Korpora in Text+: Kennenlernen und nachhaltig nutzen

Europe/Berlin
Vortragssaal (Deutsche Nationalbibliothek Frankfurt)

Vortragssaal

Deutsche Nationalbibliothek Frankfurt

Adickesallee 1 60322 Frankfurt am Main https://www.dnb.de/DE/Benutzung/Frankfurt/frankfurt_node.html;jsessionid=8EAC4FDB38BCCA3663EC03B50F2B7255.intranet671#doc57382bodyText5
Lukas Weimer (ULSB)
Description

Text+ Logo

Korpora in Text+: Kennenlernen und nachhaltig nutzen

Text+ ist ein Konsortium der Nationalen Forschungsdateninfrastruktur (NFDI) und hat zum Ziel, sprach- und textbasierte Forschungsdaten langfristig zu erhalten und ihre Nutzung in der Wissenschaft zu ermöglichen.

Text+ ist daher Heimat zahlreicher textlicher Korpora. Einige von diesen sind bereits in weiten Wissenschaftskreisen bekannt, andere bedienen bislang nur ein Expertenpublikum. Aus diesem Grund veranstaltet die DNB am 13. Juli 2022 einen Präsenz-Workshop, um Korpora aus Text+ einer breiteren Wissenschaftsöffentlichkeit vor- und Möglichkeiten der Arbeit mit ihnen darzustellen.

In insgesamt vier 90-minütigen Workshopblöcken (Programm s.u.) zu linguistischen aufbereiteten und nicht aufbereiteten Korpora, historischen Korpora und computerphilologisch aufbereiteten Korpora werden diese vorgestellt, diskutiert, problematisiert und hands-on mit ihnen gearbeitet. Dabei wird immer ein Fokus auf die Aufbereitung sowie die unterschiedlichen Formate der Korpora gesetzt, im Mittelpunkt steht aber besonders auch die Frage, welche Forschungsfragen den Korpora zugrunde liegen. Alle Diskussionspunkte werden immer auch in gemeinsamer Perspektive in Text+ betrachtet. 

Die Registrierung für den Workshop startet am 24. Mai auf dieser Seite.

Die Teilnahmegebühr für die Veranstaltung beträgt inklusive Verpflegung 35€ pro Person.

Für das NFDI-Konsortium Text+ veranstaltet die DNB in ihren Räumen (Vortragssaal, Adickesallee 1, 60322 Frankfurt am Main) den Präsenz-Workshop. Organisiert wird der Workshop von der AG Dissemination der Text+ Task Area Collections.

Registration
Participants
    • 9:00 AM 9:10 AM
      Einführung: Das NFDI-Konsortium Text+

      Kurzvorstellung des NFDI-Konsortiums Text+ mit besonderem Fokus auf seine Task Area Collections.

      Convener: Lukas Weimer (SUB Göttingen)
    • 9:10 AM 10:35 AM
      Linguistisch und nicht linguistisch aufbereitete Korpora: Zeitungen und Zeitschriften

      Sammlungen digitalisierter historischer Zeitungen sowie Sammlungen aktueller Presseerzeugnisse, z.B. Tageszeitungen, bilden eine wichtige Quelle nicht nur für die Linguistik sondern auch für die Geschichtswissenschaft und für die sozialwissenschaftliche Forschung. Derartige Sammlungen entstehen sowohl in Forschungseinrichtungen als auch in Einrichtungen des Kulturerbes. Sie werden zunehmend mittels übergreifender Portale (Europeana, DDB, ANNO, Impresso) als auch von der Wissenschaft selbst bereitgestellt.
      In den Vorträgen werden die spezifischen Aspekte der Sammlungen, der Zugang zu ihnen und Szenarien ihrer Nutzung vorgestellt. Konkret angesprochen werden Ressourcen des Leibniz-Instituts für Deutsche Sprache, des Portals „Deutsches Zeitungsportal“ der Deutschen Digitalen Bibliothek und die Sammlung der digitalen Ausgaben aller Tageszeitungen in Deutschland der DNB.
      ANNO Zeitungsportal der ÖNB, https://anno.onb.ac.at/
      Media Monitoring of the Past, https://impresso-project.ch/
      Deutsche Referenzkorpus – DeReKo, https://www.ids-mannheim.de/digspra/kl/projekte/korpora/

      Vortragende:
      Marc Kupietz (Leibniz-Institut für Deutsche Sprache Mannheim)
      Lisa Landes (Deutsche Digitale Bibliothek)
      Peter Leinen (Deutsche Nationalbibliothek)

      Convener: Christian Mair (Albert-Ludwigs-Universität Freiburg)
    • 10:35 AM 10:55 AM
      Kaffeepause
    • 10:55 AM 12:15 PM
      Historische Korpora

      In diesem Slot beschäftigen wir uns mit historischen Sprachdaten, genauer gesagt schauen wir uns zwei englischsprachige Korpora aus der Late Modern Period an. Jörg Knappen (Universität des Saarlandes) wird uns das diachrone Wissenschaftskorpus, Royal Society Corpus, vorstellen. Professor Dr. Magnus Huber (Universität Giessen) eröffnet uns Einblicke in das gesprochensprachliche Old Bailey Corpus, zusammengestellt aus Gerichtsmitschriften des Londoner Strafgerichts.
      Die Vorträge werden sich mit den jeweiligen Besonderheiten der Aufbereitung historischer Daten, dem damit verbundenen Aufwand und der Notwendigkeit der Einhaltung der FAIR Prinzipien (Stichwort Nachhaltigkeit) befassen. Behandelt werden außerdem die spezifischen Annotationen zur Beantwortung der jeweiligen Forschungsfragen.

      Vortragende:
      Jörg Knappen (Universität des Saarlandes)
      Magnus Huber (Justus-Liebig-Universität Gießen)

      Convener: Marie-Pauline Krielke (Universität des Saarlandes)
    • 12:15 PM 1:10 PM
      Mittagspause
    • 1:10 PM 2:30 PM
      Computerphilologisch aufbereitete Korpora

      Das deutsche Dramenkorpus (GerDraCor) ist Teil von DraCor (https://dracor.org), einer offenen Plattform zur Erforschung von Dramen. Im Zentrum stehen so genannte ‚Programmable Corpora‘. Hierunter verstehen wir infrastrukturell-forschungsorientierte, offene, erweiterbare, Linked Open Data-freundliche Volltextkorpora, die es ermöglichen sollen, auf niederschwellige Weise diverse Forschungsfragen aus dem Bereich der digitalen Literaturwissenschaft datenbasiert, nachvollziehbar und reproduzierbar zu bearbeiten (Fischer u. a. 2019).
      Neben einer Vorstellung von DraCor und GerDraCor werden Anwendungen und Forschungsergebnisse aus dem Projekt QuaDramA (https://quadrama.github.io/) präsentiert, die auf den GerDraCor-Daten basieren. Dies umfasst Analysen zu Protagonisten, Figurenpräsenz und Figurenbeziehungen. Auch die Idee der Programmable Corpora soll hier wieder im Zentrum stehen und wird unter anderem anhand von Annotationen aus dem QuaDramA-Kontext, die in GerDraCor integriert werden konnten, exemplifiziert.

      Vortragende:
      Korpusvorstellung: Ingo Börner (Universität Potsdam)
      Anwendung: Janis Pagel (Universität zu Köln)

      Convener: Peter Leinen (Deutsche Nationalbibliothek)
    • 2:30 PM 2:50 PM
      Kaffeepause
    • 2:50 PM 4:00 PM
      Abschlussdiskussion

      Im letzten Slot sollen die Erkenntnisse des Tages zusammengefasst und diskutiert werden: Wie können historische Korpora linguistisch erschlossen und nachgenutzt werden? Welche Vorteile bieten computerphilologisch aufbereitete Korpora? Welche Besonderheiten existieren bei der Erstellung von Zeitungskorpora?
      Ein wichtiger Fokus soll in der Diskussion auf die communitygetriebene Weiterentwicklung der Korpora und des gesamten Portfolios von Text+ gelegt werden. Außerdem wird evaluiert, wie nächste Schritte in der Zusammenarbeit aussehen könnten und welche Folge-Workshops erwünscht sind.

      Convener: Andreas Witt (IDS Mannheim)