Wohin damit? Storing and reusing my language data

Europe/Berlin
Vortragssaal (Leibniz-Institut für Deutsche Sprache (IDS))

Vortragssaal

Leibniz-Institut für Deutsche Sprache (IDS)

R 5, 6-13 D-68161 Mannheim
Description

Bild von OpenClipart-Vectors auf Pixabay 

 

DFG- und andere Forschungsprojekte stehen vor der Frage, wer ihre Daten langfristig im Rahmen der FAIR-Prinzipien entgegennehmen kann und unter welchen Voraussetzungen dies möglich ist. Dieser Marktplatz bietet für Forschende die Möglichkeit, sich direkt mit Daten- und Kompetenzzentren der Text+-Datendomäne Sammlungen auszutauschen, um nach Möglichkeiten der Datenübernahme zu suchen. Besonders angesprochen sind Forscher:innen, die nach der wissenschaftlich erfolgreichen Durchführung eines Projekts nach Wegen suchen, ihre Datenkorpora professionell zu archivieren und, wo sinnvoll, für Nachnutzungen zur Verfügung zu stellen. Darüber hinaus richtet sich das Event an die Kooperationsprojekte von Text+, die sich mit text- und sprachbasierten Sammlungen beschäftigen, Fachinformationsdienste sowie weitere Interessierte aus Verbänden, Verbünden und der gesamten Fachcommunity. Neben der Vorstellung der Datenzentren werden wir anhand von einigen Beispielen vorstellen, wie eine Datenübernahme erfolgreich erfolgt ist. 

Die Teilnahmegebühr für den Workshop beträgt 20,- €.

Die Anmeldung ist direkt über diese Seite möglich (s.u.).

Registration
Anmeldung
    • 9:00 AM 9:10 AM
      Begrüßung 10m
    • 9:10 AM 9:20 AM
      Einführung, Vorstellung des Programms 10m
      Speaker: Philippe Genêt (DNB)
    • 9:20 AM 9:45 AM
      Use Case: Data Depositing in Text+: Strategie und Voraussetzungen

      Data Depositing in Text+

      Use Case I:
      Der Vortrag steht im Kontext der Endphase eines DFG-geförderten Projekts, das die Rolle des Englischen als Lingua Franca für westafrikanische Migrantinnen in Deutschland untersucht (DFG-MA 1652/12). An den Interviews nahmen insgesamt 83 Gewährspersonen teil, teils im Individual- und teils im Fokusgruppenformat. Die Daten (ca. 51 Stunden Tonaufnahmen) liegen als .wav-Dateien vor, sind orthographisch transkribiert und selektiv und in variabler Tiefe projektspezifisch annotiert (ELAN). Der Vortrag behandelt zwei Fragen:
      (1) Welche Datenzentren kommen die für eine Archivierung solcher Daten prinzipiell in Frage, und nach welchen Kriterien wählt man aus?
      (2) Wie fördert man in Zusammenarbeit zwischen Datenzentren und dem Datengeber die produktive Nachnutzung der Daten über ein breites Fächerspektrum hinweg?
      Sowohl Archivierung als auch Nachnutzung erweisen sich als kooperative Prozesse, in denen den Datenzentrum eine Schlüsselfunktion zukommt, in der jedoch auch Datengeber und – zum Zeitpunkt der Archivierung nur abstrakt definierbare – Nachnutzer
      innen eine aktive Rolle spielen müssen.

      Use Case II:

      Use Case III:

      Convener: Andreas Witt (Leibniz-Institut für Deutsche Sprache Mannheim)
    • 9:45 AM 10:10 AM
      Use Case: I: Übrig sind noch 21 Gigabyte: Perspektiven für professionelle Archivierung und Nachnutzung von soziolinguistischen Interviewdaten

      Data Depositing in Text+

      Use Case I:
      Der Vortrag steht im Kontext der Endphase eines DFG-geförderten Projekts, das die Rolle des Englischen als Lingua Franca für westafrikanische Migrantinnen in Deutschland untersucht (DFG-MA 1652/12). An den Interviews nahmen insgesamt 83 Gewährspersonen teil, teils im Individual- und teils im Fokusgruppenformat. Die Daten (ca. 51 Stunden Tonaufnahmen) liegen als .wav-Dateien vor, sind orthographisch transkribiert und selektiv und in variabler Tiefe projektspezifisch annotiert (ELAN). Der Vortrag behandelt zwei Fragen:
      (1) Welche Datenzentren kommen die für eine Archivierung solcher Daten prinzipiell in Frage, und nach welchen Kriterien wählt man aus?
      (2) Wie fördert man in Zusammenarbeit zwischen Datenzentren und dem Datengeber die produktive Nachnutzung der Daten über ein breites Fächerspektrum hinweg?
      Sowohl Archivierung als auch Nachnutzung erweisen sich als kooperative Prozesse, in denen den Datenzentrum eine Schlüsselfunktion zukommt, in der jedoch auch Datengeber und – zum Zeitpunkt der Archivierung nur abstrakt definierbare – Nachnutzer
      innen eine aktive Rolle spielen müssen.

      Use Case II:

      Use Case III:

      Convener: Christian Mair (Universität Freiburg)
    • 10:10 AM 10:30 AM
      Kurzvorstellung Datenzentren: 1-5
    • 10:30 AM 11:00 AM
      Pause: Kaffee
    • 11:00 AM 11:25 AM
      Use Case: II: Soziolinguistik trifft Korpuslinguistk" – Der Weg des Korpus ins Repository

      Data Depositing in Text+

      Use Case I:
      Der Vortrag steht im Kontext der Endphase eines DFG-geförderten Projekts, das die Rolle des Englischen als Lingua Franca für westafrikanische Migrantinnen in Deutschland untersucht (DFG-MA 1652/12). An den Interviews nahmen insgesamt 83 Gewährspersonen teil, teils im Individual- und teils im Fokusgruppenformat. Die Daten (ca. 51 Stunden Tonaufnahmen) liegen als .wav-Dateien vor, sind orthographisch transkribiert und selektiv und in variabler Tiefe projektspezifisch annotiert (ELAN). Der Vortrag behandelt zwei Fragen:
      (1) Welche Datenzentren kommen die für eine Archivierung solcher Daten prinzipiell in Frage, und nach welchen Kriterien wählt man aus?
      (2) Wie fördert man in Zusammenarbeit zwischen Datenzentren und dem Datengeber die produktive Nachnutzung der Daten über ein breites Fächerspektrum hinweg?
      Sowohl Archivierung als auch Nachnutzung erweisen sich als kooperative Prozesse, in denen den Datenzentrum eine Schlüsselfunktion zukommt, in der jedoch auch Datengeber und – zum Zeitpunkt der Archivierung nur abstrakt definierbare – Nachnutzer
      innen eine aktive Rolle spielen müssen.

      Use Case II:

      Use Case III:

      Convener: Christoph Draxler (Bayerisches Archiv für Sprachsignale)
    • 11:25 AM 11:50 AM
      Use Case: III: Integration einer Sammlung historischer, deutschsprachiger Texte in die Infrastruktur des Deutschen Textarchivs an der Berlin-Brandenburgischen Akademie der Wissenschaften.

      Data Depositing in Text+

      Use Case I:
      Der Vortrag steht im Kontext der Endphase eines DFG-geförderten Projekts, das die Rolle des Englischen als Lingua Franca für westafrikanische Migrantinnen in Deutschland untersucht (DFG-MA 1652/12). An den Interviews nahmen insgesamt 83 Gewährspersonen teil, teils im Individual- und teils im Fokusgruppenformat. Die Daten (ca. 51 Stunden Tonaufnahmen) liegen als .wav-Dateien vor, sind orthographisch transkribiert und selektiv und in variabler Tiefe projektspezifisch annotiert (ELAN). Der Vortrag behandelt zwei Fragen:
      (1) Welche Datenzentren kommen die für eine Archivierung solcher Daten prinzipiell in Frage, und nach welchen Kriterien wählt man aus?
      (2) Wie fördert man in Zusammenarbeit zwischen Datenzentren und dem Datengeber die produktive Nachnutzung der Daten über ein breites Fächerspektrum hinweg?
      Sowohl Archivierung als auch Nachnutzung erweisen sich als kooperative Prozesse, in denen den Datenzentrum eine Schlüsselfunktion zukommt, in der jedoch auch Datengeber und – zum Zeitpunkt der Archivierung nur abstrakt definierbare – Nachnutzer
      innen eine aktive Rolle spielen müssen.

      Use Case II:

      Use Case III:

      Convener: Marius Hug (BBAW)
    • 11:50 AM 12:10 PM
      Kurzvorstellung Datenzentren: 6-11
    • 12:10 PM 1:00 PM
      Pause: Mittag
    • 1:00 PM 3:30 PM
      Marktplatz/Messe der Datenzentren in Collections 2h 30m
    • 3:30 PM 4:00 PM
      Wrap-Up & Ausblick 30m