Text+ Code Sprint For Humanities Data

Europe/Berlin
Vortragsraum im Historischen Gebäude (Niedersächsische Staats- und Universitätsbibliothek Göttingen)

Vortragsraum im Historischen Gebäude

Niedersächsische Staats- und Universitätsbibliothek Göttingen

Papendiek 14, 37073 Göttingen
Bernd Schlör (GWDG), Florian Barth (SUB Göttingen), George Dogaru (GWDG), José Calvo Tello (SUB Göttingen), Mathias Goebel (SUB Göttingen), Ralf Klammer (TU Dresden), Stefan Funk (SUB Göttingen), Ubbo Veentjer (SUB Göttingen)
Description

In diesem Code-Sprint stellen wir einen neuen Workflow vor, der einen einsteigerfreundlichen Import von Korpora, Kollektionen und Editionen im TEI-Format in das TextGrid Repository (TextGridRep) sowie eine anschließende Publikation der Daten ermöglicht.

Das TextGridRep ist dank seines umfangreichen, durchsuch- und nachnutzbaren Bestands an Texten und Bildern ein beliebtes und relevantes Repositorium für geisteswissenschaftliche Forschungsdaten.

Für Forschende bietet es eine nachhaltige, dauerhafte und sichere Möglichkeit zur zitierfähigen Publikation ihrer Forschungsdaten und zur verständlichen Beschreibung derselben durch erforderliche und erweiterte Metadaten, so dass die Publikation bestmöglich im TextGridRep präsentiert und nachgenutzt werden kann.
Der zukünftige Weg der Daten ins TextGridRep wird von Tools ermöglicht werden, die aktuell in Text+ entwickelt werden (in der Task Area Infrastructure/Operations, Measure 5).

In diesem Code-Sprint wird die auf diesen Tools basierende Lösung für einen erleichterten Datenimport in das TextGridRep vorgestellt und schließlich von den Teilnehmenden angewendet und so eine Publikation vorbereitet.

Ein besonderer Fokus wird auf die Erstellung der TextGridRep-spezifischen Metadaten liegen, die unter anderem für die Auffindbarkeit der Daten im TextGridRep essentiell sind.

Zielgruppe dieses Code-Sprints sind Personen und Projekte, die entweder bereits über TEI-Daten verfügen und diese veröffentlichen wollen, oder vorhaben, TEI-Daten zu produzieren und zu veröffentlichen. Es wird sowohl die Möglichkeit geben, mit einem Beispiel-Datensatz zu arbeiten, als auch mit eigenen TEI-Daten. Es können bis zu 25 Personen teilnehmen.

Ziel des Code-Sprints ist es, die eigene Daten-Publikation im Rahmen der Veranstaltung vorzubereiten und mit Unterstützung im Nachgang umzusetzen.

  • Thursday, 11 April
    • 12:00 12:30
      Begrüßung und gemeinsamer Imbiss 30m
    • 12:30 13:00
      Vorstellung TextGrid
    • 13:00 13:30
      Vorstellung des Tools für Datenimport
    • 13:30 13:45
      Pause 15m
    • 13:45 14:45
      Vorstellung der Daten der Teilnehmenden
    • 14:45 15:00
      Pause 15m
    • 15:00 17:00
      Hands On: Metadatenerstellung und Datenimport
    • 08:30 09:00
      Begrüßung (Es wird Kaffee geben 😀 ) 30m
    • 09:00 11:00
      Hands On: Metadatenerstellung und Datenimport
    • 11:00 11:15
      Pause 15m
    • 11:15 12:00
      Wrap-up / Abschlussdiskussion
    • 12:00 13:00
      Gemeinsamer Imbiss 1h
    • 13:00 14:30
      Optional: Spezialfragen und besondere Use Cases