Speakers
Description
Forschungsdaten in den objektbezogenen Wissenschaften liegen in heterogenen Formen vor. Neben Mess- und Bilddaten bilden Textdokumente einen erheblichen Teil des institutionellen Wissensspeichers. Im Bereich der Konservierung-Restaurierung dokumentieren Berichte und Protokolle über Jahrzehnte akkumuliertes Fachwissen, welches bislang jedoch meist weder semantisch erschlossen noch strukturiert zugänglich ist (Fischer/ Witt 2025). Das Leibniz-Zentrum für Archäologie (LEIZA) verfügt über einen solchen Bestand, der bis ins Jahr 1936 zurückreicht und damit nicht nur einen umfangreichen Quellenkorpus restauratorischen Wissens darstellt, sondern zugleich einen erheblichen Teil der insgesamt über 170-jährigen Restaurierungsgeschichte am LEIZA dokumentiert (Schwab et. al. 2024). Ein Großteil dieser Materialien lag zunächst ausschließlich in analoger Form vor und wurde ab 2021 systematisch digitalisiert. Insgesamt wurden seither rund 18.000 - 19.000 Datensätze bearbeitet.
Im Rahmen eines Use Cases innerhalb der Task Area 4 von NFDI4Objects soll dieser Textbestand in eine Wissensgraph-Repräsentation überführt werden. Voraussetzung dafür sind manuell von einer Fachwissenschaftlerin annotierte, ausgewählte Datensätze als Goldstandard, die aktuell mit der Annotationsplattform INCEpTION innerhalb der CLARIN-Infrastruktur erstellt werden. Der Workfl ow umfasst Named Entity Recognition, Relationsextraktion sowie die Verlinkung von Entitäten mit dem SKOS-modellierten LEIZA Konservierungs- und Restaurierungsfachthesaurus für archäologische Kulturgüter. In einem nächsten Schritt soll evaluiert werden, inwieweit Large Language Models in der Lage sind, dieselben Textdateien in vergleichbarer Qualität zu annotieren.
Der direkte Vergleich KI-generierter und fachwissenschaftlich erstellter Annotation liefert Rückschlüsse, inwieweit solche Modelle zur Reduzierung des manuellen Aufwands bei der Erschließung größerer Bestände sinnvoll eingesetzt werden kann.
Dieser Beitrag stellt den Use Case vor und diskutiert, wie sowohl die Rohtextdaten als auch die annotierten Datensätze langfristig gesichert und nachnutzbar gemacht werden können. Objektbezogene Forschung erzeugt Textdaten, die wiederum von textzentrierter Infrastruktur profi tieren. Der Beitrag versteht sich daher als Einladung zur Diskussion über Synergien an der Schnittstelle von NFDI4Objects und Text+.
Bibliography
- Roland Schwab, Katja Broschat, Rüdiger Lehnert, Ingrid Stelzner, Jörg Stelzner, Über 170 Jahre Expertise. Das Leibniz-Zentrum für Archäologie, in: Archäologie in Deutschland, 2024, Heft 5, S. 26-29.
- Kristina Fischer, Nathaly Witt. (2025). Zusammenfassung des Status Quo im Forschungsdatenmanagement für den Bereich der Konservierung-Restaurierung (Version v1). NFDI4Objects-Community, Zenodo. https://doi.org/10.5281/zenodo.17475354