25–26 Sept 2023
Herzog August Bibliothek
Europe/Berlin timezone

Kathleen Neumann & Frank Dürkohp (Göttingen): Sicherung digitaler Editionen für die Zukunft: Herausforderungen und Lösungsansätze

Im nun schon länger andauernden Prozess der digitalen Transformation stehen insbesondere in der deutschen Forschungslandschaft digitaler Editionen im Mittelpunkt des Interesses. Das ist nicht verwunderlich angesichts der Vielfalt der Möglichkeiten im Zuge der Digitalisierung. Eine große Bandbreite ergibt sich nicht nur aus den höchst unterschiedlichen Präsentationsformen, sondern auch aus den fachdisziplinären und informationswissenschaftlichen Perspektiven, die die digitale Erschließung von Quellenmaterialien mit sich bringt. Die Varietät der unterschiedlichen Projekte in diesem Bereich beweist das Potential des digitalen Ansatzes. Gleichzeitig zeigt sich hierin auch der große Bedarf an nachhaltigen Forschungsinfrastrukturen, die mit diesen Anforderungen Schritt halten können. Fast alle Schwierigkeiten münden in der Frage, wie die Nachhaltigkeit digitaler Editionen zu gewährleisten ist. Insgesamt leitet sich die Problematik von den folgenden drei Punkten ab:

- Ungeachtet existierender Richtlinien gehen Editionsprojekte meist von ihrer Spezifizität aus. Vom fachdisziplinären Ansatz her ist dies nachvollziehbar, doch verstellt dies den Blick auf die mal mehr, mal weniger, aber irgendwo immer vorhandenen Gemeinsamkeiten im Anforderungskatalog. Die Nachhaltigkeit der betreffenden Edition unter Einhaltung von Mindeststandards sicherzustellen, ist hiermit deutlich erschwert.

- Der Projektcharakter einer digitalen Edition bedeutet, dass auch finanzielle Ressourcen in der Regel nur für einen sehr begrenzten Zeitraum verfügbar sind. Nach Projektende sind Aktualisierung, Weiterentwicklung oder auch nur Aufrechterhaltung der erzielten Editionsergebnisse in vielen Fällen finanziell nicht oder nur sehr schwer möglich. Für die Nachhaltigkeit fehlen somit schlicht finanzielle Spielräume.

- Die stetige Fortentwicklung im Bereich der Webtechnologien wie auch beim Webdesign erhöht den Druck auf Anpassungen von entstehenden oder bereits präsenten digitalen Editionen. Die Frage, wie diese Anforderungen nach im Grunde stetigen Anpassungen erfüllt werden können, verschärft auch hier das Thema der Nachhaltigkeit.

Die FAIR-Prinzipien bieten zwar Kriterien für die Gewährleistung von Nachhaltigkeit, und mit dem XML-TEI-Format gibt es einen Ansatz für eine voraussichtlich nachhaltige Kodierung digitaler Inhalte. Ungeachtet dessen existieren bislang kaum einschlägige Angebote zur nachhaltigen Aufbewahrung und Präsentation digitaler Editionen. Wünschenswert ist also ein Dienst zur nachhaltigen Sicherung digitaler Editionen.

Aus dem zuvor Ausgeführten folgt als Ziel des Vorhabens der Aufbau eines Dienstes zur langfristigen Speicherung und Präsentation der digitalen Editionen am Beispiel der Auslandinstitute der Max Weber Stiftung. Dieses Angebot soll Textdaten abgeschlossener wie auch in Entwicklung befindlicher digitaler Editionen nachhaltig sichern und über eine Weboberfläche präsentieren. Auf diese Weise soll das Projekt einen Beitrag zur Sicherstellung der langfristigen Nutzbarkeit digitaler Editionen sowie der ihnen zugrunde liegenden Forschungsdaten leisten.

Das geplante Vorhaben, das in Kooperation mit der Max Weber Stiftung am Beispiel von den abgeschlossenen oder in Bearbeitung befindlichen Projekten Gallia Pontificia online, The Languages of Diplomacy und Sowjetische Zeitzeugen umgesetzt wird, umfasst aktuell vier Arbeitspakete:

1) Katalog von disziplinübergreifenden Kernelementen

Am Anfang steht die Erstellung eines Katalogs der disziplinübergreifenden Kernelemente der digitalen Editionen inklusive der jeweils dazugehörigen Modellierungsansätze. Im Ergebnis wird ein durchsuchbares Repertoire an grundlegenden Elementen digitaler Editionen mit korrespondierenden Modellierungsansätzen vorliegen, das virtuell verfügbar sein wird und damit längerfristig die Fortentwicklung des Formats gewährleistet.

2) Fachübergreifendes Datenformat

Im Zentrum steht die Nutzung bzw. Erweiterung des bestehenden TEI-Basisformats des deutschen Textarchivs, das anhand der ermittelten Kernelemente unter Berücksichtigung bestehender Vorarbeiten evaluiert wird. Ebenso berücksichtigt werden die bereits beschriebenen fachlichen Anforderungen sowie weitere infrastrukturelle Komponenten für die Sicherung, Bereitstellung und Präsentation der digitalen Editionen.

3) Repositorium

Auf der Basis des Open Source Frameworks MyCoRe wird ein Repositorium zur Speicherung und Sicherung von XML-Dateien der digitalen Editionen aufgebaut. Über eine Upload-Schnittstelle werden TEI-Daten importiert und referenziert. Zusätzlich können über eine weitere Schnittelle die zugehörigen Digitalisate ergänzt werden. Das Repositorium stellt Metadaten und Digitalisate über standardisierte Schnittstellen für die Präsentationsumgebung bereit, kann aber auch aufgrund der Bereitstellung der Inhalte über standardisierte Exportschnittstellen (REST, IIIF, OAI-PMH) von anderen Präsentationsoberflächen abgefragt und dargestellt werden. 

4) Weboberfläche

Über die Schnittelle des Repositoriums werden Metadaten und Digitalisate bereitgestellt und über die API in der Präsentationsoberfläche angezeigt. Die Darstellung der im Repositorium gespeicherten Editionen orientiert sich am Basisformat, so dass diese als Basisviewer fungiert und nur die unterstützten TEI-Elemente normiert anzeigt. Damit soll eine formatgerechte Visualisierung der Editionsdaten langfristig sichergestellt werden.

Der Beitrag soll ein Einblick in den aktuellen Stand der Umsetzung und die gesammelten Erfahrungen geben.


Securing Digital Editions for the Future: Challenges and Approaches

In the process of digital transformation, which has been going on for some time now, digital editions are the focus of interest, especially in the German research landscape. This is not surprising given the diversity of possibilities in the course of digitisation. A wide range results not only from the highly diverse forms of presentation, but also from the disciplinary and information science perspectives that the digital indexing of source materials entails. The diversity of the different projects in this area proves the potential of the digital approach. At the same time, it also shows the great need for sustainable research infrastructures that can keep pace with these demands. Almost all difficulties culminate in the question of how to ensure the sustainability of digital editions. Overall, the problem derives from the following three points:

- Regardless of existing guidelines, edition projects usually start from their specificity. From a disciplinary point of view, this is understandable, but it obscures the view of the sometimes more, sometimes less, but somewhere always existing commonalities in the catalogue of requirements. This makes it much more difficult to ensure the sustainability of the edition in question while adhering to minimum standards.

- The project character of a digital edition means that financial resources are also usually only available for a very limited period of time. After the end of the project, updating, further development or even just maintenance of the edition results achieved are in many cases financially impossible or very difficult. Thus, there is simply no financial leeway for sustainability.

- The constant development in the field of web technologies as well as in web design increases the pressure for adaptations of digital editions that are being created or are already present. The question of how these demands for basically constant adaptations can be met also intensifies the issue of sustainability here.

The FAIR principles do offer criteria for ensuring sustainability, and with the XML-TEI format there is an approach for a presumably sustainable encoding of digital content. Despite this, there are hardly any relevant services for the sustainable preservation and presentation of digital editions. A service for the sustainable preservation of digital editions is therefore desirable.

Based on the above, the aim of the project is to develop a service for the long-term storage and presentation of digital editions, taking the Max Weber Foundation's foreign institutes as an example. This service is intended to sustainably store text data of completed digital editions as well as those under development and to present them via a web interface. In this way, the project will contribute to ensuring the long-term usability of digital editions and the research data on which they are based.

The planned project, which is being implemented in cooperation with the Max Weber Foundation using as examples the projects Gallia Pontificia online, The Languages of Diplomacy and Soviet Contemporary Witnesses, which have been completed or are in progress, currently comprises four work packages:

1) Catalogue of cross-disciplinary core elements.

The first step is the creation of a catalogue of the cross-disciplinary core elements of the digital editions, including the respective modelling approaches. The result will be a searchable repertoire of basic elements of digital editions with corresponding modelling approaches, which will be available virtually and thus ensure the format's further development in the longer term.

2) Interdisciplinary data format

The focus is on the use or extension of the existing TEI basic format of the German Text Archive, which will be evaluated on the basis of the identified core elements, taking into account existing preliminary work. The technical requirements already described as well as further infrastructural components for securing, providing and presenting the digital editions will also be taken into account.

3) Repository

Based on the open source framework MyCoRe, a repository for storing and securing XML files of the digital editions will be established. TEI data are imported and referenced via an upload interface. In addition, the corresponding digital editions can be added via a further interface. The repository provides metadata and digital copies via standardised interfaces for the presentation environment, but can also be queried and displayed by other presentation interfaces due to the provision of content via standardised export interfaces (REST, IIIF, OAI-PMH). 

4) Web interface

Metadata and digitised material are made available via the repository interface and displayed in the presentation interface via the API. The presentation of the editions stored in the repository is oriented towards the basic format, so that it functions as a basic viewer and only displays the supported TEI elements in a standardised way. This should ensure a format-compliant visualisation of the edition data in the long term.

The article is intended to provide an insight into the current state of implementation and the experience gained.