9–11 Oct 2024
Mannheim, Schloss
Europe/Berlin timezone

Session

Text+ Plenary Tag 1

10 Oct 2024, 16:45
O 138, Fuchs-Petrolub-Saal (Schloss, 68161 Mannheim)

O 138, Fuchs-Petrolub-Saal

Schloss, 68161 Mannheim

Presentation materials

There are no materials yet.
Florian Barth (Georg-August-Universität Göttingen), José Calvo Tello (Georg-August-Universität Göttingen), Keli Du (Universität Würzburg), Philippe Genêt (Deutsche Nationalbibliothek), Peter Leinen (Deutsche Nationalbibliothek), Jörg Knappen (Universität des Saarlandes), Thorsten Trippel (Leibniz-Institut für Deutsche Sprache), Andreas Witt (Leibniz-Institut für Deutsche Sprache)
10/10/2024, 16:45

In diesem Poster präsentieren wir eine umfassende Darstellung verschiedener abgeleiteter Textformate (ATF) und auch wie diese im Zusammenhang mit großen Sprachmodelle (LLMs) eingesetzt werden können. Abgeleitete Textformate (ATF) sind systematisch generierte Repräsentationen eines Originaltextes, bei dem einerseits die Anwendung bestimmter Verfahren des Text und Data Mining noch möglich sind,...

Thomas Eckart (Sächsische Akademie der Wissenschaften zu Leipzig), Christopher Schröder (Sächsische Akademie der Wissenschaften zu Leipzig), Erik Körner (Sächsische Akademie der Wissenschaften zu Leipzig), Felix Helfer (Sächsische Akademie der Wissenschaften zu Leipzig), Frank Binder (Sächsische Akademie der Wissenschaften zu Leipzig)
10/10/2024, 16:45

Die Korpuslinguistik besitzt jahrzehntelange Erfahrung im Umgang mit großen Textmengen, inklusive ihrer Beschaffung, Aufbereitung und Nutzung. Im Angesicht der aktuellen Trends im Bereich großer Sprachmodelle (large language models, LLMs) und den sich daraus ergebenden neuen Nutzungsszenarien, für die große, hochqualitative Textmengen unabdingbar sind, können von dieser Expertise aktuelle und...

Florian Barth (Niedersächsische Staats- und Universitätsbibliothek Göttingen), Yannic Bracke (Berlin-Brandenburgische Akademie der Wissenschaften), Philippe Genêt (Deutsche Nationalbibliothek), Erik Körner (Sächsische Akademie der Wissenschaften), Peter Leinen (Deutsche Nationalbibliothek), Pia Schwarz (Leibniz-Institut für Deutsche Sprache), Claus Zinn (Eberhard Karls Universität Tübingen)
10/10/2024, 16:45

Vor dem Hintergrund der rasant fortschreitenden Entwicklung der Large Language Models (LLMs) sieht sich das NFDI-Konsortium Text+ in der Rolle, Perspektiven für die Einsatzmöglichkeiten generativer Sprachmodelle und Transformermodelle in der Wissenschaft aufzuzeigen. Mit beträchtlichen Beständen an Sprach- und Textdaten in seinen Datenzentren sowie leistungsfähigen Rechenzentren in den Reihen...

Alexander Steckel (Georg-August-Universität Göttingen), Umut Basaran (Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen), Stefan Buddenbohm (Georg-August-Universität Göttingen), Maik Wegener (Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen), Philipp Wieder (Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen)
10/10/2024, 16:45

AI as a Service

Text- and language-based humanities offer extensive use-cases for Large Language Models(LLMs). Text+ currently facilitates access to research data via the Text+ Registry, FederatedContent Search (FCS), and contributing partner’s data repositories. Through GWDG, a nationalhigh-performance computing and AI center, an additional web service will be made available onthe Text+...

Building timetable...