Ob über Plattformen oder Apps – Crowdsourcing hat sich in der linguistischen Forschung als effiziente Methode zur Sammlung großer Mengen an Sprachdaten etabliert. Doch mit dem Aufkommen leistungsfähiger KI-Modelle stellt sich zunehmend die Frage: Können algorithmische Systeme die menschliche Beteiligung bei der Sprachdatenerhebung ersetzen oder sie zumindest produktiv ergänzen?
Dieser Workshop widmet sich der Schnittstelle zwischen klassischem Crowdsourcing und KI-gestützter Datenerhebung. Es werden etablierte Methoden des linguistischen Crowdsourcings vorgestellt.
Am Beispiel wird gezeigt, wie Sprachdaten kollaborativ gesammelt, annotiert und wissenschaftlich nutzbar gemacht werden können.
Im einem interaktiven Teil wird gezeigt, welche Potenziale der Einsatz von KI, insbesondere von Large Language Models, für die automatische Erhebung, Annotation und Analyse sprachlicher Daten bietet.
Gemeinsam diskutieren wir, in welchen Bereichen KI bereits menschliche Akteure ersetzt, wo ihre Grenzen liegen, und welche hybriden Ansätze für zukünftige Forschungsprojekte vielversprechend sind.
Der Workshop richtet sich somit an Forschende sowie Lehrende, die sich mit der Erhebung, Annotation oder Analyse sprachlicher Daten beschäftigen, und zwar sowohl innerhalb der Linguistik als auch in benachbarten Disziplinen.
Der Workshop wird veranstaltet von der AG Digitale Romanistik (Verena Weiland und Sascha Resch) in Kooperation mit Text+. Wir setzen damit unsere Reihe zu KI in Forschung und Lehre mit einem ditten Teil fort. Materialien zu Teil 1 und Teil 2 können jeweils hier in Indico gefunden werden.
Wir freuen uns auf Ihre Teilnahme und einen spannenden Austausch!