Speaker
Description
Für eine gute Lehre und Ausbildung von Studierenden und Nachwuchsforschenden sind gute Trainingsdatensätze unerlässlich. Sie bilden die Grundlage für die Vermittlung von Datenkompetenz, Analyseverfahren und Datenlebenszyklen. In diesem Beitrag skizzieren wir allgemeine Anforderungen an Trainingsdatensätze und unterscheiden verschiedene Arten von Trainingsdatensätzen. Trainingsdatensätze sollten frei verfügbar sein, interessante und allgemein verständliche Fragestellungen ermöglichen und eine für die Illustration angemessenen Umfang haben. Trainingsdatensätze können an verschiedenen Stellen im Datenlebenszyklus einsetzen. Beispiele dafür sind Trainingsdatensätze in Form von Datenstandards zur Datenaufnahme, Rohdaten zum Üben der Datenaufbereitung bis hin zu fertigen Datensätzen, die zur Veranschaulichung von Analysemethoden und zur Datenarchivierung verwendet werden können.