29. September 2025 bis 2. Oktober 2025
Alte Mensa
Europe/Berlin Zeitzone

Kombination eines elektronischen Laborbuchs mit einem Workflow-Manager mit HPC-Anbindung zur effizienten Analyse neurophysiologischer Daten im Terabyte-Bereich

30.09.2025, 11:00
45m
Taberna (Alte Mensa)

Taberna

Alte Mensa

Wilhelmsplatz 3, 37073 Göttingen

Sprecher

Friedrich Schwarz (CIDBN, UMG)

Beschreibung

Computergestützte Ansätze sind essenziell für die Verarbeitung großer, hochdimensionaler Datensätze, deren Potenzial durch fragmentierte Speicherung, unzureichenden Wissenstransfer oder nicht-kollaborative Notizen häufig nicht voll ausgeschöpft wird.
Wir präsentieren ein integrierte, modulare Framework, das ein Open-Source elektronisches Laborbuch (EMBL’s LabID) mit einem Workflow-Manager (Apache Airflow) verbindet und die Daten(vor-)verarbeitung mit zeitgleicher Provenienz- und Analysemetadatenerfassung sowie das Reporting automatisiert.
Wir stellen unser Framework an einer neurophysiologischen Pipeline vor, bei welcher bis zu 8 TB an Rohdaten pro Tag anfallen. Airflow erkennt automatisch neue Daten, orchestriert Datentransfers und führt Analysen auf einem HPC-Cluster aus; jeder Schritt wird dabei in LabID über dessen CLI protokolliert.
Provenienz- und Analysemetadaten, wie Probenherkunft, Filter, Hardware- Kanalzuordnung, Softwareversionen (Git Commit), Analyseparameter, etc. - werden als RO-Crate-Objekte gespeichert und sind so leicht exportierbar.
Parallelisierte Ausführung und optimierte Datenlokalität reduzierten die Gesamtanalysezeit dramatisch und eliminierten manuelle Fehler nahezu vollständig.
Das abstrakte, use-case-agnostische Design erfordert nur minimale Anpassungen, um vielfältige weitere Workflows zu unterstützen.

ELN workflow

Autor

Friedrich Schwarz (CIDBN, UMG)

Co-Autoren

Präsentationsmaterialien

Es gibt derzeit keine Materialien.