BiodiversiTea

BiodiversiTea – die NFDI4Biodiversity Coffee Lecture #16

Organisation: NFDI4Biodiversity

Austauschen und Tee trinken: Das Onlineformat BiodiversiTea bietet ein Forum zum Vorstellen und Diskutieren von Arbeiten, Projekten, Tools und Themen aus der und um die NFDI4Biodiversity-Community. Einmal im Monat treffen wir uns online für eine Stunde mit euch und Ihnen – für spannende Präsentationen und angeregten Austausch bei einer Tasse Tee (oder Kaffee). Die Runde ist offen für alle, die Lust haben, sich über aktuelle Entwicklungen und Themen rund um Biodiversitätsdaten zu informieren und auszutauschen. Eine Zugehörigkeit zu NFDI4Biodiversity ist nicht notwendig.


Thema im September 2025
Wie FAIR sind Μetabarcoding-Daten aus öffentlichen Sequenzdatenarchiven?

Vortragende
Dr. Christiane Hassenrück (Leibniz-Institut für Ostseeforschung Warnemünde (IOW))


Darum geht es
DNA-Sequenzdatenanalysen zählen heutzutage zu den wichtigsten Werkzeugen in der Biodiversitätsforschung und gewinnen zunehmend Bedeutung für Entscheidungsprozesse in der Biodiversitätspolitik. Um ein nachhaltiges Management dieser Daten sicherzustellen und somit deren Nachnutzung zu ermöglichen, wurden bereits vor fast 15 Jahren Metadatenstandards entwickelt, die bei der Archivierung von Sequenzdaten gemäß der FAIR-Prinzipien (Findability, Accessibility, Interoperability, Reusability) Anwendung finden. Doch wie FAIR sind Sequenzdaten auf öffentlichen Archiven wirklich – und wie einfach gestaltet sich ihre Nachnutzung?

Antworten auf diese Frage liefern die Ergebnisse einer Studie von Christiane Hassenrück und ihren Kolleg:innen, die den Status der verfügbaren Metadaten für Metabarcoding-Datensätze aus Umweltproben überprüfte, die im Sequence Read Archive (SRA) der International Sequence Database Collaboration (INSDC) hinterlegt sind. Dabei zeigte sich ein gemischtes Bild: Während grundlegende Metadaten wie geografische Koordinaten und Probenahmedatum in den meisten Fällen syntaxkonform abrufbar waren, fehlten andere essentielle Metadaten, wie z.B. Informationen zu dem amplifizierten Markergen oder eine Beschreibung der Probe gemäß der Environmental Ontology (ENVO) – oder sie waren nicht interoperabel angegeben.

Metadatenstandards wie MIxS (Minimum Information about any(x) Sequence) oder brokerage Dienste wie GFBio Submission and Brokerage Service wurden zudem nur selten genutzt, obwohl in diesen Fällen die Metadatenqualität merklich höher war. Desweiteren gab es auch deutliche Unterschiede in der Metadatenqualität je nachdem, welches Portal für die Archivierung der Daten genutzt wurde (NCBI oder ENA).

Um die dringendsten Bedürfnisse zur Verbesserung des FAIRen Sequenzdatenmanagements in Zukunft zu adressieren, erstellten die Autor:innen der Studie eine Liste mit Empfehlungen für Forschende, Forschungseinrichtungen, Förderorganisationen, Gutachter:innen, Verlage und Datenbanken, die aus Sicht der Autor:innen einen großen positiven Einfluss bei minimalem Aufwand haben könnten. Während einige von diesen auch bereits umgesetzt wurden, besteht nach wie vor ein Defizit in der Nachnutzbarkeit bereits archivierter Daten. Um dieses zu beheben, werden Ansätze aus der KI-Forschung genutzt. Diese erlauben das Extrahieren und Standardisieren von Informationen aus wissenschaftlichen Publikationen, die für knapp die Hälfte der verfügbaren Datensätze auffindbar sind, wodurch eine großflächige und automatisierte Nachnutzung von DNA-Sequenzdaten ermöglicht werden soll.

Fragen & Anregungen
Der BiodiversiTea lebt von euren Ideen! Ihr möchtet Feedback einholen, sucht Mitstreiter, möchtet Arbeitsergebnisse vorstellen oder wollt euch zu einem Thema in größerer Runde austauschen? Schreibt uns an helpdesk@nfdi4biodiversity.org oder über unser Helpdesk-Formular und wir gestalten zusammen eine der kommenden Lectures.Auch bei Fragen freuen wir uns über eine Nachricht an unseren Helpdesk.
Teilnehmen Wir bitten um eine kurze Registrierung vorab:

Das Meeting wird kurz vor Beginn des Events geöffnet.

BiodiversiTea Logos (29.7 x 21 cm)
16.09.2025
11:00 - 12:00
Online
Deutsch
share on