Neues Use-Case-Projekt gestartet: "MiCoDa soll nicht isoliert, sondern zusammen mit der Community weiterentwickelt werden"
Liebe Stephanie, mit MiCoDa – der derzeit größten öffentlich zugänglichen Mikrobiom-Datenbank – bringst du ein spannendes neues Use-Case-Projekt in die NFDI4Biodiversity-Community ein. Erst einmal herzlich willkommen! Kannst du dich kurz vorstellen?
Gerne! Ich bin Stephanie Jurburg, kurz Steph, und derzeit Senior Researcher und stellvertretende Gruppenleiterin der Arbeitsgruppe Microbial Interaction Ecology im Department für Angewandte Mikrobielle Ökologie am Helmholtz-Zentrum für Umweltforschung (UFZ). Als Ökologin untersuche ich den Aufbau mikrobieller Gemeinschaften in sämtlichen Mikrobiomen. Auch in meiner Freizeit setze ich mich für die Open-Science-Bewegung ein: Seit 2022 bin ich Co-Leiterin der Open Science Working Group der Global Young Academy und 2023 wurde ich zum RDA Disciplinary Ambassador für mikrobielle Ökologie gewählt. Seit diesem Jahr bin ich außerdem Mitglied einer Leopoldina-Arbeitsgruppe zur Zukunft des wissenschaftlichen Publizierens. Privat genieße ich das Leben am liebsten bei Live-Musik und beim Kochen.
MiCoDa wurde gerade als neues Use-Case-Projekt in NFDI4Biodiversity aufgenommen. Kannst du MiCoDa denjenigen vorstellen, die es noch nicht kennen?
MiCoDa ist eine Ready-to-Use-Datenbank, die für verschiedenste Fachgruppen interessant sein kann. Die Idee hinter ihr ist, dass man mit ihr arbeiten kann, ohne fortgeschrittene Kenntnisse in Computational Biology, Bioinformatik oder Mikrobiom-Sequenzanalyse mitzubringen. MiCoDa ist also vor allem für Personen spannend, die nicht über die Infrastruktur für Hochleistungsrechner verfügen oder sich in großem Umfang für die Mikrobiomforschung interessieren. Aktuell ist MiCoDa eine der größten kuratierten Datenbanken im Bereich des Metabarcoding. Die umfangreichen Kuratierungs- und Bioinformatikbemühungen haben abei dazu geführt, dass wir einheitliche Speziesstandards für alle Studien innerhalb von MiCoDa haben, was Vergleiche erleichtert.
Wie kam das Projekt zustande? Gab es eine Lücke, die du beobachtet hast und die MiCoDa schließen sollte?
Das Projekt entstand aus meinem eigenen Versuch der Wiederverwendung von Daten im Jahr 2018, als ich versucht habe, Mikrobiomdaten zu synthetisieren. Damals bin ich davon ausgegangen, dass es einfacher sein würde, Mikrobiomdaten zu finden als herkömmliche ökologische Daten, mit denen ich zuvor hauptsächlich gearbeitet hatte. Da das allerdings nicht der Fall war, habe ich beschlossen, systematisch zu analysieren, wie FAIR Mikrobiomdaten im Allgemeinen sind. Dabei hat sich herausgestellt, dass die Daten nicht so zugänglich sind, wie sie es sein sollten, um Metanalysen unkompliziert möglich zu machen. Bei meiner Arbeit mit Makroökolog:innen habe ich darüber hinaus festgestellt, dass sie zwar daran interessiert sind, Bakterien in umfangreiche ökologische Synthesen einzubeziehen, ihnen aber die bioinformatischen Kenntnisse fehlen, um die archivierten Rohdaten abzurufen und zu verarbeiten – was letztlich der bakteriellen Ökologie schadet. Am Ende unserer systematischen Analyse der Verfügbarkeit von Metabarcoding-Daten hatten wir eine Liste gut archivierter Datensätze zusammengestellt – und daraus wurde die erste Version von MiCoDa.
"MiCoDa ist sozusagen eine Datenrettungsmission."
Stephanie Jurburg
Wie hast du von der NFDI und NFDI4Biodiversity erfahren?
Begonnen habe ich mit der Entwicklung von MiCoDa während meiner Arbeit am Deutschen Zentrum für integrative Biodiversitätsforschung (iDiv), wo viele Forschende an NFDI4Biodiversity beteiligt sind. Als MiCoDa zu einem sehr großen Datensatz anwuchs, begannen wir eine Zusammenarbeit mit NFDI4Biodiversity-Co-Sprecherin Birgitta König Ries, der Leiterin der Bioinformatik-Abteilung des iDiv, um den Aufbau der Datenbank zu unterstützen. Im Austausch mit ihr kamen wir überein, uns an NFDI4Biodiversity zu wenden, die NFDI für Ökologen ist – also die Zielgruppe von MiCoDa.
Die NFDI4Biodiversity-Use-Case-Projekte sind gewissermaßen Versuchslabore, in denen wir – jeweils zusammen mit einem oder mehreren Partnerprojekten oder -institutionen – Daten mobilisieren, Standards etablieren oder Speicherinfrastrukturen aufbauen. Was genau ist das Ziel des Use Case MiCoDa?
Der wichtigste Aspekt Zusammenarbeit von MiCoDa und NFDI4Biodiversity ist der gegenseitige Austausch. MiCoDa soll nicht isoliert, sondern zusammen mit der Community entwickelt und außerdem zunehmend mit anderen Datenquellen interoperabel werden. [Interessiert an Details zur Zusammenarbeit? Hier geht es zum ausführlichen Use-Case-Porträt.]
Ganz allgemein gesprochen: Warum ist dir wichtig, dass Daten – wie die in MiCoDa – in Zukunft noch besser verfügbar sind?
Was Sequenzierungsdaten angeht, stecken wir in einer Krise. Es gibt zwar inzwischen sehr solide Standards für die Archivierung von Daten und gute Ideen für den zukünftigen Umgang mit ihnen. Aber aktuell wenden wir wenige Ressourcen für das Aufbereiten von Daten aus der Vergangenheit auf – dabei sind das oft die einzigen Daten, die zu bestimmten Experimenten oder Umgebungen existieren. Die Probenahme wird selten wiederholt, aber den bereits vorhandenen Daten fehlen möglicherweise spezifische Qualitätsmaßstäbe und Standards. Unter diesem Gesichtspunkt ist MiCoDa sozusagen eine Datenrettungsmission: Metabarcoding-Daten werden mit zusätzlichen Metadaten aufgefrischt und durch eine einheitliche bioinformatische Verarbeitung für die Wiederverwendung fit gemacht.
Dr. Stephanie Jurburg ist Mikrobioökologin und untersucht dabei das gesamte Mikrobiom. Derzeit ist sie Postdoc und stellvertretende Gruppenleiterin der Arbeitsgruppe Mikrobielle Interaktionsökologie im Department für Angewandte Mikrobielle Ökologie am Helmholtz-Zentrum für Umweltforschung (UFZ). Neben ihrer Tätigkeit als Ökologin engagiert sich sich für Open Science und Open Data. Privat liebt sie es, auf Konzerte zu gehen und zu kochen.