Datenzentren

Unsere fachlich spezialisierten Datenzentren kümmern sich um die Standardisierung, Archivierung und nachhaltige Bereitstellung von Biodiversitäts- und Umweltdaten.

Damit Daten langfristig gefunden und genutzt werden können – nicht nur von ihren Urheber:innen selbst, sondern auch anderen Forschenden und Interessierten –, müssen sie publiziert worden sein. Hierbei spielen Datenzentren eine wesentliche Rolle: Sie halten die Infrastruktur vor, dank der Daten langfristig gespeichert werden können, sorgen durch eine aufwändige Datenkuration dafür, dass Daten standardisiert beschrieben werden, und ermöglichen so, dass Daten durch Schnittstellen zu anderen Datenportalen und -sammlungen gefunden und verwendet werden können.

Innerhalb von NFDI4Biodiversity bildet das Netzwerk der zehn GFBio-Datenzentren einen Grundpfeiler für die Mobilisierung von Biodiversitätsdaten. Neben den drei spezialisierten Datenzentren für Pflanzen-, Nukleotid- sowie ökologische und geologische Daten bieten sieben naturwissenschaftliche Sammlungen die Möglichkeit, digitale sowie physische Daten langfristig zu managen, zu archivieren und zitierbar zu veröffentlichen.

Die Datenzentren als Netzwerk

Die GFBio-Datenzentren arbeiten als Netzwerk zusammen, um die Standardisierung und Interoperabilität von Forschungsdaten zu fördern. Die Datenzentren haben gemeinsame Formate, Standards und Pipelines für das nachhaltige Datenmanagement, die Archivierung sowie den Zugriff und die Publikation von Daten erarbeitet, auf deren Grundlage sie ihre Services kontinuierlich weiterentwickeln. Die in den Datenzentren archivierten und veröffentlichten Daten sind über das GFBio-Datenportal zugänglich. Darüber hinaus liefern die Sammlungsdatenzentren ihre Daten auch an die Global Biodiversity Information Facility (GBIF); ein Großteil der Gruppe bildet zudem den deutschen GBIF-Knoten.

Aufgaben in NFDI4Biodiversity

Innerhalb der Task Area 3 erarbeiten die Vertreter:innen der Datenzentren gemeinsame Datenstandards und Datenpipelines für den langfristigen Datenerhalt und die Sicherung der Datenqualität gemäß der FAIR-Prinzipien. Sie sind maßgeblich an der Bereitstellung verschiedener GFBio-Services für das Management von Datenprodukten beteiligt:

Data Submission
Expert:innen der Datenzentren leiten Nutzende des Data Submission Service dabei an, ihre (heterogenen) biologischen, ökologischen und umweltbezogenen Datensätzen für die Einreichung in ein föderiertes Netzwerk von Datenzentren vorzubereiten. Die Datensätze werden von Fachexpert:innen des jeweiligen GFBio-Datenzentrums geprüft, fachspezifisch kuratiert, langfristig archiviert und publiziert.

Helpdesk und Nachhaltigkeit
Expert:innen der Datenzentren arbeiten im Helpdesk – unserer Anlaufstelle für alle Fragen rund um das Forschungsdatenmanagement – mit und beraten zu Datenpublikation und -archivierung.

Data Management Plan Tool (DMPT)
Das GFBio-DMP-Tool steht Forschenden zur Verfügung, um fachgerechte Datenmanagementpläne (DMPs) für biodiversitätsbezogene Projekte zu erstellen. Datenkurator:innen der Datenzentren unterstützen dabei individuell bei der Planung für bestimmte Datentypen und Archive und beraten Forschende im persönlichen Gespräch, um die Grundlage für eine spätere Übernahme von Datenprodukten in die etablierten Datenpipelines der GFBio-Datenzentren bereits in den DMPs zu verankern.

GFBio-Datenportal und BioCASe Monitor Service
Über das GFBio-Datenportal sind die veröffentlichten Daten der GFBio-Datenzentren für Forschende zugänglich. Dies wird ermöglicht durch die Kuration und Bereitstellung der Daten über die etablierten Pipelines. Im gleichen Zug werden die Daten auf einheitliche Metadata-Standards gemappt und, soweit möglich, in vereinbarte domänenspezifische Datenstandards überführt. Zudem werden Formatvalidierungen und Ontologie-Zuordnungen durchgeführt.