BiodiversiTea

BiodiversiTea – die NFDI4Biodiversity Coffee Lecture #15

Organisation: NFDI4Biodiversity

Austauschen und Tee trinken: Das Onlineformat BiodiversiTea bietet ein Forum zum Vorstellen und Diskutieren von Arbeiten, Projekten, Tools und Themen aus der und um die NFDI4Biodiversity-Community. Einmal im Monat treffen wir uns online für eine Stunde mit euch und Ihnen – für spannende Präsentationen und angeregten Austausch bei einer Tasse Tee (oder Kaffee). Die Runde ist offen für alle, die Lust haben, sich über aktuelle Entwicklungen und Themen rund um Biodiversitätsdaten zu informieren und auszutauschen. Eine Zugehörigkeit zu NFDI4Biodiversity ist nicht notwendig.


Thema im August 2025
SAHIS - ein Einblick in die GFBio Such- und Harvesting-Infrastruktur zur Erkundung heterogener Biodiversitätsdaten

Vortragende
Claas-Thido Pfaff (Gesellschaft für Biologische Daten – GFBio e.V.)


Darum geht es
Die GFBio-Such- und Harvesting-Infrastruktur (SAHIS) verarbeitet als Backend-System über 19 Millionen Einträge aus Biodiversitätsdatensätzen deutscher Forschungseinrichtungen, Fachgesellschaften und internationaler Archive. Diese Session bietet einen umfassenden Einblick in die Architektur und ordnet die Funktion und Bedeutung von SAHIS in den Kontext globaler Biodiversitäts-Datenportale ein.

Im ersten Teil wird die technische Infrastruktur vorgestellt: eine verteilte Architektur mit diversen aktiven Datenanbietern, die Integration verschiedener Datenprotokolle (BioCASe, OAI-PMH, Darwin Core) sowie zentrale Komponenten wie der Aggregator für Registrierung und Validierung, spezialisierte Harvester für unterschiedliche Datenformate und die Elasticsearch-basierte Such-Infrastruktur. Besondere Aufmerksamkeit gilt den Herausforderungen heterogener Datenquellen und deren Harmonisierung.

Der zweite Teil betrachtet die strategische Bedeutung nationaler Biodiversitätsportale im wissenschaftlichen Daten-Ökosystem. Anhand von SAHIS und internationalen Beispielen wird diskutiert, welche spezifischen Funktionen nationale Infrastrukturen erfüllen, die globale Plattformen wie GBIF nicht effizient bereitstellen können: von der Integration regionaler Datenquellen über sprachspezifische Dienste bis zur Anpassung an lokale Forschungspraktiken und regulatorische Anforderungen.

Abschließend werden Entwicklungsperspektiven für SAHIS skizziert. Dabei gilt das Augenmerk insbesondere der geplanten Migration zu DCAT v3. Diese bringt eine generische Datenregistrierung mit sich, erlaubt eine verbesserte Föderation mit anderen Portalen und Initiativen und hat eine strukturgebende Rolle für Entwicklung einheitlicher ETL-Pipelines und Such-Indices. Der Vortrag richtet sich an Teilnehmende, die sowohl an technischen Implementierungsdetails als auch an der strategischen Rolle nationaler Biodiversitätsinfrastrukturen interessiert sind.

Fragen & Anregungen
Der BiodiversiTea lebt von euren Ideen! Ihr möchtet Feedback einholen, sucht Mitstreiter, möchtet Arbeitsergebnisse vorstellen oder wollt euch zu einem Thema in größerer Runde austauschen? Schreibt uns an helpdesk@nfdi4biodiversity.org oder über unser Helpdesk-Formular und wir gestalten zusammen eine der kommenden Lectures.Auch bei Fragen freuen wir uns über eine Nachricht an unseren Helpdesk.
Teilnehmen Wir bitten um eine kurze Registrierung vorab:

Das Meeting wird kurz vor Beginn des Events geöffnet.

BiodiversiTea Logos (29.7 x 21 cm)
19.08.2025
11:00 - 12:00
Online
Deutsch
share on