CloWM erweitert den NFDI4Biodiversity-Servicekatalog für die Analyse von Biodiversitätsdaten

Mit CloWM erweitert NFDI4Biodiversity sein Angebot um eine cloudbasierte Plattform für reproduzierbare bioinformatische Analysen direkt im Webbrowser. Forschende können damit etablierte Workflows wie APSCALE ohne eigene Recheninfrastruktur nutzen.
Nach dem Beschluss des NFDI4Biodiversity-Steuerungsgremiums im Februar 2026 ist der Cloud-based Workflow Manager (CloWM) [1] nun offizieller Bestandteil des NFDI4Biodiversity-Servicekatalogs.
CloWM wird von dem Bielefeld Institute for Bioinformatics Infrastructure (BIBI) der Universität Bielefeld gemeinsam mit dem German Network for Bioinformatics Infrastructure (de.NBI) entwickelt und betrieben. Die Plattform ermöglicht es Forschenden im Bereich Biodiversität, kuratierte und bewährte bioinformatische Workflows direkt über den Webbrowser auszuführen, ohne dass sie eigene Recheninfrastruktur oder lokale Softwareinstallationen benötigen.
Was CloWM bietet
CloWM ist eine Plattform für skalierbare und reproduzierbare Workflow-Ausführung. Über eine Weboberfläche erhalten Nutzer:innen Zugriff auf kuratierte und versionierte Analyse-Workflows, die auf cloudbasierter Recheninfrastruktur ausgeführt werden und eine integrierte S3-basierte Datenspeicherung nutzen. Die Workflows sind in Nextflow implementiert, einer in der Bioinformatik weit verbreiteten Workflow-Sprache.
Die Anmeldung erfolgt über Benutzeraccounts via Life-Science-Login oder NFDI-Login. Derzeit stellt die Plattform mehr als 50 produktiv einsetzbare Workflows für Forschungsbereiche wie Metagenomik, Metabarcoding, Genomassemblierung, Transkriptomik und Phylogenomik bereit. Bis heute verzeichnet CloWM mehr als 200 aktive Nutzer:innen und hatüber 2.700 Workflow-Ausführungen unterstützt.
Eine besondere Stärke von CloWM besteht darin, komplexe, kommandozeilenbasierte Analyse-Workflows über eine Weboberfläche zugänglich zu machen. Statt Software manuell zu installieren und selbst auszuführen, können Forschende Workflow-Parameter konfigurieren, Daten hochladen oder verlinken und Analysen direkt im Browser starten. Die Plattform übernimmt dabei automatisch die Workflow-Ausführung, Ressourcenverwaltung und Speicherung der Ergebnisse.
Biodiversitäts-Workflows in der Cloud
CloWM wird innerhalb des NFDI4Biodiversity-Servicekatalogs der Kategorie „Processing & Visualizing“ im Datenlebenszyklus zugeordnet. Diese Kategorie umfasst Dienste zur Analyse und Verarbeitung von Biodiversitätsdaten.
Ein für die Biodiversitätsforschung besonders relevanter Workflow ist APSCALE [2], der während der ersten Förderphase von NFDI4Biodiversity in Zusammenarbeit mit NFDI4Microbiota in CloWM integriert wurde. APSCALE dient der Analyse von DNA-Metabarcoding-Daten aus Umweltproben. Statt selbst Softwareinstallationen und Zugänge zu Rechenclustern verwalten zu müssen, können Forschende nunDNA-Sequenzierungsrohdaten aus Umweltproben direkt in CloWM hochladen und den APSCALE-Workflow über die Weboberfläche ausführen.
Die daraus entstehenden Metabarcoding-Daten können anschließend für weitere Verarbeitungsschritte wie die taxonomische Zuordnung sowie für die Einreichung in Biodiversitätsrepositorien über den GFBio Submission Service genutzt werden.
Erste Schritte
CloWM ist frei zugänglich unter https://clowm.bi.denbi.de. Nutzer:innen können sich mit ihrem Benutzeraccount über Life Science Login oder ihren NFDI-Login anmelden, um die verfügbaren Workflows zu durchsuchen und auszuführen.
Fragen und Supportanfragen können an das CloWM-Team unter support@clowm.bi.denbi.de oder an den NFDI4Biodiversity-Helpdesk gerichtet werden.
Literatur
[1] Göbel, D., Stoye, J., Sczyrba, A., & Beckstette, M. (2024). The Cloud-based Workflow Manager (CloWM) - An integrated platform for highly scalable workflow execution. German Conference on Bioinformatics 2024 (GCB), Bielefeld. Zenodo. https://doi.org/10.5281/zenodo.14039069
[2] Buchner, D., Macher, T.-H., & Leese, F. (2022). APSCALE: advanced pipeline for simple yet comprehensive analyses of DNA metabarcoding data. Bioinformatics, 38(20), 4817–4819. https://doi.org/10.1093/bioinformatics/btac588