Dies ist die zusammenfassende Beschreibung dieser neuen Forschungsinfrastruktur, die im Rahmen der SBFI-Forschungsinfrastruktur-Roadmap 2023 eingereicht wurde.
Die Schweiz steht an der Spitze der Datenrevolution in den Lebenswissenschaften. Um diesen Wandel zu unterstützen, haben Schweizer Universitäten und Forschungsinstitute massiv in lokale Plattformen zur Datengenerierung und -verarbeitung investiert und sich den Grundsätzen der offenen Forschungsdaten verschrieben. Eine effektive gemeinsame Nutzung und Wiederverwendung von Daten erfordert jedoch gemeinsam festgelegte Qualitäts- und Betriebsstandards sowie eine enge Zusammenarbeit zwischen Fachexperten und Datenwissenschaftlern.
Das SwissBioData ecosystem (SBDe) ist eine dezentrale Infrastruktur, die sich diesen Herausforderungen stellt und die Fähigkeit der Schweiz stärkt, Forschungsdaten in Wissen und Innovation umzuwandeln. Ziel ist es, (a) die Qualität, Standardisierung und Effizienz entlang der gesamten Datenwertschöpfungskette – von der Datenproduktion bis zur Wissensgenerierung – durch eine Plattformföderation zu steigern, (b) der Schweizer Forschungsgemeinschaft modernste Unterstützung bereitzustellen, damit sie ihre Daten, Methoden, Software-Tools und Arbeitsabläufe FAIR (auffindbar, zugänglich, interoperabel, wiederverwendbar) zu machen; und (c) neue Ressourcen zu schaffen, die die internationale Wettbewerbsfähigkeit und Stellung der Schweiz im Bereich der Dateninfrastruktur für die Lebenswissenschaften stärken. Durch eine bessere Koordination innerhalb des nationalen und internationalen Datenwissenschafts-Ökosystems ist SBDe bestrebt, Doppelarbeit zu vermeiden und stattdessen bestehende Infrastrukturen und Initiativen zu nutzen.
SBDe: eine Vision, die von 54 Plattformen, Kernfacilities und Forschungsgruppen aus 18 Schweizer Institutionen entwickelt wurde (Stand: 31.01.23)

SBDe gliedert sich in vier Hauptsäulen:
- Produktion: SBDe wird bewährte Verfahren für die Datenerfassung, die Umsetzung von Qualitätskontrollstrategien, die Analyse und die ständige Aktualisierung des Datenformats und der Metadatenlandschaft auf 48 Plattformen, in Kernanlagen und Forschungsgruppen an 17 Schweizer Institutionen harmonisieren.
- Analyse: SBDe unterstützt die FAIR-konforme Datenverarbeitung, -analyse und -modellierung, indem es Forschern hilft, Softwaretools und Workflows auf verteilten Recheninfrastrukturen aufzubauen, anzupassen und einzusetzen, indem es ihnen in allen Phasen der Datenverarbeitung und -analyse mit mehrstufiger Expertise zur Seite steht, indem es die Wiederverwendung von Softwarekomponenten durch Wartung, Dokumentation und Training fördert und indem es die Standardisierung, den Einsatz und den Austausch trainierter Modelle für maschinelles Lernen unterstützt.
- Integration: Die Experten von SBDe helfen Schweizer Forschern dabei, Daten so zu strukturieren, zu beschreiben und zu teilen, dass die FAIR-Perspektiven maximiert werden, und Datenabfrage- und -integrationsverfahren zu automatisieren. Der SwissBioData Knowledge Graph (SBD-KG) ist eine neue Ressource für die Schweizer und weltweite Community, die derzeit über verschiedene Repositorien verstreute Datensätze miteinander verknüpft und sowohl Metadaten als auch Ontologien enthält, um semantische Interoperabilität herzustellen und die Identifizierung und Kombination komplexer Datensätze zu ermöglichen.
- Cloud-Dienste: Die Dienste und Ressourcen von SBDe basieren auf einer interoperablen Technologieebene. Mithilfe von Virtualisierungstechnologien unterstützt SBDe die föderierte Datenverarbeitung und kombiniert lokale Infrastruktur mit Rechenressourcen, die in externen Clouds verfügbar sind. Jeder Forscher hat Zugang zu einem FAIR-Raum, der Daten, Workflows, Methoden, Softwaretools und Modelle für maschinelles Lernen umfasst.
Über alle Säulen hinweg werden die Ressourcen und Dienste von SBDe durch ein umfangreiches Trainingsprogramm für Kernfacilities und Endnutzer sowie durch Treiberprojekte mit offenen Ausschreibungen unterstützt, um die Aspekte Datenakquisition, Modellierung, Verbreitung und/oder Analyse bestehender Projekte zu stärken und damit auch die Verbindung zwischen SBDe und der Schweizer Forschungsgemeinschaft zu festigen.
Anreize für den Datenaustausch innerhalb der Infrastruktur, die für den Erfolg des Projekts von entscheidender Bedeutung sind, werden auf nationalen und internationalen Erfahrungen mit der Messung der Auswirkungen von Datenbanken aufbauen und geeignete Mechanismen zur Quellenangabe im Falle der Wiederverwendung von Datensätzen sowie die Bereitstellung von Nutzungsstatistiken umfassen.
Das SIB Swiss Institute of Bioinformatics wird SBDe koordinieren und dabei auf jahrzehntelanger Erfahrung in der Entwicklung weit verbreiteter Bioinformatik-Datenbanken und -Ressourcen, insbesondere modernster Tools und Workflows für die Biologie, in der dezentralen Datenmodellierung und -verbreitung sowie im Training aufbauen. Der Beitrag des SIB stützt sich auch auf die jüngsten Erfahrungen mit der Entwicklung der schweizweiten BioMedIT/SPHN-Infrastruktur für biomedizinische Daten, sowohl auf technischer als auch auf organisatorischer Ebene.
Durch die Zusammenführung von Datenproduktionsplattformen, Datenreservoirs und Rechenressourcen schafft SBDe Synergien, die die Schweizer Life Sciences auf die nächste Stufe heben und die Schweizer Bioindustrie – einschließlich des Pharmasektors – mitziehen werden. Auf internationaler Ebene fördert SBDe Kooperationen und Synergien und fungiert als „Vergrößerungslinse“, um die Beiträge der Schweiz hervorzuheben und neue zu fördern, indem es das Ansehen seiner Partner und Nutzer stärkt.