Das SIB und andere führende Infrastrukturen und Biodiversitätsinformationsexperten werden entscheidendes Wissen über die Arten unseres Planeten in FAIR, maschinenlesbaren und KI-fähigen Formaten offen zugänglich machen. Die «Disentis-Roadmap» zielt darauf ab, bis 2035 Biodiversitätsdaten und -wissen aus schätzungsweise 500 Millionen Seiten Forschungs publikationen zu extrahieren und zu verknüpfen.

Die Disentis-Roadmap wurde bisher von 24 bedeutenden naturhistorischen Sammlungen, Forschungsinfrastrukturen, Zeitschriftenverlagen und globalen Biodiversitätsnetzwerken sowie weiteren 38 Einzelpersonen aus fünf Kontinenten unterzeichnet. Neben dem SIB gehören dazu das Naturmuseum Paris, die Kew Royal Botanic Gardens, die Global Biodiversity Information Facility, Pensoft Publishers und die Biodiversity Information Standards Community.

Alle Unterzeichner der Roadmap anzeigen

Verbesserung der Auffindbarkeit, des Zugangs und der Wiederverwendung von Biodiversitätsdaten

Wissenschaftler haben in den letzten 300 Jahren eine Fülle von Daten über die Natur gesammelt, darunter Artenbeschreibungen, Artenverbreitungen und Erkenntnisse über die Treiber von Umweltveränderungen. Diese Daten sind unerlässlich, um die anhaltende Biodiversitätskrise zu stoppen, One-Health-Ansätze umzusetzen und genaue KI-Modelle zu trainieren. Ein Großteil dieses Wissens ist jedoch nicht vollständig offen, zugänglich und/oder vernetzt. Dies ist ein großes Hindernis für den wissenschaftlichen Fortschritt, evidenzbasierte Politik und fundierte Entscheidungen.

Die Disentis-Roadmap wurde bisher von 24 bedeutenden naturhistorischen Sammlungen, Forschungsinfrastrukturen, Zeitschriftenverlagen und globalen Biodiversitätsnetzwerken sowie weiteren 38 Einzelpersonen aus fünf Kontinenten unterzeichnet. Neben dem SIB gehören dazu das Naturmuseum Paris, die Kew Royal Botanic Gardens, die Global Biodiversity Information Facility, Pensoft Publishers und die Biodiversity Information Standards Community.

Alle Unterzeichner der Roadmap anzeigen

Die Disentis-Roadmap ist ein Zehnjahresplan zur «Befreiung» dieser Daten aus Forschungsveröffentlichungen. Das SIB hat an der Ausarbeitung mitgewirkt, ist Unterzeichner und wird die Umsetzung im Rahmen einer internationalen Zusammenarbeit unterstützen. Die Roadmap ist Teil eines umfassenderen Arbeitsbereichs unserer Gruppe Environmental Bioinformatics, der darauf abzielt, Biodiversitäts- und Umweltwissen aus verschiedenen Quellen für aussagekräftigere Analysen zu integrieren – und unterstützt unsere Mission, das Potenzial von Biodaten zu erschließen, um Innovationen für eine bessere Zukunft zu ermöglichen.

Ein Open-Science-Rahmenwerk, das neue Artendaten mit veröffentlichten Erkenntnissen verknüpft

Das Projekt wird Informationen aus digitalisierten PDF-Artikeln mithilfe von Text-Mining-Technologien und Annotations-Workflows extrahieren – beispielsweise solchen, die von Plazi entwickelt wurden, einem digitalen taxonomischen Literaturarchiv, das eng mit der SIB Text Mining Group zusammenarbeitet. Die aus wissenschaftlichen Publikationen gewonnenen Biodiversitätsdaten werden in der vom CERN gehosteten Biodiversity Literature Repository Zenodo Community frei zugänglich gemacht. Die digitale Bibliothek kann dann in andere Plattformen einfließen, die als wichtige ergänzende Wissensquellen für die heutige Biodiversitätsforschung dienen, darunter die Biodiversity PMC-Ressource und andere offene, vernetzte Dateninfrastrukturen. Dieser Prozess ermöglicht es, Daten über neue Arten und den physischen Standort der zitierten gespeicherten Exemplare nahezu in Echtzeit offen zugänglich zu machen und langfristig verfügbar zu halten.

Die spezifischen Ziele der Roadmap für 2035 lauten:

  • alle wichtigen öffentlichen Geldgeber für Biodiversitätsforschung und akademischen Verlage werden die Veröffentlichung von Daten fördern und ermöglichen, die den FAIR-Prinzipien (auffindbar, zugänglich, interoperabel und wiederverwendbar) entsprechen.
  • veröffentlichungen mit Schwerpunkt auf Biodiversität werden in maschinenverarbeitbaren Formaten zugänglich sein, wobei alle nicht urheberrechtlich geschützten Teile von Artikeln in öffentliche Datenrepositorien einfließen;
  • veröffentlichte Forschungsergebnisse zur Biodiversität sind „vollständig KI-fähig“, d. h. sie sind für KI-Trainingszwecke frei verfügbar und für die Aufnahme in maschinelle Lernmodelle ordnungsgemäß gekennzeichnet, wobei die entsprechenden ethischen und rechtlichen Rahmenbedingungen einzuhalten sind.
  • spezielle Mittel aus Forschungs- und Infrastrukturzuschüssen werden für die Gewährleistung des Zugangs zu Biodiversitätsdaten und -wissen reserviert.

Das endgültige „Biodiversity Libroscope” wird eine dringend benötigte Nische im Bereich der Literaturdienste und -werkzeuge der nächsten Generation füllen, indem es hochwertige Daten und andere Forschungsobjekte (wie Bilder, Referenzen und taxonomische Merkmale) zu biologischen Taxa, ihren Beziehungen untereinander und zur Umwelt sowie ihren Auswirkungen und ihrer Bedeutung für den Naturschutz, Ökosystemleistungen und den Menschen bereitstellt.

Datenwissenschaftler schließen sich mit Verlagen und Biodiversitätsexperten zusammen

Die Disentis-Roadmap ist das Ergebnis eines Symposiums zum Thema Biodiversitätswissen, das im August 2024 stattfand und führende Experten aus den Bereichen Biodiversität, offene Wissenschaft und Datenmanagement zusammenbrachte – darunter auch Vertreter des SIB, die ihr Fachwissen aus der Bioinformatik in den Bereichen Dateninfrastruktur, Informationsextraktion und -verknüpfung, rechtliche Überlegungen und nachgelagerte Datennutzung einbrachten.

Das Symposium und die Roadmap sind eine Folge der Bouchout-Erklärung für offenes Biodiversitätswissensmanagement aus dem Jahr 2014, die von über 300 Institutionen und Biodiversitätsexperten weltweit unterzeichnet wurde.