Wichtige biologische Informationen, darunter die sogenannte „kryptische“ Diversität und innerartliche Variation, die die Resilienz beeinflussen können, werden erschlossen und in einen Modellierungsrahmen zur Bewertung des Artenreichtums und der Verbreitungsmuster integriert. Unter der Leitung des SIB entwickelt und evaluiert die vom SNF finanzierte Zusammenarbeit Modellierungsansätze, die traditionelle Daten zum Vorkommen von Arten mit drei zusätzlichen Datentypen kombinieren: Genomik, aus der Literatur gewonnene Merkmale und taxonomische Veränderungen im Zeitverlauf. Ziel ist es, eine breitere Evidenzbasis für die Biodiversitätsforschung zu schaffen – und maßgeschneiderte Leitlinien für den Umweltschutz und die Renaturierung zu ermöglichen.
Verbesserung von Biodiversitätsmodellen mit bisher isoliert gespeicherten Daten
Biodiversitätsbewertungen liefern wichtige Informationen darüber, wo Arten leben, wie sich ihre Verbreitungsgebiete verändern und welche Populationen am stärksten gefährdet sind, und dienen so als Grundlage für Naturschutzstrategien und -massnahmen. Bei solchen Bewertungen werden Modelle verwendet, um Daten aus Feldstudien auf grössere Lebensräume und Ökosysteme zu extrapolieren. Diese Modelle kombinieren in der Regel das Vorkommen von Arten mit Umweltfaktoren – was bedeutet, dass sie bisher unbeschriebene Arten sowie wichtige biologische Merkmale, die die langfristige Widerstandsfähigkeit von Arten beeinflussen können, wie genetische Vielfalt und Unterschiede zwischen Populationen, ausser Acht lassen. Sie sind zudem von Unsicherheiten betroffen, die beispielsweise durch Änderungen der Artendefinitionen im Zuge neuer Erkenntnisse sowie durch „kryptische“ Arten entstehen, die morphologisch schwer zu unterscheiden sind.
Genomdaten, veröffentlichte Artenkenntnisse und historische taxonomische Aufzeichnungen können diese Lücken füllen, sind jedoch derzeit fragmentiert, nicht interoperabel oder schwer zugänglich. Das neue Projekt wird diese Herausforderung bewältigen. Zwei SIB-Gruppen und der Partner Plazi werden Daten aus diesen Quellen für ausgewählte Arten in der Schweiz und in Europa erschließen – und diese Daten dann mit Vorkommens- und Umweltdaten in einem gemeinsamen Modellierungsrahmen integrieren. Die Ergebnisse sollen politischen Entscheidungsträgern und Naturschutzfachleuten helfen, Schutzmaßnahmen gezielter auszurichten, und Forschern eine reichhaltigere Evidenzbasis für weitere Studien bieten.
Die Arbeit stützt sich auf die Expertise des SIB in den Bereichen Biodiversitätsdaten, KI-gestütztes Text Mining und statistische Modellierung und fördert die strategischen Ziele des SIB, Instrumente zur Bewältigung von Umweltproblemen zu entwickeln und nationale Bemühungen zum Umweltschutz zu unterstützen.
Genomanalyse, Literaturrecherche und Kartierung taxonomischer Veränderungen
Die ausgewählten Artengruppen – Vögel, Fledermäuse und Fische in der Schweiz sowie Schmetterlinge, Hummeln und Süßwasser-Amphipoden in Europa – repräsentieren ein Spektrum des verfügbaren Wissens, das von umfangreichen, langfristigen Datensätzen bis hin zu vereinzelten Studien reicht. Um die neuen Modellierungsdaten zu generieren, wird das Projekt:
- die genetische Vielfalt, die Populationsstruktur und die Resilienzindikatoren der Arten anhand von Genomdaten aus etablierten DNA-Sequenz-Repositorien sowie aus allgemeinen Repositorien charakterisieren . Die Mobilisierung der letzteren – die schwer zu finden und wiederzuverwenden sein können – erfordert zunächst die Identifizierung und Katalogisierung relevanter Datensätze. Diese Datensätze werden zudem, soweit möglich, für die Hinterlegung in etablierten Sequenz-Repositorien aufbereitet, um ihre Auffindbarkeit und Nutzung für Modellierung und Forschung weiter zu verbessern.
- Daten zu Artenmerkmalen aus der Literatur, wie Lebensgeschichte, Lebensraumpräferenzen und Interaktionen mit anderen Arten, werden extrahiert . Die Informationen werden mithilfe von KI-gestütztem Text Mining und natürlicher Sprachverarbeitung aus bestehenden maschinenlesbaren wissenschaftlichen Artikeln und taxonomischen Aufzeichnungen (Biodiversity PMC, entwickelt von einer SIB-Gruppe; TreatmentBank, entwickelt von Plazi)gewonnen . Feldführer und Monografien mit entsprechenden Zugriffsrechten werden ebenfalls digitalisiert, in maschinenlesbare Formate umgewandelt und analysiert.
- Quantifizierung taxonomischer Unsicherheit. Wenn Arten aufgeteilt, zusammengeführt oder neu klassifiziert werden, können sich Daten aus verschiedenen Jahrzehnten auf wissenschaftliche Namen und Konzepte beziehen, die sich seitdem geändert haben – oder sogar auf mehr als eine Art. Solche Änderungen werden mithilfe des SynoSpecies-Tools von Plazi in den taxonomischen Datensätzen abgebildet. Soweit möglich, wird die verbleibende Mehrdeutigkeit durch Indizes für taxonomische Unsicherheit dargestellt.
Modelle, die die neuen Daten einbeziehen, werden mit Basismodellen verglichen, die ausschließlich Artenvorkommen und Umweltdaten verwenden, wobei die Ergebnisse von Fachexperten überprüft werden. Dieser Vergleich wird bewerten, inwieweit jeder Datentyp die Modellleistung verbessert.
Ermöglichung von Naturschutzmaßnahmen und weiterer Forschung
Die Modellausgaben sollen Biodiversitäts-Hotspots, gefährdete Populationen und prognostizierte Reaktionen auf Umweltveränderungen bei den ausgewählten Artengruppen identifizieren. Datensätze, Merkmalsannotationen, Arbeitsabläufe und Code werden unter Beachtung von Lizenzbestimmungen, Datenrechten und Sensitivitätsauflagen offen zugänglich gemacht – zur Unterstützung weiterer Biodiversitätsforschung und der Ausweitung des Modellierungsrahmens auf neue Arten.