Verranno rese disponibili importanti informazioni biologiche, tra cui la cosiddetta «diversità criptica» e la variazione intraspecifica che può influire sulla resilienza, e integrate in un quadro di modellizzazione per la valutazione della ricchezza e della distribuzione delle specie. Guidata dal SIB, la collaborazione finanziata dal FNS sta sviluppando e valutando approcci di modellizzazione che combinano i tradizionali dati sulla presenza delle specie con tre ulteriori tipi di dati: la genomica, i tratti individuati nella letteratura e i cambiamenti tassonomici nel tempo. L'obiettivo è fornire una base di dati più ampia per la ricerca sulla biodiversità e consentire una guida più mirata per la protezione e il ripristino dell'ambiente.
Migliorare i modelli sulla biodiversità grazie a dati precedentemente isolati
Le valutazioni sulla biodiversità guidano le politiche e le azioni di conservazione fornendo informazioni fondamentali su dove vivono le specie, su come stanno cambiando i loro areali e su quali popolazioni siano maggiormente a rischio. Tali valutazioni utilizzano modelli per estrapolare i dati provenienti dagli studi sul campo a habitat ed ecosistemi più ampi. Questi modelli combinano tipicamente la presenza delle specie con fattori ambientali; ciò significa che tralasciano le specie non ancora descritte, nonché caratteristiche biologiche fondamentali in grado di determinare la resilienza a lungo termine delle specie, quali la diversità genetica e le differenze tra le popolazioni. Sono inoltre influenzati da incertezze derivanti, ad esempio, dai cambiamenti nelle definizioni delle specie man mano che si generano nuove conoscenze e dalle specie "criptiche" difficili da distinguere morfologicamente.
I dati genomici, le conoscenze pubblicate sulle specie e i dati tassonomici storici possono colmare queste lacune, ma attualmente sono frammentati, non interoperabili o di difficile accesso. Il nuovo progetto supererà questa sfida. Due gruppi del SIB e il partner Plazi renderanno accessibili i dati provenienti da queste fonti per specie selezionate in Svizzera e in Europa, per poi integrarli con i dati sulla presenza e quelli ambientali in un quadro di modellizzazione condiviso. I risultati sono destinati ad aiutare i responsabili politici e gli operatori della conservazione a indirizzare gli sforzi di protezione in modo più preciso e a fornire ai ricercatori una base di prove più ricca per ulteriori studi.
Il lavoro si avvale delle competenze del SIB in materia di dati sulla biodiversità, text mining basato sull'intelligenza artificiale e modellizzazione statistica, e promuove gli obiettivi strategici del SIB di sviluppare strumenti per affrontare le sfide ambientali e sostenere gli sforzi nazionali per la protezione dell'ambiente.
Analisi dei genomi, ricerca nella letteratura scientifica e mappatura dei cambiamenti tassonomici
I gruppi di specie selezionati – uccelli, pipistrelli e pesci in Svizzera e farfalle, bombi e anfipodi d'acqua dolce in Europa – rappresentano un ampio spettro delle conoscenze disponibili, che spazia da vaste serie di dati raccolti nel lungo periodo a studi più sporadici. Per generare i nuovi dati di input per la modellizzazione, il progetto:
- Caratterizzerà la diversità genetica delle specie, la struttura delle popolazioni e gli indicatori di resilienza utilizzando dati genomici provenienti sia da archivi di sequenze di DNA consolidati che da archivi generici. La mobilitazione di questi ultimi – che possono essere difficili da trovare e riutilizzare – richiederà innanzitutto l’identificazione e la catalogazione dei set di dati rilevanti. Questi set di dati saranno inoltre preparati per essere depositati, ove possibile, in archivi di sequenze consolidati, al fine di migliorarne ulteriormente la reperibilità e l’utilizzo per la modellizzazione e la ricerca.
- Estrarre dalla letteratura i dati relativi ai tratti delle specie, quali il ciclo vitale, le preferenze di habitat e le interazioni con altre specie. Le informazioni saranno estratte utilizzando il text mining assistito dall’intelligenza artificiale e l’elaborazione del linguaggio naturale, da articoli scientifici e registrazioni tassonomiche esistenti leggibili da macchina (Biodiversity PMC, sviluppato da un gruppo del SIB; TreatmentBank, sviluppato da Plazi). Anche le guide sul campo e le monografie con diritti di accesso appropriati saranno digitalizzate, elaborate in formati leggibili da macchina e analizzate.
- Quantificare l'incertezza tassonomica. Quando le specie vengono suddivise, unite o riclassificate, i dati relativi a decenni diversi possono riferirsi a nomi scientifici e concetti che da allora sono cambiati – o addirittura a più di una specie. Tali cambiamenti saranno mappati all'interno del registro tassonomico utilizzando lo strumento SynoSpecies di Plazi. Ove possibile, l'ambiguità residua sarà rappresentata tramite indici di incertezza tassonomica.
I modelli che incorporano i nuovi dati saranno confrontati con modelli di riferimento che utilizzano solo dati sulla presenza delle specie e dati ambientali, con risultati revisionati da esperti del settore. Questo confronto valuterà in che misura ogni tipo di dato migliora le prestazioni del modello.
Promuovere iniziative di conservazione e ulteriori ricerche
I risultati del modello dovrebbero consentire di individuare i punti caldi della biodiversità, le popolazioni vulnerabili e le risposte previste ai cambiamenti ambientali per i gruppi di specie selezionati. I set di dati, le annotazioni sui tratti, i flussi di lavoro e il codice saranno resi disponibili liberamente, nel rispetto delle licenze, dei diritti sui dati e dei vincoli di riservatezza, a sostegno di ulteriori ricerche sulla biodiversità e dell'estensione del quadro di modellizzazione a nuove specie.