Le SIB et d'autres infrastructures de premier plan ainsi que des experts en information sur la biodiversité mettront à disposition gratuitement des connaissances essentielles sur les espèces de notre planète dans des formats FAIR, lisibles par machine et compatibles avec l'intelligence artificielle. La « feuille de route de Disentis » vise à extraire et à relier les données et les connaissances sur la biodiversité contenues dans environ 500 millions de pages de publications scientifiques d'ici 2035.

À ce jour, la feuille de route de Disentis a été signée par 24 grandes collections d'histoire naturelle, infrastructures de recherche, éditeurs de revues et réseaux mondiaux de biodiversité, ainsi que par 38 experts individuels issus des cinq continents. Outre le SIB, on compte parmi eux le Muséum national d'histoire naturelle de Paris, les Jardins botaniques royaux de Kew, le Centre mondial d'information sur la biodiversité, les éditions Pensoft et la communauté Biodiversity Information Standards.

Voir tous les signataires de la feuille de route

Améliorer la découverte, l'accès et la réutilisation des données sur la biodiversité

Au cours des 300 dernières années, les scientifiques ont collecté une multitude de données sur le monde naturel, notamment des descriptions d'espèces, leur répartition et des informations sur les facteurs de changement environnemental. Ces données sont essentielles pour  enrayer la crise actuelle de la biodiversitémettre en œuvre des approches « One Health » et  former des modèles d'IA précis. Cependant, une grande partie de ces connaissances n'est pas entièrement ouverte, accessible et/ou connectée. Cela constitue un obstacle majeur au progrès scientifique, à l'élaboration de politiques fondées sur des données probantes et à la prise de décisions éclairées.

À ce jour, la feuille de route de Disentis a été signée par 24 grandes collections d'histoire naturelle, infrastructures de recherche, éditeurs de revues et réseaux mondiaux de biodiversité, ainsi que par 38 experts individuels issus des cinq continents. Outre le SIB, on compte parmi eux le Muséum national d'histoire naturelle de Paris, les Jardins botaniques royaux de Kew, le Centre mondial d'information sur la biodiversité, les éditions Pensoft et la communauté Biodiversity Information Standards.

Voir tous les signataires de la feuille de route

La feuille de route de Disentis est un plan décennal visant à « libérer » ces données issues des publications scientifiques. Le SIB a contribué à sa rédaction, en est signataire et soutiendra sa mise en œuvre dans le cadre d'une collaboration internationale. La feuille de route s'inscrit dans le cadre plus large des travaux de notre groupe Environmental Bioinformatics visant à intégrer les connaissances sur la biodiversité et l'environnement provenant de multiples sources afin de permettre des analyses plus pertinentes. Elle soutient également notre mission qui consiste à libérer le potentiel des données biologiques afin de favoriser l'innovation pour un avenir meilleur.

Un cadre scientifique ouvert reliant les nouvelles données sur les espèces aux connaissances publiées

Le projet extraira des informations à partir d'articles PDF numérisés à l'aide de technologies d'exploration de textes et de workflows d'annotation, tels que ceux développés par Plazi, un référentiel numérique de littérature taxonomique travaillant en étroite collaboration avec le groupe SIB Text Mining. Les données sur la biodiversité issues de publications scientifiques sont mises à la disposition du public sur le référentiel de littérature sur la biodiversité Zenodo hébergé par le CERN. La bibliothèque numérique peut ensuite alimenter d'autres plateformes qui constituent aujourd'hui des sources complémentaires essentielles de connaissances pour la recherche sur la biodiversité, notamment la ressource Biodiversity PMC et d'autres infrastructures de données ouvertes et liées. Ce processus permet de rendre les données sur les nouvelles espèces et l'emplacement physique des spécimens cités librement accessibles en temps quasi réel et disponibles à long terme.

Les objectifs spécifiques de la feuille de route pour 2035 sont les suivants :

  • tous les principaux bailleurs de fonds publics de la recherche sur la biodiversité et les éditeurs universitaires encourageront et permettront la publication de données conformes aux principes FAIR (faciles à trouver, accessibles, interopérables et réutilisables) ;
  • les publications axées sur la biodiversité seront accessibles dans des formats exploitables par des machines, toutes les parties des articles non protégées par le droit d'auteur étant versées dans des référentiels de données publics ;
  • les recherches publiées sur la biodiversité seront « entièrement prêtes pour l'IA », c'est-à-dire librement accessibles pour la formation à l'IA et correctement étiquetées pour être intégrées dans des modèles d'apprentissage automatique, dans le respect des cadres éthiques et juridiques appropriés ;
  • des financements spécifiques provenant de subventions de recherche et d'infrastructure seront réservés pour garantir l'accès aux données et aux connaissances sur la biodiversité.

Le « Biodiversity Libroscope » final comblera un créneau très recherché de services et d'outils de documentation de nouvelle génération fournissant des données de haute qualité et d'autres objets de recherche (tels que des images, des références et des caractéristiques taxonomiques) sur les taxons biologiques, leurs relations entre eux et avec l'environnement, ainsi que leur impact et leur importance pour la conservation de la nature, les services écosystémiques et les populations.

Les experts en science des données s'associent aux éditeurs et aux professionnels de la biodiversité

La feuille de route de Disentis est le résultat d'un symposium sur les connaissances en matière de biodiversité qui s'est tenu en août 2024 et qui a réuni des experts de premier plan dans les domaines de la biodiversité, de la science ouverte et de la gestion des données, notamment des représentants du SIB, qui ont apporté leur expertise en bioinformatique sur l'infrastructure des données, l'extraction et la mise en relation d'informations, les considérations juridiques et l'utilisation en aval des données.

Le symposium et la feuille de route font suite à la Déclaration de Bouchout pour une gestion ouverte des connaissances sur la biodiversité, signée en 2014 par plus de 300 institutions et experts mondiaux de la biodiversité.