TRIPLE est une initiative européenne récemment financée qui permettra un niveau sans précédent de partage interopérable des données entre chercheurs de tous les domaines scientifiques. L'accès aux données de recherche publiques et privées partagées de manière sélective sera facilité grâce à des solutions innovantes. Coordonné par le SIB, qui met à profit son expertise en matière de FAIRification des données, de représentation des connaissances et de bases de données ouvertes, le projet rassemble des partenaires de Belgique et de République tchèque. Grâce aux découvertes qu'il permettra de faire, TRIPLE profitera à la communauté scientifique dans son ensemble ainsi qu'à la société, l'une de ses premières applications étant la recherche d'organismes susceptibles de contribuer à la dégradation des polluants.
1. Stockage sécurisé des données privées dans des coffres-forts
Les Solid Pods sont une nouvelle technologie qui permet de sécuriser les données dans des coffres-forts. Ainsi, les ensembles de données sensibles, tels que ceux issus des premières phases de la recherche, peuvent rester confidentiels tout en restant accessibles à des groupes définis lorsque cela est souhaité, puis à tous lorsque cela est approprié.
Tirer parti d'une mine de données jusqu'alors inexploitées
Imaginez un avenir où chacun aurait accès, simultanément, à des données provenant de ressources ouvertes et à des données privées partagées de manière sélective par d'autres, telles que des données non publiées. Un tel accès à un corpus de connaissances inexploité constituerait un formidable coup de pouce pour la reproductibilité de la recherche et accélérerait les découvertes. C'est l'objectif de TRIPLE (Transforming RDF Interoperability with Solid Pods for next Level Experience). Ce nouveau projet, financé par l'appel européen CHIST-ERA visant à promouvoir les données de recherche ouvertes (ORD), est dirigé par le SIB et rassemble l'Institut de chimie organique et de biochimie de l'Académie tchèque des sciences (IOCB Prague) et l'Université de Gand (Belgique).
« Le fait d'agir en tant que coordinateur d'un tel projet européen est une reconnaissance de notre expertise de longue date dans le domaine des données de recherche ouvertes et de notre capacité à rassembler des acteurs multidisciplinaires à grande échelle », déclare Christophe Dessimoz, directeur exécutif du SIB. « TRIPLE vise à jeter les bases qui permettront d'effectuer des recherches intégrées sur des données de recherche publiques et privées. »
2. Un premier cas d'utilisation pour identifier des organismes capables de décomposer des polluants à l'aide des ressources SIB
Comme premier cas d'utilisation de TRIPLE, une recherche sera menée pour trouver des organismes capables de décomposer les polluants, un processus connu sous le nom de bioremédiation. Cela représente un défi particulier, car il faut extraire, à partir de bases de données publiques et privées, les protéines présentes dans les organismes qui effectuent les réactions biochimiques appropriées. Cela sera notamment réalisé à l'aide des ressources SIB Rhea, UniProtKB et OMA. Une nouvelle méthodologie sera développée afin de simplifier ces requêtes complexes pour les scientifiques spécialisés dans ce domaine.
Des solutions innovantes s'appuyant sur une expertise en matière de données de recherche ouvertes
Pour atteindre cet objectif, TRIPLE combinera l'expertise multidisciplinaire des partenaires du projet en matière d'ouverture des données de recherche et permettra une interopérabilité transparente avec les données privées stockées dans des coffres-forts sécurisés appelés Solid Pods (voir encadré 1).
« Un moyen efficace de tirer le meilleur parti des données de recherche consiste à bien documenter et à rendre interopérables les ensembles de données, de manière à pouvoir les interroger conjointement, c'est-à-dire de manière combinée. En créant des graphiques de connaissances à partir des données, les interconnexions existantes peuvent être exploitées pour extraire de nouvelles informations de la richesse des données grâce à des requêtes fédérées. Toutes ces compétences sont au cœur du SIB », explique Ana Claudia Sima, de l'unité Représentation des connaissances du groupe Vital-IT du SIB.
En savoir plus sur la manière dont nous encourageons l'ORD
Trois groupes du SIB apporteront ainsi leur savoir-faire au projet : la FAIRification des données dans le contexte de grands partenariats public-privé européens, la représentation des connaissances et la modélisation métabolique au sein du groupe Vital-IT, et le développement de logiciels et de bases de données ouverts et interconnectés, tels que les ressources SIB UniProtKB et Rhea au sein du groupe Swiss-Prot et le navigateur OMA au sein du groupe Comparative Genomics.nos équipes s'associent au groupe Bioinformatique de l'IOCB Prague et au laboratoire Internet Technology and Data Science Lab (IDLab) de l'université de Gand, qui apportent leurs connaissances dans le développement d'outils ouverts de chimio-informatique, le web sémantique et l'utilisation de Solid Pods.
Impacts considérables de la communauté scientifique sur la société
TRIPLE profitera aux développeurs de logiciels et aux producteurs de données en leur fournissant une documentation améliorée et de nouveaux outils pour rendre plus efficaces les requêtes fédérées complexes. Les chercheurs en sciences de la vie et autres personnes intéressées par les données produites pourront également exploiter plus efficacement les ressources en ligne et intégrer leurs propres données tout en garantissant leur conformité avec les principes FAIR. La société dans son ensemble bénéficiera à terme des résultats et des connaissances acquis grâce à cette exploitation accrue des données (voir encadré 2).
Membres du SIB impliqués :