ModelArchive, un référentiel ouvert pour le partage de modèles de structures protéiques déterminées par calcul, a reçu une subvention de swissuniversities pour développer les principes de l'accès libre aux données de recherche (ORD). Plusieurs responsables de groupes du SIB collaborent avec des experts internationaux pour développer cette resource de données, qui complète la Protein Data Bank (PDB) pour les structures protéiques déterminées expérimentalement.

Exploiter l'explosion des structures protéiques prédites

De nouvelles méthodes de modélisation basées sur l'apprentissage profond, telles qu'AlphaFold, permettent désormais de prédire la structure des protéines avec une grande précision, proche de celle obtenue par l'expérimentation. Cela a entraîné une explosion des modèles prédits par ordinateur, qui complètent la gamme autrement limitée des structures déterminées expérimentalement. De plus, des progrès sont déjà observés dans la modélisation des complexes protéiques, notamment leurs interactions avec de petites molécules (par exemple, des médicaments), l'ARN et l'ADN. La modélisation des protéines dans différents états conformationnels progresse également, tout comme les études d'ingénierie et de conception des protéines. Tous ces modèles ont besoin d'un espace dédié pour être stockés et mis à la disposition des scientifiques du vivant afin qu'ils puissent les utiliser dans leurs domaines de recherche respectifs, de la découverte de médicaments à la biologie moléculaire.

C'est là qu'intervient ModelArchive. Développé par le groupe de Torsten Schwede au SIB, il permet de déposer et de partager des structures protéiques déterminées par des méthodes computationnelles. Il complète ainsi la Protein Data Bank (PDB) et PDB-Dev qui stockent respectivement des structures dérivées et partiellement dérivées de données expérimentales. En s'appuyant sur les meilleures pratiques actuelles en matière de données de recherche ouvertes, telles que le format de données ModelCIF, ModelArchive vise à devenir le référentiel de référence pour le partage des structures protéiques modélisées par ordinateur. Cette initiative visant à promouvoir les données de recherche ouvertes (ORD) a reçu un financement de swissuniversities (voir encadré).

L'appel lancé par swissuniversities pour des projets favorisant l'ouverture des données de recherche

En 2022, Swissuniversities a lancé un appel à projets visant à soutenir et à promouvoir l'excellence dans les pratiques de recherche ouverte. Cette initiative s'inscrit dans le cadre du programme Open Science I Phase B – ORD de la Stratégie nationale pour les données de recherche ouvertes, dont l'élaboration a été confiée au Secrétariat d'État à la formation, à la recherche et à l'innovation (SEFRI). Plusieurs projets impliquant ou dirigés par des membres du SIB ont obtenu un financement, ce qui témoigne du rôle du SIB en tant que catalyseur de l'ORD.

Une mine d'informations pour favoriser de nouvelles découvertes

L'initiative est menée par plusieurs scientifiques possédant une longue expertise en biologie structurale computationnelle, à savoir Andrea Cavalli, Matteo Dal Peraro, Markus Lill, Olivier Michielin, Torsten Schwede et Vincent Zoete, tous chefs de groupe au SIB. À propos de l'octroi de ce financement, Torsten Schwede déclare : « Plus de 74 000 modèles sont actuellement disponibles dans ModelArchive, et ce nombre devrait augmenter rapidement à l'avenir. Grâce au soutien de swissuniversities, nous pouvons faire progresser les meilleures pratiques actuelles en matière de R&D et accroître la réutilisabilité des modèles de structures calculés. La combinaison de structures expérimentales et de modèles computationnels offre aux biologistes structuraux une mine de données qui favorisera de nouvelles découvertes. »

S'appuyer sur les meilleures pratiques existantes en matière de données de recherche ouvertes et en établir de nouvelles

La mise à disposition gratuite des données sur la structure des protéines est au cœur des efforts de l'équipe qui développe et maintient ModelArchive. L'extension de ces pratiques ORD impliquera non seulement de garantir que le partage des données soit mis en œuvre de manière FAIR (Findable, Accessible, Interoperable and Reusable), mais aussi que les valeurs de ces pratiques soient partagées avec d'autres parties prenantes telles que les revues scientifiques, les organismes de financement et les chercheurs en sciences de la vie. Comme indiqué dans leur proposition, ces pratiques s'alignent sur le SwissBioData ecosystem (SBDe) co-dirigé par le SIB, qui vise à faire progresser de manière significative le partage de données FAIR en Suisse.