Le SIB Institut Suisse de Bioinformatique a récemment été invité au Sommet collaboratif AI-Bioscience à Washington DC pour son rôle de premier plan dans la fourniture de données de haute qualité. Le rôle du SIB en tant que co-organisateur d'UniProt, la principale base de données libre d'accès et de haute qualité sur les séquences protéiques et les informations fonctionnelles, a été souligné tout au long de l'événement. Le sommet a souligné le rôle essentiel des bases de données organisées dans l'avancement des modèles d'IA, UniProt étant citée comme une ressource essentielle qui a permis les travaux révolutionnaires récompensés par le récent prix Nobel de chimie dans le domaine de la biologie structurale.

UniProt est un consortium réunissant les équipes du SIB Institut Suisse de Bioinformatique, de l'  Institut Européen de Bioinformatique (EMBL-EBI) et de la  Protein Information Resource (PIR) aux Etats-Unis*. Au sein de ces instituts, plus de 100 experts participent à des tâches allant de la conservation de données fiables sur les protéines au développement de logiciels et à l'assistance aux utilisateurs. Cette ressource est l'une des bases de connaissances les plus utilisées dans le domaine des sciences de la vie, avec plus de 5,5 millions d'utilisateurs et 2 000 citations par an. Grâce à ses ensembles de données de haute qualité, UniProt soutient les modèles d'IA et accélère les découvertes et les applications dans divers domaines, de la médecine à la préservation de l'environnement.
* classement par nombre d'employés impliqués

En savoir plus sur l'impact de la ressource SIB

Thèmes de convergence, données ouvertes et collaboration

La convergence entre l'IA et la biotechnologie, avec un accent particulier sur les grands ensembles de données ouverts, un domaine directement lié à la mission du SIB, a été au cœur des discussions.

UniProt est un consortium réunissant les équipes du SIB Institut Suisse de Bioinformatique, de l'  Institut Européen de Bioinformatique (EMBL-EBI) et de la  Protein Information Resource (PIR) aux Etats-Unis*. Au sein de ces instituts, plus de 100 experts participent à des tâches allant de la conservation de données fiables sur les protéines au développement de logiciels et à l'assistance aux utilisateurs. Cette ressource est l'une des bases de connaissances les plus utilisées dans le domaine des sciences de la vie, avec plus de 5,5 millions d'utilisateurs et 2 000 citations par an. Grâce à ses ensembles de données de haute qualité, UniProt soutient les modèles d'IA et accélère les découvertes et les applications dans divers domaines, de la médecine à la préservation de l'environnement.
* classement par nombre d'employés impliqués

En savoir plus sur l'impact de la ressource SIB

La discussion sur l'importance de la collaboration entre les disciplines et les pays pour développer l'IA a fait écho au positionnement de notre institut. Le SIB relie tous les domaines des sciences de la vie grâce à des ressources, des services et des formations qui permettent l'intégration d'une grande diversité de données et l'application des découvertes dans un large éventail de domaines.

Des ensembles de données de référence de haute qualité, catalyseurs de découvertes récompensées par le prix Nobel

Un thème récurrent a été le besoin urgent de disposer d'ensembles de données complets pour faire progresser les modèles d'IA et les risques potentiels liés au cloisonnement des données propriétaires, qui freine l'innovation. Le récent prix Nobel de chimie (AlphaFold et RosettaFold) illustre le potentiel de l'IA dans les biosciences et les biotechnologies. Des ensembles de données de référence de haute qualité, tels que UniProt, ont été mis en avant comme des catalyseurs essentiels de ces avancées.

Les défis liés au financement des ressources de données à l'avant-garde

Le SIB milite depuis longtemps en faveur de modèles de financement durables pour soutenir les ressources essentielles à la recherche. Lors du sommet, les participants ont souligné l'importance cruciale de cette question. Malgré leur valeur avérée dans les progrès des biosciences fondées sur l'IA et leur rôle de longue date en tant que catalyseurs de la recherche, de nombreuses ressources de données sont confrontées à des pénuries de financement et manquent d'incitations pour leur maintenance à long terme.

La nécessité d'un benchmarking et d'une évaluation

L'analyse comparative et l'évaluation des modèles d'IA, domaines dans lesquels le SIB est également actif et reconnu, sont essentielles pour garantir l'efficacité et renforcer la confiance des utilisateurs. L'évaluation est essentielle tant pour valider les performances des modèles que pour accroître leur acceptation par les utilisateurs potentiels. Les défis liés aux ressources de données, tels que l'hétérogénéité des données, les limites de lisibilité par les machines et les besoins complexes en métadonnées, constituent des obstacles importants à l'interopérabilité des ensembles de données. L'absence de méthodes d'évaluation normalisées pour les modèles d'apprentissage automatique ajoute à la complexité des efforts d'intégration de l'IA. Le CASP et le CAMEO (développés au SIB) ont été cités à plusieurs reprises comme des outils essentiels pour améliorer la fiabilité et les performances de l'IA dans le domaine de la bioinformatique structurale.

Appel à la mise en place de cadres normalisés pour le partage et la sécurité des données

Le Sommet AI-Bioscience a été une plateforme inspirante pour renforcer l'appel en faveur de cadres normalisés de partage et de sécurité des données, essentiels à la transparence et à la collaboration transfrontalière. Le SIB est convaincu que l'IA jouera un rôle crucial dans la résolution de questions biologiques complexes. Ce sommet a été une occasion inestimable de partager des perspectives sur les progrès à accomplir pour atteindre cet objectif et de souligner le rôle indispensable des données organisées dans l'IA.

Participation mondiale et soutien de haut niveau

Le sommet était coorganisé par le Département d'État américain, Microsoft, les Académies nationales américaines, la Fondation nationale pour la science américaine et l'Institut national des normes et technologies (NIST). Parmi les participants figuraient des représentants d'institutions universitaires, de l'industrie et de bureaux scientifiques d'Europe, du Royaume-Uni, de France, d'Allemagne, du Brésil, d'Inde, du Japon, de Corée, d'Israël et d'Afrique du Sud. Le SIB a été invité pour son rôle de premier plan dans la fourniture de ressources de données. L'importance du sommet a été soulignée par le discours prononcé par le secrétaire d'État américain Antony Blinken lors de la deuxième journée.