Se concentrer sur la mission du groupe

Le groupe Swiss-Prot, codirigé par Alan Bridge et Paul Thomas, excelle dans la génération de connaissances biologiques lisibles par machine à partir d'un corpus toujours croissant de publications scientifiques. L'équipe exploite la puissance des méthodes d'apprentissage profond pour accélérer le triage de la littérature et l'extraction de données, fournissant ainsi aux utilisateurs les informations les plus précises et les plus complètes en temps opportun.

Chiffres clés annuels

Plus de 150 000 citations de ressources de l' dans des publications scientifiques

Plus de 180 000 mentions de ressources dans des brevets

Plus de 8 millions d'utilisateurs de ressources par an

Sources et définitions des utilisateurs : lens.org, Web of Science, PubMed, Google Analytics, Matomo

Favoriser les découvertes grâce à des ressources biodatographiques renommées

Les ressources de connaissances interconnectées et sélectionnées avec soin par les biocurateurs et les développeurs de logiciels du groupe sont reconnues à l'échelle internationale pour leur importance fondamentale dans la recherche et l'innovation en sciences de la vie. Elles sont utilisées dans des applications allant de la bioremédiation des sols contaminés à la découverte et au développement de médicaments.

  • UniProtKB/Swiss-Prot est la ressource d'informations sur les protéines la plus utilisée au monde. Elle est reconnue comme une ressource au SIB, une ELIXIR Core Data Resource et une ressource de données de base mondiale.
  • Rhea, une base de données sur les réactions biochimiques, est reconnue comme une ressource SIB, une ELIXIR Core Data Resource et une ressource de données de base mondiale.
  • Gene Ontology (GO) est une source d'informations essentielle sur la fonction des gènes et est reconnue comme une resource de données de base mondiale.
  • SwissLipids, une base de données sur les structures lipidiques et les connaissances biologiques, est reconnue comme une ressource au SIB.
  • HAMAP et PROSITE sont des bases de données largement utilisées sur les familles et les domaines protéiques.
  • La base de données ENZYME, largement utilisée, fournit des informations sur la nomenclature des enzymes.
  • ViralZone fournit des informations sur tous les genres et familles de virus.
  • SwissBioPics propose une bibliothèque d'images cellulaires interactives.

Le groupe Swiss-Prot soutient également le développement personnalisé d'outils et de ressources pour les chercheurs et les cliniciens.

En savoir plus sur nos services de biocuration et de développement de logiciels

Soutenir l'IA grâce à des connaissances biologiques lisibles par machine

Les bases de connaissances en sciences de la vie constituent également un élément essentiel de l'écosystème de l'IA. Les connaissances biologiques collectives qu'elles contiennent, sous forme de séquences et de structures moléculaires, de voies biochimiques et de relations entre celles-ci, peuvent être utilisées pour former et affiner les systèmes d'IA qui révèlent des mécanismes biologiques complexes et génèrent des informations exploitables.

Les Swiss-Prot-Knowledgebases ont contribué à :

  • le modèle AlphaFold, lauréat du prix Nobel 2024, qui permet de prédire la structure des protéines et qui a appris à identifier les relations entre les séquences d'acides aminés et les structures 3D en analysant des centaines de millions de protéines dans UniProt (voir la section « AI focus » dans le SIB Profile 2025) ;
  • un modèle linguistique à grande échelle (LLM) pour améliorer l'administration des vaccins à ARNm, qui a été formé à l'aide de SwissLipids (source : bioinformatique, 2024) ;
  • un LLM pour concevoir de nouvelles protéines dotées des fonctions souhaitées, qui a été entraîné à l'aide de la partie UniProtKB/Swiss-Prot d'UniProt, sélectionnée par des experts (source : Nature Biotechnology, 2023) ;

Le groupe a également développé un ensemble de données de référence, EnzChemRED, afin d'affiner les LLM pour la curation de données spécialisées, qui a été reconnu comme un Remarkable Output du SIB. L'équipe utilise cet ensemble de données pour orienter les efforts de biocuration des bases de connaissances UniProt et Rhea.

Membres

Consultez les publications de nos membresici