Se concentrer sur la mission du groupe
Le groupe Swiss-Prot, codirigé par Alan Bridge et Paul Thomas, excelle dans la génération de connaissances biologiques lisibles par machine à partir d'un corpus toujours croissant de publications scientifiques. L'équipe exploite la puissance des méthodes d'apprentissage profond pour accélérer le triage de la littérature et l'extraction de données, fournissant ainsi aux utilisateurs les informations les plus précises et les plus complètes en temps opportun.
Chiffres clés annuels
Plus de 150 000 citations de ressources de l' dans des publications scientifiques
Plus de 180 000 mentions de ressources dans des brevets
Plus de 8 millions d'utilisateurs de ressources par an
Sources et définitions des utilisateurs : lens.org, Web of Science, PubMed, Google Analytics, Matomo
Favoriser les découvertes grâce à des ressources biodatographiques renommées
Les ressources de connaissances interconnectées et sélectionnées avec soin par les biocurateurs et les développeurs de logiciels du groupe sont reconnues à l'échelle internationale pour leur importance fondamentale dans la recherche et l'innovation en sciences de la vie. Elles sont utilisées dans des applications allant de la bioremédiation des sols contaminés à la découverte et au développement de médicaments.
- UniProtKB/Swiss-Prot est la ressource d'informations sur les protéines la plus utilisée au monde. Elle est reconnue comme une ressource au SIB, une ELIXIR Core Data Resource et une ressource de données de base mondiale.
- Rhea, une base de données sur les réactions biochimiques, est reconnue comme une ressource SIB, une ELIXIR Core Data Resource et une ressource de données de base mondiale.
- Gene Ontology (GO) est une source d'informations essentielle sur la fonction des gènes et est reconnue comme une resource de données de base mondiale.
- SwissLipids, une base de données sur les structures lipidiques et les connaissances biologiques, est reconnue comme une ressource au SIB.
- HAMAP et PROSITE sont des bases de données largement utilisées sur les familles et les domaines protéiques.
- La base de données ENZYME, largement utilisée, fournit des informations sur la nomenclature des enzymes.
- ViralZone fournit des informations sur tous les genres et familles de virus.
- SwissBioPics propose une bibliothèque d'images cellulaires interactives.
Le groupe Swiss-Prot soutient également le développement personnalisé d'outils et de ressources pour les chercheurs et les cliniciens.
En savoir plus sur nos services de biocuration et de développement de logiciels
Soutenir l'IA grâce à des connaissances biologiques lisibles par machine
Les bases de connaissances en sciences de la vie constituent également un élément essentiel de l'écosystème de l'IA. Les connaissances biologiques collectives qu'elles contiennent, sous forme de séquences et de structures moléculaires, de voies biochimiques et de relations entre celles-ci, peuvent être utilisées pour former et affiner les systèmes d'IA qui révèlent des mécanismes biologiques complexes et génèrent des informations exploitables.
Les Swiss-Prot-Knowledgebases ont contribué à :
- le modèle AlphaFold, lauréat du prix Nobel 2024, qui permet de prédire la structure des protéines et qui a appris à identifier les relations entre les séquences d'acides aminés et les structures 3D en analysant des centaines de millions de protéines dans UniProt (voir la section « AI focus » dans le SIB Profile 2025) ;
- un modèle linguistique à grande échelle (LLM) pour améliorer l'administration des vaccins à ARNm, qui a été formé à l'aide de SwissLipids (source : bioinformatique, 2024) ;
- un LLM pour concevoir de nouvelles protéines dotées des fonctions souhaitées, qui a été entraîné à l'aide de la partie UniProtKB/Swiss-Prot d'UniProt, sélectionnée par des experts (source : Nature Biotechnology, 2023) ;
Le groupe a également développé un ensemble de données de référence, EnzChemRED, afin d'affiner les LLM pour la curation de données spécialisées, qui a été reconnu comme un Remarkable Output du SIB. L'équipe utilise cet ensemble de données pour orienter les efforts de biocuration des bases de connaissances UniProt et Rhea.
- UniProt Consortium. UniProt : la base de connaissances universelle sur les protéines en 2025. Nucleic Acids Research, volume 53, numéro D1, 6 janvier 2025, D609–D617, https://doi.org/10.1093/nar/gkae1010
- Bolleman J. et al. Une vaste collection de paires de questions-réponses de bioinformatique sur des graphes de connaissances fédérés : méthodologie et applications. Gigascience 2025, 16 mai ; 14 : giaf045. doi : 10.1093/gigascience/giaf045
- Feuermann M. et al. Un recueil des fonctions des gènes humains dérivées de la modélisation évolutive. Nature 640, 146–154 (2025). https://doi.org/10.1038/s41586-025-08592-0
- Blum M. et al. InterPro : la ressource de classification des séquences protéiques en 2025. Nucleic Acids Research, volume 53, numéro D1, 6 janvier 2025, pages D444-D456, https://doi.org/10.1093/nar/gkae1082
- Feuermann M, Gaudet P. Interpreting Gene Ontology Annotations Derived from Sequence Homology Methods. Methods Mol Biol. 2024:2836:285-298. doi: 10.1007/978-1-0716-4007-4_15.
- Lai PT, Coudert E, Aimo L, Axelsen K, Breuza L, de Castro E, Feuermann M, Morgat A, Pourcel L, Pedruzzi I, Poux S, Redaschi N, Rivoire C, Sveshnikova A, Wei CH, Leaman R, Luo L, Lu Z, Bridge A. EnzChemRED, un riche ensemble de données d'extraction de relations chimiques enzymatiques. Sci Data 9 septembre 2024 ; 11(1) : 982. doi : 10.1038/s41597-024-03835-7.
- Ross KE, Bastian FB, Buys M, Cook CE, D'Eustachio P, Harrison M, Hermjakob H, Li D, Lord P, Natale DA, Peters B, Sternberg PW, Su AI, Thakur M, Thomas PD, Bateman A, UniProt Consortium. Perspectives sur le suivi de la réutilisation des données dans les ressources de données biologiques. Bioinformatics Advances, 25 avril 2024, 4(1):vbae057. https://doi.org/10.1093/bioadv/vbae057.
- Membres du groupe RDF de l'Institut Suisse de Bioinformatique SIB. Le web sémantique des données de l'Institut Suisse de Bioinformatique SIB. Nucleic Acids Res. 5 janvier 2024 ; 52(D1) : D44-D51. doi : 10.1093/nar/gkad902.
- Witting M, Malik A, Leach A, Bridge A, Aimo L, Conroy MJ, O'Donnell VB, Hoffmann N, Kopczynski D, Giacomoni F, Paulhe N, Gassiot AC, Poupin N, Jourdan F, Bertrand-Michel J. Défis et perspectives pour la dénomination des lipides dans le contexte de la lipidomique. Métabolomique. 24 janvier 2024 ; 20(1) : 15. doi : 10.1007/s11306-023-02075-x.
- Consortium UniProt. UniProt : la base de connaissances universelle sur les protéines en 2025. Nucleic Acids Research. Novembre 2024 ;. DOI : 10.1093/nar/gkae1010.
- Bowler-Barnett EH, Fan J, Luo J, Magrane M, Martin MJ, Orchard S, UniProt Consortium. UniProt et la protéomique basée sur la spectrométrie de masse : une relation de travail à double sens. Mol Cell Proteomics. Août 2023 ; 22(8) : 100591. doi: 10.1016/j.mcpro.2023.100591. Publication électronique 8 juin 2023. Revue.
- Coudert E, Gehant S, de Castro E, Pozzato M, Baratin D, Neto T, Sigrist CJA, Redaschi N, Bridge A ; UniProt Consortium. Annotation de ligands biologiquement pertinents dans UniProtKB à l'aide de ChEBI. Bioinformatique. 1er janvier 2023 ; 39(1) : btac793. doi : 10.1093/bioinformatics/btac793.
- Gene Ontology Consortium. La base de connaissances Gene Ontology en 2023. Génétique. 4 mai 2023 ; 224(1) : iyad031. doi : 10.1093/genetics/iyad031.
- Insana G, Ignatchenko A, Martin M, Bateman A, UniProt Consortium. MBDBMetrics : un outil métrique en ligne pour mesurer l'impact des resources de données biologiques. Bioinform Adv. 2023 ; 3(1) : vbad180. doi : 10.1093/bioadv/vbad180. eCollection 2023.
- Lussi YC, Magrane M, Martin MJ, Orchard S, UniProt Consortium. Recherche et navigation dans les bases de données UniProt. Curr Protoc. Mars 2023 ; 3(3) : e700. doi : 10.1002/cpz1.700.
- Ni Z, Wölk M, Jukes G, Mendivelso Espinosa K, Ahrends R, Aimo L, Alvarez-Jarreta J, Andrews S, Andrews R, Bridge A, Clair GC, Conroy MJ, Fahy E, Gaud C, Goracci L, Hartler J, Hoffmann N, Kopczyinski D, Korf A, Lopez-Clavijo AF, Malik A, Ackerman JM, Molenaar MR, O'Donovan C, Pluskal T, Shevchenko A, Slenter D, Siuzdak G, Kutmon M, Tsugawa H, Willighagen EL, Xia J, O'Donnell VB, Fedorova M. Guiding the choice of informatics software and tools for lipidomics research applications. Nat Methods. Février 2023 ; 20(2) : 193-204. doi : 10.1038/s41592-022-01710-0. Publication électronique : 21 décembre 2022.
- UniProt Consortium. UniProt : la base de connaissances universelle sur les protéines en 2023. Nucleic Acids Research. Janvier 2023 ; 51(D1) : D523-D531. DOI : 10.1093/nar/gkac1052.
- Yamada T, Maeda M, Nagai H, Salamin K, Chang Y-T, Guenova E, Feuermann M, Monod M . Deux types différents de séquences en tandem interviennent dans la surexpression de TinCYP51B chez Trichophyton indotineae résistant aux azoles. Antimicrob Agents Chemother 15 novembre 2023 ; 67(11) : e0093323. doi : 10.1128/aac.00933-23. Publication électronique 12 octobre 2023.
- Zaru R, Orchard S, UniProt Consortium. Outils UniProt : BLAST, Align, Peptide Search et ID Mapping. Curr Protoc. Mars 2023 ; 3(3) : e697. doi : 10.1002/cpz1.697.
- Bansal P, Morgat A, Axelsen KB, Muthukrishnan V, Coudert E, Aimo L, Hyka-Nouspikel N, Gasteiger E, Kerhornou A, Neto TB, Pozzato M, Blatter MC, Ignatchenko A, Redaschi N, Bridge A. Rhea, la base de connaissances sur les réactions en 2022. Nucleic Acids Res. 7 janvier 2022 ; 50(D1) : D693-D700. doi : 10.1093/nar/gkab1016.
- Le Mercier P, Bolleman J, de Castro E, Gasteiger E, Bansal P, Auchincloss AH, Boutet E, Breuza L, Casals-Casas C, Estreicher A, Feuermann M, Lieberherr D, Rivoire C, Pedruzzi I, Redaschi N, Bridge A. SwissBioPics - une bibliothèque interactive d'images cellulaires pour la visualisation des données de localisation subcellulaire. Base de données (Oxford). 12 avril 2022 : 2022 : baac026. doi : 10.1093/database/baac026.
- Paysan-Lafosse T, Blum M, Chuguransky S, Grego T, Pinto BL, Salazar GA, Bileschi ML, Bork P, Bridge A, Colwell L, Gough J, Haft DH, Letunić I, Marchler-Bauer A, Mi H, Natale DA, Orengo CA, Pandurangan AP, Rivoire C, Sigrist CJA, Sillitoe I, Thanki N, Thomas PD, Tosatto SCE, Wu CH, Bateman A. InterPro en 2022. Nucleic Acids Res. 6 janvier 2023 ; 51(D1) : D418-D427. doi : 10.1093/nar/gkac993.
- Yamada T, Yaguchi T, Maeda M, Alshahni MM, Salamin K, Guenova E, Feuermann M, Monod M. Amplification génétique du CYP51B : un nouveau mécanisme de résistance aux composés azolés chez Trichophyton indotineae. Antimicrob Agents Chemother. 21 juin 2022 ; 66(6) : e0005922. doi : 10.1128/aac.00059-22. Publication électronique : 12 mai 2022.
- Feuermann M, Boutet E, Morgat A, Axelsen KB, Bansal P, Bolleman J, de Castro E, Coudert E, Gasteiger E, Géhant S, Lieberherr D, Lombardot T, Neto TB, Pedruzzi I, Poux S, Pozzato M, Redaschi N, Bridge A, au nom du consortium UniProt. Diverses taxonomies pour diverses chimies : représentation améliorée du métabolisme des produits naturels dans UniProtKB. Métabolites [Internet]. 12 janvier 2021 ; 11(1). Disponible à l'adresse : http://dx.doi.org/10.3390/metabo11010048.
- Hufsky F, Lamkiewicz K, Almeida A, Aouacheria A, Arighi C, Bateman A, Baumbach J, Beerenwinkel N, Brandt C, Cacciabue M, Chuguransky S, Drechsel O, Finn RD, Fritz A, Fuchs S, Hattab G, Hauschild AC, Heider D, Hoffmann M, Hölzer M, Hoops S, Kaderali L, Kalvari I, von Kleist M, Kmiecinski R, Kühnert D, Lasso G, Libin P, List M, Löchel HF, Martin MJ, Martin R, Matschinske J, McHardy AC, Mendes P, Mistry J, Navratil V, Nawrocki EP, O'Toole ÁN, Ontiveros-Palacios N, Petrov AI, Rangel-Pineros G, Redaschi N, Reimering S, Reinert K, Reyes A, Richardson L, Robertson DL, Sadegh S, Singer JB, Theys K, Upton C, Welzel M, Williams L, Marz M. Stratégies informatiques pour lutter contre la COVID-19 : outils utiles pour accélérer la recherche sur le SARS-CoV-2 et les coronavirus. Brief Bioinform. 22 mars 2021 ; 22(2) : 642-663. doi : 10.1093/bib/bbaa232.
- Consortium UniProt. UniProt : la base de connaissances universelle sur les protéines en 2021. Nucleic Acids Res. 8 janvier 2021 ; 49(D1) : D480-D489. doi : 10.1093/nar/gkaa1100
- Wang Y, Wang Q, Huang H, Huang W, Chen Y, McGarvey PB, Wu CH, Arighi CN, UniProt Consortium. Une plateforme ouverte de crowdsourcing pour la curation de la littérature dans UniProt. PLoS biology. Décembre 2021 ; 19(12) : e3001464. DOI : 10.1371/journal.pbio.3001464.
- Yamada T, Yaguchi T, Salamin K, Guenova E, Feuermann M, Monod M. MFS1, un transporteur pléiotropique chez les dermatophytes qui joue un rôle clé dans leur résistance intrinsèque au chloramphénicol et au fluconazole. J Fungi (Bâle). 7 juillet 2021 ; 7(7) : 542. doi : 10.3390/jof7070542.
- Yamada T, Yaguchi T, Tamura T, Pich C, Salamin K, Feuermann M, Monod M. Résistance à l'itraconazole de Trichophyton rubrum médiée par le transporteur ABC TruMDR2. Mycoses. Août 2021 ; 64(8) : 936-946. doi : 10.1111/myc.13286. Publication électronique 25 avril 2021.
- Bolleman J, de Castro E, Baratin D, Gehant S, Cuche BA, Auchincloss AH, Coudert E, Hulo C, Masson P, Pedruzzi I, Rivoire C, Xenarios I, Redaschi N, Bridge A. HAMAP as SPARQL rules-A portable annotation pipeline for genomes and proteomes. Gigascience 2020, 9(2):giaa003. doi: 10.1093/gigascience/giaa003
- Breuza L, Arighi CN, Argoud-Puy G, Casals-Casas C, Estreicher A, Famiglietti ML, Georghiou G, Gos A, Gruaz-Gumowski N, Hinz U, Hyka-Nouspikel N, Kramarz B, Lovering RC, Lussi Y, Magrane M, Masson P, Perfetto L, Poux S, Rodriguez-Lopez M, Stoeckert C, Sundaram S, Wang L-S, Wu E, Orchard S, IMEx Consortium, UniProt Consortium : Une approche coordonnée des ressources bioinformatiques du domaine public pour aider à lutter contre la maladie d'Alzheimer grâce à la sélection par des experts de protéines cibles clés. J. Alzheimers Dis. 2020. doi : 10.3233/JAD-200206
- Bye-A-Jee H, Zaru R, Magrane M, Orchard S, UniProt Consortium. Complexes phosphatases de Caenorhabditis elegans dans UniProtKB et Complex Portal. FEBS J. 2020, 287: 2664-2684. doi: 10.1111/febs.15213
- Drysdale R, Cook CE, Petryszak R, Baillie-Gerritsen V, Barlow M, Gasteiger E, Gruhl F, Haas J, Lanfear J, Lopez R, Redaschi N, Stockinger H, Teixeira D, Venkatesan A ; Elixir Core Data Resource Forum ; Blomberg N, Durinx C, McEntyre J. The ELIXIR Core Data Resources : infrastructure fondamentale pour les sciences de la vie. Bioinformatique. 15 avril 2020 ; 36(8) : 2636-2642. doi : 10.1093/bioinformatics/btz959.
- MacDougall A, Volynkin V, Saidi R, Poggioli D, Zellner H, Hatton-Ellis E, Joshi V, O'Donovan C, Orchard S, Auchincloss AH, Baratin D, Bolleman J, Coudert E, de Castro E, Hulo C, Masson P, Pedruzzi I, Rivoire C, Arighi C, Wang Q, Chen C, Huang H, Garavelli J, Vinayaka CR, Yeh LS, Natale DA, Laiho K, Martin M, UniProt Consortium. UniRule : une ressource de règles unifiées pour l'annotation automatique dans la base de connaissances UniProt. Bioinformatique 2020. doi : 10.1093/bioinformatics/btaa485
- Morgat A, Lombardot T, Coudert E, Axelsen K, Batista Neto T, Gehant S, Bansal P, Bolleman J, Gasteiger E, de Castro E, Baratin D, Pozzato M, Xenarios I, Poux S, Redaschi N, Bridge A, UniProt Consortium. Annotation des enzymes dans UniProtKB à l'aide de Rhea. Bioinformatique 2020, 36(6) : 1896-1901. doi : 10.1093/bioinformatics/btz817
- Porras P, Barrera E, Bridge A, Del-Toro N, Cesareni G, Duesbury M, Hermjakob H, Iannuccelli M, Jurisica I, Kotlyar M, Licata L, Lovering RC, Lynn DJ, Meldal B, Nanduri B, Paneerselvam K, Panni S, Pastrello C, Pellegrini M, Perfetto L, Rahimzadeh N, Ratan P, Ricard-Blum S, Salwinski L, Shirodkar G, Shrivastava A, Orchard S. Vers un ensemble de données ouvertes et unifiées sur les interactions moléculaires. Nat Commun. 1er décembre 2020 ; 11(1) : 6144. doi : 10.1038/s41467-020-19942-z
- Touré V, Vercruysse S, Acencio ML, Lovering RC, Orchard S, Bradley G, Casals-Casas C, Chaouiya C, Del-Toro N, Flobak Å, Gaudet P, Hermjakob H, Hoyt CT, Licata L, Lægreid A, Mungall CJ, Niknejad A, Panni S, Perfetto L, Porras P, Pratt D, Saez-Rodriguez J, Thieffry D, Thomas PD, Türei D, Kuiper M. Informations minimales sur une déclaration causale d'interaction moléculaire (MI2CAST). Bioinformatique 2020. doi : 10.1093/bioinformatics/btaa622
- Wood V, Carbon S, Harris MA, Lock A, Engel SR, Hill DP, Van Auken K, Attrill H, Feuermann M, Gaudet P, Lovering RC, Poux S, Rutherford KM, Mungall CJ. Term Matrix : un nouveau système de contrôle de la qualité des annotations de la Gene Ontology basé sur les modèles de co-annotation des termes ontologiques. Open Biol. Septembre 2020 ; 10(9) : 200149. doi : 10.1098/rsob.200149. Publication électronique : 2 septembre 2020.
Membres
Consultez les publications de nos membresici