Concentrarsi sulla missione del gruppo
Il gruppo Swiss-Prot, co-diretto da Alan Bridge e Paul Thomas, eccelle nella generazione di conoscenze biologiche leggibili da computer a partire dal corpus sempre crescente di pubblicazioni scientifiche. Il team sfrutta la potenza dei metodi di deep learning per accelerare la selezione della letteratura e l'estrazione dei dati, fornendo così agli utenti le informazioni più accurate e complete in modo tempestivo.
Dati chiave annuali
- Oltre 150.000 citazionidi risorse in pubblicazioni scientifiche
- Oltre 180.000 menzioni di risorse nei brevetti
- Oltre 8 milioni di utenti delle risorse ogni anno
Fonti e definizioni degli utenti: lens.org, Web of Science, PubMed, Google Analytics, Matomo
Consentire scoperte grazie a rinomate risorse di biodati
Le risorse di conoscenza interconnesse e curate con competenza, sviluppate dai biocuratori e dagli sviluppatori di software del gruppo, sono riconosciute a livello internazionale per la loro importanza fondamentale per la ricerca e l'innovazione nel campo delle scienze della vita e vengono utilizzate in applicazioni che vanno dal biorisanamento dei terreni contaminati alla scoperta e allo sviluppo di farmaci.
- UniProtKB/Swiss-Prot è la risorsa di informazioni sulle proteine più utilizzata al mondo ed è riconosciuta come risorsa al SIB, ELIXIR Core Data Resource e risorsa dati core globale.
- Rhea, un database di reazioni biochimiche, è riconosciuto come risorsa dati al SIB, ELIXIR Core Data Resource e risorsa dati core globale.
- Gene Ontology (GO) è una fonte fondamentale di informazioni sulla funzione dei geni ed è riconosciuta come Global Core Data Resource.
- SwissLipids, un database di strutture lipidiche e conoscenze biologiche, è riconosciuto come risorsa al SIB.
- HAMAP e PROSITE sono database ampiamente utilizzati di famiglie e domini proteici.
- Il database ENZYME, ampiamente utilizzato, fornisce informazioni sulla nomenclatura degli enzimi.
- ViralZone fornisce informazioni su tutti i generi e le famiglie virali.
- SwissBioPics offre una libreria di immagini cellulari interattive.
Il gruppo Swiss-Prot supporta anche lo sviluppo personalizzato di strumenti e risorse per ricercatori e medici.
Maggiori informazioni sui nostri servizi di biocurazione e sviluppo software
Supportare l'intelligenza artificiale con conoscenze biologiche leggibili da macchine
Anche le basi di conoscenza delle scienze della vita sono una parte essenziale dell'ecosistema dell'IA. Le conoscenze biologiche collettive che contengono, sotto forma di sequenze e strutture molecolari, percorsi biochimici e relazioni tra questi, possono essere utilizzate per addestrare e mettere a punto sistemi di IA che rivelano meccanismi biologici complessi e generano intuizioni attuabili.
Le Swiss-Prot-Knowledgebases sviluppate dal gruppo Swiss-Prot hanno contribuito a:
- il modello AlphaFold, vincitore del premio Nobel 2024, per la previsione della struttura delle proteine, che ha imparato a identificare le relazioni tra le sequenze aminoacidiche e le strutture 3D analizzando centinaia di milioni di proteine in UniProt (vedi AI focus nel SIB Profile 2025);
- un Large Language Model (LLM) per migliorare la somministrazione dei vaccini a mRNA, che è stato addestrato utilizzando SwissLipids (fonte: bioinformatica, 2024);
- un LLM per progettare nuove proteine con funzioni desiderabili, che è stato addestrato utilizzando la parte UniProtKB/Swiss-Prot di UniProt, curata da esperti (fonte: Nature Biotechnology, 2023);
Il gruppo ha anche sviluppato un dataset di benchmarking, EnzChemRED, per mettere a punto gli LLM per la curazione dei dati specializzati, che è stato riconosciuto come un Remarkable Output da SIB. Il team sta applicando il dataset per guidare gli sforzi di biocuratela per le basi di conoscenza UniProt e Rhea.
- UniProt Consortium. UniProt: la banca dati universale sulle proteine nel 2025. Nucleic Acids Research, Volume 53, Numero D1, 6 gennaio 2025, D609–D617, https://doi.org/10.1093/nar/gkae1010
- Bolleman J. et al. Una vasta raccolta di coppie di domande e query di bioinformatica su grafici di conoscenza federati: metodologia e applicazioni. Gigascience 16 maggio 2025;14:giaf045. doi: 10.1093/gigascience/giaf045
- Feuermann M. et al. Compendio delle funzioni dei geni umani derivato dalla modellizzazione evolutiva. Nature 640, 146–154 (2025). https://doi.org/10.1038/s41586-025-08592-0
- Blum M. et al. InterPro: la risorsa per la classificazione delle sequenze proteiche nel 2025. Nucleic Acids Research, Volume 53, Numero D1, 6 gennaio 2025, Pagine D444-D456, https://doi.org/10.1093/nar/gkae1082
- Feuermann M, Gaudet P. Interpretazione delle annotazioni della Gene Ontology derivate dai metodi di omologia delle sequenze. Methods Mol Biol. 2024:2836:285-298. doi: 10.1007/978-1-0716-4007-4_15.
- Lai PT, Coudert E, Aimo L, Axelsen K, Breuza L, de Castro E, Feuermann M, Morgat A, Pourcel L, Pedruzzi I, Poux S, Redaschi N, Rivoire C, Sveshnikova A, Wei CH, Leaman R, Luo L, Lu Z, Bridge A. EnzChemRED, un ricco set di dati sull'estrazione delle relazioni chimiche degli enzimi. Sci Data 9 settembre 2024; 11(1):982. doi: 10.1038/s41597-024-03835-7.
- Ross KE, Bastian FB, Buys M, Cook CE, D'Eustachio P, Harrison M, Hermjakob H, Li D, Lord P, Natale DA, Peters B, Sternberg PW, Su AI, Thakur M, Thomas PD, Bateman A, UniProt Consortium. Prospettive sul monitoraggio del riutilizzo dei dati nelle risorse di biodati. Bioinformatica Advances, 25 aprile 2024, 4(1):vbae057. https://doi.org/10.1093/bioadv/vbae057.
- Membri del gruppo RDF di SIB Istituto Svizzero di Bioinformatica. Il web semantico dei dati di SIB Istituto Svizzero di Bioinformatica. Nucleic Acids Res. 5 gennaio 2024;52(D1):D44-D51. doi: 10.1093/nar/gkad902.
- Witting M, Malik A, Leach A, Bridge A, Aimo L, Conroy MJ, O'Donnell VB, Hoffmann N, Kopczynski D, Giacomoni F, Paulhe N, Gassiot AC, Poupin N, Jourdan F, Bertrand-Michel J. Sfide e prospettive per la denominazione dei lipidi nel contesto della lipidomica. Metabolomica. 24 gennaio 2024; 20(1):15. doi: 10.1007/s11306-023-02075-x.
- UniProt Consortium. UniProt: la banca dati universale delle proteine nel 2025. Nucleic Acids Research. Novembre 2024;. DOI: 10.1093/nar/gkae1010.
- Bowler-Barnett EH, Fan J, Luo J, Magrane M, Martin MJ, Orchard S, UniProt Consortium. UniProt e proteomica basata sulla spettrometria di massa: una relazione di lavoro bidirezionale. Mol Cell Proteomics. Agosto 2023; 22(8):100591. doi: 10.1016/j.mcpro.2023.100591. Pubblicazione elettronica 8 giugno 2023. Revisione.
- Coudert E, Gehant S, de Castro E, Pozzato M, Baratin D, Neto T, Sigrist CJA, Redaschi N, Bridge A; UniProt Consortium. Annotazione dei ligandi biologicamente rilevanti in UniProtKB utilizzando ChEBI. Bioinformatica. 1 gennaio 2023; 39(1):btac793. doi: 10.1093/bioinformatica/btac793.
- Gene Ontology Consortium. La base di conoscenza Gene Ontology nel 2023. Genetica. 4 maggio 2023;224(1):iyad031. doi: 10.1093/genetics/iyad031.
- Insana G, Ignatchenko A, Martin M, Bateman A, UniProt Consortium. MBDBMetrics: uno strumento online per misurare l'impatto delle risorse dati biologici. Bioinform Adv. 2023;3(1):vbad180. doi: 10.1093/bioadv/vbad180. eCollection 2023.
- Lussi YC, Magrane M, Martin MJ, Orchard S, UniProt Consortium. Ricerca e navigazione nei database UniProt. Curr Protoc. Marzo 2023;3(3):e700. doi: 10.1002/cpz1.700.
- Ni Z, Wölk M, Jukes G, Mendivelso Espinosa K, Ahrends R, Aimo L, Alvarez-Jarreta J, Andrews S, Andrews R, Bridge A, Clair GC, Conroy MJ, Fahy E, Gaud C, Goracci L, Hartler J, Hoffmann N, Kopczyinki D, Korf A, Lopez-Clavijo AF, Malik A, Ackerman JM, Molenaar MR, O'Donovan C, Pluskal T, Shevchenko A, Slenter D, Siuzdak G, Kutmon M, Tsugawa H, Willighagen EL, Xia J, O'Donnell VB, Fedorova M. Guida alla scelta di software e strumenti informatici per applicazioni di ricerca nel campo della lipidomica. Nat Methods. Febbraio 2023; 20(2):193-204. doi: 10.1038/s41592-022-01710-0. Pubblicazione elettronica 21 dicembre 2022.
- UniProt Consortium. UniProt: la banca dati universale sulle proteine nel 2023. Nucleic Acids Research. Gennaio 2023; 51(D1):D523-D531. DOI: 10.1093/nar/gkac1052.
- Yamada T, Maeda M, Nagai H, Salamin K, Chang Y-T, Guenova E, Feuermann M, Monod M. Due diversi tipi di sequenze tandem mediano la sovraespressione di TinCYP51B nel Trichophyton indotineae resistente agli azoli. Antimicrob Agents Chemother 15 novembre 2023;67(11):e0093323. doi: 10.1128/aac.00933-23. Pubblicazione elettronica 12 ottobre 2023.
- Zaru R, Orchard S, UniProt Consortium. Strumenti UniProt: BLAST, Align, Peptide Search e ID Mapping. Curr Protoc. Marzo 2023; 3(3):e697. doi: 10.1002/cpz1.697.
- Bansal P, Morgat A, Axelsen KB, Muthukrishnan V, Coudert E, Aimo L, Hyka-Nouspikel N, Gasteiger E, Kerhornou A, Neto TB, Pozzato M, Blatter MC, Ignatchenko A, Redaschi N, Bridge A. Rhea, la banca dati delle reazioni nel 2022. Nucleic Acids Res. 7 gennaio 2022;50(D1):D693-D700. doi: 10.1093/nar/gkab1016.
- Le Mercier P, Bolleman J, de Castro E, Gasteiger E, Bansal P, Auchincloss AH, Boutet E, Breuza L, Casals-Casas C, Estreicher A, Feuermann M, Lieberherr D, Rivoire C, Pedruzzi I, Redaschi N, Bridge A. SwissBioPics: una libreria interattiva di immagini cellulari per la visualizzazione dei dati sulla localizzazione subcellulare. Database (Oxford). 12 aprile 2022:2022:baac026. doi: 10.1093/database/baac026.
- Paysan-Lafosse T, Blum M, Chuguransky S, Grego T, Pinto BL, Salazar GA, Bileschi ML, Bork P, Bridge A, Colwell L, Gough J, Haft DH, Letunić I, Marchler-Bauer A, Mi H, Natale DA, Orengo CA, Pandurangan AP, Rivoire C, Sigrist CJA, Sillitoe I, Thanki N, Thomas PD, Tosatto SCE, Wu CH, Bateman A. InterPro nel 2022. Nucleic Acids Res. 6 gennaio 2023;51(D1):D418-D427. doi: 10.1093/nar/gkac993.
- Yamada T, Yaguchi T, Maeda M, Alshahni MM, Salamin K, Guenova E, Feuermann M, Monod M. Amplificazione genica di CYP51B: un nuovo meccanismo di resistenza ai composti azolici in Trichophyton indotineae. Antimicrob Agents Chemother. 21 giugno 2022;66(6):e0005922. doi: 10.1128/aac.00059-22. Pubblicazione elettronica 12 maggio 2022.
- Feuermann M, Boutet E, Morgat A, Axelsen KB, Bansal P, Bolleman J, de Castro E, Coudert E, Gasteiger E, Géhant S, Lieberherr D, Lombardot T, Neto TB, Pedruzzi I, Poux S, Pozzato M, Redaschi N, Bridge A, per conto del Consorzio UniProt. Diverse tassonomie per diverse chimiche: rappresentazione migliorata del metabolismo dei prodotti naturali in UniProtKB. Metaboliti [Internet]. 12 gennaio 2021; 11(1). Disponibile su: http://dx.doi.org/10.3390/metabo11010048.
- Hufsky F, Lamkiewicz K, Almeida A, Aouacheria A, Arighi C, Bateman A, Baumbach J, Beerenwinkel N, Brandt C, Cacciabue M, Chuguransky S, Drechsel O, Finn RD, Fritz A, Fuchs S, Hattab G, Hauschild AC, Heider D, Hoffmann M, Hölzer M, Hoops S, Kaderali L, Kalvari I, von Kleist M, Kmiecinski R, Kühnert D, Lasso G, Libin P, List M, Löchel HF, Martin MJ, Martin R, Matschinske J, McHardy AC, Mendes P, Mistry J, Navratil V, Nawrocki EP, O'Toole ÁN, Ontiveros-Palacios N, Petrov AI, Rangel-Pineros G, Redaschi N, Reimering S, Reinert K, Reyes A, Richardson L, Robertson DL, Sadegh S, Singer JB, Theys K, Upton C, Welzel M, Williams L, Marz M. Strategie computazionali per combattere il COVID-19: strumenti utili per accelerare la ricerca sul SARS-CoV-2 e sul coronavirus. Brief Bioinform. 22 marzo 2021;22(2):642-663. doi: 10.1093/bib/bbaa232.
- UniProt Consortium. UniProt: la banca dati universale sulle proteine nel 2021. Nucleic Acids Res. 8 gennaio 2021;49(D1):D480–D489. doi: 10.1093/nar/gkaa1100
- Wang Y, Wang Q, Huang H, Huang W, Chen Y, McGarvey PB, Wu CH, Arighi CN, UniProt Consortium. Una piattaforma aperta di crowdsourcing per la curazione della letteratura in UniProt. PLoS biology. Dicembre 2021;19(12):e3001464. DOI: 10.1371/journal.pbio.3001464.
- Yamada T, Yaguchi T, Salamin K, Guenova E, Feuermann M, Monod M. MFS1, un trasportatore pleiotropico nei dermatofiti che svolge un ruolo chiave nella loro resistenza intrinseca al cloramfenicolo e al fluconazolo. J Fungi (Basilea). 7 luglio 2021; 7(7):542. doi: 10.3390/jof7070542.
- Yamada T, Yaguchi T, Tamura T, Pich C, Salamin K, Feuermann M, Monod M. Resistenza all'itraconazolo del Trichophyton rubrum mediata dal trasportatore ABC TruMDR2. Mycoses. Agosto 2021; 64(8):936-946. doi: 10.1111/myc.13286. Pubblicazione elettronica 25 aprile 2021.
- Bolleman J, de Castro E, Baratin D, Gehant S, Cuche BA, Auchincloss AH, Coudert E, Hulo C, Masson P, Pedruzzi I, Rivoire C, Xenarios I, Redaschi N, Bridge A. HAMAP come regole SPARQL: una pipeline di annotazione portatile per genomi e proteomi. Gigascience 2020, 9(2):giaa003. doi: 10.1093/gigascience/giaa003
- Breuza L, Arighi CN, Argoud-Puy G, Casals-Casas C, Estreicher A, Famiglietti ML, Georghiou G, Gos A, Gruaz-Gumowski N, Hinz U, Hyka-Nouspikel N, Kramarz B, Lovering RC, Lussi Y, Magrane M, Masson P, Perfetto L, Poux S, Rodriguez-Lopez M, Stoeckert C, Sundaram S, Wang L-S, Wu E, Orchard S, IMEx Consortium, UniProt Consortium: Un approccio coordinato da parte delle risorse bioinformatiche di dominio pubblico per aiutare la lotta contro il morbo di Alzheimer attraverso la curazione esperta di proteine target chiave. J. Alzheimers Dis. 2020. doi: 10.3233/JAD-200206
- Bye-A-Jee H, Zaru R, Magrane M, Orchard S, UniProt Consortium. Complessi fosfatasi Caenorhabditis elegans in UniProtKB e Complex Portal. FEBS J. 2020, 287: 2664-2684. doi: 10.1111/febs.15213
- Drysdale R, Cook CE, Petryszak R, Baillie-Gerritsen V, Barlow M, Gasteiger E, Gruhl F, Haas J, Lanfear J, Lopez R, Redaschi N, Stockinger H, Teixeira D, Venkatesan A; Elixir Core Data Resource Forum; Blomberg N, Durinx C, McEntyre J. Le risorse dati fondamentali ELIXIR: infrastruttura fondamentale per le scienze della vita. Bioinformatica. 15 aprile 2020;36(8):2636-2642. doi: 10.1093/bioinformatics/btz959.
- MacDougall A, Volynkin V, Saidi R, Poggioli D, Zellner H, Hatton-Ellis E, Joshi V, O'Donovan C, Orchard S, Auchincloss AH, Baratin D, Bolleman J, Coudert E, de Castro E, Hulo C, Masson P, Pedruzzi I, Rivoire C, Arighi C, Wang Q, Chen C, Huang H, Garavelli J, Vinayaka CR, Yeh LS, Natale DA, Laiho K, Martin M, UniProt Consortium. UniRule: una risorsa unificata di regole per l'annotazione automatica nella UniProt Knowledgebase. Bioinformatica 2020. doi: 10.1093/bioinformatica/btaa485
- Morgat A, Lombardot T, Coudert E, Axelsen K, Batista Neto T, Gehant S, Bansal P, Bolleman J, Gasteiger E, de Castro E, Baratin D, Pozzato M, Xenarios I, Poux S, Redaschi N, Bridge A, UniProt Consortium. Annotazione degli enzimi in UniProtKB utilizzando Rhea. Bioinformatica 2020, 36(6): 1896-1901. doi: 10.1093/bioinformatics/btz817
- Porras P, Barrera E, Bridge A, Del-Toro N, Cesareni G, Duesbury M, Hermjakob H, Iannuccelli M, Jurisica I, Kotlyar M, Licata L, Lovering RC, Lynn DJ, Meldal B, Nanduri B, Paneerselvam K, Panni S, Pastrello C, Pellegrini M, Perfetto L, Rahimzadeh N, Ratan P, Ricard-Blum S, Salwinski L, Shirodkar G, Shrivastava A, Orchard S. Verso un dataset unificato ad accesso libero delle interazioni molecolari. Nat Commun. 1 dicembre 2020;11(1):6144. doi: 10.1038/s41467-020-19942-z
- Touré V, Vercruysse S, Acencio ML, Lovering RC, Orchard S, Bradley G, Casals-Casas C, Chaouiya C, Del-Toro N, Flobak Å, Gaudet P, Hermjakob H, Hoyt CT, Licata L, Lægreid A, Mungall CJ, Niknejad A, Panni S, Perfetto L, Porras P, Pratt D, Saez-Rodriguez J, Thieffry D, Thomas PD, Türei D, Kuiper M. Informazioni minime su una dichiarazione causale di interazione molecolare (MI2CAST). Bioinformatica 2020. doi: 10.1093/bioinformatica/btaa622
- Wood V, Carbon S, Harris MA, Lock A, Engel SR, Hill DP, Van Auken K, Attrill H, Feuermann M, Gaudet P, Lovering RC, Poux S, Rutherford KM, Mungall CJ. Term Matrix: un nuovo sistema di controllo della qualità delle annotazioni della Gene Ontology basato su modelli di co-annotazione dei termini ontologici. Open Biol. Settembre 2020; 10(9):200149. doi: 10.1098/rsob.200149. Pubblicazione elettronica 2 settembre 2020.
Membri
Visualizza i membri del nostro gruppoqui