Concentrarsi sulla missione del gruppo

Il gruppo Swiss-Prot, co-diretto da Alan Bridge e Paul Thomas, eccelle nella generazione di conoscenze biologiche leggibili da computer a partire dal corpus sempre crescente di pubblicazioni scientifiche. Il team sfrutta la potenza dei metodi di deep learning per accelerare la selezione della letteratura e l'estrazione dei dati, fornendo così agli utenti le informazioni più accurate e complete in modo tempestivo.

Dati chiave annuali

  • Oltre 150.000 citazionidi risorse in pubblicazioni scientifiche
  • Oltre 180.000 menzioni di risorse nei brevetti
  • Oltre 8 milioni di utenti delle risorse ogni anno

Fonti e definizioni degli utenti: lens.org, Web of Science, PubMed, Google Analytics, Matomo

Consentire scoperte grazie a rinomate risorse di biodati

Le risorse di conoscenza interconnesse e curate con competenza, sviluppate dai biocuratori e dagli sviluppatori di software del gruppo, sono riconosciute a livello internazionale per la loro importanza fondamentale per la ricerca e l'innovazione nel campo delle scienze della vita e vengono utilizzate in applicazioni che vanno dal biorisanamento dei terreni contaminati alla scoperta e allo sviluppo di farmaci.

  • UniProtKB/Swiss-Prot è la risorsa di informazioni sulle proteine più utilizzata al mondo ed è riconosciuta come risorsa al SIB, ELIXIR Core Data Resource e risorsa dati core globale.
  • Rhea, un database di reazioni biochimiche, è riconosciuto come risorsa dati al SIB, ELIXIR Core Data Resource e risorsa dati core globale.
  • Gene Ontology (GO) è una fonte fondamentale di informazioni sulla funzione dei geni ed è riconosciuta come Global Core Data Resource.
  • SwissLipids, un database di strutture lipidiche e conoscenze biologiche, è riconosciuto come risorsa al SIB.
  • HAMAP e PROSITE sono database ampiamente utilizzati di famiglie e domini proteici.
  • Il database ENZYME, ampiamente utilizzato, fornisce informazioni sulla nomenclatura degli enzimi.
  • ViralZone fornisce informazioni su tutti i generi e le famiglie virali.
  • SwissBioPics offre una libreria di immagini cellulari interattive.

Il gruppo Swiss-Prot supporta anche lo sviluppo personalizzato di strumenti e risorse per ricercatori e medici.

Maggiori informazioni sui nostri servizi di biocurazione e sviluppo software

Supportare l'intelligenza artificiale con conoscenze biologiche leggibili da macchine

Anche le basi di conoscenza delle scienze della vita sono una parte essenziale dell'ecosistema dell'IA. Le conoscenze biologiche collettive che contengono, sotto forma di sequenze e strutture molecolari, percorsi biochimici e relazioni tra questi, possono essere utilizzate per addestrare e mettere a punto sistemi di IA che rivelano meccanismi biologici complessi e generano intuizioni attuabili.

Le Swiss-Prot-Knowledgebases sviluppate dal gruppo Swiss-Prot hanno contribuito a:

  • il modello AlphaFold, vincitore del premio Nobel 2024, per la previsione della struttura delle proteine, che ha imparato a identificare le relazioni tra le sequenze aminoacidiche e le strutture 3D analizzando centinaia di milioni di proteine in UniProt (vedi AI focus nel SIB Profile 2025);
  • un Large Language Model (LLM) per migliorare la somministrazione dei vaccini a mRNA, che è stato addestrato utilizzando SwissLipids (fonte: bioinformatica, 2024);
  • un LLM per progettare nuove proteine con funzioni desiderabili, che è stato addestrato utilizzando la parte UniProtKB/Swiss-Prot di UniProt, curata da esperti (fonte: Nature Biotechnology, 2023);

Il gruppo ha anche sviluppato un dataset di benchmarking, EnzChemRED, per mettere a punto gli LLM per la curazione dei dati specializzati, che è stato riconosciuto come un Remarkable Output da SIB. Il team sta applicando il dataset per guidare gli sforzi di biocuratela per le basi di conoscenza UniProt e Rhea.

Membri

Visualizza i membri del nostro gruppoqui