Vai al contenuto principale

Traduzione automatica

Questo contenuto è stato tradotto automaticamente. Può contenere errori o non riflettere lo stile editoriale dell'istituto. In caso di dubbio, consultare la versione originale in inglese.

IA generativa combinata con la bioinformatica: un'ampia gamma di applicazioni
Cosa succede quando l'IA generativa viene addestrata su testi scientifici tratti dalla letteratura biologica, da banche dati, sequenze genetiche o codici? Scoprite le sue applicazioni guidate dai nostri scienziati per potenziare la ricerca, migliorare e innovare gli strumenti e accelerare le scoperte in diversi ambiti delle scienze della vita. Queste nuove tecnologie comportano anche sfide e carenze. Scopri come gli esperti al SIB le affrontano.

Esempi nel campo medico:

Di IA generativa e LLM

L'intelligenza artificiale generativa (AI) comprende sistemi in grado di creare nuovi contenuti, da testi e immagini a video, musica e molto altro ancora. I modelli linguistici di grandi dimensioni (LLM), un tipo fondamentale di AI generativa, vengono addestrati su dati testuali estesi, comprese sequenze genetiche o codici informatici, per riassumere, generare e prevedere nuovi contenuti. Modelli come ChatGPT e BioBERT ne sono un esempio: ChatGPT eccelle nella generazione di testi per chatbot e nella scrittura creativa, mentre BioBERT si concentra (ovvero è pre-addestrato) sui testi biomedici. Gli LLM utilizzano tecniche di deep learning, in particolare i trasformatori, per analizzare e comprendere i modelli linguistici da vasti set di dati e per prevedere la "parola" o la sequenza di parole successiva in base al contesto.

Generazione rapida di anticorpi personalizzati per combattere le malattie

Gli anticorpi monoclonali sono proteine speciali prodotte in laboratorio. Clonando un singolo tipo di cellula immunitaria, è possibile ottenere una grande quantità di anticorpi identici in grado di riconoscere e legarsi al loro bersaglio con elevata precisione. Questi bersagli includono, ad esempio, germi o cellule malate. Tuttavia, la loro scoperta tradizionale richiede molto tempo. Il SIB di Andrea Cavalli sta lavorando su AntibodyGPT, un modello linguistico per prevedere la struttura chimica di un anticorpo con una proprietà desiderata, al fine di accelerarne lo sviluppo.

Di IA generativa e LLM

L'intelligenza artificiale generativa (AI) comprende sistemi in grado di creare nuovi contenuti, da testi e immagini a video, musica e molto altro ancora. I modelli linguistici di grandi dimensioni (LLM), un tipo fondamentale di AI generativa, vengono addestrati su dati testuali estesi, comprese sequenze genetiche o codici informatici, per riassumere, generare e prevedere nuovi contenuti. Modelli come ChatGPT e BioBERT ne sono un esempio: ChatGPT eccelle nella generazione di testi per chatbot e nella scrittura creativa, mentre BioBERT si concentra (ovvero è pre-addestrato) sui testi biomedici. Gli LLM utilizzano tecniche di deep learning, in particolare i trasformatori, per analizzare e comprendere i modelli linguistici da vasti set di dati e per prevedere la "parola" o la sequenza di parole successiva in base al contesto.

Risposte a domande mediche relative alla radioterapia oncologica

In uno studio esplorativo condotto dal gruppo Il SIB di Janna Hastings, è stata testata la straordinaria capacità di ChatGPT di rispondere a domande in campo medico nel caso specifico della radioterapia. Il programma ha risposto in modo accurato alla maggior parte delle domande a scelta multipla (94%), ma meno accuratamente alle domande a risposta aperta, secondo la valutazione degli oncologi (48%). Tale incoerenza rende questi modelli inadatti come fonte autonoma di informazioni mediche, ma le loro capacità linguistiche li rendono una nuova ed entusiasmante interfaccia utente per database e linee guida.

Leggi la pubblicazione

Decifrare il ruolo nascosto dell'RNA nel cancro

Il SIB di Raphaëlle Luisier sta collaborando con esperti di elaborazione del linguaggio naturale al SIB e IDIAP per studiare l'RNA, molecole che trasportano istruzioni genetiche e aiutano a produrre proteine nelle cellule viventi. Sono interessati alle parti dell'RNA che non codificano direttamente le proteine e al modo in cui influenzano disturbi umani complessi, come la neurodegenerazione e il cancro. Nel melanoma, un tipo di tumore della pelle, alcuni trattamenti non funzionano bene nel tempo, in particolare i farmaci chiamati inibitori BRAF, e l'RNA potrebbe avere un ruolo in questo.

Esempi nel campo biologico:

Capire come gli insetti mutano la pelle

Gli artropodi, come insetti e ragni, sono le creature più diverse della Terra, fondamentali per la natura, l'agricoltura e la salute. La muta periodica del loro guscio esterno, chiamata muta, è fondamentale per la loro adattabilità. Tuttavia, per studiare questo processo, manca un riferimento integrato per la denominazione degli artropodi. Nell'ambito di una collaborazione Sinergia, i gruppi Il SIB di Marc Robinson-Rechavi e Frédéric Bastian e di Robert Waterhouse hanno integrato i dati relativi ai nomi delle specie con i dati di sequenza provenienti da diversi database pubblici utilizzando metodi di IA generativa nella risorsa MoultDB, che funge da riferimento per il settore. 

Conversare con complessi database biologici

Le tecnologie simili a ChatGPT possono aiutare i ricercatori nel campo delle scienze della vita a esplorare dati che non conoscono bene? È questa la domanda che la nostra nuova unità di rappresentazione della conoscenza ha approfondito, attraverso esempi concreti tratti dai principali database aperti e strumenti software al SIB. Sono state dimostrate le potenzialità dell'IA conversazionale nel descrivere set di dati biologici, nonché nel generare e spiegare query complesse su di essi. Sebbene i vantaggi includano la possibilità di sfruttare la ricchezza dei dati aperti, gli autori hanno anche sottolineato che è necessario prestare attenzione durante il processo.

Leggi la notizia "Dare un significato ai dati biologici: i grafici di conoscenza incontrano ChatGPT"

IA generativa e biocurazione: un circolo virtuoso

L'interazione tra le possibilità offerte dall'intelligenza artificiale, e in particolare dai modelli di linguaggio grande (LLM), e l'importanza delle competenze umane è ben illustrata nel contesto della biocurazione, settore in cui il SIB è leader riconosciuto. La biocurazione è l'arte di estrarre con competenza conoscenze dalla letteratura biologica e biomedica per costruire un'enciclopedia accurata, affidabile e aggiornata al servizio della scienza in generale.

Previsione della struttura, della funzione e della sequenza delle proteine grazie a dati di alta qualità

La funzione di una proteina è un'informazione fondamentale per comprendere i processi molecolari coinvolti nelle malattie, nello sviluppo di farmaci o nell'attività enzimatica. Questa funzione deriva dalla struttura tridimensionale della proteina, a sua volta determinata dalla sua sequenza di aminoacidi. Oggi, i modelli di IA generativa possono essere utilizzati per prevedere:

  • La struttura di una proteina dalla sua sequenza, che potrebbe essere utilizzata per progettare nuovi farmaci che si legano ad essa.
  • La funzione di una proteina dalla sua sequenza, che potrebbe aiutare ad annotare un genoma appena assemblato, il progetto della vita.
  • Una sequenza proteica in grado di svolgere una funzione specifica, come la degradazione di un inquinante ambientale.

A tal fine, molti modelli, da AlphaFold di Google DeepMind a ProtGPT2, vengono addestrati sulla base di conoscenza universale delle proteine UniProt, sviluppata in collaborazione con il SIB, dove le proteine sono curate in modo approfondito e affidabile.

Leggi la notizia "Gli strumenti di intelligenza artificiale fanno luce su milioni di proteine"