Diverse risorse dati aggiuntive sviluppate al SIB sono state recentemente riconosciute come fondamentali per la comunità internazionale delle scienze della vita. A livello europeo, SWISS-MODEL e ModelArchive sono state selezionate rispettivamente come ELIXIR Core Data Resource ed ELIXIR Deposition Database. Entrambe le risorse sono essenziali per la ricerca nel campo della biologia strutturale e sono state sviluppate dal gruppo del SIB di Torsten Schwede presso l'Università di Basilea. In questa occasione, abbiamo chiesto al Team Lead Software Development Gerardo Tauriello di illustrarci come sono state sviluppate queste risorse e come hanno raggiunto il loro successo.
Le proteine sono fondamentali per una vasta gamma di funzioni in tutti gli esseri viventi, ad esempio agiscono come enzimi per mediare la digestione o degradare gli inquinanti, come messaggeri chimici nel sistema immunitario o come ormoni. La loro funzione è strettamente correlata alle loro strutture tridimensionali, che SWISS-MODEL e ModelArchive aiutano gli scienziati a studiare.
Puoi descrivere brevemente SWISS-MODEL e ModelArchive?
SWISS-MODEL mira a rendere la modellazione delle proteine accessibile a tutti i ricercatori nel campo delle scienze della vita in tutto il mondo. Il suo archivio contiene strutture proteiche aggiornate regolarmente generate dalla pipeline automatizzata di SWISS-MODEL e fornisce l'accesso alle strutture sperimentali della Protein Data Bank (PDB) e ai modelli computazionali di AlphaFold e ModelArchive. ModelArchive funge infatti da archivio in cui è possibile depositare strutture molecolari determinate computazionalmente. Ciò include modelli di proteine, RNA, DNA, carboidrati e piccole molecole correlate.
Maggiori informazioni sul software open source e sui database sviluppati al SIB
Quali sfide o domande di ricerca possono aiutare a risolvere?
SWISS-MODEL e ModelArchive costituiscono preziose fonti di strutture proteiche determinate computazionalmente, soprattutto quando mancano strutture determinate sperimentalmente. Ciò può essere applicato, ad esempio, nella scoperta di farmaci o per rivelare gli effetti delle variazioni nelle sequenze proteiche, poiché entrambi sono strettamente correlati alla loro conformazione tridimensionale.
Inoltre, poiché SWISS-MODEL utilizza strutture note di proteine simili come guida per prevedere le strutture proteiche, è in grado di fornire modelli in specifiche configurazioni 3D, facilitando lo studio della funzione delle proteine e dell'interazione con altre molecole. Esso integra quindi in modo vantaggioso i recenti metodi basati sul Deep Learning, offrendo notevoli vantaggi.
Hai un esempio particolarmente interessante di applicazione delle risorse?
In un caso recente, i modelli generati con SWISS-MODEL sono stati utilizzati per studiare sperimentalmente due anticorpi presenti nei sopravvissuti al virus Ebola come potenziale terapia. In un altro esempio, le strutture recuperate dall'archivio SWISS-MODEL sono state utilizzate per prevedere computazionalmente quali varianti delle proteine potrebbero causare malattie.
Recenti lavori che hanno generato strutture computazionali di proteine in cellule eucariotiche che si assemblano per formare complessi sono stati depositati in ModelArchive per consentire un ampio accesso alla comunità. In questo caso, i complessi hanno fornito informazioni sulla funzione biologica delle proteine coinvolte in vari processi biologici chiave, dalla riparazione del DNA e la divisione cellulare al metabolismo.
Come sono arrivate queste risorse dove si trovano ora?
Entrambe le risorse hanno una lunga storia che ha portato al loro recente riconoscimento a livello europeo. SWISS-MODEL è stato lanciato 30 anni fa e, grazie al suo design intuitivo e agli algoritmi implementati in modo efficiente, è oggi uno dei sistemi di modellazione proteica basati sul web più utilizzati al mondo per la ricerca e l'insegnamento.
ModelArchive è stato creato 10 anni fa e da allora c'è stata una maggiore disponibilità di modelli in silico di alta qualità, soprattutto con metodi basati sull'intelligenza artificiale come AlphaFold, rilasciato nel 2021. Questo, in combinazione con lo sviluppo di linee guida per l'archiviazione delle strutture previste, ha portato a una crescita sostanziale di ModelArchive, che ora contiene più di mezzo milione di modelli.
Cosa c'è stato di speciale nel fatto di essere al SIB che ha permesso loro di avere successo?
Il supporto del SIB è fondamentale per la stabilità e l'affidabilità a lungo termine di queste risorse aperte. Il SIB offre l'opportunità di assumere personale altamente qualificato ed esperto con contratti a lungo termine, aumentando le conoscenze tecniche che possono essere conservate all'interno del nostro gruppo. L'inclusione nelle risorse del SIB ha garantito un elevato livello di fiducia per SWISS-MODEL e ModelArchive, che si riflette nel loro utilizzo, nell'impatto all'interno della comunità delle scienze della vita e nel recente riconoscimento a livello europeo da parte di ELIXIR. Far parte della rete svizzera di al SIB facilita anche la collaborazione con altri gruppi al SIB, il che è estremamente utile per sfruttare l'ampiezza delle conoscenze disponibili nella comunità. Questi fattori hanno anche contribuito all'assegnazione a ModelArchive di una sovvenzione per estenderei principi dei dati di ricerca aperti.
Reference(s)
Immagine banner: struttura del complesso proteico archiviata in ModelArchive da uno studio recente