ModelArchive, un archivio aperto per la condivisione di modelli di strutture proteiche determinati computazionalmente, ha ricevuto una sovvenzione da swissuniversities per espandere i principi dei dati di ricerca aperti (ORD). Diversi leader del gruppo SIB stanno collaborando con esperti internazionali per sviluppare questa risorsa dati, che integra la Protein Data Bank (PDB) per le strutture proteiche determinate sperimentalmente.

Sfruttare l'esplosione delle strutture proteiche previste

Nuovi metodi di modellizzazione basati sul deep learning, come AlphaFold, consentono ora di prevedere le strutture proteiche con un elevato livello di qualità, raggiungendo un'accuratezza quasi pari a quella sperimentale. Ciò ha portato a un'esplosione di modelli previsti dal computer, che integrano la gamma altrimenti limitata di strutture determinate sperimentalmente. Inoltre, si stanno già osservando progressi nella modellizzazione dei complessi proteici, come le loro interazioni con piccole molecole (ad esempio farmaci), RNA e DNA. Anche la modellizzazione delle proteine in diversi stati conformazionali sta progredendo, così come gli studi di ingegneria e progettazione delle proteine. Tutti questi modelli necessitano di uno spazio dedicato per essere archiviati e messi a disposizione degli scienziati che si occupano di scienze della vita per essere utilizzati nei rispettivi campi di ricerca, dalla scoperta di farmaci alla biologia molecolare.

È qui che entra in gioco ModelArchive. Sviluppato dal gruppo di Torsten Schwede del SIB, consente di archiviare e condividere le strutture proteiche determinate con metodi computazionali. Completa quindi la Protein Data Bank (PDB) e PDB-Dev, che archiviano rispettivamente strutture derivate e parzialmente derivate da dati sperimentali. Costruendo e ampliando le attuali best practice in materia di dati di ricerca aperti, come il formato di dati ModelCIF, ModelArchive mira a diventare il repository di riferimento per la condivisione di strutture proteiche modellate computazionalmente. Questa iniziativa volta a promuovere i dati di ricerca aperti (ORD) ha ricevuto un finanziamento da swissuniversities (vedi riquadro).

L'appello di swissuniversities per progetti che promuovono la ricerca aperta

Nel 2022 Swissuniversities ha lanciato un bando per progetti che sostengono e promuovono l'eccellenza nelle pratiche di Open Research Data. Ciò rientra nel programma Open Science I Fase B – ORD della Strategia nazionale svizzera per i dati di ricerca aperti, che è stato commissionato dalla Segreteria di Stato per la formazione, la ricerca e l'innovazione (SEFRI). Diversi progetti che coinvolgono o sono guidati da membri del SIB hanno ottenuto finanziamenti, a dimostrazione del ruolo del SIB nel catalizzare l'ORD.

Un tesoro di dati per favorire nuove scoperte

L'iniziativa è guidata da diversi scienziati con una lunga esperienza nella biologia strutturale computazionale, ovvero Andrea Cavalli, Matteo Dal Peraro, Markus Lill, Olivier Michielin, Torsten Schwede e Vincent Zoete, tutti leader del gruppo al SIB. In merito al finanziamento concesso a questo progetto, Torsten Schwede afferma: «Attualmente ModelArchive mette a disposizione oltre 74 000 modelli e questo numero è destinato ad aumentare rapidamente in futuro. Grazie al sostegno di swissuniversities, possiamo migliorare le attuali migliori pratiche ORD e aumentare la riutilizzabilità dei modelli strutturali computazionali. La combinazione di strutture sperimentali e modelli computazionali fornisce ai biologi strutturali un tesoro di dati che favorisce nuove scoperte».

Sviluppare e stabilire nuove best practice per i dati di ricerca aperti

Rendere liberamente disponibili i dati sulla struttura delle proteine è al centro degli sforzi del team che sviluppa e gestisce ModelArchive. L'ampliamento di queste pratiche ORD non solo garantirà che la condivisione dei dati avvenga in modo FAIR (Findable, Accessible, Interoperable and Reusable, ovvero reperibile, accessibile, interoperabile e riutilizzabile), ma anche che i valori di queste pratiche siano condivisi con altri soggetti interessati, quali riviste scientifiche, agenzie di finanziamento e ricercatori nel campo delle scienze della vita. Come affermato nella loro proposta, queste pratiche sono in linea con il SwissBioData ecosystem (SBDe) co-guidato da Il SIB, che mira a promuovere in modo significativo la condivisione dei dati FAIR in Svizzera.