A seguito dell'ultima edizione del processo di selezione condotto da ELIXIR a livello europeo, altre due risorse sviluppate dai gruppi del SIB sono state designate come di fondamentale importanza per le scienze della vita: Cellosaurus – un'enciclopedia delle linee cellulari – sviluppata da Amos Bairoch dell'Università di Ginevra nell'ambito del gruppo CALIPHO, e Rhea – una banca dati delle reazioni biochimiche – sviluppata dal gruppo Swiss-Prot guidato da Alan Bridge. dopo UniProtKB/Swiss-Prot e STRING, Cellosaurus e Rhea sono la terza e la quarta risorsa svizzera ad essere aggiunta al portafoglio ELIXIR Core Data Resource: questa è un'ottima notizia e un passo fondamentale per garantire la loro sostenibilità e l'accesso a lungo termine a dati biologici di alta qualità per gli utenti di tutto il mondo», spiega Christine Durinx, direttrice esecutiva di Il SIB.
Cosa sono le ELIXIR Core Data Resources?
Le ELIXIR Core Data Resources sono un insieme di risorse dati europee di fondamentale importanza per la comunità delle scienze della vita in senso lato e per la conservazione a lungo termine dei dati biologici. L'identificazione delle ELIXIR Core Data Resources comporta un'attenta valutazione delle molteplici sfaccettature delle risorse dati. I dettagli dei criteri di selezione sono descritti nell'articolo F1000R ELIXIR track"Identifying ELIXIR Core Data Resources" (Identificazione delle risorse di dati fondamentali ELIXIR).
Abbiamo chiesto al responsabile del gruppo Amos Bairoch di Cellosaurus e ai membri del team Rhea di Swiss-Prot (Kristian Axelsen, Senior Biocurator; Alan Bridge, responsabile del gruppo e Anne Morgat, Resource Manager) di chiarire le implicazioni di questo annuncio e di parlarci delle loro risorse.
Potresti descrivere la risorsa in poche parole?
Cellosaurus / Amos: Cellosaurus è un database di linee cellulari, ovvero colture di cellule umane e animali che possono essere coltivate per periodi prolungati in vitro, utilizzate nel contesto della ricerca nelle scienze della vita. Contiene una grande quantità di informazioni su oltre 125.000 linee cellulari create a partire dagli anni '50.
Rhea / Kristian: Rhea è una base di conoscenze sulle reazioni biochimiche descritte utilizzando specie chimiche tratte dal dizionario ChEBI (Chemical Entities of Biological Interest) delle piccole molecole. Rhea è il vocabolario di riferimento per l'annotazione degli enzimi e delle proteine di trasporto in UniProt.
Per quale tipo di ricerca o per affrontare quale tipo di questioni di ricerca è utile questa risorsa?
Cellosaurus / Amos: Quasi tutti coloro che svolgono ricerche in vitro utilizzano linee cellulari: esse sono essenziali, ad esempio, per studiare la produzione di vaccini, il metabolismo dei farmaci, la funzione dei geni o persino la generazione di pelle artificiale. A seconda dei loro obiettivi di ricerca, gli scienziati devono sapere quali linee cellulari utilizzare e dove trovarle: questo è il tipo di informazioni che troveranno in Cellosaurus.
Rhea / Alan: Rhea fornisce un supporto essenziale agli approcci computazionali per lo studio e l'ingegnerizzazione degli enzimi e dei sistemi metabolici in cui funzionano. Questi approcci hanno il potenziale per rivoluzionare la nostra comprensione del metabolismo e aprire nuove strade alla produzione di biocarburanti, farmaci e altre sostanze chimiche desiderabili.
Può citare un esempio particolarmente interessante di applicazione della risorsa o di uno studio recente condotto utilizzando tale risorsa?
Cellosaurus / Amos: Si stima che fino al 30% di tutte le ricerche condotte sulle linee cellulari tumorali sia influenzato da errori di identificazione o contaminazione delle linee cellulari. Per alleviare questo problema fondamentale, un'applicazione molto importante di Cellosaurus è lo strumento CLASTR, che consente di cercare somiglianze tra il profilo STR delle linee cellulari dell'utente e quelli memorizzati nella risorsa.
Rhea / Anne: Uno studio recente ha utilizzato Rhea e UniProt per identificare potenziali metaboliti come biomarcatori precoci dei difetti dello sviluppo neurologico e come bersagli terapeutici per la schizofrenia.
Come è arrivato dove si trova ora? Qual è l'elemento dell'ecosistema del SIB che ha permesso la sua nascita e il suo successo?
Cellosaurus / Amos: Cellosaurus è nato come thesaurus delle linee cellulari nel contesto di neXtProt, una risorsa del SIB. Volevamo registrare quali linee cellulari erano state utilizzate negli esperimenti che hanno prodotto i set di dati acquisiti in neXtProt. Questo piccolo progetto è cresciuto fino a diventare una risorsa di conoscenza a tutti gli effetti e nel maggio 2015 è stato reso disponibile come risorsa autonoma su Expasy, il portale di bioinformatica del SIB. Un grande ringraziamento al team di Expasy e in particolare a Elisabeth Gasteiger (User Experience & Support Manager, Swiss-Prot Group) per aver implementato Cellosaurus sul web e aver contribuito a questo successo!
Rhea / Alan: il SIB offre un ambiente eccellente per lo sviluppo di risorse di conoscenza, lavorando per identificare e supportare risorse di conoscenza emergenti e mature in modo molto simile a ELIXIR a livello europeo. Il supporto del SIB è stato assolutamente cruciale per lo sviluppo di Rhea, che è strettamente coordinato con quello di UniProt e altre risorse del SIB come ENZYME e SwissLipids. Anne: Altrettanto cruciali sono le collaborazioni con i nostri partner internazionali, in particolare il team ChEBI dell'EMBL-EBI, nonché Gene Ontology Consortium e Reactome, con i quali stiamo lavorando a stretto contatto per migliorare la copertura e l'interoperabilità delle nostre rispettive risorse di conoscenza, e con i team di altri nodi ELIXIR come ELIXIR-CZ, con i quali collaboriamo strettamente all'implementazione di ricerche avanzate di strutture chimiche in Rhea.
Come pensi che il suo status CDR influenzerà il suo sviluppo?
Cellosaurus / Amos: Contribuirà a migliorare il finanziamento di Cellosaurus e ci consentirà di sviluppare ulteriormente il sistema di interrogazione della risorsa e la sua interoperabilità con altre risorse, ad esempio attraverso un modello semantico, un'API e un motore di ricerca basato su SPARQL. Questi sviluppi apporteranno grandi vantaggi agli utenti della bioinformatica della risorsa sia nel mondo accademico che in quello industriale.
Rhea / Alan: Le risorse dati fondamentali (Core Data Resources) sono riconosciute come di fondamentale importanza per la conservazione a lungo termine dei dati biologici. Lo status di CDR aumenterà enormemente la visibilità di Rhea sia all'interno della comunità scientifica (degli utenti) e, speriamo, contribuirà alla fine a garantire un finanziamento più stabile.
Maggiori informazioni sulla serie completa di risorse recentemente selezionate, sul processo e sull'importanza delle ELIXIR Core Data Resources sono disponibili sul sito web di ELIXIR.
Non perdetevi il corso in streaming di febbraio "A guided tour through Cellosaurus" (Una visita guidata attraverso Cellosaurus) e registratevi qui. E preparatevi per il corso in streaming di ottobre "Mining enzyme data in UniProtKB using Rhea" (Estrazione dei dati sugli enzimi in UniProtKB utilizzando Rhea) qui.