Consentire la condivisione e il riutilizzo dei dati in linea con i principi FAIR (vedi riquadro) sta diventando un prerequisito per molte agenzie di finanziamento, ma ciò rappresenta ancora una sfida pratica per i ricercatori. In questo in silico talk, Nastassia Gobet dell'Università di Losanna e il SIB condivide la strategia e gli strumenti adottati per massimizzare il valore dei dati complessi e multi-omici, generati nel contesto di un progetto di ricerca genetica sistemica sulla regolazione del sonno. Lo studio, condotto in collaborazione con Maxime Jan (Università di Losanna) , è pubblicato in una raccolta speciale della rivista Scientific Data sulla condivisione dei dati multi-omici e sostiene l'idea che rendere i dati più riproducibili migliori la qualità della scienza.

Informazioni sulla serie di conferenze in silico – Le ultime novità nel campo della bioinformatica dagli scienziati del SIB

La serie di conferenze online in silico talks ha lo scopo di informare bioinformatici, scienziati biologici e medici sugli ultimi progressi compiuti dagli scienziati dello SIB su una vasta gamma di argomenti relativi a metodi, ricerca e risorse nel campo della bioinformatica. Iscriviti alla mailing list di in silico talks per rimanere aggiornato sugli ultimi sviluppi, ottenere approfondimenti esclusivi sui recenti articoli scientifici e scoprire come questi progressi potrebbero aiutarti nel tuo lavoro o nella tua ricerca.

Principi FAIR: una checklist teorica per la condivisione dei dati

I principi FAIR sono una serie di linee guida (Wilkinson et al. 2016) che mirano a rendere i dati reperibili (ovvero indicizzati e ricercabili tramite parole chiave, con un identificatore come un DOI), accessibili (ovvero recuperabili liberamente o con una procedura di autenticazione, ove applicabile); Interoperabili (ovvero in un formato e in una lingua ampiamente utilizzati e conformi al vocabolario standard, ove esistente) e riutilizzabili (ovvero con licenze legali che chiariscono chi può utilizzare i dati e se questi possono essere modificati).

Sfide e opportunità nella condivisione dei dati multi-omici

Integrando i set di dati omici provenienti dal genoma, dal proteoma, dal trascrittoma, dall'epigenoma, ecc., gli esperimenti multi-omici mirano a catturare e comprendere congiuntamente i processi vitali, come le malattie o il sonno.

In quanto tali, rappresentano sia un'opportunità che una sfida per la condivisione dei dati. Un'opportunità perché generano un tesoro di informazioni che potrebbero poi essere incorporate in altri studi e portare a nuove scoperte; una sfida perché i set di dati generati sono di dimensioni enormi, i disegni sperimentali e i tipi di dati sono eterogenei e la portata della condivisione coinvolge non solo i dati stessi, ma anche i flussi di lavoro di analisi, il codice, l'interpretazione dei risultati e i metadati.

Strategia, strumenti e risultati per rendere i dati multi-omici FAIR

Nastassia Gobet, dottoranda presso il Centro di Genomica Integrativa dell'Università di Losanna e affiliata al gruppo Vital-IT del SIB, ha valutato la riproducibilità della pipeline bioinformatica sviluppata e la robustezza dei risultati ottenuti da uno studio precedente condotto dal suo collega Maxime Jan (Università di Losanna) mentre studiava come viene regolato il sonno nei topi utilizzando dati multi-omici.

In questo in silico talk, presenta le opportunità e le sfide complessive della condivisione dei dati multi-omici, la strategia adottata per mettere in pratica i principi FAIR, gli approcci utilizzati (ad esempio, interfaccia interattiva del notebook, definizione del flusso di lavoro) e il risultato della rianalisi dei dati.

Reference(s)

Jan M, Gobet N et al. Un oggetto di ricerca digitale multi-omico per la genetica della regolazione del sonno. Dati scientifici 2019.