Permettre le partage et la réutilisation des données conformément aux principes FAIR (voir encadré) devient une condition préalable pour de nombreux organismes de financement, mais cela représente encore un défi pratique pour les chercheurs. Dans cet in silico talk, Nastassia Gobet, de l'Université de Lausanne et du SIB, partage la stratégie et les outils adoptés pour maximiser la valeur des données multi-omiques complexes générées dans le cadre d'un projet de recherche en génétique des systèmes sur la régulation du sommeil. L'étude qu'elle a co-dirigée avec Maxime Jan (Université de Lausanne) est publiée dans un numéro spécial de la revue Scientific Data consacré au partage des données multi-omiques, et soutient l'idée que rendre les données plus reproductibles améliore la qualité de la science.

À propos de la série in silico talks - Les dernières avancées en bioinformatique par les scientifiques du SIB

La série in silico talks a pour but d'informer les bioinformaticiens, les spécialistes des sciences de la vie et les cliniciens des dernières avancées réalisées par les scientifiques du SIB sur un large éventail de sujets liés aux méthodes, à la recherche et aux ressources en bioinformatique. Restez au courant des derniers développements, obtenez des informations exclusives sur les articles récents et découvrez comment ces avancées pourraient vous aider dans votre travail ou votre recherche en vous inscrivant à la liste de diffusion in silico talks.

Principes FAIR : liste de contrôle théorique pour le partage des données

Les principes FAIR sont un ensemble de principes directeurs (Wilkinson et al. 2016) qui visent à rendre les données trouvables (c'est-à-dire indexées et consultables à l'aide de mots-clés, avec un identifiant tel qu'un DOI), accessibles (c'est-à-dire récupérables soit librement, soit avec une procédure d'authentification le cas échéant), interopérables (c'est-à-dire dans un format et un langage largement utilisés et respectant le vocabulaire standard lorsqu'il existe) et réutilisables (c'est-à-dire accompagnées d'une licence légale précisant qui peut utiliser les données et si elles peuvent être modifiées ou non).

Défis et opportunités liés au partage des données multi-omiques

En intégrant des ensembles de données omiques provenant du génome, du protéome, du transcriptome, de l'épigénome, etc., les expériences multi-omiques visent à saisir et à comprendre conjointement les processus vitaux, tels que les maladies ou le sommeil.

À ce titre, elles représentent à la fois une opportunité et un défi pour le partage des données. Une opportunité, car elles génèrent des mines d'informations qui pourraient ensuite être intégrées à d'autres études et conduire à de nouvelles découvertes ; un défi, en raison de la taille considérable des ensembles de données générés, de l'hétérogénéité des protocoles expérimentaux et des types de données, et de la portée du partage qui concerne non seulement les données elles-mêmes, mais aussi les workflows d'analyse, le code, l'interprétation des résultats et les métadonnées.

Stratégie, outils et résultats pour rendre les données multi-omiques FAIR

Nastassia Gobet, doctorante au SIB et au Centre de génomique intégrative de l'Université de Lausanne, affiliée au groupe Vital-IT du SIB, a évalué la reproductibilité du pipeline bioinformatique développé ainsi que la robustesse des résultats obtenus dans une étude précédente menée par son collègue Maxime Jan (Université de Lausanne) sur la régulation du sommeil chez la souris à l'aide de données multi-omiques.

Dans cette in silico talk, elle présente les opportunités et les défis globaux du partage des données multi-omiques, la stratégie adoptée pour mettre en œuvre les principes FAIR, les approches utilisées (par exemple, interface interactive de type notebook, définition du workflow) et les résultats de la réanalyse des données.

Reference(s)

Jan M, Gobet N et al. Un objet de recherche numérique multi-omique pour la génétique de la régulation du sommeil. Données scientifiques 2019.