Umsetzung der FAIR -Grundsätze für Multi-Omics

Die Ermöglichung des Datenaustauschs und der Wiederverwendung gemäß den FAIR-Prinzipien (siehe Kasten) wird für viele Förderorganisationen zu einer Voraussetzung, stellt jedoch für Forscher nach wie vor eine praktische Herausforderung dar. In diesem in silico talk stellt Nastassia Gobet von der Universität Lausanne und SIB die Strategie und die Tools vor, mit denen der Wert komplexer Multi-Omics-Daten maximiert werden soll, die im Rahmen eines systemgenetischen Forschungsprojekts zur Schlafregulation generiert wurden. Die von ihr gemeinsam mit Maxime Jan (Universität Lausanne) geleitete Studie wurde in einer Sonderausgabe der Fachzeitschrift Scientific Data zum Thema Multi-Omics-Datenaustausch veröffentlicht und untermauert die These, dass eine bessere Reproduzierbarkeit von Daten die Qualität der Wissenschaft verbessert.
Über die in silico talks-Reihe - Das Neueste aus der Bioinformatik von SIB-Wissenschaftlern
Mit der Online-Reihe in silico talks möchten wir Bioinformatiker, Biowissenschaftler und Kliniker über die neuesten Fortschritte der SIB-Wissenschaftler zu einem breiten Spektrum von Bioinformatik-Methoden, -Forschung und -Ressourcen informieren. Bleiben Sie auf dem Laufenden, erhalten Sie exklusive Einblicke in die neuesten Veröffentlichungen und erfahren Sie, wie diese Fortschritte Ihnen bei Ihrer Arbeit oder Forschung helfen können, indem Sie sich in die in silico talks-Mailingliste eintragen.
FAIR-Grundsätze: Eine theoretische Checkliste für den Datenaustausch
Die FAIR-Prinzipien sind eine Reihe von Leitlinien (Wilkinson et al. 2016), die darauf abzielen, Daten auffindbar (d. h. indexiert und mithilfe von Schlüsselwörtern durchsuchbar, mit einer Kennung wie einem DOI), zugänglich (d. h. entweder frei oder gegebenenfalls nach einem Authentifizierungsverfahren abgerufen werden können), interoperabel (d. h. in einem weit verbreiteten Format und einer weit verbreiteten Sprache und unter Verwendung eines Standardvokabulars, sofern vorhanden) und wiederverwendbar (d. h. mit einer rechtlichen Lizenz, die klarstellt, wer die Daten verwenden darf und ob sie verändert werden dürfen) zu machen.
Herausforderungen und Chancen beim Austausch von Multi-Omics-Daten
Durch die Integration von Omics-Datensätzen aus dem Genom, Proteom, Transkriptom, Epigenom usw. zielen Multi-Omics-Experimente darauf ab, Lebensprozesse wie Krankheiten oder Schlaf gemeinsam zu erfassen und zu verstehen.
Damit stellen sie sowohl eine Chance als auch eine Herausforderung für den Datenaustausch dar. Eine Chance, weil sie einen Schatz an Informationen generieren, die dann in andere Studien einfließen und zu neuen Entdeckungen führen können; eine Herausforderung aufgrund der schieren Größe der generierten Datensätze, der Heterogenität der Versuchsdesigns und Datentypen sowie des Umfangs des Austauschs, der nicht nur die Daten selbst, sondern auch Analyse-Workflows, Code, die Interpretation der Ergebnisse und Metadaten umfasst.
Strategie, Tools und Ergebnisse für die FAIR-Konformität von Multi-Omics-Daten
Nastassia Gobet, Doktorandin an der SIB und am Centre for Integrative Genomics der Universität Lausanne und Mitglied der SIB-Gruppe Vital-IT, bewertete die Reproduzierbarkeit der entwickelten Bioinformatik-Pipeline sowie die Robustheit der Ergebnisse einer früheren Studie, die von ihrem Kollegen Maxime Jan (Universität Lausanne) geleitet wurde und in der anhand von Multi-Omics-Daten untersucht wurde, wie der Schlaf bei Mäusen reguliert wird.
In diesem in silico talk stellt sie die allgemeinen Chancen und Herausforderungen des Multi-Omics-Datenaustauschs, die Strategie zur Umsetzung der FAIR-Prinzipien, die verwendeten Ansätze (z. B. interaktive Notebook-Schnittstelle, Workflow-Definition) und die Ergebnisse der erneuten Analyse der Daten vor.
Reference(s)
Jan M, Gobet N et al. Ein multiomisches digitales Forschungsobjekt für die Genetik der Schlafregulation. Wissenschaftliche Daten 2019.