Ob ein Gen in einem Organismus exprimiert wird oder nicht, hängt von einer Reihe miteinander verbundener Prozesse ab. Unter diesen ist die Bindung eines Transkriptionsfaktors an eine kurze Genomsequenz, die treffend als „Transkriptionsfaktor-Bindungsmotiv“ oder TFBM bezeichnet wird, ausschlaggebend für den Start der Transkription. Da experimentelle Daten nicht immer verfügbar sind, helfen Computermodelle den Forschern, die Position und Sequenz dieser Bindungsstellen im Genom vorherzusagen. Aber wie gut funktionieren diese Modelle? Eine umfassende Benchmarking-Studie zur Beantwortung dieser Frage wurde von einem internationalen Team unter der Leitung von Forschern der SIB, der EPFL und der Russischen Akademie der Wissenschaften durchgeführt.
Die „Qual der Wahl“ von Forschern angehen
„Forscher stehen heute vor einem echten ‚Fluch der Wahl‘: Für denselben Transkriptionsfaktor gibt es bis zu zehn alternative und oft sehr unterschiedliche Motive“, sagt Philipp Bucher, Gruppenleiter bei SIB und Co-Autor der Studie. „Der Bedarf an zuverlässigen Informationen über die Genauigkeit von Modellen zur Vorhersage von Transkriptionsfaktor-Bindungsstellen ist daher umso dringlicher.“
In einem in Genome Biology veröffentlichten Artikel befassten sich die Wissenschaftler mit der Frage der Genauigkeit von Transkriptionsfaktor-Bindungsmotiven, indem sie 4972 Motive aus drei verschiedenen Quellen anhand von 3161 experimentellen Testdatensätzen für menschliche Transkriptionsfaktoren verglichen, die mit drei verschiedenen Technologien generiert wurden.

Ergebnisse und Protokolle im Open Access
Der vollständige Datensatz mit mehr als 15 Millionen Leistungswerten, die aus dieser All-gegen-Alle-Benchmarking-Studie hervorgegangen sind, ist frei verfügbar im Open-Access-Repository Zenodo. Um die Reproduzierbarkeit der Berechnungen zu erleichtern, wurden die Benchmarking-Protokolle als Docker-Images containerisiert und auf GitHuböffentlich zugänglich gemacht .
Auf dem Weg zu einer besseren Vorhersage der Auswirkungen von Mutationen auf Krankheiten
Die Ergebnisse dieser Studie werden Forschern helfen, veröffentlichte Forschungsergebnisse, die auf Vorhersagen zu Transkriptionsfaktor-Bindungsstellen basieren, kritisch zu bewerten. Außerdem können sie damit optimale Motiv-Teilmengen für bestimmte Anwendungsfälle auswählen. „Langfristig hoffen wir, dass die für unser Benchmarking entwickelten Berechnungsprotokolle zu einer deutlichen Verbesserung der Bioinformatik-Tools führen werden, mit denen sich die Auswirkungen regulatorischer Genmutationen in verschiedenen Krankheitskontexten vorhersagen lassen“, so Bucher abschließend.
Reference(s)
Ambrosini G et al. Erkenntnisse aus einer umfassenden All-gegen-All-Benchmarking-Studie zu Transkriptionsfaktor-Bindungsmotiven. Genome Biology, 11. Mai 2020