ModelArchive, ein offenes Repository für den Austausch computergestützt ermittelter Proteinstrukturmodelle, hat von swissuniversities einen Zuschuss zur Erweiterung der Prinzipien für offene Forschungsdaten (ORD) erhalten. Mehrere Gruppenleiter der SIB arbeiten mit internationalen Experten zusammen, um diese Datenressource zu entwickeln, die die Protein Data Bank (PDB) für experimentell ermittelte Proteinstrukturen ergänzt.
Die explosionsartige Zunahme vorhergesagter Proteinstrukturen nutzen
Neuartige Modellierungsmethoden auf Basis von Deep Learning, wie beispielsweise AlphaFold, ermöglichen nun die Vorhersage von Proteinstrukturen in hoher Qualität, die nahezu experimenteller Genauigkeit entspricht. Dies hat zu einer explosionsartigen Zunahme computergestützter Modelle geführt, die die ansonsten begrenzte Bandbreite experimentell ermittelter Strukturen ergänzen. Darüber hinaus sind bereits Fortschritte bei der Modellierung von Proteinkomplexen zu beobachten, beispielsweise hinsichtlich ihrer Wechselwirkungen mit kleinen Molekülen (z. B. Medikamenten), RNA und DNA. Auch die Modellierung von Proteinen in verschiedenen Konformationszuständen schreitet voran, ebenso wie Studien zur Proteinentwicklung und zum Proteindesign. All diese Modelle benötigen einen eigenen Speicherplatz, damit sie Lebenswissenschaftlern für ihre jeweiligen Forschungsbereiche, von der Wirkstoffforschung bis zur Molekularbiologie, zur Verfügung stehen.
Hier kommt ModelArchive ins Spiel. Es wurde in der Gruppe von Torsten Schwede am SIB entwickelt und ermöglicht die Hinterlegung und gemeinsame Nutzung von Proteinstrukturen, die mit computergestützten Methoden bestimmt wurden. Damit ergänzt es die Protein Data Bank (PDB) und PDB-Dev, in denen Strukturen gespeichert sind, die aus experimentellen Daten abgeleitet oder teilweise abgeleitet wurden. Durch den Aufbau und die Erweiterung aktueller Best Practices für offene Forschungsdaten wie das ModelCIF-Datenformat soll ModelArchive zum Referenzrepository für den Austausch computergestützt modellierter Proteinstrukturen werden. Diese Initiative zur Förderung offener Forschungsdaten (ORD) wurde von swissuniversities mit Fördermitteln ausgezeichnet (siehe Kasten).
Der Aufruf von swissuniversities für Projekte zur Förderung offener Forschungsdaten
Im Jahr 2022 hat Swissuniversities eine Ausschreibung für Projekte gestartet, die Exzellenz in der Praxis der offenen Forschungsdaten unterstützen und fördern. Dies ist Teil des Programms «Open Science I Phase B – ORD» der nationalen Strategie für offene Forschungsdaten, mit dessen Entwicklung das Staatssekretariat für Bildung, Forschung und Innovation (SBFI) beauftragt wurde. Mehrere Projekte, an denen SIB-Mitglieder beteiligt sind oder die von ihnen geleitet werden, haben Fördermittel erhalten, was die Rolle der SIB als Katalysator für ORD unterstreicht.
Eine Fundgrube an Daten für neue Entdeckungen
Die Initiative wird von mehreren Wissenschaftlern mit langjähriger Erfahrung in der computergestützten Strukturbiologie geleitet, darunter Andrea Cavalli, Matteo Dal Peraro, Markus Lill, Olivier Michielin, Torsten Schwede und Vincent Zoete, alle Gruppenleiter der SIB. Torsten Schwede kommentiert die Förderung des Projekts wie folgt: „Derzeit sind mehr als 74.000 Modelle in ModelArchive verfügbar, und diese Zahl wird in Zukunft rasch steigen. Mit der Unterstützung von swissuniversities können wir die aktuellen ORD-Best-Practices weiterentwickeln und die Wiederverwendbarkeit von computergestützten Strukturmodellen verbessern. Die Kombination von experimentellen Strukturen mit computergestützten Modellen bietet Strukturbiologen eine Fundgrube an Daten, die neue Entdeckungen ermöglichen.“
Aufbau und Etablierung neuer Best Practices für offene Forschungsdaten
Die freie Verfügbarkeit von Proteinstrukturdaten steht im Mittelpunkt der Bemühungen des Teams, das ModelArchive entwickelt und pflegt. Die Ausweitung dieser ORD-Praktiken umfasst nicht nur die Gewährleistung einer FAIR-konformen (Findable, Accessible, Interoperable and Reusable) Datenfreigabe, sondern auch die Weitergabe der Werte dieser Praktiken an andere Interessengruppen wie Fachzeitschriften, Förderorganisationen und Life-Science-Forscher. Wie in ihrem Vorschlag dargelegt, stehen diese Praktiken im Einklang mit dem von der SIB mitgetragenen SwissBioData ecosystem (SBDe), das darauf abzielt, den FAIR-Datenaustausch in der Schweiz deutlich voranzubringen.