Mehrere zusätzliche Datenressourcen, die am SIB entwickelt wurden, sind kürzlich als wichtig für die internationale Life-Science-Gemeinschaft anerkannt worden. Auf europäischer Ebene wurden SWISS-MODEL und ModelArchive als ELIXIR Core Data Resource bzw. ELIXIR Deposition Database ausgewählt. Beide Ressourcen sind für die strukturbiologische Forschung unerlässlich und wurden von der SIB-Gruppe von Torsten Schwede an der Universität Basel entwickelt. Aus diesem Anlass haben wir den Team Lead Software Development der Gruppe, Gerardo Tauriello, gebeten, zu erläutern, wie diese Ressourcen entwickelt wurden und zu ihrem Erfolg geführt haben.
Proteine sind für eine Vielzahl von Funktionen in allen Lebewesen unverzichtbar, beispielsweise als Enzyme, die die Verdauung vermitteln oder Schadstoffe abbauen, als chemische Botenstoffe im Immunsystem oder als Hormone. Ihre Funktion hängt eng mit ihrer 3D-Struktur zusammen, die Wissenschaftler mit Hilfe von SWISS-MODEL und ModelArchive untersuchen können.
Können Sie SWISS-MODEL und ModelArchive kurz beschreiben?
SWISS-MODEL hat sich zum Ziel gesetzt, die Proteinmodellierung allen Life-Science-Forschern weltweit zugänglich zu machen. Das Repository enthält regelmäßig aktualisierte Proteinstrukturen, die aus der automatisierten Pipeline von SWISS-MODEL generiert werden, und bietet Zugang zu experimentellen Strukturen aus der Protein Data Bank (PDB) sowie zu Computermodellen von AlphaFold und ModelArchive. ModelArchive fungiert als Repository, in dem computergestützt ermittelte Molekülstrukturen hinterlegt werden können. Dazu gehören Modelle von Proteinen sowie von RNA, DNA, Kohlenhydraten und verwandten kleinen Molekülen.
Weiter lesen über die an der SIB entwickelten offenen Software und Datenbanken
Welche Forschungsaufgaben oder -fragen können sie beantworten helfen?
SWISS-MODEL und ModelArchive dienen als wertvolle Quellen für rechnerisch ermittelte Proteinstrukturen, insbesondere wenn experimentell ermittelte Strukturen fehlen. Dies kann beispielsweise bei der Wirkstoffforschung oder zur Aufdeckung der Auswirkungen von Variationen in Proteinsequenzen genutzt werden, da beide eng mit ihrer 3D-Konformation zusammenhängen.
Da SWISS-MODEL bekannte Strukturen ähnlicher Proteine als Leitfaden für die Vorhersage von Proteinstrukturen verwendet, kann es Modelle in spezifischen 3D-Konfigurationen liefern, die bei der Untersuchung der Proteinfunktion und der Interaktion mit anderen Molekülen hilfreich sind. Damit ergänzt es die neuesten Deep-Learning-basierten Methoden vorteilhaft und bietet deutliche Vorteile.
Haben Sie ein besonders spannendes Beispiel für eine Anwendung der Ressourcen?
In einem aktuellen Fall wurden mit SWISS-MODEL erstellte Modelle verwendet, um zwei Antikörper, die bei menschlichen Überlebenden des Ebola-Virus gefunden wurden, als potenzielle Therapie experimentell zu untersuchen. In einem anderen Beispiel wurden aus dem SWISS-MODEL-Archiv abgerufene Strukturen verwendet, um computergestützt vorherzusagen, welche Varianten von Proteinen Krankheiten verursachen können.
Jüngste Arbeiten, bei denen computergestützte Strukturen von Proteinen in eukaryotischen Zellen generiert wurden, die sich zu Komplexen zusammenlagern, wurden in ModelArchive hinterlegt, um sie der Community zugänglich zu machen. Die Komplexe in diesem Fall lieferten Einblicke in die biologische Funktion von Proteinen, die an verschiedenen wichtigen biologischen Prozessen beteiligt sind, von der DNA-Reparatur über die Zellteilung bis hin zum Stoffwechsel.
Wie sind diese Ressourcen dorthin gelangt, wo sie jetzt sind?
Beide Ressourcen blicken auf eine lange Geschichte zurück, die zu ihrer jüngsten Anerkennung auf europäischer Ebene geführt hat. SWISS-MODEL wurde vor 30 Jahren ins Leben gerufen und ist dank seiner benutzerfreundlichen Gestaltung und effizient implementierten Algorithmen heute eines der weltweit am häufigsten verwendeten webbasierten Proteinmodellierungssysteme für Forschung und Lehre.
ModelArchive wurde vor 10 Jahren gegründet und seitdem ist die Verfügbarkeit hochwertiger In-silico-Modelle gestiegen, insbesondere durch künstliche Intelligenz-basierte Methoden wie AlphaFold, das 2021 veröffentlicht wurde. In Kombination mit der Entwicklung von Richtlinien für die Speicherung vorhergesagter Strukturen hat dies zu einem erheblichen Wachstum von ModelArchive geführt, das nun mehr als eine halbe Million Modelle enthält.
Was ist es, das den Erfolg der SIB ermöglicht hat?
Die Unterstützung durch das SIB ist für die langfristige Stabilität und Zuverlässigkeit dieser offenen Ressourcen von entscheidender Bedeutung. Das SIB bietet die Möglichkeit, hochqualifizierte und erfahrene Mitarbeiter mit langfristigen Verträgen zu beschäftigen, wodurch das technische Wissen innerhalb unserer Gruppe erweitert wird. Die Aufnahme in die SIB-Ressourcen hat SWISS-MODEL und ModelArchive ein hohes Maß an Vertrauen eingebracht, was sich in ihrer Nutzung, ihrem Einfluss innerhalb der Life-Science-Community und dieser jüngsten europaweiten Anerkennung durch ELIXIR widerspiegelt. Die Zugehörigkeit zum schweizweiten Netzwerk des SIB erleichtert auch die Zusammenarbeit mit anderen SIB-Gruppen, was für die Nutzung des gesamten Wissens in der Community äußerst hilfreich ist. Diese Faktoren haben auch dazu beigetragen, dass ModelArchive eine Förderung zur Erweiterungder Prinzipien offener Forschungsdaten erhalten hat.
Reference(s)
Bannerbild: Proteinkomplexstruktur aus einer aktuellen Studie, gespeichert in ModelArchive