Ein Team unter der Leitung von Joana Pereira und Torsten Schwede am Biozentrum der Universität Basel und der SIB hat einen Schatz an uncharakterisierten Proteinen entdeckt. Dank der jüngsten Revolution im Bereich Deep Learning und einer speziellen Kickstarter-Förderung der SIB konnten sie Hunderte neuer Proteinfamilien entdecken, darunter eine neuartige Proteinfaltung. Die Studie wurde nun zusammen mit einer weiteren Studie der SIB-Gruppe um Pedro Beltrao an der ETH zu einem verwandten Thema in der Fachzeitschrift Nature veröffentlicht.

In den letzten Jahren hat AlphaFold die Proteinforschung revolutioniert. Dieses Tool der künstlichen Intelligenz (KI) wurde anhand von Proteindaten trainiert, die von Lebenswissenschaftlern über 50 Jahre hinweg gesammelt wurden, und ist in der Lage, die 3D-Form von Proteinen mit hoher Genauigkeit vorherzusagen. Sein Erfolg führte im vergangenen Jahr zur Modellierung von erstaunlichen 215 Millionen Proteinen und lieferte damit Einblicke in die Formen fast aller Proteine. Dies ist besonders interessant für Proteine, die noch nicht experimentell untersucht wurden, was ein komplexer und zeitaufwändiger Prozess ist.

„Es gibt mittlerweile viele Quellen für Proteininformationen, die wertvolle Einblicke in die Entwicklung und Funktionsweise von Proteinen liefern“, sagt Joana Pereira, Leiterin der Studie. Dennoch sah sich die Forschung lange Zeit mit einem Daten-Dschungel konfrontiert. Dem Forschungsteam um Torsten Schwede, Gruppenleiter am Biozentrum der Universität Basel, ist es nun gelungen, einen Teil der verborgenen Informationen zu entschlüsseln.

Aus der Vogelperspektive werden neue Proteinfamilien und -falten sichtbar

Die Forscher haben ein interaktives Netzwerk aus 53 Millionen Proteinen mit hochwertigen AlphaFold-Strukturen aufgebaut. „Dieses Netzwerk ist eine wertvolle Quelle für die theoretische Vorhersage unbekannter Proteinfamilien und ihrer Funktionen in großem Maßstab“, betont Janani Durairaj, Erstautorin der Studie. Das Team konnte 290 neue Proteinfamilien und eine neue Proteinfaltung identifizieren, die der Form einer Blume ähnelt.

Aufbauend auf der Expertise der Schwede-Gruppe in der Entwicklung und Pflege der führenden Software SWISS-MODEL, die von der SIB unterstützt wird, stellten sie das Netzwerk als interaktive Webressource unter dem Namen «Protein Universe Atlas» zur Verfügung.

Mehr über unser Portfolio an führender Software und Datenbanken

Eine von zwei bahnbrechenden Veröffentlichungen der SIB-Gruppen zur Erforschung der dunklen Materie der Proteine

Die hier beschriebene Arbeit ist eine von zwei Arbeiten, die von Gruppen am SIB zu diesem Thema veröffentlicht werden. Mit einem komplementären Ansatz, der sich eher auf die Proteinstruktur als auf Sequenzen stützt, schlägt das Team von Pedro Beltrao an der ETH Zürich und das Team von Martin Steinegger und der Seoul National University eine effiziente Methode zur Clusterung der in der AlphaFold-Datenbank vorhandenen Proteine vor. Ihr wichtigstes Ergebnis war die Ermittlung der Anzahl verschiedener Proteinstrukturen, der Anzahl der noch wenig erforschten Strukturen und der Zeitpunkt ihrer Entstehung im Laufe der Evolution. Beide Artikel wurden in einem Interview in Nature vorgestellt .

Künstliche Intelligenz als wertvolles Werkzeug in der Forschung

Das Team hat Deep-Learning-basierte Tools eingesetzt, um in diesem Netzwerk Neuheiten zu finden, und damit den Weg für Innovationen in den Lebenswissenschaften von der Grundlagenforschung bis zur angewandten Forschung geebnet. „Das Verständnis der Struktur und Funktion von Proteinen ist in der Regel einer der ersten Schritte, um beispielsweise ein neues Medikament zu entwickeln oder deren Funktionen durch Protein-Engineering zu modifizieren“, sagt Pereira. Die Arbeit wurde durch einen „Kickstarter“-Zuschuss der SIB unterstützt, um den Einsatz von KI in den Lebenswissenschaften zu fördern. Sie unterstreicht das transformative Potenzial von Deep Learning und intelligenten Algorithmen in der Forschung.

Mit dem Protein Universe Atlas können Wissenschaftler nun mehr über Proteine erfahren, die für ihre Forschung relevant sind. „Wir hoffen, dass diese Ressource nicht nur Forschern und Biokuratoren, sondern auch Studenten und Lehrern helfen wird, indem sie eine neue Plattform für das Lernen über die Vielfalt von Proteinen bietet, von der Struktur über die Funktion bis hin zur Evolution“, sagt Durairaj.

Das interaktive Netzwerk ist weltweit frei zugänglich unter:

Lesen Sie die Nachricht auf Deutsch

Reference(s)

Durairaj J et alEntdeckung neuer Familien und Faltungen im Universum der natürlichen Proteine.  Nature. Online veröffentlicht am 13. September 2023. 

Barrio-Hernandez I et al. Clustering-vorhergesagte Strukturen auf der Ebene des bekannten Proteinspekterums. Nature. Online veröffentlicht am 13. September 2023.