Konzentration auf die Mission der Gruppe

Die Swiss-Prot-Gruppe unter der gemeinsamen Leitung von Alan Bridge und Paul Thomas zeichnet sich durch die Generierung maschinenlesbarer biologischer Erkenntnisse aus der ständig wachsenden Zahl wissenschaftlicher Publikationen aus. Das Team nutzt die Leistungsfähigkeit von Deep-Learning-Methoden, um die Literaturauswertung und Datenextraktion zu beschleunigen und den Nutzern so zeitnah die genauesten und umfassendsten Informationen zu liefern.

Jährliche Kennzahlen

Über 150.000 Verweise auf Ressourcen von in wissenschaftlichen Publikationen

Über 180. 000 Erwähnungen der Ressource in Patenten

Über 8 Millionen Nutzer der Ressource pro Jahr

Quellen und Nutzerdefinitionen: lens.org, Web of Science, PubMed, Google Analytics, Matomo

Entdeckungen durch renommierte Biodatenressourcen ermöglichen

Die von den Biokuratoren und Softwareentwicklern der Gruppe fachmännisch kuratierten, miteinander verknüpften Wissensressourcen sind international für ihre grundlegende Bedeutung für die Forschung und Innovation im Bereich der Biowissenschaften anerkannt und werden in Anwendungen von der biologischen Sanierung kontaminierter Böden bis hin zur Arzneimittelforschung und -entwicklung eingesetzt.

  • UniProtKB/Swiss-Prot ist die weltweit am häufigsten genutzte Protein-Informationsquelle und als das SIB, ELIXIR Core Data Resource und globale Kerndatenressource anerkannt.
  • Rhea, eine Datenbank für biochemische Reaktionen, ist als das SIB-Ressource, ELIXIR Core Data Resource und globale Kern-Datenressource anerkannt.
  • Gene Ontology (GO) ist eine wichtige Informationsquelle zur Genfunktion und als globale Kerndatenressource anerkannt.
  • SwissLipids, eine Datenbank für Lipidstrukturen und biologisches Wissen, ist als Ressource des SIB anerkannt.
  • HAMAP und PROSITE sind weit verbreitete Datenbanken für Proteinfamilien und -domänen.
  • Die weit verbreitete ENZYME- Datenbank liefert Informationen zur Enzymnomenklatur.
  • ViralZone bietet Informationen zu allen Virusgattungen und -familien.
  • SwissBioPics bietet eine Bibliothek interaktiver Zellbilder.

Die Swiss-Prot-Gruppe unterstützt auch die kundenspezifische Entwicklung von Tools und Ressourcen für Forscher und Kliniker.

Erfahren Sie mehr über unsere Dienstleistungen im Bereich Biokuration und Softwareentwicklung

KI mit maschinenlesbarem biologischem Wissen unterstützen

Wissensdatenbanken aus den Lebenswissenschaften sind ebenfalls ein wesentlicher Bestandteil des KI-Ökosystems. Das darin enthaltene kollektive biologische Wissen – in Form von Molekülsequenzen und -strukturen, biochemischen Stoffwechselwegen und den Beziehungen zwischen diesen – kann zum Trainieren und Feinabstimmen von KI-Systemen verwendet werden, die komplexe biologische Mechanismen aufdecken und umsetzbare Erkenntnisse generieren.

Die von der Swiss-Prot-Gruppe entwickelten Swiss-Prot-Knowledgebases haben zu folgenden Entwicklungen beigetragen:

  • das mit dem Nobelpreis 2024 ausgezeichnete AlphaFold-Modell zur Vorhersage von Proteinstrukturen, das durch die Analyse von Hunderten Millionen Proteinen in UniProt gelernt hat, Beziehungen zwischen Aminosäuresequenzen und 3D-Strukturen zu identifizieren (siehe KI-Fokus im SIB Profile 2025);
  • einem Large Language Model (LLM) zur Verbesserung der mRNA-Impfstoffverabreichung, das mit SwissLipids trainiert wurde (Quelle: Bioinformatik, 2024);
  • ein LLM zur Entwicklung neuer Proteine mit gewünschten Funktionen, das mit dem fachmännisch kuratierten Teil UniProtKB/Swiss-Prot von UniProt trainiert wurde (Quelle: Nature Biotechnology, 2023);

Die Gruppe entwickelte außerdem einen Benchmarking-Datensatz, EnzChemRED, zur Feinabstimmung von LLMs für die spezialisierte Datenkuratierung – dieser wurde als Remarkable Output des SIB anerkannt. Das Team nutzt den Datensatz, um die Biokuratierungsbemühungen für die Wissensdatenbanken UniProt und Rhea zu steuern.

Mitglieder

Sehen Sie sich diehier