Konzentration auf die Mission der Gruppe
Die Swiss-Prot-Gruppe unter der gemeinsamen Leitung von Alan Bridge und Paul Thomas zeichnet sich durch die Generierung maschinenlesbarer biologischer Erkenntnisse aus der ständig wachsenden Zahl wissenschaftlicher Publikationen aus. Das Team nutzt die Leistungsfähigkeit von Deep-Learning-Methoden, um die Literaturauswertung und Datenextraktion zu beschleunigen und den Nutzern so zeitnah die genauesten und umfassendsten Informationen zu liefern.
Jährliche Kennzahlen
Über 150.000 Verweise auf Ressourcen von in wissenschaftlichen Publikationen
Über 180. 000 Erwähnungen der Ressource in Patenten
Über 8 Millionen Nutzer der Ressource pro Jahr
Quellen und Nutzerdefinitionen: lens.org, Web of Science, PubMed, Google Analytics, Matomo
Entdeckungen durch renommierte Biodatenressourcen ermöglichen
Die von den Biokuratoren und Softwareentwicklern der Gruppe fachmännisch kuratierten, miteinander verknüpften Wissensressourcen sind international für ihre grundlegende Bedeutung für die Forschung und Innovation im Bereich der Biowissenschaften anerkannt und werden in Anwendungen von der biologischen Sanierung kontaminierter Böden bis hin zur Arzneimittelforschung und -entwicklung eingesetzt.
- UniProtKB/Swiss-Prot ist die weltweit am häufigsten genutzte Protein-Informationsquelle und als das SIB, ELIXIR Core Data Resource und globale Kerndatenressource anerkannt.
- Rhea, eine Datenbank für biochemische Reaktionen, ist als das SIB-Ressource, ELIXIR Core Data Resource und globale Kern-Datenressource anerkannt.
- Gene Ontology (GO) ist eine wichtige Informationsquelle zur Genfunktion und als globale Kerndatenressource anerkannt.
- SwissLipids, eine Datenbank für Lipidstrukturen und biologisches Wissen, ist als Ressource des SIB anerkannt.
- HAMAP und PROSITE sind weit verbreitete Datenbanken für Proteinfamilien und -domänen.
- Die weit verbreitete ENZYME- Datenbank liefert Informationen zur Enzymnomenklatur.
- ViralZone bietet Informationen zu allen Virusgattungen und -familien.
- SwissBioPics bietet eine Bibliothek interaktiver Zellbilder.
Die Swiss-Prot-Gruppe unterstützt auch die kundenspezifische Entwicklung von Tools und Ressourcen für Forscher und Kliniker.
Erfahren Sie mehr über unsere Dienstleistungen im Bereich Biokuration und Softwareentwicklung
KI mit maschinenlesbarem biologischem Wissen unterstützen
Wissensdatenbanken aus den Lebenswissenschaften sind ebenfalls ein wesentlicher Bestandteil des KI-Ökosystems. Das darin enthaltene kollektive biologische Wissen – in Form von Molekülsequenzen und -strukturen, biochemischen Stoffwechselwegen und den Beziehungen zwischen diesen – kann zum Trainieren und Feinabstimmen von KI-Systemen verwendet werden, die komplexe biologische Mechanismen aufdecken und umsetzbare Erkenntnisse generieren.
Die von der Swiss-Prot-Gruppe entwickelten Swiss-Prot-Knowledgebases haben zu folgenden Entwicklungen beigetragen:
- das mit dem Nobelpreis 2024 ausgezeichnete AlphaFold-Modell zur Vorhersage von Proteinstrukturen, das durch die Analyse von Hunderten Millionen Proteinen in UniProt gelernt hat, Beziehungen zwischen Aminosäuresequenzen und 3D-Strukturen zu identifizieren (siehe KI-Fokus im SIB Profile 2025);
- einem Large Language Model (LLM) zur Verbesserung der mRNA-Impfstoffverabreichung, das mit SwissLipids trainiert wurde (Quelle: Bioinformatik, 2024);
- ein LLM zur Entwicklung neuer Proteine mit gewünschten Funktionen, das mit dem fachmännisch kuratierten Teil UniProtKB/Swiss-Prot von UniProt trainiert wurde (Quelle: Nature Biotechnology, 2023);
Die Gruppe entwickelte außerdem einen Benchmarking-Datensatz, EnzChemRED, zur Feinabstimmung von LLMs für die spezialisierte Datenkuratierung – dieser wurde als Remarkable Output des SIB anerkannt. Das Team nutzt den Datensatz, um die Biokuratierungsbemühungen für die Wissensdatenbanken UniProt und Rhea zu steuern.
- UniProt Consortium. UniProt: die universelle Protein-Wissensdatenbank im Jahr 2025. Nucleic Acids Research, Band 53, Ausgabe D1, 6. Januar 2025, D609–D617, https://doi.org/10.1093/nar/gkae1010
- Bolleman J. et al. Eine große Sammlung von Bioinformatik-Frage-Antwort-Paaren über föderierte Wissensgraphen: Methodik und Anwendungen. Gigascience 2025, 16. Mai; 14:giaf045. doi: 10.1093/gigascience/giaf045
- Feuermann M. et al. Ein Kompendium menschlicher Genfunktionen, abgeleitet aus evolutionären Modellen. Nature 640, 146–154 (2025). https://doi.org/10.1038/s41586-025-08592-0
- Blum M. et al. InterPro: die Ressource zur Klassifizierung von Proteinsequenzen im Jahr 2025. Nucleic Acids Research, Band 53, Ausgabe D1, 6. Januar 2025, Seiten D444–D456, https://doi.org/10.1093/nar/gkae1082
- Feuermann M, Gaudet P. Interpreting Gene Ontology Annotations Derived from Sequence Homology Methods. Methods Mol Biol. 2024:2836:285-298. doi: 10.1007/978-1-0716-4007-4_15.
- Lai PT, Coudert E, Aimo L, Axelsen K, Breuza L, de Castro E, Feuermann M, Morgat A, Pourcel L, Pedruzzi I, Poux S, Redaschi N, Rivoire C, Sveshnikova A, Wei CH, Leaman R, Luo L, Lu Z, Bridge A. EnzChemRED, ein umfangreicher Datensatz zur Extraktion von Beziehungen in der Enzymchemie. Sci Data 2024 Sep 9;11(1):982. doi: 10.1038/s41597-024-03835-7.
- Ross KE, Bastian FB, Buys M, Cook CE, D'Eustachio P, Harrison M, Hermjakob H, Li D, Lord P, Natale DA, Peters B, Sternberg PW, Su AI, Thakur M, Thomas PD, Bateman A, UniProt Consortium. Perspektiven zur Verfolgung der Wiederverwendung von Daten in Biodatenressourcen. Bioinformatik-Fortschritte, 25. April 2024, 4(1):vbae057. https://doi.org/10.1093/bioadv/vbae057.
- SIB Swiss Institute of Bioinformatics RDF Group Members. Das SIB Swiss Institute of Bioinformatics Semantic Web of data. Nucleic Acids Res. 5. Januar 2024; 52(D1):D44-D51. doi: 10.1093/nar/gkad902.
- Witting M, Malik A, Leach A, Bridge A, Aimo L, Conroy MJ, O'Donnell VB, Hoffmann N, Kopczynski D, Giacomoni F, Paulhe N, Gassiot AC, Poupin N, Jourdan F, Bertrand-Michel J. Herausforderungen und Perspektiven für die Benennung von Lipiden im Kontext der Lipidomik. Metabolomics. 24. Januar 2024; 20(1):15. doi: 10.1007/s11306-023-02075-x.
- UniProt-Konsortium. UniProt: die universelle Protein-Wissensdatenbank im Jahr 2025. Nucleic Acids Research. November 2024;. DOI: 10.1093/nar/gkae1010.
- Bowler-Barnett EH, Fan J, Luo J, Magrane M, Martin MJ, Orchard S, UniProt Consortium. UniProt und massenspektrometriebasierte Proteomik – eine wechselseitige Arbeitsbeziehung. Mol Cell Proteomics. August 2023; 22(8):100591. doi: 10.1016/j.mcpro.2023.100591. Epub 8. Juni 2023. Review.
- Coudert E, Gehant S, de Castro E, Pozzato M, Baratin D, Neto T, Sigrist CJA, Redaschi N, Bridge A; UniProt Consortium. Annotation biologisch relevanter Liganden in UniProtKB unter Verwendung von ChEBI. Bioinformatik. 1. Januar 2023; 39(1):btac793. doi: 10.1093/bioinformatics/btac793.
- Gene Ontology Consortium. Die Gene Ontology-Wissensdatenbank im Jahr 2023. Genetics. 4. Mai 2023;224(1):iyad031. doi: 10.1093/genetics/iyad031.
- Insana G, Ignatchenko A, Martin M, Bateman A, UniProt Consortium. MBDBMetrics: ein Online-Metrik-Tool zur Messung der Auswirkungen biologischer Datenressourcen. Bioinform Adv. 2023;3(1):vbad180. doi: 10.1093/bioadv/vbad180. eCollection 2023.
- Lussi YC, Magrane M, Martin MJ, Orchard S, UniProt Consortium. Suche und Navigation in UniProt-Datenbanken. Curr Protoc. März 2023;3(3):e700. doi: 10.1002/cpz1.700.
- Ni Z, Wölk M, Jukes G, Mendivelso Espinosa K, Ahrends R, Aimo L, Alvarez-Jarreta J, Andrews S, Andrews R, Bridge A, Clair GC, Conroy MJ, Fahy E, Gaud C, Goracci L, Hartler J, Hoffmann N, Kopczyinski D, Korf A, Lopez-Clavijo AF, Malik A, Ackerman JM, Molenaar MR, O'Donovan C, Pluskal T, Shevchenko A, Slenter D, Siuzdak G, Kutmon M, Tsugawa H, Willighagen EL, Xia J, O'Donnell VB, Fedorova M. Leitfaden zur Auswahl von Informatiksoftware und -tools für Anwendungen in der Lipidomikforschung. Nat Methods. Februar 2023; 20(2):193-204. doi: 10.1038/s41592-022-01710-0. Epub 21. Dezember 2022.
- UniProt Consortium. UniProt: die universelle Protein-Wissensdatenbank im Jahr 2023. Nucleic Acids Research. Januar 2023; 51(D1):D523-D531. DOI: 10.1093/nar/gkac1052.
- Yamada T, Maeda M, Nagai H, Salamin K, Chang Y-T, Guenova E, Feuermann M, Monod M . Zwei verschiedene Arten von Tandemsequenzen vermitteln die Überexpression von TinCYP51B in Azol-resistentem Trichophyton indotineae. Antimicrob Agents Chemother 2023 Nov 15;67(11):e0093323. doi: 10.1128/aac.00933-23. Epub 2023 Oct 12.
- Zaru R, Orchard S, UniProt Consortium. UniProt Tools: BLAST, Align, Peptide Search und ID Mapping. Curr Protoc.2023 Mar;3(3):e697. doi: 10.1002/cpz1.697.
- Bansal P, Morgat A, Axelsen KB, Muthukrishnan V, Coudert E, Aimo L, Hyka-Nouspikel N, Gasteiger E, Kerhornou A, Neto TB, Pozzato M, Blatter MC, Ignatchenko A, Redaschi N, Bridge A. Rhea, die Reaktionswissensdatenbank im Jahr 2022. Nucleic Acids Res. 7. Januar 2022; 50(D1):D693-D700. doi: 10.1093/nar/gkab1016.
- Le Mercier P, Bolleman J, de Castro E, Gasteiger E, Bansal P, Auchincloss AH, Boutet E, Breuza L, Casals-Casas C, Estreicher A, Feuermann M, Lieberherr D, Rivoire C, Pedruzzi I, Redaschi N, Bridge A. SwissBioPics – eine interaktive Bibliothek mit Zellbildern zur Visualisierung subzellulärer Lokalisierungsdaten. Datenbank (Oxford). 12. April 2022:2022:baac026. doi: 10.1093/database/baac026.
- Paysan-Lafosse T, Blum M, Chuguransky S, Grego T, Pinto BL, Salazar GA, Bileschi ML, Bork P, Bridge A, Colwell L, Gough J, Haft DH, Letunić I, Marchler-Bauer A, Mi H, Natale DA, Orengo CA, Pandurangan AP, Rivoire C, Sigrist CJA, Sillitoe I, Thanki N, Thomas PD, Tosatto SCE, Wu CH, Bateman A. InterPro im Jahr 2022. Nucleic Acids Res. 6. Januar 2023;51(D1):D418-D427. doi: 10.1093/nar/gkac993.
- Yamada T, Yaguchi T, Maeda M, Alshahni MM, Salamin K, Guenova E, Feuermann M, Monod M. Genamplifikation von CYP51B: ein neuer Mechanismus der Resistenz gegen Azolverbindungen in Trichophyton indotineae. Antimicrob Agents Chemother. 21. Juni 2022;66(6):e0005922. doi: 10.1128/aac.00059-22. Epub 12. Mai 2022.
- Feuermann M, Boutet E, Morgat A, Axelsen KB, Bansal P, Bolleman J, de Castro E, Coudert E, Gasteiger E, Géhant S, Lieberherr D, Lombardot T, Neto TB, Pedruzzi I, Poux S, Pozzato M, Redaschi N, Bridge A, im Namen des UniProt-Konsortiums. Diverse Taxonomien für diverse Chemikalien: Verbesserte Darstellung des Metabolismus natürlicher Produkte in UniProtKB. Metaboliten [Internet]. 12. Januar 2021; 11(1). Verfügbar unter: http://dx.doi.org/10.3390/metabo11010048.
- Hufsky F, Lamkiewicz K, Almeida A, Aouacheria A, Arighi C, Bateman A, Baumbach J, Beerenwinkel N, Brandt C, Cacciabue M, Chuguransky S, Drechsel O, Finn RD, Fritz A, Fuchs S, Hattab G, Hauschild AC, Heider D, Hoffmann M, Hölzer M, Hoops S, Kaderali L, Kalvari I, von Kleist M, Kmiecinski R, Kühnert D, Lasso G, Libin P, List M, Löchel HF, Martin MJ, Martin R, Matschinske J, McHardy AC, Mendes P, Mistry J, Navratil V., Nawrocki EP., O'Toole ÁN., Ontiveros-Palacios N., Petrov AI., Rangel-Pineros G., Redaschi N., Reimering S., Reinert K., Reyes A., Richardson L., Robertson DL., Sadegh S., Singer JB., Theys K., Upton C., Welzel M, Williams L, Marz M. Computergestützte Strategien zur Bekämpfung von COVID-19: nützliche Werkzeuge zur Beschleunigung der SARS-CoV-2- und Coronavirus-Forschung. Brief Bioinform. 22. März 2021; 22(2):642-663. doi: 10.1093/bib/bbaa232.
- UniProt Consortium. UniProt: die universelle Protein-Wissensdatenbank im Jahr 2021. Nucleic Acids Res. 8. Januar 2021; 49(D1):D480–D489. doi: 10.1093/nar/gkaa1100
- Wang Y, Wang Q, Huang H, Huang W, Chen Y, McGarvey PB, Wu CH, Arighi CN, UniProt Consortium. Eine Crowdsourcing-Plattform für die Literaturkuratierung in UniProt. PLoS Biology. Dezember 2021; 19(12):e3001464. DOI: 10.1371/journal.pbio.3001464.
- Yamada T, Yaguchi T, Salamin K, Guenova E, Feuermann M, Monod M. MFS1, ein pleiotroper Transporter in Dermatophyten, der eine Schlüsselrolle bei ihrer intrinsischen Resistenz gegen Chloramphenicol und Fluconazol spielt. J Fungi (Basel). 7. Juli 2021; 7(7):542. doi: 10.3390/jof7070542.
- Yamada T, Yaguchi T, Tamura T, Pich C, Salamin K, Feuermann M, Monod M. Itraconazol-Resistenz von Trichophyton rubrum, vermittelt durch den ABC-Transporter TruMDR2. Mycoses. August 2021; 64(8):936-946. doi: 10.1111/myc.13286. Epub 25. April 2021.
- Bolleman J, de Castro E, Baratin D, Gehant S, Cuche BA, Auchincloss AH, Coudert E, Hulo C, Masson P, Pedruzzi I, Rivoire C, Xenarios I, Redaschi N, Bridge A. HAMAP als SPARQL-Regeln – Eine portable Annotationspipeline für Genome und Proteome. Gigascience 2020, 9(2):giaa003. doi: 10.1093/gigascience/giaa003
- Breuza L, Arighi CN, Argoud-Puy G, Casals-Casas C, Estreicher A, Famiglietti ML, Georghiou G, Gos A, Gruaz-Gumowski N, Hinz U, Hyka-Nouspikel N, Kramarz B, Lovering RC, Lussi Y, Magrane M, Masson P, Perfetto L, Poux S, Rodriguez-Lopez M, Stoeckert C, Sundaram S, Wang L-S, Wu E, Orchard S, IMEx Consortium, UniProt Consortium: Ein koordinierter Ansatz öffentlicher Bioinformatik-Ressourcen zur Unterstützung des Kampfes gegen die Alzheimer-Krankheit durch fachkundige Kuratierung wichtiger Protein-Targets. J. Alzheimers Dis. 2020. doi: 10.3233/JAD-200206
- Bye-A-Jee H, Zaru R, Magrane M, Orchard S, UniProt Consortium. Caenorhabditis elegans phosphatase complexes in UniProtKB and Complex Portal. FEBS J. 2020, 287: 2664-2684. doi: 10.1111/febs.15213
- Drysdale R, Cook CE, Petryszak R, Baillie-Gerritsen V, Barlow M, Gasteiger E, Gruhl F, Haas J, Lanfear J, Lopez R, Redaschi N, Stockinger H, Teixeira D, Venkatesan A; Elixir Core Data Resource Forum; Blomberg N, Durinx C, McEntyre J. Die ELIXIR Core Data Resources: grundlegende Infrastruktur für die Lebenswissenschaften. Bioinformatik. 15. April 2020; 36(8):2636-2642. doi: 10.1093/bioinformatics/btz959.
- MacDougall A, Volynkin V, Saidi R, Poggioli D, Zellner H, Hatton-Ellis E, Joshi V, O'Donovan C, Orchard S, Auchincloss AH, Baratin D, Bolleman J, Coudert E, de Castro E, Hulo C, Masson P, Pedruzzi I, Rivoire C, Arighi C, Wang Q, Chen C, Huang H, Garavelli J, Vinayaka CR, Yeh LS, Natale DA, Laiho K, Martin M, UniProt Consortium. UniRule: eine einheitliche Regelressource für die automatische Annotation in der UniProt-Wissensdatenbank. Bioinformatik 2020. doi: 10.1093/bioinformatics/btaa485
- Morgat A, Lombardot T, Coudert E, Axelsen K, Batista Neto T, Gehant S, Bansal P, Bolleman J, Gasteiger E, de Castro E, Baratin D, Pozzato M, Xenarios I, Poux S, Redaschi N, Bridge A, UniProt Consortium. Enzymannotation in UniProtKB unter Verwendung von Rhea. Bioinformatik 2020, 36(6): 1896-1901. doi: 10.1093/bioinformatics/btz817
- Porras P, Barrera E, Bridge A, Del-Toro N, Cesareni G, Duesbury M, Hermjakob H, Iannuccelli M, Jurisica I, Kotlyar M, Licata L, Lovering RC, Lynn DJ, Meldal B, Nanduri B, Paneerselvam K, Panni S, Pastrello C, Pellegrini M, Perfetto L, Rahimzadeh N, Ratan P, Ricard-Blum S, Salwinski L, Shirodkar G, Shrivastava A, Orchard S. Auf dem Weg zu einem einheitlichen Open-Access-Datensatz molekularer Interaktionen. Nat Commun. 1. Dezember 2020; 11(1):6144. doi: 10.1038/s41467-020-19942-z
- Touré V, Vercruysse S, Acencio ML, Lovering RC, Orchard S, Bradley G, Casals-Casas C, Chaouiya C, Del-Toro N, Flobak Å, Gaudet P, Hermjakob H, Hoyt CT, Licata L, Lægreid A, Mungall CJ, Niknejad A, Panni S, Perfetto L, Porras P, Pratt D, Saez-Rodriguez J, Thieffry D, Thomas PD, Türei D, Kuiper M. Die Mindestinformationen über eine kausale Aussage zu molekularen Wechselwirkungen (MI2CAST). Bioinformatik 2020. doi: 10.1093/bioinformatics/btaa622
- Wood V, Carbon S, Harris MA, Lock A, Engel SR, Hill DP, Van Auken K, Attrill H, Feuermann M, Gaudet P, Lovering RC, Poux S, Rutherford KM, Mungall CJ. Term Matrix: ein neuartiges System zur Qualitätskontrolle von Gene Ontology-Annotationen auf der Grundlage von Co-Annotationsmustern ontologischer Begriffe. Open Biol. September 2020; 10(9):200149. doi: 10.1098/rsob.200149. Epub 2. September 2020.
Mitglieder
Sehen Sie sich diehier