Michael Skinnider, Assistenzprofessor an der Princeton University (USA), erhielt den SIB Bioinformatik Early Career Award 2025 auf der [BC]2 -Konferenz in Basel. Die Jury war besonders beeindruckt von der Originalität und Tragweite seiner Forschung. Seine Arbeit verbindet computergestützte Biologie und experimentelle Ansätze, von der Entwicklung neuer Methoden für die Proteomik und Metabolomik bis hin zur Anwendung von Einzelzell- und räumlicher Transkriptomik in den Neurowissenschaften. Nach der Zeremonie nahm er sich Zeit für ein Gespräch mit uns, um uns über die Bedeutung dieser Auszeichnung zu berichten.
Wie fühlt es sich an, ein SIB-Preisträger zu sein?
Es fühlt sich großartig an. Für mich ist es besonders bedeutsam, da mehrere der bisherigen Preisträger und ihre Arbeit für mich sehr inspirierend und wichtig waren. Es ist eine Ehre, in derselben Gesellschaft zu sein.
Was bedeutet diese Anerkennung für Sie und Ihre Forschung?
Sie ist äußerst wichtig. Als Nachwuchswissenschaftler versuche ich noch, mir in diesem Bereich einen Namen zu machen. Die Möglichkeit, vor so vielen führenden Persönlichkeiten der computergestützten Biologie zu präsentieren und unsere Arbeit vorzustellen, ist eine fantastische Chance, dies zu erreichen.
Es ist auch ziemlich einschüchternd, eine neue Forschungsrichtung einzuschlagen, insbesondere in einem kleineren Bereich wie der computergestützten Massenspektrometrie für kleine Moleküle. Zu wissen, dass andere Menschen diese Arbeit interessant finden, ist eine großartige Bestätigung, die uns anspornen wird, diese Arbeit weiter voranzutreiben.
Warum sind Auszeichnungen wie diese Ihrer Meinung nach für die Bioinformatik wichtig?
Diese Auszeichnungen legen einen ungewöhnlichen Schwerpunkt auf die Entwicklung von Ressourcen und Software, zusätzlich zu den herkömmlichen Entdeckungen, die viele andere Institutionen und Gemeinschaften schätzen. Ich fand es zum Beispiel bemerkenswert, dass Robert Waterhouse [Anm. d. Red.: SIB-Auszeichnungskomitee] mich bei der Preisverleihung vorstellte und erwähnte, dass ich einige Bioconductor-Pakete entwickelt habe. Diese Betonung ist großartig, da dies eine der wichtigsten Möglichkeiten ist, einen Beitrag zur Bioinformatik und zur breiteren Life-Science-Gemeinschaft zu leisten.
Was möchten Sie über die Menschen, Kooperationen oder sogar Bioinformatik-Ressourcen erzählen, die dies ermöglicht haben?
Gute Frage. Es sind sozusagen durchweg Ressourcen. Erstens brauchten wir Zugang zu einer Stoffwechsel-Datenbank, um unser Modell zu trainieren. Zweitens stützte sich unsere Arbeit zum Entdecken neuer Metaboliten zum Teil auf öffentliche Repositorien von Metabolomik-Experimenten, die Forscher öffentlich mit der Welt geteilt haben. Anhand dieser Daten konnten wir Vorhersagen über neue Metaboliten validieren, die computergestützt erstellt worden waren. Und drittens bauten wir auch auf bestehenden Ansätzen des maschinellen Lernens auf – von denen einige beispielsweise in der pharmazeutischen Industrie Pionierarbeit geleistet haben.
Wir stehen auf den Schultern von Giganten, um unsere Arbeit zu erledigen.
Haben Sie einen Rat für die zukünftigen Generationen von Bioinformatikern?
Mein Rat ist, so viel wie möglich zu lesen. Durch das Lesen älterer, sogar jahrzehntealter Artikel habe ich viel über Fallstricke gelernt und darüber, wie wichtig es ist, die eigenen Beobachtungen zu hinterfragen.
Was sind Ihre aktuellen Forschungsinteressen?
Meine Gruppe interessiert sich allgemein für die Entwicklung computergestützter Methoden, um neue Metaboliten zu entdecken. Da wir beim Entdecken von Metaboliten zunehmend erfolgreich sind, richtet sich unser Augenmerk nun auf die funktionelle Charakterisierung dieser Metaboliten. Zum Beispiel darauf, vorherzusagen, an welche Enzyme sie binden könnten oder an welchen biologischen Prozessen sie beteiligt sind.
Ein weiteres großes Thema ist die Entwicklung besserer Modelle für maschinelles Lernen, beispielsweise durch das Lernen aus unbeschrifteten Daten. Ein Großteil der Leistungsfähigkeit großer Sprachmodelle wie ChatGPT beruht auf dem Training mit unbeschrifteten Texten. Zusammen mit anderen Labors auf der ganzen Welt haben wir mit dem Training von Modellen mit unbeschrifteten Massenspektrometriedaten experimentiert.