Michael Skinnider, professeur assistant à l'université de Princeton (États-Unis), a reçu le SIB Bioinformatics Early Career Award 2025 lors de la conférence [BC]2 à Bâle. Le jury a été particulièrement impressionné par l'originalité et l'ampleur de l'impact de ses recherches. Son travail fait le pont entre la biologie computationnelle et les approches expérimentales, du développement de nouvelles méthodes pour la protéomique et la métabolomique à l'application de la transcriptomique unicellulaire et spatiale en neurosciences. Il s'est entretenu avec nous après la cérémonie pour nous parler de l'importance de cette distinction.
Que ressent-on lorsqu'on est lauréat du prix au SIB ?
C'est formidable. Cela revêt une importance particulière pour moi, car plusieurs des anciens lauréats de ce prix et leurs travaux m'ont beaucoup inspiré et ont joué un rôle important dans ma carrière. C'est un honneur de faire partie de ce cercle.
Que signifie cette reconnaissance pour vous et vos recherches ?
C'est extrêmement important. En tant que chercheur en début de carrière, j'essaie encore de me faire un nom dans ce domaine. L'opportunité de présenter nos travaux devant tant de personnalités éminentes de la biologie computationnelle représente une chance fantastique d'y parvenir.
Il est également assez intimidant de se lancer dans une nouvelle direction de recherche, en particulier dans un domaine aussi restreint que la spectrométrie de masse computationnelle pour les petites molécules. Savoir que d'autres personnes trouvent ce travail intéressant est une grande validation qui nous incitera à poursuivre dans cette voie.
Pourquoi pensez-vous que des prix comme celui-ci sont importants pour la bioinformatique ?
Ces prix mettent particulièrement l'accent sur le développement de ressources et de logiciels, en plus des découvertes conventionnelles auxquelles de nombreuses autres institutions et communautés accordent de l'importance. J'ai par exemple été frappé par le fait que Robert Waterhouse [éd. Comité des prix SIB] m'ait présenté lors de la cérémonie de remise des prix en mentionnant que j'avais développé certains paquets Bioconductor. Il est formidable de mettre l'accent sur cet aspect, car c'est l'un des moyens les plus importants de contribuer à la bioinformatique et à la communauté des sciences de la vie en général.
Que souhaitez-vous partager au sujet des personnes, des collaborations ou même des ressources en bioinformatique qui ont rendu cela possible ?
Bonne question. Ce sont les ressources qui ont tout fait, pour ainsi dire. Tout d'abord, nous avions besoin d'accéder à une base de données sur le métabolisme pour entraîner notre modèle. Deuxièmement, notre travail de découverte de nouveaux métabolites s'est appuyé en partie sur des référentiels publics d'expériences métabolomiques que des chercheurs ont partagés publiquement avec le monde entier. Grâce à ces données, nous avons pu valider les prédictions concernant les nouveaux métabolites qui avaient été faites par calcul. Et troisièmement, nous nous sommes également appuyés sur des approches existantes d'apprentissage automatique, dont certaines ont été mises au point, par exemple, dans l'industrie pharmaceutique.
Nous nous appuyons sur les épaules de géants pour accomplir notre travail.
Un conseil pour les futures générations de bioinformaticiens ?
Mon conseil est de lire autant que possible. La lecture d'articles anciens, même vieux de plusieurs décennies, m'a beaucoup appris sur les pièges à éviter et l'importance de remettre en question les observations que l'on fait.
Quels sont vos intérêts de recherche actuels ?
Mon groupe s'intéresse de manière générale au développement de méthodes computationnelles permettant de découvrir de nouveaux métabolites. À mesure que nous obtenons de meilleurs résultats dans la découverte de métabolites, nous nous intéressons davantage à la caractérisation fonctionnelle de ces métabolites. Par exemple, nous cherchons à prédire à quelles enzymes ils pourraient se lier ou dans quels processus biologiques ils sont impliqués.
Un autre thème important est le développement de meilleurs modèles d'apprentissage automatique, par exemple à partir de données non étiquetées. Une grande partie de la puissance des grands modèles linguistiques tels que ChatGPT provient de l'entraînement sur des textes non étiquetés. En collaboration avec d'autres laboratoires à travers le monde, nous avons expérimenté des modèles d'entraînement à partir de données de spectrométrie de masse non étiquetées.