Ces dernières années, les modèles de base sont apparus comme des outils puissants pour mettre en évidence les schémas, les relations et les propriétés statistiques complexes des molécules biologiques telles que les protéines, l'ADN et l'ARN. En tirant parti de ces modèles, les chercheurs sont sur le point de révolutionner la recherche en biologie moléculaire, ouvrant une nouvelle ère de découvertes et de compréhension dans ce domaine de la biologie, avec un potentiel pour le développement de nouveaux outils thérapeutiques et diagnostiques. Le groupe de discussion sur les modèles d'IA des biomolécules rassemble des membres du SIB intéressés par les modèles de base de l'ARN, de l'ADN et des protéines afin de partager et de discuter des derniers développements, des meilleures pratiques et des défis dans ce domaine, dans le but de faire progresser la science et l'application de ces modèles transformateurs.
À propos des groupes de discussion du SIB
Les groupes de discussion visent à favoriser les échanges de connaissances et les collaborations au sein de la communauté des 900 membres du SIB, autour de thèmes scientifiques spécifiques et/ou transversaux, allant du séquençage unicellulaire à l'égalité, la diversité et l'inclusion. Voir tous les groupes de discussion
Modèles fondamentaux pour les biomolécules
Les modèles de base représentent une avancée significative dans le domaine de l'apprentissage profond. Ils se caractérisent par des architectures de grande envergure, entraînées sur de vastes quantités de données non étiquetées afin de créer des représentations polyvalentes capables de résoudre une grande variété de tâches en aval. Les grands modèles linguistiques (LLM) pour le langage naturel, tels que ChatGPT, constituent des exemples parfaits de modèles de base. Ils sont souvent basés sur le Architecture Transformer qui leur permet de saisir les relations et les dépendances complexes au sein des séquences de texte. Ils ont ainsi ouvert une nouvelle ère de possibilités dans le domaine du traitement du langage naturel (NLP) en fournissant des représentations riches du texte ainsi que la capacité de générer un langage naturel nouveau mais fidèle.
À propos des groupes de discussion du SIB
Les groupes de discussion visent à favoriser les échanges de connaissances et les collaborations au sein de la communauté des 900 membres du SIB, autour de thèmes scientifiques spécifiques et/ou transversaux, allant du séquençage unicellulaire à l'égalité, la diversité et l'inclusion. Voir tous les groupes de discussion
En biologie, des modèles similaires se révèlent très prometteurs, en particulier pour prédire les structures et les fonctions. Contrairement aux modèles spécifiques à une tâche, souvent basés sur des réseaux neuronaux convolutifs qui excellent dans la reconnaissance de modèles locaux, ces modèles de base se distinguent par leur capacité à saisir des dépendances à plus long terme et des arrangements structurels complexes. Récemment, des modèles pour l'ADN, l'ARN et les protéines ont fait leur apparition. Les modèles fondamentaux d'ARN, par exemple, sont appelés à révolutionner la recherche sur l'ARN en révélant les modèles et les relations qui sous-tendent les structures secondaires et tertiaires, ainsi que les fonctions régulatrices, ouvrant la voie à une nouvelle ère de découvertes en biologie. Cependant, plusieurs défis doivent être relevés avant que cette technologie ne devienne une norme de recherche, notamment déchiffrer ce que ces modèles apprennent réellement, comprendre leurs limites, les utiliser efficacement et améliorer continuellement leurs capacités.
Objectifs du groupe de discussion
Le groupe de discussion« Modèles d'IA des biomolécules » rassemble les membres du SIB intéressés par les modèles fondamentaux pour l'omique afin de partager et de discuter des derniers développements, des meilleures pratiques et des défis dans ce domaine. Compte tenu de la rapidité des progrès et de la nécessité de se tenir informé des technologies transformatrices, ce groupe vise à favoriser la collaboration entre les experts du domaine et les informaticiens. En élargissant notre champ d'action aux chercheurs nationaux et internationaux, nous cherchons à créer une plateforme pour :
- Rester à jour : les modèles fondamentaux génomiques évoluant rapidement, il est difficile de suivre le rythme. Ce groupe vise à garantir que les membres du SIB et la communauté au sens large restent informés des derniers développements, en maintenant un réseau actif d'experts diversifiés afin de soutenir et de former la communauté suisse et au-delà.
- Partager les ressources : étant donné que les modèles fondamentaux d'ARN, d'ADN et de protéines nécessitent d'importantes ressources informatiques et énergétiques, ce groupe cherche à créer un réseau de groupes de recherche pouvant partager leurs ressources, afin de rendre ces modèles plus accessibles à l'ensemble de la communauté et d'en faire bénéficier le plus grand nombre.
- Promotion de la collaboration : le meilleur développement des modèles fondamentaux d'ARN, d'ADN et de protéines passe par une collaboration étroite entre les informaticiens et les experts du domaine. Ce groupe de réflexion vise à unir ces communautés en offrant une plateforme d'échange de connaissances par le biais de réunions mensuelles en personne et en ligne, au cours desquelles les membres du SIB peuvent présenter leurs expériences, examiner des articles pertinents et partager leurs dernières découvertes.
Nous encourageons les membres à participer activement en partageant leurs expériences avec les derniers outils, en examinant des articles et en contribuant au code d'un dépôt GitHub public dédié aux modèles de base ARN/ADN.
Le groupe rassemble actuellement 13 groupes de recherche SIB et membres associés inscrits sur le canal dédié #LLM-omics-meetings sur le Slack du SIB. Nous prévoyons de lancer notre première réunion mensuelle en septembre, suivie de réunions mensuelles comprenant à la fois une participation en personne et à distance. Nous prévoyons également d'inviter des conférenciers internationaux quatre fois par an.
Membres coordinateurs du groupe de discussion
- Raphaëlle Luisier, présidente (chef de groupe)
- Janna Hastings, coprésidente (chef de groupe)
- Vincent Jung, coprésident (doctorant)
- Charlotte Tumesheit, coprésidente (chercheuse postdoctorale)
Vous êtes membre du SIB et souhaitez rejoindre le groupe ? Contactez Raphaëlle Luisier ou Janna Hastings pour être ajouté au canal Slack et réserver une date pour une future présentation.