Mission de l'unité

L'unité Knowledge Representation du SIB interopère et intègre diverses données stockées dans plusieurs emplacements et formats, et développe des interfaces pionnières pour accéder rapidement à des bases de données interconnectées et les explorer.

Cela augmente la valeur des données des sciences de la vie en :

  • maximisant la réutilisation des données par les personnes et les systèmes d'IA
  • en reliant les connaissances au sein d'un même domaine et entre différents domaines
  • permettant une vision holistique des systèmes biologiques complexes
  • générant des informations plus pertinentes que celles obtenues à partir de bases de données individuelles.

L'unité est codirigée par Tarcisio Mendes de Farias et Ana-Claudia Sima et fait partie du groupe SIB Vital-IT Computational Biology au SIB Hub. Ses membres contribuent à un large éventail de projets de recherche suisses et internationaux impliquant des partenaires universitaires, hospitaliers et industriels, et collaborent au sein du réseau SIB afin d'améliorer les outils, les ressources et les découvertes en bioinformatique.

Découvrez les services de représentation des connaissances du SIB

Expertise en représentation des connaissances

L'équipe dispose d'une expertise approfondie dans les technologies du web sémantique pour décrire, structurer et relier de manière significative des données, ainsi que dans la création d'outils conviviaux permettant de récupérer efficacement des données et des informations dans plusieurs bases de données.

  • Ingénierie ontologique: développement d'ontologies (ou vocabulaires) lisibles par machine et de normes de métadonnées pour décrire les données biologiques et leurs relations, et application de celles-ci à des bases de données hétérogènes provenant de différentes sources, domaines et/ou emplacements.
  • Graphes de connaissances : structuration des métadonnées et des bases de données en réseaux intégrés de données liées qui interconnectent de manière transparente les informations stockées dans les différentes bases de données.
  • Interrogation de bases de données : utilisation de SPARQL et d'autres langages techniques de requête pour extraire et compiler des informations pertinentes à partir de grandes quantités de données complexes provenant de différentes sources.
  • Recherche sémantique et traitement du langage naturel : fournir des interfaces conviviales pour un accès, une récupération et une compilation rapides et faciles des données, en intégrant la représentation des connaissances à des technologies sophistiquées de recherche par mots-clés et d'IA générative basée sur des modèles linguistiques à grande échelle (LLM).

Faire progresser la découverte et la préservation des connaissances

L'unité de représentation des connaissances du SIB contribue à divers projets de données de pointe sur plusieurs sites en Suisse et à l'étranger, dont beaucoup sont financés par des subventions très compétitives, notamment du Fonds national suisse de la recherche scientifique (FNS), de swissuniversities, de The Loop Zurich et d'Horizon Europe.

  • Faire progresser le nuage européen pour la science ouverte (EOSC) : les projets multipartenaires EOSC EDEN, FIDELIS et EOSC Data Commons garantiront la préservation à long terme des ressources de données européennes et permettront la découverte, grâce à l'IA, de données et d'outils dans l'ensemble des résultats de la recherche européenne. FIDELIS implique également les équipes Biodata Resources et Training du SIB.

  • Permettre une oncologie de précision basée sur l'IA : le projet AI Tumor Board, mené en collaboration avec des hôpitaux suisses, convertit des directives PDF non structurées relatives aux soins contre le cancer en procédures de traitement structurées et interopérables, et développe un outil d'IA permettant d'analyser ces procédures ainsi que les données cliniques historiques afin de prédire le meilleur traitement pour chaque patient.

  • Promouvoir une agriculture durable et résiliente au climat : le projet européen MICROBES4CLIMATE met en place une infrastructure intégrée pour soutenir la recherche sur les interactions entre les micro-organismes du sol, les plantes et l'environnement. Cet effort multipartenaire inclut également le groupe Environmental Bioinformatics du SIB.

  • Relier les bases de données publiques et privées : coordonnée par le SIB, l'initiative européenne TRIPLE permet un niveau sans précédent de partage interopérable des données entre chercheurs de tous les domaines scientifiques, y compris des recherches intégrées dans des données de recherche publiques et privées. Cette initiative multipartenariale comprend également des membres du groupe Vital-IT Computational Biology, du groupe Swiss-Prot knowledgebases et du groupe SIB dirigé par Christophe Dessimoz et Natasha Glover

    L'unité de représentation des connaissances a également développé une méthode standard permettant au personnel de BASF, une entreprise leader dans le domaine de la protection des cultures, de trouver et d'accéder aux données produites et stockées par différents groupes internes et bases de données publiques.
  • Maintenir les ressources du SIB à la pointe de la technologie : le travail de l'unité pour développer, déployer et maintenir des graphes de connaissances hautement connectés pour les ressources du SIB a contribué à faire de Bgee, une base de données sur l'expression génétique développée par le groupe SIB dirigé par Marc Robinson-Rechavi et Frédéric Bastian, une ressource d'interopérabilité recommandée par ELIXIR.
  • Accélérer les découvertes en biologie et en bioinformatique : Les graphes de connaissances des ressources du SIB constituent également l'une des bases d'ExapsyGPT, un puissant outil d'IA générative qui permet d'explorer, de récupérer et de compiler plus rapidement et plus facilement que jamais des données et des informations pour répondre à des questions biologiques complexes. ExpasyGPT est le fruit d'une collaboration entre l'unité de représentation des connaissances et d'autres membres du groupe de biologie computationnelle Vital-IT, du groupe de travail sur le web sémantique du SIB et des membres des équipes des technologies de l'information et des ressources biodonnées. Groupe Vital-IT Computational Biology, du groupe de travail SIB Semantic Web of data et des membres des équipes Information Technology et Biodata Resources du SIB Hub.

    L'unité de représentation des connaissances développe également des méthodes et des outils pour diffuser automatiquement les données des ressources du SIB vers des bases de connaissances en sciences de la vie non SIB et des encyclopédies publiques telles que Wikipédia.

Membres

Voir Membres de l'unité de représentation des connaissances ici