Deux autres ressources développées par des groupes du SIB ont été désignées comme étant d'une importance cruciale pour les sciences de la vie, à l'issue de la dernière édition du processus de sélection mené par ELIXIR au niveau européen : Cellosaurus – une encyclopédie des lignées cellulaires – développée par Amos Bairoch à l'Université de Genève dans le cadre du groupe CALIPHO, et Rhea – une base de connaissances sur les réactions biochimiques – développée par le groupe Swiss-Prot dirigé par Alan Bridge. « Après UniProtKB/Swiss-Prot et STRING, Cellosaurus et Rhea sont les troisième et quatrième ressources suisses à être ajoutées au portefeuille ELIXIR Core Data Resource : c'est une excellente nouvelle et une étape clé pour garantir leur pérennité et un accès à long terme à des données biologiques de haute qualité pour les utilisateurs du monde entier », explique Christine Durinx, directrice exécutive du SIB.
Que sont les ELIXIR Core Data Resources ?
Les ELIXIR Core Data Resources sont un ensemble de ressources de données européennes d'importance fondamentale pour la communauté des sciences de la vie au sens large et pour la conservation à long terme des données biologiques. L'identification des ELIXIR Core Data Resources implique une évaluation minutieuse des multiples facettes des ressources de données. Les détails des critères de sélection sont décrits dans l'article F1000R ELIXIR track « Identifying ELIXIR Core Data Resources ».
Nous avons demandé à Amos Bairoch, chef du groupe Cellosaurus, et aux membres de l'équipe Rhea chez Swiss-Prot (Kristian Axelsen, bioconservateur senior, Alan Bridge, chef de groupe, et Anne Morgat, gestionnaire des ressources) de nous éclairer sur les implications de cette annonce et de nous parler de leur ressource.
Pourriez-vous décrire cette ressource en quelques mots ?
Cellosaurus / Amos : Cellosaurus est une base de données de lignées cellulaires, c'est-à-dire de cultures de cellules humaines et animales pouvant être cultivées pendant de longues périodes in vitro, utilisées dans le cadre de la recherche en sciences de la vie. Elle contient une mine d'informations sur plus de 125 000 lignées cellulaires créées depuis les années 1950.
Rhea / Kristian : Rhea est une base de connaissances des réactions biochimiques décrites à l'aide d'espèces chimiques issues du dictionnaire ChEBI (Chemical Entities of Biological Interest) des petites molécules. Rhea est le vocabulaire de référence pour l'annotation des enzymes et des protéines de transport dans UniProt.
À quel type de recherche cette ressource est-elle utile ? À quel type de questions de recherche répond-elle ?
Cellosaurus / Amos : Presque tous ceux qui font de la recherche in vitro utilisent des lignées cellulaires : elles sont essentielles, par exemple, pour étudier la production de vaccins, le métabolisme des médicaments, la fonction des gènes ou même la génération de peau artificielle. En fonction de leurs questions de recherche, les scientifiques doivent savoir quelles lignées cellulaires utiliser et où les trouver : c'est le type d'informations qu'ils trouveront dans Cellosaurus.
Rhea / Alan : Rhea apporte un soutien essentiel aux approches computationnelles visant à étudier et à concevoir des enzymes et les systèmes métaboliques dans lesquels elles fonctionnent. Ces approches ont le potentiel de révolutionner notre compréhension du métabolisme et d'ouvrir de nouvelles voies pour la production de biocarburants, de médicaments et d'autres produits chimiques intéressants.
Pouvez-vous citer un exemple particulièrement intéressant d'application de cette ressource ou d'une étude récente réalisée à l'aide de celle-ci ?
Cellosaurus / Amos : On estime que jusqu'à 30 % de toutes les recherches menées sur des lignées cellulaires cancéreuses sont affectées par une mauvaise identification ou une contamination des lignées cellulaires. Pour pallier ce problème fondamental, Cellosaurus propose une application très importante, l'outil CLASTR, qui permet de rechercher des similitudes entre le profil STR des lignées cellulaires de l'utilisateur et celles stockées dans la ressource.
Rhea / Anne : Une étude récente a utilisé Rhea et UniProt pour identifier des métabolites potentiels comme biomarqueurs précoces de troubles neurodéveloppementaux et cibles thérapeutiques pour la schizophrénie.
Comment en est-il arrivé là ? Qu'est-ce qui, dans l'écosystème SIB, a permis sa création et son succès ?
Cellosaurus / Amos : Cellosaurus est à l'origine un thésaurus de lignées cellulaires développé dans le cadre de neXtProt, une ressource du SIB. Nous voulions enregistrer les lignées cellulaires utilisées dans les expériences produisant les ensembles de données capturés dans neXtProt. Ce petit projet s'est transformé en une ressource de connaissances à part entière, qui est devenue disponible en mai 2015 en tant que ressource autonome sur Expasy, le portail de ressources bioinformatiques du SIB. Un grand merci à l'équipe Expasy et en particulier à Elisabeth Gasteiger (responsable de l'expérience utilisateur et du support, Swiss-Prot Group) pour avoir déployé Cellosaurus sur le web et contribué à ce succès !
Rhea / Alan : Le SIB offre un excellent environnement pour le développement de ressources de connaissances, en s'efforçant d'identifier et de soutenir les ressources émergentes et matures, à l'instar d'ELIXIR au niveau européen. Le soutien du SIB a été absolument crucial pour le développement de Rhea, qui est étroitement coordonné avec celui d'UniProt et d'autres ressources du SIB telles que ENZYME et SwissLipids. Anne: Les collaborations avec nos partenaires internationaux sont également cruciales, en particulier avec l'équipe ChEBI de l'EMBL-EBI, ainsi qu'avec le Gene Ontology Consortium et Reactome, avec lesquels nous travaillons en étroite collaboration pour améliorer la couverture et l'interopérabilité de nos ressources de connaissances respectives, et avec des équipes d'autres nœuds ELIXIR tels que ELIXIR-CZ, avec lesquels nous collaborons étroitement à la mise en œuvre de recherches avancées sur les structures chimiques dans Rhea.
Comment pensez-vous que son statut CDR influencera son développement ?
Cellosaurus / Amos : Cela aidera Cellosaurus à obtenir un meilleur financement et nous permettra de développer davantage le système de recherche de la ressource et son interopérabilité avec d'autres ressources, par exemple grâce à un modèle sémantique, une API ainsi qu'un moteur de recherche basé sur SPARQL. Ces développements profiteront grandement aux utilisateurs bioinformatiques de la ressource, tant dans le monde universitaire que dans l'industrie.
Rhea / Alan : Les ressources de données de base sont reconnues comme étant d'une importance fondamentale pour la préservation à long terme des données biologiques. Le statut CDR renforcera considérablement la visibilité de Rhea au sein de la communauté scientifique (utilisateurs) et, nous l'espérons, contribuera à terme à garantir un financement plus stable.
Pour en savoir plus sur l'ensemble des ressources récemment sélectionnées, le processus et l'importance des Core Data Resources, consultez le site web d'ELIXIR.
Ne manquez pas le cours en streaming « Une visite guidée de Cellosaurus » qui aura lieu en février et inscrivez-vous ici. Et préparez-vous pour le cours en streaming « Exploitation des données enzymatiques dans UniProtKB à l'aide de Rhea » qui aura lieu en octobre ici.