Les chercheurs universitaires et privés qui utilisent UniProt, une base de connaissances unique et de haute qualité sur les protéines développée conjointement par le SIB, bénéficient d'un gain d'efficacité estimé entre 373 et 565 millions d'euros par an. Il s'agit d'un retour sur investissement impressionnant par rapport aux coûts opérationnels annuels de 14,6 millions d'euros. UniProt génère également des avantages socio-économiques à long terme, comme en témoignent ses mentions dans plus de 15 200 publications scientifiques et plus de 183 000 publications de brevets à ce jour. Cette valeur est particulièrement importante pour la Suisse, trois des cinq premières organisations déposant le plus de brevets étant des entreprises suisses ou des filiales suisses. Ces résultats sont publiés aujourd'hui dans une étude de cas menée par le CSIL en collaboration avec ELIXIR, dans le cadre du projet PathOS financé par l'UE visant à mieux comprendre et mesurer les impacts de la science ouverte.
UniProt est la principale source mondiale d'informations de haute qualité, complètes et librement accessibles sur la séquence et la fonction des protéines. Fruit d'une collaboration entre le SIB, l'Institut européen de bioinformatique (EMBL-EBI) et la Protein Information Resource (PIR), il comprend une suite de bases de données dont la base UniProtKB/Swiss-Prot, gérée par le SIB, est spécialement sélectionnée par des experts.
UniProt est reconnu pour son importance fondamentale pour la communauté des sciences de la vie au sens large et pour la conservation à long terme des données en tant que ressource SIB, ELIXIR Core Data Resource et Global Core Biodata Resource. Il a été choisi pour l'analyse coût-bénéfice par ELIXIR, qui mène une étude de cas sur les ressources bioinformatiques ouvertes pour le projet PathOS.
Quantifier les avantages et la valeur de la science ouverte
Le partage ouvert des données et des connaissances est de plus en plus reconnu comme essentiel pour accélérer les progrès scientifiques, favoriser l'innovation et renforcer la confiance du public dans la science. Bien que des preuves de ces résultats positifs aient été recueillies, il n'existe pas de méthode commune pour mesurer systématiquement les impacts académiques et socio-économiques.
UniProt est la principale source mondiale d'informations de haute qualité, complètes et librement accessibles sur la séquence et la fonction des protéines. Fruit d'une collaboration entre le SIB, l'Institut européen de bioinformatique (EMBL-EBI) et la Protein Information Resource (PIR), il comprend une suite de bases de données dont la base UniProtKB/Swiss-Prot, gérée par le SIB, est spécialement sélectionnée par des experts.
UniProt est reconnu pour son importance fondamentale pour la communauté des sciences de la vie au sens large et pour la conservation à long terme des données en tant que ressource SIB, ELIXIR Core Data Resource et Global Core Biodata Resource. Il a été choisi pour l'analyse coût-bénéfice par ELIXIR, qui mène une étude de cas sur les ressources bioinformatiques ouvertes pour le projet PathOS.
Un nouveau cadre spécialement conçu pour mesurer les avantages et les impacts des pratiques scientifiques ouvertes comble cette lacune, avec UniProt, une ressource de données ouvertes essentielle et mondialement reconnue dans le domaine des sciences de la vie, comme première étude de cas. Grâce à une analyse coûts-avantages adaptée et à une évaluation des « voies d'impact », l'étude révèle qu'UniProt apporte :
des gains d'efficacité pour les utilisateurs du secteur universitaire et privé d'une valeur de 373 à 565 millions d'euros par an, une part importante de ces avantages provenant de la curation des données par le groupe Swiss-Prot du SIB, basé à Genève ;
un bénéfice net direct qui dépasse ses coûts opérationnels de 14,6 millions d'euros dans un rapport de 25 à 39 pour 1 ;
une valeur à long terme pour la science et la société en accélérant les nouvelles connaissances et innovations, en facilitant les collaborations entre les universités et le secteur privé et en générant de nouvelles idées entrepreneuriales ;
une forte valeur ajoutée pour la Suisse, trois des cinq premières organisations publiant des brevets mentionnant UniProt étant des entreprises suisses ou des filiales suisses.
L'analyse fournit aux bailleurs de fonds d'UniProt – le Secrétariat d'État à la formation, à la recherche et à l'innovation (SEFRI), le Laboratoire européen de biologie moléculaire (EMBL) et les National Institutes of Health (NIH) des États-Unis – des preuves concrètes du retour sur investissement. Elle fournit également un argument convaincant en faveur d'un financement durable des ressources de données ouvertes en général, y compris celles fournies par le SIB et l'infrastructure européenne de données sur les sciences de la vie ELIXIR. Le cadre global, élaboré par l'institut de recherche économique CSIL pour le projet PathOS d'Horizon Europe, constitue en outre un outil décisionnel puissant pour promouvoir les politiques en faveur de la science ouverte.
Les avantages immédiats d'UniProt dépassent largement ses coûts
L'analyse coûts-avantages adaptée réalisée par CSIL pour l'étude de cas évalue spécifiquement les résultats à court terme directement attribuables à UniProt. Le coût opérationnel annuel moyen a été calculé à 14,6 millions d'euros pour la période 2017-2023, comprenant les coûts de fonctionnement couverts par les trois bailleurs de fonds et d'autres sources, ainsi que les contributions des utilisateurs pour améliorer les données sur les protéines.
Les avantages pour les utilisateurs ont été identifiés à l'aide d'une enquête et consistent principalement en un gain de temps dans trois domaines :
accès libre aux données et aux connaissances ouvertes d'UniProt par rapport à la négociation d'un accès à des alternatives restreintes ou propriétaires (économies sur les coûts de transaction) ;
accès direct à des informations intégrées dans UniProt par opposition à un accès séparé à différentes sources (économies sur les coûts d'accès)
rationalisation du travail quotidien par rapport à la nécessité d'intégrer, d'interpréter et de vérifier les données provenant d'autres sources (économies de coûts de main-d'œuvre).
La valeur monétaire combinée de ce gain de temps a été estimée entre 373 et 565 millions d'euros par an. Bien que l'analyse n'ait pas pu inclure tous les coûts historiques liés au développement d'UniProt, tels que les investissements initiaux, les efforts d'expansion et les mises à niveau majeures, et qu'elle ne reflète pas les avantages indirects et à long terme (abordés ci-dessous), cette valeur dépasse les coûts opérationnels actuels de la ressource d'un facteur compris entre 25 (estimation basse) et 39 (estimation haute).
La conservation et la gestion des données offrent le plus d'avantages aux utilisateurs
Les entretiens et les groupes de discussion ont révélé que le gain de temps pour les utilisateurs est principalement attribuable aux efforts continus des scientifiques employés par le SIB, l'EMBL-EBI et le PIR pour améliorer l'accessibilité des données, renforcer l'interopérabilité des données et organiser de manière experte les séquences protéiques dans Swiss-Prot à l'aide d'informations issues de la littérature scientifique sur la structure et la fonction des protéines.
Le coût de la main-d'œuvre nécessaire à la curation et à la gestion de ces données représente la majeure partie des coûts opérationnels d'UniProt. Mais comme le souligne l'étude, ce travail – en particulier la curation experte des données par le groupe Swiss-Prot du SIB – ne peut être accompli par d'autres organisations existantes ni remplacé par des technologies d'IA. En effet, l'enquête auprès des utilisateurs n'a pas permis d'identifier d'alternative pleinement comparable à UniProt, avec :
74 % des répondants déclarant qu'ils n'auraient pas accès aux mêmes données provenant de ressources restreintes ou fermées ;
68 % déclarant qu'ils ne seraient pas en mesure de recréer les mêmes données.
Les cinq principales organisations déposant des brevets mentionnant UniProt
Genentech – 960 (États-Unis ; filiale de F. Hoffmann-La Roche)
F. Hoffmann-La Roche – 948 (Suisse)
Novozymes – 705 (Danemark)
Institut national de la santé et de la recherche médicale – 589 (France)
Novartis – 574 (Suisse)
UniProt apporte une valeur ajoutée à long terme à la science et à la société
La quantification des impacts à long terme à travers la littérature scientifique et l'analyse des brevets a montré qu'UniProt contribue également à :
Les cinq principales organisations déposant des brevets mentionnant UniProt
Genentech – 960 (États-Unis ; filiale de F. Hoffmann-La Roche)
F. Hoffmann-La Roche – 948 (Suisse)
Novozymes – 705 (Danemark)
Institut national de la santé et de la recherche médicale – 589 (France)
Novartis – 574 (Suisse)
l'acquisition de nouvelles connaissances, avec plus de 15 200 mentions dans des publications scientifiques couvrant un large éventail de domaines des sciences de la vie et des technologies, dont 31 % sont directement liées aux objectifs de développement durable (ODD) des Nations unies ;
La R&D et l'innovation, y compris en Suisse, avec des mentions dans plus de 183 000 publications de brevets – trois des cinq principales organisations déposant des brevets étant des entreprises suisses ou des filiales suisses – ainsi que des mentions de brevets citant UniProt dans des brevets en aval.
Des enquêtes et des entretiens auprès des utilisateurs ont permis d'identifier d'autres effets à long terme rendus possibles par UniProt, notamment des collaborations public-privé, le développement de produits et de services et l'amélioration des processus de production.
Nécessité d'un financement durable des infrastructures de recherche
Dans l'ensemble, l'étude de cas confirme la valeur scientifique et sociétale des politiques en faveur de la science ouverte, auxquelles se sont engagés la Suisse, l'UE, d'autres pays européens et les États-Unis. Elle démontre également le rôle des infrastructures de recherche, dont UniProt fait partie, dans le soutien à la science ouverte ainsi qu'à des politiques économiques, sanitaires et environnementales plus larges.
Ces preuves sont plus cruciales que jamais : malgré la part importante des ressources mondiales de données biologiques provenant du SIB, de l'EMBL-EBI et d'autres institutions européennes et américaines, le financement des infrastructures de recherche reste un problème dans leurs pays respectifs. Le SIB et tous les autres fournisseurs de ressources de données de haute qualité et d'activités stratégiques dans le domaine des données ont besoin d'un financement durable pour répondre à la demande sans cesse croissante en matière d'accélération de la recherche, d'innovation et de solutions aux problèmes mondiaux.