Importance de l’Open Science

Importance de l’Open Science

Avoir une science financée par les fonds publiques accessible à tous les chercheurs, telle est la signification du mouvement Open Science qui vise à améliorer globalement la diffusion du savoir scientifique. Cette diffusion se traduit par diverses actions possibles, décrites notamment dans l’Initiative de Budapest : « Par « accès libre » à cette littérature, nous entendons sa mise à disposition gratuite sur l’Internet public, permettant à tout un chacun de lire, télécharger, copier, transmettre, imprimer, chercher ou faire un lien vers le texte intégral de ces articles, les disséquer pour les indexer, s’en servir de données pour un logiciel, ou s’en servir à toute autre fin légale, sans barrière financière, légale ou technique autre que celles indissociables de l’accès et l’utilisation d’Internet » (Institut de l’information scientifique et technique, 2004) L’Open Science prend en compte le partage des articles publiés par les chercheurs (on parle alors d’Open Access) mais concerne également le partage des données de recherches proprement dites, que l’on nomme Open Data. Concernant les articles, les visées de l’Open Science peuvent être atteintes avec la publication dans une revue fonctionnant sur le modèle de l’Open Access ou encore en déposant la version de l’article « author manuscript14 » dans une archive ouverte ou une base de données institutionnelle qui serait accessible à quiconque. Ces deux pratiques se nomment respectivement le Gold Open Access ou la voie dorée et le Green Open Access ou la voie verte (Horizon 2020 2013c). Concernant l’Open Data, qui est le partage des données de recherche de manière libre, le but est finalement de publier ses données sur une plateforme accessible à la communauté scientifique. Pour cela, il est nécessaire de stocker ses données sur un dépôt en ligne qui existe en deux versions principales. Il s’agit des dépôts institutionnels, créés et gérés notamment par les universités, et les dépôts privés. Ces dépôts garantissent la consultation de ces données mais aussi et surtout leur téléchargement permettant ainsi la reproduction de l’expérience (Horizon 2020 2013c).

L’ouverture des données de la recherche est un réel enjeu pour les financeurs de la recherche scientifique. Les États paient de grandes sommes afin d’avoir une recherche scientifique dont les résultats puissent être de qualité, vérifiables et reproductibles. De ce fait, l’Open Access et l’Open Data sont indispensables et les seuls moyens efficaces pour permettre la transmission transparente des données et leur vérification. L’Open Data permet non seulement la vérification, mais aussi une recherche plus rapide en se basant sans entrave sur les données d’une recherche précédente. De plus, il apporte aussi une plus grande transparence dans la recherche pour le grand public (Horizon 2020 2013c). Enfin, il favorise la collaboration permettant, de ce fait, d’éviter les recherches à double, c’est-à-dire des recherches similaires réalisées parce que les données produites précédemment n’étaient alors pas accessibles. (Horizon 2020 2013c) Face à cet enjeu, les États ont créé plusieurs projets visant à favoriser l’Open Science, voire à en faire une obligation. C’est notamment le cas d’Horizon 202015, le programme pour la recherche et le développement de l’Union Européenne pour la période 2014-2020. Dans celui-ci, l’Open Science y est inclus de manière concrète à travers l’article 29 du Modèle général de convention de subvention multi bénéficiaire.

Celui-ci explicite que les bénéficiaires provenant de ce programme doivent divulguer les résultats de leur recherche de manière appropriée. Ces résultats, comprennent notamment les données de recherche, ce qui est précisé au point 29.3 : « En ce qui concerne les données numériques de la recherche produites dans le cours de l’action, les bénéficiaires doivent : (a) Les déposer dans une banque de données de la recherche et prendre des mesures afin de permettre aux tiers d’accéder aux éléments suivants et de les explorer, exploiter, reproduire et diffuser, gratuitement pour l’utilisateur […] (b) Fournir des informations, par la banque de données, sur les outils et les instruments à la disposition des bénéficiaires et nécessaires pour la validation des résultats (et, si possible, fournir les outils et instruments eux-mêmes). » (Horizon 2020 2013a, p. 69) Il est important de préciser que bien qu’Horizon 2020 encourage vivement l’Open Data, cette obligation n’est applicable, jusqu’en janvier 2017, qu’au projet pilote de libre accès aux données de recherche (Open Research Data Project). Or, ce projet pilote « correspond à environ 3 milliards d’euros, soit 20 % du budget total d’Horizon 2020 pour 2014 et 2015 » (Horizon 2020 2013c, p.9).

Data Management Plan

Le Data Management Plan (DMP) ou plan de gestion des données, est l’un des outils mis en avant dans le RDM. Comme nous l’avons déjà dit, Horizon 2020 en fait l’une de ses conditions imposées au chercheur dans l’optique du projet pilote Open Research Data. De même, selon le UK Data Service23 : « Good data management is fundamental for high-quality research data and research excellence. A data management plan helps you consider at the planning stages of research how data will be managed throughout the research process and shared afterwards. » (UK Data Service 2002a) Cette mise en avant du DMP est symptomatique de son importance. En effet, il permet d’expliciter de manière concrète comment seront gérées les données produites durant tout le processus de recherche mais aussi ultérieurement à celui-ci. Le DMP couvrant une grande partie du cycle de vie des données, il doit être pensé et rédigé au commencement de la recherche afin de s’assurer d’une conformité avec la politique de gestion des données de son financeur ainsi que celle de son institution (UK Data Service 2002a) (Horizon 2020 2013b). Selon la version les Lignes directrices pour la gestion des données dans Horizon 2020, les recherches prenant part au projet pilote Open Research Data devront fournir une première version de leur plan de gestion des données dans les six premiers mois (Horizon 2020 2013b). De plus, il est nécessaire de préciser que le DMP n’est en aucun cas un document fixe, figé dans le temps. Il se doit d’être évolutif, mis à jour au gré des changements dans la recherche concernée. Le Data Management Plan est donc fortement lié aux principes de l’Open Access et de l’Open Data dans le sens où il les prévoit dans sa structure-même mais il ne s’agit en réalité que du résultat d’une politique responsable de gestion des données de recherche. Concrètement, le Data Management Plan comporte plusieurs champs que le chercheur devra remplir selon les caractéristiques de sa recherche. Le modèle de DMP peut varier selon l’institution qui le crée, mais nous y trouvons généralement plus ou moins les mêmes rubriques que l’on peut résumer à partir des exemples (Deboin, 2014), (Horizon 2020 2016b), (Cartier, Moysan, Reymonet, 2015), (University of Edinburgh [sans date]24) ainsi que le NIH (National Institutes of Health, 2003) :

Les fondements et caractéristiques de la recherche biomédicale

La recherche biomédicale peut se diviser en plusieurs disciplines rattachées à la recherche fondamentale, la recherche préclinique et la recherche clinique. La recherche fondamentale représente les actions à la production de savoirs dans un domaine précis. Dans le domaine du biomédical, elle tente de comprendre le corps humain, son fonctionnement et les maladies existantes, étant ainsi à la croisée des différentes sciences du vivant. « Dans les sciences du vivant, elle s’attache à connaître et comprendre les systèmes biologiques qui régissent la vie, sans se préoccuper immédiatement des applications éventuelles à court, moyen ou long terme. Elle désigne généralement une recherche menée par des équipes et organismes de recherche non industriels, le plus souvent publics » (Direction de la Prospective et du Dialogue Public 2013, p. 7) En effet, « On considère d’habitude que la recherche fondamentale se consacre à l’acquisition des connaissances sans but défini d’utilité ou d’objet spécifique. » (OMS 2003, p.2).

Cependant, la recherche fondamentale peut aboutir à une utilisation des connaissances créées. Il s’agit ici du rôle de la recherche translationnelle, qui agit comme un chaînon entre la recherche fondamentale et la recherche clinique en analysant l’applicabilité des résultats (Direction de la Prospective et du Dialogue Public 2013) (Q-CROC 2010). La recherche préclinique consiste à tester et à évaluer l’utilité, l’efficacité mais aussi la toxicité d’un traitement ou d’une molécule révélés parfois grâce à la recherche fondamentale. Ces tests peuvent se faire de manière dite in-vitro, c’est-à-dire sur des organismes cellulaires mais aussi in-vivo, c’est-à-dire sur des animaux tels que les rongeurs ou les primates (Direction de la Prospective et du Dialogue Public 2013) (Jouis, Guery & Vicaut 2011). Les essais précliniques comportent trois axes (Bencheikh [sans date]) (les entreprises du médicament 2013) :

•Les études pharmacologiques : les composantes de la molécule et son potentiel

• Les études pharmacocinétiques : son assimilation et son élimination par le corps permettant de déterminer les possibles dosages à employer.

• Les études toxicologiques : s’intéresse aux effets secondaires mais aussi à la possible accumulation de la molécule dans les tissus du corps. Ces expériences tentent aussi de déterminer les doses de toxicité mais aussi les possibles effets cancérigènes de la molécule notamment.

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

Déclaration
Remerciements
Résumé
Liste des tableaux
Liste des figures
Liste des acronymes
1Introduction
1.1Problématique générale
1.2Cadre général
1.2.1Objectifs généraux et spécifiques
1.3Méthodologie
1.4Limites et contraintes
2La donnée de la recherche
2.1Qu’est-ce qu’une donnée de recherche ?
2.2Contenu et caractéristiques des données de recherche
2.3Problématique et enjeux
2.3.1Importance de la gestion des données de la recherche
2.3.2Importance de l’Open Science
2.4Cycle de vie des données de recherche
2.5Politique de gestion des données de recherche
2.5.1Incitations et politique des institutions
2.5.2Impulsions venant des chercheurs
2.6Data Management Plan
3Les données de la recherche biomédicale
3.1Les fondements et caractéristiques de la recherche biomédicale
3.2Caractéristiques des données biomédicales
3.2.1Les Omics
3.2.2L’imagerie
3.2.3Données de laboratoire « long tail »
3.2.4Données médicales – biobanque
3.2.5Formats
3.2.5.1Imagerie
3.2.5.2Tableurs
3.2.5.3Fichiers Textuels
3.2.6Données de recherche en santé publique
3.3Partage des données biomédicales : bénéfices et inquiétudes
4Contexte des institutions
4.1IUMSP
4.1.1Formations et services existants
4.1.2Recherche existante et données créées
4.2BIUM – CHUV
4.2.1Formations et services existants
4.2.2Recherche existante et données créées
5Formations générales et biomédicales sur les données de la recherche – exemples
5.1MANTRA – Research Data Management Training
5.1.1La formation du MANTRA
5.1.2Kit prêt à l’emploi pour les bibliothèques
5.2University of East London
5.3DATUM for Health
5.3.1La formation du DATUM
5.3.2Évaluation
5.4New England Collaborative Data Management Curriculum
5.4.1La formation du NECDMC
5.4.2L’exemple canadien
5.4.2.1Évaluation
5.5Checklists
5.5.1Le Data Management Plan en 20questions du OXFORD DMP online Project
5.5.2ETH – EPFL
5.6Formations ludiques et questionnaires
5.6.1Educaplay
5.6.2Questionnaires
5.6.3Vidéos
5.7Conclusion
6Formation proposée
6.11er module : introduction à la gestion des données de recherche et création d’un Data Management Plan
6.1.11ère séquence : introduction à la gestion des données de recherche
6.1.22e séquence : le cycle de vie des données
6.1.33e séquence : questionnaire en vue de la réalisation du DMP
6.1.4Séquence pédagogique du 1er module
6.22nd module : Open Data, formats, métadonnées et dépôt en ligne
6.2.11ère séquence : nécessités et bénéfices de l’Open Data
6.2.22e séquence : la création de métadonnées dans le but de décrire le set de données
6.2.33e séquence : gestion des formats de fichiers pérennes
6.2.44e séquence : les licences CC pour protéger les copyrights des chercheurs
6.2.55e séquence : choix du dépôt en ligne pour les sets de données
6.2.6Séquence pédagogique du 2nd module
7Conclusion
Bibliographie
Annexe 1: Exercice Cycle de vie
Annexe 2: Questionnaire concernant la gestion des données de recherche
Annexe 3: Contraintes et bénéfices au partage des données de recherche
Annexe 4: Questionnaire sur les métadonnées
Annexe 5: Schéma listant les métadonnées à incorporer
Annexe 6: Formats des données de recherche
Annexe 7: Tableau récapitulatif des licences CC
Annexe 8: Exercice dépôts en ligne

Importance de l’Open ScienceTélécharger le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *