« La mise à disposition des données attachées à une publication scientifique est indispensable pour comprendre, reproduire et valider un résultat scientifique. » indique Alain Schuhl, directeur général délégué à la science du CNRS, dans une interview pour présenter le Plan Données de la recherche. « Partager ces données permet aussi à d’autres équipes de les réutiliser sans avoir à les générer une nouvelle fois, ce qui permet un gain de temps et assure une meilleure utilisation des fonds de la recherche. » ajoute-t-il.
Pour les communautés scientifiques du CNRS qui ne disposent pas encore d’un entrepôt thématique bien identifié et de confiance[1], le CNRS ouvre, au sein de la plateforme nationale Recherche Data Gouv, un entrepôt institutionnel pour déposer et partager les données de la recherche.
Découvrir l’entrepôt “CNRS Research Data”
L’ouverture d’un espace générique dédié aux données de recherche s’inscrit dans les objectifs du Plan Données de la recherche du CNRS pour diffuser une culture des données FAIR : faciles à trouver, accessibles, interopérables et réutilisables. Néanmoins, toutes les données produites n’ont pas vocation à être ouvertes ou divulguées. Il existe des exceptions légales telles que les données confidentielles à caractère personnel, les données liées à de la concurrence industrielle ou celles liées à des questions de souveraineté nationale.
L’ouverture des données s’entend selon l’expression de la commission européenne « ouvert autant que possible, fermé autant que nécessaire ». La décision d’ouverture ou de protection des données de la recherche doit être prise avec les services compétents du CNRS : les services partenariat et valorisation pour la propriété intellectuelle, la délégation à la protection des données pour les données à caractère personnel et la direction de la sûreté pour les questions relatives à la souveraineté.
L’entrepôt CNRS Rechearch Data est hébergé sur la plateforme Recherche Data Gouv, un écosystème souverain de publication pour le partage et l’ouverture des données de la recherche française. Il participe à la préservation et à la réutilisation des résultats scientifiques pour rendre la recherche plus innovante, transparente et collaborative.
Le CNRS est partie prenante dans le développement de l’environnement Recherche Data Gouv et contribue au déploiement des centres de ressources nationaux, aux centres de références thématiques et aux ateliers de la donnée. Les centres de références thématiques sont composés d’experts disciplinaires et les ateliers de la donnée mènent des actions locales et régionales qui constituent un premier niveau d’expertise dans la gestion des données.
Dans la lignée de la Feuille de route pour la science ouverte, le CNRS soutient et accompagne les infrastructures de recherche, productrices de données, dans la définition et la mise en œuvre des politiques de gestion des données. Le développement de ces infrastructures devrait être corrélé à l’avenir avec une certification de type CoreTrustSeal qui évalue des critères relatifs aux entrepôts de données de confiance selon plusieurs niveaux de conformité. Cette étape de certification est importante pour garantir la fiabilité et la durabilité des dépôts de données ainsi que l’archivage et le partage à long terme des données.
L’infrastructure Recherche Data Gouv ambitionne de devenir à terme un service de l’European Open Science Cloud (EOSC) qui offre un accès au patrimoine des données partagées et ouvertes de la recherche pour favoriser leur réutilisation et ainsi faciliter les collaborations européennes.
[1] Le logigramme « Où publier vos données ? » permet de définir le type d’entrepôt à privilégier en fonction de la nature des données.
Le catalogue « CNRS Données de la Recherche » met à disposition un répertoire des entrepôts et des services dédiés aux données, dont le CNRS est responsable ou auxquels il contribue en y affectant des moyens.
Lors du dépôt d’un jeu de données sur l’espace « CNRS Research Data », l’équipe de modération effectue une première vérification pour vous indiquer si un entrepôt thématique serait plus adapté.
A lire aussi
À Saclay, mutualiser les machines de calcul pour aller plus loin ensemble
Depuis 2017, l’Institut du développement et des ressources en informatique scientifique du CNRS héberge la machine de calcul mutualisée de CentraleSupélec, l’ENS Paris-Saclay et l’université Paris-Saclay.
ANF TDM 2023 | Retrouver les interviews vidéos autour des logiciels de fouille de textes
Chaque année, le CNRS et INRAE organisent l'action nationale de formation dédiée à l'exploration documentaire et l'extraction d'informations. Retrouvez les interviews vidéos de l'édition 2023.
ANF TDM 2024 | Inscriptions ouvertes pour explorer la littérature scientifique
Du 3 au 4 octobre 2024, le CNRS et INRAE organisent la 5ème édition de l'action nationale de formation dédiée à l'exploration de la littérature scientifique. Les inscriptions sont ouvertes jusqu’au lundi 15 juillet 2024.