Le projet Didómena : un plateforme moderne au service de la gestion des données de la recherche en sciences humaines et sociales

Didόmena est la plateforme qui permet aux unités de recherche de l'EHESS d'organiser, de partager et de pérenniser les données utilisées ou produites dans le cadre de leurs travaux. Les données y sont décrites selon les standards de l'information scientifique et technique.
La publication sur Didόmena a d'abord pour finalité d'illustrer ou d'étayer les résultats publiés; mais elle rend également possible la réutilisation des données dans le cadre d'autres travaux de recherche et plus généralement l'accès aux données pour toutes les personnes intéressées par la recherche en sciences sociales.
Télécharger la plaquette de présentation de Didómena

L'entrepôt de données de la recherche de l'EHESS

Didómena accueille les données collectées, produites, traitées dans le cadre des travaux des unités de recherche de l'École des Hautes Études en Sciences Sociales. Il s'agit de ressources numériques, situées en amont des publications dans le processus de production des connaissances, que les chercheurs souhaitent conserver et éventuellement partager.
Peuvent être déposées aussi bien des corpus de données constitués (“données froides”), qui ne font plus l'objet d'apports réguliers - que les données issues de la recherche en train de se faire (“données chaudes”).

Le rôle des données de la recherche en sciences humaines et sociales

Les projets de recherche mettent en jeu une quantité croissante de données, essentiellement numériques. En les plaçant sur une plateforme dédiée à leur partage et à leur préservation, les membres de la communauté scientifique peuvent étayer leurs publications en citant certains des matériaux dont ils ont fait usage. Ils permettent également à leurs pairs de prolonger leurs travaux, de les réinterroger pour les confirmer ou les infirmer.

Sécuriser les données de la recherche

Les données mises en oeuvre dans les projets de recherche en sciences humaines et sociales sont exposées au risque de perte, alors qu'elle représentent un enjeu important à la fois sur le plan scientifique et en tant que patrimoine culturel.
Ni les ordinateurs des laboratoires de recherche, ni les sites web où les données sont parfois présentées, ni les stockages proposés dans le cloud ne réunissent les conditions d'une conservation pérenne.
Didómena permet le dépôt des données sur une infrastructure permanente et sécurisée.

Un outil de description scientifique précise

L'objectif de Didómena est de donner la possibilité aux chercheurs d'assortir leurs données d'informations aussi précises que possible afin de restituer leur contexte de production, de préciser leur place dans un corpus, de les lier aux publications dont elles font l'objet...
Les exigences de rigueur, d'exactitude dont font preuve les scientifiques sur leurs terrains de recherches peuvent ainsi également s'appliquer à la gestion des données qu'ils produisent et collectent.

Un processus contrôlé d'ouverture des données

Sur Didómena, l'ouverture des données n'est pas conçue dans une logique de tout ou rien. Déposer un jeu de données n'est pas synonyme de l'exposer sur Internet. Tous les niveaux d'exposition sont proposés, depuis la visibilité publique jusqu'au statut de donnée privée, en passant par plusieurs degrés d'accès restreint, limité à des groupes ou à des individus précis, avec possibilité d'embargo.

L'intéropérabilité des données de la recherche

Hyrax, le logiciel libre sur lequel est basé Didómena, s'appuie sur un modèle de données générique conçu pour soutenir une large variété d'entrepôts de données : le modèle de données commun de Portland (PCDM). Ce modèle fait lui même référence à plusieurs standards répandus tels Dublin Core afin d'optimiser l'intéropérabilité des métadonnées.
Les utilisateurs qui rendent leurs données publiques sont ainsi assurés de possibilités de diffusion et de réutilisation élevées.

Améliorer la découvrabilité des données de la recherche

Grâce à son puissant moteur de recherche Solr, Didómena propose des fonctionnalités de recherche répondant aux usages actuels telles que les filtres à facettes, la recherche plein texte non seulement dans les métadonnées mais à l'intérieur des données, y compris les images (archives numérisées).

Une technologie moderne au service des sciences humaines et sociales

Dans Didómena, les données sont soumises à une chaîne de traitement permettant aux chercheurs d'en valoriser les potentialités techniques : miniaturisation automatique, océrisation à la volée, indexation plein texte, transcodage des contenus audio et vidéo, contrôle automatisé de la fixité...

Publier les données de la recherche sur le web sémantique

Didómena stocke les données dans Fedora, une plateforme qui supporte nativement les formats du web sémantique (ou web de données).

Contribuer à une solution libre de gestion des données de la recherche et du patrimoine culturel

Didómena est basée sur la plateforme Hyrax, issue des travaux de la communauté internationale Samvera. En adoptant cette solution, l'École des Hautes Études en Sciences Sociales reconnaît l'importance de la dynamique de mutualisation entre institutions universitaires au plan international pour faire émerger des solutions technologiques à la hauteur des exigences de la recherche.