Open Research Data Management (ORD)

Un consortium assure le financement d'un projet sur les procédures ORD

24 nov. 2022 | NCCR MARVEL / EMPA

Un consortium de chercheurs de l'Institut Paul Scherrer (PSI), de l'Empa et de l'ETH Zurich a obtenu près de 1,3 million de francs pour un projet de trois ans; il s'agit d'améliorer les procédures de gestion des données de recherche dans les sciences des matériaux, qui doivent être ouvertes et librement accessibles à tous – ce que l'on appelle communément "Open Research Data" (ORD). PREMISE, tel est le nom du projet, fait partie d'une initiative du Conseil des EPF visant à développer le traitement et la gestion des ORD.

/documents/56164/23022791/premise-stopper-neu.png/91fa8af6-3307-4d98-9e36-9c61995ecb0a?t=1669211357723
Expériences et simulations scientifiques : Le projet ORD veut promouvoir une recherche ouverte et reproductible dans un format accessible et partageable avec la grande communauté scientifique. Image : Empa

L'objectif du projet est d'établir, de promouvoir et de faciliter la diffusion de pratiques ORD conformes aux principes dits FAIR pour la gestion des données de recherche ("Trouvable, accessible, interopérable et réutilisable, tant pour les machines que pour les personnes"; https://www.nature.com/articles/sdata201618) dans le domaine des sciences des matériaux. Au cours de ce projet de trois ans, le consortium doit fournir les composants manquants afin de garantir une recherche ouverte, comparable et reproductible grâce à des formats de données librement accessibles et utilisables par l'ensemble de la communauté scientifique. Les chercheurs accordent une attention particulière à l'interopérabilité et à la compatibilité des données de simulation et des données expérimentales, car il n'existe actuellement aucune procédure de gestion des données de recherche permettant de réunir ces deux domaines.

Synergies entre les expériences et les simulations informatiques
/documents/56164/23022791/PREMISE-figure.jpg/331aec99-138d-489e-852a-600eb27e87b1?t=1669211188873
Le projet PREMISE vise à permettre pour la première fois l'intégration transparente de données ouvertes provenant à la fois d'expériences de laboratoire et de simulations. Cette nouvelle approche sera appliquée à deux exemples concrets de recherche combinée expérimentale et basée sur la simulation: des données ouvertes issues d'études expérimentales basées sur la simulation, par exemple la microscopie et la spectroscopie de molécules sur des substrats, et des données ouvertes issues d'expériences pilotées par des flux de travail et des robots pour l'étude de matériaux destinés à la conversion d'énergie. La combinaison des données est une condition essentielle pour la recherche et la découverte autonomes de matériaux. Image : Empa

Durant le projet, le consortium s'appuiera sur deux plateformes existantes: openBIS, un logiciel open source de gestion des données développé à l'ETH Zurich, et AiiDA, un système open source de gestion des flux de travail développé principalement à l'EPFL et au PSI dans le cadre du PRN MARVEL ("La révolution des matériaux : Conception et découverte computationnelles de nouveaux matériaux "; https://nccr-marvel.ch/). Ces deux plateformes couvrent différents domaines de la recherche quotidienne – et donc des données qui en résultent: celles issues d'expériences ou de simulations et de modèles informatiques. Les chercheurs sont convaincus que le lien et les synergies qui résultent des deux plateformes constituent le chaînon manquant pour automatiser l'ensemble de la "chaîne de valeur" expérimentale sur la voie des laboratoires autonomes "FAIR-by-design". Il n'existe actuellement aucune pratique ORD généralement acceptée pour cette étape cruciale. "L'idée est de réaliser des expériences de laboratoire de manière largement autonome, c'est-à-dire avec une intervention humaine minimale, tout en déclenchant automatiquement des simulations informatiques qui complètent les expériences", explique Carlo Pignedoli, chercheur à l'Empa et membre du consortium. "D'une part, une stratégie de gestion des données bien conçue est une condition préalable pour atteindre un haut degré d'automatisation; d'autre part, plus nous pouvons automatiser, plus les données ainsi générées sont alors, par définition, conformes à la norme FAIR".

Le financement du projet est lié à l'initiative ORD du Conseil des EPF. "PREMISE" relève de la catégorie de projets "Establish"; ce type de projets doit permettre d'établir largement des pratiques ORD déjà existantes, d'améliorer leur applicabilité, d'élever leur niveau de qualité et de les ancrer en tant que normes généralement reconnues dans la communauté des chercheurs. Le consortium est composé du chef de projet Giovanni Pizzi du PSI, de Carlo Pignedoli, Corsin Battaglia et Peter Kraus de l'Empa, ainsi que de Bernd Rinn, Caterina Barillari et Henry Lütcke de l'ETH Zurich.