Journée science ouverte 2023 | Logiciels libres et fouille de données textuelles

04 décembre 2023
La 5ème édition de la Journée science ouverte du CNRS se consacre aux logiciels libres et à la fouille de données textuelles, dans le contexte de la science ouverte.

Le mercredi 22 novembre, s’est déroulée la 5ème édition de la Journée science ouverte (JSO) du CNRS. Cette journée dédiée aux avancées de la science ouverte a permis d’aborder la place du logiciel libre et les méthodes de fouille de textes et de données. Ce thème est le 3ème pilier de la feuille de route pour la science ouverte du CNRS ; il est au cœur des enjeux actuels de diffusion, de protection et de réutilisation des résultats de la recherche au regard des méthodes d’apprentissage par intelligence artificielle.

Le récit de cette journée est disponible sur CNRS Info

Chaque édition aborde un des piliers de la feuille de route pour la science ouverte du CNRS comme les publications scientifiques (2020), l’évaluation de la recherche (2021) et les données de la recherche (2022). Le PDG du CNRS, Antoine Petit, a rappelé que ces journées avec les équipes de direction des instituts et leurs conseils scientifiques « sont le point de départ d’actions concrètes sur les sujets de la science ouverte ».

Consulter le programme et les présentations de la journée

La matinée s’est consacrée au logiciel libre, une ressource collaborative, accessible à toutes et tous, qui navigue entre les disciplines et permet de nouer des liens entre les équipes de recherche et avec la société. Lors de son discours d’ouverture, Antoine Petit, a précisé l’importance de faire connaître et valoriser les logiciels libres : « Je suis sûr qu’il y a de nombreuses  pépites au sein des laboratoires du CNRS ; l’enjeu est de les faire connaitre tant au sein du CNRS qu’auprès des communautés et des parties prenantes qui pourraient en bénéficier ».

Les sessions de l’après-midi se sont concentrées sur le 3ème pilier de la feuille de route pour la science ouverte du CNRS : « Développer et promouvoir les outils pour l’analyse et la fouille de textes et des données ». La fouille de textes et les grands modèles de langage (LLM) facilitent l’innovation pour explorer, partager et réutiliser les résultats de la recherche. Selon Alain Schuhl, directeur général délégué à la science du CNRS, « chaque année, les chercheurs et chercheuses du CNRS s’investissent pour ouvrir les publications et les données scientifiques. Les logiciels destinés à l’exploration des données textuelles s’appuient sur cette ouverture et permettront d’en exploiter toutes les possibilités. »

A lire aussi