Publications et données

La crise sanitaire du coronavirus (COVID-19) nécessite un engagement de chacun et de chacune. Le partage et l’analyse des données et des publications scientifiques reste un enjeu majeur pour lutter efficacement contre le coronavirus et les sujets biologiques annexes. Dans un communiqué récent, le gouvernement français demande l’ouverture complète des publications et données scientifiques issues de la recherche française sur le COVID-19. D’autres initiatives et liens utiles sont recensées sur cette page.


L’ensemble des initiatives sur l’ouverture, le partage, l’exploration et l’analyse des publications et des données scientifiques sur le coronavirus (COVID-19) et les sujet biologiques connexes.

La liste suivante recense quelques-unes des ressources COVID-19 en libre accès sur l’ouverture des publications et des données scientifiques.

Ouverture des publications scientifiques

Appel aux éditeurs scientifiques

L’association des responsables de l’information scientifique et technique des organismes de recherche français publics (Eprist), le consortium Couperin et l’association des directeurs de bibliothèque universitaire (ADBU) ont lancé, le 19 mars 2020, un appel à tous les éditeurs afin de rendre immédiatement accessibles les publications scientifiques disponibles concernant le Coronavirus dans le souci commun du bien public.

PubMed Central

La National Library of Medicine (NLM) of the National Institutes of Health annonce, dans un communiqué, qu’elle donne un accès plus large aux articles scientifiques sur les coronavirus grâce à sa plateforme PubMed Central® (PMC). Les articles seront accessibles pour la fouille de textes (TDM).

PubMed Central – COVID-19

Le volume considérable de données nécessite d’être assisté par les outils de text and data mining (TDM) pour les organiser, les explorer, les analyser et les synthétiser afin d’extraire de l’information et faire émerger de nouvelles connaissances.

UNESCO

Dans le contexte du COVID 19, l’UNESCO mobilise 122 pays pour une science ouverte et une coopération renforcée.

UNESCO – COVID-19

Couperin

Les correspondants du consortium Couperin qui échangent constamment avec les éditeurs, fournisseurs, négociateurs, autres… recensent l’ensemble des informations communiquées sur l’ouverture des données à propos du COVID-19.

Couperin – COVID-19

Partage des données de la recherche

COVID-19 Data Portal

Le portail européen de données intitulé COVID-19 Data Portal, a été lancé au mois d’avril 2020 afin de rassembler et faciliter le partage et l’analyse des données de référence dans le but d’accélérer la recherche sur les coronavirus. 

Portail de données COVID-19

Cette initiative de l’European Bioinformatics Institute (EMBL-EBI) et de ses partenaires a pour objectif de permettre aux chercheurs de télécharger, d’accéder et d’analyser des jeux de données spécifiques liés au COVID-19.

Exploration documentaire et extraction d’information

Corpus spécialisés

Corpus PubMed – COVID-19

Requête complète (PubMed Central)
2019-nCoV OR 2019nCoV OR COVID-19 OR SARS-CoV-2 OR ((wuhan AND coronavirus) AND 2019/12[PDAT]:2030[PDAT])

Corpus PubMed – Coronaviruses broadly (historical and current literature)

Requête complète (PubMed Central)
2019-nCoV OR 2019nCoV OR COVID-19 OR SARS-CoV-2 OR ((wuhan AND coronavirus) AND 2019/12[PDAT]:2030[PDAT])

Corpus d’actualités

Data-Istex propose désormais des collections de corpus d’actualités permettant d’expliquer ou de préciser le présent à partir des documents issus de l’archive ISTEX.

Constitués par l’équipe ISTEX de l’Inist-CNRS, ces corpus d’actualités se distinguent des corpus spécialisés par leur mode de constitution. En effet, leur requête cible des documents pertinents sur un sujet d’actualité sans prendre en considération de contraintes particulières liées à l’utilisation d’un outil de traitement automatique du langage ou de fouille de texte, comme c’est le cas pour les corpus spécialisés.

Corpus ISTEX – Coronavirus SRAS-MERS

Recherche de ressources ISTEX concernant les 2 épidémies graves à coronavirus précédant le « covid-19 ou SRAS-CoV-2 » à savoir le « SRAS ou SRAS-CoV-1 » (2002) et le « MERS-CoV » (2012)

Thésaurus COVID-19

Face à l’inflation de publications concernant la COVID-19,  le service d’ingénierie terminologique, a créé un thésaurus bilingue français /anglais spécifique coronavirus. Il est hébergé sur la plateforme Loterre.

Ce thésaurus bilingue (français-anglais), développé à l’Inist, présente les concepts relatifs à la COVID-19 qui n’est pas sans rappeler les épidémies de syndrome respiratoire aigu sévère et de syndrome respiratoire du Moyen-Orient.

Thésaurus Loterre – COVID-19

Ce thésaurus est construit à partir du vocabulaire utilisé dans les publications scientifiques sur le SRAS-CoV-2 et les autres coronavirus, comme le SRAS-CoV et le MERS-CoV

Cartographies d’information

L’équipe de l’ISC-PIF est spécialisée dans la fouille de données textuelles et la cartographie de connaissances. Elle met à disposition des cartographies de pans de littérature, à partir de l’archive Pubmed, liés au coronavirus avec le logiciel Gargantext.

Carte coronavirus – PubMed

Cartographie effectuée le 7 février 2020 sur une base de méta-données d’articles extraits de PubMed Central sur la période 2000-2020 (6560 articles)

Carte chloroquine – PubMed

Cartographie de 20 ans de recherche sur le sujet de la chloroquine et l’hydroxychloroquine à partir des données disponibles sur PubMed Central