Contexte
La plateforme ISTEX propose un accès à une collection pluridisciplinaire de 23 millions de documents de 1473 à 2016 pour l’ensemble des établissements de l’enseignement supérieur et de la recherche français. Les ressources sont réparties en 26 corpus éditeurs rassemblant plus de 250 éditeurs scientifiques et ont été acquises sans date limite d’accès et d’exploitation.
Le développement de modèles d’apprentissage automatique a permis d’enrichir et d’uniformiser l’ensemble des ressources afin d’interroger très finement l’intégralité de la base. À ce réservoir inégalé s’ajoute des services aux utilisateurs permettant d’en optimiser l’exploitation grâce à des outils de fouille de contenus (Text Mining) et de visualisation interactive.
Actions de communication
Les équipes ISTEX et leurs partenaires se sont déplacés dans une vingtaine de villes françaises en 2018 dans le cadre de l’événement ISTEX Tour pour réaliser des démonstrations sur le fonctionnement de la plateforme ISTEX et des services associés de fouille de textes. L’enquête de satisfaction diffusée auprès des participants a révélé une volonté d’aller plus loin dans l’usage des services et des outils présentés au cours d’ateliers pratiques.
Les équipes d’ISTEX s’associent cette année au réseau des URFIST pour proposer des « ateliers pratiques ISTEX ». Ces ateliers d’une journée permettront aux participants la prise en main des services et des outils de constitution, de visualisation et d’exploration d’un corpus thématique. Ils ont également pour objectifs de renforcer la communauté d’utilisateurs des ressources ISTEX et d’éveiller les pratiques documentaires vers la fouille de textes et de données (TDM).
Calendrier des déplacements 2019/2020
Afin de desservir au mieux le territoire, l’INIST et les sept URFIST proposeront chacun un atelier pratique ISTEX cette année :
-
Nancy (Inist) – mardi 18 juin 2019
Informations et inscription -
Bordeaux – mardi 1er octobre 2019
Informations et inscriptions : session du matin et session de l’après-midi -
Rennes – jeudi 17 octobre 2019
Informations et inscription -
Lyon – jeudi 7 novembre 2019
informations et inscriptions : session du matin et session de l’après-midi -
Toulouse – jeudi 21 novembre 2019
Informations et inscription -
Paris – jeudi 16 janvier 2020
Informations et inscription -
Montpellier – jeudi 23 janvier 2020
Informations et inscription -
Strasbourg – mardi 6 février 2020
Informations et inscription -
Paris – jeudi 12 mars 2020
Informations et inscription -
Montpellier – jeudi 17 septembre 2020
Informations et inscriptions
Programme de la journée
Matin (9h30-12h30) : découvrir la plateforme ISTEX et services intégrés
Atelier : Construire et valoriser un corpus spécialisé à partir du réservoir ISTEX
30min de présentation de la base ISTEX et 2h30 de travaux pratiques
Les participants pourront découvrir les outils et services ISTEX et s’approprier les méthodes de constitution et d’exploration de corpus à travers des exemples de corpus réalisés par l’INIST.
Déroulement de l’atelier ISTEX
Interrogation d’ISTEX pour constituer un corpus
- Démonstrateur ISTEX – Construction d’un requête pédagogique
- Affiner la requête pour limiter les étapes de post-traitement des résultats
Extraction du corpus
- ISTEX-DL – Service de téléchargement
Exploration, analyse et partage d’un corpus
- Lodex – Service de visualisation
A l’issue de cet atelier, les participants sauront interroger la base ISTEX pour construire, télécharger et explorer leur propre corpus.
Tutoriel Lodex (15 modules)
Durée indicative : 42 minutes
Après-midi (14h-17h) : visualiser et analyser les données textuelles ou les métadonnées d’un corpus documentaires
Cette session sera consacrée à un seul des deux ateliers suivant :
Atelier 1 : Exploration d’un corpus documentaires ISTEX à l’aide de l’outil de cartographie Gargantext
Atelier 2 : Exploration d’un corpus documentaires ISTEX à l’aide de l’outil de cartographie Cillex
Atelier 1 : Exploration d’un corpus documentaires ISTEX à l’aide de l’outil de cartographie Gargantext
45min de présentation théorique – 30 min de démonstration d’une étude de cas – 1h45 de travaux pratiques
Le logiciel Gargantext est conçu pour produire des cartes interactives qui évoluent au fur et à mesure de la sélection de mots-clés. Ces cartes de mots s’organisent en groupement thématiques et peuvent être utilisées pour explorer un corpus de texte, construire un état de l’art, trouver de nouveaux mots-clés, etc.
Déroulement de l’atelier Gargantext
Théorie et démonstration
- Présentation de l’algorithme et de l’interface du logiciel Gargantext ;
- Démonstration de la routine d’exploration cartographique ;
Travaux pratiques
- Manipulations de l’interface à partir d’une requête personnalisée sur ISTEX ;
- Organisation, analyse et interprétation des mots-clés ;
- Circuit itératif pour affiner les résultats.
Constitution d’un « journal de bord » de recherche
- Exploration de plusieurs bases de données ;
- Démonstration de remplissage d’un tableur interopérable ;
- Importation du tableur personnalisé dans Gargantext.
Tutoriel Gargantext (1 module)
Durée indicative : 9 minutes
Atelier 2 : Exploration d’un corpus documentaires ISTEX à l’aide de l’outil de cartographie Cillex
30min de présentation de Cillex – 1h30 de travaux pratiques – 1h sur l’interopérabilité avec Gargantext
L’outil Cillex est conçu pour produire des cartes dynamiques référençant les métadonnées d’une requête à l’API ISTEX. Cette cartographie permet de choisir les métadonnées d’intérêt en fonction du type de recherche (par thématique, par auteur, etc.)
Déroulement de l’atelier Cillex
Théorie et démonstration
- Présentation de l’algorithme et de l’interface du logiciel Cillex ;
- Démonstration de la routine d’exploration cartographique ;
Travaux pratiques et constitution de corpus
- Manipulations de l’interface à partir d’une requête personnalisée sur ISTEX ;
- Traitement des métadonnées sur un tableur externe ;
- Circuit itératif pour visualiser les métadonnées d’intérêt.
Interopérabilité avec le logiciel Gargantext
- Exploration de plusieurs bases de données ;
- Démonstration de remplissage d’un tableur interopérable ;
- Importation du tableur personnalisé dans Gargantext.
Tutoriel Cillex (1 module)
Durée indicative : 10 minutes
Ressources complémentaires
Documents et actualités ISTEX
L’INIST communique sur différents canaux de diffusion de la documentation technique et des actualités sur les ressources ISTEX (méthode d’intégration, fonctionnalités associées, bonnes pratiques, etc.)
Tutoriels de formation
L’INIST met à disposition une série de tutoriels qui permettront aux participants de se familiariser avec la base ISTEX et de découvrir les méthodes de visualisation sous forme de graphique (Lodex) ou cartographique (Cillex et Gargantext) qui seront présentés lors de ces formations.
API ISTEX – 6 modules (90 minutes)
Lodex – 15 modules (42 minutes)
Gargantext – 1 module ( 9 minutes)
Cillex – 1 module (10 minutes)
Pour tout autre information
A lire aussi
Identifier un entrepôt thématique de confiance pour exposer les données de recherche
Le Comité pour la science ouverte (CoSO) publie une note méthodologique et une liste d’entrepôts thématiques de confiance pour le dépôt et le partage des jeux de données.
Passeport pour la science ouverte | Guide des données de la recherche
Le passeport pour la science ouverte s'enrichit d'un guide pour accompagner les scientifiques à la gestion et à la diffusion de leurs données de recherche.
Journée European Open Science Cloud (EOSC) au CNRS
La DDOR du CNRS organise une journée dédiée aux projets et services de l'infrastructure European Open Science Cloud (EOSC) à destination des scientifiques des unités CNRS.