Ateliers pratiques ISTEX et cartographie documentaire

01 septembre 2019
Les équipes ISTEX (DIST, INIST, ISC-PIF et CLLE) s’associent en 2019 et 2020 avec le réseau des Urfist pour proposer des ateliers pratiques autour de la plateforme ISTEX et des outils de cartographie documentaires.

Contexte

La plateforme ISTEX propose un accès à une collection pluridisciplinaire de 23 millions de documents de 1473 à 2016 pour l’ensemble des établissements de l’enseignement supérieur et de la recherche français. Les ressources sont réparties en 26 corpus éditeurs rassemblant plus de 250 éditeurs scientifiques et ont été acquises sans date limite d’accès et d’exploitation.

Le développement de modèles d’apprentissage automatique a permis d’enrichir et d’uniformiser l’ensemble des ressources afin d’interroger très finement l’intégralité de la base. À ce réservoir inégalé s’ajoute des services aux utilisateurs permettant d’en optimiser l’exploitation grâce à des outils de fouille de contenus (Text Mining) et de visualisation interactive.

Actions de communication

Les équipes ISTEX et leurs partenaires se sont déplacés dans une vingtaine de villes françaises en 2018 dans le cadre de l’événement ISTEX Tour pour réaliser des démonstrations sur le fonctionnement de la plateforme ISTEX et des services associés de fouille de textes. L’enquête de satisfaction diffusée auprès des participants a révélé une volonté d’aller plus loin dans l’usage des services et des outils présentés au cours d’ateliers pratiques.

Les équipes d’ISTEX s’associent cette année au réseau des URFIST pour proposer des « ateliers pratiques ISTEX ». Ces ateliers d’une journée permettront aux participants la prise en main des services et des outils de constitution, de visualisation et d’exploration d’un corpus thématique. Ils ont également pour objectifs de renforcer la communauté d’utilisateurs des ressources ISTEX et d’éveiller les pratiques documentaires vers la fouille de textes et de données (TDM).

Calendrier des déplacements 2019/2020

Afin de desservir au mieux le territoire, l’INIST et les sept URFIST proposeront chacun un atelier pratique ISTEX cette année :

Programme de la journée

Matin (9h30-12h30) : découvrir la plateforme ISTEX et services intégrés
Atelier : Construire et valoriser un corpus spécialisé à partir du réservoir ISTEX
30min de présentation de la base ISTEX et 2h30 de travaux pratiques

Les participants pourront découvrir les outils et services ISTEX et s’approprier les méthodes de constitution et d’exploration de corpus à travers des exemples de corpus réalisés par l’INIST.

Déroulement de l’atelier ISTEX

Interrogation d’ISTEX pour constituer un corpus

  • Démonstrateur ISTEX – Construction d’un requête pédagogique
  • Affiner la requête pour limiter les étapes de post-traitement des résultats

Extraction du corpus

  • ISTEX-DL – Service de téléchargement

Exploration, analyse et partage d’un corpus

  • Lodex – Service de visualisation

A l’issue de cet atelier, les participants sauront interroger la base ISTEX pour construire, télécharger et explorer leur propre corpus.

Tutoriel Lodex (15 modules)
Durée indicative : 42 minutes

Après-midi (14h-17h) : visualiser et analyser les données textuelles ou les métadonnées d’un corpus documentaires

Cette session sera consacrée à un seul des deux ateliers suivant :
Atelier 1 : Exploration d’un corpus documentaires ISTEX à l’aide de l’outil de cartographie Gargantext
Atelier 2 : Exploration d’un corpus documentaires ISTEX à l’aide de l’outil de cartographie Cillex

Atelier 1 : Exploration d’un corpus documentaires ISTEX à l’aide de l’outil de cartographie Gargantext
45min de présentation théorique – 30 min de démonstration d’une étude de cas – 1h45 de travaux pratiques

Le logiciel Gargantext est conçu pour produire des cartes interactives qui évoluent au fur et à mesure de la sélection de mots-clés. Ces cartes de mots s’organisent en groupement thématiques et peuvent être utilisées pour explorer un corpus de texte, construire un état de l’art, trouver de nouveaux mots-clés, etc.

Déroulement de l’atelier Gargantext

Théorie et démonstration

  • Présentation de l’algorithme et de l’interface du logiciel Gargantext ;
  • Démonstration de la routine d’exploration cartographique ;

Travaux pratiques

  • Manipulations de l’interface à partir d’une requête personnalisée sur ISTEX ;
  • Organisation, analyse et interprétation des mots-clés ;
  • Circuit itératif pour affiner les résultats.

Constitution d’un « journal de bord » de recherche

  • Exploration de plusieurs bases de données ;
  • Démonstration de remplissage d’un tableur interopérable ;
  • Importation du tableur personnalisé dans Gargantext.

Tutoriel Gargantext (1 module)
Durée indicative : 9 minutes

Atelier 2 : Exploration d’un corpus documentaires ISTEX à l’aide de l’outil de cartographie Cillex
30min de présentation de Cillex – 1h30 de travaux pratiques – 1h sur l’interopérabilité avec Gargantext

L’outil Cillex est conçu pour produire des cartes dynamiques référençant les métadonnées d’une requête à l’API ISTEX. Cette cartographie permet de choisir les métadonnées d’intérêt en fonction du type de recherche (par thématique, par auteur, etc.)

Déroulement de l’atelier Cillex

Théorie et démonstration

  • Présentation de l’algorithme et de l’interface du logiciel Cillex ;
  • Démonstration de la routine d’exploration cartographique ;

Travaux pratiques et constitution de corpus

  • Manipulations de l’interface à partir d’une requête personnalisée sur ISTEX ;
  • Traitement des métadonnées sur un tableur externe ;
  • Circuit itératif pour visualiser les métadonnées d’intérêt.

Interopérabilité avec le logiciel Gargantext

  • Exploration de plusieurs bases de données ;
  • Démonstration de remplissage d’un tableur interopérable ;
  • Importation du tableur personnalisé dans Gargantext.

Tutoriel Cillex (1 module)
Durée indicative : 10 minutes

Ressources complémentaires

Documents et actualités ISTEX

L’INIST communique sur différents canaux de diffusion de la documentation technique et des actualités sur les ressources ISTEX (méthode d’intégration, fonctionnalités associées, bonnes pratiques, etc.)

Documentation
Blog
Twitter

Tutoriels de formation

L’INIST met à disposition une série de tutoriels qui permettront aux participants de se familiariser avec la base ISTEX et de découvrir les méthodes de visualisation sous forme de graphique (Lodex) ou cartographique (Cillex et Gargantext) qui seront présentés lors de ces formations.

API ISTEX – 6 modules (90 minutes)
Lodex – 15 modules (42 minutes)
Gargantext – 1 module ( 9 minutes)
Cillex – 1 module (10 minutes)

Pour tout autre information

Contact technique

A lire aussi