La fouille de textes et de données (TDM)

Action nationale de formation
ANF TDM 2021 – Exploration documentaire et extraction d’information

Chaque année le monde de la recherche accélère et développe sa production scientifique. L’apport massif de données et de publications, associé à la multiplication des canaux de diffusion, complexifie l’exploration de la littérature scientifique.

Afin de répondre à ces nouveaux enjeux, les activités de recherche bibliographique, d’état de l’art, de veille scientifique, etc. s’appuient de plus en plus sur des outils sémantiques et des logiciels de traitement de l’information. Des solutions informatiques qui permettent de repérer, d’extraire, d’organiser, de trier, de combiner, d’explorer, d’analyser et de partager un corpus de données.

Inscription

Cette formation a pour objectif de faire monter en compétence les chercheurs et chercheuses, doctorant(e)s et ingénieur(e)s d’appui à la recherche qui souhaitent mettre en place ou développer l’exploration documentaire et l’extraction d’information dans leur activité.

Formulaire d’inscription (bientôt accessible)
Choix des ateliers du mercredi 17 novembre 2021

Si vous souhaitez vous perfectionner ou si vous êtes appelés à utiliser ce type d’outils, il n’est pas nécessaire de savoir manipuler des bases de données ou d’avoir utilisé des logiciels de visualisation en amont. Néanmoins, une connaissance des enjeux et des méthodes de fouille de textes est fortement recommandée.

Programme

La formation se déroule sous forme de conférences plénières (démonstration) et d’ateliers pratiques (manipulation).

Conférences
– La constitution et l’exposition d’un corpus documentaire à partir des ressources ISTEX
– La fouille de texte et de données (TDM) et le positionnement de l’offre logicielle
– La cartographie documentaire

Ateliers
– Logiciel GarganText : la représentation cartographique de données textuelles non structurées
– Logiciel NooJ – la recherche et l’extraction d’information à partir de ressources linguistiques
– Logiciel Alvis : l’extraction d’information et l’exploration documentaire basées sur des ontologies
– Logiciel Weka et Notebook : l’apprentissage automatique pour la classification textuelle
– Logiciel Iramuteq : l’exploration de corpus par des recherches thématiques 

Informations pratiques

Les participants devront rapporter leur matériel informatique et installer certains logiciels en amont de la formation. Les procédures d’installation seront transmises au mois d’octobre 2021

Lieu : Institut des systèmes complexes – Paris Ile-de-France
Adresse : Espace Totem au 11 place nationale, 75013 Paris
Date : du mardi 16 novembre au mercredi 17 novembre 2021
En savoir plus


2020


Action nationale de formation
ANF TDM 2020 – Exploration documentaire et extraction d’information

Chaque année le monde de la recherche accélère et développe sa production scientifique. L’apport massif de données et de publications, associé à la multiplication des canaux de diffusion, complexifie l’exploration de la littérature scientifique.

Afin de répondre à ces nouveaux enjeux, les activités de recherche bibliographique, d’état de l’art, de veille scientifique, etc. s’appuient de plus en plus sur des outils sémantiques et des logiciels de traitement de l’information. Des solutions informatiques qui permettent de repérer, d’extraire, d’organiser, de trier, de combiner, d’explorer, d’analyser et de partager un corpus de données.

Inscription

Cette formation a pour objectif de faire monter en compétence les chercheurs et chercheuses, doctorant(e)s et ingénieur(e)s d’appui à la recherche qui souhaitent mettre en place ou développer l’exploration documentaire et l’extraction d’informations dans leur activité.

ANF TDM 2020
les 18 et 19 novembre 2020

Formulaire d’inscription (60 places) – choix des ateliers du 19 novembre 2020

Si vous souhaitez vous perfectionner ou si vous êtes appelés à utiliser ce type d’outils, il n’est pas nécessaire de savoir manipuler des bases de données ou d’avoir utilisé des  logiciels de visualisation en amont. Néanmoins, une connaissance des enjeux et des méthodes de fouille de textes est fortement recommandée.

Programme

La formation se déroule sous forme de conférences plénières (démonstration) et d’ateliers pratiques (manipulation).

Conférences
– La constitution et l’exposition d’un corpus documentaire à partir des ressources ISTEX
– La fouille de texte et de données (TDM) et le positionnement de l’offre logicielle
– La cartographie documentaire

Ateliers
– L’extraction d’information et l’exploration documentaire basées sur des ontologies (Alvis)
– La représentation cartographique de données textuelles non structurées (Gargantext)
– L’apprentissage automatique pour la classification textuelle (Weka et Notebook)

Informations pratiques

Lieu : Institut des systèmes complexes – Paris Ile-de-France
Adresse : Espace Totem au 11 place nationale, 75013 Paris
Date : du mercredi 18 novembre au jeudi 19 novembre 2020
En savoir plus


LIBER Webinar

How Can Libraries Support TDM?

Europe’s new Copyright Directive includes a mandatory text and data mining (TDM) exception for non-commercial research. This opens up new opportunities for libraries to support researchers in this exciting new area of work.

In this webinar, organised by LIBER’s Copyright & Legal Matters Working Group, two LIBER libraries will share what they are doing to help researchers access and analyse more content through text and data mining.

Informations pratiques

Date : Thursday, March 12, 2020 – 11:00 am – 12:00 pm (Amsterdam)
Complete registration on the website


2019


Ateliers pratiques URFIST

Plateforme ISTEX et visualisation cartographique

Les équipes ISTEX et leurs partenaires se sont déplacés dans une vingtaine de villes françaises en 2018 dans le cadre de l’événement ISTEX Tour pour réaliser des démonstrations sur le fonctionnement de la plateforme ISTEX et des services associés de fouille de textes.

L’enquête de satisfaction diffusée auprès des participants a révélé une volonté d’aller plus loin dans l’usage des services et des outils présentés au cours d’ateliers pratiques.

Les équipes ISTEX s’associent cette année au réseau des URFIST pour proposer des « ateliers pratiques ISTEX ». Ces ateliers d’une journée permettront aux participants la prise en main des services et des outils de constitution, de visualisation et d’exploration d’un corpus thématique.

Ateliers ISTEX et cartographie – URFIST 2019-2020

Ils ont également pour objectifs de renforcer la communauté d’utilisateurs des ressources ISTEX et d’éveiller les pratiques documentaires vers la fouille de textes et de données (TDM).

Programme de la journée

Matin (9h30-12h30) : découvrir la plateforme ISTEX et services intégrés
-> 30min d’introduction et 2h30 de manipulation de corpus

  • Atelier : Construire et valoriser un corpus spécialisé à partir de la base de données ISTEX

Après-midi (14h-17h) : Visualiser et analyser les métadonnées d’un corpus documentaire (choix d’un atelier pour l’ensemble des participants)
-> 45min de théorie et 2h15 de manipulation cartographique

  • Atelier 1 : Exploration d’un corpus documentaires ISTEX à l’aide de l’outil de cartographie Gargantext
  • Atelier 2 : Exploration d’un corpus documentaires ISTEX à l’aide de l’outil de cartographie Cillex

Informations pratiques

Cette formation est à destination des acteurs de la recherche : des chercheurs, des doctorants, des services d’appuis à la recherche et des personnels de bibliothèques universitaires.

Lieu : salle informatique des URFIST
Date : juin 2019 à mars 2020
Inscription obligatoire sur SYGEFOR
Retrouver l’intégralité des dates et des liens d’inscription


2018


ISTEX Tour

Présentation de la plateforme ISTEX et des services associés

La plateforme ISTEX met à disposition de la communauté de l’enseignement supérieur et de la recherche (ESR) française un accès numérique à des collections de la littérature scientifique dans toutes les disciplines.

ISTEX Tour est la première campagne de communication qui mobilise les équipes ISTEX et leurs partenaires (Univ Lorraine, INRA, ISC-PIF, CLLE, etc.).

Déplacements ISTEX Tour 2018-2019

Plus d’une vingtaine de déplacements, d’octobre 2018 à décembre 2018, ont été fixés avec les universités de France métropolitaine pour présenter la plateforme numérique ISTEX et les service de fouille de documentaire associés.

Informations pratiques

Lieu : bibliothèque universitaire
Date : octobre 2018 à décembre 2018
Consulter la Timeline pour connaitre les dates de déplacement