IHRIM (CNRS 5317)

Indexer les corpus numériques

Description et organisation

En effet, la constitution d’index est un véritable enjeu scientifique et technique, pour lequel il existe encore peu de documentation. Les index relèvent, avec l’annotation, de l’exploitation scientifique des textes édités : ils sont des outils de navigation dans le corpus et participent à sa compréhension en identifiant les personnes, les lieux et les œuvres mentionnés, ainsi que les matières traitées. L’exploitation de ces données aide par exemple à visualiser des réseaux de relations. Les référentiels et les notices d’autorités permettent d’uniformiser et de consolider les index grâce à l’emploi d’un vocabulaire contrôlé et de formes normalisées. Ils apportent des solutions au traitement des variantes des patronymes, des toponymes et des titres d’ouvrages. Dans la perspective du Linked Open Data, l’alignement sur des référentiels aide à enrichir les données d’un projet en les complétant avec d’autres ressources et bases de données (data.bnf.fr, IdREF, VIAF, ISNI). Le séminaire, fondé sur le partage d’expériences d’ingénieurs et de chercheurs impliqués dans l’édition de corpus numériques, vise à définir les bonnes pratiques utiles à l’établissement d’index, pour identifier et documenter de manière univoque une notion ou une entité nommée.

Programme

09h15 Accueil

10h00 Ouverture Pratiques des référentiels Présidence de séance Philippe Colantoni (UJM Saint-Étienne, vice-président délégué au numérique)

10h30 François Mistral | ABES, responsable d’IdRef-Autorités | IdRef : une offre de services à destination de la recherche pour enrichir les données et accroître leur interopérabilité.

11h30 Francesco Beretta | CNRS, LARHRA UMR 5190 | Encodage sémantique de textes historiques et référentiels publics : retours d’expériences et perspectives. Indexation et corpus numériques Présidence de séance Thomas LebarBé (Université Grenoble Alpes, coordinateur du Consortium Cahier)

14h00 Emmanuelle Morlock | CNRS, HISOMA UMR 5189 | Indexation et qualification des contenus en TEI : méthodes, outils et exploitations possibles. 15h00 Thierry Joliveau | UJM Saint-Étienne, EVS UMR 5600 | Retrouver, annoter, cartographier et analyser les entités spatiales nommées dans un corpus de romans parisiens.

16h00 Laurent Capelli | CNRS, Huma-Num | Collectes, enrichissements et normalisations sur ISIDORE, la plateforme d’accès aux données numériques des SHS.

Contact

Le séminaire est ouvert à tous, sur inscription à cette adresse : ihrim-seminaire-index@univ-st-etienne.fr

Ce événement a reçu le soutien du Consortium Cahier et de la MSH Lyon-Saint-Etienne.

(Text by the organizers)

Lien

http://ihrim.ens-lyon.fr/evenement/indexer-les-corpus-numeriques

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *