INDEXATION DES RESSOURCES ÉDUCATIVES

Indexation

Présentation

L'indexation est utilisée pour faciliter la recherche, la classification et l'organisation des objets documentaires. C'est est la pierre angulaire de nombreux processus de gestion des connaissances.

Lors d'une recherche documentaire à travers un moteur qui indexe une base de documents, tous les documents indexés par les mêmes mots clés du langage documentaire sont retrouvés, indépendamment de la langue ou de la présence ou non des mots dans le reste du document.

Lors de l'analyse de corpus (Text Mining), les mots clés sont utilisés pour analyser un corpus textuel avec des méthodes statistiques ou linguistiques et permettent d'obtenir des résultats plus précis. Pour la veille informationnelle, la sélection de mots clés permet de construire des équations de recherche pour surveiller les sources.

En Linked Open Data, en alignant les différents vocabulaires avec les technologies du web sémantique, on peut comparer les termes communs ou différents et enrichir des vocabulaires avec des informations contenues dans les autres vocabulaires (termes équivalents, traduction dans d'autres langues). Quand on traite des ensembles de données indexées avec des vocabulaires contrôlés il est plus facile de rechercher de l'information et de lier des données en utilisant ces vocabulaires » (Pascal Aventurier, Qu'est-ce que l'indexation ? 2015)

L’indexation de ressources éducatives s'inscrit dans une chaîne éditoriale globale qui implique plusieurs acteurs autour d'un système d'information à finalités pédagogiques.

DéfinitionPortail UNT

« Indexer une ressource signifie la caractériser en y associant des « métadonnées » qui décrivent le document (date, auteur, mots-clés, niveau, critères, type de ressource, cycle de vie, etc.). Il est primordial d'indexer les ressources éducatives afin d'en faciliter la recherche et la diffusion. C'est un élément clé de la mise à disposition des ressources. Le principal enjeu lié à l'indexation est, en effet, la bonne accessibilité de la ressource : plus les métadonnées sont correctement renseignées, plus la ressource est identifiable par un moteur de recherche. L'indexation permet également de gérer et de protéger les droits (d'accès et de propriété intellectuelle) ainsi que d'authentifier un texte (via l'encodage d'une signature) » (Portail UNT : http://univ-numerique.fr/).

DéfinitionViviane, C., & Céline, P. (ADBS)

Processus destiné à représenter, au moyen des termes ou indices d'un langage documentaire ou au moyen des éléments d'un langage libre, les notions caractéristiques du contenu d'un document (ressource, collection) ou d'une question, en vue d'en faciliter la recherche, après les avoir identifiées par l'analyse. Les combinaisons possibles des notions identifiées sont représentées explicitement (indexation pré-coordonnée) ou non (indexation post-coordonnée) en fonction des possibilités du langage documentaire utilisé.

Viviane, C., & Céline, P. (2013). L'information professionnelle. Lavoisier.

DéfinitionMénillet, Dominique. Thésaurus et indexation. Bulletin des bibliothèques de France [en ligne], n° 5, 1993

L'indexation est l'opération qui consiste à décrire et à caractériser un document à l'aide de représentations des concepts contenus dans ce document, c'est-à-dire à transcrire en langage documentaire les concepts après les avoir extraits du document par une analyse.

La transcription en langage documentaire se fait grâce à des outils d'indexation qui appartiennent à deux grands types :

  • classificatoire : les éléments d'information sont classés selon un ordre logique regroupant les notions plus particulières sous des notions plus générales. Il y a des emboîtements de classes l'une dans l'autre ;

  • combinatoire : les notions sont rangées par ordre alphabétique des mots qui les expriment. Ces outils combinatoires rassemblent un ensemble de termes, descripteurs ou mots clés, pouvant se combiner entre eux lors de l'indexation pour exprimer des notions complexes.

Ces derniers ont l'avantage de permettre une description fidèle du contenu du document sans la contrainte d'une structure de classification préalable qui rend difficile l'introduction de tout aspect nouveau.

La recherche bibliographique automatisée et l'utilisation de la logique booléenne pour formuler les questions ont favorisé la recherche par mots clés. Les performances de cette recherche (pertinence et rappel) sont directement en liaison avec la qualité de l'indexation, c'est-à-dire de la saisie des données. Ceci implique des règles précises d'indexation d'une part, et l'utilisation d'un langage documentaire normalisé d'autre part.

Ménillet, Dominique. Thésaurus et indexation. Bulletin des bibliothèques de France [en ligne], n° 5, 1993 [consulté le 08 janvier 2016]. Disponible sur le Web : <http://bbf.enssib.fr/consulter/bbf-1993-05-0044-009>. ISSN 1292-8399.

DéfinitionHUYNH-KIM-BANG Benjamin

L'indexation sur le Web est le processus pendant lequel les contenus des pages Web sont parcourus et analysés afin d'en extraire une organisation générale. Cette organisation est ensuite employée pour répondre aux requêtes des utilisateurs. Google réalise ce processus de manière automatique, à l'aide de machines qui parcourent régulièrement les pages du Web, et créent un index associant les pages aux termes issus de leurs contenus.

HUYNH-KIM-BANG Benjamin (2009). Indexation de documents pédagogiques : fusionner les approches du Web Sémantique et du Web Participatif. Informatique [cs]. Université Henri Poincaré - Nancy I, 2009. [https://tel.archives-ouvertes.fr/tel-00452259]

PrécédentPrécédentSuivantSuivant
AccueilAccueilImprimerImprimer Mokhtar Ben Henda PaternitéRéalisé avec Scenari (nouvelle fenêtre) modèle documentaire TechnOpale