Aperçu historique
L'index alphabétique d'un livre est sans doute la forme la plus ancienne que le concept d'indexation a pu avoir depuis la Rome antique. Dans le domaine de l'édition, une méthode d'organisation de l'information que nous tenons aujourd'hui pour acquis, à savoir l'ordre alphabétique, a été probablement la première forme conçue par les savants grecs du troisième siècle avant J.C. (à la bibliothèque d'Alexandrie en Égypte) dans le but d'aider à organiser le nombre croissant d'œuvres littéraires de l'époque.
Pour les Romains, lorsque le mot Index est utilisé en relation avec les œuvres littéraires, il voulait dire une petite fiche jointe aux rouleaux de papyrus sur laquelle le titre de l'œuvre (et parfois aussi le nom de l'auteur) était écrit pour que chaque rouleau sur les étagères pouvait être facilement identifié sans avoir à le retirer pour vérification.
Dans le premier siècle de notre ère, le sens du mot Index a été élargie d'une simple liste de « Titres » à une « Table de matières » ou une liste de chapitres (parfois avec un bref résumé de leur contenu) et donc à une « liste bibliographique » ou un « catalogue ». Or, l'index qui donne les emplacements exacts des noms et des sujets dans un livre comme nous l'entendons aujourd'hui, a été très peu pratiqué avant l'invention de l'imprimerie. L'une des raisons majeures était que les livres avaient une forme de rouleau et don il n'y avait pas de système de pagination qui aurait permis de produire des index avec des renvois exacts dans le corps du texte. Seule l'invention de l'imprimerie vers 1450 avait permis de produire des copies identiques de livres en grand nombre, de sorte que peu de temps après, les premiers index ont commencé à être courants, en particulier pour des livres volumineux et les ouvrages de référence comme les encyclopédies. Ce n'est qu'au XIXe siècle que l'indexation comme système de renvoie et de référencement du contenu d'un document ou d'une collection s'est généralisée sous l'effet de l'industrie du livre. En Grande Bretagne, la Index Society a été créée en 1877 avec le but de créer un index général de la littérature universelle. En Belgique, Paul Otlet avait aussi e, 1895 commencé le Répertoire bibliographique universel - un index universel couvrant toutes les connaissances. En 1914, cet index contenait plus de onze millions d'entrées soutenues par des fichiers texte et des illustrations. Cette œuvre d'Otlet présageait l'arrivée de l'Internet, de l'indexation automatisée et de l'accès à la totalité de la connaissance par des pointeurs d'accès. En 1934, Otlet avait publié son œuvre phare « Traité de documentation : le livre sur le livre, théorie et pratique » qui décrivait un système par lequel les connaissances seraient projetée sur un écran individuel de sorte que « dans son fauteuil, quelqu'un serait en mesure de contempler l'ensemble de la création ou certaines parties de celui-ci ».

Aujourd'hui, Internet et son modèle d'indexation et de référencement a rendu cette hypothèse une réalité.
C'était le monde des bibliothèques et de la documentation qui fut parmi les premiers à s'approprier les techniques de l'indexation et du référencement. La volonté de constituer une norme internationale en la matière s'est traduite en 1954 par la constitution d'un groupe de travail au sein de l'IFLA (Fédération Internationale des Associations des Bibliothèques), qui en 1961, présenta à la Conférence internationale sur la normalisation du catalogage tenue à Paris, un projet de norme ISBD (International Standard Book Description) validé et publié en 1971.
Avec l'arrivée du numérique, l'ordinateur a été d'une aide considérable dans la production et l'innovation des formes existantes d'index et la création de grandes bases de données référentielles (références qui renvoient vers des documents en réseau). Or, malheureusement, le World Wide Web, la plus grande accumulation de bases de données, s'est développé sans un plan de référencement d'ensemble. Seule une minorité de sites utilisent des techniques d'indexation sophistiquées. La plupart utilisent des méthodes d'indexation et de recherche à base de mots clés primitifs. La majorité des sites ne sont soumis à aucune sorte de contrôle de qualité quant à l'application et l'usage de méthodes consensuelles et normalisées d'indexation et de description des contenus bien que des spécifications, des directives et des normes internationales ont été produites dans ce but. Dublin Core, par exemple (cf. plus loin), a été une sorte de cri d'alarme poussé en 1995 par de grands acteurs de l'Internet qui ont senti le débordement incontrôlé des contenus sur Internet. Leur idée était de produire un mécanisme de description uniforme des ressources pour pouvoir les localiser et les restituer à tout instant par les moteurs de recherche. Sans valeur juridique contraignante, l'application de ce que l'on appelle des schémas de métadonnées descriptives (mots clés de description) est laissée au libre arbitre des institutions et des développeurs de sites et de contenus. Chaque domaine développe ses propres mécanismes et ses propres modèles de références. A l'instar de secteurs d'activités comme la santé, l'agriculture, ou encore la géographie, l'économie, l'éducation et l'enseignement ont aussi développé leurs propres outils d'indexation et référentiels de description de ressources et contenus pédagogiques.
L'usage des métadonnées relève d'une pratique ancienne dans les bibliothèques et centres de documentation, habitués à normaliser le signalement et le contenu des documents. Ainsi, les fiches cartonnées normalisées en 1954 sous la référence ISBD (International standard bibliographic description) ont progressivement fait place à des notices bibliographiques comme le format MARC (Machine-readable cataloging) utilisé pour la description des ouvrages, MARC ISBD(S) (International Standard Bibliographic Description for Serials), pour la description des publications en série, puis à des schémas spécifiques de description des ressources numériques, à l'instar du langage Dublin Core. Les ressources à décrire étant variées, chaque métier s'est ainsi doté de son propre langage de description (EAD (Encoded Archival Description) pour les archives, LOM (Learning Object Metadata) pour les ressources pédagogiques, RKMS (Recordkeeping Metadata Schema) pour les ressources audio ou encore CIMI consortium (Computer Interchange of Museum Information) pour les ressources muséographiques). [ENSSIB : Services et ressources, Céée le 21 novembre 2013, mise à jour le 26 mars 2014]
Complément :
Lecture recommandée
Alexandre Serres. Introduction à l'indexation, URFIST Bretagne-Pays de Loire
Susan Kovacs, « Jacques Maniez et Dominique Maniez : Concevoir l'index d'un livre : histoire, actualité, perspectives », Études de communication [En ligne], 36 | 2011, mis en ligne le 20 juillet 2011, consulté le 07 janvier 2016. URL : http://edc.revues.org/2646
Douglas J. FOSKETT, Jacques MANIEZ, « INDEXATION », Encyclopædia Universalis [en ligne], consulté le 7 janvier 2016. URL : http://www.universalis.fr/encyclopedie/indexation/