210 likes | 407 Views
L’indexation. L’indexation avec un thesaurus. Thesaurus : définitions de l’AFNOR. Définition de l’AFNOR, 1987 :
E N D
L’indexation L’indexation avec un thesaurus
Thesaurus : définitions de l’AFNOR • Définition de l’AFNOR, 1987 : « Langage documentaire fondé sur une structuration hiérarchisée d’un ou plusieurs domaines de la connaissance et dans lequel les notions sont représentées par des termes d’une ou plusieurs langues naturelles et les relations entre notions par des signes conventionnels. »
Thesaurus : définitions de l’AFNOR • Définition de l’AFNOR, norme NF Z 47-100, 1981 : « Un thesaurus est une liste d’autorité organisée de descripteurs et de non descripteurs obéissant à des règles terminologiques propres et reliés entre eux par des relations sémantiques (hiérarchiques, associatives ou d’équivalence). Cette liste sert à traduire en un langage artificiel dépourvu d’ambiguïté des notions exprimées en langage naturel. »
Les relations entre les termes d’un thesaurus • Relations d’équivalence • Relations de hiérarchie • Relations d’associativité • Relations de définition • Relations catégorielles
Le thesaurus au sein de la RI Documents Recherche des concepts Traduction en langage documentaire Bordereau de saisie Besoin d’information Questions Recherche des Concepts Traduction en langage documentaire Formulation de la requête Thesaurus Fichier recherche Réponse
Motbis, le thesaurus du secteur éducatif • Un thesaurus élaboré à la fin des années 1980 au sein du CNDP (centre national de documentation pédagogique). • Créé à partir de langages documentaires qui existaient déjà, à savoir : Mémobase+, Mémotec, Thélyce, Rameau et Eudised. • 1ère version publiée en 1989.
Pourquoi avoir créé Motbis ? • Pour donner aux centres de documentation de l’Education nationale un outil spécifique, adapté à leurs besoins. • Motbis est un thesaurus encyclopédique (on trouve des documents relatifs à tous les domaines du savoir dans les centres de documentation des établissements scolaires). • Mais c’est un thesaurus spécialisé (usage destiné au public des établissements scolaires).
Une structure à triple entrée • Liste alphabétique permutée • Liste alphabétique structurée • Terminogrammes
Motbis en pratique (1) • Utiliser Motbis sous sa forme papier • Commencer par consulter le tome 1 pour rechercher le descripteur. • Vérifier l’usage du descripteur dans le tome 2 et lire les NA éventuelles. • Vérifier l’environnement sémantique dans le tome 3 (rappel : on ne peut choisir à la fois un TG et un TS dans la même indexation).
Motbis en pratique (2) • Utiliser Motbis sous sa forme électronique : • Entrer dans le thésaurus. • Inscrire le terme recherché il apparaît dans une liste alphabétique sur la gauche de l’écran. A ce moment-là, plusieurs solutions : • Soit il est non-descripteur : il apparaît alors en italique dans la liste. En cliquant sur le terme, on est directement renvoyé au descripteur employé pour ce mot dans le thésaurus. • Soit il est descripteur : on clique alors sur le mot pour faire apparaître l’environnement sémantique. TG, TS, EP, etc. apparaissent alors sur l’écran dans différentes « cases ». • Soit le mot n’est ni descripteur, ni non-descripteur : alors la recherche dans le thésaurus ne donne rien et il convient de chercher un synonyme susceptible d’être présent dans Motbis ou, à défaut, d’indexer le document avec ce terme dans le champ d’indexation libre du logiciel.
Un thesaurus évolutif Des évolutions qui sont le fruit d’un travail interne à l’Education nationale (Scéren, documentalistes…) et de relations étroites avec des partenaires extérieurs.
Les versions de Motbis • 1ère version en 1989. • Motbis 2 en 1992. • Motbis 3 en 1998. • Motbis 3.1 en 2001. • Des évolutions annuelles des millésimes (Motbis 2006, Motbis 2007…).
Pourquoi faire évoluer Motbis ? • Refléter le plus fidèlement possible l’évolution des connaissances dans un domaine, les intérêts et les besoins des usagers. • Combler les lacunes conceptuelles et terminologiques (ex. : toute la terminologie liée aux TIC a été intégrée pour répondre aux besoins d’indexation). • Corriger les erreurs éventuelles qui ont pu apparaître dans la version précédente (erreurs typographiques notamment).
Une création récente : www.motbis.fr • Objectif : créer une communauté d’utilisateurs. • Des services d’accompagnement sont proposés. • Des contacts avec le groupe projet sont possibles. • L’activité de conception et de maintenance est rendue visible. • Il devient possible de participer à la création du thésaurus.
Caution bibliographique fréquence d’utilisation du terme dans les documents à traiter Caution de l’utilisateur fréquence d’utilisation du terme dans les requêtes Univocité de la représentation du concept un descripteur = un seul concept un concept = un seul descripteur éviter les termes polysémiques et ambigus Compatibilité structurelle facilité d’intégration du terme dans la structure existante (réseaux sémantiques, forme du terme…) Utilisation courante de préférence, le terme choisi doit être d’usage courant s’il est précis et non ambigu Cohérence utilisation constante du même type de terme pour représenter les concepts et adoption du même niveau de langage Indépendance contextuelle capacité d’un terme à représenter une réalité détachée de tout contexte Des critères pour l’adoption de nouveaux descripteurs
Modification simple d’un descripteur Sans retentissement sur la structure conceptuelle du thésaurus. Le nouveau descripteur représente le même concept que l’ancien, il ne fait que s’y substituer. Transformation d’un descripteur en non descripteur Etudier les relations sémantiques de l’ancien descripteur et évaluer leur pertinence pour le nouveau descripteur. Ajout d’un nouveau terme au lexique Il faut apporter simultanément les modifications nécessaires à tous les descripteurs auquel le nouveau terme est relié sémantiquement (EP, EM, TG, TS…). Suppression totale d’un descripteur Possible uniquement lorsque ce descripteur n’est pas utilisé pour l’indexation et pour la recherche. S’assurer que cette non utilisation n’est pas liée à un défaut du thésaurus (descripteur utile mais orphelin), à un problème d’indexation (niveau de spécificité par exemple) ou de lien sémantique mal construit. Lorsqu’un descripteur apparaît comme superflu, il est conseillé de le transformer en non descripteur, autrement dit de garder une entrée par ce terme dans le thésaurus. Les types de modifications possibles