1

6 La navigation dans le manuel de Kentika est réservée aux utilisateurs identifiés



Thesaurus : Présentation et glossaire

Thesaurus : présentation et glossaire

Présentation

Un thesaurus est un ensemble de termes normalisés, qui sont utilisés pour représenter le contenu thématique des documents ou informations à des fins de classement et de recherche.

Cette technique de classement est issue de la gestion documentaire ; elle nécessite pour le débutant l'apprentissage des termes qui lui sont spécifiques.

Glossaire

Descripteur

Un descripteur peut être un terme simple (uniterme) ou un groupe de mots pour lequel toute ambiguïté de sens a été levée. Par convention, la forme des termes du thesaurus est le substantif masculin singulier.

Même s’il peut s’agir d’une simple liste alphabétique, le principe du thesaurus est d’organiser les descripteurs de manière conceptuelle : ils sont regroupés par affinité sémantique et sont complétés d’indications de relations.

Les relations

Relation de synonymie

Pour éviter de trouver dans le thesaurus des termes qui ont un sens identique ou très proche, ou différentes formes d’écriture, on va retenir une forme préférentielle qui sera le descripteur. Les autres termes seront gérés comme des synonymes : l’emploi d’un synonyme en saisie comme en recherche renverra implicitement au descripteur correspondant.

Exemples : Automobile a pour synonyme, c’est-à-dire est employée pour Voiture. A l’inverse, on dira pour Voiture qu’il faut employer Automobile.

Note d’application

Il s’agit d’un commentaire ou d'une définition qui permet de préciser le contexte d’utilisation du descripteur, au cas où il serait très technique ou ambigu, parce que disposant de plusieurs sens (polysémie).

Relation de hiérarchie

La principale relation est une relation de hiérarchie de manière à disposer d’une arborescence.

Le premier niveau du thesaurus est appelé descripteur maître . Chaque descripteur maître va se décliner en sous-thèmes, qui eux-mêmes peuvent se décliner en sous-thèmes, etc. En général, on conseille de ne pas dépasser 4 niveaux de hiérarchie.

Lorsque l’on descend dans l’arborescence, on parle de termes spécifiques. Lorsque l’on remonte dans l’arborescence, on parle de termes génériques. Les relations s’établissent avec les termes du niveau immédiat.

Exemple

  • France
    • Île-de-France
      • Paris
    • Essonne
    • Alsace
      • Haut-Rhin
      • Bas-Rhin
    • PACA

On dira que France a pour termes spécifiques les différentes régions françaises (Alsace, Ile de France, PACA, etc). Chaque région a pour termes spécifiques ses départements (ex : Alsace a pour termes spécifiques Haut-Rhin et Bas-Rhin).

A l’inverse, on dira que Haut-Rhin et Bas-Rhin ont pour terme générique Alsace, qui lui-même a pour terme générique France.

En général, un descripteur n’a qu’un terme générique . Cependant, Kentika accepte la poly-hiérarchie, ce qui permet d’attribuer plusieurs termes génériques à un même descripteur.

Relation d’association

Elle permet de faire un renvoi de type "Voir aussi" d’un descripteur vers un autre descripteur du thesaurus, qui appartient en général à une branche différente.

Abréviations

Toutes ces relations sont matérialisées par des abréviations :

  • TG : terme générique
  • TS : terme spécifique
  • TA : terme associé
  • EP : employé pour
  • EM : employer
  • NA : note d’application

Candidat

Un candidat descripteur est un terme utilisé sur des notices mais non encore positionné dans le thesaurus. Il n'est même pas sûr qu'à terme, il soit conservé.

Les Candidats sont tous regroupés sous le descripteur maître (si vous travaillez en mono-thesaurus) ou le thesaurus (si vous travaillez en multi-thesaurus) intitulé "Candidat".

Si vous disposez uniquement des autorisations de créer des candidats, tout terme que vous créerez à partir d'un champ de type thesaurus sera positionné sous le terme candidat ainsi que sous le descripteur maître ou thesaurus contrôlant ce champ.

Utilisation du thesaurus

Les relations existantes entre les termes permettent, lors de la saisie d’une fiche, de sélectionner les termes correspondant bien au sujet traité, de manière à ne pas utiliser un terme qui serait trop large ou trop précis.

Exemple, pour un document traitant de la région Alsace, on va utiliser le descripteur Alsace, et non les descripteurs France (qui est large), ou Haut-Rhin ou Bas-Rhin (qui sont trop précis et qui sont de toutes manières englobés dans Alsace).

Lors de la recherche, on pourra rechercher sur un terme précis (exemple Alsace), ou demander à étendre la recherche à ses termes génériques, spécifiques et associés. Ce déploiement est appelé autopostage .

Par exemple, la recherche sur Alsace avec un déploiement sur ses termes spécifiques permet de retrouver les fiches indexées avec les termes Alsace ou Haut-Rhin ou Bas-Rhin.

Mono / multi-thesaurus

Selon les paramètres définis en Préférences, la base peut contenir un ou plusieurs thesaurus.

Mono-thesaurus

Cela signifie que tous les descripteurs appartiennent à un même corpus. Un descripteur n'est créé qu'une seule fois, mais peut si nécessaire être rattaché à plusieurs branches. Le premier niveau du thesaurus correspond aux descripteurs maîtres.

Multi-thesaurus

Cela signifie que l'on peut gérer plusieurs thesaurus, qui sont indépendants les uns par rapport aux autres.

Chaque terme de premier niveau sera considéré comme nom d'un thesaurus. Un même terme pourra être enregistré plusieurs fois dans la base s'il figure dans des thesaurus différents.

Méthodologie de constitution du thesaurus

Deux cas de figure peuvent se présenter suite à l'analyse que vous avez menée :

vous savez ce que vous allez gérer avec le thesaurus ;

vous ne savez pas encore comment vous allez utiliser cet outil.

Si vous avez déjà une idée de ce que allez gérer dans le thesaurus, nous vous suggérons d'adopter la démarche suivante :

1 - Identifier les descripteurs maîtres

Les descripteurs maîtres sont les descripteurs qui n’ont pas de générique, à partir desquels vous allez déployer successivement les différents niveaux.

2 - Identifier les sous-niveaux

Si la constitution d'un thesaurus complet représente un travail important difficile à effectuer a priori, il est recommandé de réfléchir à la structuration des premiers niveaux. Au fur et à mesure que vous allez saisir de nouvelles fiches, votre thesaurus va s'enrichir de nouveaux descripteurs, ces descripteurs pourront ensuite être positionnés les uns par rapport aux autres.

Quelques descripteurs maîtres se retrouvant généralement dans un thesaurus :

géographie : découpage pays / région / département / ville ;

secteur d'activité ;

sciences humaines.

Certains descripteurs sont difficiles à positionner sous un descripteur maître. On préférera créer un descripteur maître : "Mot outil" ou "Divers" plutôt que les laisser indéfiniment sous "Candidat" ; en effet ce descripteur maître ne doit être qu'un descripteur maître de transit.

Votre base peut contenir plusieurs champs de type "Valeur thesaurus". Pour ces champs, il est parfois nécessaire de développer un descripteur maître dans le thesaurus afin de bénéficier de la structure imbriquée des informations.

Si vous n'avez aucune idée de ce que vous pouvez gérer dans votre thesaurus, contentez-vous dans un premier temps d'indiquer des descripteurs au niveau des fiches. Ces descripteurs sont créés comme "Candidat" (rattachés au descripteur maître "Candidat"). Ensuite, après quelque temps d'exploitation de votre base, faites une édition de l'ensemble de ces descripteurs et dégagez les différents descripteurs maîtres sous lesquels ils pourront être regroupés ; créez ces descripteurs maîtres ; puis pour chacun des descripteurs maîtres ainsi créés, structurez votre thesaurus en vous inspirant des quelques exemples cités ci-dessus.

Dans tous les cas, n'oubliez pas d'enrichir votre thesaurus de synonymes (exemple : ONU peut avoir pour synonymes : O.N.U. et Organisation des Nations Unies), cela facilitera les saisies et les recherches et vous évitera d'avoir à vous rappeler la manière dont vous avez écrit ces descripteurs.

 

Affichage sur le web

 

Sur l'interface web, vous pouvez accéder aux descripteurs depuis la table Thesaurus ou depuis les fiches documents qui ont été indexés avec des descripteurs.

 

 

Affichage des descripteurs à partir de la table Thesaurus​

Les descripteurs qui apparaissent en gras sont ceux qui ont été utilisées dans des fiches.

Le nombre entre parenthèses indique le nombre de fois de documents indéxés avec ce descripteur.

 

Fiche descriptive d'un descripteur

 

 

La fiche du descripteur "Classique" contient liste des documents indexés avec ce descripteur

Naviguer dans l'arborescence

 

Des flèches permettent de naviguer dans l'arborescence et de déployer les termes que vous souhaitez.

Déployer le descripteur

 

 

Le descripteur est déployé sur un seul niveau, tous ses termes spécifiques apparaissent

Déployer toute l'arborescence

 

 

Toute l'arborescence du descripteur est déployée​

Fiche descriptive d'un document

 

La liste des descripteurs ainsi que leur arborescence apparaît sous le descriptif du document.

 

Affichage des descripteurs à partir d'une fiche Document