Le projet de création d’un thésaurus
Les étapes d’un projet de création de langages documentaires
La phase de collecte
- Collecter le vocabulaire nécessaire pour la description du contenu des documents à traiter.
- 2 méthodes en théorie
- Analytique (ou déductive) : on part des documents primaires (le fonds à traiter) et on identifie le vocabulaire nécessaire
- Synthétique (ou inductive) : on part d’ouvrages de référence sur les thèmes abordés par le fonds et on détermine le vocabulaire sans consulter les documents du fonds
- En pratique, les deux méthodes sont utilisées de manière complémentaire → c’est cette méthode que vous serez amené à utiliser dans le contexte du projet de fin d’année
Au terme de la phase de collecte
- Lors de la phase de collecte, l’accent était placé sur l’identification des termes décrivant les sujets des articles
- Conséquences :
- Nous avons toute la richesse de la langue pour décrire des sujets semblables
- Nous avons des termes vagues
- Nous avons des termes génériques
- …
Regroupement des termes par thèmes
C’est-à-dire un regroupement basé sur l’appartenance du terme représenté dans un domaine, un sous-domaine ou un champ d’activités de la discipline décrite dans le thésaurus
- Avantages
- Mise en avant du contexte d’utilisation
- Facilite l’établissement de relations d’équivalence conceptuelle, d’inclusion ou d’association
- Découpage thématique → subjectif (variation possibles entre deux thésaurus portant sur le même sujet, et donc ayant des listes de thèmes différents)
- Astuce
- Certains termes peuvent appartenir à plusieurs catégories → leur assigner une seule catégorie temporairement, ces termes étant souvent trop généraux ou trop ambigus pour être choisis comme descripteurs
(Source : Hudon, 2001)
Regroupement des termes par facettes
C’est-à-dire le regroupement des termes représentant des concepts de même nature et donc l’énoncé de la définition ferait intervenir des mots comme :
- Processus consistant en …
- Outil servant à …
- Propriété d’un objet qui …
- Personne qui fait …
- …
Donc une facette est indépendante de toute discipline ou environnement d’utilisation
(Source : Hudon, 2001)
Regroupement des termes par facettes — Quelques facettes classiques
- Ranganathan (1933) : PMEST = Personnalité ; Matière ; Énergie ; Espace ; Temps
- Classification Research Group (1955) : Personnalité ; Matière ; Énergie ; Espace ; Temps ; Entité ; Attribut ; Activité
- Van Slype (1987) : Équipement ; Être vivant ; Matériau ; Organisation ; Phénomène ; Processus ; Propriété
(Source : Hudon, 2001)