Métadonnées et langages d’indexation : documents multimedia, images fixes et animées

Haute École Bruxelles-Brabant (HE2B)

2025-12-17

Planning de la séance

Valorisation des langages documentaires

Pour rappel

Avantages

  • Rappel ↗↗↗
  • Précision ↗↗↗

Désavantages

  • Coût
  • Complexité
    • Pour le professionnel (construction, maintenance, etc.)
    • Pour l’usager (l’utilisation efficace d’un langage documentaire pour la recherche reste problématique pour toute personne qui n’a pas l’habitude de l’outil)

Quelques solutions

  • Publication des langages documentaires
  • Réutilisation des langages documentaires
  • Interopérabilités des langages documentaires
  • Intégration des langages documentaires dans le web

→ Rendre les langages documentaires facilement manipulable par l’ordinateur

SKOS

  • Simple
  • Knowledge
  • Organisation
  • System

Principes

  • Vocabulaire RDF
    • → Lisibilité pour les ordinateurs (et donc possibilité d’échanges et de publication sur le web)
  • Représentant de manière semi-formelle
  • Des systèmes d’organisation des connaissances

RDF - Un acronyme

  • Resource
  • Description
  • Framework

RDF - L’usage

  • Informer à propos des ressources disponibles sur le web
    • Décrire les ressources du web

RDF - La notion de déclaration (statement en anglais)

http://www.example.org/index.html has a creator whose value is John Smith
http://www.example.org/index.html has a creation-date whose value is August 16, 1999
http://www.example.org/index.html has a language whose value is English

(Source)

Structure d’une déclaration RDF

  • Un sujet : http://www.example.org/index.html
  • Un prédicat : creator, creation-date, ou language
  • Un objet : respectivement, John Smith, =August 16, 1999, et English

→ On parle également de triplets RDF

Une structure en graphe

  • L’ensemble des déclarations RDF constitue un graphe
  • Cette notion de graphe est classique en informatique/mathématique et permet de modéliser de nombreux phénomènes complexes
  • Ce modèle peut être interrogé efficacement pour récupérer des informations, mais également pour en produire (par inférence, déduction) ce qui est une des bases d’un système sémantique

Retour au SKOS

Le vocabulaire du SKOS :

  • Concept
  • Label
  • Relations sémantiques
  • Notes
  • Schéma de concepts

Exemple de SKOS

ex:animalThesaurus rdf:type skos:ConceptScheme;
  dct:title "Simple animal thesaurus";
  dct:creator ex:antoineIsaac.

ex:animals rdf:type skos:Concept;
  skos:prefLabel "animals"@en;
  skos:altLabel "creatures"@en;
  skos:prefLabel "animaux"@fr;
  skos:altLabel "créatures"@fr.
ex:animals rdf:type skos:Concept;
  skos:prefLabel "animals"@en;
  skos:narrower ex:mammals.
ex:mammals rdf:type skos:Concept;
  skos:prefLabel "mammals"@en;
  skos:broader ex:animals.

ex:mammals rdf:type skos:Concept;
  skos:inScheme ex:animalThesaurus.
ex:cows rdf:type skos:Concept;
  skos:broader ex:mammals;
  skos:inScheme ex:animalThesaurus.
ex:fish rdf:type skos:Concept;
  skos:inScheme ex:animalThesaurus.

ex:birds rdf:type skos:Concept;
  skos:prefLabel "birds"@en;
  skos:related ex:ornithology.
ex:ornithology rdf:type skos:Concept;
  skos:prefLabel "ornithology"@en.

ex:animalThesaurus rdf:type skos:ConceptScheme;
  skos:hasTopConcept ex:mammals;
  skos:hasTopConcept ex:fish.

SKOS - Pour plus d’informations

https://www.w3.org/TR/skos-primer/

OWL

Web Ontology Language

En bref

  • Langage de description formelle d’ontologie
  • Ontologie dans ce contexte signifie une description riche et complexe des parties d’un système et de relations entretenues par ces parties pour constituer le système
    • Autrement dit, un ensemble de descriptions décrivant une partie de la réalité

Lien entre SKOS et OWL

  • Étroit puisque OWL permet une description plus fine que le SKOS
  • Très utile dans le contexte de la collaboration entre plusieurs langages documentaires puisque OWL permettra de documenter les liens entre les termes

Linked Data

  • En gros, publication des données dans un vocabulaire RDF adapté
  • Et possibilité d’interrogation en SPARQL

SPARQL

SPARQL Protocol and RDF Query Language

Alignement de langages documentaires

Propriétés d’alignement de SKOS

  • closeMatch
  • exactMatch
  • broadMatch
  • narrowMatch
  • relatedMatch

Illustration : Optimizing Elasticsearch Search Experience Using a Thesaurus

Figure 1

Illustration : Annif

Illustration : SkoHub Vocabs

Illustration : SHACL

Illustration : Topic Modeling

Illustration : Alignement de thésaurus

Illustration : llama

Illustration : LLMs4Subjects