E <      ^ R    Atelier ADNX / OAI > Le protocole OAI >                

 

Les objets documentaires

2005-05-25 / 2005-06-22
Sévigny, Martin (AJLSM, France)

Le protocole OAI définit trois objets fondamentaux : la ressource , l'item et l'enregistrement (record ).

Ressource
La ressource est le véritable objet dont il est question dans une application documentaire. Autrement dit, si des métadonnées sont des données à propos de quelque chose , la ressource est ce quelque chose.
Une ressource peut être physique ou numérique . Un livre imprimé peut être une ressource, et une monographie numérique (numérisée par exemple) peut également en être une.
Le protocole OAI ne définit pas d'instructions qui s'intéressent aux ressources comme telles . Mais il est important de bien comprendre la nature de cet objet pour comprendre celle des deux autres.
Item
L'item est un ensemble de données descriptives, structurées et numériques , à propos de la ressource. Il s'agit en quelque sorte de la fiche signalétique, de catalogage, à propos de la ressource.
L'item est un objet bien réel pour un entrepôt OAI, mais le protocole ne spécifie pas comment ces items sont gérés, stockés, etc.
Enregistrement
L'enregistrement est un jeu de métadonnées dans un format spécifique . Il s'agit donc d'une manifestation réelle d'un item. Ce sont des enregistrements qui sont échangés par le protocole OAI.

Pour mieux comprendre ces trois types d'objets, prenons le cas relativement simple d'un catalogue de bibliothèque, catalogue qui serait géré à l'aide d'une base documentaire.

Dans ce catalogue, les ressources sont les documents que possède la bibliothèque : monographies, périodiques, etc. Le catalogue ne gère pas directement ces ressources.

Pour chaque document que possède la bibliothèque, le catalogue contient une fiche qui décrit ce document : titre, auteur, date de publication, etc. Concrètement, les utilisateurs – y compris les utilisateurs avertis – n'ont pas besoin de savoir comment est stockée ou gérée cette fiche et l'ensemble des fiches. Est-ce une base de données relationnelle ? Une base de données XML ? Un index lié à un moteur de recherche ? Peu importe. Ces fiches constituent les items au sens OAI.

Enfin, dans un souci d'interopérabilité, la base documentaire est en mesure d'exporter chaque fiche en XML, soit en Dublin Core, soit en MarcXML. Ainsi, pour chaque document que possède la bibliothèque, et donc pour chaque item, nous sommes en mesure d'obtenir deux fiches en format XML. Chacune de ces fiches constitue un enregistrement au sens OAI.

Le protocole OAI insiste également – et avec raison – sur l'importance des identifiants dans une infrastructure d'interopérabilité. Ainsi, un item doit avoir un identifiant unique qui l'identifie de manière unique parmi tous les items de l'entrepôt. Et c'est bien l'item qui possède cet identifiant unique, et ce même si cet item peut se manifester en plusieurs enregistrements, qui feront tous référence à ce même identifiant.

Ces définitions nous permettent déjà de préciser un point par rapport à une méthodologie de mise en œuvre du protocole OAI . En effet, il sera fondamental de bien identifier les items et les enregistrements qui devront être gérés par notre système, que ce soit pour un entrepôt ou un moissonneur, ainsi que leur identifiant.