Intégration dans l’écosystème web
Web des données
Avant de traiter du web des données il est important de définir le contexte dans lequel il se situe.
En effet, à la base du web des données se trouve le web sémantique. Le web sémantique, comme définit par Tim Berners Lee, repose sur le principe de l’enrichissement des données produites dans un écosystème numérique par des métadonnées, soit des données qui décrivent d’autres données et qui relient des données entre elles (Melhem, 2017). Les institutions culturelles ont rapidement compris le potentiel du web sémantique dans une optique d’interopérabilité technique qui permet aux différents systèmes de partager des données et les relations entre ces données (Loyant, Deraze, 2016).
Le web sémantique se base sur trois standards : RDF (Ressource Description Framework) qui définit la syntaxe, les URI (Unique Resource Identifiers) qui permettent d’identifier de manière univoque une ressource et SPARQL qui permet la construction de requêtes en RDF.
RDF est un modèle de description des données dans lequel toute ressource est identifiée par une URI, et où l’on peut faire des assertions ou déclarations sur ces ressources sous la forme d’un triplet sujet/prédicat/objet (BnF, 2017).
Modèles conceptuels
Nous avons choisi de définir le modèle conceptuel dans le sens de la définition d’Emmanuelle Bermès : « un cadre conceptuel permettant de comprendre clairement sous une forme précisément exprimée et dans un langage qui soit parlant pour tout le monde, l’essence même de ce sur quoi la notice bibliographique est censée renseigner, et l’essence même de ce que nous attendons de la notice en termes d’adéquation aux besoins des utilisateurs. » (2016).
Le modèle conceptuel se confond régulièrement avec le modèle de données physiques. Le premier est une représentation mentale de l’organisation théorique des données
bibliographiques alors que le second définit de manière tangible le structure des données bibliographiques. Karen Coyle décrit le modèle conceptuel comme « un modèle mental de l’univers bibliographique qui reflétait une vue conceptuelle des éléments du catalogage descriptif ».
Un point important des nouveaux modèles conceptuels dont l’adoption est envisagée est la notion d’œuvre. La ressource tangible (physique ou digitale) devient, dans cette conception des métadonnées bibliographiques, l’expression d’un élément abstrait : l’œuvre. L’œuvre est considérée, dans la majorité des cas, comme l’élément originel de la ressource. Il s’agit du titre, des auteurs, de la langue originale et des sujets de sa création.
Modèle actuel
Le modèle utilisé actuellement en Suisse est un modèle à deux niveaux descriptifs : notice bibliographique et notice d’exemplaire. Ce modèle a été largement utilisé dans le monde entier depuis l’informatisation des catalogues des bibliothèques. Il commence à être remplacé dans de nombreuses bibliothèques par les deux modèles suivants, mieux adaptés au web sémantique (Decourselle, 2016).
Bibframe
Bibframe (Bibliographic Framework Initiative) est issu d’une initiative de la Library of Congress qui a commencé à le développer en 2008 et a implémenté sa première version en 2011.
Bibframe a été créé avec l’ambition annoncée de remplacer et de devenir plus international que le format MARC lequel, malgré son adoption mondiale, se décline en plusieurs adaptation .
Bibframe n’est donc pas seulement un modèle mais également un format et un vocabulaire. Dans ce travail, nous essayerons de ne considérer que le modèle conceptuel proposé par Bibframe et non le format.
Le modèle veut s’inscrire au plus près des besoins des bibliothèques et s’articule autour de trois principes:
• Différencier clairement le contenu conceptuel de sa manifestation physique ou digitale ;
• Identifier de manière univoque les entités d’information ;
• Tirer parti et exposer les relations entre les différentes entités.
La Library of Congress en est actuellement à la version Bibframe 2.0 de l’initiative.
LRM
LRM (Library Reference Model) est un modèle conceptuel de type entité-relation qui est développé par l’IFLA. Il s’agit de la consolidation de trois modèles précédemment développés : FRBR (Functional Requirements for Bibliographic Records) finalisé en 1997, FRAD modèle pour les données d’autorité, ajouté en 2009 et FRSAD pour les données matières, ajouté en 2010. LRM a consolidé les modèles FRBR, FRSAD et FRAD et les a rendus compatibles à l’écosystème du web des données .
LRM reprend les quatre tâches utilisateurs autour desquelles FRBR a été créé pour répondre aux besoins des usagers, auxquelles vient s’ajouter une cinquième tâche : « Explorer ».
Formats et règles de catalogage
MARC
Le format MARC, Machine Readable Cataloguing, permet aux ordinateurs d’échanger, d’utiliser et d’interpréter les données bibliographiques et ainsi de créer les premiers catalogues informatisés de recherche bibliographique au milieu des années 70 .
Depuis, les catalogues de bibliothèques ont beaucoup évolué et l’écosystème numérique n’a cessé de gagner en importance dans le domaine de l’information, mais le format, basé sur le catalogue sur fiche, reste pourtant le même. L’essor du web des données a définitivement rendu le format MARC obsolète, ce dernier n’étant pas compatible avec les nouveaux formats d’échanges de données. Les métadonnées des bibliothèques se sont donc retrouvées enfermées dans un silo où elles ne pouvaient échanger de l’information qu’entre elles mais étaient invisibles là où les usagers recherchent l’information : le web.
Le format n’est pas non plus adapté au changement des ressources qu’il décrit. En effet, si MARC remplit sa fonction pour les ressources physiques, ce n’est pas le cas pour les ressources immatérielles.
AACR2
La première édition des Anglo-American Cataloguing Rules (AACR) a été publiée en 1967 et sa seconde version (AACR2) en 1981. Ainsi, malgré leurs régulières mises à jour, nous utilisons des règles qui furent dictées dans un écosystème bibliographique très différent de celui dans lequel nous travaillons aujourd’hui, une quarantaine d’années plus tard (Andrew et al., 2015). Ces règles, initialement prévues pour les bibliothèques nord-américaines, ont rapidement été adoptées, avec quelques adaptations, en Europe et dans le reste du monde.
Peu adaptées à la description de ressources numériques et n’étant plus compatibles avec les nouveaux standards internationaux, elles ne sont plus mises à jour depuis 2005 et RDA les remplace à présent.
RDA
Les travaux sur les nouvelles règles de catalogage Resource Description and Access (RDA) ont débuté en 2004 pour aboutir à une première version publiée en 2010. Ces nouvelles règles ont pour objectifs de pouvoir décrire toutes les ressources numériques en plus que physiques et ne s’appliquent pas seulement au monde des bibliothèques mais également aux archives et aux musées. Elles veulent favoriser l’échange de données au-delà du milieu bibliothéconomique.RDA formalise les règles de catalogage des différentes entités de LRM : les WEMI (Zumer, Riva, 2017).
Ces nouvelles règles, adoptées dès 2013 en Amérique du Nord, ont commencé à être adoptées en Europe, notamment dans les pays germanophones. En France, l’adaptation de RDA, RDA-FR, est en cours de rédaction et sera implémenté dans la mouvance de la transition bibliographique .
|
Table des matières
1. Introduction
1.1 Contexte du mandat
1.2 Problématique
1.3 Objectifs du travail
2. Cadre conceptuel
2.1 Revue de la littérature
2.1.1 Web des données
2.1.2 Modèles conceptuels
2.1.3 Formats et règles de catalogage
2.2 Etat des lieux
2.2.1 Analyse de cas
2.2.2 Synthèse de l’état de lieux
3. Méthodologie
3.1 Echantillonnage
3.2 Hypothèses de recherche
3.3 Guide d’entretien
3.4 Collecte des données
3.5 Transcriptions
3.6 Traitement des données
4. Résultats des entretiens
4.1 Tableau des résultats finaux
4.2 Analyse qualitative des entretiens
4.3 Focus sur les bibliothèques scolaires et publiques
4.3.1 La prise de liberté en matière de règles de catalogage
4.3.2 La méconnaissance de l’évolution des standards
4.3.3 Une interface de catalogage conviviale
4.3.4 Des résumés comme points d’accès supplémentaires
4.4 Focus sur les bibliothèques spécialisées et patrimoniales
4.4.1 Une connaissance superficielle des nouveaux standards
4.4.2 La peur de la complexification du catalogage avec l’introduction de nouveaux standards
4.4.3 Un intérêt pour le multilinguisme
4.4.4 L’import de lots de données
4.5 Limites des entretiens
4.6 Synthèse des entretiens
5. Observations de catalogage
5.1 Commentaires sur les processus observés
5.1.1 Création d’une notice de fonds
5.1.2 Création de la notice d’exemplaire en différé
5.1.3 Création de liens entre plusieurs notices bibliographiques
5.1.4 Numérisation de la ressource
6. Evaluation des modèles
6.1 Interopérabilité générale
6.1.1 Intégration dans l’écosystème web
6.1.2 Adoption internationale
6.2 Complexité du catalogage
6.3 Réponse aux besoins des utilisateurs finaux
6.4 Facilité de migration des données depuis MARC
6.5 Choix du modèle
7. Modélisation des processus
7.1 Méthodologie
7.2 Cas d’utilisation
7.2.1 Importation d’une notice d’œuvre et d’une notice de manifestation
7.2.2 Création d’une notice de manifestation à partir d’une notice d’œuvre existante
7.2.3 Création d’une notice d’œuvre
8. Maquettage
8.1 Création de la maquette
8.2 Résultats
8.3 Synthèse du maquettage
9. Discussion
9.1 Perspectives
10. Conclusion
11. Bibliographie
Télécharger le rapport complet