ETAT DES LIEUX DE LA BASE DOCUMENTAIRE
Présentation du logiciel documentaire
Lorsqu’en 1993, la décision d’informatiser la bibliothèque de l’ESJ fut prise, plusieurs logiciels furent évalués selon leurs fonctionnalités, leur accessibilité et leur coût. Le choix final s’est porté sur le logiciel ALEXANDRIE développé par la société GB.
Concept
ALEXANDRIE fonctionne dans l’environnement d’un système,de gestion de base de données nommé 4D (4eme dimension) et du système d’exploitation Macintosh.
La version complète du logiciel propose de nombreuses fonctionnalités : une palette d’icônes, renvoyant à différents modules (paramétrage, document, thésaurus, personne, emprunt, revue, commande), remplace les menus déroulants classiques.
Cette version complète est modulable selon les besoins et moyens du centre documentaire et de son public. Ainsi la bibliothèque de l’ESJ se contente des cinq premiers modules du logiciel disponible sur deux postes informatiques.
Le fonds documentaire informatisé
Quantité et nature le fonds documentaire présent sur ALEXANDRIE se compose de 4985 notices de documents saisies entre fin 1993 et début 1998.
La saisie informatique a principalement concerné le fonds spécialisé de la bibliothèque et se compose donc presque exclusivement d’ouvrages, le tableau ci dessous fait le recensement des différents types de documents que l’on peut trouver.
Les fiches sont numérotées automatiquement suivant leur ordre de saisie (la fiche 1 a été saisie la première).
Les paramètres de saisie choisis sont les suivants : titre du document, nom du / des auteurs, le type de document (la liste des types de documents est saisie au moment du paramétrage général), la cote, la date de pamtion, la date d’indexation (saisie automatiquement), l’éditeur, le nombre de pages, le prix, le nombre d’exemplaires disponibles, la langue, la collection, l’indexation par descripteurs, le résumé/commentaire, s’il existe ou non une bibliographie, s’il y a ou non des illustrations.
Alimentation et entretien de la base
Le fonds de la base documentaire est alimenté par des documents traitant d’information, de communication et de tous les aspects de la presse et du journalisme(économie, droit, histoire, techniques, métiers…).
Le choix des acquisitions repose sur le documentaliste qui se tient au courant des dernières parutions (catalogues d’éditeurs, presse spécialisée,etc…), et satisfait les demandes des étudiants et professeurs. Il rédige une liste de propositions d’achats visée par le directeur de la recherche qui donne ou non son accord. Les productions de l’école (rapports, mémoires d’étudiants, la revue du centre de recherches : Les cahiers du journalisme ), les écrits de professeurs et d’intervenants participent aussi à l’alimentation du fonds.
Aujourd’hui la politique d’acquisition poursuit la spécialisation de la bibliothèque en se limitant aux documents spécialisés en information-communication, vraiment utiles et intéressants pour le public.
Malheureusement, depuis que le personnel a été réduit à un documentaliste, la veille documentaire est réduite à son minimum.
La bibliothèque est un peu livrée à elle-même, les nouvelles acquisitions mettent beaucoup de temps à être intégrées dans le fonds et saisies dans la base, quand elles le sont.
En effet, la plus grande partie du fonds informatisé a été saisie en peu de temps (emviron un an et demi) juste après la mise en place de l’informatique, c’est à dire il y a 3 à 4 ans.
L’alimentation et l’entretien de la base ont été assurés tant que le personnel était suffisant.
Aujourd’hui, l’alimentation et l’entretien restent très sporadiques, largement insuffisants.
De plus, quand on parcourt les notices une à une, on se rend compte que le travail qui a été fourni à cette époque est plus quantitatif que qualitatif. La saisie est souvent imparfaite, des mbriques ne sont pas remplies représentant autant de possibilités perdues de retrouver les notices lors d’une recherche sur ces champs laissés vides.
Cette situation s’explique facilement : des personnes en contrat à durée déterminée ou des objecteurs de conscience ont été chargés de ce travail. D’un côté, c’est la volonté, bien compréhensible, de faire le maximum en un minimun de temps et de l’autre le manque de qualifications qui ont mené à ce résultat.
Démarches de recherche
Comme nous l’avons déjà dit, deux postes informatiques sont disponibles pour la recherche. J’ai pu disposer de l’un d’eux pendant toute la durée de mon travail.
L’accès à l’interrogation
Il existe plusieurs modes d’accès à la base qui dépendent du paramétrage effectué par la personne responsable.
Le premier mode est le mode « invité ».
A la connexion, le logiciel procède à l’identification de l’utilisateur sous la forme d’un mot de passe. En mode « invité », l’utilisateur clique directement sur l’icône d’entrée sans donner de mot de passe. Il aboutit à un écran de recherche défini : celui qui a été paramétré par le responsable de la base. C’est lui qui décide de l’écran qui sera accessible à ce niveau.
Actuellement, il s’agit de l’écran intitulé « borne de recherche », très proche de l’écran de recherche de niveau 1 dont nous reparlerons un peu plus loin.
Ce mode d’accès vous limite à cette borne de recherche, aucune saisie ou modification n’est possible à partir de cet écran, ni même l’exploration des autres modules du logiciel.
Un deuxième mode d’accès s’adresse plutôt aux utilisateurs très fréquents, familiers de la base et possédant un certain niveau d’autorisation.
Il nécessite un mot de passe personnel connu et reconnu par ALEXANDRIE et permet d’accéder à la palette complète des modules du logiciel.
En cliquant sur le module « document » puis sur le menu « action », trois options de recherche s’offrent à l’utilisateur : recherche de niveau 1, recherche de niveau 2, recherche de niveau 3. Ce mode d’accès permet donc d’exploiter trois écrans de recherche différents (du moins au plus pointu) là où le mode « invité » vous limite à un seul. Mais ici non plus, vous n’avez pas de pouvoir de modification de la base.
Le dernier mode d’accès, que nous appellerons « mode de modification », est utilisé par un « super – utilisateur », le responsable de la base, ici M. HERLIN.
Ce mode permet donc la saisie ou la modification des notices, l’entretien du thésaurus, le suivi des emprunts, l’accès à tous les écrans de recherche et à toutes les autres fonctionnalités d’ALEXANDRIE (statistiques sur le thésaurus ou la sortie d’ouvrages (non significatives à l’heure actuelle), l’édition d’étiquettes de cote, paramétrage général, et bien d’autres qu’il serait long d’énumérer ici).
Pour comprendre les outils et les démarches nécessaires à la recherche, j’ai pris connaissance des trois écrans d’interrogation que propose ALEXANDRIE.
Les écrans de recherche 2
Trois niveaux sont disponibles pour la recherche. Ils permettent de poser des requêtes de plus en plus complexes, de plus en plus pointues. Ils sont accessibles par le menu « action » du module « document ».
Le niveau 1 permet de rechercher à partir du titre, des mots du titre, du / des auteurs, des descripteurs, des références, de la date de parution, du type de document.
La présentation des résultats
Les niveaux 2 et 3 indiquent le nombre de documents répondant aux critères de la requête.
En cliquant sur le bouton « voir le résultat », ALEXANDRIE présente les notices trouvées sous la forme d’une liste.
Chaque notice comporte le titre du document, l’auteur, la cote, le numéro de fiche, l’éditeur, la date de parution. L’utilisateur peut imprimer cette liste telle quelle ou sa forme détaillée (langue, bibliographie, collection, illustration, descripteurs, résumé / commentaire). Un exemple de liste détaillée est donnée en annexe 2.
Lorsque dans la liste, une notice semble intéressante il suffit de cliquer dessus pour la consulter plus en détails. Il est également possible de l’imprimer, (cf. annexe 3)
il Après la découverte du fonctionnement général des écrans de recherche, je me suis intéressée au thésaurus en usage à mon arrivée à la bibliothèque.
Le thésaurus
Principes généraux : gestion et consultation gestion
Pour gérer le thésaurus sur ALEXANDRIE, plusieurs outils sont disponibles accessibles par le menu « action » du module « thésaurus ».
Dans le menu « action », deux choix sont possibles : « saisie rapide » ou « saisie de descripteurs ».
L’option « saisie rapide » permet de visualiser et de travailler directement sur la structure du thésaurus.
Lorsque l’on clique sur cette option, un écran apparaît séparé en deux parties :
La partie gauche permet de visualiser la structure du thésaurus, elle se transforme en direct lorsque vous effectuez des modifications.
Sur cette partie de l’écran, les descripteurs-maîtres (ou mots-vedettes ou têtes de hiérarchie) s’affichent, un bouton permet de déployer les différents niveaux de hiérarchie signifiés par un décalage sur la droite ( un terme spécifique est décalé par rapport à son terme générique). Il est ainsi possible de déployer le thésaurus jusqu’à son niveau de spécificité le plus pointu.
La partie droite de l’écran de « saisie rapide » permet de visualiser chaque descripteur dans son environnement sémantique.
Lorsqu’on clique sur un descripteur dans la partie gauche, il s’affiche dans la partie droite avec son / ses terme(s) générique(s) (TG), sa note d’application (NA), son / ses terme(s) associé(s) (TA), son / ses terme(s) spécifique(s) (TS). Un descripteur qui s’affiche sans terme générique est un descripteur- maître.
A partir de cette partie de l’écran, il est possible d’ajouter ou de supprimer des descripteurs, de créer ou de supprimer des relations très rapidement tout en visualisant les changements sur la partie gauche de l’écran.
L’option « saisie de descripteurs » permet de travailler mot à mot selon le mode d’une fiche détaillée. Elle est le seul moyen de saisir les descripteurs-maîtres.
Une première zone est consacrée à la saisie du descripteur (80 caractères maximum) et de la note d’application si nécessaire.
Une deuxième zone intitulée « relations » permet de saisir les termes générique(s) et associé(s). les relations génériques et associatives peuvent être saisies de deux manières : en tapant directement le terme dans une boîte de dialogue ou en les sélectionnant dans la liste des descripteurs déjà saisis à partir de la consultation du thésaurus.
Une troisième et dernière zone est destinée à la saisie des synonymes.
Le bouton « fiche document » de cet écran donne accès à la liste des documents indexés avec le descripteur affiché.
Pratiques d’indexation : quantité et qualité des descripteurs
Pour étudier les pratiques d’indexation et évaluer le thésaurus en usage, je me suis inspirée de la démarche de Jacques CHAUMIER3 qui se base sur les chiffres.
Quand j’ai pris connaissance pour la première fois du thésaurus de la bibliothèque, il comptait 374 termes (338 descripteurs et 36 non-descripteurs). La liste qui figure en annexe 4 reprend l’intégralité des 338 descripteurs, les relations hiérarchiques sont symbolisées par un retrait sur la droite.
J’ai commencé mon évaluation en calculant la profondeur d’indexation du fonds.
Pour cela, j’ai prélevé, au hasard, un échantillon de 2 500 notices (de la fiche n° 1 200 saisie le 21/12/93 à la fiche n° 3 700 saisie le 25/07/94)
Constat
L’accumulation de ces nombreuses observations nécessite un constat clair.
Tout d’abord, ALEXANDRIE est un logiciel documentaire performant qui s’adapte, au cas par cas, à la précision des requêtes et propose un éventail de champs interrogeables plutôt complet et accessible.
Par contre, le thésaurus en usage comporte de nombreuses et graves lacunes, l’indexation réalisée sur certains documents n’est donc pas toujours de qualité.
J’avais également constaté que sur un échantillon de 2 500 notices, 2 390 n’avaient donné lieu à aucune indexation par descripteurs. En explorant rapidement le reste dufonds, j’ai pu confirmer que le travail en la matière était très restreint.
Cela prive l’utilisateur d’un champ de recherche pourtant disponible, facile et très utile puisqu’il porte sur les thèmes des documents.
Il reste à disposition du public les possibilités de recherche en « plein texte » sur le titre, et le résumé / commentaire.
Etait-il suffisant de se limiter à ces dernières possibilités ? Que pouvait apporter un thésaurus ?
Me poser ces questions revenait à évaluer les avantages et inconvénients du « plein texte » et du langage contrôlé.
Lors de la saisie d’un document, le logiciel procède à l’indexation automatique des mots-clés du titre et du résumé / commentaire (un mot-clé est un terme ne relevant pas d’une liste de mots « vides » établie à priori par le responsable de la base).
Cette indexation est non sélective, en langage libre non normalisé.
Une recherche en « plein texte » permet ainsi d’interroger sur des mots et de retrouver des mots de toutes les formes grammaticales, de toutes les catégories du discours et sous diverses formes orthographiques alors que le thésaurus uniformise, normalise son vocabulaire (en général des noms au masculin singulier).
Lors de l’indexation, le « plein texte » est bien sûr plus avantageux puisque c’est le logiciel qui se charge d’extraire les mots-clés du titre et du résumé / commentaire au moment de la saisie.
Le « plein texte », en incluant tous les termes, permet de retrouver des concepts très spécifiques ou figurant dans peu de titres ou résumés. Mais il engendre aussi plus facilement de « bmit » lorsqu’on obtient des documents dont le titre et / ou le résumé comportent effectivement le terme recherché mais où il ne représente qu’un concept accessoire.
Le problème est le même avec les termes polysémiques : un terme pouvant exprimer plusieurs concepts, des documents dont le titre et / ou le résumé comportent pourtant le mot recherché peuvent se révéler non pertinents.
Le « silence » est également un inconvénient possible du « plein texte » parce qu’il n’existe pas de renvois entre synonymes.
Ex : une recherche sur « courrier électronique », ne vous renverra pas aux documents dont le titre et / ou le résumé comportent le synonyme « E-mail ».
Le thésaurus, s’il n’échappe pas aux problèmes de « bruit » et de « silence », comporte beaucoup moins d’imprécisions.
Le problème des termes polysèmes est résolu par l’environnement sémantique etles notesd’application qui en éclairent le sens. Les équivalences (ou relations synonymiques) permettent de retrouver des documents indexés par des termes synonymes.
Le thésaurus a le grand avantage de faire parler le même langage à tout le monde : indexeurs, logiciel, utilisateurs. Il facilite le dialogue entre ces trois acteurs du système documentaire.
Ainsi, faire une recherche en « plein texte » sur le champ résumé / commentaire peut poser des problèmes de langages. En effet, le résumé / commentaire est une opération humaine, réalisée par une personne unique qui a son propre langage. Et pas forcément le même que celui des utilisateurs…
Tel terme utilisé par l’indexeur ou par l’auteur (pour la recherche sur les mots du titre) ne sera pas forcément employé par le public à l’interrogation.
Les relations de hiérarchie et d’association facilitent la recherche des termes adéquats par tous et permet d’étendre la recherche à d’autres concepts.
Après ces réflexions, il était évident pour moi que les deux modes d’indexation et de recherche se complétaient et devaient cohabiter au sein d’un système qui, de plus, le permettait.
Un thésaurus ne pouvait qu’améliorer les performances du logiciel et l’efficacité de la recherche. La création du thésaurus ne pouvait être qu’un enrichissement pour la base documentaire, pour la redynamiser et l’entretenir alors qu’elle se figeait dans un statu quo néfaste.
Je ne pouvais me limiter à la simple structuration du vocabulaire déjà présent, trop disparate, trop désordonné, non ciblé. Il fallait construire un thésaurus de toutes pièces, ce qui allait me mener au nettoyage (nécessaire et bénéfique) de l’ancien thésaurus.
Ce projet entraînera la révision complète de l’indexation par descripteurs déjà effectuée et l’indexation des notices laissées vierges.
Il pourrait surtout être un atout pour la promotion et l’attrait de la base auprès du public en vue d’une plus grande autonomie lors des recherches. Ce qui, du même coup, libérerait un peu de temps pour notre documentaliste…
|
Table des matières
INTRODUCTION
□ 1. PRESENTATION DE LA STRUCTURE D’ACCUEIL
■1.1 L’ESJ : l’école supérieure de journalisme de Lille (p.2)
■ 1.2 Les lieux de documentation
□ 2. ETAT DES LIEUX DE LA BASE DOCUMENTAIRE
■ 2.1 Présentation du logiciel documentaire
■ 2.2 Le fonds documentaire informatisé
• 2.2.1 Nature et quantité
• 2.2.2 Alimentation et entretien de la base
■ 2.3 Démarches de recherche
• 2.3.1 L’accès à l’interrogation
• 2.3.2 Les écrans de recherche
• 2.3.3 La présentation des résultats
■ 2.4 Le thésaurus
• 2.4.1 Principes généraux : gestion et consultation
• 2.4.2 Pratiques d’indexation : quantité et qualité des descripteurs
• 2.4.3 Relations thésaurales
■ 2.5 Utilisateurs et pratique de la base
■ 2.6 Constat
a 3. ELABORATION DU NOUVEAU THESAURUS
■3.1 L’édition papier
• 3.1.1 Définition du domaine
• 3.1.2 Profil des utilisateurs et types de requêtes
• 3.1.3 Les sources terminologiques
• 3.1.4 compilation de termes
• 3.1.5 construction d’une arborescence
• 3.1.6 sélection descripteurs
• 3.1.7 établissement des relations
• 3.1.8 structuration en listes
• 3.1.9 rédaction de la version papier
3.1.9.1 Evaluation du travail
3.1.9.2 Validation
■ 3.2 L’édition informatique
• 3.2.1 Nettoyage de la base
• 3.2.2 Saisie du nouveau thésaurus
• 3.2.3 Utilisation du thésaurus
□ 4. AVENIR DU THESAURUS ET PERSPECTIVES DE LA BIBLIOTHEQUE
■ 4.1 Avenir du thésaurus
■ 4.2 Perspectives de la bibliothèque (p.30)
CONCLUSION
BIBLIOGRAPHIE
ANNEXES