Mise en place du Thésaurus et rôle de celui-ci dans la valorisation du fonds

La comparaison et la mise en relation des termes

Cette étape permet de faire un premier tri des termes collectés. Lors de cette étape on classe les termes et on les regroupe dans les sous-domaines. La comparaison permet de repérer les groupes de termes qui expriment le même concept. La comparaison permet de voir quels sont les termes les plus pertinents et à partir de là de pouvoir choisir les descripteurs, choix qui prend aussi en compte les préférences des futurs utilisateurs du Thésaurus. Pour la réalisation de cette étape, aucune méthode n’est meilleure que les autres.
Pour les comparaisons on peut utiliser des tableurs avec Excel par exemple ou le faire manuellement. A la fin de cette étape nous nous retrouvons avec une liste de descripteurs et de non descripteurs (les synonymes).

La hiérarchisation

Cette troisième étape intègre les relations entre les descripteurs et non descripteurs c’est-à-dire les relations associatives et surtout hiérarchique. En, effet c’est essentiellement mettre en place les relations hiérarchiques entre les descripteurs. La hiérarchisation est un travail de réflexion pour couvrir au mieux le domaine de connaissance que doit traiter le Thésaurus tout en restant cohérent avec le public à qui on destine le Thésaurus. La hiérarchisation est importante car elle doit être aussi pertinente que le choix des descripteurs. Si la structure est mal pensée, les réponses à des requêtes d’utilisateur peuvent ne pas être pertinentes et ne pas satisfaire l’utilisateur. Certes un Thésaurus représente un domaine de connaissance mais représente aussi un fonds ou une base documentaire et donc une mauvaise structure peut faire que des utilisateurs peuvent passer à côté de documents qui pourraient répondre à leur requête. Il existe des logiciels capables de faire des hiérarchisations mais on peut aussi le faire manuellement en s’inspirant de Thésaurus déjà réalisé.

La validation

Quand l’élaboration du Thésaurus est finie, il faut que le Thésaurus soit validé par des spécialistes du domaine de connaissance qui est traité. En général il doit aussi être validé par les responsables avant l’utilisation du Thésaurus. Il est important aussi de réaliser des tests pour voir la pertinence du Thésaurus. Par exemple on peut expérimenter le Thésaurus en indexant quelques documents puis en le questionnant. On peut aussi réaliser une enquête pour savoir comment les utilisateurs s’approprient ce nouvel outil voire même faire une enquête de satisfaction. Les résultats de ces tests permettent de pouvoir faire des rectifications en changeant un descripteur par exemple, ils permettent de peaufiner le Thésaurus. De toute façon il est indispensable de faire valider le Thésaurus avant son utilisation et sa diffusion (en ligne par exemple).

Méthode de la mise à jour

Cette méthode reprend les étapes de la première méthode mais là on doit mettre à jour un Thésaurus qui permet son adaptation à un fonds documentaire déjà existant. Donc dans un premier temps il faut déterminer quel sont le ou les domaines de connaissance que le fonds couvre de manière à pouvoir choisir le Thésaurus qui représente le mieux le fonds documentaire. Il faut savoir qu’il est rare voire même très rare de trouver un Thésaurus qui correspondrait parfaitement à notre fonds documentaire. La plupart du temps il faut adapter, mettre à jour le Thésaurus en rajoutant ou en supprimant des descripteurs voire en ajoutant ou en supprimant des branches entières du Thésaurus. Après avoir choisi le Thésaurus qui correspond le mieux au fonds documentaire, tout un travail de réflexion se fait pour déterminer les branches et descripteurs que l’on garde et ceux que l’on supprime et de définir clairement les manques c’est-à-dire les domaines ou des parties d’un domaine de connaissance du fonds documentaire qui ne sont pas présents dans le Thésaurus. L’action de suppression est aussi importante que celle d’ajout de nouveaux termes car un Thésaurus est également un outil de recherche comme je l’ai déjà précisé précédemment. Si un utilisateur consulte le Thésaurus pour faire une recherche et que certains descripteurs ne conduisent à aucun résultat, à aucun document indexé, le Thésaurus perd de sa cohérence et de sa pertinence et induit un taux de silence élevé et sûrement une insatisfaction de l’utilisateur qui risque de se détourner de cet outil.
Concernant les descripteurs et non descripteurs que l’on ajoute, on reprend les étapes de la méthode classique. Dans un premier temps on collecte les termes, l’utilisation dans ce cas d’un ou plusieurs autres Thésaurus est souvent conseillé et bien sûr les termes sont également extrais du fonds documentaire. Puis suit l’étape de la comparaison et celui de la hiérarchisation qui ici s’accompagne d’une réflexion sur l’intégration de ces nouveaux descripteurs et non descripteurs et leurs relations sémantiques dans la structure du Thésaurus que l’on a choisi de mettre à jour. En effet il faut que la structure reste cohérente, il faut que le Thésaurus reste aussi clair que possible il ne faut pas juste rajouter un terme générique et ses descripteurs, il est souvent plus pertinent d’intégrer des descripteurs dans les chaînes hiérarchiques donc de compléter simplement le Thésaurus à petite touche.
L’étape de validation ne change pas. A la fin du travail d’élaboration, voire même pendant, il faut que le Thésaurus soit validé par des spécialistes et testé pour être sur qu’il soit pertinent pour les futurs utilisateurs. La validation se fait pour tout le Thésaurus et pas seulement pour les termes rajoutés.
Cette méthode est plus rapide que la méthode dite classique car en mettant à jour un Thésaurus les étapes de hiérarchisation et de collecte de terme sont moins longues étant donné que ce travail est en partie fait par les concepteurs du Thésaurus que l’on adapte.
Le gros du travail avec cette méthode est de savoir quels sont les termes (descripteur et non descripteur) que l’on garde et ceux que l’on supprime. Quand on utilise cette méthode pour mettre en place un Thésaurus il ne faut oublier d’avertir les concepteurs du Thésaurus de votre démarche même si ils mettent gratuitement et librement leur Thésaurus sur Internet par exemple.

Terminologie médicale f7

La terminologie : une représentation des connaissances

La Terminologie se définit le plus simplement comme l’étude des vocabulaires de spécialité que Ton peut trouver dans les domaines de connaissances. En fait la Terminologie désigne au moins trois concepts différents : l’ensemble des principes et des fondements qui régissent l’étude des termes mais aussi l’ensemble des règles qui permettent de réaliser un travail terminologique et enfin l’ensemble des termes d’un domaine de spécialité donné. L’objet de la terminologie est l’étude et la compilation de termes spécialisés.
A quoi sert la terminologie ? La terminologie est essentielle pour la structuration des connaissances grâces à la systématisation des concepts. Elle permet une meilleure communication des connaissances. Elle permet également la rédaction de textes techniques. Je rappelle que la Terminologie est une discipline autonome qui permet l’élaboration de vocabulaires, de dictionnaires, de Thésaurus et d’ontologies ayant pour objectif de permettre et de faciliter l’accès à l’information. La terminologie, à travers les vocabulaires et outils qu’elle élabore, joue un rôle majeur dans l’efficacité et la rapidité d’un système de recherche d’information. Le grand avantage des vocabulaires produits par les terminologues est leur aptitude à présenter des termes normalisés, ce qu’on appelle les descripteurs, éléments principaux des Thésaurus.
Cependant les Terminologies et les Thésaurus sont des produits différents. En effet une terminologie rassemble des termes qui appartiennent à une langue de spécialité et qui représentent des notions. Sa fonction est de faire la description notionnelle d’un domaine de connaissances, alors qu’un Thésaurus est constitué de descripteurs qui servent à indexer des documents et que sa fonction est de caractériser le contenu des documents dans un fonds documentaire. La Terminologie et le Thésaurus sont deux moyens différents pour représenter un domaine de connaissances mais la terminologie peut aider à l’élaboration d’un Thésaurus car elle présente un vocabulaire issu du langage contrôlé que Ton peut reprendre pour sélectionner des descripteurs. Les terminologies sont une source dé termes possible pour l’étape de la sélection des termes.

Particularités de la Terminologie médicale

Le domaine médical est un domaine de connaissance important qui comprend un grand nombre de disciplines, donc génère une terminologie très diverse et complexe. En fait il faudrait parler des Terminologies médicales au lieu de la terminologie médicale. Plusieurs Terminologies ont été créées dans le domaine médical en fonction des disciplines traitées et en fonction du public à qui est destinée la Terminologie. Il existe des Terminologies médicales spécialisées dans certaines disciplines comme la génétique (Gene Ontology par exemple), des Terminologies plus générales comme celle du MESH (22 995 descripteurs et 57 000 synonymes) développée et entretenue par la National Library of Medecine (NLM). On trouve aussi des Terminologies qui traitent le thème de la prévention par exemple qui sont destinées au grand public. Une des premières particularités de la terminologie médicale et qui peut paraître comme une difficulté, c’est la grande diversité des Terminologies médicales et on peut comprendre qu’un utilisateur désirant faire des recherches dans le domaine médical peut être un peu perdu dans toutes ces Terminologies.
La terminologie peut être difficile à aborder car d’une part elle contient de nombreux termes techniques et d’autre part un grand nombre de terminologies sont en anglais ce qui peut avoir pour conséquence des problèmes d’accès à l’information. Les connaissances en médecine évoluent rapidement, à tel point que les terminologues ont des difficultés à suivre, il est souvent difficile d’avoir une vue complète et cohérente du domaine de la médecine ou d’une des disciplines qui la compose, difficulté qui se répercute dans les Terminologies.
Depuis une vingtaine d’année, l’accès aux connaissances médicales est un enjeu majeur pour les professions de la santé comme pour le grand public. La production d’informations médicales, principalement textuelles, connait une augmentation vertigineuse dans laquelle internet joue un rôle important. Face à cette augmentation, la difficulté des outils de traitement de l’information n’est pas dans le stockage ni le traitement de gros volume d’information mais dans la prise en compte des spécificités du vocabulaire métier des utilisateurs, ce qui montre l’importance des terminologies à l’heure actuelle. Autrement dit, pour permettent le traitement de l’information et son stockage (ce qui implique aussi sa recherche), il faut une terminologie cohérente et complète du domaine traité ce qui est rendu difficile par l’évolution constante du domaine médicale. L’information médicale concerne aussi la gestion des dossiers médicaux des patients et notamment la communication des dossiers médicaux. Étant donné que nous vivons de plus en plus longtemps, la quantité de ce type de document augmente de plus en plus, donc on comprend que l’information médicale est un enjeu important depuis plusieurs années et à travers elle le Terminologie médicale.
La Terminologie médicale est particulière car elle est très diversifiée, majoritairement en langue anglo-saxonne, les connaissances médicales sont en perpétuelle évolution et la production d’information médicale connait une augmentation considérable, autant pour l’information pour les spécialistes que pour celle destinée au grand public.

Choix de la méthode d’élaboration et des thésaurus

Choix de la méthode de mise à jour et du thésaurus

Dans un premier temps, en concertation avec Annick Dupond, qui connaissait le fonds documentaire monographique, nous avons décidé de mettre à jour un thésaurus déjà existant pour l’adapter au fonds documentaire et donc nous avons écarté l’idée de réaliser un thésaurus original, propre au centre. Ce choix fut guidé par la contrainte de temps c’est-à-dire la durée du stage qui est de six semaines que nous avons jugé trop court pour réaliser un Thésaurus totalement original, avec la méthode que j’ai appelée classique.
Nous avons décidé d’adapter le Thésaurus du CIDDES, le Centre d’Information et de Documentation des Directions, Ecoles et Services que j’ai déjà évoqué dans la partie 1. Ce centre est plus grand que le centre de documentation de Roger Salengro et son fonds documentaire est plus important au niveau du nombre de documents et au niveau des sous domaines qui sont plus nombreux. Mais la plupart des concepts qui sont représentés par les termes génériques sont présents dans le fonds documentaire monographique du centre de Roger Salengro.

Le Thésaurus du CIDDES1

Le Thésaurus du CIDDES est constitué de 744 descripteurs et 245 non descripteurs.
Ces termes se répartissent en dix termes génériques : Ta sociologie’ qui couvre le domaine social, de la protection sociale au type de population en passant par les politiques sociales et la sociologie du travail (management, carrière,…). Le terme générique ‘droit’ couvre le domaine juridique : des différents types de droit (de la personne, de la santé, privée, public, internationale, du travail,…) aux concepts de litige et responsabilité en passant par une énumération des types de textes officiels. Le troisième ‘1a santé public’ couvre les sous-domaines suivants : la structure des établissements de santé, les soins, les pratiques de la santé et la ou les politiques de la santé. Le quatrième terme ‘1a psychologie’ est utilisé dans un sens purement médical et aussi au niveau social et du travail. Le cinquième terme ‘spécialité paramédicale’ est un petit sous domaine englobant quatre disciplines (‘cosmétologie’, ‘podologie’, ‘thermalisme’ et ‘puériculture’). Le sixième terme ‘spécialité médicale’ couvre la quasi-totalité des disciplines médicales qui font parties du domaine médical ou de la santé, pour être précis vingt-neuf grandes disciplines sont énumérées comme ‘neurologie’, ‘psychiatrie’, ‘pédiatrie’, …c’est un des sous-domaines comportant le plus de termes. En général un centre de documentation d’un établissement de santé comme celui de Roger Salengro qui élabore un Thésaurus ne cite pas toutes les disciplines médicales dans leur Thésaurus, seulement les disciplines présentes dans leur fonds documentaire et qui correspondent en règle générale aux disciplines qui ont leurs services au sein de l’établissement de santé, pour le CIDDES la situation est différente car il ne se situe pas dans un établissement de santé mais un établissement d’enseignement donc leur fonds documentaire doit couvrir un grand nombre de disciplines médicales. Le septième terme générique ‘sciences humaines’ couvre les domaines les moins en relation avec le domaine médical comme ‘l’art et la littérature’, ‘histoire’ ou ‘information et communication’ qui comprend entre autre les concepts d’aide à la recherche documentaire et la gestion documentaire. Le huitième terme ‘sciences de l’éducation’ couvre tout ce qui concerne les concours, l’éducation destinée au patient comme l’éducation sexuelle et tout ce qui est en rapport avec les formations et les méthodes pédagogiques, concepts destinés essentiellement aux étudiants. Le neuvième et avant dernier terme ‘discipline scientifique’ regroupe des disciplines non médicales mais ayant des liens avec la médecine comme la ‘chimie’ ou la ‘physique’. Enfin le dixième et dernier terme ‘la philosophie’ couvre le thème de la moralité dans la médecine avec notamment ‘l’éthique’ et ‘la déontologie’.
Le choix de ce thésaurus a été fait car d’une part la majorité des sous domaines traités dans ce Thésaurus se retrouvent dans le fonds de monographique du centre de Roger Salengro, d’autre part la responsable avait l’idée d’un projet de thésaurus commun à tous les centres de documentation du CHRU, certes dans chaque centre le Thésaurus serait légèrement différent car il ne traite pas des mêmes disciplines médicales mais certains sousdomaines se retrouvent dans tous les centres de documentation comme la gestion d’un service ou le management ou encore le droit, des points communs existent. Donc nous avons choisi ce Thésaurus car il est pertinent et qu’il a été élaboré par un des centres de documentation du CHRU.

La sélection des termes et les contraintes rencontrées

L’analyse de l’existant

Quand je parle de l’analyse de l’existant, en fait je parle de l’analyse du Thésaurus du CIDDES de manière approfondie et dans une moindre mesure celui du réseau BDSP. En prenant contact avec la responsable du CIDDES comme je l’ai expliqué auparavant, ma responsable, Annick Dupond, s’est procurée une liste alphabétique de descripteurs et non descripteurs (les premiers en majuscule et les seconds en minuscule) dans un fichier Word. Cette liste m’a permis de prendre connaissance des termes médicaux car n’ayant pas fait d’étude de médecine et n’étant pas familiarisé avec le monde médical un certain nombre de termes de cette liste m’étaient inconnus. Donc dans un premier temps j’ai passé en revue tous les termes et pour ceux que je ne connaissais pas, j’ai cherché leur définition sur internet ou dans des dictionnaires médicaux présents dans le centre de documentation. En parallèle de ce travail, j’ai pris contact par téléphone avec la responsable du CIDDES pour lui demander de me fournir l’arborescence de leur Thésaurus, après l’avoir demandé une première fois à la personne de la maintenance de BCDI qui s’était occupée du Thésaurus du CIDDES et qui était absente lors de la première semaine du stage. La responsable du CIDDES m’a fait parvenir par mail la liste alphabétique structurée de leur Thésaurus. Pour avoir une vue plus globale de la structure du Thésaurus, j’entrepris de réaliser la liste hiérarchique du Thésaurus, ce qui m’a pris environ une semaine. Mais cette liste hiérarchique m’a permis de bien assimiler la structure c’est-à-dire les différentes relations sémantiques car j’ai en plus annoté la liste en ajoutant les non descripteurs et les relations associatives pour avoir une vue d’ensemble et complète du Thésaurus du CIDDES afin de pouvoir comprendre leur logique et la démarche qu’ils ont réalisé.

Les premières contraintes

Après avoir consulté le catalogue du fonds de monographies pour lequel je devais réaliser un Thésaurus CHR Roger Salengro avant le début du stage et après avoir pris connaissance des Thésaurus que j’ai sélectionné, j’ai constaté que le fonds est petit, 8 monographies, en nombre de documents mais couvrant plusieurs sous-domaines très divers (droit, préparation aux concours, management, livre sur la maladie d’Alzheimer,…). Donc la difficulté, ici, est de réaliser un Thésaurus qui couvre tous les sous-domaines, sans qu’il soit disproportionné au niveau de la taille par rapport au fonds documentaire monographique, de limiter les niveaux de termes spécialisés. Je m’orientais vers l’idée de fixer le nombre de mots-clés par monographie à deux ou trois voire quatre pour quelques exceptions, donc si j’ai 80 monographies, mon Thésaurus sera constitué d’environ de 200 descripteurs. Je pense que si mon Thésaurus fait plus de 300 termes la pertinence serait moindre car d’une part les futurs indexeurs risquent de ne pas utiliser tous les descripteurs et d’autre part certains ouvrages risquent de n’être indexés que par un descripteur ce qui n’est pas pertinent non plus. A côté de ce premier problème, un autre apparut mais celui-ci provenant de l’environnement du centre de documentation.

Le Thésaurus, seule solution pour l’organisation des connaissances ?

Le Thésaurus n’est pas la seule solution pour organiser des connaissances et pour l’indexation, d’autres outils existent : les grandes classifications, les folksonomies et les ontologies.
Une classification est un système organisé et hiérarchisé des connaissances dans un domaine voire la totalité des connaissances. En bibliothéconomie, la classification décimale de Dewey est la classification la plus répandue. Elle est basée sur une approche épistémologique visant à classer l’ensemble du savoir humain selon une division hiérarchique. La classification permet de situer les connaissances les unes par rapport aux autres. Elle facilite le rangement des exemplaires physiques, qui est une de ses caractéristiques. C’est le modèle le plus proche du Thésaurus car comme pour lui la sélection est basée sur la comparaison et ils sont basés sur un fonds documentaire. Mais le Thésaurus, comme je l’ai déjà dit n’a pas de vocation universelle et n’a pas directement un rôle pour la localisation physique des documents. Mais dans le cadre de ma mission, cet outil n’est pas pertinent principalement à cause de la taille du fonds documentaire trop petit.
La folksonomie désigne un système de classification collaborative, décentralisé spontané. Elle donne la possibilité à l’usager d’indexer lui-même des documents grâce à un système de mots-clés. Ce système se développe surtout dans le web sémantique (web 2.0). Cette indexation semble très efficace sur le web mais pas dans un centre de documentation car elle est faite par des auteurs non contrôlés qui peuvent être influencés par l’effet de mode et ce système est peu structuré par rapport au Thésaurus, il est beaucoup plus souple donc mieux adapté au web que le Thésaurus. Dans le cadre de ma mission ce système ne serait pas pertinent non plus car pas assez normalisé et structuré mais on peut aussi penser que les médecins risquent de ne pas avoir le temps de faire ces indexations et qu’ils considèrent que ce n’est pas leur travail.

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

Introduction 
PARTIE 1 : Présentation et description du lieu du stage et mon intégration dans ce lieu 
I Présentation du lieu où se déroule le stage
A) Le CHRU et le CHR Roger Salengro
B) Le centre de documentation du CHR Roger Salengro
II Mon intégration au sein du centre et ma mission
A) Le personnel et leurs tâches
B) Stage déjà effectué dans le centre
C) Intégration et ma mission
PARTIE 2 : Définition d’un thésaurus et méthodes de construction 
I Le Thésaurus c’est quoi
A) Petit historique
B) Définition
C) Structure
C.l Les descripteurs et non descripteurs
C.2 Les relations sémantiques
D) Fonctions, rôles et intérêt du thésaurus
II Méthodes de constructions d’un Thésaurus
A) La méthode classique
A.l La collecte des termes
A.2 La comparaison et la mise en relations des termes
A.3 La hiérarchisation des termes
A.4 La validation
B) Méthode de la mise à jour
C) Présentation du Thésaurus
C.l La liste alphabétique structurée
C.2 La liste alphabétique permutée
C.3 La liste hiérarchique
III Terminologie médicale
A) La terminologie : une représentation des connaissances
B) Particularités de la Terminologie médicale
PARTIE 3 : Mise en place du Thésaurus et rôle de celui-ci dans la valorisation du fonds
I La collecte des termes
A) Choix de la méthode d’élaboration et des Thésaurus
A.l Choix de la méthode de la mise à jour et du Thésaurus
A.2 Le Thésaurus du CIDDES
A.3 Le Thésaurus BDSP
B) La sélection des termes et les contraintes rencontrées
B.l Analyse de l’existant 32
B.2 Les premières contraintes 34
C) Le Thésaurus, seule solution pour l’organisation des connaissances ?
II La comparaison des termes
A) Le logiciel documentaire BCDI
A.l Présentation
A.2 Contrainte technique: la mise à jour du Thésaurus
‘ B) L’identification des sous domaines
B.l Elaboration des listes de termes pour la comparaison
B.2 Une analyse du fonds monographique tardive
B.3 Regroupement des termes et sélection des descripteurs
C) Un fonds monographique non valorisé
III Hiérarchisation des termes
A) Méthode de hiérarchisation et cas particulier
B) Contraintes et mise au point des procédures
IV La Validation du Thésaurus
A) Tests et validation du Thésaurus
B) Les causes de la non réalisation de la validation du Thésaurus
V L’enquête de fréquentation
A) La démarche
B) Les raisons de la non réalisation de l’enquête
Conclusion
Bibliographie et sitographie 
ANNEXES

Rapport PFE, mémoire et thèse PDFTélécharger le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *