Enjeux conceptuels pour l’élaboration d’un modèle ontologique : le cas du domaine minier

La progressive disparition des derniers mineurs de l’ancien Bassin Houiller du Nord – Pas-de-Calais met en danger la transmission de leur mémoire et soulève des problématiques liées à la sauvegarde d’un patrimoine à résoudre dans un laps de temps toujours plus court. La thèse étudie la mémoire sous le prisme de l’organisation des connaissances et selon une approche hybride prenant en compte les dimensions linguistiques, extralinguistiques et métalinguistiques du domaine étudié. Les questions d’accès et de représentation des connaissances d’un patrimoine sont interrogées à travers la conception de trois systèmes d’organisation des connaissances (SOC – anglais KOS) : une terminologie, un thésaurus et une ontologie de domaine. Le travail, inscrit dans le cadre du projet ANR MémoMines participant à la valorisation de la mémoire minière, présente la méthodologie de construction des trois SOC à partir de plusieurs ressources documentaires hétérogènes sur le domaine. Outre créer de nouvelles connaissances et nouveaux terrains d’études, l’objectif du travail est de réfléchir au moyen de tirer le meilleur profit des nouvelles technologies, et notamment du web sémantique avec l’analyse des SOC selon quatre critères : couverture, finesse, expressivité des formalismes et interopérabilité. Les enjeux liés à la conception des SOC, à l’alignement avec des standards et les SOC en eux-mêmes sont des résultats de ce travail. L’analyse des documents sur le domaine montre une valeur essentielle dans la réalisation de tout travail : celle de partage basée sur des codes de communication communs au sein de différentes communautés d’acteurs. Par l’ambition de conceptualiser un domaine spécifique dans une période délimitée et révolue qui est celle de l’exploitation minière, les enjeux soulevés sont à poser dans le contexte (numérique) actuel et à transposer sur de nouveaux territoires ou même territoire en évolution. Cette thèse marque enfin l’importance de la représentation de la dimension sensible dans tout processus de transmission des savoirs.

Plus largement, la recherche s’insère dans les sciences de l’information, qui ont comme origine la rédaction en 1934 par Paul Otlet de l’ouvrage fondateur : Traité de documentation. Le livre sur le livre (Otlet 1934) et la fondation avec Henri La Fontaine du Mundaneum en 1895. L’ambition de rassembler, classer et partager toutes les connaissances du monde est novatrice à l’époque et est aujourd’hui plus que centrale. En 1984, Le Coadic définit la science de l’information comme la « science qui étudie la communication de l’information » (Le Coadic 1984, 168). L’auteur en donne cette représentation thématique (Cf. figure 1), avec pour thèmes centraux : les théories de l’indexation (liées à la recherche de l’information, information retrieval, et, en particulier, celles qui concernent l’indexation automatique des documents textuels), la loi de Bradford (analyse bibliométrique relative à la performance des recherches bibliographiques dans les revues scientifiques), les systèmes de recherche en ligne « de documents ou de données et les études descriptives des technologies correspondantes, banques de données bibliographiques, référentielles et textuelles, et banques de données factuelles », les techniques des bibliothèques (comme les techniques de constitution et de mise à disposition des collections en site, techniques en matière de bâtiments, pour l’accueil des lecteurs, l’organisation des fonds et des services, techniques de partage des ressources etc.), l’analyse des co-citations (la fréquence des citations reçues par un article est l’indice de l’importance scientifique de cet article) et des mots-associés (mots-clés utilisés lors de l’indexation d’un article qui sont retenus et analyse des co occurences).

L’organisation des connaissances est un champ considéré par Dahlberg (Ohly 2016) comme une sousdiscipline de la science de la science, avec une orientation de recherche descriptive. D’après elle, les champs d’application de l’organisation des connaissances ne sont pas seulement les sciences de l’information mais tous les domaines nécessitant des taxonomies, avec pour seule limite les objectifs de la classification (Ohly 2016). Dans nos travaux, nous verrons que le domaine du patrimoine minier est choisi comme champ d’application direct de l’organisation des connaissances. Hjørland liste les principales activités de l’organisation des connaissances telles que : la description de document, l’indexation, la classification, activités effectuées dans les lieux de savoirs (Hjørland 2008, 86). Comme champ d’étude, le domaine s’intéresse à la nature et à la qualité des systèmes d’organisation des connaissances (SOC ou KOS en anglais) : « KO as a field of study is concerned with the nature and quality of such knowledge organizing processes (KOP) as well as the knowledge organizing systems (KOS) used to organize documents, document representations, works and concepts » (Hjørland 2008, 86). La nature des SOC est constamment redéfinie par les auteurs. Nous verrons que récemment, Zacklad en propose une nouvelle typologie : il identifie les SOC symboliques, les SOC algorithmiques, les SOC visuels, les SOC incarnés et insiste surtout sur l’importance « d’articuler de manière fine et complémentaire » ceux-ci « pour rendre compte de la diversité croissante des usages dans les environnements postdigitaux actuels » (Zacklad 2018, 103).

Organisation, représentation et modélisation

L’essentiel, c’est toujours de distinguer. (Werner 2006)

Ce chapitre insère le contexte de l’étude qui est le champ de l’OC (1.1). Il se focalise tout d’abord sur trois enjeux du champ au regard de travaux réalisés lors de ces dix dernières années (1.1.1). Nous présentons ensuite les différentes approches identifiées par Hjørland (Hjørland 2008) et développons celles qui intéressent nos travaux (1.1.2). Hjørland définit le champ de l’OC en séparant les processus, des systèmes d’organisation des connaissances. Nous nous intéressons particulièrement aux SOC et les définissons à travers des typologies récentes. Les SOC répondent à des enjeux de représentation des connaissances, notamment au niveau du langage à utiliser. Nous commençons par donner différentes définitions et exemples de la dualité représentation mentale (1.2.1) représentation graphique (1.2.2) des connaissances. Les préoccupations actuelles se placent au niveau d’une représentation globale des connaissances et nous voyons ce que propose le web sémantique dans ce cadre (1.2.3), puis présentons les langages de représentation en vigueur (1.2.4). Nous questionnons finalement la représentation de l’aspect sensible des connaissances (1.2.5). Enfin, nous choisissons de développer un type de représentation, qui est la modélisation (1.3) et nous expliquons ensuite en quoi la structuration des connaissances est nécessaire (1.3.1) puis développons les différents problèmes que posent les ontologies (1.3.2) et notamment la modélisation, la généricité, la linguisticité des connaissances. Nous posons enfin la question des ontologies en documentation.

Organisation des connaissances (OC)

De 1895 et jusqu’à sa mort (en 1944), Paul Otlet, bibliographe belge, met en œuvre une théorie globale de la documentation. Une des premières occurrences de l’expression « Organization of Knowledge » est située dans un de ses écrits (Otlet 1903, 74). Celui-ci la distingue alors de la documentation. Jugeant l’expression imprécise, il s’attache à la définir. Il applique celle-ci à l’ensemble des faits et des considérations, extérieurs à la connaissance, impliquées dans la vie, qui participent à l’organisation de la connaissance et tout ce qui est né de la création, de la conservation, de l’enseignement, de la diffusion de cette connaissance . Dans ce cadre knowledge est défini comme la systématisation de ce qui est connu sur un sujet donné (Otlet 1903, 74). Comme exemple de sujet (matter) pouvant faire partie de cette Organization of Knowledge, l’auteur donne l’enseignement d’une discipline dans toutes ses dimensions (chaires spéciales, cours pratiques et séminaires, conférences de vulgarisation, instituts de recherche et tous les moyens d’encourager l’étude d’une science : concours, bourses d’études, bourses de voyage, etc.). Le sens est donc large. Quelques années plus tard, Henry Evelyn Bliss, bibliothécaire américain, utilise la même expression « Organization of Knowledge » dans ses deux ouvrages (Bliss 1929, 1933) qu’il confronte au système des sciences en 1929 et qu’il étudie en bibliothèques avec une approche thématique des livres (1933). Le domaine d’investigation alors constitué est établi principalement sur des questions relatives aux systèmes de classification et aux systèmes de relations conceptuelles tels que les thésaurus (Murguia et De Sales 2013). Dansla lignée des travaux de Bliss, un champ d’étude international se forme et Ingetraut Dahlberg crée en 1973 la revue Knowledge Organization qui deviendra une revue bi-mensuelle officielle de la International Society for Knowledge Organization (ISKO), dont Dahlberg sera la première présidente. En France, l’organisation des connaissances est une discipline étudiée sous le prisme des sciences de l’information et de la communication (Couzinet 2012). En 2013, Murguia et De Sales (Murguia et De Sales 2013) s’attachent quant à eux à réfléchir aux associations théoriques possibles entre les concepts de Bliss et d’Otlet ainsi que celle de l’ISKO que nous définissons ci dessous. Les auteurs montrent que Dahlberg a accordé une stature particulière à l’œuvre de Bliss, ce qui implique qu’elle a, avec des auteurs ultérieurs, développé l’idée et l’applicabilité de l’œuvre, faisant de Bliss le fondateur d’un discours, emprunté et réinterprété par ISKO. Les auteurs montrent également qu’Otlet n’est pas le fondateur d’un discours lié à l’organisation des connaissances tel qu’il existe dans ISKO, mais que ses travaux sont présents dans les propos de Hjørland.

La conférence internationale ISKO, créée en 1989 est entièrement dédiée aux échanges et questionnements sur la discipline de l’OC. Comme nous pouvons le voir sur le site web dédié, une trentaine de pays sont représentés . De nombreux actes de colloque sont écrits suite à chaque événement organisé, représentant une partie de l’évolution du champ. Parmi ceux-ci, des travaux récents traitent du futur de la discipline ainsi que celui de l’organisation de l’information (Ohly 2016) lors de la 13ème conférence en 2014 à Cracovie, ou de la théorie, de la sémantique et de l’OC comme l’ouvrage de Babik, Ohly, et Weber (Babik, Ohly, et Weber 2017) qui rassemble les actes de plusieurs événements organisés en Allemagne. Comme nous pouvons le lire sur le site web dédié, la mission de l’ISKO est :

« […] to advance conceptual work in knowledge organization in all kinds of forms, and for all kinds of purposes, such as databases, libraries, dictionaries and the Internet.».

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

INTRODUCTION
PARTIE 1. CADRE THÉORIQUE DE L’ORGANISATION DES CONNAISSANCES
CHAPITRE 1. ORGANISATION, REPRÉSENTATION ET MODÉLISATION
1.1 Organisation des connaissances (OC)
1.2 Représentation des connaissances (RC)
1.3 Modélisation des connaissances
CHAPITRE 2. APPROCHES DOCUMENTAIRES DE L’ORGANISATION DES CONNAISSANCES
2.1 Systèmes d’organisation des connaissances (SOC)
2.2 Types et hétérogénéité des SOC
2.3 SOC et Web sémantique
CHAPITRE 3. APPROCHES ONTOLOGIQUES DE L’ORGANISATION DES CONNAISSANCES
3.1 Domaines d’étude des ontologies
3.2 Types d’ontologies
3.3 Travaux actuels sur les ontologies dans le champ de l’OC
3.4 Rôle des ontologies
3.5 Éléments d’un modèle ontologique
3.6 Différentes approches de conception d’une ontologie de domaine
PARTIE 2. LE PATRIMOINE MINIER COMME DOMAINE DE CONNAISSANCE
CHAPITRE 4. DÉFINIR LE PATRIMOINE MINIER
4.1 Un patrimoine à plusieurs facettes
4.2 Un patrimoine inscrit à l’UNESCO
4.3 Un patrimoine langagier en danger
4.4 Un patrimoine souterrain à rendre visible
4.5 Un patrimoine documentaire hétérogène et dispersé
CHAPITRE 5. VERS UNE MÉTHODOLOGIE DE CONCEPTION DES SOC DU DOMAINE MINIER
5.1 Constitution d’un corpus documentaire hétérogène
5.2 Des ressources lexicales à la terminologie de la mine
5.3 De la terminologie minière au thésaurus
5.4 Du thésaurus au modèle ontologique.
5.5 Du modèle ontologique réduit à l’ontologie de domaine instanciée
CHAPITRE 6. PRÉSENTATION DES TROIS SOC
6.1 Une terminologie de la mine : TerminoMines
6.2 Un thésaurus du patrimoine minier : ThesoMines
6.3 Une ontologie de la mine : OntoMines
PARTIE 3. ENJEUX CONCEPTUELS DES SOC DU PATRIMOINE MINIER
CHAPITRE 7. COUVERTURE INFORMATIONNELLE
7.1 Recouvrement et différenciation conceptuels
7.2 Évaluation de la saturation
7.3 Processus d’enrichissement : démarche évaluation et perfectionnement
CHAPITRE 8. FINESSE DE DESCRIPTION OU GRANULARITÉ
8.1 Les entités nommées
8.2 Les objets matériels
8.3 Les activités
CHAPITRE 9. EXPRESSIVITÉ DES FORMALISMES
9.1 La structure de la terminologie
9.2 Les relations hiérarchiques du thésaurus
9.3 Le réseau de l’ontologie
CHAPITRE 10. INTEROPÉRABILITÉ
10.1 Interopérabilité syntaxique
10.2 Interopérabilité sémantique
CONCLUSION
BIBLIOGRAPHIE

Rapport PFE, mémoire et thèse PDFTélécharger le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *