Mapping entre WordNets
L’interopérabilité est une question importante, largement identifiée dans plusieurs domaines comme par exemple dans la communauté des systèmes d’information (SI). La dépendance et le partage d’information entre des organismes ont créé un besoin de coopération et de coordination qui facilite aussi bien l’échange et l’accès aux informations distantes qu’aux informations locales. La large adoption de l’internet (WWW : World Wide Web), pour accéder et distribuer l’information, engendre un besoin crucial de l’interopérabilité des systèmes. Le problème principal de tous les travaux sur l’interopérabilité porte sur la comparaison et le mapping des différentes ontologies. Etant donnée la nature décentralisée du développement du Web, le nombre d’ontologies est très important. Pour intégrer les données des ontologies distinctes, nous devons connaitre les correspondances sémantiques entre leurs éléments. La mise en correspondance peut être traitée entre des ontologies monolingues comme elle peut être traitée entre des ontologies multilingues. Les liens de correspondance peuvent être employés directement après avoir traduit les deux ontologies dans une seule langue afin d’appliquer les techniques de mapping d’ontologies monolingues. Notre contribution dans ce mémoire consiste en la proposition d’une approche de mapping entre deux ontologies générales de type WordNet tel que WordNet anglais et WordNet espagnol. Cette approche se compose de trois phases : (i) une phase de traduction automatique dont cette dernière consiste à traduire l’ontologie source dans le langage naturel de l’ontologie cible, (ii) une phase de mise en correspondance dont les méthodes de calcul de similarités sont applicables dans le contexte afin de résoudre leshétérogénéités terminologiques et structurelles. Ces méthodes sont basées sur des informations auxiliaires capables d’identifier les éventuels liens linguistiques et hiérarchiques entre deux termes de deux concepts ontologiques et (iii) une phase de test et d’évaluation qui inclut l’expérimentation et l’évaluation des techniques de calcul de similarité. Notre approche de mapping utilise plusieurs techniques telles que la recherche d’information, les heuristiques et l’apprentissage automatique.
Ontologies
La représentation de la sémantique est nécessaire pour l’intégration des systèmes, pour cela on utilise des techniques de représentation de la connaissance, cette dernière étudie comment transformer l’expression du sens en une représentation formelle manipulable par une machine, l’un des moyens les plus utilisés est l’ontologie. De ce fait, nous avons remarqué que durant la dernière décennie, une attention croissante a été concentrée sur les ontologies. Ces dernières sont largement utilisées de nos jours dans plusieurs domaines comme l’ingénierie de connaissance, les applications liées à la gestion des connaissances, e-commerce, la recherche d’information ainsi que le Web Sémantique. Cet engouement est motivé par le fait que les ontologies peuvent fournir un moyen efficace pour gérer les connaissances partagées et communes a un domaine particulier, tout en permettant des échanges tant au niveau syntaxique que sémantique, entre personnes et/ou systèmes. Les ontologies servent à décrire une sémantique et sont au centre des développements du Web sémantique. Elles permettent la modélisation d’informations agréées par une communauté de personnes et accessibles par une machine pour développer des services automatisés. Elles jouent donc un rôle de référence pour décrire la sémantique des informations des différents sites web.
Définitions
Nous assistons, ces dernières années, à l’émergence de la notion d’ontologie, qui constitue un sujet de recherche répandu dans diverses communautés notamment celles liées à l’ingénierie des connaissances, à l’ingénierie des systèmes, à l’intégration des systèmes, etc. Parce qu’elle facilite le partage et la réutilisation de connaissances, De ce fait, les ontologies définissent actuellement des vocabulaires structurés, regroupant des concepts utiles d’un domaine et de leurs relations et qui servent à organiser et échanger des informations de façon non ambiguë.
Le terme ontologie vient du mot grec Ontologia qui signifie, parler (logia) au sujet de l’être (onto), l’ontologie est une discipline philosophique qui peut être décrite comme la science de l’existence, ou l’étude de l’être ; Platon (427-347 AJC) était l’un des premiers philosophes qui mentionne explicitement le monde des idées ou des formes contrastées au vrais ou les objets observés qui sont selon sa vue, des réalisations imparfaites des idées ; En fait, Platon a soulevé les idées, les formes ou les abstractions aux entités qu’on peut parler aujourd’hui, donc il a créé les bases d’ontologies. Plus tard, son étudiant Aristote (384-322 AJC) a formé le fond logique des ontologies, il a présenté des notions telles que la catégorie et la subsumption aussi bien que la distinction entre le superconcept et le subconcept, qui est appliqué sur les espèces pour les classifiés dans différentes catégories ; C’est le principe sur lequel sont basées les notions modernes du concept ontologique [1]. Dans cette section, nous allons décrire les différentes définitions qui ont été attribués à la notion d’ontologie.
Définition de Neches et al 1991 : « Une ontologie définit les termes et les relations de bases qui composent le vocabulaire d’un domaine, bien que les règles de combinaison des termes et les relations pour définir l’extension du vocabulaire ». Cette définition indique en quelques sortes, ce qu’on doit faire pour construire une ontologie, elle identifie les termes de base et les relations entre termes, et les règles pour combiner les termes. Quelques années après, vient la définition qui nous semble être la plus célèbre est celle de Gruber.
Définition de Gruber 1993 : « Une ontologie est une spécification explicite d’une conceptualisation ». Le terme « conceptualisation » réfère à un modèle abstrait d’un certain phénomène de la réalité et qui permet d’identifier les concepts pertinents de ce phénomène. Le terme « explicite » signifie que le type des concepts utilisés est réellement défini d’une manière claire et précise.
Définition de Borst 1997 : « Une ontologie est une spécification formelle d’une conceptualisation partagée ». Cette définition précise d’une part, le fait que l’ontologie doit être formelle, c’est à dire exprimée sous forme d’une logique pouvant être manipulée sur machine, et d’autre part, le fait qu’elle doit être partagée dans la mesure où elle doit référer à la notion de groupe qui impose ainsi la mise en place d’un partage de connaissances entre les différents individus.
Types d’ontologies
Dans cette partie, nous allons présenter les principaux travaux sur la classification des ontologies selon plusieurs types :
− Guarino 1998 [8] : il a classifie les ontologies selon le niveau de granularité, il a distingué l’ontologie supérieure, l’ontologie de domaine, l’ontologie de tâche et l’ontologie d’application.
− Lassila et McGuinness [9] : ils ont classifie les ontologies selon l’information dont l’ontologie a besoin, et la richesse de sa structure interne, ils ont précisé les catégories suivantes : vocabulaires, glossaires, thésaurus, hiérarchies informelles, hiérarchies formelles, Frame, ontologies avec restriction de valeur et ontologies avec contraintes logiques.
− Gomez-Perez et al [10] : ils ont classifie les ontologies selon la richesse de leurs structures internes comme le travail de Lassila [9], et le sujet de conceptualisation qui est une extension des travaux de Van Heijst et al [11] et ceux de Guarino .
Types d’ontologies basés sur la richesse de leurs structures
• Vocabulaires contrôlés : c’est-à-dire un ensemble fini de termes, par exemple les catalogues ;
• Glossaires : des listes de termes avec leurs significations, présentés en langage naturel;
• Thésaurus : il fournit plus de la sémantique entre termes, il présente les informations comme des relations entre synonymes, mais il ne fournit aucune hiérarchie explicite ;
• Hiérarchies informelles : la structure de ce type d’hiérarchie est basée non pas sur des relations de généralisation mais sur la proximité des concepts ;
• Hiérarchies formelles : hiérarchie dont la structure est déterminée par des relations de généralisation ;
• Hiérarchie formelle avec instances du domaine: similaire à la catégorie précédente mais incluant des instances du domaine ;
• Frames : ontologies incluant des classes avec propriétés pouvant être héritées ;
• Ontologies avec restrictions de valeur: ontologies pouvant contenir des restrictions sur les valeurs des propriétés ;
• Ontologies avec contraintes logiques: ontologies pouvant contenir des contraintes entre constituants (exemple : relations) définies dans un langage logique.
Conclusion
Les travaux menés dans ce mémoire se situent dans le domaine de l’ingénierie des connaissances et du Web sémantique. Notre objectif a été de tirer profit des travaux menés dans le domaine de l’interopérabilité sémantique des connaissances, dans le but d’aligner des ontologies et également d’accéder à une ressource distante de façon transparente telle qu’un dictionnaire bilingue. Une implémentation de la méthode de mise en correspondance des ontologies proposée a été développée. Cette implémentation est décrite en java et s’appuie sur l’utilisation de deux ontologies de type WordNet de langue différente, l’une est décrite sous forme d’une base de données et l’autre ressource est appelée en utilisant l’API JWNL. Cette mise en correspondance est appliquée pour en déduire une série de mappings.
|
Table des matières
INTRODUCTION GÉNÉRALE
CHAPITRE 1 : ONTOLOGIES
I. Introduction
II. Définitions
III. Constituant des ontologies
IV. Types d’ontologies
IV.1. Types d’ontologies basés sur la richesse de leurs structures
IV.2. Types d’ontologies basés sur le sujet de conceptualisation
V. Construction des ontologies
V.1. Cycle de vie d’une ontologie
V.2. Les outils de développement des ontologies
VI. Formalismes de représentation
VII. Langages de représentation des ontologies
VIII. Approches de l’interopérabilité sémantique
IX. Conclusion
CHAPITRE 2 : ETAT DE L’ART
I. Introduction
II. Terminologies
II.1. Mapping/Matching d’ontologies
II.2. Méthodes de comparaison ou matchers
II.3. Alignement d’ontologies
II.4. Transformation d’ontologies
II.5. Fusion d’ontologies (merging ontologies)
II.6. Intégration d’ontologies
III. Le processus du mapping
IV. Similarité sémantique
V. Classification des techniques de mapping
V.1. Pré-traitement
V.2. Les différentes techniques de mapping
V.2.1. Méthodes basées sur l’analyse des chaines de caractères
V.2.2. Méthodes linguistiques
V.2.3. Méthodes extensionnelles
V.2.4. Méthodes structurelles
V.2.5. Méthodes basées sur la sémantique
VI. Composition des techniques de mapping
VII. Classification des méthodes, outils et Framework existants
VII.1. Les techniques de mapping supportées
VII.2. Langages d’ontologies et de mapping
VIII. Mapping pour des ontologies multilingues
IX. Conclusion
CHAPITRE 3 : Une approche de mapping pour l’alignement d’ontologies
I. Introduction
II. Algorithme de Lesk
II.1. Principe générale
II.2. Informations syntaxiques. Contexte local/global
II.3. Description de l’algorithme
III. Approche proposée
III.1. Principe générale
III.2. Description de l’algorithme
III.3. Mécanismes et méthodes du processus de mapping
III.3.1. Matchers linguistiques et syntaxiques ou matchers terminologiques
III.3.2. Matchers structurels
III.3.3. Combinaison des matchers et génération des hypothèses de mapping
III.4. Extraction des mapping
III.5. Exemple illustratif
IV. Expérimentation et évaluation de l’approche
IV.1. Technologies et outils de développement.
IV.2. Les métriques utilisées pour l’évaluation
IV.3. Evaluation
IV.4. Résultats et discusions
V. Conclusion
CONCLUSION
Télécharger le rapport complet