Mapping entre WordNets
L’interopรฉrabilitรฉ est une question importante, largement identifiรฉe dans plusieurs domaines comme par exemple dans la communautรฉ des systรจmes d’information (SI). La dรฉpendance et le partage dโinformation entre des organismes ont crรฉรฉ un besoin de coopรฉration et de coordination qui facilite aussi bien lโรฉchange et lโaccรจs aux informations distantes quโaux informations locales. La large adoption de lโinternet (WWW : World Wide Web), pour accรฉder et distribuer lโinformation, engendre un besoin crucial de l’interopรฉrabilitรฉ des systรจmes. Le problรจme principal de tous les travaux sur lโinteropรฉrabilitรฉ porte sur la comparaison et le mapping des diffรฉrentes ontologies. Etant donnรฉe la nature dรฉcentralisรฉe du dรฉveloppement du Web, le nombre d’ontologies est trรจs important. Pour intรฉgrer les donnรฉes des ontologies distinctes, nous devons connaitre les correspondances sรฉmantiques entre leurs รฉlรฉments. La mise en correspondance peut รชtre traitรฉe entre des ontologies monolingues comme elle peut รชtre traitรฉe entre des ontologies multilingues. Les liens de correspondance peuvent รชtre employรฉs directement aprรจs avoir traduit les deux ontologies dans une seule langue afin dโappliquer les techniques de mapping dโontologies monolingues. Notre contribution dans ce mรฉmoire consiste en la proposition dโune approche de mapping entre deux ontologies gรฉnรฉrales de type WordNet tel que WordNet anglais et WordNet espagnol. Cette approche se compose de trois phases : (i) une phase de traduction automatique dont cette derniรจre consiste ร traduire lโontologie source dans le langage naturel de lโontologie cible, (ii) une phase de mise en correspondance dont les mรฉthodes de calcul de similaritรฉs sont applicables dans le contexte afin de rรฉsoudre leshรฉtรฉrogรฉnรฉitรฉs terminologiques et structurelles. Ces mรฉthodes sont basรฉes sur des informations auxiliaires capables dโidentifier les รฉventuels liens linguistiques et hiรฉrarchiques entre deux termes de deux concepts ontologiques et (iii) une phase de test et d’รฉvaluation qui inclut lโexpรฉrimentation et lโรฉvaluation des techniques de calcul de similaritรฉ. Notre approche de mapping utilise plusieurs techniques telles que la recherche dโinformation, les heuristiques et l’apprentissage automatique.
Ontologies
La reprรฉsentation de la sรฉmantique est nรฉcessaire pour lโintรฉgration des systรจmes, pour cela on utilise des techniques de reprรฉsentation de la connaissance, cette derniรจre รฉtudie comment transformer lโexpression du sens en une reprรฉsentation formelle manipulable par une machine, lโun des moyens les plus utilisรฉs est lโontologie. De ce fait, nous avons remarquรฉ que durant la derniรจre dรฉcennie, une attention croissante a รฉtรฉ concentrรฉe sur les ontologies. Ces derniรจres sont largement utilisรฉes de nos jours dans plusieurs domaines comme lโingรฉnierie de connaissance, les applications liรฉes ร la gestion des connaissances, e-commerce, la recherche dโinformation ainsi que le Web Sรฉmantique. Cet engouement est motivรฉ par le fait que les ontologies peuvent fournir un moyen efficace pour gรฉrer les connaissances partagรฉes et communes a un domaine particulier, tout en permettant des รฉchanges tant au niveau syntaxique que sรฉmantique, entre personnes et/ou systรจmes. Les ontologies servent ร dรฉcrire une sรฉmantique et sont au centre des dรฉveloppements du Web sรฉmantique. Elles permettent la modรฉlisation dโinformations agrรฉรฉes par une communautรฉ de personnes et accessibles par une machine pour dรฉvelopper des services automatisรฉs. Elles jouent donc un rรดle de rรฉfรฉrence pour dรฉcrire la sรฉmantique des informations des diffรฉrents sites web.
Dรฉfinitions
Nous assistons, ces derniรจres annรฉes, ร l’รฉmergence de la notion d’ontologie, qui constitue un sujet de recherche rรฉpandu dans diverses communautรฉs notamment celles liรฉes ร lโingรฉnierie des connaissances, ร l’ingรฉnierie des systรจmes, ร l’intรฉgration des systรจmes, etc. Parce quโelle facilite le partage et la rรฉutilisation de connaissances, De ce fait, les ontologies dรฉfinissent actuellement des vocabulaires structurรฉs, regroupant des concepts utiles dโun domaine et de leurs relations et qui servent ร organiser et รฉchanger des informations de faรงon non ambiguรซ.
Le terme ontologie vient du mot grec Ontologia qui signifie, parler (logia) au sujet de lโรชtre (onto), lโontologie est une discipline philosophique qui peut รชtre dรฉcrite comme la science de lโexistence, ou lโรฉtude de lโรชtre ; Platon (427-347 AJC) รฉtait lโun des premiers philosophes qui mentionne explicitement le monde des idรฉes ou des formes contrastรฉes au vrais ou les objets observรฉs qui sont selon sa vue, des rรฉalisations imparfaites des idรฉes ; En fait, Platon a soulevรฉ les idรฉes, les formes ou les abstractions aux entitรฉs quโon peut parler aujourdโhui, donc il a crรฉรฉ les bases dโontologies. Plus tard, son รฉtudiant Aristote (384-322 AJC) a formรฉ le fond logique des ontologies, il a prรฉsentรฉ des notions telles que la catรฉgorie et la subsumption aussi bien que la distinction entre le superconcept et le subconcept, qui est appliquรฉ sur les espรจces pour les classifiรฉs dans diffรฉrentes catรฉgories ; Cโest le principe sur lequel sont basรฉes les notions modernes du concept ontologique [1]. Dans cette section, nous allons dรฉcrire les diffรฉrentes dรฉfinitions qui ont รฉtรฉ attribuรฉs ร la notion dโontologie.
Dรฉfinition de Neches et al 1991ย : ยซ Une ontologie dรฉfinit les termes et les relations de bases qui composent le vocabulaire dโun domaine, bien que les rรจgles de combinaison des termes et les relations pour dรฉfinir lโextension du vocabulaire ยป. Cette dรฉfinition indique en quelques sortes, ce quโon doit faire pour construire une ontologie, elle identifie les termes de base et les relations entre termes, et les rรจgles pour combiner les termes. Quelques annรฉes aprรจs, vient la dรฉfinition qui nous semble รชtre la plus cรฉlรจbre est celle de Gruber.
Dรฉfinition de Gruber 1993ย : ยซ Une ontologie est une spรฉcification explicite dโune conceptualisation ยป. Le terme ยซ conceptualisation ยป rรฉfรจre ร un modรจle abstrait d’un certain phรฉnomรจne de la rรฉalitรฉ et qui permet d’identifier les concepts pertinents de ce phรฉnomรจne. Le terme ยซ explicite ยป signifie que le type des concepts utilisรฉs est rรฉellement dรฉfini d’une maniรจre claire et prรฉcise.
Dรฉfinition de Borst 1997 : ยซ Une ontologie est une spรฉcification formelle dโune conceptualisation partagรฉe ยป. Cette dรฉfinition prรฉcise d’une part, le fait que l’ontologie doit รชtre formelle, c’est ร dire exprimรฉe sous forme d’une logique pouvant รชtre manipulรฉe sur machine, et d’autre part, le fait qu’elle doit รชtre partagรฉe dans la mesure oรน elle doit rรฉfรฉrer ร la notion de groupe qui impose ainsi la mise en place d’un partage de connaissances entre les diffรฉrents individus.
Types dโontologies
Dans cette partie, nous allons prรฉsenter les principaux travaux sur la classification des ontologies selon plusieurs types :
โ Guarino 1998 [8] : il a classifie les ontologies selon le niveau de granularitรฉ, il a distinguรฉ lโontologie supรฉrieure, lโontologie de domaine, lโontologie de tรขche et lโontologie dโapplication.
โ Lassila et McGuinness [9] : ils ont classifie les ontologies selon lโinformation dont lโontologie a besoin, et la richesse de sa structure interne, ils ont prรฉcisรฉ les catรฉgories suivantes : vocabulaires, glossaires, thรฉsaurus, hiรฉrarchies informelles, hiรฉrarchies formelles, Frame, ontologies avec restriction de valeur et ontologies avec contraintes logiques.
โ Gomez-Perez et al [10] : ils ont classifie les ontologies selon la richesse de leurs structures internes comme le travail de Lassila [9], et le sujet de conceptualisation qui est une extension des travaux de Van Heijst et al [11] et ceux de Guarino .
Types dโontologies basรฉs sur la richesse de leurs structuresย
โข Vocabulaires contrรดlรฉs : c’est-ร -dire un ensemble fini de termes, par exemple les catalogues ;
โข Glossaires : des listes de termes avec leurs significations, prรฉsentรฉs en langage naturel;
โข Thรฉsaurus : il fournit plus de la sรฉmantique entre termes, il prรฉsente les informations comme des relations entre synonymes, mais il ne fournit aucune hiรฉrarchie explicite ;
โข Hiรฉrarchies informelles : la structure de ce type d’hiรฉrarchie est basรฉe non pas sur des relations de gรฉnรฉralisation mais sur la proximitรฉ des concepts ;
โข Hiรฉrarchies formelles : hiรฉrarchie dont la structure est dรฉterminรฉe par des relations de gรฉnรฉralisation ;
โข Hiรฉrarchie formelle avec instances du domaine: similaire ร la catรฉgorie prรฉcรฉdente mais incluant des instances du domaine ;
โข Frames : ontologies incluant des classes avec propriรฉtรฉs pouvant รชtre hรฉritรฉes ;
โข Ontologies avec restrictions de valeur: ontologies pouvant contenir des restrictions sur les valeurs des propriรฉtรฉs ;
โข Ontologies avec contraintes logiques: ontologies pouvant contenir des contraintes entre constituants (exemple : relations) dรฉfinies dans un langage logique.
Conclusion
Les travaux menรฉs dans ce mรฉmoire se situent dans le domaine de lโingรฉnierie des connaissances et du Web sรฉmantique. Notre objectif a รฉtรฉ de tirer profit des travaux menรฉs dans le domaine de lโinteropรฉrabilitรฉ sรฉmantique des connaissances, dans le but d’aligner des ontologies et รฉgalement dโaccรฉder ร une ressource distante de faรงon transparente telle quโun dictionnaire bilingue. Une implรฉmentation de la mรฉthode de mise en correspondance des ontologies proposรฉe a รฉtรฉ dรฉveloppรฉe. Cette implรฉmentation est dรฉcrite en java et sโappuie sur lโutilisation de deux ontologies de type WordNet de langue diffรฉrente, lโune est dรฉcrite sous forme dโune base de donnรฉes et lโautre ressource est appelรฉe en utilisant lโAPI JWNL. Cette mise en correspondance est appliquรฉe pour en dรฉduire une sรฉrie de mappings.
|
Table des matiรจres
INTRODUCTION GรNรRALE
CHAPITRE 1 : ONTOLOGIES
I. Introduction
II. Dรฉfinitions
III. Constituant des ontologies
IV. Types dโontologies
IV.1. Types dโontologies basรฉs sur la richesse de leurs structures
IV.2. Types dโontologies basรฉs sur le sujet de conceptualisation
V. Construction des ontologies
V.1. Cycle de vie dโune ontologie
V.2. Les outils de dรฉveloppement des ontologies
VI. Formalismes de reprรฉsentation
VII. Langages de reprรฉsentation des ontologies
VIII. Approches de lโinteropรฉrabilitรฉ sรฉmantique
IX. Conclusion
CHAPITRE 2 : ETAT DE LโART
I. Introduction
II. Terminologies
II.1. Mapping/Matching dโontologies
II.2. Mรฉthodes de comparaison ou matchers
II.3. Alignement dโontologies
II.4. Transformation dโontologies
II.5. Fusion dโontologies (merging ontologies)
II.6. Intรฉgration dโontologies
III. Le processus du mapping
IV. Similaritรฉ sรฉmantique
V. Classification des techniques de mapping
V.1. Prรฉ-traitement
V.2. Les diffรฉrentes techniques de mapping
V.2.1. Mรฉthodes basรฉes sur lโanalyse des chaines de caractรจres
V.2.2. Mรฉthodes linguistiques
V.2.3. Mรฉthodes extensionnelles
V.2.4. Mรฉthodes structurelles
V.2.5. Mรฉthodes basรฉes sur la sรฉmantique
VI. Composition des techniques de mapping
VII. Classification des mรฉthodes, outils et Framework existants
VII.1. Les techniques de mapping supportรฉes
VII.2. Langages dโontologies et de mapping
VIII. Mapping pour des ontologies multilingues
IX. Conclusion
CHAPITRE 3 : Une approche de mapping pour lโalignement dโontologies
I. Introduction
II. Algorithme de Lesk
II.1. Principe gรฉnรฉrale
II.2. Informations syntaxiques. Contexte local/global
II.3. Description de lโalgorithme
III. Approche proposรฉe
III.1. Principe gรฉnรฉrale
III.2. Description de lโalgorithme
III.3. Mรฉcanismes et mรฉthodes du processus de mapping
III.3.1. Matchers linguistiques et syntaxiques ou matchers terminologiques
III.3.2. Matchers structurels
III.3.3. Combinaison des matchers et gรฉnรฉration des hypothรจses de mapping
III.4. Extraction des mapping
III.5. Exemple illustratif
IV. Expรฉrimentation et รฉvaluation de lโapproche
IV.1. Technologies et outils de dรฉveloppement.
IV.2. Les mรฉtriques utilisรฉes pour lโรฉvaluation
IV.3. Evaluation
IV.4. Rรฉsultats et discusions
V. Conclusion
CONCLUSION
Tรฉlรฉcharger le rapport complet