ONTOLOGIE ET MODELISATION DES CONNAISSANCES

Télécharger le fichier pdf d’un mémoire de fin d’études

Architectures du Web sémantique

La finalité première de la recherche Web sémantique est d’élargir le présent WWW, d’optimiser le réseau avec autant de données que la sémantique, puis de faire en sorte que la machine puisse être capable de faciliter l’échange et la collaboration entre eux.
L’axe d’analyse est de visualiser de quelle manière les données sont comprises par la machine, et comment elle traite la forme, avec la sémantique. Tim Berners-Lee a décrit l’organigramme du Web sémantique se fondant sur le XML et RDF / RDFS. Et en haut de cette réalisation des ontologies et de chartes d’inférence logique, pour compléter la schématisation des  connaissances focalisées sur le raisonnement et la sémantique, et qui peut être compréhensible et traité par l’ordinateur. Semantic Web stack est un terme qui a été créé en 2008 par Tim Berners-Lee. Le Semantic Web Stack qui peut se traduire par « pyramide du Web sémantique » ou « piles du Web sémantique », est une manière de schématiser l’organigramme des langages informatiques : chaque couche emploi et exploite les aptitudes des couches qui se trouvent en dessous de chacune d’elle. Cela démontre la planification de celles-ci au cœur du Web sémantique, ce dernier étant une extension et non un remplacement de la technologie « standard hypertexte »usitée sur le Web. La pyramide du Web sémantique est constamment en progression à mesure que chaque couche (et donc langage) est optimisée [1.14].
La progression des réalisations dans l’optique du Web sémantique est caractérisée par divers degré de difficultés. Si les plus basiques comportent une simple attribution de métadonnées aux potentielles usitées, d’autres se focalisent sur des inférences très complexes et permettent l’utilisation de ressources hétérogènes. Qu’importe le degré de difficulté, ces algorithmes utilisent une structure en couche commune représentée dans la figure 1.05 ci-dessous, conseillée par le W3C. C’est en fait la vision illustrative du Web sémantique proposée par son créateur Tim Berners-Lee en 2001 [1.15]. La totalité des technologies, c’est-à-dire les langages et les protocoles, qu’elle comporte par conséquent, sont normalisés par le W3C, et font toujours l’objet d’analyse, de travaux d’optimisation et de standardisation chez W3C.
Interface utilisateur & applications
La plupart de ces couches sont déjà implémentées par W3C. Effectivement, les protocoles et langages destinés à remplir leurs rôles étaient déjà là ou ont été réalisées pour satisfaire les exigences spécifiques de chaque couche. Le Web sémantique nécessite encore une masse de travail considérable, les couches supérieures n’étant pas encore très développées, mais tout de même, leurs fonctions sont généralement déjà bien définies. Chaque couche se sert de la couche du dessous, et a un rôle bien spécifique dans la structure. Nous allons visualiser les rôles de chaque couche puis les langages et/ou protocoles qui leur sont associés [1.16]. Pour bien atteindre ces objectifs, le W3C a mis en place de manière progressive, une succession d’indications pour la totalité des couches de la structure. L’illustration de la figure 1.06 suivante résume les normalisations faite par le W3C à propos du Web sémantique, au cours du temps.
Couche URI et Unicode
L’Uniform Resource Identifier (URI) est justement un protocole simple et extensible pour identifier, d’une manière unique et uniforme, toute ressource sur le Web. Cet élément forme la base de l’architecture en couche du Web sémantique.
La particularisation de la sémantique et de la syntaxe de l’URI dérive des théories introduites par l’intention de globaliser l’information dans le www, datant des années 1990. Elle faisait alors l’objet du protocole RFC1630. Son emploi est détaillé dans le livre « Universal Resource Identifiers in WWW » [1.17] et vise à rassembler plusieurs indications en rapport avec  la localisation d’une ressource (URL) et son identification (URN). C’est pour cette raison qu’il est considéré comme l’initiateur du Web syntaxique avant d’être celui du Web sémantique. La notion d’URI s’est naturellement bien développée depuis, pour revêtir une autre appellation, une nouvelle référence du Web qu’est le RFC2396.
En général, le terme identificateur est dit d’un outil pouvant référencer un objet qui possède une identité. Pour le Web sémantique, l’URI est une séquence de caractères avec une syntaxe restreinte, qui donne la possibilité de reconnaitre toute ressource employée au niveau d’une application Web sémantique. Une ressource désigne tout objet qui dispose d’une identité, comme un support électronique, une page HTML, un fichier, une image, une vidéo, un service, une couleur, etc. Une ressource, n’est pas obligatoirement un objet qui intègre le réseau, il peut être un internaute, un livre, une corporation, etc. Le concept d’uniformité, ou universalité, de son côté, est non seulement importante mais aussi remplie de privilèges. En premier lieu, elle permet l’emploi de plusieurs sortes d’identificateurs de ressources au sein d’un même contexte, bien que leur procédé d’acheminement ne soit pas identique. En second lieu, elle réalise une interprétation sémantique cohérente des conventions syntaxiques que partagent des identificateurs distincts.
En outre, elle permet d’ajouter de nouvelles sortes d’identificateurs de ressources sans engendrer des conflits avec les anciens. En dernier lieu, cette forme de cohérence donne la possibilité d’employer à nouveau ces identificateurs dans des situations diversifiées. A ces dires, nous souhaitons faire comprendre que les identificateurs de ressources sont très diversifiés. Un URI peut se regrouper, en réalité, en trois types, en fonction de son usage pour la localisation, le nommage ou un usage mixte. La dénomination Uniform Resource Locator (URL) fait référence une sous-catégorie d’URI qui fait la reconnaissance des ressources à partir d’une illustration de leur procédé d’accès, au lieu de considérer l’appellation ou autre caractéristique de cette dernière, comme le ferait l’Uniform Resource Name (URN). L’URL et l’URN constituent des classes spécifiques d’URI Entre autres, il faut savoir que les données sont toujours encodées avec le jeu de caractères Unicode concernant un grand nombre d’interopérabilité. C’est la raison pour laquelle cet élément fait partie de cette strate de bas niveau, dans la classe de l’URI.
Scheme
Le scheme représente le prefixe qui désigne le contexte donné à l’identifiant tel que le protocole, le réseau virtuel non atteignable par une machine. Exemple : http, urn, info
Authority
Authority a pour fonction essentielle la nomination des schemes. Il est communément appelé autorité nommante. Le cas des noms de domaines est un cas spécifique de l’Authority pour le Web classique.
Path
Le Path est un accès ou un nom donné par l’autorité nommante. Dans le cas d’une URI HTTP, c’est la personne en charge du nom de domaine qui organise l’attribution des différents chemins d’accès à une ressource.

XML

L’Extensible MarkupLanguage (XML) est un langage de balisage extensible, un sous-ensemble du SGML. En réalité, il fait référence à un métalangage qui nous donne les moyens de caractériser nos propres balises pour nos documents. XML emploie le Document Type Définition (DTD) pour ses modèles de données.
Cette figure 1.08 représentée plus haut montre que XML dispose d’une structure interne des échanges de données hiérarchisées. Il n’est pas lié à la catégorie de logiciel, d’application et de langage employé. XML tient une fonction capitale dans l’interopérabilité, il sera actif dans le cas d’un stockage, d’un traitement, d’un envoi des données. Le XML DTD caractérise les composants d’un document, sa structure syntaxique est l’ossature d’un document typé à l’aide d’une grammaire. De ce fait, XML offre la possibilité à toute application de vérifier la cohérence d’un document avec la DTD pour ainsi le traiter et le convertir s’il est cohérent avec cette DTD.
Pour le cas du Web sémantique, le XML atteste le niveau syntaxique de sa couche constitutive. XML ne substitue pas à HTML (HTML pour l’inscription des données, leur présentation (taille, couleur…). Il emploie le langage XSL / XSLT pour se convertir en HTML. Parmi les privilèges de XML se trouve le nombre de technologies et de langages qui se sont élargis autour de XML. Ceux-ci multiplient les outils pour le traitement des documents XML. L’énumération suivante présente les langages essentiels qui intègrent l’environnement XML. XML dispose déjà d’un procédé pour concrétiser les relations entre les composants d’un document. XLink et XPointer donnent les moyens de créer des relations entre documents et spécifiquement entre un composant d’un document et une partie d’un autre document. Ils universalisent les liens hypertextes des documents HTML en permettant les liens entre différents documents.
DTD
La fonction d’une Document Type Definition (DTD) est de caractériser de façon concise la forme d’un document. Ceci concerne quelques conditions obligatoires pour évaluer la validité d’un document. Ces conditions définissent les composants qui peuvent s’afficher dans le constitutif d’un composant, l’arrangement hypothétique de ces composants et l’existence de texte brut. Elles caractérisent également, pour chaque composant, les caractères permis et les caractères obligatoires. Les DTD présentent le privilège d’être faciles d’usage, toutefois elles sont aussi souvent assez restreintes. Les illustrations donnent les moyens de caractériser de manière encore plus concrète l’agencement d’un document. Ils sont plus perfectionnés mais plus complexes à employer. Ainsi, les DTD conviennent spécifiquement aux petits modèles de documents. Par contre, leur modularité limitée les rend plus complexes à employer pour des modèles plus rationnels. Une DTD est formée par des déclarations d’éléments, d’attributs et d’entités. Elle peut également comporter des déclarations de notations. Toutes ces déclarations débutent par la suite « <! » suivi d’un mot clé qui indique le type de déclaration. Les mots clés éventuels sont ELEMENT, ATTLIST et ENTITY. La déclaration se finalise par le caractère « > ».
XPath
XPath est un langage qui donne la possibilité de choisir des éléments d’un document XML. Il s’emploi pour plusieurs langages XML. Dans le présent fichier, il s’affiche déjà parmi les conditions de cohérence. Le langage XPath ne s’assimile pas à un langage indépendant. Il s’agit d’un langage d’expressions employé au niveau d’un autre langage hôte. Dans cette optique, il est similaire aux expressions logiques, connues sous le nom d’expressions régulières qui sont abrégés en regex comme elles sont employées dans les langages de script à l’exemple de Perl ou Python. La syntaxe de XPath n’est pas égale à la syntaxe XML car les expressions XPath s’affichent en général comme valeurs d’attributs de documents XML. Ceci concerne les schémas et XSLT.
Au tout début, XPath constituait un langage permettant en majeur partie de caractériser des combinaisons de nœuds dans un document XML. La version 1.0 de XPath intégrait quelques fonctions pour le traitement de nombres et de suite de caractères. Le but se résumait ainsi à trouver la possibilité de confronter les éléments des nœuds. La version 2.0 de XPath a largement développé le langage. Il s’est transformé en langage plus rempli pouvant par exemple traiter des  listes de nœuds ainsi que des valeurs atomiques. XPath est seulement un langage d’expressions dont l’appréciation donne des valeurs sans effet de bord. XPath n’est pas capable de conserver un résultat. Il n’y a pas de variables spécifiques à XPath, cependant une expression XPath peut référencer des variables du langage hôte. Les valeurs de ces variables sont ainsi employées pour apprécier l’expression. La simulation de valeurs à ces variables s’effectue seulement au sein du langage hôte.

XQuery

XQuery est un langage qui permet de déduire des données via un ou plusieurs documents XML et d’éditer des informations supplémentaires par le biais de celles extraites. Il ressemble à un langage d’interrogation de bases de données et présente une fonction SQL pour les documents XML. L’expression XQuery la mieux notable est l’expression communément appelée FLWOR. FLWOR est une abréviation qui a pour sens « For-Let-Where-Order-Return » et se prononce généralement « flower ». Son mécanisme est pareil qu’à la déclaration SQL SELECT qui contient des conditions similaires, comme FROM, WHERE, ORDER BY, etc. L’expression FLWOR nous donne le privilège d’interroger des données XML et de bases de données de manière plus efficace et imposante qu’avec des expressions XPath ordinaires et elle est la pierre angulaire de XQuery.
Néanmoins, XQuery promeut fortement la flexibilité de la clause de retour en vous donnant la possibilité d’éditer des arborescences XML en entier depuis la première étape grâce à des constructeurs. D’une manière générale, comme précédemment, la clause de retour est appréciée pour chaque élément dans la boucle for, mais en plus de la production de valeur dans une séquence, vous pouvez désormais construire une sous-arborescence XML en entier. Le but de la clause let de l’expression FLOWR est de caractériser des variables additionnels. Cela pourrait avoir comme origine la même source de données voire une source de données à part, mais vous pouvez par exemple employer la variable loop pour choisir certains éléments originaires d’autres sources.
XSLT
Le langage XML Stylesheet Language (XSL) a été établi pour convertir des documents XML en d’autres formats tels que PDF ou des pages HTML. Tout au long de son essor, le projet se montrait plus difficile par rapport à ce qui était envisagé et il a été divisé en deux unités différentes XSLT et XSL-FO. Le langage XML Stylesheet Language Transformation (XSLT) est un langage de conversion de fichiers XML. Le langage XML Stylesheet Language – Formatting Objets (XSL-FO) est un langage de mise en forme de document. La démarche pour la conversion d’un document XML en un document imprimable, au format PDF par exemple, est donc divisée en deux étapes. Dans la première étape, le document XML est converti en un document XSL-FO par le biais de feuilles de style XSLT. Dans la seconde étape, le document FO acquis à la première étape est transformé par un processeur FO en un document imprimable. Bien que le langage XSLT trouve sa provenance dans la conversion de documents XML en document XSL-FO, il convient à la conversion d’un document de tout dialecte XML dans un document, dans tout autre dialecte XML. Il est généralement employé pour fournir des documents XSL-FO ou XHTML. Le langage XSLT est également parfois employé pour effectuer des conversions classiques sur des documents. Ceci concerne, par exemple, d’enrayer certains éléments, de substituer un attribut par un élément ou de délocaliser un élément.
Le concept de fonctionnement de XSLT se présente comme suit : une feuille de style XSLT comporte des règles qui caractérisent des conversions. Ces règles sont utilisées sur un document source XML pour avoir un nouveau document XML résultat. Cette conversion est effectuée par un programme nommé processeur XSLT. La feuille de style est également nommée programme sous condition qu’il s’agisse des instructions à exécuter par le processeur. La version 2.0 de XSLT a intégré un certain nombre de progression comparée à la version 1.0.

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

INTRODUCTION ET POSITION DU PROBLEME
CHAPITRE 1 LE WEB SEMANTIQUE
1.1 W3C vers le Web sémantique
1.1.1 Web statique ou Web 1.0
1.1.2 Web 2.0
1.1.3 Web sémantiques
I.2. Architectures du Web sémantique
1.2.1 Couche URI et Unicode
1.2.2 XML
1.2.3 RDF 21
1.1.4 SparQL
1.1.5 Logique de description
1.1.6 Ontologie
1.1.7 Logique et preuves
1.1.8 Niveau de confiance
1.3 Modèle de données
1.3.1 Modèle de données tabulaires
1.3.2 Le modèle relationnel
1.3.3 Le modèle triplets
1.4 Les langages utilisés
1.4.1 Langage d’assertion et d’annotation
1.4.2 Langage de définition d’ontologie : OWL
1.4.3 Langages de description et de composition de services
1.4.4 Langages de requêtes
1.5 Concept Web sémantiques
1.5.1 Web de données et linked data
1.5.2 Web de données et Open data
1.5.3 Web sémantique et big data
1.6 Conclusion
CHAPITRE 2 LOGIQUE DE DESCRIPTION
2.1. Genéralité sur les logique de description
2.1.1 Bases de la logique des prédicats du premier ordre
2.1.2 Quelques transformées en logique du premier ordre
2.1.3 Phase d’évolution de la logique de description
2.1.4 Vue général de la logique de description
2.2 Syntaxe
2.2.1 Syntaxe des elements du langage du premier ordre
2.2.2 Syntaxe des élements de base
2.2.3 Ontologie
2.3 Sémantique
2.3.1 Relation de satisfaction
2.3.2 Interprétation de langage
2.3.3 Théorie d’une structure
2.3.4 Conséquences et équivalences logiques
2.3.5 Sémantique des expressions LD
2.3.6 Sémantique de la base de connaissances
2.3.7 Sémantique des concepts
2.3.8 Sémantique d’une logique de description associé à une ontologie
2.4 Famille des langages LD
2.4 .1 La Famille AL
2.4 .2 Les langages FL et FL–
2.5 Formalismes de base
2.5.1 Tbox
2.5.2 ABOX
2.5.3 Méthodes de tests de subsomption
2.6 Conclusion
CHAPITRE 3 ONTOLOGIE ET MODELISATION DES CONNAISSANCES
3.1 Définition de l’ontologie
3.1.1 Définitions philosophique de l’ontologie
3.1.2 Définitions issues de l’intelligence artificielle
3.2 Composantes de l’ontologie
3.2.1 Concepts
3.2.2 Relations
3.2.3 Axiomes
3.2.4 Instances (ou individus)
3.3 Structure d’une ontologie
3.3.1 Espace de nommage
3.3.2 En-têtes d’une ontologie
3.3.3 Corps du document ontologique
3.3.4 Pied du document ontologique
3.4 Rôles ontologie
3.4.1 Ontologie simple :
3.4.2 Ontologies multiples
3.4.3 Ontologie hybride
3.5 Représentation et modélisation de l’ontologie
3.5.1 Typologie d’une ontologie
3.5.2 Cycle de vie d’une ontologie
3.5.3 Construction ontologie
3.5.4 Modélisation d’une ontologie
3.5.5 Représentation d’une ontologie
3.5.6 Développement d’une ontologie
3.6 Conclusion
CHAPITRE 4 INTERROPERABILITE SUR LE WEB SEMANTIQUE
4.1 Types d’interopérabilité
4.2 Comment assurer l’interopérabilité sémantique ?
4.3 Le mapping d’ontologies
4.4 Fusion de l’ontologie
4.3.1 PROMPT
4.3.2 SAMBO
4.3.3 Fusion automatique
4.3.4 OWLDiff
4.3.5 CHIMAERA
4.3.6 FCA-Merge
4.3.7 OntoMerge
4.3.8 FCA-OntMerge
4.3.9 FFCA
4.5 Alignement
4.5.1 Les approches d’alignement d’ontologies
4.5.2 La similarité
4.6 Conclusion
CHAPITRE 5 SIMULATION ET RAISONNEMENT SUR LE WEB SEMANTIQUE
5.1 Monde clos et monde ouvert
5.2 Analyse lexicale et lemmatisation
5.2.1 Expression régulière
5.2.2 Lemmatisation
5.3 Alignement
5.3.1 Méthode d’alignement
5.3.2 Algorithme utilisé
5.3.3 Résultats
5.3.4 Interpretation des résultats
5.4 Ontologie
5.4.2 Distance sémantique du terme
5.4.3 Les Classes et propriétés
5.4.4 Les caractéristiques des propriétés
5.4.5 Domaine et range
5.4.6 Visualization des graphes conceptuels
5.5 Développement du site Web sémantique
5.5.1 Expressivité de la logique de description
5.5.2 Logique et règles
5.5.3 Exportation des codes en java
5.5.4 Exportation des codes en XML
5.5.5 Base de connaissances
5.5.6 Moteur d’inférence
CONCLUSION GENERALE
ANNEXES
Annexe 1: SQL Parser XML – Xquery : Approche de détection des injections SQL
Annexe 2 : Modélisation et construction d’une ontologie pour le Web sémantique
Annexe 3 : Raisonnement dans les systèmes à base de logiques de description
Annexe 4 : The foundation of the Web semantic: Architecture and development concept
REFERENCES
RENSEIGNEMENT SUR L’AUTEUR

Télécharger le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *