Architecture du Web sémantique

Le terme Évolution est défini dans le Dictionnaire de l’Académie Française (9ème édition, dictionnaire en ligne) comme une “suite de transformations progressives, de développements graduels, de modifications”. Il s’agit de changements et de modifications ayant lieu d’une manière progressive. Le sujet de l’évolution joue un rôle important depuis longtemps dans les recherches de plusieurs domaines tels que l’économie, la génétique, la psychologie, les sciences du langage, etc.

Dans le domaine de l’informatique, l’évolution est aussi un sujet qui attire beaucoup de travaux de recherche. Il existe des études sur l’évolution du système de base de données, l’évolution en génie logiciel, l’évolution des bases de connaissances, etc. Dans la nouvelle génération du Web, le Web sémantique favorisera l’évolution de la connaissance humaine vers un autre type de connaissance “compréhensible” par la machine qui peut être traitée automatiquement dans les systèmes de gestion des connaissances. L’application des technologies du Web sémantique (i.e. l’ontologie, l’annotation sémantique, la recherche intelligente…) aux systèmes de gestion des connaissances peut entraîner l’évolution de ces systèmes et elle doit être bien gérée. Ainsi, ce mémoire de thèse s’intéresse aux études sur l’évolution du Web sémantique et particulièrement sur les deux composants importants, i.e. l’ontologie et l’annotation sémantique.

Web sémantique

De nos jours, les informations du web actuel augmentent énormément ce qui a bien renforcé le besoin de partager, d’échanger et de réutiliser ces informations d’une manière efficace entre les utilisateurs. Cependant, la plupart des informations se trouvant sur Internet sont effectivement lisibles par les hommes mais elles sont difficilement interprétables par les machines. Nous pouvons le constater clairement à travers un exemple de recherche d’information avec un moteur de recherche actuel basé principalement sur les mots-clés (e.g. Altavista, Google…). Par exemple, si nous effectuons une recherche sur les mots “voiture” et “accident” avec le sens d’un accident de voiture mais nous ne l’avons pas spécifié explicitement au moteur de recherche, alors nous obtiendrons peut-être beaucoup de réponses renvoyées qui ne relient pas du tout avec notre requête. Elles pourraient être des documents contenant le mot “voiture” avec le sens d’un magazine de voiture, d’une nouvelle collection de voiture…, ou les documents comportant le mot “accident” avec le sens d’un accident d’avion, d’un lieu ou des victimes de l’accident, etc. Cependant, les résultats renvoyées peut-être ne contiennent pas des informations telles que “collision des voitures” ou “accident des camions”… qui sont également considérées d’être concernées à notre requête.

La raison principale de l’imprécision de la recherche ci-dessus est que la description de ces informations est encore limitée et non pas exploitée d’une manière plus “intelligente” par les machines. Le manque de normes et de sémantique formelle des informations du Web actuel empêche également le partage et la réutilisation d’information entre les individus et les organisations. Par conséquent, la vision du Web du futur a pour objectif de relier des “connaissances” en permettant à des machines d’accéder aux sources d’information et aux services du Web .

L’expression de Web Sémantique, énoncée par Tim Berners-Lee [BernersLee et al., 2001] fait d’abord référence à la vision du Web du futur comme un vaste espace d’échange de ressources supportant la collaboration entre humains et machines en vue d’exploiter plus efficacement de grands volumes d’informations et de services variés disponibles sur le Web. L’objectif du Web sémantique est de rendre explicite le contenu sémantique des ressources dans le Web (documents, pages web, services, etc.). Les machines et les agents logiciels pourraient “comprendre” les contenus décrits dans les ressources et faciliter les tâches de traitement des informations de façon plus automatique et plus efficace. Avec cette idée, le moteur de recherche sémantique peut “savoir” et “trouver” exactement les documents contenant l’information “accident de voiture” grâce aux sémantiques attachées dans ces documents telles que “l’accident est un type de collision”, “l’accident entrîne des dégâts sur le véhicule”, “la voiture est un type de véhicule”, “le camion est un type de véhicule”, etc.

Architecture et langages du Web sémantique

Architecture du Web sémantique

La vision courante du Web sémantique proposée par [Berners-Lee et al., 2001] peut être représentée dans une architecture en plusieurs couches différentes.

Les couches les plus bases assurent l’interopérabilité syntaxique : la notion d’URI fournit un adressage standard universel permettant d’identifir les ressources tandis que Unicode est un encodage textuel universel pour échanger des symboles. Rappelons que l’URL , comme l’URI, est une chaîne courte de caractères qui est aussi utilisée pour identifier des ressources (physiques) par leur localisation.

XML fournit une syntaxe pour décrire la structure du document, créer et manipuler des instances des documents. Il utilise l’espace de nommage (namespace) afin d’identifier les noms des balises (tags) utilisées dans les documents XML. Le schéma XML permet de définir les vocabulaires pour des documents XML valides. Cependant, XML n’impose aucune contrainte sémantique à la signification de ces documents, l’interopérabilité syntaxique n’est pas suffisante pour qu’un logiciel puisse “comprendre” le contenu des données et les manipuler d’une manière significative.

Les couches RDF M&S (RDF Model and Syntax) et RDF Schéma sont considérées comme les premières fondations de l’interopérabilité sémantique. Elles permettent de décrire les taxonomies des concepts et des propriétés (avec leurs signatures). RDF fournit un moyen d’insérer de la sémantique dans un document, l’information est conservée principalement sous forme de déclarations RDF. Le schéma RDFS décrit les hiérarchies des concepts et des relations entre les concepts, les propriétés et les restrictions domaine/co-domaine pour les propriétés.

La couche suivante Ontologie décrit des sources d’information hétérogènes, distribuées et semi-structurées en définissant le consensus du domaine commun et partagé par plusieurs personnes et communautés. Les ontologies aident la machine et l’humain à communiquer avec concision en utilisant l’échange de sémantique plutôt que de syntaxe seulement. Les règles sont aussi un élément clé de la vision du Web sémantique, la couche Règles offre la possibilité et les moyens de l’intégration, de la dérivation, et de la transformation de données provenant de sources multiples, etc.

La couche Logique se trouve au-dessus de la couche Ontologie. Certains considèrent ces deux couches comme étant au même niveau, comme des ontologies basées sur la logique et permettant des axiomes logiques. En appliquant la déduction logique, on peut inférer de nouvelles connaissances à partir d’une information explicitement représentée.

Les couches Preuve (Proof) et Confiance (Trust) sont les couches restantes qui fournissent la capacité de vérification des déclarations effectuées dans le Web Sémantique. On s’oriente vers un environnement du Web sémantique fiable et sécurisé dans lequel nous pouvons effectuer des tâches complexes en sûreté. D’autre part, la provenance des connaissances, des données, des ontologies ou des déductions est authentifiée et assurée par des signatures numériques, dans le cas où la sécurité est importante ou le secret nécessaire, le chiffrement est utilisé.

Langages du Web sémantique

Dans le contexte du Web Sémantique, plusieurs langages ont été développés. La plupart de ces langages reposent sur XML ou utilisent XML comme syntaxe. Nous allons présenter brièvement certains langages principaux XML, XML Schéma, RDF(S), OWL, SPARQL, RDFa et RIF.

XML (eXtensible Markup Language)

XML est un langage de balisage extensible et est considéré comme une spécification pour les documents “lisible par les machines”. Il est naturellement utilisé pour encoder les langages du Web sémantique. Le balisage signifie que certaines suites des caractères du document peuvent contenir de l’information indiquant le rôle du contenu du document. XML se sert de balises (tags, par exemple ou ) pour décrire un classement des données du document et sa structure logique. Cependant, le caractère extensible indique la différence importante avec d’autres langages précédents qui est aussi la caractéristique essentielle du XML. XML est un métalangage (une description de type de document, DTD, permet de décrire la grammaire des documents admissibles) : en effet XML fournit un structure pour représenter d’autres langages d’une manière normalisée.

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

Introduction
1 État de l’art
1.1 Web sémantique
1.1.1 Architecture et langages du Web sémantique
1.1.2 Composants principaux du Web sémantique
1.1.3 De la Mémoire d’entreprise au Web sémantique d’entreprise
1.2 Évolution du système de gestion des connaissances
1.2.1 Problème de changements et de l’évolution
1.2.2 Approches principales sur la gestion de l’évolution
1.3 Conclusion
2 Évolution du Web Sémantique d’Entreprise
2.1 Introduction
2.1.1 Web sémantique d’entreprise – Approche Acacia
2.1.2 Cycle de développement
2.1.3 Applications du Web Sémantique d’entreprise
2.2 Problèmes d’évolution du WSE
2.2.1 Causes possibles des problèmes d’évolution
2.2.2 Scénarios d’évolution
2.3 Aspects importants de l’évolution de l’ontologie
2.3.1 Processus d’évolution
2.3.2 Représentation des changements
2.3.3 Détection des changements ontologiques
2.3.4 Vérification et résolution des inconsistances
2.3.5 Comparaison et Gestion des versions de l’ontologie
2.3.6 Discussion
2.4 Aspects importants de l’évolution de l’annotation sémantique
2.4.1 Analyse des effets des changements ontologiques sur l’annotation
2.4.2 Détection des annotations inconsistantes
2.4.3 Résolution des annotations inconsistantes
2.4.4 Discussion
2.5 Conclusion
3 CoSWEM – un système de gestion de l’évolution du WSE
3.1 Motivations
3.2 Architecture du système CoSWEM
3.2.1 Architecture
3.2.2 Description des composants du système
3.2.3 Intégration de CoSWEM dans un Web sémantique d’entreprise
3.3 Évolution de l’ontologie dans le système CoSWEM
3.3.1 Propagation des changements de l’ontologie
3.3.2 Principaux aspects de l’évolution de l’ontologie
3.4 Évolution de l’annotation sémantique dans le système CoSWEM
3.4.1 Étapes principales
3.4.2 Approches de détection et de résolution des inconsistances
3.5 Outils de support utilisés dans le système CoSWEM
3.5.1 CORESE – Moteur de recherche sémantique
3.5.2 ECCO – Editeur Collaboratif et Contextuel d’Ontologie
3.5.3 SemTag – Librairie de tags JSP sémantiques
3.6 Conclusion
4 Évolution de l’ontologie
Conclusion