Etat de l’art sur les modèles de mappage
Problématique
L’intégration des données se reporte à un problème combinatoire de données résidentes dansdes sources autonomes et hétérogènes. Ce problème est rendu crucial avec la prolifération dessources de données sur Internet ou au sein des entreprises, le caractère hétérogène de ces données etle besoin de plus en plus pressant d’exploiter ces gisements de données pour des besoinsdécisionnels.Notamment, l’appariement de schémas est l’un des problèmes majeurs rencontréslors du processus d’intégration soit de données (par exemple, la médiation de données, les entrepôts de données, etc.),soit applications (par exemple, le e-commerce, le Web sémantique, etc.).Tout ceci pose de sérieux problèmes aux utilisateurs qui cherchent à combiner, ou « intégrer » des informations provenant des sources différentes. Parmi eux on peut citer les problèmes liés à lagestion des schémas, l’évolution des schémas, le Mapping et le Matching des schémas.Dans ce contexte, plusieurs approches ont été développées cernant ainsi les aspects de transformation de données qui résultent de l’hétérogénéité technique, syntaxique et sémantique des sources de données, de génération de Matching et de Mappings. Pour simplifier et accélérer ces tâches d’intégration de données et garantir une interconnexion efficace entre tous les systèmes, il est nécessaire de bâtir des passerelles entre tous ces types de données. Ceci se fera en permettant de concevoir les schémas de Mapping de façon visuelle et en automatisant les transformations nous permettant de nous concentrer sur l’implémentation de la logique métier dans les applications.
Plan du rapport
Le présent rapport est organisé en trois grandes parties. La première est consacrée à l’état de l’art où est passée en revue la littérature relative aux technologies traitées. En effet, un état de l’art recensant les algorithmes de Matching de schémas est présenté dans le chapitre 2. Dans le chapitre 3, nous décrivons les modèles de découverte des expressions de mappage. Dans le chapitre 4, nous allons étudier les outils existants qui réalisent le Mapping et faire une comparaison entre eux. Dans la deuxième partie, on va proposer une architecture répondant à toutes les problématiques posées. Dans le chapitre 5, nous allons détailler cette architecture et présenter ses spécificités. Le chapitre 6 sera consacré à la conception de l’architecture proposée et le chapitre 7 à la réalisation et l’implémentation de cette architecture 11. Enfin, la dernière partie (conclusion et perspectives) synthétise le travail accompli et les différents points que nous devons développer dans le futur.
Les approches basées sur les schémas de données
Dans cette catégorie, on trouvera les algorithmes travaillant sur les méta données (DTD, schémas XML, schémas de bases de données, …) spécifiques pour trouver l’indice de similarité le plus précis entre les éléments, Cupid [15] en est un exemple. Cet algorithme tente de trouver les correspondances sémantiques des éléments de différents schémas qui sont génériques. Les auteurs ont testé leur application sur les schémas XML et les schémas relationnels. Le processus de Matching se déroule en trois étapes: le calcul de la similarité, la similarité structurelle (les éléments atomiques, les éléments composés, les feuilles, les noeuds internes, les sous arbres), et le calcul du poids de similarité. Similarity Flooding [16] [17] est un algorithme de Matching structurel pour schémas XML, SQL DDL, schemas RDF, UML et OEM. Il utilise l’idée d’influence de nœud sur ses adjacents. Dans [18] XClust est une stratégie d’intégration basée sur le clustering des DTD ou bien sur les schémas. La similarité linguistique dans ce cas, est basée sur un thésaurus et la similarité structurelle est basée sur (les éléments atomiques, les éléments composés, sur les sous arbres et nombre de feuilles).
|
Table des matières
Chapitre Introduction Problématique Plan du rapport Environnement du stage Chapitre Etat de l'art sur le Matching L'interopérabilité Les schémas XML Les algorithmes de Matching des schémas Les approches basées sur les schémas de données Les approches basées sur les instances ou ontologies Conclusion Chapitre Etat de l'art sur les modèles de mappage Mapping des schémas Modèles de découverte des expressions de mappage Value Correspondences . Le Modèle d'expression de Mappage [1]. Le Modèle de données LIMXS . Le modèle XHS (Intégration via l'HYPERSCHEMA XML) . Model Management System TUPELO Synthèse des expressions de mappage Chapitre Etat de l'art sur les outils de Mapping Introduction Les plateformes et Outils de Mapping Altova MapForce . Schema Mapper Stylus Studio Visual XSLT TIBCO XMLTransform Adeptia XML Mapper Redix AnyToAny XML GUI Mapper Clio HyperMapper BEA WebLogic Workshop Cape Clear
Télécharger le rapport complet