La place de la modélisation dans la gestion des informations
La gestion des informations numériques est un processus complexe, qui fait intervenir plusieurs fonctions. Il est important pour la bonne compréhension des travaux de cette thèse d’expliquer clairement la place de la modélisation dans le processus global de gestion des informations. D’après la norme ISO 14258, un modèle est « une représentation de quelque chose d’autre, exprimée sous forme mathématiques, symbolique ou de mots ». Dans ce processus, les informations sont détenues en premier lieu par l’utilisateur métier, qui les introduit dans un système d’exploitation possédant une Interface Homme-Machine (IHM).
Ce système s’appuie sur un modèle de données, qui organise les informations numériques selon les actions de l’utilisateur. Ensuite, les données sont stockées, mises-à-jour et maintenues dans un système de gestion des données, en général des bases de données. On voit alors que le modèle est une étape intermédaire, qui a pour objectif de «représenter» et donc exprimer l’information. techniques, qu’organisationnelles. Si ces différents points s’influencent nécessairement les uns les autres, il est ambitieux de prétendre les traiter tous à la fois. C’est pourquoi, la présente thèse se focalise uniquement sur la problématique de modélisation des données, considérant les autres enjeux comme des contraintes externes. Les aspects exploitation, stockage et maintenance des données et des informations ne sont donc pas ou peu considérées, tout comme le processus de captation de l’information auprès de l’expert métier (gestion des connaissances).
Parmi l’ensemble des étapes d’un processus de gestion des données, nous considérons que l’étape de modélisation est une étape support : elle est au service de l’exploitation et de la maintenance des données. En effet, un modèle doit à la fois procurer toute la sémantique au système d’exploitation, et assurer la pérennité des données stockées, en leur apportant un sens et en en assurant l’organisation. Par conséquent, l’étape de modélisation est une étape cruciale, qui doit être envisagée en amont des autres : c’est le nœud du processus.
Le cycle de vie et l’interopérabilité des informations
Le cycle de vie du produit et les systèmes d’information
Les informations que nous considérons dans ce travail de recherche sont les informations liées au produit industriel, tout au long de son cycle de vie. [Stark, 2011] décompose le cycle de vie du produit en cinq étapes majeures, sous forme de cinq verbes d’action : imaginer / définir / réaliser / utiliser et maintenir / retraiter et disposer. Ces cinq verbes correspondent aux états communément définis du produit : idée, conception, fabrication, usage et maintenance, démantèlement et recyclage ; et aux acronymes anglais BOL (pour Beginning of Life, le BOL regroupant l’idée, la conception et la fabrication), MOL (pour Middle of Life, ou utilisation et maintenance) et EOL (pour End of Life, soit le démantèlement et le recyclage).
Les approches cycle de vie dans l’industrie
La maîtrise du système complexe de systèmes que représente l’ensemble des SI industriels est un enjeu majeur pour la compétitivité industrielle. Pour dépasser cette complexité, des approches considérant le produit sur l’ensemble de son cycle de vie ont émergé, notamment le Product Lifecycle Management (PLM), ou, en français, gestion du cycle de vie du produit.
Le product lifecycle management : Nous retenons ici les définitions sur lesquelles un consensus existe 3 , en premier lieu, celle de l’International Journal on Product Lifecycle Management (IJPLM), selon lequel : Si «approche» est souvent utilisé à même escient que «méthodologie», c’est à tort : les deux termes ne sont pas synonymes. Le choix du terme «méthodologie» par l’IJPLM est fort, puisqu’une méthodologie va plus loin qu’une simple approche : selon [Zellner, 2011], qui s’appuit sur les travaux de [Braun et al., 2005] et [Winter and Schelp, 2006], une méthodologie doit comporter :
un modèle procédural : une séquence d’activités à réaliser ; un ensemble de techniques : comment générer les livrables en support des activités ; des rôles : l’identification des acteurs et de leurs responsabilités ; un modèle informationnel de la méthodologie : un modèle qui décrit les éléments de la méthodologie et leurs relations.
Le travail de [Cantamessa et al., 2012] montre qu’il n’existe pas réellement de méthodologie d’implantation du PLM, ni d’évaluation de ses effets. La partie «méthodologie» aujourd’hui n’est donc pas réalisée par le PLM. Le terme «approche», lui, signifie selon le Larousse : «une manière d’aborder un sujet, un problème».
Les applications des ontologies pour l’approche cycle de vie
Depuis la standardisation du langage OWL, l’emploi d’ontologies va croissant, particulièrement pour les applications de gestion du cycle de vie du produit. L’indicateur utilisé est le nombre de publications par année . Pour ces deux requêtes, on remarque une progression constante année après année du nombre de résultats, progression qui est sensiblement la même dans les deux cas: une multiplication par 5 entre 2004 et 2012.Il est intéressant de noter, au-delà du fait que les sujets sont connexes dans les deux requêtes, que les deux sujets les plus traités -hors outils informatiques- sont la gestion des connaissances et la modélisation des processus métier. Nous avons ensuite affiné la recherche, en nous limitant aux travaux utilisant les ontologies d’inférence pour des applications industrielles (les états de l’art par exemple, sont exclus de ce recensement). Les industries concernées sont les industries manufacturières, la construction et l’énergie. Cela exclut, par exemple, les travaux -nombreux- liés à la modélisation de l’environnement dans le cade de l’industrie agro-alimentaire. Nous n’avons également sélectionné que les travaux se centrant sur le produit ou les processus industriels. La dimension verticale représente le cycle de vie du produit. Les travaux sont ainsi classés en fonction des étapes du cycle de vie qu’ils concernent : conception, fabrication, maintenance/usage et fin de vie. Enfin, sur la ligne «autre» sont reportés les travaux qui n’adressent pas une phase du cycle de vie en particulier, soit parce qu’ils en concernent plusieurs, parce qu’ils proposent des méthodologies génériques ou parce qu’ils réalisent une évaluation des potentialités des ontologies, sans se focaliser sur une activité en particulier. Les travaux en italique sont issus d’actes de conférences ou de rapports techniques, tandis que les autres sont des articles de journaux scientifiques.
Les ontologies et la modélisation sémantique
Les ontologies : un moyen de procurer une sémantique riche
La richesse sémantique et les ontologies :Le terme de richesse sémantique est apparu assez récemment dans le domaine des ontologies pour le PLM. La première occurrence de ce terme survient dans un article de conférence en 2011 [Nazarenko et al., 2011], rédigé par l’équipe d’ONTORule , où il est question «d’enrichir sémantiquement» la base de gestion des règles par des annotations ontologiques. Cette notion est reprise dans [Wicaksono et al., 2011], puis dans [Landherr and Constantinescu, 2012] et enfin dans [van Ruijven, 2013]. Pour ce qui concerne les articles de revue, la première occurrence a lieu dans la contribution de [Al-Ashaab et al., 2012] qui précisent que le but est de produire un environnement «riche basé sur la logique et les faits» pour la chaîne logistique automobile. Le terme n’est alors utilisé qu’une seule fois. Il revient ensuite dans la contribution de [Barbau et al., 2012], rédigée par une équipe du NIST, et qui considère que le langage OntoSTEP permet «l’enrichissement des modèles de données produit par les ontologies». Le terme apparaît également dans [Giovannini et al., 2012] et [Lee and Jeong, 2012] qui emploient la notion de «sémantiquement riche». Cette notion est souvent reprise par la suite, notamment dans [Bechhofer et al., 2013], [Chandrasegaran et al., 2013] et [Song et al., 2013].
Les ontologies pour l’échange d’information et la collaboration
L’échange d’information par les modèles d’unification :Le deuxième objectif majeur de l’utilisation de modèles ontologiques est donc l’échange d’information. En effet, une information du PLM a pour vocation d’être échangée : entre les métiers, entre les phases du cycle de vie, entre les applications. Elle permet de transmettre des données porteuses de sens. Comme nous l’avons précédemment évoqué, les problématiques d’interopérabilité sont par conséquent importantes dans une approche PLM.
Pour pallier le manque d’interopérabilité sémantique des systèmes applicatifs actuels, des modèles pivots ont été développés, éléments de base des approches d’unification.
Parmi ces modèles, certains ont été standardisés, afin de permettre un partage générique entre les systèmes, sans connaissance a priori des systèmes tiers. Récemment, de nombreux travaux ont visé à transformer ces standards vers des modèles fondés sur les ontologies, forts de l’idée que le paradigme de modélisation des ontologies permettait d’améliorer l’échange sémantique des informations. De plus, la modélisation par les ontologies apportant de nouvelles possibilités, des modèles ad hoc ont été développés, et ont vocation à devenir des standards.
Les méthodologies de modélisation ontologique
Il existe plusieurs méthodologies pour créer des modèles ontologiques. A vrai dire, le terme «directives» semble plus adapté, car bien souvent, ces méthodologies proposent seulement une suite d’étapes génériques à suivre par les utilisateurs.
Methontology :Parmi toutes les méthodologies existantes, une des plus citées est la méthode METHONTOLOGY [Fernández-Lopéz et al., 1999], définie pourtant il y a plus de 10 ans.
METHONTOLOGY a été établie pour la création d’ontologies dans le domaine de la chimie. Cette méthodologie se fonde sur une suite d’étapes, chacune de ces étapes nécessitant une acquisition, une documentation et une évaluation. La méthodologie commence par une spécification de l’ontologie, fondée sur l’approche « middle out » de [Uschold and King, 1995] puis une conceptualisation reposant sur un glossaire de termes métier. Les concepts ainsi définis doivent ensuite être formalisés afin d’y intégrer l’information. Enfin, l’ontologie doit être implémentée et maintenue. [Fernández-Lopéz et al., 1999] préconisent fortement la réutilisation d’ontologies existantes.
On-To-Knowledge :Plus récemment, [Staab et al., 2001] proposent avec On-To-Knowledge quatre étapes pour créer des ontologies de gestion de la connaissance. La proposition principale de On-To-Knowledge est de rompre dans le domaine de la gestion de la connaissance avec un paradigme de modélisation fondé habituellement sur la gestion documentaire, afin de tendre vers un paradigme fondé sur la connaissance elle-même. Alors, les quatre étapes de modélisation sont : identifier les besoins primordiaux de la connaissance ; mettre en évidence les concepts métiers de la connaissance ; décrire les processus de la connaissance ; construire une infrastructure pour gérer la connaissance.
Le processus de conception d’ontologies de [Staab et al., 2001], passe par une phase lancement au cours de laquelle l’objectif est de définir des concepts métiers fondamentaux, grâce à des interviews d’experts, concepts qui seront ensuite déclinés en sous-concepts. Mais comme le précise [Ottens, 2007], «ces méthodes (METHONTOLOGY et On-To-Knowledge) fournissent peu d’aide sur les modalités d’extraction des connaissances et sur la manière de choisir le contenu de l’ontologie.»
|
Table des matières
1 La modélisation des informations au long du cycle de vie
1.1 La modélisation sémantique des informations
1.1.1 La place de la modélisation dans la gestion des informations
1.1.2 La donnée, l’information et la connaissance
1.1.3 La sémantique
1.2 Le cycle de vie et l’interopérabilité des informations
1.2.1 Le cycle de vie du produit et les systèmes d’information
1.2.2 Les approches cycle de vie dans l’industrie
1.2.3 L’interopérabilité sémantique
1.2.4 Les modèles standards d’unification
1.2.5 La fédération : combattre la rigidité des standards
1.3 L’émergence des modèles à base d’ontologies
1.3.1 Les ontologies : définition et langages
1.3.2 Les applications des ontologies pour l’approche cycle de vie
1.4 La problématique et la démarche de recherche
1.4.1 Dépasser les limites de l’unification, et celles de la fédération
1.4.2 La problématique de recherche
1.4.3 Questions et démarche de recherche
2 L’apport des ontologies pour la modélisation des informations : état de l’art
2.1 Les potentialités des ontologies d’inférence
2.1.1 Les langages OWL
2.1.2 L’expressivité
2.1.3 Le raisonnement
2.1.4 L’expressivité et le raisonnement : un antagonisme
2.1.5 Les règles, les requêtes et la syntaxe
2.2 Les ontologies et la modélisation sémantique : état de l’art
2.2.1 Les ontologies : un moyen de procurer une sémantique riche
2.2.2 Les ontologies pour l’échange d’information et la collaboration
2.2.3 Les ontologies pour le partage de la sémantique
2.3 Une illustration : l’interface conception / fabrication
2.3.1 Présentation du cas d’étude
2.3.2 Une ontologie pour l’interface conception / fabrication
2.3.3 Une nouvelle représentation graphique de la nomenclature
2.4 Les méthodologies de modélisation ontologique : état de l’art
3 Vers une modélisation ontologique des informations
3.1 La modélisation des informations du cycle de vie dans une approche fédérative
3.1.1 De l’unification à la fédération : approche générale
3.1.2 Partager une sémantique commune via un modèle unifié pivot
3.1.3 Capter et réutiliser l’information par les ontologies de domaine
3.1.4 La définition des ontologies d’application
3.2 Une méthode générique pour le cadre de modélisation
3.2.1 L’étape 1 : remonter le fil de la sémantique
3.2.2 L’étape 2 : conceptualiser et formaliser la sémantique partagée
3.2.3 L’étape 3 : conceptualiser et formaliser les ontologies de domaine
3.2.4 L’étape 4 : formaliser les modèles applicatifs
3.2.5 L’étape 5 : établir les mappings sémantiques entre les différents modèles
3.2.6 Le bilan : un cadre ontologique de formalisation des informations
4 L’application au cas des règles métier
4.1 Le cas d’étude industriel
4.1.1 L’ingénierie de la prochaine génération de centrales nucléaires
4.1.2 L’expression et l’exécution des règles métier
4.2 La mise en place du cadre de modélisation
4.2.1 La définition du besoin sémantique
4.2.2 La définition du méta-modèle sémantique (l’ontologie du cycle de vie)
4.2.3 L’utilisation des ontologies de domaine
4.2.4 La mise en œuvre des règles au niveau applicatif
4.2.5 Les correspondances entre les modèles
4.3 Les apports et limites du cadre de modélisation ontologique
4.3.1 L’apport du cadre de modélisation : une discussion
4.3.2 Les limites des ontologies pour la modélisation envisagée
5 L’implémentation du cadre de modélisation et la validation du modèle
5.1 La validation par un démonstrateur
5.1.1 Le cas d’application industriel
5.1.2 L’implémentation réalisée
5.2 La place des ontologies dans l’implémentation : une comparaison UML/OWL
5.2.1 L’indispensable inférence des modèles « métier »
5.2.2 La conceptualisation ontologique face à la formalisation UML
5.2.3 L’apport de RDF et du web des données pour la gestion des occurrences
6 La conclusion et les perspectives de recherche
6.1 La conclusion générale
6.2 Les perspectives de recherche relatives au cas d’application
6.2.1 Les méthodes de traitement automatique de corpus linguistiques
6.2.2 L’évaluation sémantique du contenu de l’ontologie métier et son évaluation
6.2.3 Des règles aux exigences et aux processus : vers une ingénierie système
6.3 Les perspectives de recherche sur la modélisation ontologique des informations
6.3.1 Les limites d’implémentation des ontologies sont-elles insurmon-tables ?
6.3.2 Les systèmes industriels : des mondes fermés ou ouverts ?
6.3.3 Quelle place pour les standards d’interopérabilité ?
6.3.4 De la philosophie des ontologies
7 Annexes
7.1 L’ontologie Famille
7.2 L’ontologie d’interface conception/fabrication
7.3 L’ontologie du cycle de vie : cas des règles métier
7.4 Liste des règles métier du cas d’application
7.5 L’ontologie métier OWL2/SWRL
7.6 Expressing formal rules within ontology-based models using SWRL : an application to the nuclear industry
7.7 La modélisation UML des règles
7.8 Le schéma d’architecture du démonstrateur
Bibliographie
Télécharger le rapport complet