Typologie des notions de trajectoires
Avant d’aborder concrètement la notion de trajectoire, il est nécessaire de spécifier dans quel espace celle-ci s’inscrit. Pour cela (Spaccapietra et al., 2008) distinguent trois principales dimensions : la dimension métaphorique, la dimension géographique et la dimension spatio-temporelle.
Chacune d’entre elles renvoie à une notion, un sens, qui peut être différent. La trajectoire métaphorique n’est pas directement rattachée à la notion de mouvement mais elle fait plutôt référence à l’idée d’évolution. Par exemple, on peut parler du cheminement professionnel d’une personne. Dans ce cas, si la dimension temporelle est bien présente, il n’y pas nécessairement de dimension spatiale. D’un point de vue informatique, ces évolutions sont gérées comme un changement d’état d’un des attributs de l’entité. La trajectoire géographique est un cas particulier de la dimension métaphorique. Bien que la dimension spatiale soit plus explicite, elle n’en reste pas moins uniquement textuelle. Ce type de trajectoire est utilisé quotidiennement quand nous souhaitons par exemple indiquer un itinéraire à une personne ou décrire notre dernier voyage. C’est pourquoi les auteurs rapprochent cette trajectoire à la notion de géographie naïve définie par Egenhofer (Egenhofer and Mark, 1995). La trajectoire spatio-temporelle est celle manipulée dans les SIG. Il s’agit d’une suite de positions exprimées en utilisant des coordonnées géographiques. Si la partie géométrique est aujourd’hui maîtrisée d’un point de vue informatique (du moins pour les géométries en deux dimensions), il en est tout autrement de la partie sémantique. Pour que cette sémantique puisse être appliquée, il est
nécessaire au préalable de disposer d’une modélisation de la trajectoire en tant qu’objet. Cela permettra de distinguer les différents éléments qui la composent pour ensuite y rattacher les informations sémantiques appropriées. Cette idée a notamment été explorée par Spaccapietra (Spaccapietra et al., 2008) sous le terme de trajectoire sémantique.
Enrichissement sémantique des trajectoires spatio-temporelles
Géographique par nature, une trajectoire est constituée d’une succession d’événements (stops, moves) spatio-temporels. Bien que cette dimension spatio-temporelle soit nécessaire à l’analyse d’un objet mobile, elle est néanmoins insuffisante. En effet, différentes informations, dites sémantiques, sont nécessaires et doivent être ajoutées. Les paragraphes ci-dessous présentent l’approche choisie ainsi que la notion de trajectoire sémantique.
Processus d’enrichissement sémantique et modélisation ontologique
Jusqu’à présent, l’essentiel de la problématique a consisté à proposer une modélisation la plus fidèle possible possible des trajectoires. Néanmoins, une trajectoire encodée sous la forme d’une suite de coordonnées ne fournit aucune information à propos du contexte dans lequel évolue l’objet. Or ce contexte participe tout autant à la compréhension et à l’interprétation d’une situation. C’est pourquoi en se basant sur la notion de trajectoire sémantique définie par Spaccapietra (Spaccapietra et al., 2008), Baglioni (Baglioni et al., 2008) propose d’augmenter le contenu informationnel d’une trajectoire par un processus d’enrichissement sémantique. Ce processus permet à partir de données brutes d’obtenir des trajectoires dont le contenu informationnel a été enrichi par l’ajout d’informations liées à la zone géographique ou encore d’informations ayant trait au domaine d’activité de l’utilisateur. En plus d’apporter des informations complémentaires, ces trajectoires sémantiques doivent être manipulables directement par l’utilisateur en utilisant un langage expressif et humainement compréhensible. De ce fait, il est nécessaire de les modéliser à l’aide d’un formalisme de représentation spécifique. Actuellement, c’est le domaine des ontologies qui offre la plus grande expressivité. C’est pourquoi les auteurs ont choisi d’utiliser le formalisme OWL pour représenter les trajectoires. L’ontologie obtenue est constituée des différents composants d’une trajectoire . Dans celle-ci sont définis les deux éléments Stop et Move permettant de délimiter spatialement et temporellement l’activité d’un objet mobile. Ainsi, dans l’approche des auteurs, la conceptualisation d’une trajectoire est représentée par une séquence d’arrêt connecté à un déplacement. Cette connexion se fait à l’aide de l’une des quatre relations : fromStop, toStop, inMove, outMove. De plus, chaque Stop s’inscrit dans une dimension temporelle spécifique comme cela est précisé par la relation StopHasTime.
Application du processus d’enrichissement sémantique
Basé sur une logique similaire d’enrichissement sémantique, Yan propose dans son travail de thèse une architecture complète pour la création, la gestion et l’analyse des trajectoires (Yan, 2011). Pour cela, il s’appuie sur une infrastructure modulaire composée de trois principales ontologies : une ontologie géométrique des trajectoires, une ontologie géographique et une ontologie du domaine d’application. il est nécessaire de préciser succinctement la signification de ce terme. Conceptuellement, une ontologie peut être vue comme un réceptacle possédant les structures nécessaires à la modélisation des connaissances. En fonction du formalisme utilisé, ces connaissances sont ensuite encodées afin d’être utilisées aussi bien par les individus que par les systèmes. Les trois ontologies nécessaires à la description d’une trajectoire sont détaillées ci-dessous.
L’ontologie géométrique des trajectoires est elle-même constituée de plusieurs sous ontologies spécialisées dans la description des concepts spatiaux ou temporels. Tout l’intérêt de l’approche proposée est de modéliser la trajectoire d’un objet mobile comme une suite de positions ordonnées temporellement. Ainsi, une trajectoire peut être représentée par une suite de triplets <x, y, t> contenant la position en x et en y ainsi qu’une référence temporelle t. Cette abstraction des entités géométriques peut être alors modélisée à l’aide des logiques de description (Yan et al.,2008).
Présentation générale du domaine de la détection d’anomalies
La détection d’anomalies fait référence à la problématique de trouver un modèle, un comportement non conforme à ce qui est potentiellement attendu. En se basant sur un jeu de données, il s’agit alors de construire des modèles de normalité à partir desquels seront détectées les déviances potentielles.
Étudié en statistique dès le 19e siècle, ce champ de recherche a été appliqué à de très nombreux domaines (bancaire, médical, informatique, etc.) (Chandola et al., 2009). Différentes approches, techniques et méthodes ont ainsi été proposées, certaines très génériques et d’autres spécifiques à un domaine d’application. C’est pourquoi cette notion de normalité et par extension d’anormalité se retrouve sous différentes formes dans la littérature scientifique (Roy, 2008).
Plus récemment, en raison du grand nombre de données disponibles et à l’augmentation croissante du nombre de capteurs (GPS, WIFI, etc.), la détection d’anomalies appliquée aux trajectoires a connu un vif intérêt (Laxhammar, 2011). Néanmoins, la plupart des algorithmes de détection nécessitent des trajectoires complètes avant d’effectuer le processus de classification. Cette procédure, dite offline, est une limitation importante pour les domaines nécessitant une réactivité immédiate. De ce fait de nombreux travaux ont été réalisés sur la définition d’algorithmes online (ou séquentiel) permettant la détection d’anomalies même sur des trajectoires incomplètes. L’analyse se fait alors en même temps que l’objet mobile évolue (Morris and Trivedi, 2008; Laxhammar, 2011).
L’avantage de ces solutions de détection online a notamment été abordée dans Piciarelli et Foresti (Piciarelli and Foresti, 2006) ainsi que dans Rhodes et al. (Rhodes et al., 2007).
Dans le domaine maritime, le suivi et la détection de trajectoires anormales ont été facilités par l’obligation pour tous les navires soumis à la convention SOLAS (Safety Of Life At Sea) de disposer d’un transpondeur AIS . Ce transpondeur utilise un signal radio digital afin de diffuser des informations statiques (nom du navire, âge, cargaison, etc.) et dynamiques (cap, vitesse, localisation, etc.) aux autres navires et aux stations côtières équipés d’un récepteur AIS. Mais, ce transpondeur est limité par la puissance du signal radio (30 à 50 milles). C’est pourquoi, l’Organisation Maritime Internationale (IMO), propose d’y ajouter un système LRIT (Long Range Identification and Tracking) afin de permettre une surveillance étendue (1000 milles). Bien que conçus au départ pour éviter la collision entre les navires, ces systèmes ont également été utilisés pour détecter des trajectoires anormales comme notamment dans les travaux de Etienne (Etienne et al., 2010) ou encore ceux de Ristic (Ristic et al., 2008). Malgré l’augmentation du nombre de capteurs disponibles, il a été prouvé que les méthodes de détection supervisée utilisées habituellement ne sont pas suffisantes. Les raisons principales sont dues notamment au manque de formalisation de la connaissance experte mais aussi à l’absence de données couvrant le spectre des comportements (Patcha and Park, 2007).
Anomalie sémantique
Tout comme la notion de trajectoire sémantique, le concept d’anomalie sémantique consiste à attacher différentes informations (météorologique, géographique, etc.) aux anomalies constatées. La première étape à réaliser est de dresser un catalogue des différentes anomalies potentielles pouvant survenir. Celles-ci doivent être bien évidemment mises en relation avec les éléments contextuels afin d’apporter une meilleure richesse sémantique. Dans le domaine maritime, ce type de travaux est assez rare. À notre connaissance, seul Roy et son équipe ont proposé une description complète d’un système de détection de comportements anormaux basé sur une approche ontologique (Roy, 2008; Roy et al., 2008; Roy and Davenport, 2010). Réalisée dans le cadre d’une étude menée par l’agence R&D du ministère de la défense nationale du Canada (RDDC), Roy propose une taxonomie des situations anormales sous la forme d’une ontologie, une description complète de chaque scénario potentiel, ainsi qu’un ensemble de règles de détection. Cette taxonomie se divise en deux catégories selon le caractère dynamique ou statique de l’événement constaté.
Les anomalies statiques correspondent par exemple à des incohérences par rapport au numéro IMO ou encore les fréquences radio du navire concerné. Les anomalies dynamiques font référence à la notion de mouvement. Celles-ci ont été subdivisées en deux sous catégories pour différencier les anomalies portant sur la cinématique du navire et les autres. La première nommée « Dynamic Non-Kinematic Anomaly » contient six classes principales portant notamment sur les relations avec le port de départ ou d’arrivée, la liste des passagers de l’équipage ou encore sur le type du navire. La seconde nommée « Dynamic Kinematic Anomaly » contient cinq classes principales directement relatives à la cinématique du navire comme sa vitesse, ses manœuvres ou encore sa localisation. Au final, cette conceptualisation des anomalies maritimes potentielles a conduit à la création d’une ontologie de haut niveau contenant plus de 350 classes, 100 propriétés, 700 restrictions et 600 instances. Pour cela, les auteurs se sont appuyés notamment sur les connaissances des experts des Forces Canadiennes ainsi que sur différentes ontologies déjà existantes comme JC3IEDM et Ucore (Roy and Davenport, 2010).
Les composants d’une ontologie
Comme cela a été mentionné, les ontologies fournissent un vocabulaire du domaine et définissent, de façon plus ou moins formelle, le sens des termes et des relations entre ces derniers. Pour cela, les connaissances intégrées dans une ontologie sont formalisées en s’appuyant sur cinq types de composants : les concepts, les relations, les fonctions, les instances et les axiomes (Gruber, 1993): Concept : terme que l’on retrouve également dans la littérature sous le nom de classe, il fait référence à la représentation d’un objet matériel, d’une notion ou d’une idée dans l’ontologie. Il s’agit, d’abstractions pertinentes d’un fragment du monde réel en fonction d’un domaine d’application. Un concept peut être classé selon plusieurs dimensions : le niveau d’abstraction (concret ou abstrait), l’atomicité (élémentaire ou composé) et le niveau de réalité (réel ou fictif) (Gómez-Pérez, 1999). Selon Uschold (Uschold and King, 1995), un concept se compose de trois parties : un ou plusieurs termes, une notion et un ensemble d’objets. Le ou les termes permettent d’identifier le concept. La notion, aussi appelée intention du concept, désigne la sémantique du concept défini au travers de ses propriétés et de ses attributs. Enfin, l’ensemble d’objets forme l’extension du concept, il s’agit de toutes les instances du concept. Lors de la création d’une ontologie, le problème qui se pose est la sélection de ces concepts. Quels sont ceux à intégrer ? Comment définir les hiérarchies ? Comment surmonter la variabilité des représentations ? Pour répondre à ces questions, Bachimont (Bachimont, 2000) propose de recourir à une normalisation sémantique des concepts en s’appuyant sur le paradigme différentiel. Celui-ci permet d’éviter toute ambiguïté de sens en définissant chacun des concepts en fonction des quatre principes différentiels que sont : le principe de communauté avec le père, le principe de différence avec le père, le principe de différence avec les frères et le principe de communauté avec les frères. Enfin, un concept se définit également au travers du lien qu’il peut entretenir avec les autres concepts de l’ontologie. De ce fait, Guarino (Guarino and Welty, 2000) propose de qualifier un concept en se basant sur des propriétés formelles de rigidité, d’identité, d’unité et de dépendance.
Relations : Dans une ontologie, les relations correspondent aux types d’interaction possibles entre les concepts d’un domaine. De ce fait, elles se définissent à la fois par leur signature mais aussi par le contenu sémantique entre les concepts qu’elles unissent (Bachimont, 2000). Par exemple, deux relations peuvent porter sur deux mêmes concepts (signature sémantique égale) sans toutefois avoir le même sens (contenu sémantique différent). Dans une ontologie, les relations permettent ainsi de structurer les connaissances et de définir les interrelations entre les concepts. Par exemple si l’on souhaite définir une relation de spécialisation entre les concepts d’un domaine, on utilise pour cela une relation de type sous-classe-de (subClassOf). Ces relations peuvent également être utilisées afin de faire référence à des propriétés spécifiques afin d’exprimer une valeur qui peut être textuelle ou encore algébrique. Ainsi, deux grands types de relations peuvent être distingués (Hernandez,2005) : les relations taxonomiques et les relations associatives. Les premières, également appelées subsomption ou encore relation de spécificité/généricité permettent d’organiser hiérarchiquement un ensemble de concepts. Les secondes désignent toutes les relations entre les concepts qui ne sont pas des relations de taxonomiques. Ces relations peuvent être enrichies par des notions de symétrie, de transitivité ou encore de non-réflexivité. Fonctions : ce sont un cas particulier de relations dans lesquelles un élément est défini en fonction des éléments précédents.
Instances : elles sont utilisées pour représenter les individus d’une ontologie. Ces individus correspondent à une instance concrète de la classe à laquelle ils appartiennent. Dans le cas d’une ontologie contenant des instances, celles-ci devient alors une base de connaissances.
Axiomes : sont des assertions toujours vraies à propos des abstractions (concepts et relations) du domaine modélisé. Ils permettent de combiner des concepts, des relations et des fonctions pour définir des règles d’inférence. L’ajout d’axiomes dans une ontologie peut avoir notamment pour objectif de définir la signification des composants, de restreindre la valeur des attributs ou encore de vérifier la validité des informations spécifiées (Hernandez, 2005).
|
Table des matières
Introduction
Contexte général
Problématique et contexte scientifique Management et modélisation des connaissances spatiales dans le domaine maritime
Problématique et contexte applicatif : les systèmes de surveillance maritime de nouvelle génération
Hypothèse et objectifs de recherche
Hypothèse
objectifs de recherche
Proposition de recherche et approche adoptée
Méthodologie & Structure de la thèse
Méthodologie
Structure de la Thèse
Partie 1 État de l’art
Chapitre 1. Trajectoires et comportements sémantiques
1.1. D’un objet mobile à une trajectoire sémantique
1.1.1. Modélisation conceptuelle des trajectoires
1.1.2. Enrichissement sémantique des trajectoires spatio-temporelles
1.2. De la normalité aux anomalies sémantiques
1.2.1. Détection d’anomalies
1.2.2. Création de trajectoires
1.2.3. Anomalie sémantique
1.3. D’une trajectoire anormale à un comportement
1.3.1. Simple Event Model (SEM)
1.3.2. ISFAR
Chapitre 2. Formalisation de la connaissance au sein des ontologies
2.1. L’ontologie en Intelligence Artificielle
2.1.1. Origine et définitions
2.1.2. Les composants d’une ontologie
2.1.3. Le rôle des ontologies dans les systèmes d’information
2.1.4. Typologie des ontologies
2.2. Méthodologies pour la construction d’ontologies
2.2.1. Principes généraux guidant la construction d’une ontologie
2.2.2. La méthode On-To-Knowledge
2.2.3. La méthode Methontology
2.3. Formalismes et Langages de représentation d’ontologies
2.3.1. Formalismes de représentation
2.3.2. Les langages ontologiques
2.4. Conception et exploitation d’ontologies
2.4.1. Éditeur d’ontologies
2.4.2. Interfaces de programmation pour la manipulation d’ontologies
2.4.3. Raisonner à partir d’une ontologie
Chapitre 3. Représentation et raisonnement spatial dans les ontologies
3.1. De la perception de l’espace à sa représentation ontologique
3.1.1. De la difficulté à représenter l’espace
3.1.2. Différents niveaux de représentation de l’espace
3.2. Modélisation des concepts géographiques et spatiaux à l’aide d’une ontologie
3.2.1. Des ontologies géographiques aux ontologies géospatiales
3.2.2. Domaine d’application des ontologies géospatiales
3.2.3. Typologie des ontologies géospatiales
3.2.4. Ontologies géospatiales existantes
3.2.5. Architecture du Web Sémantique géospatial
3.3. Raisonnement spatial dans les ontologies
3.3.1. Le raisonnement spatial qualitatif, le cas de la topologie
3.3.2. Raisonnement spatial topologique dans les ontologies
Partie 2 Approche proposée
Chapitre 4. Une approche ontologique pour l’analyse des comportements de navires
4.1. Modélisation du contexte sémantique
4.1.1. Conceptualisation du modèle
4.1.2. Ontologie géométrique des trajectoires
4.1.3. Ontologie géographique
4.2. Ontologie du domaine : l’analyse de comportements anormaux de navires
4.2.1. Principales classes de l’ontologie du domaine
4.2.2. Modélisation des alertes
4.2.3. Modélisation des scénarios
4.2.4. Modélisation du contexte maritime
4.3. Modélisation des règles d’inférence et enrichissement du SWRL
4.3.1. Le langage SWRL
4.3.2.Modélisation des règles classiques
4.3.3.Modélisation des règles spatiales
Chapitre 5. Structuration de la plate-forme d’analyse des comportements anormaux de navires
5.1. Analyse de comportements dirigé par une ontologie : application à la surveillance maritime
5.1.1. Présentation générale du prototype
5.1.2. Vue du prototype
5.2. Module de données
5.2.1. Présentation des données
5.2.2. Préparation des données
5.2.3. Enrichissement des données et création de la trajectoire sémantique
5.3. Module d’inférence
5.3.1. Architecture du module d’inférence
5.3.2. Processus d’inférence
5.3.3. Résultats du processus d’inférence
5.4. Module de calcul de similarité des comportements anormaux
5.4.1. Raisonnement à partir de cas
5.4.2. Architecture du module de calcul de similarité
5.4.3. intégration de l’ontologie et calcul de similarité
5.5. Module cartographique
5.5.1. Architecture du module
5.5.2. Interface et présentation des comportements
Chapitre 6. Expérimentations et évaluations
6.1. Exemples de scénarios type
6.1.1. Scénario d’un navire dangereux dans une zone réglementée
6.1.2. Scénario de transbordement de pêche
6.1.3. Autres scénarios
6.2. Évaluation du système
6.2.1. Évaluation des performances du système
6.2.2. Synthèse des résultats
6.3. Perspectives d’amélioration
6.3.1. Amélioration fonctionnelle
6.3.2. Amélioration du processus de modélisation des connaissances
Conclusion
Télécharger le rapport complet