CEP à base de connaissance dans un milieu pratique
Contexte du projet et problématique
Introduction
Dans notre projet nous nous intéressons à l’analyse des données massives relatives à un réseau de distribution électrique. Il s’agit d’un environnement spatio-temporel dans lequel diverses caractéristiques sont importantes telles que la topologie de réseau, la localisation des pannes, la date de chaque panne, la date de chaque intervention, etc.
Dans ce chapitre, nous présentons d’abord les concepts de base permettant de définir un tel environnement. Puis nous exposons la problématique de notre recherche, ainsi que les principaux objectifs qu’on vise à atteindre dans le cadre de ce mémoire.
Environnement spatiotemporel
Données spatiales
Les données spatiales permettent de décrire l’orientation géographique spécifique des objets spatiaux et la distribution spatiale dans le monde réel [Shuliang, 2013]. Elles spécifient également les attributs des entités spatiales (le nombre d’individus, leur emplacement et leurs relations mutuelles) et permettent de décrire l’information spatiale sur plusieurs niveaux. Par exemple, grâce à des technologies de détection avancées, il est possible de détecter les coordonnées d’une surface point par point à un micro-niveau et d’extraire ses propriétés géométriques et physiques grâce à des images fournies pour un macro-niveau. Plusieurs chercheurs ont montré l’importance de l’information spatiale qui représente implicitement près de 80 % de l’information contenue dans les bases de données [Bedard, 2015]. En effet, la présence de plus en plus importante de capteurs sur la planète permet de générer un volume croissant de données qui contiennent souvent de l’information spatiale : coordonnées GPS, adresse, code postal, adresse IP, numéro de téléphone, etc. De plus, les données spatiales sont de types variés : elles peuvent décrire la valeur de la hauteur d’un point, la longueur des routes, la superficie des polygones, le volume de bâtiments, la valeur des pixels, les graphiques des images, etc.
Objets spatiaux et relations spatiales
Les objets spatiaux sont considérés comme des entités spatiales qui sont situées dans l’espace. Un objet spatial contient des informations sur ses propres limites (frontières) qui le distinguent des autres objets dans l’espace [Barouni et Moulin, 2016].
Les relations spatiales sont utilisées pour décrire les positions relatives de plusieurs entités définies par des attributs spatiaux [Cohn et Renz, 2007]. Les relations spatiales sont classées en trois grandes familles : relations de distance, relations topologiques et relations directionnelles (orientation).
Données temporelles
Les données à dimension temporelle sont généralement utilisées dans les systèmes d’aide à la décision. Ce sont des données qui réfèrent spécifiquement au temps et/ou à des dates. Les données temporelles peuvent référer à des événements discrets tels que des coups de foudre, à des objets en mouvement tels que des voitures, des trains ou à des répétitions d’observations telles que des données de capteurs.
Relations temporelles
Les relations temporelles sont utilisées pour décrire les positionnements relatifs des événements et/ou de processus sur l’axe du temps. À partir des relations temporelles, nous pouvons distinguer deux types de corrélations possibles dans le temps. La première concerne la découverte de relations causales entre des événements ayant des attributs temporels. La deuxième concerne l’identification de modèles similaires dans la même séquence de temps ou entre différentes séquences de temps [Roddick, 1999].
Situation spatiotemporelle
Une situation est une configuration finie de quelques aspects du monde de référence qui a une caractéristique spatiale et une caractéristique temporelle, et dans laquelle des objets possèdent des propriétés et peuvent être en relation avec d’autres objets [Moulin, 2015].
Une situation temporelle est une situation associée à un intervalle de temps. Elle peut être une configuration statique (un état) qui ne change pas sur une période de temps, une configuration de changement (un événement) qui se produit à un instant déterminé (à un instant inférieur à un seuil bien déterminé) ou une configuration de changement qui évolue dans le temps (un processus) [Moulin, 2015].
Une situation spatiotemporelle est une situation associée à des positions spatiales et temporelles [Haddad, 2009].
État
Un état est défini comme étant une situation statique décrivant la stabilité et la non-modification (du point de vue de la localisation spatiale et temporelle ou les propriétés des objets) [Desclés, 1994]. Haddad et Moulin [2007] ont défini un état du monde (« A state of the world ») comme étant la description du monde à un instant t. Il s’agit du résultat de l’attribution d’une valeur à chaque entité et à chaque relation entre les entités qui décrivent le monde et qui sont utilisées dans la représentation des situations.
Haddad et Moulin [2010] ont représenté un état comme étant une situation spatiotemporelle définie par des attributs spatiaux et temporels.
Événement
Selon [Desclés, 1994], un événement exprime une occurrence temporelle de durée négligeable, qui apparait dans un monde statique et qui peut changer ou ne pas changer l’état de ce monde. Haddad et Moulin [2010] ont proposé une approche complémentaire où un événement représente une situation spatiotemporelle qui fait la liaison entre deux états en utilisant des relations spatiales. Barouni et Moulin [2012] ont utilisé cette approche pour définir un événement spatiotemporel. Dans cette définition, ils utilisent aussi bien les attributs spatiaux que les attributs temporels.
Par exemple, la figure 6 présente une instance d’événement de coupure d’une ligne électrique. Cet événement s’est produit sur la ligne L1 (attribut spatial) à 17h21(attribut temporel). Suite à cet événement, le capteur C1L1 qui se situe sur la ligne L1 (attribut spatial) passe de l’état « en fonctionnement », à 17h20 (Attribut temporel) à l’état « hors tension » à 17h22 (Attribut temporel).
Processus
Galton a distingué deux types d’événements : les événements ponctuels et les événements ayant une durée déterminée, qu’on appelle aussi processus [Galton, 2004]. Un processus exprime un changement déclenché par un événement et peut avoir un état final (résultat) [Desclés, 1994]. Moulin et Haddad [2010] ont proposé une définition de trois relations en liaison avec le processus, en utilisant trois opérateurs temporels (avant, durant et après).La relation «Avant la situation» définit la situation initiale avant le déclenchement du processus, la relation «Durant la situation» définit la situation intermédiaire durant le processus et la relation « Après la situation » définit la situation finale après la fin du processus.
Outils de collecte de données – Réseaux SWE
Les données spatiotemporelles sont utilisées pour décrire des changements temporels qui peuvent survenir sur des objets spatiaux. C’est par exemple l’objectif d’un système d’information géographique, il permet d’acquérir des événements horodatés relatifs à des objets spatiaux [Roddick, 1999].
Les outils de collecte des données spatiotemporelles, génèrent non seulement des données volumineuses et de types variés, mais souvent aussi un flux continu de données en temps réel. D’où le caractère véloce des données. Les outils de collecte de données spatio-temporelles sont utilisés par des systèmes d’aide à la décision dans un grand nombre de domaines (télécommunication, écologie, climat, etc.) [Sakr, 2011].
Parmi ces outils, nous nous intéressons aux « Sensor Web Enabled networks » (SWE Networks). C’est une nouvelle génération de réseaux de capteurs utilisés généralement pour la surveillance de l’environnement. Il s’agit de plusieurs capteurs montés sur des dispositifs qui fonctionnent avec la même fréquence, dans la même zone, et utilisent le même protocole de communication [Townsend et al, 2002]. Ainsi, les réseaux SWE ont les avantages suivants [Li, 2014] :
– L’interopérabilité : Les différents capteurs sont capables de fonctionner ensemble tout en produisant une sortie commune.
– La scalabilité : La configuration de l’ajout ou de la suppression d’un capteur est relativement facile.
– L’autonomie : Les capteurs peuvent agir automatiquement sans l’intervention humaine.
Ce genre de capteurs est géo-référencé et collecte des informations horodatées. Puis il génère des événements spatiotemporels en temps réel qui seront traités par la suite par des applications dédiées [Haddad et Moulin, 2010].
Les données extraites des événements bruts, collectées par les réseaux sont trop primitives pour appuyer le raisonnement humain et la prise de décision. Le premier défi en lien avec les SWE est la nature de ces données. En effet, elles ne sont pas intuitives et sont représentées dans des formats non facilement interprétables par un opérateur humain [Barouni et Moulin, 2010]. De plus, ce sont des données volumineuses en explosion (si on collecte les données d’un capteur 10 fois par heure, on aura 87600 lignes par année pour chaque capteur) dont le stockage dans des bases de données conventionnelles présente des limites de point de vue scalabilité. En fait, étant donné que ces données sont souvent semi structurées (qui pourraient être transformées vers des données structurées, relationnelles), il faut établir des requêtes complexes pour en extraire de l’information [Bruchez, 2013]. Les événements détectés par les capteurs SWE sont acheminés vers un système dit d’acquisition de données pour les traiter et les analyser.
Système d’acquisition de données
Un système d’acquisition de données est un système composé de capteurs de mesure et d’un ordinateur équipé d’un logiciel programmable (Figure 7). Dans le domaine électrique, le but d’un tel système est de collecter des données de mesure d’un phénomène électrique ou physique telles que le courant, la tension, la pression, la température, etc.Un autre défi des SWE est la vitesse avec laquelle ces données sont acheminées vers les systèmes d’acquisition. En effet, elles arrivent en flux continu et peuvent contenir des informations pertinentes (panne, interruption de service, etc.) nécessitant une intervention humaine urgente (diagnostic, maintenance, etc.). C’est ce qui explique le besoin d’un traitement en temps réel pour filtrer les événements pertinents dès qu’ils arrivent.Notre intérêt dans ce mémoire se focalise sur l’analyse des données spatiotemporelles complexes collectées par les capteurs SWE pour les exploiter au niveau de la prise de décision.
Complex event processing et patron spatiotemporel
Étant donné le caractère véloce et complexe des données acheminées vers les systèmes d’acquisition, les techniques d’exploration de données telles que le Data Mining s’avèrent habituellement inefficaces pour effectuer des traitements adéquats [Barouni et Moulin, 2012]. Pour ce genre de systèmes, Lukham [2002] a introduit une nouvelle approche de traitement des événements complexes appelée Complex Event Processing (CEP).
Complex event processing
« Le CEP est un ensemble de techniques et d’outils permettant de comprendre et contrôler les systèmes d’information à base d’événements » [Lukham, 2002]. Il consiste à utiliser diverses techniques (système à base de règles, patrons d’événements et relations entre événements) pour prétraiter des événements complexes. Lukham définit un événement complexe comme étant un événement qui ne pourrait se produire si plusieurs autres événements ne s’étaient pas produits auparavant. Le but du CEP est de combiner des données hétérogènes provenant de plusieurs sources pour déterminer des corrélations entre elles (causalité, temporelle, etc.). Le mécanisme du CEP est simple, il se compose d’une base de configurations typiques qu’on appelle « patrons » et d’un moteur de filtrage (Figure 8).Ce moteur prend en entrée un flux d’événements et permet de faire la correspondance entre les attributs des événements reçus avec des configurations typiques appelés « patrons des événements ». En cas de correspondances détectées, le moteur de filtrage signale la présence d’une instance de patron. Ces patrons sont exprimés en EPL, un langage de description de patrons d’événement (Event Pattern Language) en se basant sur une algèbre des événements.Le but de l’approche de Lukham est d’identifier les événements les plus significatifs, à partir du flux des événements bruts provenant de plusieurs sources de données et de la base de patrons prédéfinis (Figure 8).Le moteur CEP permet de distinguer les instances de patrons détectées afin d’y répondre le plus rapidement possible, et d’écarter les événements non significatifs [Buchmann et Koldehofe, 2009]. En fait, un événement ne peut contenir qu’un petit bout de l’information. Pour donner sens à cette information, on pourrait avoir besoin d’autres événements qui sont reliés d’une façon ou d’une autre à l’événement origine.Le cas d’utilisation principal que Lukham avait présenté se situe dans le secteur financier, plus particulièrement dans les marchés de capitaux (Trading Bonds, Change, etc.) où le CEP a pu servir à détecter des cas de fraude dans un flux de données. Par exemple, sur un compte bancaire, on pourrait détecter un changement de mot de passe suivi d’une transaction. Toutefois, avec les extensions et les améliorations ajoutées par la suite (tableaux de bord, interfaces personne-machine, etc.), le CEP peut être utilisé dans un grand nombre de domaines d’application parmi lesquels les systèmes de gestion de pannes dans les réseaux de distribution électriques. Parmi les implémentations les plus matures, nous citons ESPER [ESPER, 2016]. C’est un logiciel open source implémenté en Java et dédié au CEP. Il fournit un langage de traitement d’événements riche pour exprimer le filtrage, l’agrégation et la jointure d’événements.
Dans ce mémoire, nous nous intéressons aux systèmes de contrôle et de gestion de données qui utilisent les capteurs SWE pour détecter les événements spatiotemporels. Nous considérons l’approche de CEP qui s’avère efficace pour filtrer les événements correspondant à des configurations dites « intéressantes ».
Patron spatio-temporel
Barouni a défini un patron spatiotemporel comme étant une configuration finie comportant un ensemble d’événements et d’états reliés entre eux par des attributs spatiaux et temporels [Barouni et Moulin, 2012].La Figure 9 présente un exemple simple de patron spatiotemporel. Il représente un premier événement de coupure de ligne L12 suivi par un deuxième événement de coupure de ligne L13. Le premier s’est produit sur la ligne L12 (attribut spatial) à 17h21 (attribut temporel). Suite à cet événement, le capteur C1L12 qui se situe sur la ligne L12 (attribut spatial) passe de l’état « en fonctionnement », à 17h20 (Attribut temporel) à l’état « hors tension » à 17h22 (Attribut temporel). Le premier s’est produit sur la ligne adjacente L13 (attribut spatial) à 17h22 (attribut temporel). Suite à cet événement, le capteur C1L13 qui se situe sur la ligne L13 (attribut spatial) passe de l’état « en fonctionnement », à 17h21 (Attribut temporel) à l’état « hors tension » à 17h23 (Attribut temporel). Nous pourrions conclure que probablement le premier événement a causé le deuxième. Ce qui pourrait représenter une situation d’intérêt.De façon générale, Barouni a proposé la définition suivante d’un patron spatiotemporel [Barouni et Moulin, 2012] :
P=(E, TR, SR, L, T) avec :
P : le patron spatiotemporel
E : l’ensemble des événements spatiotemporels
TR : l’ensemble des relations temporelles entre les événements
SR : l’ensemble des relations spatiales entre les objets spatiaux.
L : l’ensemble des localisations
T : l’ensemble des références temporelles.
En effet, comme le représente la figure 10, un patron spatiotemporel est un ensemble d’événements spatiotemporels ayant une relation spatiale et/ou temporelle entre eux.
|
Table des matières
Chapitre 1 Introduction générale
Chapitre 2 Contexte du projet et problématique
2.1. Introduction
2.2. Environnement spatiotemporel
Objets spatiaux et relations spatiales
Données temporelles
Relations temporelles
Situation spatiotemporelle
État
Événement
Processus
Outils de collecte de données – Réseaux SWE
Système d’acquisition de données
2.3. Complex event processing et patron spatiotemporel
Patron spatio-temporel
2.4. Problématique
2.5. Objectifs du mémoire
2.6. Conclusion
Chapitre 3 CEP à base de connaissance dans un milieu pratique
3.1. Introduction
3.2. Exemples d’application du CEP dans un milieu pratique
3.2.1. GEMINI2 – Système CEP implanté dans le domaine de contrôle des grilles intelligentes.
3.2.2. Système DPCEP – CEP implanté dans le domaine IOT
3.2.3. Système de Barouni
3.2.4. Synthèse
3.3. Étude approfondie du système de Barouni
3.3.1. Apports de l’approche
3.3.2. Fonctionnement de l’ensemble du système
3.4. CEP à base de connaissance (Knowledge-based CEP)
3.4.1. CEP à base de règles dans le domaine de transport
3.4.2. Détermination des patrons CEP par des techniques d’apprentissage automatique
3.4.3. Analyse de données de capteurs dans le domaine de l’environnement
3.4.4. Synthèse
3.5. Discussion
3.6. Conclusion
Chapitre 4 Modélisation d’un réseau de distribution électrique
4.1. Introduction
4.2. Catégories des réseaux électriques
Réseau de transport
Réseau de distribution
4.3. Les facteurs influençant le réseau de distribution électrique
La localisation géographique
Les équipements
Le type de zone desservie
Des facteurs humains
4.4. Les zones de consommation
Zone 2 : zone de consommation commerciale
Zone 3 : Zone de consommation industrielle
Système de reconfiguration automatique
4.5. Proposition de modélisation du réseau de distribution électrique
Vue d’ensemble
Modèle proposé
4.6. Application au cas d’étude : Réseau de Galveston
Étape 2 : Visualisation du réseau de distribution sur CYME
Étape 3 : Visualisation du réseau de distribution sur QGIS
Étape 4 : Localisation du réseau de distribution sur la carte avec les zones60
Étape 5 : Mapping du réseau de distribution sur la carte des zones
Étape 6 : Modélisation de la topologie du réseau réel sur Visio
Étape 7 : Simplification du modèle sur Visio
Étape 8 : Conception du modèle dans le logiciel de simulation YFA
Étape 9 : Proposition d’une méthode de nommage des composantes du site 67
Étape 10 : Visualisation des zones fonctionnelles sur le site du simulateur 69
4.7. Conclusion
Chapitre 5 Contribution théorique à la modélisation des patrons d’événements
5.1. Introduction
5.2. Notation des graphes conceptuels utilisés
5.3. Approche de Barouni pour la détection des patrons spatio-temporels
Les points faibles de l’approche de Barouni
Présentation de nos contributions
5.4. Contributions à la modélisation du domaine d’application
5.5. Extension des relations spatiales
5.6. Base de données représentant le contexte géographique du réseau
5.7. Modélisation des pannes
5.8. Extension proposée au formalisme de patrons de Barouni
Ajout de la structure du Résumé dans notre formalisme de patrons
Impact de la structure proposée sur la traduction des patrons en langage EPL 101
5.9. Synthèse du formalisme proposé
5.10. Démarche progressive et itérative de détection des patrons
5.11. Protocole d’expérimentation
5.12. Conclusion
Chapitre 6 Expérimentation
6.1. Introduction
6.2. Spécification des macro-scénarios de test
Spécification des macros-scénarios
Structure contextuelle du macro-scénario de test
Outil de génération des scripts de simulation
6.3. Simulation des scénarios avec YFA
6.4. Filtrage et prétraitement des fichiers Logs
6.5. Détection des patrons : approche par itération
6.6. Exemple de simulation d’un macro-scénario
6.7. Structuration des instances de patron détectées
Les patrons complexes de type 1 :
Les contraintes spatiales :
Les patrons complexes de type 2 :
6.8. Validation et interprétation des résultats
6.9. Comparaison entre les deux types de scénarios
6.10. Apport de l’approche pour la spécification des patrons complexes dans un moteur CEP – Esper
6.11. Conclusion
Conclusion générale
Références
Bibliographie
Annexe
Télécharger le rapport complet