Réseaux de capteurs sans fil
Introduction générale
Le besoin constant d’informations et les progrès rapides de la micro-électronique et des technologies sans fil, ont permis la fabrication de petits appareils électroniques avec un coût relativement faible [voir chatpfe.com]. Ces derniers sont capables de collecter et de traiter l’information d’une manière autonome et flexible, donnant ainsi naissance à un nouveau type de réseaux nommé réseau de capteurs sans fil (RCSF) ou en anglais Wireless Sensor Networks (WSN) [8, 9]. Ces réseaux instaurent un nouveau paradigme pour l’extraction des données de différents environnements, ce qui a permis le développement d’une vaste gamme d’applications. Naturellement, le domaine militaire a constitué un domaine de prédilection pour ce type de réseaux (surveillance des champs de bataille, localisation de l’ennemie…). Néanmoins, leurs performances remarquables en matière de flexibilité et de faible coût ont suscité un grand intérêt dans les domaines d’application civile tels que : la santé, la surveillance d’environnement, l’industrie, la domotique, etc. Ces réseaux sont constitués de plusieurs nœuds capteurs, appelés aussi motes. Ces dispositifs miniatures sont peu coûteux et à faible consommation d’énergie, ils permettent d’extraire différents types d’informations de l’environnement étudié : scalaires ou multimédias. Le nombre des nœuds capteurs dans un RCSF peut varier de quelques dizaines à plusieurs centaines ou même des milliers. Ces réseaux sont conçus pour coopérer en groupe afin de transmettre les données collectées à un point central appelé station de base ou Sink. Chaque nœud capteur est équipé d’un microprocesseur à faible puissance de calcul, d’une source d’énergie limitée, d’une antenne radio et d’un ou de plusieurs capteurs. Les nœuds d’un réseau sont le plus souvent interconnectés grâce à des liaisons sans fil telles que la radiofréquence (RF), ou via des liaisons optiques, acoustique ou infrarouge (IR) [9]. Pour accroître leur portabilité, ils utilisent principalement une batterie comme source d’énergie, ce qui limite leur portée de capture et de communication, et impose l’utilisation d’unités de traitement et de stockage à faible consommation et par conséquent avec performance limitée. Ces réseaux peuvent être déployés, d’une façon aléatoire ou déterministe, dans une zone d’intérêt (indoor ou outdoor) pour collecter des informations du monde physique, éventuellement les traiter et les transmettre à un ou plusieurs nœuds Sinks. Une fois relayé au nœud Sink, ces informations peuvent être utilisées localement à son niveau, ou retransmises à une station de prise de décision via une liaison à haut débit (internet ou satellite) [7].
Les données capturées étant le but principal de ce type de réseaux, leur fiabilité constitue la cipale préoccupation des chercheurs étant donné leur importance dans les applications critiques.
Parmi les conditions de fiabilité nous citons la tolérance aux fautes et leurs recouvrements. Les applications des RCSFs visent essentiellement à automatiser le traitement des données collectées et par conséquent la prise de décision. La plupart d’entre elles sont considérées comme critiques suivant leur domaines d’applications tels que la surveillance des frontières, la détection des feux de forêts, suivie biomédicale de l’état du patient [10]. Cette criticité repose essentiellement sur le type de données collectées et les actions déclenchées par ces mêmes données. De nos jours, assurer la fiabilité de telles données devient une tâche plus qu’indispensable. Car des données erronées peuvent générer des actions inutiles qui sont souvent coûteuses voire même nuisibles. D’autre part, en raison des limitations physiques des capteurs et des modifications imprévisibles des environnements dans lesquels est déployé un RCSF, les données générées par le réseau sont susceptibles d’être perdues ou de contenir diverses anomalies. En outre, le traitement de telles anomalies peut être une opération coûteuse en termes d’énergie [11]. Ces limitations inhérentes posent un défi majeur qui provient de l’imperfection des données collectées. En effet, les données brutes générées sont vulnérables aux erreurs, aux attaques malveillantes et aux valeurs manquantes pour diverses raisons, telles que les collisions, les interférences ou les défaillances ou dommages inopinés de nœuds [12]. Il est donc crucial de développer des techniques efficaces pour détecter et corriger les éventuelles anomalies.
Motivation
Les RCSFs ont suscité un grand intérêt au niveau mondial et sont considérés comme l’un des domaines des plus étudiés au cours de la dernière décennie, plus de 30000 papiers ont été publiés dans ce domaine au cours de l’année 2018 seulement. Ce réseau multidisciplinaire offre une variété d’applications et d’opportunités commerciales chaque jour, allant des applications militaires,
industrielles, santé, agriculture . . L’automatisation des systèmes de surveillance des infrastructures considérées comme dangereuses ou inaccessibles par l’homme est devenue une tâche indispensable de nos jours. Le but principal étant la prise de décision correcte et efficace. Les RCSFs constituent le candidat par excellence pour assurer de telles fonctionnalités. Récemment le domaine de la médecine s’oriente vers le suivie du patient à distance [13–15]. En équipant ce dernier de tout type de capteurs capables de relever ses fonctions vitales et de les transmettre en temps réel au médecin traitant. Ce système de capteurs permet ainsi de détecter les différentes anomalies et d’alerter aussi tôt les urgences au cas où la vie du patient est en danger. Ceci favorise la prise en charge rapide et efficace des patients jugés à risque et encourage leur convalescence grâce à un environnement familier et plus accueillant que les hôpitaux. Les RCSFs représentent le pilier fondateur de l’internet des objets (IdT). Ils constituent une plateforme d’interaction entre les différents systèmes, donnant ainsi naissance aux villes intelligentes, maisons intelligentes, voitures intelligentes, etc. L’ensemble des données collectées dans ce contexte est considéré comme une ressource critique capable de générer de nouvelles informations et de connaissances. Ces données sont souvent utilisées pour relever les différentes anomalies, celles-ci constituent des indicateurs d’un dysfonctionnement isolé d’un nœud, ou d’un événement important. Ceci rend primordiale la mise en place d’un système de détection de ces anomalies. La plupart des approches existantes imposent des limitations sur le type de distribution ou mettent des hypothèses sur la plage des données collectées [12]. Souvent, ces hypothèses ne sont pas faciles à réaliser en pratique, la distribution des données ne peut pas être connue et la définition de limites supérieures et inférieures pour l’ensemble des données ne sera pas possible. Problématique de la thèse Les RCSFs sont souvent constitués de plusieurs nœuds capteurs, pouvant être déployés dans des environnements relativement hostiles et inappropriés qui augmentent considérablement leur probabilité de génération d’erreurs. Ces dernières ont une incidence directe sur la performance d’un nœud capteur : le nœud produit des données incorrectes ; le nœud bascule entre l’état normal et l’état défectueux et est par conséquent instable ; des données peuvent être perdues. Ces incertitudes, peuvent avoir de sérieux impacts dans les applications critiques. En effet, la défaillance d’un nœud capteur peut entraîner un grand nombre de victimes et de pertes matérielles comme par exemple dans le cas de RCSFs utilisés pour détecter des gaz toxiques dans des usines chimiques. Dans ce scénario, si le réseau ne détecte pas la fuite de gaz à temps, la sécurité des travailleurs ne sera pas garantie. Un autre exemple concret est la catastrophe de la navette spatiale Challenger [16], un événement qui a sans aucun doute renforcé la vigilance à l’égard de l’intégrité des capteurs, dans lequel un des nœuds de détection est tombé en panne dans le réseau de l’un des réservoirs de combustible solide externes de la navette Discovery, son lancement prévu a été annulé. La gestion de telles incertitudes nécessite la mise en place d’un système de tolérance aux fautes. Un premier défi crucial consiste à fournir une solution efficace pour la détection d’anomalie (valeur aberrante) au sein du réseau. Cette dernière est d’une importance capitale pour les applications des RCSFs. En effet, les données générées par un nœud capteur sont souvent susceptibles de contenir des valeurs aberrantes pour diverses raisons, telles que les conditions environnementales aux quelles est soumis un nœud capteur, une erreur technique dans le capteur lui-même (matérielle ou logicielle). Détecter ces anomalies potentielles d’une collection de données d’un RCSF et alerter les utilisateurs concernés en temps réel est d’une importance cruciale dans de nombreuses applications telles que les systèmes d’alerte d’intrusion, des éruptions volcaniques, etc. Un autre défi consisterait à définir une méthode d’estimation des données manquantes générées par un RCSF [17, 18]. En effet, Les données collectées d’un RCSF constituent une ressource inestimable pour la communauté scientifique. Elles sont souvent utilisées dans la prise de décision ou la reconstitution de l’environnement étudié, et doivent refléter au mieux l’état du système surveillé. Cependant dû aux caractéristiques des RCSFs, plus de 40% à 70% des données sont perdues pour diverses raisons comme par exemple la présence de perturbations dans le canal de transmission ou la provocation d’une panne au niveau du réseau. Le recouvrement de ces données doit se faire avec des approches d’estimation générant une erreur minime. Ceci, afin de représenter avec exactitude l’environnement étudié.
Objectifs et contribution de la thèse Cette thèse de doctorat a été réalisée dans un cadre d’une coopération entre le laboratoire de recherche en informatique industrielle et en réseaux (RIIR) de l’université d’Oran 1, et le laboratoire de recherche de Sciences et Techniques de l’Information, de la Communication et de la Connaissance de l’Université de Bretagne Occidentale UBO-France. Ce travail de thèse porte sur la gestion des fautes qui peuvent avoir lieu lors des opérations de collecte de données par un RCSF, en tenant compte des spécificités de ce type de réseaux. Les stratégies proposées doivent garantir que les contraintes imposées en termes de fiabilité et estimation des données soient satisfaisantes, par rapport aux méthodes existantes. Plusieurs travaux de recherche ont été menés pour résoudre les problèmes de gestion des fautes liées au données issues d’un RCSF [19], telles que : la détection des valeurs aberrantes, la détection des événements, le recouvrement ou la récupération des données manquantes. Nous nous sommes intéressés dans nos travaux à deux axes de recherche, à savoir, la détection des valeurs aberrantes et le recouvrement des données manquantes. Étant donné les perspectives applicatives prometteuses des réseaux de capteurs ainsi que la problématique de fiabilité des données soulevée, l’objectif de la thèse consiste à étudier et à proposer de nouveaux algorithmes de gestion des incertitudes permettant d’apporter des réponses aux deux problématiques notamment la détection des anomalies et le recouvrement des données manquantes. Nos contributions dans cette thèse peuvent être résumées comme suit : • La détection des valeurs aberrantes [20] : une approche courante pour détecter des déviations au niveau de la collecte dans les RCSFs est de définir une limite supérieure et une limite inférieure pour chaque mesure physique captée par le nœud capteur. Ainsi, les valeurs collectées en dehors de ces limites seront identifiées comme étant des valeurs aberrantes ou outliers. La détection de ces anomalies est relativement triviale, mais devient problématique lorsqu’on veut y ajouter la détection qui doit prendre en considération différents types de valeurs physiques. Certaines approches [21–23] proposent de définir un modèle de normalité en se basant sur : i) une distribution gaussienne, ou ii) en calculant les corrélations entre les différentes valeurs. La première stratégie manque de flexibilité et rend le processus de détection biaisé, tandis que la deuxième néglige les dépendances entre les valeurs. Il est à noter que le principe de dépendance est beaucoup plus large que celui de la corrélation, des variables corrélées sont forcément dépendantes tandis que la réciproque est fausse [24]. Pour pallier à cela, nous proposons une nouvelle méthode de détection probabiliste basée sur la théorie des copules afin de détecter les nœuds capteurs défectueux dans les RCSFs. Dans notre approche, nous utilisons la fonction de densité de probabilité de la copule comme un indicateur de la normalité des données ; celle-ci est construite en tenant compte de la dépendance entre les n-mesures collectées, sans mettre une quelconque hypothèse sur leur distribution. Les échantillons ayant des probabilités au delà d’une limite de contrôle prédéterminée sont classés comme étant aberrants ou outliers. Les résultats de tests réalisés sur l’approche proposée sont nettement meilleurs que certaines méthodes statistiques existantes dans l’état de l’art. • Estimation des données manquantes [25] : Pour des raisons telles que le manque de fiabilité du protocole de transport, l’épuisement de l’énergie et les interférences dans un RCSF, les données issues des nœuds capteurs ont tendance à être incomplètes ou manquantes qui entrave l’analyse et le bon fonctionnement du réseau. Il est donc nécessaire de recouvrer ces données manquantes pour assurer une fiabilité dans les prises de décision. La stratégie la plus simple serait de demander à nouveau ces données aux nœuds concernés, cependant ceci génère un surcoût énergétique considérable sur le réseau et diminue considérablement sa durée de vie. Dans notre deuxième contribution, nous proposons d’estimer ces données manquantes en utilisant les copules conditionnelles. Ainsi, chaque donnée manquante sera remplacée sans aucune intervention du réseau déployé. Notre approche permet de réduire l’erreur d’estimation par rapport aux méthodes existantes en exploitant les dépendances entre les différentes valeurs captées par un nœud capteur.
Structuration de la thèse
Ce manuscrit est organisé en cinq chapitres. Le positionnement de nos travaux est présenté dans les trois premiers chapitres et nos contributions sont détaillées dans les deux derniers. Une conclusion générale et les perspectives de nos travaux futures clôturent le manuscrit. • Le premier chapitre expose un état de l’art sur les RCSFs, objet de notre étude. Il introduit d’une manière générale les notions de base liées aux RCSFs, il regroupe ainsi les principes de ce type de réseaux, les divers domaines d’applications, les systèmes d’exploitation, les caractéristiques et les contraintes de conception de ces réseaux. Ensuite, il donne une brève description des différentes couches d’un RCSF et se termine par une classification de cette classe de réseaux selon différents critères. • Dans le deuxième chapitre, nous présentons les concepts fondamentaux de la tolérance aux fautes dans les RCSFs et un état de l’art consistant sur les techniques et mécanismes de tolérance aux fautes classifiés selon plusieurs critères. Ensuite, nous détaillons ces mécanismes en révélant leurs avantages et leurs inconvénients dans le contexte de la tolérance aux fautes dans les RCSFs. • Parmi les différentes méthodes statistiques pertinentes on trouve celles fondées sur la théorie des copules, pour lesquelles le troisième chapitre est dédié. Cette théorie puissante issue du domaine des finances est capable de modéliser les dépendances entre les données sans émettre aucune hypothèse sur leur distribution marginale. L’objectif de ce chapitre est de mettre en exergue les capacités des copules et aussi de justifier leur choix. • Le quatrième chapitre présente notre première approche pour la détection des données aberrantes et leur classification dans les RCSFs. Cette approche repose essentiellement sur la théorie des copules. Dans un premier temps, les données collectées par les nœuds capteurs sont utilisées pour estimer un classificateur binaire en alliant la théorie des copules au théorème de Bayes. Ce classificateur permet de séparer les données normales des données anormales (outliers). Les résultats de détection de l’approche proposée démontrent son efficacité par rapport aux approches concurrentes de l’état de l’art. Ce chapitre se termine par une proposition d’un schéma de classification de ces fautes dans un RCSF (données aberrantes ou événement).
|
Table des matières
Résumé i
Abstract ii
Résumé (Arabe) iv
Remerciements iv
Abréviations xiv
Notations mathématiques xvi
Introduction générale xviii
1 Réseaux de capteurs sans fil
1 Introduction
2 Architecture d’un RCSF
3 Pile protocolaire
4 Types des RCSFs
5 Plateformes dédiées aux RCSFs
6 Systèmes d’exploitation pour RCSF
7 Défis et caractéristiques des RCSFs
8 Applications des RCSFs
9 Conclusion
2 Tolérance aux fautes dans les RCSFs
1 Introduction
2 Terminologie et classification des fautes
3 Sources de faute dans les RCSFs
4 Classification des erreurs dans les RCSFs
5 Motivations pour le diagnostic des fautes dans les RCSFs
6 Classification des approches de tolérance aux fautes
7 Conclusion
3 Fondement mathématique de la théorie des copules
1 Introduction
2 Théorie des copules
3 Famille des copules
4 Mesures de dépendance
5 Conclusion
4 Contribution 1 : Détection des données aberrantes dans les RCSFs
1 Introduction
2 Les valeurs aberrantes dans les RCSFs
3 Détection des valeurs aberrantes dans les RCSFs : Etat de l’art
4 Avantages de la modélisation à l’aide des copules
5 L’approche proposée : A probabilistic multivariate copula-based technique for faulty node diagnosis in wireless sensor networks
6 Résultats et discussion
7 Conclusion
5 Contribution 2 : Estimation des données manquantes dans les RCSFs
1 Introduction
2 Les données manquantes dans les RCSFs
3 Travaux connexes
4 Conditional Quantile Imputation Copula Average (CQICA)
5 Expérimentation et validation
5.1 Données de test
5.2 Mesures de performances
5.3 Principes de l’analyse
5.4 Résultats et discussion
6 Conclusion
Conclusion générale et quelques perspectives
Liste des publications et communications issues de cette thèse
A Language R
Bibliographie
Télécharger le rapport complet