Une étude sur l’estimation non linéaire basée sur la théorie des observateurs invariants

De nombreux travaux de recherche sur les observateurs invariants non linéaires ont été menés durant ces dix dernières années notamment par P. Rouchon, S. Bonnabel et E. Salaun dont les résultats ont permis d’élaborer une méthode constructive utilisant conjointement la géométrie différentielle et la théorie des groupes pour synthétiser des filtres non linéaires dédiés aux problèmes d’estimation non linéaire de l’état d’un système. Cette dernière décénnie se caractérise donc par l’essor de nouvelles techniques, remettant en cause la définition classique de l’erreur d’estimation d’état utilisée traditionnellement dans les méthodes de conception d’observateur non linéaire. Les premiers travaux basés sur une approche géométrique sont le fruit de (Maithripala et al. [2005],Mahony et al. [2008],Lagemann et al. [2008],Aghannan et al. [2002]). Ils exploitent principalement les groupes géométriques de Lie (quaternion, matrice de rotation, etc.). Prenant ses racines dans les travaux de Krener et Isidori, elle vise à utiliser l’invariance d’un système non linéaire vis-à-vis de certaines transformations géométriques (rotation, translation, etc) pour construire un observateur ayant une convergence bien meilleure que localement autour de tout point d’équilibre (Bourmaud and al. [2013],Bourmaud and al. [2014], Khosravian et al. [2015]). Les nombreux résultats obtenus par Bonnabel (Bonnabel [2007], Bonnabel et al. [2008],Bonnabel et al. [2009],Bonnabel et al. [2009]) ont ainsi permis de proposer une théorie des observateurs invariants pour une classe importante de systèmes qui présentent des symétries. Désormais, la linéarisation ne se fera plus autour d’un point d’équilibre mais autour de l’élément neutre d’un groupe, ce qui permettra, comme nous le verrons, d’élargir le domaine de convergence de l’estimation et d’avoir une forme simplifiée de la dynamique de l’erreur d’estimation sur l’état. L’émergence de nouvelles applications dans le domaine de la robotique mobile et aérienne a favorisé l’essor de cette approche bien adaptée pour le problème d’estimation d’attitude (Crassidis et al. [2007],Martin et al. [2007],Martin et al. [2008],Vasconcelos et al [2008],Barczyk et al. [2013]). Ainsi, dans [Bonnabel et al., 2009], l’erreur invariante d’estimation est utilisée dans le schéma récursif du filtre de Kalman étendu pour élargir a priori son domaine de convergence. Cette hybridation aboutit à un filtre de Kalman étendu invariant (IEKF) avec de nombreuses variantes (Barrau et al. [2013],Barrau et al. [2014],Barrau et al. [2015],Barczyk et al. [2015],Li et al. [2015]).

A l’instar des travaux menés il y a quelques années autour de l’IEKF (Invariant Extended Kalman Filter), les gains de correction de cet estimateur, construit pour être invariant, peuvent êtres obtenus en suivant les étapes de calcul propres au filtrage de type UKF (Van der Merwer et al. [2001],Julier [2002],Sarkka [2007]). Toutefois, l’intégration à la théorie des observateurs invariants d’une procédure de calcul des gains de correction qui suit un schéma algorithmique emprunté au filtrage de Kalman dit unscented, nécessite un certain nombre de développements méthodologiques. Ces travaux de recherche ont conduit in fine à la mise au point de deux variantes algorithmiques de l’UKF baptisées π-IUKF (Condomines et al. [2013],Condomines et al. [2014]), utilisant une condition de compatibilité π et IUKF (pour Invariant Unscented Kalman Filter) (Condomines and al. [2017]), sans condition de compatibilité. Les recherches menées autour des formulations des filtres π-(SR)IUKF et (SR)IUKF, ont notamment permis de montrer qu’il était donc possible, à partir des principes de base du filtrage de Kalman par Sigma Points (SPKF), de synthétiser des filtres invariants pour l’estimation d’état de systèmes dynamiques nonlinéaires caractérisés eux aussi par un domaine de convergence élargi.

Par ailleurs, le fait de recourir à un calcul des gains qui se fonde sur une technique de type UKF présente le grand avantage de ne pas nécessiter de linéarisation explicite de la dynamique de l’erreur d’état invariante, qui représente en soi un point dur de l’approche IEKF, pour identifier les matrices A(I) et C(I) (qui dépendent des invariants du problème) nécessaires à l’application des principes du filtrage de Kalman étendu. Bien qu’une différenciation analytique de cette dynamique peut être obtenue dans certains cas particuliers de modélisation (essentiellement lorsque les mouvements du système obéissent à des relations cinématiques), levant ainsi la difficulté mentionnée précédemment, les développements théoriques des filtres (SR)IUKF et π-(SR)IUKF se justifient par le fait qu’ils visent à être largement appliqués, dans le futur, à tout type de système dynamique. Cette ambition couvre notamment le cas où le modèle de la dynamique du système ne permet plus, du fait de son niveau de complexité intrinsèque, de procéder à cette linéarisation de manière analytique. Nous pensons ici notamment au cas des minidrones à voilure fixe pour lesquels des représentations numériques, sous la forme d’abaques tabulées par exemple, décrivant l’aérodynamique et la propulsion de tels engins, peuvent être avantageusement (car elles représentent une forte connaissance a priori du système) utilisées pour décrire de façon plus complète la dynamique du vol de ces appareils. A travers les différentes définitions qui suivent, nous présentons ici le fil conducteur des principaux travaux de recherche menés autour de la synthèse de filtres invariants. Cette théorie sera appliquée pour le développement de l’IEKF et de l’IUKF, qui a l’avantage de ne pas utiliser de condition de compatibilité, puis repris  travers de l’élaboration de deux systèmes nommés tilt sensor system et INS (Inertial Navigation System).

Le présent article comprend quatre sections. La première partie (§1) a trait au développement de principes méthodologiques originaux qui ont permis d’élaborer deux algorithmes d’estimation non linéaire : l’IEKF et l’IUKF. Ceux-ci fondés conjointement sur la théorie des observateurs invariants et sur les principes du filtrage de Kalman dit unscented, permettent d’apporter une solution algorithmique extrêmement intéressante aux problèmes de la convergence autour de toute trajectoire permanente. Nous avons donc mené, dans la deuxième partie (§2) de cet article, une étude comparative entre l’IEKF et l’IUKF sur un exemple de motivation nommé tilt sensor system. Enfin la dernière partie (§3,§4) fournit un ensemble complet de résultats pour l’IUKF avec une comparaison des performances des algorithmes SRUKF (standard) et IUKF. Cette analyse est effectuée sur la base de données simulées bruitées d’un modèle d’INS (Inertial Navigation System) qui intègrent les imperfections des différents capteurs. Ces résultats valident l’approche qui permet de déterminer une correction spécifique de la prédiction fournie par n’importe quelle représentation d’état non linéaire utilisée pour l’estimation, de sorte que la dynamique de l’observateur synthétisé vérifie aussi les propriétés de symétrie du système considéré.

Petit tour d’horizon des problèmes d’estimation des filtres de Kalman invariants

Théorie des observateurs invariants

Tout d’abord, considérons la représentation d’état non linéaire suivante définie par :

dx/dt = f(x, u), y = h(x, u) [1]

Dans l’équation [1], le vecteur d’état x (resp. d’entrée u)(resp. de sortie y) appartient à un ensemble ouvert X ∈ Rn (resp. U ∈ Rm)(resp. Y ∈ Rp, p ≤ n). Etant donné cette représentation non linéaire, nous commençons par définir une structure de groupe sur laquelle nous allons construire différentes transformations dont les actions sur les ouverts précédemment définis vont laisser inchanger la dynamique (du système).

Definition 1.1. Carte différentiable et groupe de Lie : Une variété topologique M de dimension r est dite différentiable si et seulement si ses cartes de transition sont différentiables. Ainsi un groupe de Lie G est une variété différentiable qui est munie d’une structure algébrique de groupe.

Definition 1.2. Groupe de transformation : Soit G un groupe de Lie et T un ouvert de Rq. Une action sur T d’un groupe de transformation paramétré par G, noté (θg)g∈G et d’application identité θe (e, est l’élément neutre de G), et tel que (g, ξ) ∈ G × T → θg(ξ) ∈ T , est une carte différentiable qui vérifie :
– ∀ξ ∈ T , θe(ξ) = ξ ;
– ∀(g1, g2) ∈ G2, θg2 ◦ θg1(ξ) = θg2g1 (ξ).

Definition 1.3. Identification du groupe de Lie et de l’ouvert : Soit (θg)g∈G un groupe de transformation de rang plein i.e., ∀g ∈ G, dim (Im(θg)) = dim(G) = r. Si dim(G) = r = dim(T ) = q alors G et T peuvent être identifiés l’un à l’autre de sorte que l’application θ paramétrisée sur G puisse s’assimiler à une multiplication à droite ou à gauche telle que :

∀(g, ξ) ∈ (G × T ), θg(ξ) = ξg−1 = Rg−1(ξ) ou θg(ξ) = gξ = Lg(ξ)

A partir de la définition 2, il en résulte que (θg)g∈G est un difféomorphisme. Par ailleurs, nous considérerons uniquement dans la suite les actions de groupe de rang plein pour lesquelles rg(θg) = dim(G) et dim(G) = dim(M). Dans ce cas là, la définition 2 signifie que nous pouvons identifier le groupe G à l’ouvert T . Par analogie, en considérant la représentation d’état [1] où le vecteur d’état (resp. d’entrée)(resp. de sortie) appartient à un ensemble ouvert X ∈ Rn (resp. U ∈ Rm)(resp. Y ∈ Rp, p ≤ n), nous considérons le groupe de transformation défini par une multiplication à droite sur X ×U×Y tel que :

φ : G × (X ×U×Y) → (X ×U×Y)

(g, x, u, y) → φg(x, u, y)=(ϕg(x), ψg(u), ρg(y)) = (X, U, Y)

où (ϕg, ψg, ρg) sont trois difféomorphismes paramétrisés par g ∈ G où le groupe de Lie G vérifie dim(G) = dim(X ) = n. Les coordonnées des transformations ci-dessus doivent être définies telle que leur action respective mais conjuguée sur les variables d’état, d’entrée et de sortie laisse l’entière dynamique du système inchangée, c’est à dire X˙ = f(X, U) and Y = h(X, U) tel que :

Definition 1.4. Système G-invariant et sortie équivariante : La dynamique du système sera dite Ginvariante si ∃(ϕg, ψg)g∈G, ∀(g, x, u) ∈ G × (X ×U) :

f(ϕg(x), ψg(u)) = Dϕg(x) · f(x, u)

Quelques remarques sur l’erreur d’estimation

Les propriétés d’invariance d’un estimateur d’état, que l’on souhaite voir préserver les symétries intrinsèques au système, reposent essentiellement sur la notion d’erreur d’estimation sur l’état invariante et sur sa dynamique propre. En effet, il est possible de montrer que cette dernière dépend uniquement de l’erreur d’estimation sur l’état invariante elle-même et de l’ensemble complet d’invariants fondamentaux du système défini par I(xˆ, u) = ψγ(xˆ)(u) = ψxˆ−1(u). Cette dynamique dépend des trajectoires estimées par le système uniquement au travers de la non-linéarité I.

Il s’agit là d’une grande différence par rapport à la plupart des algorithmes d’estimation non linéaires conventionnels tels que l’EKF ou l’UKF pour lesquels la dynamique de l’erreur d’estimation dépend directement de la trajectoire suivie par l’engin. Ceci étend donc le domaine de convergence des observateurs invariants et en fait des estimateurs plus robustes. Ainsi, pour un système dynamique qui suit une trajectoire de référence quasi-permanente, i.e. tels que les invariants fondamentaux I(xˆ, u) ne dépendent pas du temps, I(xˆ, u) = c, il peut être démontré que les matrices de gain K¯ convergent vers des valeurs fixes pour toutes trajectoires x telles que I(x , u) = c. Par la suite, il peut être démontré que, pour certain système comme le système de l’AHRS (Attitude and Heading Reference System), et sous certaines conditions de découplage de l’estimation des composantes du vecteur d’état x, la dynamique de l’erreur d’estimation sur l’état invariante η(x, xˆ) obéit à une équation dite autonome c’est-à-dire de la forme : η˙ = Υ(η, c). Un tel filtre sera caractérisé par un large domaine de convergence pour différents réglages des valeurs des gains.

Pour pallier à la difficulté de régler les gains de correction manuellement, l’état de l’art du domaine rapporte qu’un algorithme de type EKF, généralisé, a été développé pour obtenir ces derniers. Celui-ci repose sur une linéarisation de la dynamique de l’erreur d’estimation sur l’état invariante qui permet d’identifier des matrices d’évolution (A(ˆI)) et d’observation (C(ˆI)) dépendantes des invariants du problème d’estimation. Par la suite, les équations du filtrage de Kalman étendu peuvent être appliquées au système des erreurs invariantes linéarisées de sorte que la résolution de l’équation de Riccati soit menée avec le couple (A(ˆI), C(ˆI)). La démarche suivie dans l’IEKF revient à formuler mathématiquement un EKF classique mais pour une erreur d’estimation sur l’état invariante. L’IEKF fournit une approximation, au 2nd ordre, de l’erreur d’estimation sur l’état invariante. Malgré ses nombreux avantages, cette technique peut être relativement complexe à exploiter du fait de la linéarisation qu’elle nécessite pour identifier les matrices A(ˆI) et C(ˆI). Afin de s’affranchir de ce point difficile, des recherches ont conduit au développement d’une méthode différente pour l’estimation de l’état des systèmes dynamiques dans un cadre non linéaire. Tout comme pour l’IEKF, l’IUKF (Invariant Unscented Kalman Filter) a cherché à conférer à l’estimateur les mêmes propriétés d’invariance que celles qui peuvent caractériser le système observé.

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

I)INTRODUCTION
II) GENERALITES
III) METHODOLOGIE
IV) RESULTATS
V) COMMENTAIRES ET DISCUSSION
VI) CONCLUSION  
VII) REFERENCES
ANNEXES
RESUME

Lire le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *