Estimation robuste de la matrice de covariance en traitement du signal

Introduction : estimation des paramรจtres statistiques en traitement de signal

ย  ย  Nous nous proposons ici de rรฉcapituler les principales mรฉthodes existant, pour estimer les statistiques du second ordre de donnรฉes reรงues. Le moment dโ€™ordre un (la moyenne), sera considรฉrรฉ comme connu et supposรฉ nul. En effet, cette derniรจre hypothรจse revient simplement ร  considรฉrer des donnรฉes dont on connaรฎt la moyenne et qui ont รฉtรฉ recentrรฉes. Lโ€™hypothรจse de moyenne nulle est faite dans de nombreuses applications (radar, localisation de source) permettant ร  cette รฉtude de rester proche de nombreux cas rรฉels. Les รฉvolutions entre deux mรฉthodes, sont parfois directement liรฉes aux รฉvolutions technologiques : en radar par exemple, le modรจle des donnรฉes gaussiennes a longtemps รฉtรฉ utilisรฉ et validรฉ pour estimer les รฉchos du sol et de lโ€™environnement en gรฉnรฉral. Puis la haute rรฉsolution est apparue. Avec la nouvelle prรฉcision obtenue, il sโ€™est vite avรฉrรฉ que le modรจle gaussien รฉtait non seulement trรจs loin de la rรฉalitรฉ mais quโ€™en plus les dรฉtecteurs et techniques basรฉs sur lโ€™ancien modรจle nโ€™รฉtaient plus du tout fiables. On a alors eu lโ€™idรฉe de sโ€™inspirer de ce quโ€™il se passe en rรฉalitรฉ : avec cette haute rรฉsolution, lโ€™environnement nโ€™est pas assimilable ร  un bruit relativement homogรจne mais on y discerne diffรฉrentes zones, une texture en quelque sorte. Ainsi, on peut considรฉrer que le bruit est toujours gaussien mais avec une puissance variable en fonction de lโ€™endroit. Cโ€™est ainsi que lโ€™utilisation des distributions gaussiennes-composรฉes a commencรฉ ร  se rรฉpandre dans les applications de traitement de signal, et notamment en radar. Il a fallu รฉgalement adapter les estimateurs de paramรจtres statistiques ainsi que les techniques associรฉes. Tout cela sera repris en dรฉtail dans les sections suivantes. Par ailleurs, les รฉvolutions ne sโ€™arrรชtent pas aux distributions gaussiennes-composรฉes. En effet, celles-ci ne sont en rรฉalitรฉ quโ€™un cas particulier dโ€™une famille de distributions plus grande, trรจs flexible et aux propriรฉtรฉs dรฉjร  beaucoup รฉtudiรฉes par les statisticiens : les distributions elliptiques. Le fait est quโ€™elles sont pratiquement inutilisรฉes en traitement de signal, en dehors de quelques rares exceptions [64]. Une raison probable est quโ€™elles nโ€™ont รฉtรฉ รฉtendues au cas complexe que trรจs rรฉcemment et quโ€™en traitement de signal, les donnรฉes sont trรจs souvent complexes. A noter dโ€™ailleurs, que dans des domaines tels que la finance oรน les donnรฉes ร  traiter sont rรฉelles, lโ€™abandon du modรจle gaussien sโ€™est fait trรจs souvent au profit des donnรฉes elliptiques. La littรฉrature des distributions elliptiques se retrouve donc trรจs souvent dans le cadre dโ€™applications liรฉes ร  la finance. La derniรจre partie de ce chapitre sera donc consacrรฉe aux distributions elliptiques. Avant dโ€™entrer plus en dรฉtail dans les distributions gaussiennes-composรฉes, elliptiques ou autres, posons le cadre de lโ€™รฉtude en dรฉcrivant les hypothรจses classiques du traitement de signal.

Quโ€™est ce quโ€™un estimateur robuste ?

ย  ย  Dans le premier chapitre, nous avons vu que pour amรฉliorer lโ€™estimation de paramรจtres, lโ€™objectif est dโ€™utiliser un bon modรจle afin dโ€™utiliser ensuite lโ€™EMV correspondant. Cette mรฉthode conduit ร  des estimateurs asymptotiquement efficaces mais pas forcรฉment robustes. En effet, lโ€™estimateur robuste sera plutรดt celui qui reste toujours assez fiable, quelles que soient les donnรฉes de dรฉpart, ร  dรฉfaut dโ€™รชtre optimal dans certains cas de figures. Dans un contexte rรฉel, bien que les distributions elliptiques offrent de trรจs grandes possibilitรฉs de distributions, il nโ€™en reste pas moins que le risque existe, que des donnรฉes ne suivent pas le modรจle considรฉrรฉ. On ne prendra pas en compte ici, toutes les techniques qui consistent en un prรฉ-traitement de donnรฉes, afin de pouvoir parfaitement les maรฎtriser. Ainsi, les modรจles utilisรฉs correspondent toujours ร  des simplifications de la rรฉalitรฉ. La caractรฉristique qui permet alors ร  une lรฉgรจre dรฉviation entre la rรฉalitรฉ et le modรจle supposรฉ, de nโ€™avoir pas ou peu dโ€™influence sur le paramรจtre estimรฉ, est prรฉcisรฉment la robustesse de lโ€™estimateur. Pour en revenir aux estimateurs optimaux (EMV), un lรฉger รฉloignement au modรจle ne permet pas de conclure ร  une lรฉgรจre chute de performances. Pour rรฉsumer, une approche robuste de la modรฉlisation et de lโ€™analyse de donnรฉes pourrait se dรฉfinir, de faรงon abstraite, comme une maniรจre dโ€™obtenir sur un modรจle approximativement exact, des rรฉsultats approximativement valides. En pratique cela signifie des mรฉthodes fiables, pour lesquelles un intervalle de confiance peut รชtre รฉtabli. Ainsi, la robustesse doit dโ€™une maniรจre ou dโ€™une autre pouvoir รชtre mesurรฉe. Des critรจres doivent permettre de dรฉterminer comment les erreurs peuvent influencer un estimateur et dans quelle mesure lโ€™estimation dโ€™un paramรจtre peut รชtre faussรฉe. De nombreux auteurs se sont posรฉs ces questions, menant ร  la formalisation dโ€™une thรฉorie de la robustesse.

Conclusion

Synthรจse Partant de la constatation simple que la haute rรฉsolution et la modernisation des applications actuelles amรจnent les traiteurs de signaux ร  analyser des donnรฉes qui ne vรฉrifient plus le modรจle classiquement admis de donnรฉes gaussiennes, nous nous sommes penchรฉs, dans un premier chapitre, sur les problรจmes qui en dรฉcoulaient et solutions qui ont pu รชtre apportรฉes ces derniรจres annรฉes. Premiรจre consรฉquence de cette inadรฉquation statistique : de nombreux traitements, optimisรฉs pour fonctionner en milieu gaussien voient leurs performances dรฉcroรฎtre. Nous nous sommes intรฉressรฉs plus particuliรจrement au problรจme dโ€™estimation de matrice de covariance. En effet, dans de nombreuses applications, ce paramรจtre permet la prise en compte du milieu. En radar par exemple, cโ€™est lโ€™injection de cette information dans le dรฉtecteur qui en fait un traitement adaptatif. Lโ€™EMV en milieu gaussien รฉtant la SCM, cโ€™est prรฉcisรฉment cet estimateur qui est en cause dans la chute des performances en milieu non-gaussien. Lโ€™idรฉe premiรจre est donc de mieux modรฉliser les donnรฉes, afin de trouver ensuite lโ€™EMV correspondant. Le problรจme, est que les donnรฉes ne se sont pas รฉloignรฉes du modรจle gaussien au profit dโ€™une seule et mรชme distribution. Lโ€™amรฉlioration des techniques a plutรดt conduit ร  une diversification des comportements. Ce dernier dรฉpend de lโ€™application, du milieu… et ainsi, il existe une multitude de distributions modรฉlisant diffรฉrents contextes, chacune ayant un EMV, lui-mรชme รฉtant parfois impossible ร  obtenir. De nombreux traiteurs de signaux ont donc proposรฉ le modรจle des distributions gaussiennes-composรฉes. Elles sont assez gรฉnรฉrales et correspondent au produit dโ€™un vecteur gaussien par une variable de distribution inconnue, sensรฉe permettre la modรฉlisation de la plupart des situations. De nombreuses รฉtudes montrent quโ€™elles modรฉlisent effectivement trรจs bien de nombreux milieux, en particulier en radar [41], [80], [32], [89], [90], [15], [16], [72], [29]. Lโ€™intรฉrรชt de ces distributions, est quโ€™il sโ€™en dรฉgage un seul et mรชme EMV approchรฉ, qui ne nรฉcessite pas la connaissance de la distribution de la variable inconnue. Cet estimateur, lโ€™estimateur FP, a รฉtรฉ รฉtudiรฉ notamment dans la thรจse de F. Pascal [67]. Puis, sโ€™inspirant dโ€™autres domaines tels que la finance, nous avons poussรฉ la gรฉnรฉralisation des distributions plus loin : les distributions elliptiques contiennent ร  la fois la distribution gaussienne et toutes les distributions gaussiennes-composรฉes. Elle correspondent en fait ร  nโ€™importe quelle distribution dรฉpendant uniquement de la norme des donnรฉes blanchies par la matrice de covariance. Cette forme quadratique particuliรจre est รฉgalement appelรฉe distance de Mahalanobis [50]. Pour certaines distributions elliptiques, la matrice de covariance nโ€™existe pas. Mais la matrice de dispersion, paramรจtre inhรฉrent ร  la distribution elliptique, peut, elle, toujours รชtre calculรฉe. Lorsque la matrice de covariance existe, cette matrice de dispersion est proportionnelle ร  la premiรจre. Dans le cas complรจtement gรฉnรฉral des distributions elliptiques, nous ne disposons pas dโ€™EMV approchรฉ. Bien sรปr, pour chaque distribution particuliรจre un EMV peut รชtre obtenu, mais bien souvent, la seule information dont on dispose sur le milieu, est quโ€™il est probable quโ€™il ne suive pas une loi gaussienne. On espรจre alors quโ€™il puisse รชtre modรฉlisรฉ par une distribution elliptique. Dans le chapitre 2, nous avons introduit le concept de robustesse tel que dรฉcrit par Huber en 1964 [36],[39], dans ce que nous appellerons les prรฉmices dโ€™une thรฉorie de la robustesse. Il propose en effet des estimateurs robustes sur lโ€™ensemble des distributions elliptiques. Ceux-ci ne sont pas forcรฉment les EMV dโ€™une distribution particuliรจre, mais quelle que soit la distribution elliptique, on sโ€™assure des performances minimales et une faible influence des perturbations ou donnรฉes aberrantes. Ces estimateurs, construits de maniรจre analogue aux EMV sont alors appelรฉs M-estimateurs, le M signifiant ยซย Maximum Likelihood Typeย ยป. Nous avons ensuite comparรฉ la robustesse de ces M-estimateurs ร  celle de lโ€™estimateur FP et de la SCM. Ainsi, si les M-estimateurs et lโ€™estimateur FP ont une robustesse trรจs proche, lโ€™instabilitรฉ de la SCM en milieu non-gaussien ou lorsque des perturbations sont prรฉsentes, a รฉtรฉ mis en รฉvidence. Pour cela nous avons utilisรฉ des outils issus de la thรฉorie de la robustesse dont notamment, la fonction dโ€™influence introduite par Hampel en 1971 [35], [34]. En grossissant le trait, lโ€™estimateur FP a donc en quelque sorte, une robustesse ยซย ร  toute รฉpreuveย ยป, cโ€™est-ร -dire quelle que soit la distribution elliptique et quelles que soient les perturbations (ร  condition de ne pas dรฉpasser le point de rupture). Les rรฉsultats sont souvent lรฉgรจrement moins bons en ce qui concerne les M-estimateurs, mais grรขce ร  leurs paramรจtres de rรฉglages, il peuvent dans certains cas, atteindre le maximum de vraisemblance. Nous avons ensuite รฉtudiรฉ dans le chapitre 3, les performances de ces diffรฉrents estimateurs. Aprรจs avoir obtenu la distribution asymptotique des M-estimateurs, une propriรฉtรฉ particuliรจre sโ€™est dรฉgagรฉe. Elle se gรฉnรฉralise ร  tout estimateur donnant une matrice hermitienne et dont la variance asymptotique suit une forme particuliรจre dรฉcrite dans le chapitre. Cette propriรฉtรฉ sโ€™applique aux traitements modรฉlisables par des fonctions homogรจnes dโ€™ordre zรฉro qui ร  une matrice (estimรฉe), associent un paramรจtre dโ€™intรฉrรชt. En dโ€™autres termes, elle sโ€™applique aux traitements dans lesquels la matrice de covariance nโ€™a besoin dโ€™รชtre connue quโ€™ร  un facteur prรจs. Cette propriรฉtรฉ permet dโ€™obtenir la distribution asymptotique du paramรจtre dโ€™intรฉrรชt et celle-ci a de particulier, que pour tous les estimateurs vรฉrifiant les conditions prรฉcรฉdemment citรฉes, la variance asymptotique est la mรชme ร  un coefficient prรจs. Lโ€™intรฉrรชt principal de cette propriรฉtรฉ rรฉside dans le fait que les propriรฉtรฉs statistiques de nombreuses applications sont connues dans le cas classique gaussien. De plus, la plupart de ces applications vรฉrifient รฉgalement la condition dโ€™homogรฉnรฉitรฉ dโ€™ordre zรฉro. Ainsi, en substituant les M-estimateurs ou lโ€™estimateur FP ร  la SCM dans ces applications, les propriรฉtรฉs statistiques asymptotiques du paramรจtre dโ€™intรฉrรชt peuvent facilement รชtre obtenues : en multipliant les donnรฉes ร  utiliser par un certain coefficient, on retrouve en effet le mรชme comportement quโ€™avec la SCM en gaussien. Diffรฉrentes applications telles que le radar adaptatif, la dรฉtection en hyperspectral ou la localisation de direction dโ€™arrivรฉe par la mรฉthode MUSIC, ont permis tout au long de cet ouvrage, dโ€™illustrer lโ€™intรฉrรชt pratique de nos rรฉsultats. En particulier, dans le chapitre 4 nous nous sommes penchรฉs plus particuliรจrement sur le cas de la dรฉtection en radar ou en imagerie hyperspectral. Les simulations sur donnรฉes rรฉelles ou de synthรจse, ont montrรฉ que lโ€™utilisation des M estimateurs ou de lโ€™estimateur FP, apportant robustesse et parfois optimalitรฉ, est facilitรฉe par nos rรฉsultats thรฉoriques. En effet, des courbes telles que la relation Pfa-seuil, peuvent se dรฉduire de celle de la SCM en gaussien, dรฉjร  connue. Le rรฉsultat des M-estimateurs et de lโ€™estimateur FP est cependant moins immรฉdiat car il nรฉcessite un algorithme itรฉratif. Nous avons donc rรฉalisรฉ de nombreuses simulations afin de tester sa convergence sous diffรฉrentes configurations. Celles-ci permettent de montrer que dans toutes les conditions normales dโ€™utilisations, les algorithmes itรฉratifs donnant les estimateurs convergent rapidement.

Le rapport de stage ou le pfe est un document dโ€™analyse, de synthรจse et dโ€™รฉvaluation de votre apprentissage, cโ€™est pour cela chatpfe.com propose le tรฉlรฉchargement des modรจles complet de projet de fin dโ€™รฉtude, rapport de stage, mรฉmoire, pfe, thรจse, pour connaรฎtre la mรฉthodologie ร  avoir et savoir comment construire les parties dโ€™un projet de fin dโ€™รฉtude.

Table des matiรจres

Introduction
1 Etat de lโ€™artย 
1.1 Estimation de paramรจtres statistiquesย 
1.2 Modรฉlisation de donnรฉes et dรฉfinitions importantesย 
1.3 Premiรจre approche : hypothรจses classiques en traitement de signal
1.3.1 La Sample Covariance Matrix
1.4 Seconde approche : les distributions gaussiennes-composรฉesย 
1.4.1 Vecteurs gaussiens-composรฉs
1.4.2 Exemples de GCV
1.4.3 Lโ€™estimateur du Point-Fixe
1.4.4 Comparaison de la robustesse et des performances du Point-fixe par rapport ร  la SCM
1.4.5 Simulation MUSIC pour comparer lโ€™estimateur FP et la SCM
1.5 Troisiรจme approche : les distributions elliptiquesย 
1.5.1 Les distributions elliptiques rรฉelles
1.5.2 Les distributions elliptiques complexes gรฉnรฉralisรฉes
1.5.3 Les distributions elliptiques complexes (circulaires du second-ordre)
1.5.4 Lien avec les distributions sphรฉriques
1.5.5 Lien avec les distributions gaussiennes-composรฉes
1.5.6 Cas particulier des distributions gaussiennes complexes gรฉnรฉralisรฉes
1.6 Estimateurs du Maximum de Vraisemblance de la matrice de covariance, dans le cadre des distributions elliptiques
1.7 Illustrations : distribution elliptique rรฉelle
1.8 Synthรจseย 
2 Thรฉorie de la robustesseย 
2.1 Thรฉorie de la robustesse
2.1.1 Quโ€™est ce quโ€™un estimateur robuste ?
2.1.2 Thรฉorie de la robustesse
2.2 Les M-estimateurs
2.2.1 Matrices de dispersion et de pseudo-dispersion
2.2.2 Dรฉfinition des M-estimateurs
2.2.3 Exemples de M-estimateurs
2.3 Critรจres de robustesse
2.3.1 Fonction dโ€™influence
2.3.2 Point de rupture
2.3.3 Biais asymptotique et biais asymptotique maximum
2.3.4 Synthรจse
2.4 Application des critรจres de robustesse aux diffรฉrents estimateurs รฉtudiรฉs
2.4.1 Fonction dโ€™influence
2.4.2 Point de rupture
2.4.3 Biais asymptotique
2.5 Synthรจse
3 Performances statistiques des estimateursย 
3.1 Distribution asymptotique de la SCM et de lโ€™estimateur FP
3.1.1 Distribution asymptotique de la SCM
3.1.2 Distribution asymptotique de lโ€™estimateur FP
3.2 Distribution asymptotique des M-estimateurs
3.2.1 Distribution asymptotique des M-estimateurs rรฉels
3.2.2 Distribution asymptotique des M-estimateurs complexes
3.3 Propriรฉtรฉs particuliรจres des estimateurs รฉtudiรฉs
3.3.1 Cas rรฉel
3.3.2 Cas complexe
3.3.3 Exemple : variance asymptotique de lโ€™รฉquivalent complexe du M-estimateur de Huber
3.3.4 Etude du coefficient ฮฝ1
3.4 Simulation sur la mรฉthode MUSIC
3.5 Synthรจse
4 Mise en oeuvre sur des applications de traitement du signal
4.1 Contexte
4.1.1 Problรจme de dรฉtection des traitements adaptatifs
4.1.2 Dรฉtecteur utilisรฉ : Adaptive Normalized match filter (ANMF)
4.2 Performances de lโ€™ANMF en fonction de lโ€™estimateur utilisรฉย 
4.2.1 Relation Pfa-seuil des M-estimateurs
4.3 Caractรฉristiques de mise en oeuvre des estimateurs
4.3.1 Vitesse de convergence du M-estimateur dโ€™Huber
4.3.2 Vitesse de convergence du M-estimateur issu dโ€™une t-distribution
4.4 Applicationsย 
4.4.1 Traitements spatio-temporels adaptatifs (STAP)
4.4.2 Dรฉtection en imagerie hyperspectral
4.5 Synthรจseย 
Conclusion

Tรฉlรฉcharger le rapport complet

Tรฉlรฉcharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiรฉe. Les champs obligatoires sont indiquรฉs avec *