Introduction : estimation des paramรจtres statistiques en traitement de signal
ย ย Nous nous proposons ici de rรฉcapituler les principales mรฉthodes existant, pour estimer les statistiques du second ordre de donnรฉes reรงues. Le moment dโordre un (la moyenne), sera considรฉrรฉ comme connu et supposรฉ nul. En effet, cette derniรจre hypothรจse revient simplement ร considรฉrer des donnรฉes dont on connaรฎt la moyenne et qui ont รฉtรฉ recentrรฉes. Lโhypothรจse de moyenne nulle est faite dans de nombreuses applications (radar, localisation de source) permettant ร cette รฉtude de rester proche de nombreux cas rรฉels. Les รฉvolutions entre deux mรฉthodes, sont parfois directement liรฉes aux รฉvolutions technologiques : en radar par exemple, le modรจle des donnรฉes gaussiennes a longtemps รฉtรฉ utilisรฉ et validรฉ pour estimer les รฉchos du sol et de lโenvironnement en gรฉnรฉral. Puis la haute rรฉsolution est apparue. Avec la nouvelle prรฉcision obtenue, il sโest vite avรฉrรฉ que le modรจle gaussien รฉtait non seulement trรจs loin de la rรฉalitรฉ mais quโen plus les dรฉtecteurs et techniques basรฉs sur lโancien modรจle nโรฉtaient plus du tout fiables. On a alors eu lโidรฉe de sโinspirer de ce quโil se passe en rรฉalitรฉ : avec cette haute rรฉsolution, lโenvironnement nโest pas assimilable ร un bruit relativement homogรจne mais on y discerne diffรฉrentes zones, une texture en quelque sorte. Ainsi, on peut considรฉrer que le bruit est toujours gaussien mais avec une puissance variable en fonction de lโendroit. Cโest ainsi que lโutilisation des distributions gaussiennes-composรฉes a commencรฉ ร se rรฉpandre dans les applications de traitement de signal, et notamment en radar. Il a fallu รฉgalement adapter les estimateurs de paramรจtres statistiques ainsi que les techniques associรฉes. Tout cela sera repris en dรฉtail dans les sections suivantes. Par ailleurs, les รฉvolutions ne sโarrรชtent pas aux distributions gaussiennes-composรฉes. En effet, celles-ci ne sont en rรฉalitรฉ quโun cas particulier dโune famille de distributions plus grande, trรจs flexible et aux propriรฉtรฉs dรฉjร beaucoup รฉtudiรฉes par les statisticiens : les distributions elliptiques. Le fait est quโelles sont pratiquement inutilisรฉes en traitement de signal, en dehors de quelques rares exceptions [64]. Une raison probable est quโelles nโont รฉtรฉ รฉtendues au cas complexe que trรจs rรฉcemment et quโen traitement de signal, les donnรฉes sont trรจs souvent complexes. A noter dโailleurs, que dans des domaines tels que la finance oรน les donnรฉes ร traiter sont rรฉelles, lโabandon du modรจle gaussien sโest fait trรจs souvent au profit des donnรฉes elliptiques. La littรฉrature des distributions elliptiques se retrouve donc trรจs souvent dans le cadre dโapplications liรฉes ร la finance. La derniรจre partie de ce chapitre sera donc consacrรฉe aux distributions elliptiques. Avant dโentrer plus en dรฉtail dans les distributions gaussiennes-composรฉes, elliptiques ou autres, posons le cadre de lโรฉtude en dรฉcrivant les hypothรจses classiques du traitement de signal.
Quโest ce quโun estimateur robuste ?
ย ย Dans le premier chapitre, nous avons vu que pour amรฉliorer lโestimation de paramรจtres, lโobjectif est dโutiliser un bon modรจle afin dโutiliser ensuite lโEMV correspondant. Cette mรฉthode conduit ร des estimateurs asymptotiquement efficaces mais pas forcรฉment robustes. En effet, lโestimateur robuste sera plutรดt celui qui reste toujours assez fiable, quelles que soient les donnรฉes de dรฉpart, ร dรฉfaut dโรชtre optimal dans certains cas de figures. Dans un contexte rรฉel, bien que les distributions elliptiques offrent de trรจs grandes possibilitรฉs de distributions, il nโen reste pas moins que le risque existe, que des donnรฉes ne suivent pas le modรจle considรฉrรฉ. On ne prendra pas en compte ici, toutes les techniques qui consistent en un prรฉ-traitement de donnรฉes, afin de pouvoir parfaitement les maรฎtriser. Ainsi, les modรจles utilisรฉs correspondent toujours ร des simplifications de la rรฉalitรฉ. La caractรฉristique qui permet alors ร une lรฉgรจre dรฉviation entre la rรฉalitรฉ et le modรจle supposรฉ, de nโavoir pas ou peu dโinfluence sur le paramรจtre estimรฉ, est prรฉcisรฉment la robustesse de lโestimateur. Pour en revenir aux estimateurs optimaux (EMV), un lรฉger รฉloignement au modรจle ne permet pas de conclure ร une lรฉgรจre chute de performances. Pour rรฉsumer, une approche robuste de la modรฉlisation et de lโanalyse de donnรฉes pourrait se dรฉfinir, de faรงon abstraite, comme une maniรจre dโobtenir sur un modรจle approximativement exact, des rรฉsultats approximativement valides. En pratique cela signifie des mรฉthodes fiables, pour lesquelles un intervalle de confiance peut รชtre รฉtabli. Ainsi, la robustesse doit dโune maniรจre ou dโune autre pouvoir รชtre mesurรฉe. Des critรจres doivent permettre de dรฉterminer comment les erreurs peuvent influencer un estimateur et dans quelle mesure lโestimation dโun paramรจtre peut รชtre faussรฉe. De nombreux auteurs se sont posรฉs ces questions, menant ร la formalisation dโune thรฉorie de la robustesse.
Conclusion
Synthรจse Partant de la constatation simple que la haute rรฉsolution et la modernisation des applications actuelles amรจnent les traiteurs de signaux ร analyser des donnรฉes qui ne vรฉrifient plus le modรจle classiquement admis de donnรฉes gaussiennes, nous nous sommes penchรฉs, dans un premier chapitre, sur les problรจmes qui en dรฉcoulaient et solutions qui ont pu รชtre apportรฉes ces derniรจres annรฉes. Premiรจre consรฉquence de cette inadรฉquation statistique : de nombreux traitements, optimisรฉs pour fonctionner en milieu gaussien voient leurs performances dรฉcroรฎtre. Nous nous sommes intรฉressรฉs plus particuliรจrement au problรจme dโestimation de matrice de covariance. En effet, dans de nombreuses applications, ce paramรจtre permet la prise en compte du milieu. En radar par exemple, cโest lโinjection de cette information dans le dรฉtecteur qui en fait un traitement adaptatif. LโEMV en milieu gaussien รฉtant la SCM, cโest prรฉcisรฉment cet estimateur qui est en cause dans la chute des performances en milieu non-gaussien. Lโidรฉe premiรจre est donc de mieux modรฉliser les donnรฉes, afin de trouver ensuite lโEMV correspondant. Le problรจme, est que les donnรฉes ne se sont pas รฉloignรฉes du modรจle gaussien au profit dโune seule et mรชme distribution. Lโamรฉlioration des techniques a plutรดt conduit ร une diversification des comportements. Ce dernier dรฉpend de lโapplication, du milieu… et ainsi, il existe une multitude de distributions modรฉlisant diffรฉrents contextes, chacune ayant un EMV, lui-mรชme รฉtant parfois impossible ร obtenir. De nombreux traiteurs de signaux ont donc proposรฉ le modรจle des distributions gaussiennes-composรฉes. Elles sont assez gรฉnรฉrales et correspondent au produit dโun vecteur gaussien par une variable de distribution inconnue, sensรฉe permettre la modรฉlisation de la plupart des situations. De nombreuses รฉtudes montrent quโelles modรฉlisent effectivement trรจs bien de nombreux milieux, en particulier en radar [41], [80], [32], [89], [90], [15], [16], [72], [29]. Lโintรฉrรชt de ces distributions, est quโil sโen dรฉgage un seul et mรชme EMV approchรฉ, qui ne nรฉcessite pas la connaissance de la distribution de la variable inconnue. Cet estimateur, lโestimateur FP, a รฉtรฉ รฉtudiรฉ notamment dans la thรจse de F. Pascal [67]. Puis, sโinspirant dโautres domaines tels que la finance, nous avons poussรฉ la gรฉnรฉralisation des distributions plus loin : les distributions elliptiques contiennent ร la fois la distribution gaussienne et toutes les distributions gaussiennes-composรฉes. Elle correspondent en fait ร nโimporte quelle distribution dรฉpendant uniquement de la norme des donnรฉes blanchies par la matrice de covariance. Cette forme quadratique particuliรจre est รฉgalement appelรฉe distance de Mahalanobis [50]. Pour certaines distributions elliptiques, la matrice de covariance nโexiste pas. Mais la matrice de dispersion, paramรจtre inhรฉrent ร la distribution elliptique, peut, elle, toujours รชtre calculรฉe. Lorsque la matrice de covariance existe, cette matrice de dispersion est proportionnelle ร la premiรจre. Dans le cas complรจtement gรฉnรฉral des distributions elliptiques, nous ne disposons pas dโEMV approchรฉ. Bien sรปr, pour chaque distribution particuliรจre un EMV peut รชtre obtenu, mais bien souvent, la seule information dont on dispose sur le milieu, est quโil est probable quโil ne suive pas une loi gaussienne. On espรจre alors quโil puisse รชtre modรฉlisรฉ par une distribution elliptique. Dans le chapitre 2, nous avons introduit le concept de robustesse tel que dรฉcrit par Huber en 1964 [36],[39], dans ce que nous appellerons les prรฉmices dโune thรฉorie de la robustesse. Il propose en effet des estimateurs robustes sur lโensemble des distributions elliptiques. Ceux-ci ne sont pas forcรฉment les EMV dโune distribution particuliรจre, mais quelle que soit la distribution elliptique, on sโassure des performances minimales et une faible influence des perturbations ou donnรฉes aberrantes. Ces estimateurs, construits de maniรจre analogue aux EMV sont alors appelรฉs M-estimateurs, le M signifiant ยซย Maximum Likelihood Typeย ยป. Nous avons ensuite comparรฉ la robustesse de ces M-estimateurs ร celle de lโestimateur FP et de la SCM. Ainsi, si les M-estimateurs et lโestimateur FP ont une robustesse trรจs proche, lโinstabilitรฉ de la SCM en milieu non-gaussien ou lorsque des perturbations sont prรฉsentes, a รฉtรฉ mis en รฉvidence. Pour cela nous avons utilisรฉ des outils issus de la thรฉorie de la robustesse dont notamment, la fonction dโinfluence introduite par Hampel en 1971 [35], [34]. En grossissant le trait, lโestimateur FP a donc en quelque sorte, une robustesse ยซย ร toute รฉpreuveย ยป, cโest-ร -dire quelle que soit la distribution elliptique et quelles que soient les perturbations (ร condition de ne pas dรฉpasser le point de rupture). Les rรฉsultats sont souvent lรฉgรจrement moins bons en ce qui concerne les M-estimateurs, mais grรขce ร leurs paramรจtres de rรฉglages, il peuvent dans certains cas, atteindre le maximum de vraisemblance. Nous avons ensuite รฉtudiรฉ dans le chapitre 3, les performances de ces diffรฉrents estimateurs. Aprรจs avoir obtenu la distribution asymptotique des M-estimateurs, une propriรฉtรฉ particuliรจre sโest dรฉgagรฉe. Elle se gรฉnรฉralise ร tout estimateur donnant une matrice hermitienne et dont la variance asymptotique suit une forme particuliรจre dรฉcrite dans le chapitre. Cette propriรฉtรฉ sโapplique aux traitements modรฉlisables par des fonctions homogรจnes dโordre zรฉro qui ร une matrice (estimรฉe), associent un paramรจtre dโintรฉrรชt. En dโautres termes, elle sโapplique aux traitements dans lesquels la matrice de covariance nโa besoin dโรชtre connue quโร un facteur prรจs. Cette propriรฉtรฉ permet dโobtenir la distribution asymptotique du paramรจtre dโintรฉrรชt et celle-ci a de particulier, que pour tous les estimateurs vรฉrifiant les conditions prรฉcรฉdemment citรฉes, la variance asymptotique est la mรชme ร un coefficient prรจs. Lโintรฉrรชt principal de cette propriรฉtรฉ rรฉside dans le fait que les propriรฉtรฉs statistiques de nombreuses applications sont connues dans le cas classique gaussien. De plus, la plupart de ces applications vรฉrifient รฉgalement la condition dโhomogรฉnรฉitรฉ dโordre zรฉro. Ainsi, en substituant les M-estimateurs ou lโestimateur FP ร la SCM dans ces applications, les propriรฉtรฉs statistiques asymptotiques du paramรจtre dโintรฉrรชt peuvent facilement รชtre obtenues : en multipliant les donnรฉes ร utiliser par un certain coefficient, on retrouve en effet le mรชme comportement quโavec la SCM en gaussien. Diffรฉrentes applications telles que le radar adaptatif, la dรฉtection en hyperspectral ou la localisation de direction dโarrivรฉe par la mรฉthode MUSIC, ont permis tout au long de cet ouvrage, dโillustrer lโintรฉrรชt pratique de nos rรฉsultats. En particulier, dans le chapitre 4 nous nous sommes penchรฉs plus particuliรจrement sur le cas de la dรฉtection en radar ou en imagerie hyperspectral. Les simulations sur donnรฉes rรฉelles ou de synthรจse, ont montrรฉ que lโutilisation des M estimateurs ou de lโestimateur FP, apportant robustesse et parfois optimalitรฉ, est facilitรฉe par nos rรฉsultats thรฉoriques. En effet, des courbes telles que la relation Pfa-seuil, peuvent se dรฉduire de celle de la SCM en gaussien, dรฉjร connue. Le rรฉsultat des M-estimateurs et de lโestimateur FP est cependant moins immรฉdiat car il nรฉcessite un algorithme itรฉratif. Nous avons donc rรฉalisรฉ de nombreuses simulations afin de tester sa convergence sous diffรฉrentes configurations. Celles-ci permettent de montrer que dans toutes les conditions normales dโutilisations, les algorithmes itรฉratifs donnant les estimateurs convergent rapidement.
|
Table des matiรจres
Introduction
1 Etat de lโartย
1.1 Estimation de paramรจtres statistiquesย
1.2 Modรฉlisation de donnรฉes et dรฉfinitions importantesย
1.3 Premiรจre approche : hypothรจses classiques en traitement de signal
1.3.1 La Sample Covariance Matrix
1.4 Seconde approche : les distributions gaussiennes-composรฉesย
1.4.1 Vecteurs gaussiens-composรฉs
1.4.2 Exemples de GCV
1.4.3 Lโestimateur du Point-Fixe
1.4.4 Comparaison de la robustesse et des performances du Point-fixe par rapport ร la SCM
1.4.5 Simulation MUSIC pour comparer lโestimateur FP et la SCM
1.5 Troisiรจme approche : les distributions elliptiquesย
1.5.1 Les distributions elliptiques rรฉelles
1.5.2 Les distributions elliptiques complexes gรฉnรฉralisรฉes
1.5.3 Les distributions elliptiques complexes (circulaires du second-ordre)
1.5.4 Lien avec les distributions sphรฉriques
1.5.5 Lien avec les distributions gaussiennes-composรฉes
1.5.6 Cas particulier des distributions gaussiennes complexes gรฉnรฉralisรฉes
1.6 Estimateurs du Maximum de Vraisemblance de la matrice de covariance, dans le cadre des distributions elliptiques
1.7 Illustrations : distribution elliptique rรฉelle
1.8 Synthรจseย
2 Thรฉorie de la robustesseย
2.1 Thรฉorie de la robustesse
2.1.1 Quโest ce quโun estimateur robuste ?
2.1.2 Thรฉorie de la robustesse
2.2 Les M-estimateurs
2.2.1 Matrices de dispersion et de pseudo-dispersion
2.2.2 Dรฉfinition des M-estimateurs
2.2.3 Exemples de M-estimateurs
2.3 Critรจres de robustesse
2.3.1 Fonction dโinfluence
2.3.2 Point de rupture
2.3.3 Biais asymptotique et biais asymptotique maximum
2.3.4 Synthรจse
2.4 Application des critรจres de robustesse aux diffรฉrents estimateurs รฉtudiรฉs
2.4.1 Fonction dโinfluence
2.4.2 Point de rupture
2.4.3 Biais asymptotique
2.5 Synthรจse
3 Performances statistiques des estimateursย
3.1 Distribution asymptotique de la SCM et de lโestimateur FP
3.1.1 Distribution asymptotique de la SCM
3.1.2 Distribution asymptotique de lโestimateur FP
3.2 Distribution asymptotique des M-estimateurs
3.2.1 Distribution asymptotique des M-estimateurs rรฉels
3.2.2 Distribution asymptotique des M-estimateurs complexes
3.3 Propriรฉtรฉs particuliรจres des estimateurs รฉtudiรฉs
3.3.1 Cas rรฉel
3.3.2 Cas complexe
3.3.3 Exemple : variance asymptotique de lโรฉquivalent complexe du M-estimateur de Huber
3.3.4 Etude du coefficient ฮฝ1
3.4 Simulation sur la mรฉthode MUSIC
3.5 Synthรจse
4 Mise en oeuvre sur des applications de traitement du signal
4.1 Contexte
4.1.1 Problรจme de dรฉtection des traitements adaptatifs
4.1.2 Dรฉtecteur utilisรฉ : Adaptive Normalized match filter (ANMF)
4.2 Performances de lโANMF en fonction de lโestimateur utilisรฉย
4.2.1 Relation Pfa-seuil des M-estimateurs
4.3 Caractรฉristiques de mise en oeuvre des estimateurs
4.3.1 Vitesse de convergence du M-estimateur dโHuber
4.3.2 Vitesse de convergence du M-estimateur issu dโune t-distribution
4.4 Applicationsย
4.4.1 Traitements spatio-temporels adaptatifs (STAP)
4.4.2 Dรฉtection en imagerie hyperspectral
4.5 Synthรจseย
Conclusion
Tรฉlรฉcharger le rapport complet