Segmentation conjointe de signaux astronomiques
Brรจve taxinomie des mรฉthodes de segmentation
Les problรจmes de dรฉtection de changements ont reรงu un intรฉrรชt considรฉrable dans la communautรฉ du traitement du signal, et ce depuis plus de 25 ans. Une bibliographie complรจte des rรฉfรฉrences publiรฉs avant 2000 peut รชtre trouvรฉe dans les livres de Basseville et Nikiforov [BN93], Brodsky et Darkhovsky [BD93] ou Gustafsson [Gus00]. Cependant, depuis 2000, la mise en ลuvre de nouveaux algorithmes performants sโavรจre possible, grรขce notamment aux importantes charges calculatoires dรฉsormais supportรฉes par les outils informatiques. Dโune maniรจre gรฉnรฉrale, on distingue deux types dโalgorithme de segmentation. La premiรจre classe de mรฉthodes consiste en un traitement sรฉquentiel des donnรฉes observรฉes, ร mesure de leur disponibilitรฉ. On parle alors de segmentation ยซ en ligneยป : pour un taux de fausse alarme donnรฉ, un critรจre de dรฉcision est calculรฉ successivement sur les portions de signal [y1, . . . , yi ], puis [y1, . . . , yi+1], puis [y1, . . . , yi+2] etc…, jusquโร ce quโun changement soit dรฉtectรฉ. Un grand nombre de ces algorithmes sont basรฉs sur des tests dโhypothรจses statistiques mettant en jeu des rapports de vraisemblance. Nous citerons par exemple les algorithmes CUSUM pour Cumulative Sum [BN93, p. 35] et GLR pour Generalized Likelihood Ratio [Nik01; WW04]. Notons que dโautres algorithmes de segmentation en ligne reposent par exemple sur des mรฉthodes ร noyau [DDD05] ou sur des techniques de filtrage [DF98; FL07].
Le travail de thรจse rapportรฉ dans ce manuscrit se concentre sur un deuxiรจme type dโalgorithme : les procรฉdures de segmentation hors-ligne. Dans ce cas, nous supposons que lโensemble du signal observรฉ [y1, . . . , yN ] est connu. Il convient alors de dรฉceler un ou plusieurs changements dans lโensemble de cette sรฉquence, de maniรจre ยซ rรฉtrospective ยป (terme employรฉ notamment par Inclan dans [IT94] et Rotondi dans [Rot02]). Lร encore, une dichotomie des algorithmes de segmentation hors-ligne peut รชtre opรฉrรฉe. Un grand nombre de stratรฉgies dรฉveloppรฉes se base sur une approche par sรฉlection de modรจle. Les algorithmes les plus connus sont basรฉs sur les critรจres Cp introduit par Mallows [Mal73], AIC (Akaike Information Criterion [Aka74]) et BIC (Bayesian Information Criterion [Sch78]). Une description paramรฉtrique est proposรฉe, incluant les positions des ruptures entre un nombre inconnu de segments. Les changements sont alors estimรฉs par optimisation dโun critรจre pรฉnalisรฉ appropriรฉ [Lav99; LM00]). Cette pรฉnalisation, portant par exemple sur le nombre total de segments, permet de sโaffranchir des problรจmes de sur segmentation. Plusieurs รฉtudes ont รฉtรฉ menรฉes afin de choisir au mieux le terme de pรฉnalisation [Lav98; LL00; BM01; Lav05; Leb05]. Une alternative ร cette dรฉmarche de pรฉnalisation rรฉside en une formulation bayรฉsienne du problรจme. Il est alors nรฉcessaire de dรฉfinir des lois a priori pour les paramรจtres inconnus. Ces lois induisent implicitement une pรฉnalisation du terme dโattache aux donnรฉes reprรฉsentรฉ par la vraisemblance. Comme nous lโavons prรฉcisรฉ plus haut, lโutilisation de mรฉthodes MCMC sโavรจre alors souvent nรฉcessaire [MT93; Dju94; Chi98; LM99; WW03]. Lโestimation des hyperparamรจtres est alors possible en introduisant un deuxiรจme niveau de hiรฉrarchie dans lโinfรฉrence [CGS92; Cap02].
Position du problรจme
Trรจs peu de travaux issus de la littรฉrature du traitement du signal sont consacrรฉs ร la segmentation de sรฉries astronomiques. Pourtant, dรฉtecter les changements de brillance de diffรฉrents objets est un problรจme fondamental en astronomie pour lโanalyse temporelle des activitรฉs galactique et extragalactique. Au dรฉbut des annรฉes 1990, la NASA a lancรฉ le satellite CGRO ย afin dโรฉtudier plus prรฉcisรฉment un phรฉnomรจne mรฉconnu jusquโalors : les sursauts gamma. Embarquรฉ ร son bord, un instrument, appelรฉ BATSE , a pour mission dโenregistrer les instants dโarrivรฉe des photons sur un capteur photo-sensible dans quatre bandes dโรฉnergies diffรฉrentes.
Un algorithme bayรฉsien itรฉratif basรฉ sur un modรจle de Poisson constant par morceaux a รฉtรฉ rรฉcemment รฉtudiรฉ pour rรฉsoudre ce problรจme [Sca98]. Lโidรฉe principale de cet algorithme est de dรฉcomposer le signal observรฉ en deux sous-intervalles (en optimisant un critรจre appropriรฉ basรฉ sur un rapport de vraisemblance), dโappliquer la mรชme procรฉdure sur les deux segments obtenus et de continuer cette opรฉration autant de fois que nรฉcessaire. Lโavantage majeur de cette procรฉdure est de choisir une seule rupture ร chaque รฉtape. Cependant, la performance de lโalgorithme est limitรฉe par sa complexitรฉ calculatoire et par le fait quโune rรจgle dโarrรชt judicieuse a besoin dโรชtre dรฉfinie. Lโalgorithme ร ruptures multiples prรฉsentรฉ dans [JSB+05] permet de dรฉpasser ces limitations, mais nรฉcessite la connaissance dโune information a priori sur le nombre de ruptures. Il a รฉgalement lโinconvรฉnient de ne pas fournir automatiquement dโinformation sur la prรฉcision des paramรจtres dรฉterminรฉs de faรงon optimale. Un autre inconvรฉnient des algorithmes prรฉsentรฉs dans [Sca98] et [JSB+05] est quโils ne permettent pas de traiter simultanรฉment les quatre sรฉquences de donnรฉes fournies par le capteur BATSE. Ce chapitre รฉtudie un nouvel algorithme de segmentation bayรฉsienne qui ne nรฉcessite pas de rรจgle dโarrรชt et qui permet de segmenter conjointement plusieurs signaux issus de capteurs multiples. La stratรฉgie proposรฉe repose sur un modรจle hiรฉrarchique qui suppose que des lois a priori pour les paramรจtres inconnus sont disponibles. Des lois a priori vagues sont choisies pour les hyperparamรจtres qui sont soit intรฉgrรฉs dans la loi a posteriori dรจs que cela est possible, soit estimรฉs grรขce aux donnรฉes observรฉes. Des mรฉthodes MCMC sont utilisรฉes pour gรฉnรฉrer des รฉchantillons distribuรฉs suivant la loi a posteriori. Les estimateurs bayรฉsiens sont finalement calculรฉs ร partir de ces รฉchantillons simulรฉs. La mรฉthodologie proposรฉe est similaire au modรจle bayรฉsien hiรฉrarchique dรฉveloppรฉ dans [PADF02]. Pourtant, il convient de noter les deux points suivants. La mรฉthode prรฉsentรฉe dans [PADF02] traite de modรจles de rรฉgression linรฉaire entachรฉs dโun bruit additif gaussien et ne peut donc pas รชtre directement appliquรฉe ร des donnรฉes poissonniennes. Notre mรฉthode peut donc รชtre considรฉrรฉe comme une adaptation de cette approche ร des donnรฉes distribuรฉes suivant une loi de Poisson. Dโautre part, la procรฉdure de segmentation que nous dรฉtaillons ici permet la segmentation conjointe de sรฉquences enregistrรฉes par plusieurs capteurs, ce qui nโรฉtait pas possible avec lโalgorithme proposรฉ dans [PADF02]. Cโest, ร notre connaissance, la premiรจre fois quโun algorithme totalement bayรฉsien est dรฉveloppรฉ pour la segmentation conjointe de donnรฉes poissonniennes.
Mises en forme des donnรฉes
Comme cela est dรฉtaillรฉ dans [Sca98], les donnรฉes brutes fournies par des outils comme BATSE sont les temps dโarrivรฉes de P photons {tp, p = 1, . . . , P} sur la surface sensible de lโappareil. Ces donnรฉes peuvent รชtre mises en forme selon diffรฉrents modรจles qui sont dรฉtaillรฉs ci-aprรจs. Le mode TTE (Time-Tagged Event) est couramment utilisรฉ en astronomie. Il suppose la connaissance dโune pรฉriode dโรฉchantillonnage ฮดt qui correspond ร la rรฉsolution temporelle de lโappareil. Cette constante est le dรฉlai minimal qui sรฉpare lโarrivรฉe de deux photons dรฉtectรฉs. En dโautres termes, cโest le temps nรฉcessaire au dispositif pour quโil redevienne opรฉrationnel aprรจs avoir dรฉtectรฉ une particule. Ce temps est gรฉnรฉralement trรจs court comparรฉ au phรฉnomรจne astronomique qui nous intรฉresse (pour BATSE, ฮดt = 2ยตs). Ainsi, les donnรฉes observรฉes pendant la durรฉe T = Mฮดt sont reprรฉsentรฉes par leur indice dโarrivรฉe DTTE = {mp, p = 1, . . . , P}, oรน tp = mpฮดt est le temps dโarrivรฉe du p iรจme photon. Une reprรฉsentation รฉlรฉgante de ce mode consiste ร introduire un processus binaire Xm (m = 1, . . . , M) tel que :
Xm = 1 si un photon est dรฉtectรฉ ร lโinstant mฮดt,
Xm = 0 sinon.
Ainsi Xm peut-il รชtre considรฉrรฉ comme un processus de Bernoulli avec P0 = P[Xm = 0] et P1 = 1โP0. Bien sรปr, le mode TTE fournit les donnรฉes les plus rรฉsolues du point de vue temporel. Cependant, les donnรฉes binaires TTE semblent trop volumineuses pour donner lieu ร une analyse facilement exploitable. La deuxiรจme maniรจre de reprรฉsenter les donnรฉes est appelรฉe Time-To-Spill (TTS). Pour rรฉduire le volume occupรฉ par les donnรฉes brutes, seuls sont conservรฉs les temps dโarrivรฉe tous les S photons, oรน S est un entier (pour BATSE, S = 64). Les donnรฉes disponibles sont alors les temps qui sรฉparent lโarrivรฉe de S photons consรฉcutifs, DTTS = {ฯl , l = 0, . . . , L โ 1}, oรน ฯlฮดt est le temps รฉcoulรฉ entre lโenregistrement des (lS + 1)-iรจme et (lS +S)-iรจme photons.
|
Table des matiรจres
Introduction
1 Segmentation conjointe de signaux astronomiques
1.1 Brรจve taxinomie des mรฉthodes de segmentation
1.2 Position du problรจme
1.3 Mises en forme des donnรฉes
1.4 Description du modรจle bayรฉsien hiรฉrarchique
1.5 รchantillonneur de Gibbs pour la dรฉtection de ruptures
1.6 Diagnostic de convergence
1.7 Segmentation de donnรฉes synthรฉtiques
1.8 Analyse de donnรฉes astronomiques rรฉelles
1.9 Conclusions
2 Segmentation conjointe de processus autorรฉgressifs
2.1 Introduction
2.2 Modรจle bayรฉsien hiรฉrarchique
2.3 รchantillonneur de Gibbs pour la segmentation conjointe de processus AR
2.4 Segmentation de donnรฉes synthรฉtiques
2.5 Modรจles alternatifs
2.6 Ordres des modรจles inconnus
2.7 Applications
2.8 Conclusions
3 Dรฉmรฉlange linรฉaire dโimages hyperspectrales
3.1 Introduction
3.2 Modรจle de mรฉlange linรฉaire
3.3 Modรจle bayรฉsien hiรฉrarchique
3.4 รchantillonneur de Gibbs pour lโestimation des abondances
3.5 Rรฉsultats de simulations sur des donnรฉes synthรฉtiques
3.6 Dรฉmรฉlange spectral dโune image AVIRIS
3.7 Cas dโun bruit gaussien corrรฉlรฉ
3.8 Estimation du nombre de pรดles de mรฉlange ร lโaide dโun algorithme ร sauts rรฉversibles
3.9 Conclusions
Conclusions