Segmentation conjointe de signaux astronomiques

Segmentation conjointe de signaux astronomiques

Brรจve taxinomie des mรฉthodes de segmentation

Les problรจmes de dรฉtection de changements ont reรงu un intรฉrรชt considรฉrable dans la communautรฉ du traitement du signal, et ce depuis plus de 25 ans. Une bibliographie complรจte des rรฉfรฉrences publiรฉs avant 2000 peut รชtre trouvรฉe dans les livres de Basseville et Nikiforov [BN93], Brodsky et Darkhovsky [BD93] ou Gustafsson [Gus00]. Cependant, depuis 2000, la mise en ล“uvre de nouveaux algorithmes performants sโ€™avรจre possible, grรขce notamment aux importantes charges calculatoires dรฉsormais supportรฉes par les outils informatiques. Dโ€™une maniรจre gรฉnรฉrale, on distingue deux types dโ€™algorithme de segmentation. La premiรจre classe de mรฉthodes consiste en un traitement sรฉquentiel des donnรฉes observรฉes, ร  mesure de leur disponibilitรฉ. On parle alors de segmentation ยซ en ligneยป : pour un taux de fausse alarme donnรฉ, un critรจre de dรฉcision est calculรฉ successivement sur les portions de signal [y1, . . . , yi ], puis [y1, . . . , yi+1], puis [y1, . . . , yi+2] etc…, jusquโ€™ร  ce quโ€™un changement soit dรฉtectรฉ. Un grand nombre de ces algorithmes sont basรฉs sur des tests dโ€™hypothรจses statistiques mettant en jeu des rapports de vraisemblance. Nous citerons par exemple les algorithmes CUSUM pour Cumulative Sum [BN93, p. 35] et GLR pour Generalized Likelihood Ratio [Nik01; WW04]. Notons que dโ€™autres algorithmes de segmentation en ligne reposent par exemple sur des mรฉthodes ร  noyau [DDD05] ou sur des techniques de filtrage [DF98; FL07].

Le travail de thรจse rapportรฉ dans ce manuscrit se concentre sur un deuxiรจme type dโ€™algorithme : les procรฉdures de segmentation hors-ligne. Dans ce cas, nous supposons que lโ€™ensemble du signal observรฉ [y1, . . . , yN ] est connu. Il convient alors de dรฉceler un ou plusieurs changements dans lโ€™ensemble de cette sรฉquence, de maniรจre ยซ rรฉtrospective ยป (terme employรฉ notamment par Inclan dans [IT94] et Rotondi dans [Rot02]). Lร  encore, une dichotomie des algorithmes de segmentation hors-ligne peut รชtre opรฉrรฉe. Un grand nombre de stratรฉgies dรฉveloppรฉes se base sur une approche par sรฉlection de modรจle. Les algorithmes les plus connus sont basรฉs sur les critรจres Cp introduit par Mallows [Mal73], AIC (Akaike Information Criterion [Aka74]) et BIC (Bayesian Information Criterion [Sch78]). Une description paramรฉtrique est proposรฉe, incluant les positions des ruptures entre un nombre inconnu de segments. Les changements sont alors estimรฉs par optimisation dโ€™un critรจre pรฉnalisรฉ appropriรฉ [Lav99; LM00]). Cette pรฉnalisation, portant par exemple sur le nombre total de segments, permet de sโ€™affranchir des problรจmes de sur segmentation. Plusieurs รฉtudes ont รฉtรฉ menรฉes afin de choisir au mieux le terme de pรฉnalisation [Lav98; LL00; BM01; Lav05; Leb05]. Une alternative ร  cette dรฉmarche de pรฉnalisation rรฉside en une formulation bayรฉsienne du problรจme. Il est alors nรฉcessaire de dรฉfinir des lois a priori pour les paramรจtres inconnus. Ces lois induisent implicitement une pรฉnalisation du terme dโ€™attache aux donnรฉes reprรฉsentรฉ par la vraisemblance. Comme nous lโ€™avons prรฉcisรฉ plus haut, lโ€™utilisation de mรฉthodes MCMC sโ€™avรจre alors souvent nรฉcessaire [MT93; Dju94; Chi98; LM99; WW03]. Lโ€™estimation des hyperparamรจtres est alors possible en introduisant un deuxiรจme niveau de hiรฉrarchie dans lโ€™infรฉrence [CGS92; Cap02].

Position du problรจme

Trรจs peu de travaux issus de la littรฉrature du traitement du signal sont consacrรฉs ร  la segmentation de sรฉries astronomiques. Pourtant, dรฉtecter les changements de brillance de diffรฉrents objets est un problรจme fondamental en astronomie pour lโ€™analyse temporelle des activitรฉs galactique et extragalactique. Au dรฉbut des annรฉes 1990, la NASA a lancรฉ le satellite CGRO ย afin dโ€™รฉtudier plus prรฉcisรฉment un phรฉnomรจne mรฉconnu jusquโ€™alors : les sursauts gamma. Embarquรฉ ร  son bord, un instrument, appelรฉ BATSE , a pour mission dโ€™enregistrer les instants dโ€™arrivรฉe des photons sur un capteur photo-sensible dans quatre bandes dโ€™รฉnergies diffรฉrentes.

Un algorithme bayรฉsien itรฉratif basรฉ sur un modรจle de Poisson constant par morceaux a รฉtรฉ rรฉcemment รฉtudiรฉ pour rรฉsoudre ce problรจme [Sca98]. Lโ€™idรฉe principale de cet algorithme est de dรฉcomposer le signal observรฉ en deux sous-intervalles (en optimisant un critรจre appropriรฉ basรฉ sur un rapport de vraisemblance), dโ€™appliquer la mรชme procรฉdure sur les deux segments obtenus et de continuer cette opรฉration autant de fois que nรฉcessaire. Lโ€™avantage majeur de cette procรฉdure est de choisir une seule rupture ร  chaque รฉtape. Cependant, la performance de lโ€™algorithme est limitรฉe par sa complexitรฉ calculatoire et par le fait quโ€™une rรจgle dโ€™arrรชt judicieuse a besoin dโ€™รชtre dรฉfinie. Lโ€™algorithme ร  ruptures multiples prรฉsentรฉ dans [JSB+05] permet de dรฉpasser ces limitations, mais nรฉcessite la connaissance dโ€™une information a priori sur le nombre de ruptures. Il a รฉgalement lโ€™inconvรฉnient de ne pas fournir automatiquement dโ€™information sur la prรฉcision des paramรจtres dรฉterminรฉs de faรงon optimale. Un autre inconvรฉnient des algorithmes prรฉsentรฉs dans [Sca98] et [JSB+05] est quโ€™ils ne permettent pas de traiter simultanรฉment les quatre sรฉquences de donnรฉes fournies par le capteur BATSE. Ce chapitre รฉtudie un nouvel algorithme de segmentation bayรฉsienne qui ne nรฉcessite pas de rรจgle dโ€™arrรชt et qui permet de segmenter conjointement plusieurs signaux issus de capteurs multiples. La stratรฉgie proposรฉe repose sur un modรจle hiรฉrarchique qui suppose que des lois a priori pour les paramรจtres inconnus sont disponibles. Des lois a priori vagues sont choisies pour les hyperparamรจtres qui sont soit intรฉgrรฉs dans la loi a posteriori dรจs que cela est possible, soit estimรฉs grรขce aux donnรฉes observรฉes. Des mรฉthodes MCMC sont utilisรฉes pour gรฉnรฉrer des รฉchantillons distribuรฉs suivant la loi a posteriori. Les estimateurs bayรฉsiens sont finalement calculรฉs ร  partir de ces รฉchantillons simulรฉs. La mรฉthodologie proposรฉe est similaire au modรจle bayรฉsien hiรฉrarchique dรฉveloppรฉ dans [PADF02]. Pourtant, il convient de noter les deux points suivants. La mรฉthode prรฉsentรฉe dans [PADF02] traite de modรจles de rรฉgression linรฉaire entachรฉs dโ€™un bruit additif gaussien et ne peut donc pas รชtre directement appliquรฉe ร  des donnรฉes poissonniennes. Notre mรฉthode peut donc รชtre considรฉrรฉe comme une adaptation de cette approche ร  des donnรฉes distribuรฉes suivant une loi de Poisson. Dโ€™autre part, la procรฉdure de segmentation que nous dรฉtaillons ici permet la segmentation conjointe de sรฉquences enregistrรฉes par plusieurs capteurs, ce qui nโ€™รฉtait pas possible avec lโ€™algorithme proposรฉ dans [PADF02]. Cโ€™est, ร  notre connaissance, la premiรจre fois quโ€™un algorithme totalement bayรฉsien est dรฉveloppรฉ pour la segmentation conjointe de donnรฉes poissonniennes.

Mises en forme des donnรฉes

Comme cela est dรฉtaillรฉ dans [Sca98], les donnรฉes brutes fournies par des outils comme BATSE sont les temps dโ€™arrivรฉes de P photons {tp, p = 1, . . . , P} sur la surface sensible de lโ€™appareil. Ces donnรฉes peuvent รชtre mises en forme selon diffรฉrents modรจles qui sont dรฉtaillรฉs ci-aprรจs. Le mode TTE (Time-Tagged Event) est couramment utilisรฉ en astronomie. Il suppose la connaissance dโ€™une pรฉriode dโ€™รฉchantillonnage ฮดt qui correspond ร  la rรฉsolution temporelle de lโ€™appareil. Cette constante est le dรฉlai minimal qui sรฉpare lโ€™arrivรฉe de deux photons dรฉtectรฉs. En dโ€™autres termes, cโ€™est le temps nรฉcessaire au dispositif pour quโ€™il redevienne opรฉrationnel aprรจs avoir dรฉtectรฉ une particule. Ce temps est gรฉnรฉralement trรจs court comparรฉ au phรฉnomรจne astronomique qui nous intรฉresse (pour BATSE, ฮดt = 2ยตs). Ainsi, les donnรฉes observรฉes pendant la durรฉe T = Mฮดt sont reprรฉsentรฉes par leur indice dโ€™arrivรฉe DTTE = {mp, p = 1, . . . , P}, oรน tp = mpฮดt est le temps dโ€™arrivรฉe du p iรจme photon. Une reprรฉsentation รฉlรฉgante de ce mode consiste ร  introduire un processus binaire Xm (m = 1, . . . , M) tel que :

Xm = 1 si un photon est dรฉtectรฉ ร  lโ€™instant mฮดt,
Xm = 0 sinon.

Ainsi Xm peut-il รชtre considรฉrรฉ comme un processus de Bernoulli avec P0 = P[Xm = 0] et P1 = 1โˆ’P0. Bien sรปr, le mode TTE fournit les donnรฉes les plus rรฉsolues du point de vue temporel. Cependant, les donnรฉes binaires TTE semblent trop volumineuses pour donner lieu ร  une analyse facilement exploitable. La deuxiรจme maniรจre de reprรฉsenter les donnรฉes est appelรฉe Time-To-Spill (TTS). Pour rรฉduire le volume occupรฉ par les donnรฉes brutes, seuls sont conservรฉs les temps dโ€™arrivรฉe tous les S photons, oรน S est un entier (pour BATSE, S = 64). Les donnรฉes disponibles sont alors les temps qui sรฉparent lโ€™arrivรฉe de S photons consรฉcutifs, DTTS = {ฯ„l , l = 0, . . . , L โˆ’ 1}, oรน ฯ„lฮดt est le temps รฉcoulรฉ entre lโ€™enregistrement des (lS + 1)-iรจme et (lS +S)-iรจme photons.

Le rapport de stage ou le pfe est un document dโ€™analyse, de synthรจse et dโ€™รฉvaluation de votre apprentissage, cโ€™est pour cela chatpfe.com propose le tรฉlรฉchargement des modรจles complet de projet de fin dโ€™รฉtude, rapport de stage, mรฉmoire, pfe, thรจse, pour connaรฎtre la mรฉthodologie ร  avoir et savoir comment construire les parties dโ€™un projet de fin dโ€™รฉtude.

Table des matiรจres

Introduction
1 Segmentation conjointe de signaux astronomiques
1.1 Brรจve taxinomie des mรฉthodes de segmentation
1.2 Position du problรจme
1.3 Mises en forme des donnรฉes
1.4 Description du modรจle bayรฉsien hiรฉrarchique
1.5 ร‰chantillonneur de Gibbs pour la dรฉtection de ruptures
1.6 Diagnostic de convergence
1.7 Segmentation de donnรฉes synthรฉtiques
1.8 Analyse de donnรฉes astronomiques rรฉelles
1.9 Conclusions
2 Segmentation conjointe de processus autorรฉgressifs
2.1 Introduction
2.2 Modรจle bayรฉsien hiรฉrarchique
2.3 ร‰chantillonneur de Gibbs pour la segmentation conjointe de processus AR
2.4 Segmentation de donnรฉes synthรฉtiques
2.5 Modรจles alternatifs
2.6 Ordres des modรจles inconnus
2.7 Applications
2.8 Conclusions
3 Dรฉmรฉlange linรฉaire dโ€™images hyperspectrales
3.1 Introduction
3.2 Modรจle de mรฉlange linรฉaire
3.3 Modรจle bayรฉsien hiรฉrarchique
3.4 ร‰chantillonneur de Gibbs pour lโ€™estimation des abondances
3.5 Rรฉsultats de simulations sur des donnรฉes synthรฉtiques
3.6 Dรฉmรฉlange spectral dโ€™une image AVIRIS
3.7 Cas dโ€™un bruit gaussien corrรฉlรฉ
3.8 Estimation du nombre de pรดles de mรฉlange ร  lโ€™aide dโ€™un algorithme ร  sauts rรฉversibles
3.9 Conclusions
Conclusions

Lire le rapport complet

Tรฉlรฉcharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiรฉe. Les champs obligatoires sont indiquรฉs avec *