Détection des pixels rares par seuillage de l’erreur quadratique de reconstruction

Télécharger le fichier pdf d’un mémoire de fin d’études

Image Hyperspectrale

L’imagerie hyperspectrale consiste à acquérir une scène dans plus d’une cen-taine de bandes spectrales. Cette acquisition aboutit à la formation d’un cube hyperspectral tel qu’illustré par la figure 2.1.
Ce cube hyperspectral contient les données acquises en trois dimensions : deux dimensions spatiales et une dimension spectrale.
L’imagerie hyperspectrale est un cas particulier de l’imagerie dite “multi-spectrale” en ce que les bandes spectrales acquises sont étroites et contiguës. La résolution spectrale, de l’ordre du nanomètre, est alors suffisamment fine pour qu’on puisse assimiler l’information spectrale d’un pixel au spectre de réflexion continu de ce pixel.
De même, chaque image spectrale est une image monochromatique dont l’in-formation diffère en fonction de la longueur d’onde.
Le principe de l’imagerie hyperspectrale est basé sur le fait que chaque maté-riau reflète des ondes électromagnétiques à des longueurs d’onde spécifiques liées à sa composition moléculaire. Deux matériaux différents ayant des couleurs simi-laires en imagerie classique sont différentiables en imagerie hyperspectrale grâce à leurs spectres respectifs. Par conséquent le spectre de réflexion d’un pixel du cube hyperspectral est différent en fonction des matériau présent dans ce pixel.

Acquisition des images hyperspectrales

Il existe de très nombreux capteurs hyperspectraux dont les caractéristiques varient en fonction des applications visées. Les principales caractéristiques de ces instruments sont le type de scanner (pushbroom ou wiskbroom), la couverture et la résolution spectrale, l’angle de vue et la résolution spatiale.
Les techniques d’acquisitions se classent en trois catégories :
Les méthodes à balayage spectral qui consistent à acquérir successivement chaque image spectrale monochromatique, comme illustré par la figure 2.2. Chaque acquisition permet de capturer l’ensemble de la scène 2D à une longueur d’onde sélectionnée par un filtre optique passe-bande, le filtre optique est alors changé pour capturer l’image spectrale suivante et ainsi de suite jusqu’à l’acquisition com-plète du cube hyperspectral. Cette méthode nécessite d’avoir des filtres optiques très sélectifs qui permettent de filtrer précisément la longueur d’onde désirée. Elle nécessite cependant que la scène (et le capteur) restent immobiles pendant toute la durée de l’acquisition.
La seconde catégorie est celles des méthodes à balayage spatial. Elles consistent à acquérir en une seule fois toute l’information spectrale d’un ou plusieurs pixels. L’acquisition se fait ligne par ligne selon deux techniques différente : pushbroom et wiskbroom. Un capteur wiskbroom possède un miroir qui balaie chaque pixel de la ligne, la lumière reçue est alors projetée à travers un élément dispersif sur une barrette CCD dont chaque cellule correspond à une longueur d’onde. Un capteur pushbroom possède une matrice CCD dont une dimension est la longueur d’onde et l’autre correspond aux pixels de la ligne. La figure 2.3 présente les deux techniques d’acquisition. Après avoir collecté l’information spectrale d’une ligne (mono dimensionnelle) le capteur se déplace pour acquérir la ligne suivante. Cette technique d’acquisition est particulièrement adaptée pour les acquisitions spatiales ou aériennes puisque le capteur se déplace naturellement, elle nécessite des corrections géométriques pour compenser les mouvements du capteur [21].
La troisième technique est l’imagerie hyperspectrale instantanée (snapshot imaging), sans balayage elle permet l’acquisition simultanée de l’information spa-tiale et spectrale. Plusieurs approches sont utilisées, l’une d’entre elles consiste à “découper” l’image en bandes et à réorganiser ces bandes en une seule ligne à l’aide d’un système optique complexe [22]. Une autre méthode utilise une mo-saïque de filtre de façon similaire aux capteurs couleurs classique, comme l’illustre la figure 2.4. Ces techniques sont souvent beaucoup plus complexes à utiliser que les méthodes à balayages pour des résolutions moindres ce qui restreint leur uti-lisation actuelle au domaine de l’astronomie [23, 24].

Modélisation tensorielle des images hyperspectrales

De par la nature de la forme d’acquisition des données hyperspectrales, dans lesquelles chacun des pixels est un vecteur information, les données sont géné-ralement représentées par un cube hyperspectral. En raison de cette représenta-tion cubique, il est tout naturel d’envisager l’utilisation des tenseurs d’ordre 3 comme modèle mathématique pour représenter des images hyperspectrales. Clas-siquement, les dimensions spatiales sont associées respectivement au 1-mode et 2-mode du tenseur et la dimension spectrale est associée au 3-mode du tenseur, voir figure 2.5.
Le déploiement d’un tenseur est une réorganisation sous forme matricielle de ses données selon un mode privilégié. En particulier la matrice dépliante dans le mode spectral (3-mode) où chaque colonne de la matrice dépliante représente le spectre d’un pixel permet une représentation physique concrète des données spectrales de l’image, voir figure 2.6. Les matrices dépliantes dans les modes spatiaux (1-mode et 2-mode) sont plus difficiles à interpréter.
Dans la suite du document nous assimilerons les images hyperspectrales à leurs matrices dépliantes dans le mode spectral.

Problématique du démixage en imagerie hyperspectrale

Les scènes observées sont constituées de différents matériaux qui ont cha-cun un spectre de réflectance spécifique. Chaque pixel de l’image hyperspectale contient une information spectrale qui dépend des matériaux contenus dans le pixel. Il arrive souvent qu’un seul pixel contienne plusieurs matériaux, dans ce cas l’information spectrale observée est un mélange des spectres spécifiques des matériaux.
Une image hyperspectrale peut être interprétée comme d’une part un en-semble de spectres échantillonnés correspondant aux signatures spectrales spéci-fiques, appelés endmembers, de chaque matériau de la scène observée et d’autre part une carte de localisation qui indique la position dans l’image de chacun de ces endmembers. On appelle cette carte : carte d’abondance ; lorsque les pixels contiennent plusieurs matériaux cette carte indique la proportion de chaque end-members dans chacun des pixels.
La problématique de démixage, parfois dîte problématique de démélange, est similaire aux problèmes de séparation de sources, qui consistent à estimer simul-tanément l’ensemble des endmembers présents dans l’image et leur carte d’abon-dance. Pour résoudre ce problème on utilise un modèle de mélange qui décrit la manière dont sont combinés les endmembers dans l’image.

Modèle de mélange linéaire

L’observation de plusieurs matériaux au sein d’un même pixel peut avoir deux origines :
La première est due à la résolution spatiale des capteurs, les matériaux sont séparés spatialement mais occupent une surface de la scène inférieure à celle couverte par un pixel. Dans ce cas, chaque rayon lumineux provenant de la scène n’interagit qu’avec un seul matériau de la surface observée. Le spectre mesuré est alors un mélange linéaire des spectres spécifiques des matériaux de surface, et les coefficients de mélange représentent les proportions surfaciques de chaque constituant.
Dans l’autre cas, la surface observée peut être composée d’une seule entité qui est un mélange intime de plusieurs matériaux, comme par exemple un sable dont les grains ont diverses compositions chimiques. Les rayons lumineux peuvent alors être réfléchis plusieurs fois par des matériaux différents avant d’être renvoyés vers l’instrument de mesure. Ces réflexions multiples conduisent à l’observation d’un spectre qui est un mélange non linéaire des spectres purs des constituants en présence.
Les deux situations sont illustrées par la figure 2.7.
Dans la suite de cette thèse, nous considèrerons uniquement le modèle de mé-lange linéaire qui correspond bien au cas macroscopique. Ce modèle décrit le cas de matériaux spatialement séparés, ce qui peut être vu comme une approximation au premier ordre du modèle de mélange non-linéaire [1]. Les lecteurs intéressés par la modélisation non-linéaire peuvent se reporter aux références [25, 26, 27, 28].
Dans le modèle de mélange linéaire, l’information spectrale acquise par un pixel est une combinaison linéaire des endmembers, pondérés par des coefficients de mélange, appelés abondances, correspondant aux proportions de chaque end-member recherché. L’information spectrale yp correspondant à un pixel p de K X yp = αp,ksk + np (2.1).

État de l’art sur le démixage des HSI

Plusieurs méthodes de démixage ont été proposées dans la littérature pour retrouver les spectres sources (endmembers) ainsi que la matrice d’abondances à partir de l’image hyperspectrale observée [31].
Certaines proposaient d’estimer les spectres sources S dans un premier temps à l’aide d’un algorithme dit d’extraction d’endmembers et d’estimer les abon-dances dans un second temps. C’est le cas des méthodes ayant fait l’hypothèse des « Pixels Purs » qui suppose que chacun des matériaux de l’image doit être pré-sent seul dans au moins un des pixels de l’image. C’est à dire que pour chaque matériau de la scène, il existe au moins un pixel « pur » dont l’information spectrale est identique au spectre spécifique de ce matériau. Parmi les algorithmes utili-sant cette hypothèse on peut citer la méthode Pixel Purity Index (PPI) [32] qui consiste à projeter les pixels sur un ensemble de vecteurs aléatoires et d’utiliser ces projections pour donner un score à chaque pixel. Les pixels avec les scores les plus élevés sont définis comme les pixels les plus purs et sont utilisés comme endmembers. La méthode N-FINDER [33] quand à elle, considère que le simplexe dont les sommets sont les pixels purs à un volume supérieur à un simplexe dont les sommets seraient n’importe quels autres pixels. La méthode consiste alors à construire un simplexe à partir de pixels choisis aléatoirement puis à modifier itérativement ses sommets de sorte à maximiser son volume. La VCA (Vertex Component Analysis) [18] est une méthode qui estime les endmembers de façon itérative. Les pixels sont projetés dans une direction orthogonale au sous-espace engendré par les endmembers déjà estimés. La valeur extrême de cette projection est alors le nouvel endmember. La méthode est itérée jusqu’à atteindre le nombre d’endmembers voulu.
En pratique, cette hypothèse de pixels purs n’est pas totalement vérifiée, plusieurs erreurs d’estimation sont alors commises [34, 35].
D’autres méthodes géométriques, basées sur la minimisation du volume d’un simplexe mais n’utilisant pas l’hypothèse des pixels purs ont été proposées. Les pixels étant décrits par le modèle de mélange comme une combinaison linéaire des endmembers dont les coefficients sont soumis à la contrainte de somme à l’unité, ces pixels se trouvent à l’intérieur d’un simplexe dont les sommets sont les end-members. Dans certain cas, cette contrainte qui impose que les pixels soient à l’intérieur du simplexe peut-être relaxée, ce qui permet, entre autre, de prendre en compte le bruit. L’une de ces méthodes est MVSA (Minimum Volume Sim-plex Analysis) [36] qui permet une estimation des endmembers robuste au bruit en relaxant la contrainte de positivité. La méthode MVSE (Minimum Volume Enclosing Simplex) [37, 38] estime les endmembers comme étant les sommets du simplexe de volume minimum contenant l’ensemble des pixels observés.
D’autres approches ont également été proposées en utilisant des méthodes sta-tistiques comme la Décomposition en Valeurs Singulières (SVD) [39] et l’Analyse en Composantes Principales (PCA) [3]. Ces méthodes permettent d’obtenir les directions principales d’un ensemble des pixels, cependant, ces méthodes n’inter-disent pas l’obtention de valeurs négatives des coefficients des matrices A et S, et par conséquent les résultats obtenus sont peu représentatifs de la réalité des données physiques étudiées. L’Analyse en Composantes Indépendantes (ICA) est une méthode utilisée en séparation aveugle de sources qui a été proposée pour le démixage d’images hyperspectrales [40]. Elle repose sur les hypothèses que les pixels sont des combinaisons linéaires des endmembers pondérés par leurs abon-dances, et que ces abondances sont indépendantes. Dans le cas des images hyper-spectrales, la première hypothèse correspond au modèle de mélange linéaire, mais la contrainte de somme à 1 sur les abondances empêche de satisfaire le critère d’in-dépendances des abondances [41]. Pour résoudre les problèmes rencontrés par ces méthodes un algorithme d’Analyse en Composantes DEpendantes (DECA) [35] a été proposé. Il repose sur une décomposition du signal en prenant en compte les contraintes de positivité des endmembers et abondances, et celle de somme à l’unité des abondances.
Plus récemment, la notion de la Factorisation en Matrices Non-négatives (NMF) [42, 43], issue des mathématiques appliquées, a connu une attention consi-dérable pour le démixage des images hyperspectrales [44, 34, 45]. En effet, étant donnée une matrice non-négative (ici la matrice signal Y), l’objectif de la NMF est de trouver deux matrices non-négatives (A et S) dont le produit est la meilleure approximation possible de la matrice des données. Plusieurs algorithmes NMF permettant d’ajouter des contraintes comme la somme à un des abondances ou pour contraindre la matrice des abondances A à être creuse ont été proposée ces dernières années [46, 19, 47]. Cette méthode sera détaillée dans le chapitre 4

Importance de l’estimation du sous-espace signal

Les images hyperspectrales sont composées de centaines de bandes spectrales mais le nombre d’endmembers est souvent très inférieur au nombre de bandes. Les méthodes de réduction de dimensions ou d’estimation du sous-espace signal cherchent à estimer le sous-espace signal afin de travailler sur cet espace réduit et de dimensions plus faibles que l’espace d’origine des données pour limiter les phénomènes liés aux grandes dimensions. Le démixage hyperspectral est un cas particulier de réduction de dimensions dans lequel les endmembers sont la base vectorielle du sous-espace signal.
Cependant l’estimation du sous-espace signal ne vise pas forcément à trou-ver les endmembers et abondances. La réduction de dimensions peut-être utilisée par exemple pour réduire le bruit ou améliorer la classification. En fonction de l’objectif recherché, les vecteurs de base qui engendrent le sous-espace signal ne sont pas soumis aux même contraintes et ne permettent pas forcement d’obtenir des bases vectorielles ayant un sens physique. Le démixage hyperspectral effec-tue une réduction de dimensions dont les contraintes, comme la positivité et la somme à 1 des abondances, visent à obtenir des endmembers proches des spectres de réflexion des matériaux de la scène.
L’estimation de la dimension du sous-espace signal ou du nombre d’endmembers présents dans une image est une problématique importante dans le traitement de données hyperspectrale [48, 1]. Différentes méthodes peuvent être utilisées pour cette estimation, comme les critère d’estimation d’Akaike (AIC) [49] et Bayesien (BIC) [50], longueur de description minimale (MDL) [51], la méthode d’estima-tion non-biaisée du risque de Stein (SURE) [52, 53, 54] ou encore l’analyse en composante principale (PCA) [55, 56]. De nombreuses méthodes découlent de la décomposition en valeur singulière (SVD) [57] qui utilise les vecteurs singuliers associés aux valeurs propres dominantes pour l’estimation du sous-espace signal. La méthode HySime [58] qui utilise l’importante corrélation entre les différentes bandes spectrales. Ou encore des méthodes tensorielles comme l’approximation par tenseur de rang inférieur (Lower Rank Tensor Approximation) [59].
Plus récemment, des travaux [55, 60, 61] se sont intéressés à l’estimation du sous-espace signal pour des images hyperspectrales contenant des objets de faibles dimensions spatiales, il y est fait mention des difficultés de ces méthodes à conser-ver les données correspondant à ces objets représentés par seulement quelques pixels lors de l’estimation du sous-espace signal rendant alors inefficaces les pré-traitements pour la classification et la détection dans les images hyperspectrales contenant des objets de faibles dimensions spatiales.

Performances de différentes méthodes de démixage dans le cas de l’estimation de pigments de végétaux

Dans cette partie, nous comparons les résultats de différentes méthodes de démixage appliquées à la détection de pigments de végetaux. Nous souhaitons démixer une image de taille 700 par 1000 pixels, contenant 155 bandes spectrales. Cette image est présentée dans la figure 2.8, elle contient plusieurs feuilles dont les pigments principaux sont la chlorophylle, l’anthocyanine et le beta-carotene. Les spectres de réflexion de ces pigments sont présentés dans la figure 2.9
Nous avons utilisé la méthode VCA [18], la méthode de factorisation nonné-gative additive NMF-PG [62], une méthode de NMF multiplicative [63] et une dernière méthode NMF-BPP [64] sur lesquelles nous reviendrons au chapitre 4. La figure 2.10 présente les spectres estimés pour ces trois pigments. La figure 2.11 présente les cartes d’abondances obtenues par ces différentes méthodes.
Nous constatons que les cartes d’abondances obtenues par les différentes mé-thodes de démixage permettent de situer les pigments aux bons endroits.
Nous constatons cependant que les endmembers estimés varient fortement d’une méthode à l’autre. Les spectres de réflexions obtenus par la méthode NMF-PG sont les plus proches de ceux attendus. La NMF semble donc être une méthode adapté dans ce cas de figure, bien plus que VCA, en particulier sous sa forme additive NMF-PG, et retrouve bien les spectres des différents objets (types de feuilles) présents en abondance dans la scène.

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

1 Introduction 
2 Démixage des images hyperspectrales 
2.1 Image Hyperspectrale
2.1.1 Acquisition des images hyperspectrales
2.1.2 Modélisation tensorielle des images hyperspectrales
2.2 Problématique du démixage en imagerie hyperspectrale
2.2.1 Modèle de mélange linéaire
2.2.2 État de l’art sur le démixage des HSI
2.3 Importance de l’estimation du sous-espace signal
2.4 Performances de différentes méthodes de démixage dans le cas de l’estimation de pigments de végétaux
2.5 Conclusion
3 Détection des objets de petite taille 
3.1 Détection en imagerie hyperspectrale
3.1.1 Filtre adaptatif : AMF
3.1.2 Détecteur angulaire : ACE
3.1.3 Détecteur d’anomalie : RX
3.2 Détection des pixels rares par seuillage de l’erreur quadratique de reconstruction
3.2.1 Erreur de reconstruction à partir des endmembers dominants
3.2.2 Critère de seuillage pour détecter les pixels rares
3.3 Détection des pixels rares à partir d’ondelettes
3.3.1 Introduction aux ondelettes
3.3.1.1 La transformée en ondelettes continue
3.3.1.2 La transformée en ondelette discrète
3.3.1.3 Ondelettes pour les signaux multidimensionnels
3.3.2 Détection d’anomalies à partir d’ondelettes
3.3.2.1 Expérimentation sur des données simulées
3.3.2.2 Expérimentations sur des données réelle HYDICE
3.4 Conclusion
4 Démixage en présence de pixels rares 
4.1 Le démixage hyperspectral, un problème d’optimisation
4.1.1 Contrainte de somme à l’unité relaxée
4.1.2 Démixage par la NMF
4.1.2.1 Problème des moindres carrés
4.1.2.2 Problème des moindres carrés contraint
4.1.2.3 Contraintes supplémentaires pour la NMF
4.2 Démixage en présence de pixels rares
4.2.1 NMF avec des endmembers connus a priori
4.2.2 Résultats expérimentaux
4.3 Conclusion
5 Méthode rééchantillonnage Bootstrap 
5.1 Histoire du bootstrap
5.2 Application du bootstrap au démixage hyperspectral
5.3 Étude de la méthode bootstrap
5.3.1 Influence de l’algorithme bootstrap sur le bruit blanc gaussien
5.3.2 Effet du bootstrap sur le démixage
5.3.3 Influence de la présence des pixels originaux dans une image “bootstrapée”
5.4 Étude en présence de pixels rares
5.4.1 Enrichissement de l’image originale par Bootstrap
5.4.2 NMF-BDR
5.4.3 NMF-BR
5.4.4 Résultats comparatifs
5.5 Application sur des données réelles
5.6 Conclusion
6 Conclusion générale et perspectives 
A Image HYDICE 
B Problème d’affectation 
Bibliographie

Télécharger le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *