Indexation d’image par le contenu
Etat de lโart
Introduction
La recherche dโimages par le contenu, ร partir dโun e image requรชte, sโappuie sur la comparaison dโimages, et donc la dรฉfinition dโune mesure de distance entre deux images. Ce travail peut รชtre simplifiรฉ en associant aux images des signatures, ou index, qui les reprรฉsentent de maniรจre plus compacte que leur matrice de pixels. Diverses mรฉthodes ont รฉtรฉ proposรฉes pour construire ces signatures. Nous prรฉsentons dans ce chapitre un panorama des principales mรฉthodes dโindexation dโimages par la caractรฉristique de texture.
Principales mรฉthodes de caractรฉrisation dโimages par la texture
Lโanalyse de la texture permet la dรฉtermination des signatures qui caractรฉrisent lโimage. Plusieurs mรฉthodes caractรฉrisation de la texture ont รฉtรฉ prรฉsentรฉes dans les littรฉratures. Le choix dโune mรฉthode est รฉtroitemenliรฉ ร lโapplication visรฉe. Les principales mรฉthodes de caractรฉrisation de la texture peuvent treรช regroupรฉes dans trois catรฉgories. On distingue : les mรฉthodes statistiques, les mรฉthodes ร base de modรจle et les mรฉthodes frรฉquentielles. Ces mรฉthodes peuvent รชtre รฉtudiรฉes sur toute l’image ou bien sur des rรฉgions prรฉcisรฉes.
Mรฉthodes statistiques
Les mรฉthodes statistiques sont basรฉes sur des รฉvaluations quantitatives de la distribution de nivaux de gris. Elles รฉtudient les relations entre un pixel et ses voisins et dรฉfinissent des paramรจtres discriminants de la texture en se basant sur des outils statistiques. Parmi ces mรฉthodes on peut citer la mรฉthode de dรฉpendance spatiale des niveaux de gris (SGLDM : Spatial Gray Level Dรฉpendance Method) ou matrices de cooccurrences, caractรฉristiques de Tamura, la matrice de longueurde plage), ou dans un domaine transformรฉ telle que (densitรฉ spectrale, mรฉthode des extremaslocaux, mรฉthodes de transformation de Fourier, Karhunen Loeve, etc) [22] [23][24]
Matrice de cooccurrence
La matrice de cooccurrence et une mรฉthode principale dans la caractรฉrisation de la texture. Elle a รฉtรฉ proposรฉe par Haralick et al [25], dans les annรฉes 70. Cette approche consiste ร explorer les dรฉpendances spatiales des textures en construisant dโabord une matrice de cooccurrence basรฉe sur lโorientation et la distance entre les pixels de lโimage. De chacune de ces matrices Haralick a dรฉfini quatorze paramรจtres caractรฉristiques de texture, comme le contraste, lโentropie ou la diffรฉrence inverse des moments [26]. La rรฉussite de cette mรฉthode repose sur le bon choix des paramรจtres qui sont : la taille de la matrice sur laquelle sโeffectuent la mesure, et la distance d qui sรฉpare les deux pixels du motif.
Longueurs de plage
Les longueurs de plage ou iso segments. On appelle une plage un ensemble de pixels consรฉcutifs et dans une direction donnรฉe ayant le รชme niveau de gris. La longueur d’une plage est alors le nombre de pixels pour une plage donnรฉe. L’objet qui caractรฉrise les textures dans cette mรฉthode est alors un ensemble de matrices Pฮธ=(P(i,j)).Chaque cas (i,j) de la matrice Pฮธ contient le nombre de plages de longueur j et de niveau de gris i dans la direction ฮธ.
Tout comme pour les matrices de cooccurrences, cette mรฉthode permet une bonne caractรฉrisation des textures des rรฉgions. Cependant, elle reste relativement lente et est efficace sur des images comportant peu de niveaux de gris. [28] [29].
Mรฉthodes ร base de modรจle
Le principe de ces mรฉthodes et de dรฉcrire la texture par un probabiliste. Celle-ci est alors caractรฉrisรฉe par les paramรจtres de ce modรจle[30] [31].on peut citez :
Modรจles Fractals
Ces mรฉthodes permettent de synthรฉtiser des images rรจst proches de la rรฉalitรฉ. En analyse de texture, la dimension fractale, qui est une mesure du degrรฉ d’irrรฉgularitรฉ d’un objet, dรฉcrit une certaine propriรฉtรฉ de la texture. Le modรจle fractal est basรฉ essentiellement sur l’estimation par des mรฉthodes spatiales de la dimension fractale de la surface reprรฉsentant les niveaux de gris de l’image [27].
Le modรจle autorรฉgressif
Le modรจle autorรฉgressif (AR) considรจre une interaction entre l’intensitรฉ de chaque pixel de l’image et la somme pondรฉrรฉe des intensitรฉde ses voisins. En prenant l’image I comme un champ alรฉatoire, le modรจle AR se dรฉfini par la formule (2.9)
7(8) = 9 + โ>โ@ ;(<)7(8 + <) + =(8) โฆโฆโฆโฆโฆโฆโฆโฆโฆ (2.9)
Ou x est un point de l’image, D dรฉfinit un voisinage, =(8) est une variable Gaussienne de moyenne nulle, 9 est le biais (inutilisรฉe pour la segmentation) etles r;(<), <AB sont les paramรจtres du modรจle. Les diffรฉrentes textures sont caractรฉrisรฉes par les diffรฉrentes dรฉpendances de voisinage, elles-mรชmes reprรฉsentรฉespar les diffรฉrents paramรจtres du modรจle. [29].
Mรฉthodes frรฉquentielles
Ces mรฉthodes sont souvent utilisรฉes en traitement ud signal, permettent dโanalyser une texture en identifiant les diffรฉrentes frรฉquences qui la composent. Parmi elles, on retrouve notamment la transformรฉe de Fourier, les filtres deGabor ainsi que les ondelettes. De faรงon gรฉnรฉrale, laฮป transformation linรฉaire dโune image f est obtenue en calculant la corrรฉlation de f et dโune fonction ฯ donnรฉ dans la formule (2.10) :
Cโโ(8, D) EFG(x,y)dxdy โฆโฆโฆโฆโฆโฆโฆโฆโฆโฆโฆ.. (2.10)
Avec ฮป un ensemble de paramรจtres propre ร et ฯ le complexe conjuguรฉ de la quantitรฉ en argument.
Ces mรฉthodes, prรฉservent ร la fois les informationsglobales et locales. Elles sont bien adaptรฉes aux signaux pรฉriodiques. En effet, les textures sont des signaux quasi pรฉriodiques qui ont une รฉnergie frรฉquentielle localisรฉe [27]. Ces mรฉthodes permettent de caractรฉriser la texture ร diffรฉrentes รฉchelles. Analyser une texture par son spectre frรฉquentiel nous donne beaucoup d’informations sur celle-ci.
โข La transformรฉe de Fourier (TF) permet de passer d’une reprรฉsentation de l’image dans le domaine spatial ร sa reprรฉsentation dans le domaine frรฉquentiel. [32]
โข Transformรฉe Cosinus Discret (DCT) La Transformรฉe encosinus discrรจte ou TCD (de l’anglais : DCT ou Discrรจte Cosine Transform) est une transformation proche de la transformรฉe de Fourier discrรจte (DFT). Le noyau de projection est un cosinus et gรฉnรจre donc des coefficients rรฉels, contrairement ร la DFT, dont le noyau est une exponentielle complexe et qui gรฉnรจre donc des coefficients complexes. La DCT possรจde une excellente propriรฉtรฉde ยซย regroupementย ยป de l’รฉnergie : lโinformation est essentiellement portรฉe par les coefficients basses frรฉquences.
โข Filtre de gabord [33].
โข La transformรฉe en Ondelettes, contrairement ร Fourier, est beaucoup plus prรฉcise et riche en informations et en pertinence [32]. Pour faire face aux difficultรฉs d’analyse des textures naturelles, l’outil espace- frรฉquence et temps-รฉchelle qui semble le plus appropriรฉ est la transformรฉe en ondelettes. Celle-ci permet de prรฉlever des paramรจtres locaux dans le domaine spatial, dans le domaine frรฉquentiel, ร des rรฉsolutions multiples ainsi quedes paramรจtres inter-รฉchelles. De plus, son mode d’investigation, du global vers le dรฉtail, possรจde une similitude avec le systรจme visuel humain. Pour ces nombreuses avantages ; nous nous intรฉressant, dans cette thรจse, ร lโanalyse de la texture par la transformรฉe en ondelette.
Indexation des images ร partir de la transformรฉe en ondelette : Etat de lโart
Dans les annรฉes 1990, aprรจs lโintroduction et lโรฉtablissement de la thรฉorie de la transformรฉe en ondelette, beaucoup de chercheurs oncommencer ร lโutiliser pour lโanalyse de la texture. Le principe et dโappliquer la transformรฉe en ondelette sur lโimage afin dโextraire les coefficients dโondelettes de lโimage ; ensuite la signature est calculรฉ a partir de ces coefficients. Plusieurs mรฉthodes de construction dela signature ร partir des coefficients de la transformรฉe en ondelette ont รฉtรฉ proposรฉs dans laittรฉrature,l on peut les regroupรฉes en deux principales catรฉgories : les approches รฉnergies et approches basรฉes sur les modรจles statistiques, la figure 2-1 illustre les diffรฉrentes approches de caractรฉrisation de la texture par ondelette.
Les approches รฉnergies
Le principe de ces approches consiste ร calculer des g randeurs globales de lโimage ร partir des coefficients dโondelette. La mรฉthode la plus simple et la plus populaire est de former un vecteur dโรฉnergies pour chaque sous bande ร partir des coefficients de transformรฉ en ondelettes [34].Lieu et al [35], propose de calculer la moyenne et la variance pour chaque sous bande en utilisant la transformรฉe en paquet dโondelette. Smeulder et al [36], utilise lโanalyse multi rรฉsolution et crรฉe la signature ร partir des valeurs absolus des coefficients dโondelettes. Dans leur article, Jacobs et al. [37] utilisent lโanalyse multi-rรฉsolution pour crรฉer un index gรฉnรฉrรฉ ร partir des valeurs les plusรฉlevรฉes (en valeur absolue) des coefficients dโondelettes. Mandar et al. [38], quant ร eux, ont proposรฉ une autre technique basรฉe sur le calcul de moments ร partir des coefficients dโondel ettes. De leur cรดtรฉ, Idris et al [39] proposent une technique de quantification vectorielle dans laquelle la comparaison est effectuรฉe sur des vecteurs quantifiรฉs issus des coefficients dโondelette. Saif lZahir [40], a dรฉveloppรฉ un algorithme d’indexation dโimage medicale efficace, la signature est construite en utilisant la corrรฉlation des coefficients dโondelette. Rajakumar [41] propose une nouvelle signature pour les images mรฉdicales construites directement ร partir des รฉnergies coefficients dโondelette. Hivashankar [42] proposent de calculer la matrice de cooccurrence, ensuite la lโanalyse composante principale (PCA) et l’Analyse Discriminant Linรฉaire (LDA) est appliquรฉe pour sรฉlectionnรฉ et rรฉduire la taille duvecteur caractรฉristique.
Les approches basรฉes sur les modรจles statistiques
Le principe de ces mรฉthodes est de tracer des histogrammes des coefficients de la transformรฉe en ondelette et de les modรฉliser par des lois statistiques. La signature est calculรฉe ร partir dโune estimation des paramรจtres du modรจle statistique. On distingue deux type distribution: la gaussienne gรฉnรฉralisรฉ et la mixture de gaussienne gรฉnรฉralisรฉ.
Do et al [43] propose une mรฉthode de caractรฉrisation de la texture basรฉ sur la distribution globale des coefficients dโondelette, la signature est construite a partir des paramรจtres dโรฉchelle et de forme de la gaussienne.Gwรฉnole [44] ร appliquer la gaussienne gรฉnรฉralisรฉ aux images mรฉdicales rรฉtiniennes et mammographie. Allili [45], propose dโutilisรฉ la mixture de la gaussienne gรฉnรฉralisรฉ.
Mรฉthodes de rรฉduction de dimension des donnรฉes
La rรฉduction de dimension permet de transformer lesdonnรฉes reprรฉsentรฉes dans un espace de grande dimension en une reprรฉsentation dans une espace de dimension inferieur. Plusieurs mรฉthodes de rรฉduction des donnรฉes sont รฉsentรฉespr dans la littรฉrature. Elles peuvent รชtre regroupรฉes en deux principales catรฉgories :
โข Les mรฉthodes linรฉaires telles que (lโAnalyse en Composantes Principales (ACP) [46], la factorisation nonโnรฉgative de matrices (NMF) [47], lโAnalyse en Composantes Indรฉpendantes (ICA) [48] et lโAnalyse Discriminante Linรฉaire (LDA) [49].
โข Les mรฉthodes non linรฉaires telles que (Kernel PCA 50],[ multidimensional scaling (MDS) [51]), Locally Linear Embedding (LLE) [52].
La rรฉduction de dimension est utilisรฉ dans de nombreux domaines ; telle que la compression donnรฉes de grande dimension.la classification. Dans notre cas, la rรฉduction des donnรฉes est utilisรฉe pour rรฉduire la taille des grandes signatures en utilisant lโAnalyse en Composante Principale.
Analyse en composante principaleย
LโAnalyse en Composantes Principales (ACP) [53], aussi connue sous le nom de transformรฉe de KarhunenโLoรจve [54] est une mรฉthodetrรจs utilisรฉe en statistique. Introduite par Pearson [54] puis plus tard par Hotelling [46], sa principale idรฉe est de rรฉduire la dimension dโun jeu de donnรฉes tout en gardant un maximum dโinformations. Cela est rรฉalisรฉ grรขce ร une projection qui maximise la variance tou t en minimisant lโerreur quadratique moyenne de la reconstruction.
Ainsi, le maximum pour le multiplicateur de Lagrange est obtenu si ฮป est une valeur propre et u un vecteur propre de C. Ainsi la variance dรฉcrite par le vecteur de projection u est donnรฉe parฮป.
Pour la mise en ลuvre de mรฉthodes batch, il est sup posรฉ que le jeu de donnรฉes dโentraรฎnement est disponible en entier. Ainsi nous avons un ensemble de n observations xi ั RD organisรฉs sous forme matricielle X =[x1;โฆโฆ.;x n] ัRD x n . Lโestimation de la base de projection de lโACP revient donc ร estimer les รฉlรฉments propres de la matrice de covariance C de X.
|
Table des matiรจres
Introduction gรฉnรฉrale
Chapitre 1: Indexation d’image par le contenu
I. Introduction
II. Principe gรฉnรฉral de lโindexation et de la recherche dโinformation
III. Les systรจmes de recherche dโimages
IV. Les principales approches pour lโindexation dโimages
V. Architecture des systรจmes dโindexation par contenu
VI. Principales techniques dโindexation par contenu
VI.1. Indexation dโimages ร lโaide de caractรฉristiques bas niveaux
a) Couleur
b) Texture
c) Forme
VI.2. Indexation dโimages ร lโaide de caractรฉristiques haut niveaux
VII. La recherche dโimages par contenu dans le domaine mรฉdical
VIII. Quelques systรจmes CBIR mรฉdicaux existants
IX. รvaluation des mรฉthodes de recherche dโinformation
X. Description des bases de Donnรฉes utilisรฉes
X.1 Base dโimages ยซMESSIDORยป
X.2 Base dโimages cervicale
X.3 Base dโimages mรฉlanome
XI. Conclusion
Chapitre 2 : Etat de l’art
I. Introduction
II. Principales mรฉthodes de caractรฉrisation dโimages par la texture
II.1 Mรฉthodes statistiques
II.1.1 Matrice de cooccurrence
II.1.2 Longueurs de plage
II.2 Mรฉthodes ร base de modรจle
II.2.1Modรจles Fractals
II.2.2 Le modรจle autorรฉgressif
II.3 Mรฉthodes frรฉquentielles
III. Indexation des images ร partir de la transformรฉe en ondelette : Etat de lโart
III.1 Les approches รฉnergies
III.2 Les approches basรฉes sur les modรจles statistiques
IV. Mรฉthodes de rรฉduction de dimension des donnรฉes
IV.1 Analyse en composante principale
IV.2 Choix du nombre de composante principale
IV.2.1 Critรจres Heuristiques
IV.2.2 Critรจre de validation croisรฉe
V. Conclusion
Chapitre 3 : La transformรฉe en ondelette
I. Introduction
II. La Transformรฉe de Fourier (TF)
III. Transformรฉe de Fourier Fenรชtrรฉe (STFT)
IV. Transformรฉe en ondelettes
IV.1 Dรฉfinition dโune ondelette
V. Transformรฉe en ondelettes continue CWT
VI. Transformรฉe en ondelettes discrรจte DWT
VII. Analyse multiresolution
VIII. Transformรฉe en ondelette 2 D
IX. Transformรฉe en ondelette rapide 2D
X. Propriรฉtรฉs Fondamentales dโune Ondelette
XI. Ondelette bi-orthogonalitรฉ
XII. Le lifting
XII.1 Lโondelette Bi orthogonal Cohen-Daubechies-Feauveau CDF 9/7
XIII. Propriรฉtรฉs du schรฉma de lifting [80]
XIV . Conclusion
Chapitre 4 : Nouvel algorithme d’indexation d’images par le contenu
I. Introduction
II. Indexation dโimages ร partir des รฉnergies
III. Indexation dโimages ร partir de la gaussienne gรฉnรฉralisรฉe
III.1 Principe de la mรฉthode
III.2 Loi gaussienne gรฉnรฉralisรฉe
III.2.1 Mesure de distance entre deux distributions gaussiennes gรฉnรฉralisรฉes
IV. Comparaison entre les diffรฉrentes approches
V. Algorithme proposรฉ
V.1 Prรฉtraitement
V.2 Principe de l’algorithme
VI. Mesure de similaritรฉ
VII. Rรฉsultats
VIII. Influence de lโondelette utilisรฉ dans la dรฉcomposition des images
IX. Influence du nombre de niveaux de dรฉcomposition pour lโindexation dโimage
X. Amรฉlioration des performances du system proposรฉ
X.1 Indexation des images mรฉdicales basรฉe sur le schรฉma de lissage
X.2. Indexation des images mรฉdicales basรฉe sur le Pourcentage de variance cumulรฉ
XI. Comparaison entre plusieurs approches de la littรฉrature
XII. Conclusion
Conclusion gรฉnรฉrale
Tรฉlรฉcharger le rapport complet