Construction de la base d’apprentissage
Lโanatomie cytologique est une spรฉcialitรฉ mรฉdicale qui รฉtudie la composition microscopique des cellules. Les prรฉlรจvements sont รฉtalรฉs sur une lame puis fixรฉs et colorรฉs afin de reconnaรฎtre les diffรฉrentes cellules prรฉsentes. Les รฉtalements sont ensuite examinรฉs au microscope par un cytotechnicien afin de repรฉrer les cellules dโintรฉrรชt. Cette รฉtape de lecture de la lame consiste en une รฉvaluation visuelle des cellules prรฉsentes sur une lame cytologique. Le but de cette รฉtape est soit la dรฉtection de cellules anormales ou suspectes, soit la quantification de cellules. Ceci est donc un intรฉrรชt capital pour le pathologiste qui doit รฉtablir un diagnostic fiable et valide. Le faible nombre de cellules anormales observรฉes durant lโanalyse implique une grande concentration du cytotechnologiste. A cause de ce facteur subjectif, quelques erreurs apparaissent et peuvent causer des faux nรฉgatifs.
Une approche prometteuse est dโaider le cytopathologiste dans sa recherche des cellules anormales sur la lame. Un systรจme automatique pourrait contribuer ร la dรฉtection des erreurs dโanalyse pour une meilleure fiabilitรฉ. La premiรจre รฉtape du systรจme est la segmentation automatique des images cytologique qui consiste ร sรฉparer la scรจne image en rรฉgions homogรจnes . Lโutilisation de plusieurs espaces couleur permet une description exhaustive des couleurs car les propriรฉtรฉs de chaque espace couleur sont susceptibles dโรชtre exploitรฉes. Cette description conduit ร des donnรฉes de grande dimensions oรน la possibilitรฉ dโavoir une redondance et une incohรฉrence est รฉlevรฉe lโutilisation dโune mรฉthode de rรฉduction de dimension peut contourner ce problรฉme. Une analyse discriminante linรฉaire (LDA) est rรฉalisรฉe pour extraire les caractรฉristiques discriminantes et pertinentes afin de rรฉduire le temps dโexรฉcution, les redondances et le bruit.
Reprรฉsentation de la couleur
Les systรจmes de primaires
Le systรจme (R,G,B) Dans le domaine de traitement dโimages, les composantes couleur dโun pixel dรฉpendent du camรฉra et du systรจme dโacquisition utilisรฉ. Cela pose diffรฉrents normes mais le systรจme (Rc, Gc, Bc) de la CIE [1] reste nรฉanmoins le systรจme de rรฉfรฉrence. Le systรจme RGB est un systรจme ร trois dimensions qui peut รชtre reprรฉsentรฉ sous la forme dโun cube (figure4.9) dont chaque axe correspond ร une couleur primaire, dโorigine O. La couleur est reprรฉsentรฉ par un point C qui dรฉfinit le vecteur couleur
โ
OC La CIE dรฉfinies autres primaires, par exemple, la norme NTSC qui utilise les primaires fixรฉes par la FCC. La norme allemande PAL fixรฉe par EBU ou ร la norme SECAM.
Le systรจme (X,Y,Z) Les systรจmes(R,G,B) prรฉsentent quelques inconvรฉnients majeurs :
โ Les composantes trichromatiques peuvent prendre des valeurs nรฉgatives.
โ Les valeurs des composantes trichromatiques sont liรฉes ร la luminance qui est une combinaison linรฉaire des composantes trichromatiques.
โ Lโexistence de multitude standards de systรจme (R*,G*,B*).
En 1931, la CIE tente dโรฉtablir un systรจme permet de rรฉsoudre les inconvรฉnients du systรจme (Rc, Gc, Bc) [2], dont les primaires [X], [Y] et [Z], qui sont imaginaires, une de ces primaires reprรฉsente lโinformation de luminance, et toutes les composantes trichromatiques sont positives.
Les systรจmes luminance-chrominance
Les composantes dโun systรจme luminance-chrominance sont รฉvaluรฉes ร partir des composantes trichromatiques R, G et B par une transformation non linรฉaire ou une transformation linรฉaire en utilisant une matrice de passage. La luminance notรฉe L dans le systรจme luminance-chrominance, qui peut avoir plusieurs sens selon la faรงon dont elle est considรฉrรฉe. Les systรจmes luminance-chrominance sont ainsi notรฉs (L, Chr1, Chr2). Ainsi, il existe diffรฉrents types de systรจmes luminance-chrominance :
Les systรจmes perceptuellement uniformes
Judd ร proposer de nouvelles composantes de chrominance qui tentent de rรฉduire les disproportions entre les diffรฉrents ellipses de MacAdam [3]. Ces composantes, notรฉes u et v.
Les systรจmes de tรฉlรฉvision
Les signaux de tรฉlรฉvision sรฉparent lโinformation de luminance de celle de chrominance. Il existe deux principaux systรจmes de tรฉlรฉvision :
Le systรจme (Y,I,Q) Cโest un systรจme dรฉfini par le standard NTSC. On peut rรฉaliser une transformation linรฉaire des composantes trichromatiques du systรจme par lโutilisation dโune matrice de passage .
Le systรจme (Y,U,V) Cโest un systรจme dรฉfini par le standard PAL (norme allemande). Il est aussi possible dโรฉvaluer les composantes trichromatiques ร partir du systรจme (Rc,Gc,Bc) de la CIE en utilisant une matrice de passage.
Les systรจmes perceptuels
Les systรจmes perceptuels ressemblent ร des systรจmes luminance-chrominance puisquโils sont composรฉs dโune information quantifiant la luminance ainsi que de deux informations quantifiant la chrominance. Ces notions mises en รฉvidence en 1909 par A.Henry Munsell Il existe de nombreux systรจmes de ce type dans la littรฉrature telles que : ISH, HSL, HSV, TLS, LCH, LSH, LST, ITS, … Nous distinguons deux familles de systรจmes perceptuels :
Les systรจmes de coordonnรฉes polaires
Cette famille de systรจmes dรฉcomposant lโinformation couleur en un axe de luminance et un plan de chrominance, par transposition des coordonnรฉes cartรฉsiennes en coordonnรฉes polaires .
La premiรจre composante dโun systรจme de coordonnรฉes polaires reprรฉsente lโinformation de luminance L, identique ร la premiรจre composante du systรจme luminance-chrominance correspondant, qui est dรฉfini par lโรฉquation : L = โโ OP โโ = โCHrยฒโ + CHrยฒโ
Les systรจmes humains de perception de la couleur
Dans ce type dโespace, la couleur est dรฉcrite comme lโhomme la qualifie, exprimรฉ par trois composantes forment un systรจme (I,S,T), La premiรจre composante I reprรฉsente lโintensitรฉ correspond ร lโinformation de luminance, ensuite la saturation S reprรฉsente le niveau de coloration, et T la teinte.
Le systรจme (I,S,T) Ce modรจle correspond ร une expression des composantes I, S et T dans le cubeย des couleurs dโun systรจme (R,G,B). Dans cette reprรฉsentation du cube des couleurs, Nous retrouvons lโaxe achromatique qui correspond ร lโaxe dโintensitรฉ dans le systรจme (I,S,T).
Analyse Linรฉaire Discriminante (LDA)
Lโobjectif de lโAnalyse Linรฉaire Discriminante (LDA), est de rรฉduire le nombre de dimensions en prรฉsentant le maximum des donnรฉes. Elle cherche les axes tels que la projection des donnรฉes dans lโespace engendrรฉ par ces axes permette une plus grande discrimination entre les classes .
Apprentissage et classifications supervisรฉes
La prรฉsence dโimages numรฉriques dans des applications devient importante de jour en jour. Plusieurs formalismes existent pour modรฉliser lโinformation issue dโune image ou dโune mesure [15].Ces modรฉlisations posent problรจme au niveau de la taille des donnรฉs, ce problรจme peut รชtre rรฉgler par lโutilisation dโune mรฉthode de rรฉduction de dimension. Nous avons choisit la mรฉthode LDA qui nous permet de rรฉduire la taille des donnรฉes dโimage en combinant les composantes couleurs et donc elle nous facilite la classification.
Notion d’apprentissage
Lโapprentissage automatique (machine-Learning en anglais) est une discipline scientifique, qui est aussi lโun des champs dโรฉtude de lโintelligence artificielle. Lโapprentissage automatique fait rรฉfรฉrence au dรฉveloppement, ร lโanalyse et ร lโimplรฉmentation de mรฉthodes qui permettent ร une machine (au sens large) dโรฉvoluer grรขce ร un processus dโapprentissage, et ainsi de remplir des tรขches quโil est difficile ou impossible de remplir par des moyens algorithmiques plus classiques. Cette notion englobe toute mรฉthode permettant de construire un modรจle de la rรฉalitรฉ ร partir de donnรฉes, soit en amรฉliorant un modรจle partiel ou moins gรฉnรฉral, soit en crรฉant complรจtement le modรจle ou bien capacitรฉ ร amรฉliorer les performances au fur et ร mesure de lโexercice dโune activitรฉ .
Types d’apprentissage
Les algorithmes dโapprentissage peuvent se catรฉgoriser selon le mode dโapprentissage quโils emploient :
Lโapprentissage supervisรฉ
Si les classes sont prรฉdรฉterminรฉes et les exemples connus, le systรจme apprend ร classer selon un modรจle de classement ; on parle alors dโapprentissage supervisรฉ (ou dโanalyse discriminante).
Lโapprentissage non-supervisรฉ
Quand le systรจme ou lโopรฉrateur ne disposent que dโexemples, mais non dโรฉtiquettes, et que le nombre de classe et leur nature nโont pas รฉtรฉ prรฉdรฉterminรฉs, on parle dโapprentissage non supervisรฉ ou clustering.
Lโapprentissage par renforcement
lโalgorithme apprend un comportement รฉtant donnรฉ une observation. Lโaction de lโalgorithme sur lโenvironnement produit une valeur de retour qui guide lโalgorithme dโapprentissage.
Notion de la classification
La classification est une opรฉration de structuration qui vise ร organiser un ensemble dโobservation en groupes homogรจnes et contrastรฉs afin de faciliter lโanalyse des informations et dโeffectuer des prรฉdictions .
Principale mรฉthodes de la classification supervisรฉe
Machine ร vecteurs de support (SVM)
Les machines ร vecteurs support on รฉtรฉ introduites en 1995 par Cortes et Vapnik [17]. Elles sont utilisรฉes dans de nombreux problรจmes dโapprentissage : reconnaissance de forme, catรฉgorisation de texte ou encore diagnostic mรฉdical. Les SVM reposent sur deux notions : celle de marge maximale et celle de fonction noyau. Elles permettent de rรฉsoudre des problรจmes de discrimination non linรฉaire. La marge est la distance entre la frontiรจre de sรฉparation et les รฉchantillons les plus proches appelรฉs vecteurs support. Dans un problรจme linรฉairement sรฉparable les SVM trouvent une sรฉparatrice qui maximise cette marge.
Astuce du noyau
Le cas linรฉairement sรฉparable est peu intรฉressant, car les problรจmes de classification sont souvent non linรฉaires. Pour rรฉsoudre ce point la mรฉthode classique est de projeter les donnรฉes dans un espace de dimension supรฉrieur appelรฉ espace de redescription. Lโidรฉe รฉtant quโen augmentant la dimensionnalitรฉ du problรจme on se retrouve dans le cas linรฉaire vu prรฉcรฉdemment. Nous allons donc appliquer une transformation non linรฉaire ฮฆ(โข) aux vecteurs dโentrรฉe xi tel que xi โ R et ฮฆ(xi) โ R(e > d). Ce changement va conduire ร passer dโun produit scalaire dans lโespace dโorigine xi *xj ร un produit scalaire ฮฆ(xi) โ ฮฆ(xj) dans lโespace de redescription lโastuce est dโutiliser une fonction noyau notรฉe K qui รฉvite le calcul explicite du produit scalaire dans lโespace de redescription. Les fonctions noyaux doivent satisfaire le thรฉorรจme de Mercer. Nous avons alors lโรฉgalitรฉ suivante : k(xi, xj) = ฮฆ(xi) โ ฮฆ(xj)
Un contre tous
Cette approche utilise une architecture parallรจle de k machines ร vecteur de support, une pour chaque classe. Chaque machine ร vecteur de support rรฉsout un problรจme ร deux classes : une classe ฯi (ฯi โ โฆ), et toutes les autres โฆ โ ฯi .ย nous avons M classifieurs binaires, dans cette premiรจre approche M = k . La rรจgle de dรฉcision finale est lโapplication du principe ยซ winner take all ยป. Pour chaque classifieur un score va รชtre รฉtabli et lโรฉtiquette attribuรฉe ร lโentrรฉe xi est celle associรฉe au classifieur qui obtient le meilleur score. Son principal inconvรฉnient est dโeffectuer un apprentissage qui peut รชtre grandement dรฉsรฉquilibrรฉ. Ainsi pour un classifieur ฯi nous pouvons avoir un trรจs petit nombre dโexemples de la classe i et un grand nombre de contre exemples .
Perceptron multi couche
Il y a principalement deux facteurs qui influent sur lโapprentissage. Ce sont la qualitรฉ de lโรฉchantillonnage dโapprentissage(les exemples qui constituent la base dโapprentissage) et la diversitรฉ des valeurs. En effet, le rรฉseau de neurones gรฉnรฉralisera mieux (aura plus de chances de rรฉpondre correctement en lui donnant en entrรฉe des informations non prรฉsentes dans les exemples dโapprentissage) si la qualitรฉ de lโรฉchantillonnage est meilleure et si les donnรฉes des exemples dโapprentissage sont variรฉes. Intuitivement, on est conscient que sโil sait rรฉpondre correctement pour un nombre fini de situations les plus diverses, il sera alors plus proche de ce que lโon veut dans une situation nouvelle.
Conclusion gรฉnรฉraleย
Le problรจme traitรฉ dans ce travail concerne lโamรฉlioration de la classification dโimage dans les conditions dโinsuffisance dโinformations ร priori, dรฉterministes et fiables sur lโรฉtat et la nature de la formation de lโimage ร lโinstant de prise de vue. Notre expรฉrience montre que la combinaison de classifieurs amรฉliore nettement les performances du systรจme de reconnaissance par rapport ร chacun des classifieurs pris isolรฉment, ainsi que le choix de classifieurs est important pour aboutir ร une meilleure performance avec le minimum de classifieurs. Une mรฉthode de combinaison de classifieurs dโimagerie pour une meilleure classification des scรจnes imagรฉes a รฉtรฉ proposรฉe. La thรฉorie de lโรฉvidence est basรฉe sur le principe de combinaison parallรจle des systรจmes rรฉpartis. Elle est gรฉnรฉrale et applicable ร tout type de classifieurs.
|
Table des matiรจres
Introduction gรฉnรฉraleย
1 Reprรฉsentation de la couleur et analyse discriminanteย
1.1 Introduction
1.2 Reprรฉsentation de la couleur
1.2.1 Les systรจmes de primaires
1.2.2 Les systรจmes luminance-chrominance
1.2.3 Les systรจmes perceptuels
1.2.4 Les systรจmes d’axes indรฉpendants
1.3 Synthรจse
1.4 Analyse Linรฉaire Discriminante (LDA)
2 Apprentissage et classifications supervisรฉesย
2.1 Introduction
2.2 Notion d’apprentissage
2.2.1 Types d’apprentissage
2.3 Notion de la classification
2.4 Principale mรฉthodes de la classication supervisรฉe
2.4.1 Machine ร vecteurs de support (SVM)
2.4.2 Rรฉseaux de neurones
2.4.3 Modรจle de mรฉlanges de gaussiennes
2.4.4 Arbres de dรฉcision
2.4.5 Les K plus proches voisins
2.5 Conclusion
3 Fusion de dรฉcisionsย
3.1 Introduction
3.2 Principes et besoins de la combinaison des classifieurs
3.3 Dรฉfinition d’un classifieur dans le cadre de la combinaison
3.4 Mรฉthodes sans apprentissage
3.5 Mรฉthodes avec apprentissage
3.5.1 Approche bayรฉsienne
3.5.2 Thรฉorie de l’รฉvidence
3.6 Conclusion
4 Modรฉlisation de la fusion et expรฉrimentationsย
4.1 Description de la base
4.2 Construction de la base d’apprentissage
4.2.1 Espaces couleur
4.2.2 Construction de la matrice de passage
4.2.3 รtiquetage
4.2.4 รchantillonnage
4.2.5 Base d’apprentissage
4.3 Classifications
4.4 Fusions
4.5 Rรฉsultats et รฉvaluations
4.5.1 Discussion des rรฉsultats
4.5.2 Prรฉsentation de l’interface graphique
Conclusion gรฉnรฉrale
Tรฉlรฉcharger le rapport complet