Techniques dโacquisition active
ย ย La technique active est la plus utilisรฉe pour lโacquisition de la forme 3D du visage. Elle consiste ร combiner un capteur photographique (ou plusieurs) avec une source lumineuse spรฉcifique contrรดlรฉe, afin de mesurer les coordonnรฉes 3D des objets de la scรจne observรฉe. Diffรฉrents systรจmes dโacquisition active ont รฉtรฉ รฉlaborรฉs, nous prรฉsentons ici les plus connus.
โ Scanners laser : le laser consiste en une lumiรจre monochromatique que lโon projette afin dโรฉclairer une tranche de la scรจne observรฉe par une camรฉra associรฉe au dispositif. Ceci permet de calculer la position dans lโespace de la tranche de scรจne captรฉe en se basant sur le principe de la triangulation active [21]. La triangulation permet de dรฉterminer la position dโun point en mesurant les angles entre ce point et dโautres points de rรฉfรฉrence (le projecteur de lumiรจre et la camรฉra) dont la position est connue. Le laser a รฉtรฉ beaucoup utilisรฉ pour lโacquisition 3D de visages humains dans des applications diffรฉrentes. Une collection de visages 3D a รฉtรฉ publiรฉe dans le cadre de lโรฉvaluation FRGC (Face Recognition Grand Challenge) [110], comportant des vues frontales des visages et intรฉgrant les deux type de donnรฉes, 2D et 3D, pour chaque sujet acquis par un scanner laser de type VI900/910 de Konica Minolta. Lโobjectif du projet est lโรฉvaluation des approches de reconnaissance faciale 2D et 3D sur un corpus dโimages de taille significative (un total de 4007 modรจles 3D) et riche en variations dโรฉclairage et dโexpressions faciales. Les dispositifs laser prรฉsentent de bonnes performances dโacquisition en termes de prรฉcision et de rรฉsolution. Cependant, quelques difficultรฉs comme les occultations et lโabsorption de la lumiรจre par la surface, notamment dans les rรฉgions pileuses du visage (sourcils, barbe, moustache) et les rรฉgions des yeux, peuvent affecter les rรฉsultats de lโacquisition. Par ailleurs, ces รฉquipements sont trรจs onรฉreux et nรฉcessitent la coopรฉration des personnes qui doivent rester un certain temps face au scanner en bougeant le moins possible afin dโacquรฉrir le modรจle 3D. Ceci limite leur utilisation ร un nombre restreint dโapplications.
โ Systรจmes basรฉs sur la lumiรจre structurรฉe : ce type de technique active consiste ร projeter une lumiรจre ร motifs structurant sous forme de grille ou des bandes de lumiรจre parallรจles. Les motifs sont capturรฉs par la camรฉra associรฉe. Il sโensuit une รฉtape dโanalyse de la dรฉformation de ces motifs par rapport ร leur forme rectiligne dโorigine, permettant dโobtenir la gรฉomรฉtrie des objets de la scรจne. Diffรฉrentes mรฉthodes basรฉes sur la projection de motifs lumineux ont รฉtรฉ proposรฉes. Chaque approche propose un schรฉma de lumiรจre couplรฉ ร une mรฉthode de mise en correspondance pour la reconstruction de la forme 3D. Un รฉtat de lโart dรฉtaillรฉ sur ces mรฉthodes a รฉtรฉ prรฉsentรฉ dans [115]. Quelques collections de visages ont รฉtรฉ construites en se basant sur cette technique pour lโรฉvaluation des mรฉthodes dโanalyse de visages 3D, comme la collection 3DRMA [17], contenant des visages 3D de 120 sujets.
โ Systรจmes basรฉs sur le temps de vol (time-of-light, TOF) : ils se composent de LED ou de diodes lasers ayant la capacitรฉ de gรฉnรฉrer des impulsions de lumiรจre trรจs rapides , et un dโun capteur capable de mesurer le ยซย temps de volย ยป (de lโordre de la nanoseconde), cโest-ร -dire le temps que cette impulsion met pour effectuer le trajet aller-retour entre la camรฉra et lโobjet. Le ยซย temps de volย ยป de cette impulsion est directement proportionnel ร la distance entre la camรฉra et lโobjet mesurรฉ. Ceci permet ainsi dโobtenir une image complรจte de profondeur de lโobjet mesurรฉ. Un exemple de ces systรจmes est la camรฉra SR4000 conรงue par la sociรฉtรฉ MESA IMAGING.
โ Systรจmes basรฉs sur la lumiรจre infrarouge : le principe de ces systรจmes consiste ร illuminer une scรจne par une lumiรจre infrarouge, et ensuite ร mesurer la quantitรฉ de la lumiรจre incidente rรฉflรฉchie par les objets. Lโhypothรจse faite est que plus cette quantitรฉ est grande, plus lโobjet est proche de la camรฉra, et inversement. Le capteur Kinect, mis au point par Microsoft, est lโexemple le plus connu de cette catรฉgorie.
Les modรจles 3D
ย ย Ces mรฉthodes consistent ร utiliser un modรจle 3D afin de reconstruire la forme 3D du visage ร partir dโune image 2D. Un modรจle 3D, appelรฉ 3D morphable model (3DMM), permettant de reprรฉsenter la forme du visage a รฉtรฉ proposรฉ par Blanz et Vetter [22]. Le 3DMM est ร lโorigine de plusieurs travaux de reconstruction 3D du visage [22, 9, 114, 143, 86]. ร partir dโune grande collection de scans 3D de visages alignรฉs, les auteurs ont construit un modรจle statistique du visage en termes de forme et de texture. La forme et la texture sont dรฉcrites de maniรจre vectorielle, et une ACP est appliquรฉe sur les deux espaces (forme, texture) indรฉpendamment. Les principaux axes de dรฉformation sont caractรฉrisรฉs par les vecteurs propres. De nouveaux visages peuvent donc รชtre dรฉcrits par une combinaison linรฉaire de ces vecteurs, pondรฉrรฉs par un ensemble de paramรจtres. Ces paramรจtres peuvent รชtres estimรฉs par diffรฉrentes mรฉthodes dโoptimisation [22, 9, 114] cherchant ร minimiser la diffรฉrence entre lโimage 2D du visage et lโimage synthรฉtisรฉe ร partir de son modรจle.ย Dโautres chercheurs ont proposรฉ dโutiliser la silhouette du visage au lieu dโune simple image, comme Wang et al. [143]. Une silhouette est un contour, une forme ou lโombre projetรฉe par un objet. Elle fournit des donnรฉes prรฉcises et robustes pour la reconstruction car elle ne dรฉpend que de la forme et de la pose du visage et elle est indรฉpendante de lโรฉclairage. Lโapproche proposรฉe par Wang et al. [143], ainsi que celle proposรฉe par Lee et al. [86] se basent toutes les deux sur lโutilisation des images de silhouette pour lโรฉtape dโajustement dโun modรจle dรฉformable. Lโidรฉe de ces deux approches est similaire ร la mรฉthode de Blanz et Vetter [22], sauf quโau lieu dโutiliser une seule photo, elles se concentrent sur lโacquisition de la gรฉomรฉtrie relativement prรฉcise dโun visage ร partir de plusieurs images de silhouette. Le problรจme rencontrรฉ par les mรฉthodes basรฉes sur les modรจles dรฉformables est que lโalgorithme dโoptimisation peut converger vers une solution trรจs proche de la valeur initiale, entraรฎnant une reconstruction qui ressemble au modรจle gรฉnรฉrique plutรดt quโau visage particulier qui doit รชtre modรฉlisรฉ. Ainsi, cette mรฉthode peut donner de trรจs bons rรฉsultats lorsque le modรจle gรฉnรฉrique prรฉsente des similaritรฉs significatives avec le visage ร reconstruire. Toutefois, si les caractรฉristiques du modรจle gรฉnรฉrique sont trรจs diffรฉrentes de celles du visage en cours de reconstruction, le modรจle obtenu est susceptible de ne pas reprรฉsenter fidรจlement ce visage. Un autre inconvรฉnient est la nรฉcessitรฉ dโune initialisation manuelle afin de faciliter la convergence du systรจme. En effet, en raison des minima locaux de la procรฉdure dโoptimisation utilisรฉe pour lโestimation des paramรจtres du modรจle, il est nรฉcessaire dโinitialiser cette procรฉdure ร proximitรฉ de la solution optimale. Un autre modรจle appelรฉ CANDIDE-3 [3] a รฉtรฉ utilisรฉ dans certains travaux de reconstruction de visages en raison de sa simplicitรฉ et de sa disponibilitรฉ publique. Le modรจle CANDIDE-3 reprรฉsente la forme dโun visage par un maillage 3D composรฉ de 113 sommets. La formule gรฉnรฉrale dรฉcrivant le modรจle CANDIDE-3 est donnรฉe par deux ensembles : les Shape Units (SU) et les Actions Units (AU). Les SU permettent dโadapter le modรจle 3D ร la physionomie dโune personne. Les AU codent les modifications physiques dโun visage issues de lโactivation de muscles faciaux. Elles permettent de reproduire et de sโadapter aux expressions dโun visage. Quelques mรฉthodes sont basรฉes sur ce modรจle [81, 127, 128] pour la reconstruction 3D du visage. Cependant, ce modรจle est gรฉnรฉralement utilisรฉ comme une รฉtape prรฉliminaire dโobtention dโune reprรฉsentation 3D grossiรจre du visage, et il nโest donc pas adaptรฉ ร la reconstruction pour lโidentification, mais plutรดt ร dโautres applications comme lโanimation du visage.
Structure ร partir du mouvement (SfM)
ย Cette technique a pour but lโextraction de la forme dโune scรจne ร partir des changements spatiaux et temporels qui se produisent dans une sรฉquence dโimages, en exploitant le mouvement relatif entre la camรฉra et la scรจne. Le processus de Shape from Motion (SfM) consiste en deux รฉtapes : la mise en correspondance entre les images, et lโestimation du mouvement et de la structure. La correspondance entre les images peut รชtre obtenue par des mรฉthodes diffรฉrentielles [166] ou des mรฉthodes basรฉes sur les primitives dโintรฉrรชts (points, lignes, contours, etc.) [149]. La premiรจre catรฉgorie de mรฉthodes fournit des mesures denses sur le mouvement apparent (mouvement 2D) en utilisant les dรฉrivรฉes temporelles, et nรฉcessite une sรฉquence dโimages sรฉparรฉes par de petits intervalles de temps. Les mรฉthodes de la deuxiรจme catรฉgorie cherchent ร รฉtablir une correspondance entre les points dโintรฉrรชts se trouvant dans des images successives. Ceci peut รชtre fait par des mรฉthodes de corrรฉlation ou bien par des mรฉthodes de suivi comme les filtres de Kalman [77]. La reconstruction et lโestimation du mouvement sont ensuite obtenues par diffรฉrentes mรฉthodes dโoptimisation [95]. La mรฉthode de factorisation, proposรฉe par Kanade [76] a รฉtรฉ aussi utilisรฉe pour rรฉsoudre ce problรจme. Pour ce faire, la matrice engendrรฉe par les correspondances calculรฉes entre les images est dรฉcomposรฉe en un produit de deux facteurs sรฉparรฉs : la forme et le mouvement. Le principe de SfM a รฉtรฉ appliquรฉ pour la reconstruction de visages dans les travaux de Brand et al. [27], Jebara et al. [73] et Torresani et al. [135]. Par ailleurs, dans [35], Chowdhury et al. ont proposรฉ une mรฉthode couplant la technique SfM et un modรจle gรฉnรฉrique du visage. Deux images dโune sรฉquence vidรฉo fournies en entrรฉe ร lโalgorithme SfM. La reconstruction 3D obtenue ร partir de lโalgorithme SfM est fusionnรฉe avec le modรจle gรฉnรฉrique afin de corriger les รฉventuelles fausses estimations. Les auteurs ont montrรฉ que cette combinaison permet dโobtenir une reconstruction plus prรฉcise. Par rapport aux mรฉthodes basรฉes sur les modรจles, ces mรฉthodes ne nรฉcessitent pas lโoptimisation des paramรจtres dโun visage 3D moyen. Par consรฉquent, elles permettent de gรฉnรฉrer un modรจle 3D spรฉcifique ร la personne en question. Cependant, la qualitรฉ de la reconstruction de visages 3D ร partir de deux ou plusieurs images en utilisant la technique SfM est souvent insuffisante. Ceci est liรฉ ร lโรฉtape de mise en correspondance entre les images qui est trรจs sensible ร la qualitรฉ des images, lโhomogรฉnรฉitรฉ des surfaces et les occultations.
Structure ร partir des ombres portรฉes (SfS)
ย ย La technique de Shape from Shading (SfS) est une mรฉthode de reconstruction passive qui met en relation les niveaux de gris dโune image et le relief de la scรจne observรฉe. Elle a รฉtรฉ dรฉveloppรฉe par Horn [63] et depuis, de nombreuses approches diffรฉrentes ont รฉmergรฉ. Cette technique permet dโestimer la forme 3D dโun objet en analysant les variations progressives de lโombrage dans lโimage. Pour expliciter les fondements de SfS, il est nรฉcessaire dโรฉtudier la faรงon dont les images sont formรฉes. Le niveau de gris dโun pixel dans une image reprรฉsente la brillance de la scรจne en ce point. Celle-ci dรฉpend de trois facteurs : lโรฉclairage de la scรจne, lโorientation de la surface et ses propriรฉtรฉs de rรฉflectance. Lorsquโon ne dispose que dโune image de la scรจne, le niveau de gris lu dans lโimage constitue la seule donnรฉe, ce qui rend la rรฉsolution du problรจme trรจs complexe. Afin de rรฉduire le nombre dโinconnues du systรจme, quelques hypothรจses sont รฉtablies [161] :
โ รฉclairage : la scรจne est รฉclairรฉe par une source lumineuse unique, รฉmettant un flux lumineux parallรจle et uniforme, ou bien par plusieurs sources lumineuses suffisamment รฉloignรฉes. Lโillumination est donc approximativement uniforme sur toute la surface ;
โ rรฉflectance : la rรฉflectance de la scรจne, qui dรฉcrit la maniรจre dont la lumiรจre est reflรฉtรฉe, est connue. On suppose gรฉnรฉralement que la rรฉflectance des surfaces ร รฉtudier est homogรจne et de type diffuse ;
โ modรจle de formation : le modรจle de formation de lโimage est Lambertien, cโest-ร -dire que le niveau de gris dโun pixel de lโimage ne dรฉpend que de la direction de la source de lumiรจre et de la normale ร la surface ;
โ propriรฉtรฉs de la surface : la surface est lisse, non texturรฉe et complรจtement visible (sans occultation). Le calcul de la normale en tout point de la surface sโeffectue alors, grรขce ร une fonction de minimisation entre la brillance rรฉelle de la scรจne et la brillance obtenue par estimation de la carte de rรฉflectance. Plusieurs mรฉthodes ont รฉtรฉ proposรฉes pour la reconstruction 3D du visage par la technique SfS [8, 122, 88]. Des a priori sur la forme du visage ont รฉtรฉ introduits dans [8, 122] en utilisant un modรจle statistique de la forme du visage afin de renforcer le processus SfS utilisรฉ. Aux points dโoccultation, les algorithmes SfS ne parviennent pas ร dรฉterminer tous les paramรจtres de la surface. Une faรงon dโรฉviter ce problรจme est dโestimer la profondeur ร partir dโimages prises ร partir de plusieurs points de vue [48]. Bien que le SfS ait montrรฉ une efficacitรฉ satisfaisante pour la reconstruction 3D, il est basรฉ sur plusieurs hypothรจses fortes qui limitent son efficacitรฉ. La mise en ลuvre de SfS nรฉcessite la connaissance prรฉcise des propriรฉtรฉs de rรฉflexion et dโรฉclairage, et est susceptible de donner de mauvais rรฉsultats en raison de certaines hypothรจses irrรฉalistes รฉtablies sur les propriรฉtรฉs de la surface et lโรฉclairage.
Post-traitement de la carte de profondeur du visage
ย ย La carte de profondeur estimรฉe contient gรฉnรฉralement des artefacts produits par des erreurs de mise en correspondance et des incertitudes. Par consรฉquent, il est souvent nรฉcessaire de recourir ร une รฉtape de post-traitement afin de les รฉliminer. Deux types dโartefacts sont possibles dans la carte de profondeur :
โ valeurs manquantes : aucun pixel correspondant nโest trouvรฉ. La disparitรฉ du pixel reste donc indรฉfinie et la valeur de profondeur ne peut pas รชtre calculรฉe. Ces valeurs sont reprรฉsentรฉes par des trous dans la carte de profondeur ;
โ valeurs erronรฉes : la position du pixel correspondant est erronรฉe. La disparitรฉ estimรฉe est donc diffรฉrente ร la disparitรฉ rรฉelle (supรฉrieure ou infรฉrieure). Un bruit est donc prรฉsent dans la carte de profondeur .Dans lโรฉtat de lโart, diffรฉrentes mรฉthodes ont รฉtรฉ proposรฉes pour le dรฉbruitage de la carte de profondeur. Afin de traiter les donnรฉes manquantes, il sโagit de trouver le paramรฉtrage appropriรฉ qui permet la reconstruction de ces donnรฉes ร lโaide des donnรฉes disponibles (voisinage). Ceci est gรฉnรฉralement rรฉalisรฉ par un algorithme dโinterpolation linรฉaire ou cubique [74, 15, 66, 147, 47]. Le traitement des donnรฉes erronรฉes consiste souvent en lโapplication des filtres de rรฉduction de bruit sur la carte de profondeur. Le filtre mรฉdian est couramment appliquรฉ afin de dรฉbruiter et lisser les valeurs de profondeur [74, 15, 66, 47]. Dans [147], Wang et al. ont utilisรฉ trois filtres gaussiens avec des variances diffรฉrentes pour enlever les pics, remplir les petits trous et lisser les donnรฉes. Lโavantage de ces mรฉthodes est quโelles peuvent rรฉduire le bruit de diffรฉrentes tailles en adaptant les paramรจtres du filtre. Cependant, elles traitent la carte de profondeur globalement, et peuvent ainsi causer la perte des donnรฉes exactes, car elles affectent toute lโimage (incluant les pixels avec une valeur de profondeur correcte). Afin de pallier ce problรจme, une approche consiste ร dโabord ร identifier les valeurs erronรฉes et ensuite ร les corriger de la mรชme maniรจre que les donnรฉes manquantes. Afin de dรฉtecter ces valeurs erronรฉes, une mรฉthode consiste ร parcourir la carte de profondeur et ร appliquer un seuillage sur la valeur absolue entre la valeur de profondeur dโun pixel et la valeur mรฉdiane de son voisinage. Seulement quand ce seuil est dรฉpassรฉ, le pixel est identifiรฉ comme un bruit [98]. La dรฉtection du bruit permet un dรฉbruitage plus prรฉcis de la carte de profondeur et prรฉserve ainsi les donnรฉes correctes. Cependant, si la zone bruitรฉe est grande, le bruit devient plus difficile ร dรฉtecter. En effet, dans ce cas de figure, lโinformation de profondeur du voisinage est รฉgalement bruitรฉe.
Approches bimodales 2D-3D
ย ย Afin dโaugmenter la prรฉcision et la robustesse des systรจmes de reconnaissance faciale, de nouvelles mรฉthodes bimodales 2D-3D, dites de fusion, ont รฉtรฉ rรฉcemment dรฉveloppรฉes [26, 1]. Lโobjectif de ces mรฉthodes est de combiner lโinformation visuelle (image 2D) et lโinformation 3D correspondante (modรจle 3D ou image de profondeur du visage) afin de tirer parti des avantages et de la complรฉmentaritรฉ des deux modalitรฉs. Lโimage 2D fournit des informations sur les rรฉgions texturรฉes du visage avec peu de structure gรฉomรฉtrique (comme les poils du visage, les yeux et les sourcils), tandis que les donnรฉes 3D fournissent des informations sur les rรฉgions oรน il y a peu de texture (comme le nez, le menton ou les joues). La fusion de ces deux modalitรฉs est donc susceptible dโamรฉliorer la prรฉcision et la robustesse des mรฉthodes de reconnaissance faciale. La fusion 2D-3D peut intervenir ร diffรฉrents niveaux du processus de reconnaissance. Trois stratรฉgies de fusion peuvent รชtre considรฉrรฉes selon le niveau auquel elles interviennent lors du processus de reconnaissance [59] :
โ la fusion de donnรฉes brutes : elle consiste ร combiner les donnรฉes provenant directement des capteurs afin de construire de nouvelles donnรฉes.
โ la fusion de descripteurs : elle consiste ร modรฉliser les donnรฉes de chaque modalitรฉ sรฉparรฉment. Les vecteurs caractรฉristiques extraits ร partir des donnรฉes de chaque modalitรฉ sont ensuite fusionnรฉs afin dโen construire un seul qui va รชtre utilisรฉ lors de lโapprentissage et de la mise en correspondance.
โ la fusion de dรฉcisions : elle intervient aprรจs lโรฉtape de classification. Un classifieur par modalitรฉ est donc construit et leurs sorties respectives sont ensuite combinรฉes. Les Figures 3.9, 3.10 et 3.11 illustrent les trois stratรฉgies possibles pour la fusion lors de lโรฉtape de test. Les mรฉthodes de fusion peuvent aussi รชtre classรฉes selon quโelles interviennent avant ou aprรจs lโรฉtape de classification [117]. On parle donc de fusion prรฉcoce (fusion de donnรฉes ou de descripteurs) ou tardive (fusion de dรฉcisions).
|
Table des matiรจres
I Introduction, problรฉmatique et รฉtat de lโartย
1 Introductionย
1.1 Contexte
1.2 Processus gรฉnรฉral de la reconnaissance de visages
1.3 Problรฉmatique
1.4 Objectif et contributions
1.5 Plan de la thรจse
2 Acquisition de la forme 3D du visageย
2.1 Introduction
2.2 Techniques dโacquisition active
2.3 Techniques dโacquisition passive par reconstruction 3D
2.3.1 Les modรจles 3D
2.3.2 Structure ร partir du mouvement (SfM)
2.3.3 Structure ร partir des ombres portรฉes (SfS)
2.3.4 La stรฉrรฉovision
2.4 Reconstruction basรฉe sur la stรฉrรฉovision
2.4.1 Principe gรฉnรฉral
2.4.2 Approches existantes
2.4.3 Reconstruction stรฉrรฉoscopique : le cas du visage
2.4.4 Post-traitement de la carte de profondeur du visage
2.5 Conclusion et positionnement
3 Reconnaissance de visagesย
3.1 Introduction
3.2 Approches de reconnaissance 2D
3.2.1 Mรฉthodes globales ou holistiques
3.2.2 Mรฉthodes locales
3.2.3 Mรฉthodes hybrides
3.2.4 Synthรจse
3.3 Approches de reconnaissance 3D
3.3.1 Mรฉthodes dโalignement
3.3.2 Mรฉthodes basรฉes sur des propriรฉtรฉs gรฉomรฉtriques
3.3.3 Mรฉthodes de rรฉduction de dimensionnalitรฉ
3.3.4 Mรฉthodes basรฉes sur les modรจles 3D
3.3.5 Synthรจse
3.4 Approches bimodales 2D-3D
3.4.1 Fusion de donnรฉes brutes
3.4.2 Fusion de descripteurs
3.4.3 Fusion de dรฉcisions
3.4.4 Choix de la stratรฉgie de fusion
3.4.5 Synthรจse
3.5 Reconnaissance 3D basรฉe sur les motifs binaires locaux
3.5.1 Principe
3.5.2 LBP pour la reconnaissance de visages 2D
3.5.3 Extensions aux visages 3D
3.6 Conclusion et positionnement
II Approche proposรฉe pour la reconstruction et la reconnaissance de visagesย
4 Aperรงu global de lโapproche bimodale 2D-3D de reconnaissance de visagesย
4.1 Introduction
4.2 Acquisition
4.3 Reconnaissance
4.4 Fusion
4.5 Conclusion
5 Reconstruction 3D du visageย
5.1 Introduction
5.2 Reconstruction stรฉrรฉoscopique basรฉe sur la structure topologique du visage
5.2.1 Construction du modรจle de disparitรฉ
5.2.2 Calcul de la carte de disparitรฉ
5.3 Post-traitement : dรฉbruitage de la carte de profondeur
5.3.1 Dรฉtection du bruit
5.3.2 Suppression du bruit
5.4 Conclusion
6 Reconnaissance bimodale 2D-3Dย
6.1 Introduction
6.2 Extraction des descripteurs 2D et 3D
6.3 Descripteur dโimages de profondeur
6.3.1 Dรฉfinition du DLBP
6.3.2 Stratรฉgie multi-รฉchelles
6.3.3 Calcul du seuil
6.3.4 Construction des histogrammes
6.4 Prรฉdiction de lโidentitรฉ par fusion
6.4.1 Fusion de descripteurs
6.4.2 Fusion de dรฉcisions
6.4.3 Fusion bi-niveaux
6.5 Conclusion
III Expรฉrimentations, rรฉsultats et discussionย
7 รlaboration dโune collection de testsย
7.1 Contexte et besoins
7.2 Matรฉriel utilisรฉ
7.3 Mรฉthodologie
7.4 Annotation
7.5 Discussion et conclusion
8 รvaluation de la mรฉthode de reconstruction stรฉrรฉoscopique de visagesย
8.1 Introduction
8.2 Dรฉtection du bruit
8.3 Estimation de la profondeur
8.3.1 Illustration des rรฉsultats de la mรฉthode proposรฉe
8.3.2 Comparaison aux mรฉthodes stรฉrรฉoscopiques
8.3.3 Comparaison aux autres mรฉthodes de reconstruction
8.4 Conclusion
9 รvaluation de la mรฉthode bimodale de reconnaissance de visages
9.1 Introduction
9.2 Collections de tests
9.3 รvaluation du descripteur DLBP
9.3.1 รtude des paramรจtres des DLBP
9.3.2 Comparaison avec les autres descripteurs
9.4 รvaluation de lโapproche globale de reconnaissance bimodale
9.5 Conclusion
IV Conclusion gรฉnรฉraleย
10 Conclusionย
10.1 Synthรจse des contributions
10.2 Perspectives
Bibliographie
Tรฉlรฉcharger le rapport complet