Reconnaissance Bimodale de Visages

Techniques dโ€™acquisition active

ย  ย La technique active est la plus utilisรฉe pour lโ€™acquisition de la forme 3D du visage. Elle consiste ร  combiner un capteur photographique (ou plusieurs) avec une source lumineuse spรฉcifique contrรดlรฉe, afin de mesurer les coordonnรฉes 3D des objets de la scรจne observรฉe. Diffรฉrents systรจmes dโ€™acquisition active ont รฉtรฉ รฉlaborรฉs, nous prรฉsentons ici les plus connus.
โ€“ Scanners laser : le laser consiste en une lumiรจre monochromatique que lโ€™on projette afin dโ€™รฉclairer une tranche de la scรจne observรฉe par une camรฉra associรฉe au dispositif. Ceci permet de calculer la position dans lโ€™espace de la tranche de scรจne captรฉe en se basant sur le principe de la triangulation active [21]. La triangulation permet de dรฉterminer la position dโ€™un point en mesurant les angles entre ce point et dโ€™autres points de rรฉfรฉrence (le projecteur de lumiรจre et la camรฉra) dont la position est connue. Le laser a รฉtรฉ beaucoup utilisรฉ pour lโ€™acquisition 3D de visages humains dans des applications diffรฉrentes. Une collection de visages 3D a รฉtรฉ publiรฉe dans le cadre de lโ€™รฉvaluation FRGC (Face Recognition Grand Challenge) [110], comportant des vues frontales des visages et intรฉgrant les deux type de donnรฉes, 2D et 3D, pour chaque sujet acquis par un scanner laser de type VI900/910 de Konica Minolta. Lโ€™objectif du projet est lโ€™รฉvaluation des approches de reconnaissance faciale 2D et 3D sur un corpus dโ€™images de taille significative (un total de 4007 modรจles 3D) et riche en variations dโ€™รฉclairage et dโ€™expressions faciales. Les dispositifs laser prรฉsentent de bonnes performances dโ€™acquisition en termes de prรฉcision et de rรฉsolution. Cependant, quelques difficultรฉs comme les occultations et lโ€™absorption de la lumiรจre par la surface, notamment dans les rรฉgions pileuses du visage (sourcils, barbe, moustache) et les rรฉgions des yeux, peuvent affecter les rรฉsultats de lโ€™acquisition. Par ailleurs, ces รฉquipements sont trรจs onรฉreux et nรฉcessitent la coopรฉration des personnes qui doivent rester un certain temps face au scanner en bougeant le moins possible afin dโ€™acquรฉrir le modรจle 3D. Ceci limite leur utilisation ร  un nombre restreint dโ€™applications.
โ€“ Systรจmes basรฉs sur la lumiรจre structurรฉe : ce type de technique active consiste ร  projeter une lumiรจre ร  motifs structurant sous forme de grille ou des bandes de lumiรจre parallรจles. Les motifs sont capturรฉs par la camรฉra associรฉe. Il sโ€™ensuit une รฉtape dโ€™analyse de la dรฉformation de ces motifs par rapport ร  leur forme rectiligne dโ€™origine, permettant dโ€™obtenir la gรฉomรฉtrie des objets de la scรจne. Diffรฉrentes mรฉthodes basรฉes sur la projection de motifs lumineux ont รฉtรฉ proposรฉes. Chaque approche propose un schรฉma de lumiรจre couplรฉ ร  une mรฉthode de mise en correspondance pour la reconstruction de la forme 3D. Un รฉtat de lโ€™art dรฉtaillรฉ sur ces mรฉthodes a รฉtรฉ prรฉsentรฉ dans [115]. Quelques collections de visages ont รฉtรฉ construites en se basant sur cette technique pour lโ€™รฉvaluation des mรฉthodes dโ€™analyse de visages 3D, comme la collection 3DRMA [17], contenant des visages 3D de 120 sujets.
โ€“ Systรจmes basรฉs sur le temps de vol (time-of-light, TOF) : ils se composent de LED ou de diodes lasers ayant la capacitรฉ de gรฉnรฉrer des impulsions de lumiรจre trรจs rapides , et un dโ€™un capteur capable de mesurer le ยซย temps de volย ยป (de lโ€™ordre de la nanoseconde), cโ€™est-ร -dire le temps que cette impulsion met pour effectuer le trajet aller-retour entre la camรฉra et lโ€™objet. Le ยซย temps de volย ยป de cette impulsion est directement proportionnel ร  la distance entre la camรฉra et lโ€™objet mesurรฉ. Ceci permet ainsi dโ€™obtenir une image complรจte de profondeur de lโ€™objet mesurรฉ. Un exemple de ces systรจmes est la camรฉra SR4000 conรงue par la sociรฉtรฉ MESA IMAGING.
โ€“ Systรจmes basรฉs sur la lumiรจre infrarouge : le principe de ces systรจmes consiste ร  illuminer une scรจne par une lumiรจre infrarouge, et ensuite ร  mesurer la quantitรฉ de la lumiรจre incidente rรฉflรฉchie par les objets. Lโ€™hypothรจse faite est que plus cette quantitรฉ est grande, plus lโ€™objet est proche de la camรฉra, et inversement. Le capteur Kinect, mis au point par Microsoft, est lโ€™exemple le plus connu de cette catรฉgorie.

Les modรจles 3D

ย  ย Ces mรฉthodes consistent ร  utiliser un modรจle 3D afin de reconstruire la forme 3D du visage ร  partir dโ€™une image 2D. Un modรจle 3D, appelรฉ 3D morphable model (3DMM), permettant de reprรฉsenter la forme du visage a รฉtรฉ proposรฉ par Blanz et Vetter [22]. Le 3DMM est ร  lโ€™origine de plusieurs travaux de reconstruction 3D du visage [22, 9, 114, 143, 86]. ร€ partir dโ€™une grande collection de scans 3D de visages alignรฉs, les auteurs ont construit un modรจle statistique du visage en termes de forme et de texture. La forme et la texture sont dรฉcrites de maniรจre vectorielle, et une ACP est appliquรฉe sur les deux espaces (forme, texture) indรฉpendamment. Les principaux axes de dรฉformation sont caractรฉrisรฉs par les vecteurs propres. De nouveaux visages peuvent donc รชtre dรฉcrits par une combinaison linรฉaire de ces vecteurs, pondรฉrรฉs par un ensemble de paramรจtres. Ces paramรจtres peuvent รชtres estimรฉs par diffรฉrentes mรฉthodes dโ€™optimisation [22, 9, 114] cherchant ร  minimiser la diffรฉrence entre lโ€™image 2D du visage et lโ€™image synthรฉtisรฉe ร  partir de son modรจle.ย Dโ€™autres chercheurs ont proposรฉ dโ€™utiliser la silhouette du visage au lieu dโ€™une simple image, comme Wang et al. [143]. Une silhouette est un contour, une forme ou lโ€™ombre projetรฉe par un objet. Elle fournit des donnรฉes prรฉcises et robustes pour la reconstruction car elle ne dรฉpend que de la forme et de la pose du visage et elle est indรฉpendante de lโ€™รฉclairage. Lโ€™approche proposรฉe par Wang et al. [143], ainsi que celle proposรฉe par Lee et al. [86] se basent toutes les deux sur lโ€™utilisation des images de silhouette pour lโ€™รฉtape dโ€™ajustement dโ€™un modรจle dรฉformable. Lโ€™idรฉe de ces deux approches est similaire ร  la mรฉthode de Blanz et Vetter [22], sauf quโ€™au lieu dโ€™utiliser une seule photo, elles se concentrent sur lโ€™acquisition de la gรฉomรฉtrie relativement prรฉcise dโ€™un visage ร  partir de plusieurs images de silhouette. Le problรจme rencontrรฉ par les mรฉthodes basรฉes sur les modรจles dรฉformables est que lโ€™algorithme dโ€™optimisation peut converger vers une solution trรจs proche de la valeur initiale, entraรฎnant une reconstruction qui ressemble au modรจle gรฉnรฉrique plutรดt quโ€™au visage particulier qui doit รชtre modรฉlisรฉ. Ainsi, cette mรฉthode peut donner de trรจs bons rรฉsultats lorsque le modรจle gรฉnรฉrique prรฉsente des similaritรฉs significatives avec le visage ร  reconstruire. Toutefois, si les caractรฉristiques du modรจle gรฉnรฉrique sont trรจs diffรฉrentes de celles du visage en cours de reconstruction, le modรจle obtenu est susceptible de ne pas reprรฉsenter fidรจlement ce visage. Un autre inconvรฉnient est la nรฉcessitรฉ dโ€™une initialisation manuelle afin de faciliter la convergence du systรจme. En effet, en raison des minima locaux de la procรฉdure dโ€™optimisation utilisรฉe pour lโ€™estimation des paramรจtres du modรจle, il est nรฉcessaire dโ€™initialiser cette procรฉdure ร  proximitรฉ de la solution optimale. Un autre modรจle appelรฉ CANDIDE-3 [3] a รฉtรฉ utilisรฉ dans certains travaux de reconstruction de visages en raison de sa simplicitรฉ et de sa disponibilitรฉ publique. Le modรจle CANDIDE-3 reprรฉsente la forme dโ€™un visage par un maillage 3D composรฉ de 113 sommets. La formule gรฉnรฉrale dรฉcrivant le modรจle CANDIDE-3 est donnรฉe par deux ensembles : les Shape Units (SU) et les Actions Units (AU). Les SU permettent dโ€™adapter le modรจle 3D ร  la physionomie dโ€™une personne. Les AU codent les modifications physiques dโ€™un visage issues de lโ€™activation de muscles faciaux. Elles permettent de reproduire et de sโ€™adapter aux expressions dโ€™un visage. Quelques mรฉthodes sont basรฉes sur ce modรจle [81, 127, 128] pour la reconstruction 3D du visage. Cependant, ce modรจle est gรฉnรฉralement utilisรฉ comme une รฉtape prรฉliminaire dโ€™obtention dโ€™une reprรฉsentation 3D grossiรจre du visage, et il nโ€™est donc pas adaptรฉ ร  la reconstruction pour lโ€™identification, mais plutรดt ร  dโ€™autres applications comme lโ€™animation du visage.

Structure ร  partir du mouvement (SfM)

ย  Cette technique a pour but lโ€™extraction de la forme dโ€™une scรจne ร  partir des changements spatiaux et temporels qui se produisent dans une sรฉquence dโ€™images, en exploitant le mouvement relatif entre la camรฉra et la scรจne. Le processus de Shape from Motion (SfM) consiste en deux รฉtapes : la mise en correspondance entre les images, et lโ€™estimation du mouvement et de la structure. La correspondance entre les images peut รชtre obtenue par des mรฉthodes diffรฉrentielles [166] ou des mรฉthodes basรฉes sur les primitives dโ€™intรฉrรชts (points, lignes, contours, etc.) [149]. La premiรจre catรฉgorie de mรฉthodes fournit des mesures denses sur le mouvement apparent (mouvement 2D) en utilisant les dรฉrivรฉes temporelles, et nรฉcessite une sรฉquence dโ€™images sรฉparรฉes par de petits intervalles de temps. Les mรฉthodes de la deuxiรจme catรฉgorie cherchent ร  รฉtablir une correspondance entre les points dโ€™intรฉrรชts se trouvant dans des images successives. Ceci peut รชtre fait par des mรฉthodes de corrรฉlation ou bien par des mรฉthodes de suivi comme les filtres de Kalman [77]. La reconstruction et lโ€™estimation du mouvement sont ensuite obtenues par diffรฉrentes mรฉthodes dโ€™optimisation [95]. La mรฉthode de factorisation, proposรฉe par Kanade [76] a รฉtรฉ aussi utilisรฉe pour rรฉsoudre ce problรจme. Pour ce faire, la matrice engendrรฉe par les correspondances calculรฉes entre les images est dรฉcomposรฉe en un produit de deux facteurs sรฉparรฉs : la forme et le mouvement. Le principe de SfM a รฉtรฉ appliquรฉ pour la reconstruction de visages dans les travaux de Brand et al. [27], Jebara et al. [73] et Torresani et al. [135]. Par ailleurs, dans [35], Chowdhury et al. ont proposรฉ une mรฉthode couplant la technique SfM et un modรจle gรฉnรฉrique du visage. Deux images dโ€™une sรฉquence vidรฉo fournies en entrรฉe ร  lโ€™algorithme SfM. La reconstruction 3D obtenue ร  partir de lโ€™algorithme SfM est fusionnรฉe avec le modรจle gรฉnรฉrique afin de corriger les รฉventuelles fausses estimations. Les auteurs ont montrรฉ que cette combinaison permet dโ€™obtenir une reconstruction plus prรฉcise. Par rapport aux mรฉthodes basรฉes sur les modรจles, ces mรฉthodes ne nรฉcessitent pas lโ€™optimisation des paramรจtres dโ€™un visage 3D moyen. Par consรฉquent, elles permettent de gรฉnรฉrer un modรจle 3D spรฉcifique ร  la personne en question. Cependant, la qualitรฉ de la reconstruction de visages 3D ร  partir de deux ou plusieurs images en utilisant la technique SfM est souvent insuffisante. Ceci est liรฉ ร  lโ€™รฉtape de mise en correspondance entre les images qui est trรจs sensible ร  la qualitรฉ des images, lโ€™homogรฉnรฉitรฉ des surfaces et les occultations.

Structure ร  partir des ombres portรฉes (SfS)

ย  ย La technique de Shape from Shading (SfS) est une mรฉthode de reconstruction passive qui met en relation les niveaux de gris dโ€™une image et le relief de la scรจne observรฉe. Elle a รฉtรฉ dรฉveloppรฉe par Horn [63] et depuis, de nombreuses approches diffรฉrentes ont รฉmergรฉ. Cette technique permet dโ€™estimer la forme 3D dโ€™un objet en analysant les variations progressives de lโ€™ombrage dans lโ€™image. Pour expliciter les fondements de SfS, il est nรฉcessaire dโ€™รฉtudier la faรงon dont les images sont formรฉes. Le niveau de gris dโ€™un pixel dans une image reprรฉsente la brillance de la scรจne en ce point. Celle-ci dรฉpend de trois facteurs : lโ€™รฉclairage de la scรจne, lโ€™orientation de la surface et ses propriรฉtรฉs de rรฉflectance. Lorsquโ€™on ne dispose que dโ€™une image de la scรจne, le niveau de gris lu dans lโ€™image constitue la seule donnรฉe, ce qui rend la rรฉsolution du problรจme trรจs complexe. Afin de rรฉduire le nombre dโ€™inconnues du systรจme, quelques hypothรจses sont รฉtablies [161] :
โ€“ รฉclairage : la scรจne est รฉclairรฉe par une source lumineuse unique, รฉmettant un flux lumineux parallรจle et uniforme, ou bien par plusieurs sources lumineuses suffisamment รฉloignรฉes. Lโ€™illumination est donc approximativement uniforme sur toute la surface ;
โ€“ rรฉflectance : la rรฉflectance de la scรจne, qui dรฉcrit la maniรจre dont la lumiรจre est reflรฉtรฉe, est connue. On suppose gรฉnรฉralement que la rรฉflectance des surfaces ร  รฉtudier est homogรจne et de type diffuse ;
โ€“ modรจle de formation : le modรจle de formation de lโ€™image est Lambertien, cโ€™est-ร -dire que le niveau de gris dโ€™un pixel de lโ€™image ne dรฉpend que de la direction de la source de lumiรจre et de la normale ร  la surface ;
โ€“ propriรฉtรฉs de la surface : la surface est lisse, non texturรฉe et complรจtement visible (sans occultation). Le calcul de la normale en tout point de la surface sโ€™effectue alors, grรขce ร  une fonction de minimisation entre la brillance rรฉelle de la scรจne et la brillance obtenue par estimation de la carte de rรฉflectance. Plusieurs mรฉthodes ont รฉtรฉ proposรฉes pour la reconstruction 3D du visage par la technique SfS [8, 122, 88]. Des a priori sur la forme du visage ont รฉtรฉ introduits dans [8, 122] en utilisant un modรจle statistique de la forme du visage afin de renforcer le processus SfS utilisรฉ. Aux points dโ€™occultation, les algorithmes SfS ne parviennent pas ร  dรฉterminer tous les paramรจtres de la surface. Une faรงon dโ€™รฉviter ce problรจme est dโ€™estimer la profondeur ร  partir dโ€™images prises ร  partir de plusieurs points de vue [48]. Bien que le SfS ait montrรฉ une efficacitรฉ satisfaisante pour la reconstruction 3D, il est basรฉ sur plusieurs hypothรจses fortes qui limitent son efficacitรฉ. La mise en ล“uvre de SfS nรฉcessite la connaissance prรฉcise des propriรฉtรฉs de rรฉflexion et dโ€™รฉclairage, et est susceptible de donner de mauvais rรฉsultats en raison de certaines hypothรจses irrรฉalistes รฉtablies sur les propriรฉtรฉs de la surface et lโ€™รฉclairage.

Post-traitement de la carte de profondeur du visage

ย  ย  La carte de profondeur estimรฉe contient gรฉnรฉralement des artefacts produits par des erreurs de mise en correspondance et des incertitudes. Par consรฉquent, il est souvent nรฉcessaire de recourir ร  une รฉtape de post-traitement afin de les รฉliminer. Deux types dโ€™artefacts sont possibles dans la carte de profondeur :
โ€“ valeurs manquantes : aucun pixel correspondant nโ€™est trouvรฉ. La disparitรฉ du pixel reste donc indรฉfinie et la valeur de profondeur ne peut pas รชtre calculรฉe. Ces valeurs sont reprรฉsentรฉes par des trous dans la carte de profondeur ;
โ€“ valeurs erronรฉes : la position du pixel correspondant est erronรฉe. La disparitรฉ estimรฉe est donc diffรฉrente ร  la disparitรฉ rรฉelle (supรฉrieure ou infรฉrieure). Un bruit est donc prรฉsent dans la carte de profondeur .Dans lโ€™รฉtat de lโ€™art, diffรฉrentes mรฉthodes ont รฉtรฉ proposรฉes pour le dรฉbruitage de la carte de profondeur. Afin de traiter les donnรฉes manquantes, il sโ€™agit de trouver le paramรฉtrage appropriรฉ qui permet la reconstruction de ces donnรฉes ร  lโ€™aide des donnรฉes disponibles (voisinage). Ceci est gรฉnรฉralement rรฉalisรฉ par un algorithme dโ€™interpolation linรฉaire ou cubique [74, 15, 66, 147, 47]. Le traitement des donnรฉes erronรฉes consiste souvent en lโ€™application des filtres de rรฉduction de bruit sur la carte de profondeur. Le filtre mรฉdian est couramment appliquรฉ afin de dรฉbruiter et lisser les valeurs de profondeur [74, 15, 66, 47]. Dans [147], Wang et al. ont utilisรฉ trois filtres gaussiens avec des variances diffรฉrentes pour enlever les pics, remplir les petits trous et lisser les donnรฉes. Lโ€™avantage de ces mรฉthodes est quโ€™elles peuvent rรฉduire le bruit de diffรฉrentes tailles en adaptant les paramรจtres du filtre. Cependant, elles traitent la carte de profondeur globalement, et peuvent ainsi causer la perte des donnรฉes exactes, car elles affectent toute lโ€™image (incluant les pixels avec une valeur de profondeur correcte). Afin de pallier ce problรจme, une approche consiste ร  dโ€™abord ร  identifier les valeurs erronรฉes et ensuite ร  les corriger de la mรชme maniรจre que les donnรฉes manquantes. Afin de dรฉtecter ces valeurs erronรฉes, une mรฉthode consiste ร  parcourir la carte de profondeur et ร  appliquer un seuillage sur la valeur absolue entre la valeur de profondeur dโ€™un pixel et la valeur mรฉdiane de son voisinage. Seulement quand ce seuil est dรฉpassรฉ, le pixel est identifiรฉ comme un bruit [98]. La dรฉtection du bruit permet un dรฉbruitage plus prรฉcis de la carte de profondeur et prรฉserve ainsi les donnรฉes correctes. Cependant, si la zone bruitรฉe est grande, le bruit devient plus difficile ร  dรฉtecter. En effet, dans ce cas de figure, lโ€™information de profondeur du voisinage est รฉgalement bruitรฉe.

Approches bimodales 2D-3D

ย  ย Afin dโ€™augmenter la prรฉcision et la robustesse des systรจmes de reconnaissance faciale, de nouvelles mรฉthodes bimodales 2D-3D, dites de fusion, ont รฉtรฉ rรฉcemment dรฉveloppรฉes [26, 1]. Lโ€™objectif de ces mรฉthodes est de combiner lโ€™information visuelle (image 2D) et lโ€™information 3D correspondante (modรจle 3D ou image de profondeur du visage) afin de tirer parti des avantages et de la complรฉmentaritรฉ des deux modalitรฉs. Lโ€™image 2D fournit des informations sur les rรฉgions texturรฉes du visage avec peu de structure gรฉomรฉtrique (comme les poils du visage, les yeux et les sourcils), tandis que les donnรฉes 3D fournissent des informations sur les rรฉgions oรน il y a peu de texture (comme le nez, le menton ou les joues). La fusion de ces deux modalitรฉs est donc susceptible dโ€™amรฉliorer la prรฉcision et la robustesse des mรฉthodes de reconnaissance faciale. La fusion 2D-3D peut intervenir ร  diffรฉrents niveaux du processus de reconnaissance. Trois stratรฉgies de fusion peuvent รชtre considรฉrรฉes selon le niveau auquel elles interviennent lors du processus de reconnaissance [59] :
โ€“ la fusion de donnรฉes brutes : elle consiste ร  combiner les donnรฉes provenant directement des capteurs afin de construire de nouvelles donnรฉes.
โ€“ la fusion de descripteurs : elle consiste ร  modรฉliser les donnรฉes de chaque modalitรฉ sรฉparรฉment. Les vecteurs caractรฉristiques extraits ร  partir des donnรฉes de chaque modalitรฉ sont ensuite fusionnรฉs afin dโ€™en construire un seul qui va รชtre utilisรฉ lors de lโ€™apprentissage et de la mise en correspondance.
โ€“ la fusion de dรฉcisions : elle intervient aprรจs lโ€™รฉtape de classification. Un classifieur par modalitรฉ est donc construit et leurs sorties respectives sont ensuite combinรฉes. Les Figures 3.9, 3.10 et 3.11 illustrent les trois stratรฉgies possibles pour la fusion lors de lโ€™รฉtape de test. Les mรฉthodes de fusion peuvent aussi รชtre classรฉes selon quโ€™elles interviennent avant ou aprรจs lโ€™รฉtape de classification [117]. On parle donc de fusion prรฉcoce (fusion de donnรฉes ou de descripteurs) ou tardive (fusion de dรฉcisions).

Le rapport de stage ou le pfe est un document dโ€™analyse, de synthรจse et dโ€™รฉvaluation de votre apprentissage, cโ€™est pour cela chatpfe.com propose le tรฉlรฉchargement des modรจles complet de projet de fin dโ€™รฉtude, rapport de stage, mรฉmoire, pfe, thรจse, pour connaรฎtre la mรฉthodologie ร  avoir et savoir comment construire les parties dโ€™un projet de fin dโ€™รฉtude.

Table des matiรจres

I Introduction, problรฉmatique et รฉtat de lโ€™artย 
1 Introductionย 
1.1 Contexte
1.2 Processus gรฉnรฉral de la reconnaissance de visages
1.3 Problรฉmatique
1.4 Objectif et contributions
1.5 Plan de la thรจse
2 Acquisition de la forme 3D du visageย 
2.1 Introduction
2.2 Techniques dโ€™acquisition active
2.3 Techniques dโ€™acquisition passive par reconstruction 3D
2.3.1 Les modรจles 3D
2.3.2 Structure ร  partir du mouvement (SfM)
2.3.3 Structure ร  partir des ombres portรฉes (SfS)
2.3.4 La stรฉrรฉovision
2.4 Reconstruction basรฉe sur la stรฉrรฉovision
2.4.1 Principe gรฉnรฉral
2.4.2 Approches existantes
2.4.3 Reconstruction stรฉrรฉoscopique : le cas du visage
2.4.4 Post-traitement de la carte de profondeur du visage
2.5 Conclusion et positionnement
3 Reconnaissance de visagesย 
3.1 Introduction
3.2 Approches de reconnaissance 2D
3.2.1 Mรฉthodes globales ou holistiques
3.2.2 Mรฉthodes locales
3.2.3 Mรฉthodes hybrides
3.2.4 Synthรจse
3.3 Approches de reconnaissance 3D
3.3.1 Mรฉthodes dโ€™alignement
3.3.2 Mรฉthodes basรฉes sur des propriรฉtรฉs gรฉomรฉtriques
3.3.3 Mรฉthodes de rรฉduction de dimensionnalitรฉ
3.3.4 Mรฉthodes basรฉes sur les modรจles 3D
3.3.5 Synthรจse
3.4 Approches bimodales 2D-3D
3.4.1 Fusion de donnรฉes brutes
3.4.2 Fusion de descripteurs
3.4.3 Fusion de dรฉcisions
3.4.4 Choix de la stratรฉgie de fusion
3.4.5 Synthรจse
3.5 Reconnaissance 3D basรฉe sur les motifs binaires locaux
3.5.1 Principe
3.5.2 LBP pour la reconnaissance de visages 2D
3.5.3 Extensions aux visages 3D
3.6 Conclusion et positionnement
II Approche proposรฉe pour la reconstruction et la reconnaissance de visagesย 
4 Aperรงu global de lโ€™approche bimodale 2D-3D de reconnaissance de visagesย 
4.1 Introduction
4.2 Acquisition
4.3 Reconnaissance
4.4 Fusion
4.5 Conclusion
5 Reconstruction 3D du visageย 
5.1 Introduction
5.2 Reconstruction stรฉrรฉoscopique basรฉe sur la structure topologique du visage
5.2.1 Construction du modรจle de disparitรฉ
5.2.2 Calcul de la carte de disparitรฉ
5.3 Post-traitement : dรฉbruitage de la carte de profondeur
5.3.1 Dรฉtection du bruit
5.3.2 Suppression du bruit
5.4 Conclusion
6 Reconnaissance bimodale 2D-3Dย 
6.1 Introduction
6.2 Extraction des descripteurs 2D et 3D
6.3 Descripteur dโ€™images de profondeur
6.3.1 Dรฉfinition du DLBP
6.3.2 Stratรฉgie multi-รฉchelles
6.3.3 Calcul du seuil
6.3.4 Construction des histogrammes
6.4 Prรฉdiction de lโ€™identitรฉ par fusion
6.4.1 Fusion de descripteurs
6.4.2 Fusion de dรฉcisions
6.4.3 Fusion bi-niveaux
6.5 Conclusion
III Expรฉrimentations, rรฉsultats et discussionย 
7 ร‰laboration dโ€™une collection de testsย 
7.1 Contexte et besoins
7.2 Matรฉriel utilisรฉ
7.3 Mรฉthodologie
7.4 Annotation
7.5 Discussion et conclusion
8 ร‰valuation de la mรฉthode de reconstruction stรฉrรฉoscopique de visagesย 
8.1 Introduction
8.2 Dรฉtection du bruit
8.3 Estimation de la profondeur
8.3.1 Illustration des rรฉsultats de la mรฉthode proposรฉe
8.3.2 Comparaison aux mรฉthodes stรฉrรฉoscopiques
8.3.3 Comparaison aux autres mรฉthodes de reconstruction
8.4 Conclusion
9 ร‰valuation de la mรฉthode bimodale de reconnaissance de visages
9.1 Introduction
9.2 Collections de tests
9.3 ร‰valuation du descripteur DLBP
9.3.1 ร‰tude des paramรจtres des DLBP
9.3.2 Comparaison avec les autres descripteurs
9.4 ร‰valuation de lโ€™approche globale de reconnaissance bimodale
9.5 Conclusion
IV Conclusion gรฉnรฉraleย 
10 Conclusionย 
10.1 Synthรจse des contributions
10.2 Perspectives
Bibliographie

Rapport PFE, mรฉmoire et thรจse PDFTรฉlรฉcharger le rapport complet

Tรฉlรฉcharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiรฉe. Les champs obligatoires sont indiquรฉs avec *