VISION HUMAINE
ย ย ย ย ย ย ย ย ย La vision humaine est dรฉcrite tout simplement par la perception de lโorgane de vue. Les images qui se forment sur la rรฉtine humaine proviennent dโun monde tridimensionnel, mais celles-ci sont rรฉduites ร deux dimensions, supprimant la profondeur. Malgrรฉ cela, le cerveau est capable de reconstruire cette troisiรจme dimension ร partir de la vision stรฉrรฉoscopique. Les images gauche et droite du mรชme objet, captรฉes en mรชme temps par les deux rรฉtines, sont acheminรฉes au cortex visuel par les nerfs optiques qui se croisent dans le chiasma optique, ce qui fait quโelles sont prรฉsentes dans des cellules voisines du cortex visuel [cf. annexe1]. Cette double information permet, par des mรฉcanismes complexes faisant intervenir dโautres zones du cerveau, la perception de lโangle entre lโinformation visuelle captรฉe par des photorรฉcepteurs dโun ลil et ses homologues de lโautre ลil permettant de percevoir les reliefs et la distance. Les deux yeux fournissent au cerveau deux images non superposables, du fait de lโรฉcartement inter-pupillaire [cf. annexe1], mais dans la plupart des cas, quand le cerveau fonctionne correctement, hors de lโemprise de lโalcool par exemple, il restitue une seule image : celle de lโลil directeur. Une seule image, certes mais avec une valeur ajoutรฉe : le relief de la scรจne observรฉe. Cette perception de la profondeur est ร diffรฉrencier de lโanalyse rationnelle de la scรจne, qui fournit, elle aussi, des renseignements sur la profondeur : รฉtude des parties cachรฉes, connaissance ร priori de la taille des objets observรฉs, comparaisons de leur diamรจtre apparent.
Traitement de bas niveau
Filtrage La premiรจre รฉtape dโun algorithme de traitement dโimage consiste ร appliquer un certain nombre de filtres [cf. annexe2] sur celle-ci. Ces filtres peuvent faciliter les traitements (utilisation de filtres gaussiens passe-bas avant un calcul de flux optique par exemple) ou directement mettre en รฉvidence les parties de lโimage intรฉressantes pour une application donnรฉe (filtre de texture permettant de segmenter le sol dans lโimage par exemple). Il est possible รฉgalement dโutiliser plusieurs filtres sรฉquentiellement.
Extraction dโinformation Cette deuxiรจme รฉtape a pour but dโextraire de lโimage les informations nรฉcessaires pour lโapplication choisie. Le but est de rรฉduire la grande quantitรฉ de donnรฉes que reprรฉsente une image en un petit ensemble dโinformations plus facilement exploitables. Ces informations sont gรฉnรฉralement reprรฉsentรฉes par quelques valeurs scalaires. Les primitives utilisรฉes pour cette รฉtape dโextraction dโinformation peuvent se concentrer sur des portions rรฉduites de lโimage (extracteurs de coins ou de bords) ou sur des zones plus importantes (calcul de moyenne sur une partie de lโimage). [7]
METHODES GLOBALES
ย ย ย ย ย ย ย Les mรฉthodes globales utilisent des contraintes non-locales afin dโaugmenter la robustesse dans les rรฉgions locales de lโimage, oรน lโappariement รฉchoue dans des zones de texture uniforme, ou ร cause des occlusions et des dรฉfauts dโillumination. Par contre lโinconvรฉnient majeur de ces mรฉthodes est la plus grande complexitรฉ des calculs. Ces mรฉthodes sont reprรฉsentรฉes sous forme de problรจme dโoptimisation, cherchant ร assigner les disparitรฉs qui minimisent une fonction de coรปt global. [7] Appartiennent ร ce groupe les mรฉthodes de :
Programmation dynamique La programmation dynamique est une mรฉthode assez gรฉnรฉrale pour rรฉsoudre des problรจmes dโoptimisation non-linรฉaire avec contraintes, quand les variables ne sont pas toutes interdรฉpendantes. Un tel problรจme peut รชtre dรฉcomposรฉ en une sรฉquence de sous-problรจmes dโoptimisation avec une seule variable, ou de faรงon plus gรฉnรฉrale avec un sous-ensemble de variables. La programmation dynamique est รฉquivalente ร la recherche dโun chemin optimal dans un graphe, par la minimisation dโune fonction de coรปt.
Flot de graphe (Graph-cut) Le but de cette mรฉthode est de trouver la coupure dโun graphe qui possรจde un coรปt minimum parmi toutes les coupures possibles, en minimisant une fonction dโรฉnergie. Les terminaux du graphe reprรฉsentent les disparitรฉs pouvant รชtre associรฉes ร un pixel de lโimage, et les diffรฉrents nลuds correspondent aux pixels de lโimage. Pour dรฉfinir la fonction dโรฉnergie, une fonction de coรปt basรฉe sur un critรจre de photo-consistance est introduite (mesure sur la similaritรฉ de lโintensitรฉ des pixels), appelรฉe le terme des donnรฉes (data term). Un second terme, appelรฉ terme dโhomogรฉnรฉitรฉ ou dโuniformitรฉ spatiale (smoothness term), pรฉnalise les discontinuitรฉs entre pixels voisins. Cette mรฉthode permet donc dโobtenir une carte de disparitรฉs avec des zones homogรจnes tout en prรฉservant les contours. Le dรฉfaut majeur de cette mรฉthode est dโaplatir les objets.
Optimisation ligne par ligne Cette mรฉthode globale dโoptimisation nโutilise que les termes horizontaux de lissage (smoothness terms), en rรฉsolvant le mรชme problรจme dโoptimisation que lโalgorithme de graphcut (sauf que les termes verticaux de lissage sont donc ignorรฉs).
Relaxation Cโest un algorithme itรฉratif et localement parallรจle, qui amรฉliore une solution en minimisant localement lโรฉnergie. Lโimplรฉmentation de ce genre de mรฉthode est simple, mais la vitesse de convergence est lente.
CONCLUSION GENERALE
ย ย ย ย ย ย ย ย Pour conclure, lโutilisation de la vision est tellement naturelle et simple pour l’homme qu’il est difficile d’apprรฉhender la complexitรฉ des traitements rรฉellement effectuรฉs pour acquรฉrir et interprรฉter cette information, ce qui fait lโobjet dโรฉtude de la vision artificielle. Cette derniรจre dรฉveloppe alors des bases algorithmiques et thรฉoriques grรขce auxquelles lโinformation utile relative ร lโenvironnement peut รชtre automatiquement extraite et analysรฉe ร partir dโune image ou dโune sรฉquence dโimages. Dโaprรจs lโรฉtude, la stรฉrรฉovision pose deux problรจmes fondamentaux fortement liรฉs: l’identification des points homologues et la calibration du systรจme de prise de vue. Savoir comment se projettent les points de la scรจne sur lโimage sโavรจre une รฉtape difficile. Pourtant lโobtention des coordonnรฉes des points dans lโespace est quasiment immรฉdiate si les paramรจtres de la calibration sont connus. Alors il ne reste plus quโร rรฉsoudre les รฉquations de triangulation pour dรฉduire la profondeur ou la distance en temps rรฉel dans lโespace. Les thรฉories sont ensuite appliquรฉes dans la conception dโun systรจme de vision stรฉrรฉoscopique. Puis un robot mobile est conรงu et couplรฉ avec ce systรจme pour lui permettre de mesurer la profondeur dans son champ de vision et ainsi de dรฉtecter les obstacles et de se naviguer dans son environnement. Ceci a permis la validation des rรฉsultats prรฉcรฉdents. Ainsi, cโest prouvรฉ quโun robot ou un systรจme informatique peut se doter des mรชmes capacitรฉs de vision dโun รชtre humain. Enfin, cette mรฉmoire ouvre de nombreuses perspectives. Par exemple en ajoutant d’autres capteurs comme l’ultrason ou laser au robot pour avoir des rรฉsultats plus prรฉcis et aussi dโajouter des cellules solaires pour lui donner plus dโautonomie. Une autre possibilitรฉ serait dโรฉquiper des engins mobiles plus grands qui nรฉcessitent son propre systรจme de vision, par exemple une voiture qui serait intelligente ou mรชme autonome. Cette mรฉmoire est consacrรฉe spรฉcialement dans la vision robotique mais la stรฉrรฉovision peut รชtre appliquรฉe dans beaucoup plus de domaines. Les captures de mouvement pour l’industrie des jeux vidรฉo et des cinรฉmas 3D, l’imagerie satellites et la topographie en sont des exemples.
|
Table des matiรจres
INTRODUCTION GENERALE
CHAPITRE I GENERALITES SUR LA VISION ET LโIMAGE
1.1 PRINCIPE DE LA VISION
1.1.1 VISION HUMAINE
1.1.2 VISION PAR ORDINATEUR
1.2 PRINCIPE DโANALYSE DโIMAGE
1.2.1 NOTION DE BASE
1.2.2 DIFFERENTES PHASES DE LโANALYSE
1.2.3 NIVEAU DE COMPLEXITE DE LโANALYSE
1.2.4 CONTRAINTES
CHAPITRE II THEORIES SUR LA STEREOVISION
2.1 LE STEREO-CALIBRAGE
2.2 LA RECTIFICATION EPIPOLAIRE
2.3 APPARIEMENT OU MISE EN CORRESPONDANCE
2.3.1 METHODES LOCALES
2.3.2 METHODES GLOBALES
2.4 LA TRIANGULATION
2.4.1 GEOMETRIE POUR LES CAMERAS PARALLELES
2.4.2 GEOMETRIE POUR LES CAMERAS NON PARALLELES
2.4.3 CAS GENERAL
CHAPITRE III REALISATION DU ROBOT EQUIPE DE LA STEREOVISION
3.1 CONCEPTION DU ROBOT
3.1.1 PRESENTATION DU ROBOT
3.1.2 ELECTRONIQUES
3.2 CONCEPTION DU CAPTEUR
3.2.1 CHOIX DES CAMERAS
3.2.2 ASSEMBLAGE DU CAPTEUR
3.2.3 CALIBRAGE ET RECTIFICATION DU CAPTEUR
3.3 DETECTEUR DโOBSTACLE PAR STEREOVISION
3.3.1 CALCUL DE LA CARTE DE DISPARITE
3.3.2 CALCUL DE LA CARTE DE PROFONDEUR
3.3.3 SEGMENTATION DES OBSTACLES
CONCLUSION GENERALE
Tรฉlรฉcharger le rapport complet