Géométrie des caméras

 Géométrie des caméras

Relation entre l’espace euclidien et l’espace projectif

Nous supposons que le lecteur possède des notions de géométrie projective. Les ouvrages cités précédemment possèdent de riches descriptions des propriétés de cette géométrie. Nous rappelons succinctement dans cette section la relation qui peut être établie entre les espaces projectif et euclidien, tout en introduisant par la même occasion les notations qui seront utilisées dans ce manuscrit.

L’utilisation de la géométrie projective en vision par ordinateur est particulièrement intéressante puisqu’elle permet non seulement de rendre homogènes et linéaires les opérations de transformation de l’espace euclidien (dont la projection centrale, qui est le modèle le plus courant de caméra), mais aussi de travailler avec des entités géométriques à l’infini.

L’espace euclidien peut en effet être vu comme une restriction de l’espace projectif. Considérons un point X de l’espace euclidien R n de dimension n. Il est défini par un vecteur colonne X = (X1, . . . , Xn), exprimé dans un repère rattaché à la scène. Ce point peut être mis en relation dans l’espace projectif Pn avec le point X = (λX1, . . . , λXn, λ), où X est de dimension n + 1 et λ un scalaire non nul. Les coordonnées cartésiennes d’un point de l’espace euclidien sont obtenues à partir de ses coordonnées homogènes X dans P3 en divisant toutes les coordonnées projectives par λ, si ce scalaire est non-nul. Si λ = 0, alors X représente une direction dans l’espace euclidien, ou un point à l’infini.

De nombreux autres modèles de caméra ont été proposés dans la littérature. Citons par exemple les modèles para-perspectif, ortho-perspectif ou encore parallèle. Le lecteur intéressé trouvera dans [Lingrand 99, Hartley 00] des illustrations de ces différentes modélisations qui sont des simplifications du modèle perspectif. Dans le reste de ce manuscrit, nous considérons le modèle général que nous avons présenté précédemment.

D’autres types de capteurs vision sont aujourd’hui également utilisés. Ainsi, certaines caméras possèdent une distribution fovéale en log-polaire des pixels afin de disposer d’une meilleure définition sur les zones d’attention [Bernardino 99]. Les caméras omni-directionnelles permettent d’obtenir des vues de 360 degrés, grâce à un miroir placé au-dessus de la caméra [Baker 99]. Du type du miroir utilisé (paraboloïque, hyperboloïque, elliptique) dépendent les relations de projection. Dans les travaux présentés ici, nous utilisons les caméras perspectives classiques.

Géométrie de deux images

Si l’on ne possède pas de connaissance a priori sur l’environnement observé, une image prise par une caméra fournit peu d’information sur la géométrie de la scène. À partir de deux images, il est possible de déduire non seulement la structure 3D de la scène, mais aussi le mouvement entre les deux caméras qui ont acquis ces prises de vue. Comme nous allons le voir dans cette partie, ces informations sont déduites des primitives mises en correspondance dans les deux images.

Estimation du mouvement rigide

À partir de primitives en correspondance, l’estimation du mouvement rigide reliant les deux positions de la caméra passe par l’estimation de la géométrie épipolaire. Nombreuses sont les méthodes permettant de déterminer cette géométrie. Nous n’effectuerons ici qu’une présentation succincte des méthodologies employées. Nous renvoyons aux études comparatives de [Luong 96, Zhang 98] (pour la détermination des matrices fondamentales et essentielles) et de [Malis 00] (pour la matrice d’homographie) pour de plus amples détails.

Comme il a déjà été mentionné, sept correspondances sont suffisantes pour calculer la matrice fondamentale de manière linéaire [LonguetHiggins 81]. Une normalisation des données permet d’obtenir une meilleure estimation de cette matrice [Hartley 97a]. Dans [Luong 96], Luong montre que la solution obtenue peut cependant s’avérer instable, et qu’elle tend à ramener les épipoles vers le centre de l’image. De plus, la contrainte de rang n’est généralement pas satisfaite. Des méthodes de résolution non linéaires ont ensuite été proposées afin de prendre en compte les contraintes portant sur cette matrice au moyen de représentations adaptées. Le critère de minimisation généralement utilisé correspond à la distance entre un projeté et sa ligne épipolaire associée [Deriche 94, Luong 96]. Ces méthodes nécessitent une bonne initialisation de la matrice fondamentale, initialisation qui est généralement obtenue par une approche linéaire. Les méthodes non-linéaires permettent ensuite de faire converger cette mesure initiale vers la solution optimale au sens du critère de minimisation.

Certaines méthodes déterminent la matrice fondamentale à partir d’une homographie et de l’épipole. L’intérêt de cette méthodologie est qu’indirectement, elle permet de contrôler le rang de la matrice fondamentale. Ainsi, dans [Boufama 95], un changement de repère dans l’image, associé à la contrainte de colinéarité entre c2, 2x et le point de coordonnées pixelliques 2Hp1 1xp permet de déterminer simultanément l’homographie et l’épipole. La matrice fondamentale est alors obtenue en appliquant l’équation (1.15). Mais cette méthodologie possède des cas singuliers où la matrice d’homographie ne peut être estimée.

Dans [Shashua 94b], la matrice d’homographie est calculée de manière linéaire à partir de trois correspondances et des épipoles. Ces dernières sont déduites de l’équation (1.7), ce qui suppose donc que la matrice fondamentale est estimée préalablement. Dans [Couapel 95, Malis 00], la matrice d’homographie est déduite directement, sans nécessiter la connaissance de l’épipole, là aussi au moyen d’un changement de repère judicieux. Dans [Malis 00], il est montré que la deuxième méthode permet d’obtenir une matrice moins sensible aux mesures bruitées.

Il existe des configurations où la matrice fondamentale subit une réduction de rang. Entre autres, cette dégénérescence est observée si :
– le mouvement entre les deux positions de la caméra est une rotation pure ;
– toutes les primitives de la scène appartiennent à un même plan ;
– tous les points 3D de la scène se projettent sur une droite unique.
La matrice d’homographie est au contraire toujours définie. Si le mouvement entre les deux images est une rotation pure, la matrice d’homographie s’écrit alors 2Hn1 = 2R1, ce qui revient à considérer que le plan de référence est le plan à l’infini. Si la scène observée est plane, la relation (1.9) est exacte. Si l’on a n correspondances, l’estimation de l’homographie revient à déterminer n + 8 inconnues avec un système de 3n équations (quatre correspondances entre les deux prises de vue sont alors suffisantes).

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

Introduction
1 Fondements théoriques
1.1 Géométrie des caméras
1.1.1 Relation entre l’espace euclidien et l’espace projectif
1.1.2 Modèle sténopé d’une caméra
1.1.3 Géométrie de deux images
1.1.3.1 La géométrie épipolaire
1.1.3.2 Les matrices fondamentales et essentielles
1.1.3.3 Homographie entre deux prises de vue
1.1.3.4 Estimation du mouvement rigide
1.2 Description du contenu d’une prise de vue
1.2.1 Représentation des images
1.2.2 Caractérisation des primitives visuelles
1.2.3 La mise en correspondance
1.2.4 Le suivi de primitives
1.3 Conclusion
2 Représentation d’un environnement de navigation
2.1 État de l’art
2.1.1 Représentation géométrique
2.1.1.1 Projection de l’environnement dans l’espace des configurations
2.1.1.2 Modèle tridimensionnel de la scène
2.1.2 Représentation basée apparence
2.1.2.1 Description par séquences d’images
2.1.2.2 Représentation par lieux
2.1.2.3 Description par vues
2.1.3 Positionnement
2.2 Une mémoire visuelle de l’environnement
2.2.1 Localisation basée apparence
2.2.1.1 La reconnaissance d’images comme outil de localisation
2.2.1.2 Caractérisation locale d’une prise de vue
2.2.1.3 Indexation d’images sur les invariants photométriques
2.2.1.4 Résultats expérimentaux
2.2.2 Structuration de la mémoire visuelle de l’environnement
2.2.2.1 Fonction de coût inter-image
2.2.2.2 Génération de graphes hiérarchiques
2.2.3 Transcription et résolution d’une tâche de navigation
2.2.4 Schémas temporels récapitulatifs
2.2.5 Résultats expérimentaux
2.2.5.1 Recherche de chemin classique
2.2.5.2 Valuation basée sur le mouvement
2.2.5.3 Recherche de chemins avec les graphes hiérarchiques
2.3 Conclusion
3 Mise à jour des amers visibles durant la navigation
3.1 Gestion de l’évolution des amers visibles : état de l’art
3.1.1 Méthodes n’utilisant pas d’amers locaux
3.1.2 Mise à jour basée sur la connaissance du modèle de la scène
3.1.3 Méthodes basées sur la connaissance de la trajectoire des primitives
3.1.4 Positionnement
3.2 Gestion de l’évolution des amers visibles
3.2.1 Reprojection à partir de la matrice d’homographie
3.2.2 Approche proposée : cas d’une scène tri-dimensionnelle
3.2.2.1 Protocole de mise à jour des primitives visibles
3.2.2.2 Estimation de l’épipole et initialisation de la boucle
3.2.3 Cas d’une scène plane
3.2.3.1 Transfert de primitives
3.2.3.2 Schéma de mise à jour des primitives
3.2.4 Résultats expérimentaux
3.2.4.1 Cas d’une scène plane
3.2.4.2 Cas d’une scène tridimensionnelle
3.3 Conclusion
4 Contrôle des mouvements d’un système robotique
4.1 La navigation robotique : état de l’art
4.1.1 Planification de trajectoires
4.1.1.1 Les méthodes globales
4.1.1.2 Les méthodes locales
4.1.2 L’asservissement visuel
4.1.2.1 Principe de l’asservissement visuel
4.1.2.2 L’asservissement visuel face aux grands déplacements et à la contrainte de visibilité
4.1.3 Une navigation basée vision
4.1.4 Positionnement
4.2 Une navigation basée sur l’évolution du champ de vision de la caméra
4.2.1 Formalisme du champ de potentiel
4.2.1.1 Généralités
4.2.1.2 D’autres espaces de définition du potentiel
Conclusion

Rapport PFE, mémoire et thèse PDFTélécharger le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *