Modèles stochastiques pour la reconstruction tridimensionnelle d’environnements urbains

Les enjeux de la modélisation urbaine en 3D

La constitution de bases de données urbaines tridimensionnelles représente un enjeu important dans de nombreux domaines. Dans le secteur public, les applications se focalisent principalement autour de l’aménagement urbain. Ces bases de données sont utiles dans des études concernant l’implantation d’espaces verts, le positionnement de lampadaires (simulation d’éclairage), ou bien encore l’impact de la construction de bâtiments dans un environnement. Elles peuvent également se révéler être efficaces pour le suivi de l’évolution des villes et pour la gestion des risques tels que les inondations ou les séismes. Dans le secteur industriel, les modélisations 3D de villes intéressent beaucoup les opérateurs de téléphonie mobile. Elles leur permettent de simuler la propagation des ondes électromagnétiques et ainsi améliorer le développement de leurs réseaux de télécommunication. L’industrie cinématographique, ainsi que celles du jeu vidéo et de l’automobile, sont également demandeuses de ces modélisations 3D. Enfin, il existe des applications militaires comme l’aide à la préparation d’opérations ou au guidage d’engins autonomes tels que les drônes. Les possibilités d’utilisation sont donc très nombreuses. Le lecteur pourra trouver dans [Fritsch, 1999], une gamme d’applications possibles.

Le procédé historique d’acquisition de modélisation 3D de ville est le relevé topométrique de bâtiments. Des opérateurs saisissent manuellement des points d’intérêt sur le terrain. Ces points sont ensuite reportés à l’intérieur d’une scène virtuelle, et permettent ainsi de modéliser le bâtiment en 3D. Bien que très précise, cette méthode est lente et coûteuse. Elle est utilisée principalement pour la modélisation de bâtiments remarquables. Cependant, pour une reconstruction « en masse », c’est-à-dire de villes entières, ce procédé devient très vite pénible. Il n’est d’autant pas adapté que les modélisations urbaines ont besoin de mises à jour fréquentes. Dans ce contexte, il est nécessaire de se tourner vers des procédés où l’intervention humaine est moindre. L’imagerie terrestre est une des principales alternatives, notamment pour aborder les problèmes liés à la reconstruction et la texturation des façades. On peut citer à cet effet les travaux de [Wang et al., 2002; Zhao et Shibasaki, 2001; Frueh et al., 2005; Penard et al., 2006]. Le recours à la télédétection, c’est-à-dire aux méthodes permettant d’extraire des informations à partir de données aériennes et satellitaires, est également très prisé.

L’apport de la télédétection

L’acquisition rapide et massive de données urbaines, la couverture importante des avions et satellites, ou bien encore les avancées récentes dans le domaine spatial concernant le coût et la qualité des images satellitaires, font de la télédétection le moyen le plus efficace aujourd’hui pour aborder la modélisation urbaine en 3D. Le temps mis pour acquérir des données aériennes ou satellitaires sur une ville est notamment beaucoup plus court que le temps mis par un géomètre pour effectuer un relevé topographique. Il existe principalement trois types de capteurs permettant d’acquérir des données aériennes et satellitaires : les capteurs optiques, LASER et RADAR.

La modélisation urbaine en 3D par la télédétection présente de nombreuses difficultés qui doivent être prises en compte lors de la mise en place des processus. Voici les principales d’entre elles :

• La diversité des objets : Les scènes urbaines ne sont pas uniquement constituées de bâtiments. Arbres, pelouses, haies, voitures, routes, trottoirs, ponts ou bien encore rivières : voici un panel d’objets que l’on trouve régulièrement dans le paysage urbain et qui doivent être pris en compte lors de la mise en place du processus de modélisation 3D. Ces objets diffèrent par des caractéristiques de forme, de taille, de radiométrie ou bien encore de texture. Bien souvent une étape de classification, préliminaire au processus de reconstruction 3D, est nécessaire afin de localiser et d’identifier ces différents types d’objets dans la scène.

• La densité des objets : Le nombre d’objets peut varier de manière importante d’une scène urbaine à une autre. L’hétérogénéité de la répartition des objets constitue une source de difficultés. Les zones urbaines denses posent notamment des problèmes relatifs à la reconnaissance et à l’extraction des objets.

• La complexité des bâtiments : Afin de modéliser efficacement les zones urbaines, il est important de connaître et comprendre les différents types de bâtiments, et surtout les lois qui régissent leur construction. Or, ces dernières sont à la fois très variées et complexes. Elles dépendent de nombreux facteurs tels que le contexte historique (différentes vagues de construction au cours des époques) ou l’aspect géographique (à différentes échelles : nationale, régionale, intra-urbaine). Tout ceci contribue à créer un certain désordre au sein des zones urbaines, et rend difficile leur analyse, en particulier les études sur les typologies de bâtiments.

• La spécificité des données : Les différents types de données utilisés en télédétection ont chacun leurs caractéristiques propres en matière de reconstruction 3D. Tous rencontrent des difficultés pour extraire des informations 3D dans une scène. Nous détaillerons ces difficultés par la suite.

Etat de l’art

Comme cela a été souligné précédemment, la reconstruction 3D de scènes urbaines en télédétection est un problème complexe. De nombreux systèmes ont été développés dans des contextes variés. Dans cette partie, nous nous penchons sur les méthodes existantes et tentons d’en dégager les points forts et les inconvénients. Cette étude est déterminante pour le choix du système qui sera proposé dans le cadre de cette thèse. Les méthodes de reconstruction peuvent être classées en fonction de cinq critères principaux :
• Le type des données utilisées – optique (monoscopie, stéréoscopie, multiscopie), LASER, RADAR, produits dérivés.
• Le niveau d’automaticité du système – automatique, automatique avec données cadastrales, semi-automatique.
• La complexité des zones urbaines reconstruites – urbain dense, peri-urbain, zones d’activité et d’habitats collectifs.
• Le degré de généralité de la modélisation 3D – prismatique, paramétrique, structurelle, polyédrique.
• Le type d’approche utilisé – « Top-Down », « Bottom-Up », « Hypothesize-And-Verify ».

Les données

Les données utilisées pour la modélisation urbaine 3D doivent pouvoir fournir, directement ou indirectement, des informations tridimensionnelles sur la scène observée. Nous évoquons brièvement ici, les principaux types de données possédant cette spécificité.

Résolution des données
La résolution des données est un point important permettant de choisir le niveau de détails de la modélisation 3D finale. Celle-ci dépend fortement du type de données utilisé. Dans ce paragraphe, nous nous efforçons d’établir un lien entre la résolution de données optiques aériennes, et le niveau de détails pouvant être exigé pour la reconstruction 3D. D’une manière générale, on peut distinguer quatre gammes de résolution :
• >1m – ce sont des résolutions très basses pour traiter les problèmes de reconstruction en 3D de bâtiments. On peut cependant espérer fournir une modélisation par toits plats (i.e. avec une simple estimation de la hauteur des bâtiments).
• entre 1m et 50cm – cette gamme permet de proposer des modélisations assez simples et généralisées, laissant apparaître les principaux plans de toits qui constituent un bâtiment.
• entre 50cm et 20cm – ces résolutions sont adaptées pour fournir des reconstructions détaillées des toitures, c’est-à-dire prenant en compte les décrochements de toits et les petits pans mineurs qui constituent la toiture d’un bâtiment.
• <20cm – cette gamme permet d’obtenir des modélisations très détaillées et complètes, en reconstruisant notamment des objets urbains très intéressants tels que les superstructures des toitures (cheminée, chien-assis,…). On peut citer à cet effet les travaux de [Brédif et al., 2007]. Ces gammes de résolution correspondent à des données optiques aériennes. Avec des données optiques satellitaires, cela n’est plus forcément valable, celles-ci ayant une moins bonne qualité d’image à résolution identique.

Monoscopie
La monoscopie consiste à extraire des informations tridimensionnelles à partir d’une seule image. [McGlone et Shufelt, 1994] et [Lin et Nevatia, 1998] proposent des approches reposant sur le « shape from shadow », c’est-à-dire en utilisant les informations inhérentes à l’ombre des objets. Ce type de procédés fournit des modélisations assez pauvres, où les bâtiments sont représentés par des parallépipèdes rectangles dont la hauteur est estimée en fonction de la projection de l’ombre dans l’image. De plus, en considérant l’ombre comme unique information tridimensionnelle, ces méthodes manquent de robustesse. Aujourd’hui, les systèmes à base de monoscopie tendent à disparaître.

Stéréoscopie
La stéréoscopie est le procédé de référence, du moins celui qui a focalisé l’attention des chercheurs durant la dernière décennie. Cette technique permet de calculer le relief d’une scène à partir de deux images prises à des points de vue différents. La vision humaine utilise ce processus et permet à l’homme d’évoluer naturellement dans un environnement en ayant cette notion de distance par rapport aux objets qui l’entourent. Ce procédé doit gérer deux difficultés principales :
• La mise en correspondance qui consiste à retrouver les pixels homologues dans le couple d’images (également appelée appariement). Cette opération est loin d’être évidente et fait appel à des mesures de corrélation parfois très complexes. Les algorithmes doivent faire face aux changements de luminosité, aux bruits, aux déformations des images ou bien encore aux zones homogènes.
• Les zones d’occultation qui rendent localement impossible la mise en correspondance puisqu’un point de la première image n’a pas d’homologue dans la seconde. Or ces points sont fréquents en stéréoscopie et obligent les algorithmes à introduire des informations a priori.

Le paramètre principal lors d’une prise de vue stéréoscopique est le rapport B/H (base sur hauteur), où B représente la distance entre les deux centres de prise de vue, et H, la hauteur entre la base des prises de vue et la scène observée (voir Figure 1.1). Ce rapport permet de déterminer la précision altimétrique théorique du relief en fonction de la précision planimétrique. La valeur de ce rapport soulève un compromis entre la difficulté d’appariement et la précision altimétrique. En théorie, un B/H faible (i.e. deux images dont les prises de vue sont très proches) permettra une mise en correspondance relativement facile en restreignant notamment les zones d’occultation, cependant la précision altimétrique sera mauvaise. Et inversement. En pratique, ce principe n’est pas toujours linéaire et l’on observe parfois des intervalles de B/H clairement avantageux. Ce procédé, qui fournit des informations 3D fiables, a été utilisé dans de nombreux travaux. Les algorithmes proposés doivent cependant gérer les zones d’occultation. Face à ce problème, certains optent pour une modélisation 3D simplifiée. C’est le cas notamment de [Paparoditis et al., 1998] proposant uniquement des toits plats ou [Dang, 1994] reconstruisant des bâtiments parallépipédiques. D’autres, comme [Gruen, 1998; Gruen et Wang, 1998], évoluent dans un contexte semi-automatique, c’est-à-dire en permettant à un opérateur d’intervenir et de rectifier les erreurs de reconstructions. [Fuchs, 2001] et [Jibrini, 2002] ont proposé des modèles intéressants permettant des reconstructions relativement complexes.

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

1 Introduction
1.1 Problématique
1.1.1 Les enjeux de la modélisation urbaine en 3D
1.1.2 L’apport de la télédétection
1.2 Etat de l’art
1.2.1 Les données
1.2.2 L’automaticité
1.2.3 Les zones urbaines
1.2.4 Les modélisations 3D
1.2.5 Les approches
1.2.6 Bilan
1.3 Le contexte de notre étude
1.3.1 Données spatiales et simulations PLEIADES
1.3.2 Vers de l’urbain dense en automatique
1.4 La stratégie
1.4.1 L’approche structurelle
1.4.2 Les outils stochastiques
1.4.3 Démarche générale
2 Extraction des bâtiments
2.1 Caricatures de bâtiments par agencement de rectangles : rappel et analyse de travaux antérieurs
2.1.1 Processus ponctuels marqués
2.1.2 Formulation de l’énergie
2.1.3 Commentaires
2.2 Régularisation en supports structuraux
2.2.1 Connexion des supports
2.2.2 Détection des discontinuités des hauteurs de toit
3 Reconstruction 3D des bâtiments
3.1 Bibliothèque de modèles 3D
3.1.1 Typologie des toits et adéquation avec les données
3.1.2 La bibliothèque proposée
3.2 Formulation Bayésienne
3.2.1 Vraisemblance
3.2.2 A priori
3.3 Optimisation
3.3.1 Echantillonneur RJMCMC
3.3.2 Noyaux de propositions
3.3.3 Recuit simulé
3.3.4 Des méthodes alternatives
3.4 Estimation des paramètres
3.4.1 Paramètres de la densité
3.4.2 Paramètres de l’optimisation
4 Evaluation
4.1 Evaluation qualitative
4.2 Evaluation quantitative
4.3 Influence du recuit simulé
4.4 Influence des supports 2D
4.5 Les limites d’utilisation
4.6 Extension du contexte
5 Conclusion