Traçage de l’évolution de la déformation des surfaces continentales

Données utilisées et protocoles élaborés

Choix des données

Pour déterminer les données qui seront utiles, je me suis basé sur les données déjà utilisées par les géologues et géomorphologues. Ainsi j’ai retenu le MNT avec une résolution de 90 m et ses dérivées : pente (SL), courbure (CU), ainsi que la rugosité (RU) et hauteur relative (RH). De plus, une autre donnée a été ajoutée, il s’agit de la texture (TE), ce descripteur permet de mettre en avant la présence de motifs à partir du MNT. Cette donnée n’a pas été utilisée auparavant, mais pourrait se trouver intéressante à prendre en compte. En effet, les PS pourraient avoir une texture particulière qui permettrait de les identifier.
Avant d’appliquer les protocoles définis ci-après deux zones ont été définies et serviront de zone test afin de limiter les temps de calcul et de tester les protocoles élaborés.
La zone d’étude sur laquelle je me suis principalement appuyé est située à la frontière entre Namibie et Afrique du Sud. J’ai aussi travaillé sur une zone de contrôle située dans le nord de la Patagonie argentine pour confronter mes résultats.

Namibie/Afrique du Sud

Au sein de cette zone d’étude africaine (ZA ;Figure 19), j’ai découpé deux zones tests plus petites. La Zone Test 1 (ZT1) qui se situe au nord de la zone d’étude et la Zone Test 2 (ZT2) se situant à l’est de la zone d’étude. Ces deux zones tests sont composées chacune des deux types de surfaces que nous cherchons à identifier : pédiments et etchplains (Figure 10 – A).

Argentine

La zone d’étude argentine (ZAR ; Figure 20) a été utilisée entiérement, sans création de zones de tests.

Protocoles élaborés

Pour élaborer mes protocoles, je me suis basé sur l’OBIA (Blaschke et al., 2014) qui correspond à une chaine de traitement. Tout d’abord, il y a un prétraitement des données puis les données sont segmentées avant d’être classifiées. Enfin, les résultats sont analysés.
Deux protocoles ont été élaborés : un premier protocole utilisant une classification non supervisée et un deuxième protocole basé sur une classification supervisée. Les deux protocoles ont le même « squelette » et seule l’étape de classification diffère.
Ainsi, la première étape de ces deux protocoles consistera à calculer les données utiles : la pente, la courbure, la rugosité et la hauteur relative. Ces descripteurs sont calculés à partir des logiciels de SIG (ArcGIS et/ou QGIS). (E1). Puis dans une deuxième étape, chaque donnée est segmentée individuellement grâce à l’algorithme Mean Shift (ArcGIS). (E2). Une fois toutes les segmentations réalisées, ces dernières formeront une image multi bandes (E3) avant l’étape de classification et d’analyse propre à chaque protocole.

Protocole 1 : Identification des PS par classification non supervisée (IPS-NS)

Dans ce protocole, les étapes citées précédemment (E1 à E3) sont réalisées. La classification, non supervisée est appliquée à l’image multibande, avec l’algorithme K-Means. K, correspondant au nombre de classes souhaitées que l’utilisateur détermine lui-même (Figure 21 – A).
La classification nous donne K classes, chacune avec des statistiques différentes. Ce qui nous permet d’identifier les PS grâce à la réalisation de nuage de points.

Protocole 2 : Identification des PS par classification supervisée (IPS-S)

Dans ce deuxième protocole (IPS-S) les étapes E1 et E3 sont exécutées comme dans le protocole précédent. La classification supervisée sera réalisée à partir de l’algorithme Random Forest (Figure 21 – B). Contrairement au protocole précédent, il faudra créer des échantillons d’apprentissage en parallèle de cette chaine de traitement afin de pouvoir utiliser Random Forest.
La classification nous donne alors des entités classifiées avec les classes données aux échantillons d’apprentissage. Les entités ont des propriétés similaires aux échantillons. Les calculs de matrices de confusion vont alors nous aider à analyser les résultats.

Résultats

Dans cette avant-dernière partie, les résultats des différentes étapes relatives aux protocoles élaborés seront présentés. Les deux protocoles ont été développés et testés tout d’abord sur les zones tests (ZT1 et ZT2) extraites de la zone d’étude africaine (résultats présentés en Annexe 1) puis sur la zone d’étude africaine entière (ZA) puisqu’il s’agit d’une zone bien connue des géologues ou de nombreux écrits ont été publiés. Le même travail est ensuite appliqué sur l’Argentine pour confronter les solutions proposées.
Pour vérifier les résultats obtenus, ceux-ci seront comparés avec la cartographie existante proposée par Dauteuil et al. (2015). De plus, les précisions obtenues sur les résultats seront présentées.

Zone de développement des protocoles : la Namibie/Afrique du Sud

Les deux protocoles proposés ont été testés pour différentes combinaisons de descripteurs en entrée : (1) H SL CU RU, (2) SL CU RU RH, (3) SL CU RU, (4) SL CU, (5) SL CU Texture (TE) et (6) SL CU sans le réseau hydrographique (SH). L’objectif de tester ces combinaisons de descripteurs est de déterminer ceux qui sont optimaux pour identifier les PS.
Pour chaque combinaison, les descripteurs ont été calculés, segmentés puis l’image multibande générée (cf. Figure 21). Ensuite, les paramètres nécessaires pour chaque algorithme de classification ont été déterminés : (1) K pour IPS NS, (2) les classes correspondant à des PS suite à la classification et (3) les échantillons d’apprentissage pour IPS S.

Détermination de K

Pour déterminer, le nombre de classes, K, la classification a été réalisée pour différents K, K allant de 2 à 10. Avec les différents résultats obtenus (Figure 22), une tendance s’affiche : les délimitations des classes sont similaires. Lorsque K est grand, de nouvelles classes sont créées à l’intérieur des classes, induisant un effet « courbes de niveau ». Le K choisi sera alors le K pour lequel les frontières des classes se fixent par rapport à K-1 et avant le K+n pour lequel le phénomène de « courbes de niveau » apparait.

Identification des PS par degré d’appartenance

En s’inspirant de la méthode de détermination du degré d’appartenance proposé par Haider et al. (2015), une fois K déterminé, les classes correspondant aux PS peuvent être identifiées.
Des nuages de points sont créés en fonction des descripteurs : H/SL, SL/CU, SL/RU, pour chaque classe (Figure 23).
Grâce aux propriétés morphométriques des PS, un degré d’appartenance est défini pour chacun des paramètres calculés et leur combinaison par multiplication permet de définir le degré d’appartenance à la catégorie PS. Ainsi, pour être identifiée comme une PS, en se basant sur la littérature existante (Haider et al., 2015 ; Liu et al., 2018), la classe doit avoir SL < 2 °, CU < 0,14 m -1 et RU < 75 m -1 (représenté par les contours noirs).
Le Tableau 7 résume les classes identifiées comme des PS pour chaque combinaison de descripteurs. L’Annexe 1 reprend l’ensemble des graphiques permettant de déterminer les classes.

Résultats

Les figures suivantes reprennent les résultats obtenus pour chaque combinaison de paramètres. Dans un premier temps pour le protocole IPS NS et dans un second temps pour le protocole IPS S.
Le premier protocole, IPS NS, identifie des PS mais ne permet pas de différencier s’il s’agit de pédiments (PS1) ou de etchplains (PS2). Les surfaces seront alors nommées PS0.X (X permettant de différencier les classes identifiées comme PS).

Application à une zone de contrôle : région Nord-Patagonienne (Argentine)

Le même travail que précédemment a été reproduit sur l’Argentine pour confirmer les résultats obtenus sur l’Afrique :
 Travail préliminaire pour définir K, les classes assimilables à des PS et la définition des échantillons d’apprentissage à partir des cartographies des PS existantes (Aguilera & Rabassa, 2010; Gonzales Diaz & Di Tommaso, 2011)
 Application des deux protocoles pour H SL CU RU, SL CU RU RH, SL CU RU, SL CU, SL CU TE
L’Annexe 2 reprend les différents résultats. Le résultat ci-dessous montre les PS identifiées pour la région située en Argentine Nord-Patagonienne.

Évaluation de la précision des résultats pour comparaison avec les cartographies existantes

Pour comparer les résultats entre eux et avec les cartes existantes, j’ai utilisé deux méthodes qui s’appliquent aux données et résultats obtenus. La première consiste à comparer les pourcentages d’occupation de chaque classe d’un résultat à un autre. La deuxième méthode est basée sur les matrices de confusion.

Méthode des pourcentages d’occupation par classe

Avec cette méthode, le pourcentage d’occupation de la carte pour chaque classe, pour ZA la zone d’étude africaine, est déterminé. Cela permet de comparer les résultats entre eux, mais aussi avec la cartographie existante, bien que la cartographie existante ne recouvre pas toute la zone d’étude (Tableau 8).

Matrice de confusion

Les matrices de confusion permettent de mesurer la qualité d’une classification. Elles comparent deux ensembles : la « vérité » terrain et la classification réalisée. Ici, la carte des PS de Dauteuil et al., 2015 est considérée comme la « vérité » terrain (elle contient seulement les classes PS1 et PS2, pas de classe divers) et les résultats du protocole IPS S pour ZA comme la classification réalisée. Il est difficile de calculer les matrices de confusion pour le protocole IPS NS puisque les classes obtenues sont différentes de la cartographie existante.
La lecture de chaque matrice nous indique combien d’objets sont bien classés et combien sont mal classés pour une classe donnée. L’abscisse représente la « vérité » terrain et l’ordonnée la classification. Par exemple : 60 056 points de la classe C_1 classés sont issus de la classe C_1 de la « vérité » terrain pour H SL CU RU.

Discussion

Les résultats précédents montrent la validité des deux protocoles à identifier des PS puisque nous obtenons des résultats cohérents avec les cartographies existantes. Bien que les résultats des deux protocoles soient différents à cause de la méthode de classification utilisée, non supervisée ou supervisée, les résultats sont exploitables et répondent à la problématique posée. Dans cette partie, nous reviendrons sur les différents résultats obtenus, mais aussi sur les limitations que les protocoles élaborés font surgir et les perspectives d’améliorations.

Performances globales

Interprétation des résultats

Les protocoles permettent d’utiliser des combinaisons de descripteurs différents en entrée.
Les résultats ont montré que les différentes combinaisons de descripteurs donnent différentes identifications des PS.
Pour la combinaison initialement utilisée, H SL CU RU, les résultats font apparaitre un phénomène de « courbes de niveau » (Figure 25 – A). Que ce soit pour l’Afrique ou pour l’Argentine, ce phénomène apparait nettement pour les deux protocoles proposés. L’attribut H aurait une importance trop forte dans l’identification des PS ? Une analyse en composante principale (ACP) montre qu’un des descripteurs a un degré d’importance élevé, 48 % contre 26 %, 24 % et 2 % pour les autres descripteurs. Ce paramètre serait donc la donnée H. En effet l’ACP réalisée ici ne permet pas de savoir quel pourcentage est associé à quel descripteur. Ainsi, H pourrait être exclue des données initiales pour l’identification des PS. RH, utilisée par Haider et al. (2015) peut être une donnée de substitution de H.
En effet, la donnée RH représente la différence d’altitude et peut se substituer à l’altitude et d’éliminer le phénomène de courbe de niveau. De plus, l’ACP (Figure 29) montre une corrélation entre SL et RU qui sera discutée plus loin.
Les résultats obtenus en remplaçant H par RH dans la combinaison des descripteurs précédents ne présentent pas de phénomène de « courbes de niveau ». Cependant, le résultat pour le protocole IPS S présente de nombreuses surfaces identifiées comme PS2 (Figure 26 – B). L’ACP avec ces quatre attributs montre ici qu’un descripteur a un fort degré d’importance, 74 %, et un paramètre a un degré d’importance très faible de 2 %.
L’ACP réalisée ne donnant pas le degré d’importance associé à chaque attribut, les différents tests permettront de déterminer l’association des descripteurs et de leurs degrés d’importance. De plus, l’ACP montre une corrélation entre RH, SL et RU (Figure 30).
Avec les trois descripteurs, SL, CU et RU, les résultats sont assez similaires à ceux obtenus avec SL CU RU RH. En comparant les cercles de corrélation (Figure 30), le descripteur RH serait donc celui qui a le moins d’importance. Ce dernier pourra être négligé par la suite.
L’ACP sur ces trois descripteurs montre toujours que SL et RU sont corrélés. Les degrés d’importance pour les descripteurs de cette combinaison sont de 64 %, 33 % et 3 %. Comme SL et RU sont corrélés, un des deux paramètres peut être mis de côté. SL est le paramètre principal caractérisant les PS, RU permet lui de distinguer différents types de PS, il pourra être négligé. Avant de négliger ce paramètre, RU a été calculé pour d’autre résolution (30 m, 180 m, 360 m et 720 m) et avec des méthodes de calcul différentes. En effet, le résultat de RU dépend de la résolution, l’identification des PS avec SL CU et RU à des résolutions différentes donne des résultats différents dont un exemple est présenté en Annexe 4. Ainsi le paramètre RU peut être exclu pour une résolution de 90 m, mais il pourrait être utilisé avec d’autres résolutions.
Les résultats obtenus pour SL et CU sont eux aussi similaires aux deux résultats précédents, démontrant ainsi que RU et RH ont une importance relativement faible dans l’identification des PS, ce qui est en accord avec les résultats des ACP (Figure 30). Les deux paramètres les plus propices à l’identification des PS sont donc SL et CU. Pour les deux protocoles, les résultats obtenus avec ces deux paramètres sont satisfaisants. L’ACP sur ces deux paramètres montre que leurs importances est presque égale dans l’identification et que leurs comportements respectifs sont décorrélé.

Précisions obtenues

Les précisions globales, obtenues avec les matrices de confusion, sont assez proches pour les différentes combinaisons de paramètres avec une précision minimale de 66 % et une précision maximale de 73 % (Tableau 9). La moyenne des précisions globales obtenues étant de 70,2 % pour l’ensemble des résultats.
Il est important de noter que ces précisions sont issues des matrices de confusion utilisant une cartographie des PS réalisée manuellement et pouvant comporter quelques biais liés à la subjectivité.
La meilleure précision obtenue, 73 % avec SL CU, semble être une précision relativement acceptable lorsqu’elle est comparée à la précision obtenue dans le cadre de développement de méthodes OBIA sur d’autres types d’objets géomorphologiques. Par exemple, dans ses travaux de recherche, Lewington (Lewington et al., 2019) développe et applique un protocole OBIA pour identifier des morphologies sous-glaciaires indicatrices de flux de glaces dans de paléo-calottes glaciaires. Ses tests de précision globale révèlent une valeur de 42 % de surfaces cartographiées manuellement identifiées par son protocole OBIA. La précision obtenue dans notre étude, supérieure à celle obtenue par Lewington, semble donc satisfaisante. Ces précisions supérieures pourraient en partie être expliquées par la différence de taille entre les objets identifiés (des surfaces plusieurs centaines de km² pour les PS et des couloirs de quelques dizaines de km de long pour les morphologies sous-glaciaires).

Objectivité et subjectivité des protocoles

Les deux protocoles élaborés diffèrent par leur étape de classification. Non supervisée pour un et supervisée pour l’autre. Le premier protocole, IPS NS, peut être qualifié de protocole « plus objectif ». En effet, le résultat est objectif dans le sens ou le protocole détermine luimême les différentes classes sans apports de l’utilisateur. Le deuxième protocole, IPS S, lui peut être qualifié de « plus subjectif », le résultat obtenu est basé sur les échantillons d’apprentissage définis par l’utilisateur et ses connaissances. Ainsi les deux protocoles permettent une identification différente en fonction des connaissances assimilées sur la zone d’étude. Pour une zone d’étude peu étudiée avec peu de connaissances, le protocole IPS NS sera plus adapté. Alors que pour une zone où de nombreux travaux existent déjà le protocole IPS S pourra être envisagé en fonction des connaissances.

Limitations

IPS NS et IPS S : Besoin d’interprétation ensuite

Une fois les résultats obtenus par les deux protocoles, le travail d’identification n’est pas terminé. Les résultats nécessitent d’être interprétés et plus particulièrement pour le protocole IPS NS qui donne un résultat objectif. Les résultats obtenus doivent ensuite être confrontés à d’autres données et connaissances géologiques. Par exemple, la confrontation avec une carte géologique permettra d’exclure ou non certains objets identifiés comme des PS. En effet, l’identification des PS identifie des objets morphologiques qui ont des caractéristiques similaires aux PS, mais qui n’en sont pas, comme des coulées volcaniques pour l’Argentine.
Ces dernières peuvent alors être écartées grâce à une carte géologique. De plus, la carte géologique permet de discriminer les différentes générations de PS.

IPS S : Définition des échantillons d’apprentissage

Une première limitation aux protocoles élaborés est la définition des échantillons d’apprentissage pour le protocole IPS S. En fonction des échantillons d’apprentissage définis, les résultats vont être différents. Ainsi pour une même zone d’étude, les échantillons d’apprentissage définis par deux utilisateurs peuvent être différents. Les résultats ne seront alors pas nécessairement les mêmes (30 % de différence Figure 32)

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des mat

ières
REMERCIEMENTS
LISTE DES ABREVIATIONS
GLOSSAIRE
TABLE DES MATIERES
INTRODUCTION
I GEOLOGIE / GEOMORPHOLOGIE
I.1 LES SURFACES D’APLANISSEMENT
I.1.1 Les surfaces quasi planes : pénéplaines, pédiments, et pédiplaines
I.1.1.1 Les pénéplaines
I.1.1.2 Les pédiments/pédiplaines
I.1.2 Les surfaces de corrosion : « etchplains » et « etch-surface »
I.2 ÉTAT DE L’ART DES METHODES DE CARTOGRAPHIES
I.2.1 Méthode manuelle
I.2.2 Méthodes d’identification semi-automatique orientée pixel
I.2.2.1 Méthode utilisant l’indice de position topographique
I.2.2.2 Méthode de classification floue selon 4 paramètres
I.2.3 Autres méthodes
I.3 DOMAINES D’APPLICATION EN GEOSCIENCES
I.3.1 Géologie, réservoir et hydrologie
I.3.2 Traçage de l’évolution de la déformation des surfaces continentales
I.4 CHOIX D’UNE ZONE TEST:LES ABORDS DU FLEUVE ORANGE (FRONTIERE AFRIQUE DU SUD/NAMIBIE)
II RAPPELS SUR LES METHODES DE SEGMENTATION ET DE CLASSIFICATION
II.1 LOGICIELS ET METHODES INTEGREES
II.2 FONCTIONNEMENT DES ALGORITHMES
II.2.1 Segmentation
II.2.2 Classification
II.3 COMPARAISON DES ALGORITHMES
II.3.1 Segmentation
II.3.2 Classification
II.3.3 Choix des algorithmes
III DONNEES UTILISEES ET PROTOCOLES ELABORES
III.1 CHOIX DES DONNEES
III.1.1 Namibie/Afrique du Sud
III.1.2 Argentine
III.2 PROTOCOLES ELABORES
III.2.1 Protocole 1 : Identification des PS par classification non supervisée (IPS-NS)
III.2.2 Protocole 2 : Identification des PS par classification supervisée (IPS-S)
IV RESULTATS
IV.1 ZONE DE DEVELOPPEMENT DES PROTOCOLES:LA NAMIBIE/AFRIQUE DU SUD
IV.1.1 Détermination de K
IV.1.2 Identification des PS par degré d’appartenance
IV.1.3 Choix des échantillons d’apprentissage
IV.1.4 Résultats
IV.1.4.1 IPS NS
IV.1.4.2 IPS S
IV.2 APPLICATION A UNE ZONE DE CONTROLE:REGION NORD-PATAGONIENNE (ARGENTINE)
IV.3 ÉVALUATION DE LA PRECISION DES RESULTATS POUR COMPARAISON AVEC LES CARTOGRAPHIES EXISTANTES
IV.3.1 Méthode des pourcentages d’occupation par classe
IV.3.2 Matrice de confusion
V DISCUSSION
V.1 PERFORMANCES GLOBALES
V.1.1 Interprétation des résultats
V.1.2 Choix du paramètre K
V.1.3 Précisions obtenues
V.1.4 Objectivité et subjectivité des protocoles
V.2 LIMITATIONS
V.2.1 IPS NS et IPS S : Besoin d’interprétation ensuite
V.2.2 IPS S : Définition des échantillons d’apprentissage
V.2.3 IPS S : Application d’arbre d’une zone à une autre
V.3 PERSPECTIVES D’AMELIORATIONS
CONCLUSION
BIBLIOGRAPHIE
Annexe 1 Résultats complémentaires pour l’Afrique
Annexe 2 Résultats complémentaires pour l’Argentine
Annexe 3 Statistiques et précisions pour l’Argentine
Annexe 4 Comparaison RU à différentes résolutions
LISTE DES FIGURES
LISTE DES TABLEAUX

Lire le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *