Approches de modélisation non-stationnaire : état de l’art

Approches de modélisation non-stationnaire : état de l’art

Le problème classique en géostatistique est la prédiction d’une grandeur physique d’intérêt (variable régionalisée) sur un domaine d’étude à partir d’un ensemble fini d’observations éventuellement espacées irrégulièrement. Pour résoudre ce problème, les observations sont considérées comme étant issues de la réalisation d’une fonction aléatoire Z = {Z(x), x ∈ G ⊆ Rp} définie sur un domaine fixe et continu G de l’espace euclidien Rp . La fonction aléatoire Z est très souvent modélisée sous une hypothèse de stationnarité de second ordre ou de stationnarité intrinsèque [Matheron, 1971]. Autrement dit, ses deux premiers moments peuvent s’écrire sous la forme : E(Z(x) − Z(y)) = 0, Cov(Z(x), Z(y)) = C(x − y) ou 1/2 V(Z(x) − Z(y)) = γ(x − y). De la sorte, la moyenne est constante à travers le domaine d’intérêt et la structure de dépendance spatiale (covariance ou variogramme) entre deux emplacements ne dépend que du vecteur de distance les séparant.

Dans certaines situations, il est approprié de modéliser la covariance ou le variogramme par une famille paramétrique stationnaire. Tandis que dans d’autres cas, les caractéristiques non-stationnaires sont apparentes et doivent être prises en considération afin d’obtenir une prédiction spatiale plus fiable. Par ailleurs, il a été remarqué que la stationnarité d’ordre 2 n’est pas toujours une hypothèse raisonnable même pour les fonctions aléatoires de moyenne constante et de variance homogène [Vanmarcke, 2010]. Un exemple remarquable est le processus de Wiener à 1D. La variance du processus augmentent linéairement avec la localisation. Et même après une standardisation du processus (moyenne nulle et variance unité), sa fonction de corrélation est non-stationnaire [Vanmarcke, 2010]. Le variogramme du processus quant à lui est stationnaire.

Dès lors que la structure de dépendance spatiale n’est plus stationnaire (varie spatialement), deux conséquences importantes surviennent. Premièrement, les modèles de variogramme ou covariance valides dans le cadre stationnaire ne peuvent plus s’appliquer directement. Deuxièmement, la fonction aléatoire ne s’auto réplique plus dans les différentes parties du domaine d’intérêt. Or, c’est cette répétition dans l’espace qui fournit, d’une certaine manière, l’équivalent de plusieurs réalisations de la même fonction aléatoire, permettant ainsi une certaine inférence statistique.

L’idée de base des approches non-stationnaires est que les paramètres variographiques (effet de pépite, palier, portée, anisotropie, . . . ) peuvent varier spatialement. Plusieurs approches ont été proposées pour rendre compte de la non-stationnarité dans les données géostatistiques. La littérature à ce sujet est récente. Dans ce chapitre, nous la passons en revue sous les rubriques suivantes : points sources, déformation d’espace, fonctions orthogonales empiriques, partitionnement, fenêtre glissante, convolution, lissage par noyau et équations aux dérivées partielles stochastiques. Nous décrivons chaque approche de modélisation et mettons en exergue leurs avantages et limites. Une attention particulière est portée sur les hypothèses de travail et l’inférence statistique. Nous montrons également au moyen de simulations à quoi peuvent ressembler des réalisations issues de certains de ces modèles non-stationnaires. Ce chapitre se termine par une vue synoptique des différentes approches. Pour une revue bibliographique synthétique et non exhaustive des approches de modélisation non-stationnaire voir : Guttorp and Schmidt [2013], Sampson [2010], Sampson [2006] et Schabenberger and Gotway [2005a].

Points sources

Lorsqu’on connait les mécanismes qui contribuent à la non-stationnarité d’un processus spatial, ceux-ci peuvent être incorporés dans un modèle de covariance. Tel est le cas d’un processus spatial piloté par l’action d’un nombre limité de sites ou de points sources. L’intérêt peut se trouver non seulement dans la prédiction du processus spatial mais aussi dans l’évaluation de l’effet des points sources. Cette approche a été introduite par Hughes-Oliver et al. [1998a] qui proposent un modèle de corrélation pour un processus spatial conduit par un ou plusieurs points sources. Un point source étant défini comme une entité qui pilote le processus spatial directement ou indirectement. Cette définition attribue au moins un point source à un processus spatial. Le modèle à un point source de Hughes-Oliver et al.

Bien que le modèle défini en (1.1) soit intéressant, sa validité reste à vérifier. En effet, comme toute covariance, elle doit être définie positive. Autrement dit, toute matrice de covariance induite par celle-ci doit être semi-définie positive. Cette condition implique des contraintes sur les trois paramètres du modèle. Selon Hughes-Oliver et al. [1998a], ces contraintes dépendent de la dimension du domaine d’intérêt et de la métrique utilisée. Il n’est pas aisé de déterminer les conditions nécessaires et suffisantes sur les paramètres du modèle assurant une définie positivité de la structure de covariance non-stationnaire. Toutefois, des conditions nécessaires peuvent être énoncées : tous les paramètres doivent être positifs (θ1 > 0, θ2 ≥ 0, θ3 ≥ 0). Une astuce trouvée par Hughes-Oliver et al. [1998a] est de dériver une condition suffisante sur le domaine d’intérêt et sur la distance utilisée qui assure la condition de définie positivité du modèle estimé (aux points d’observation), même si le modèle théorique ne l’est pas forcément. En effet, cette condition assure que la matrice de covariance aux points d’observation est une matrice à diagonale dominante  et donc semi-définie positive.

L’inférence statistique des paramètres du modèle est faite par maximum de vraisemblance restreint. Le modèle défini en (1.1) est appliqué par Hughes-Oliver et al. [1998b] pour la modélisation de dépôts chimiques en cours de fabrication de semi-conducteurs. D’autres applications potentielles de cette approche de modélisation sont par exemple : la contamination aux métaux lourds causés par les sites de tir ou la pollution de l’eau causée par les eaux usées des usines.

Hughes-Oliver and Gonzàlez-Farìas [1999] étendent le modèle défini en (1.1) en construisant une classe générale de modèles paramétriques non-stationnaires (à un seul point source) valides, où la mise à zéro de certains paramètres rend la classe stationnaire. Ils discutent des propriétés d’une famille particulière de cette catégorie générale (famille exponentielle). Pour cela, ils écrivent un processus spatial non stationnaire comme le produit ou la somme de deux processus spatiaux indépendants de moyenne nulle dont l’un est stationnaire et l’autre non-stationnaire. La covariance résultante est la somme ou le produit des covariances de ces processus spatiaux et est donc définie positive. La covariance de la composante stationnaire est définie comme appartenant à la famille exponentielle et celle de la composante non-stationnaire est obtenue à partir du processus non-stationnaire de Wiener. Les auteurs optent pour une décomposition multiplicative. La procédure d’inférence s’effectue toujours par maximum de vraisemblance. Il est possible d’effectuer des tests pour évaluer la significativité de l’ensemble des paramètres, de même que l’impact du point source. Cette dernière peut être évaluée en prenant comme hypothèse nulle une covariance stationnaire et en utilisant le test du rapport de vraisemblance. Ainsi, l’intérêt des modèles paramétriques non-stationnaires à points sources ne réside pas seulement dans la prédiction mais aussi dans le fait qu’ils permettent de tester l’impact d’un point source sur la moyenne, la variance ou la corrélation d’un processus spatial ; ce qui permet in fine de comprendre la non stationnarité. Hughes-Oliver and Gonzàlez-Farìas [1999] appliquent leur modèle à un ensemble de mesures de potentiels électriques prises dans un champ contenant un poteau en métal.

Hughes-Oliver et al. [2009] étendent le modèle de décomposition d’un processus spatial suggéré par Hughes-Oliver and Gonzàlez-Farìas [1999] et proposent une approche hiérarchique bayésienne. Ecker and Oliveira [2008] présentent un modèle similaire à celui étudié par Hughes-Oliver and Gonzàlez-Farìas [1999], mais ils combinent les deux composantes du processus spatial de façon additive plutôt que multiplicative. Une approche bayésienne est utilisée pour tirer des conclusions sur les paramètres du modèle. Les covariances des deux processus spatiaux sous jacents (stationnaire et non-stationnaire) sont définies dans la famille exponentielle. Le modèle est appliqué à une situation où il y a une externalité localisée dans une région qui influence le prix de vente des maisons (proximité de l’autoroute principale, d’une centrale nucléaire, d’un aéroport,. . . ). Ecker et al. [2013] améliorent le modèle de Ecker and Oliveira [2008]. Leur modèle n’a qu’un seul paramètre de plus que le modèle à structure de covariance stationnaire et il s’adapte mieux que le modèle à trois paramètres supplémentaires de Ecker and Oliveira [2008]. Le modèle est estimé dans le contexte bayésien et la méthode est illustrée sur le jeu de données utilisé par Ecker and Oliveira [2008] .

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

Introduction
Notations
1 Approches de modélisation non-stationnaire : état de l’art
1.1 Introduction
1.2 Points sources
1.3 Déformation d’espace
1.3.1 Modèle de base
1.3.2 Développements
1.3.3 Distance non-euclidienne
1.4 Fonctions orthogonales empiriques
1.5 Partitionnement et fenêtre glissante
1.5.1 Partitionnement
1.5.2 Fenêtre glissante
1.6 Convolution
1.6.1 Modèle continu
1.6.2 Modèle discret
1.6.3 Extensions
1.7 Lissage par noyau
1.7.1 Modèles locaux stationnaires pondérés
1.7.2 Variogramme (covariance) empirique lissé(e)
1.8 Équations aux dérivées partielles stochastiques
1.9 Conclusion
2 Modèle de déformation d’espace et inférence
2.1 Introduction
2.2 Description du modèle
2.3 Inférence statistique
2.3.1 Estimateur à noyau du variogramme
2.3.2 Construction de l’espace déformé
2.3.3 Estimation des paramètres fonctionnels
2.3.4 Réglages des hyper-paramètres
2.4 Prédiction
2.4.1 Krigeage
2.4.2 Simulation conditionnelle
2.5 Illustration
2.5.1 Exemple 1D
2.5.2 Exemple 2D
2.6 Conclusion
3 Modèle de convolution généralisé et inférence
3.1 Introduction
3.2 Définition du modèle
3.3 Classes de covariance non-stationnaire
3.4 Inférence statistique
3.4.1 Modélisation
3.4.2 Estimation des paramètres
3.4.3 Choix des hyper-paramètres
3.5 Prédiction
3.5.1 Krigeage
3.5.2 Simulation conditionnelle
3.6 Illustration
3.7 Conclusion
4 Synthèse – trois exemples d’application
4.1 Introduction
4.2 Application 1 : données de sol
4.3 Application 2 : données de pluie
4.4 Application 3 : données de topographie
4.5 Conclusion
Conclusions

Rapport PFE, mémoire et thèse PDFTélécharger le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *