L’assimilation de données
Problématique de l’assimilation de données
L’atmosphère est observée à l’aide de mesure. Les techniques de mesure les plus anciennes sont par exemple les mesures de la pression de surface, celles de la température ou encore celles du vent (direction et amplitude). Il y a aussi les techniques plus récentes telles que les mesures satellitaires de radiance, à partir desquelles il est possible de déduire le profil vertical de température, ou encore l’occultation GPS permettant de déduire le profil vertical d’humidité à partir de la réfraction dans l’atmosphère des signaux GPS. Avec les notations usuelles, y° désigne le vecteur constitué de toutes ces observations, et x t désigne le vecteur d’état de l’atmosphère à un instant donné. L’indice t (pour true) indique ici qu’il s’agit de l’état exact, ou état vrai, pour l’instant considéré. Ce vecteur d’état désigne la représentation de l’atmosphère en machine. Un vecteur d’état x correspond donc à une représentation finie des champs sur la sphère et sur la verticale. Le passage d’un état du modèle à celui des observations est effectué à l’aide d’un opérateur d’observation H. Cet opérateur est généralement non linéaire. Il permet de transformer les quantités décrites par le modèle numérique (tourbillon, divergence, température, etc) en quantités mesurées (radiance, vent, etc).
Le problème de la spécification de l’état de l’atmosphère est celui de la détermination de l’état x tel que, pour les observations de l’atmosphère y° (que l’on peut supposer parfaites dans un premier temps), la relation suivante soit vérifiée :
y° = H(x). (2.1)
Ce problème est également désigné sous le nom de problème inverse. En effet, l’état vrai xt recherché est formellement donné par xt = H−1 (y° ), en supposant que l’opérateur H est directement inversible, ce qui n’est souvent pas le cas. Plusieurs difficultés rendent effectivement cette inversion difficile ou peu précise.
Une première difficulté provient de la modélisation de l’atmosphère. L’atmosphère étant un milieu continu, sa représentation finie sous la forme d’un vecteur x induit des erreurs de représentativité, associées à la conversion (via l’opérateur H) de l’état x en vecteur d’observation y. Les erreurs de représentativité peuvent être associées à des problèmes d’interpolation, mais aussi à des défauts de modélisation (au niveau du transfert radiatif, par exemple). Une deuxième difficulté vient du fait que les observations sont entachées d’erreurs de mesure, induisant une erreur sur la détermination de l’état vrai. Un troisième problème est associé à l’hétérogénéité du réseau d’observation. En effet la densité spatio-temporelle des zones observées est inégale : il y a moins d’observations dans l’hémisphère Sud que dans l’hémisphère Nord, les zones océaniques sont très peu mesurées en surface (seulement quelques bateaux ou bouées). La conséquence est qu’il est plus difficile de déterminer l’état vrai dans l’hémisphère Sud ou sur les océans, qu’en Europe ou sur les États-Unis.
Par conséquent l’état vrai a peu de chances d’être effectivement obtenu, et le problème inverse se réduit à la détermination de l’état le plus proche de la réalité. Cet état est appelé état analysé, ou tout simplement analyse ; il est noté xa . L’erreur d’analyse εa est définie par xa = xt + εa .
L’analyse xa correspond donc à l’état le plus vraisemblable de l’atmosphère au vu des observations. Il n’y a pas si longtemps encore, cet état était construit à la main par les prévisionnistes (ou plutôt par les analystes). Ces professionnels ajustaient ainsi les isobares pour les faire correspondre au mieux avec les observations. Il s’agissait alors d’une analyse subjective de l’état de l’atmosphère. L’assimilation de données est utilisée dans la prévision météorologique pour déterminer de manière objective l’état analysé. Pour un jeu d’observations donné, l’analyse est l’unique état vérifiant certaines contraintes. Elle est généralement obtenue comme la solution d’un problème d’optimisation d’une certaine fonctionnelle. Ainsi, l’état résultant du processus d’assimilation de données est naturellement appelé analyse objective, en opposition à l’analyse subjective. Dans la suite, le terme analyse correspond à l’analyse objective. Le paragraphe suivant s’intéresse à la manière de construire cet état.
Estimation objective : le BLUE
Une méthode de prédiction/correction
Il existe différentes techniques pour déterminer l’état analysé. Pour les problèmes opérationnels, rencontrés en météorologie ou en océanographie, l’analyse est obtenue par une méthode de prédiction/correction. Ainsi, une ébauche (correspondant généralement à la dernière prévision) est ajustée à partir des observations. La raison de l’utilisation d’une approche prédiction/correction est double. D’une part, c’est une question de fermeture : le nombre d’observations disponibles est de l’ordre de p = O(10⁵ ) pour un vecteur d’état dont la taille est de l’ordre de n = O(10⁷ ). Il y a donc trop d’inconnues pour fixer l’état, le problème n’est pas fermé.
D’autre part, c’est une question de valeur ajoutée : il apparaît en pratique que l’ébauche apporte effectivement de l’information. Ceci est associé au fait que les prévisions sont en général de bonne qualité, et fournissent effectivement une information utile dans la recherche de l’analyse. C’est au fond cette deuxième raison qui prévaut sur la première. En effet, si l’ébauche n’apportait pas d’information supplémentaire, alors elle ne serait d’aucune utilité. L’unique solution serait de se ramener à un problème fermé : par exemple, ajuster la résolution du modèle pour éviter l’indétermination.
Information contenue dans les covariances d’erreur d’ébauche
La matrice de covariance B contient des informations complexes sur les liens statistiques existant pour l’erreur de prévision en chaque degré de liberté du modèle (par exemple la valeur d’un champ physique en un point de la grille du modèle est un degré de liberté du modèle). Ces liens statistiques sont décrits par les fonctions de covariance, également appelées fonctions de structure. Une fonction de structure caractérise ainsi le lien statistique existant entre un degré de liberté donné et tous les autres degrés de liberté du modèle. En particulier, cette fonction est tridimensionnelle spatialement.
Fonctions de covariance
Une fonction de covariance fx(y) relative à un point x est définie comme étant la distribution des covariances cov(x, y) = E ε b (x)ε b (y) pour un point courant y sur le domaine. Dans le cas de l’exemple de matrice de covariance de la figure 2.1, les fonctions de covariance correspondent aux colonnes de la matrice. Quelques fonctions de covariance sont représentées sur la figure 2.2-(a). Sur cette figure, chaque courbe colorée est une fonction de covariance. Le domaine circulaire étant périodique, une partie de la covariance associée à la position 0◦ (courbe colorée en bleu) se prolonge au voisinage de 360 ◦ . En comparant les fonctions de covariance entre elles, il apparaît qu’elles ont des maxima et des extensions spatiales différentes. Les maxima correspondent aux variances, tandis que l’extension spatiale est caractérisée par la longueur de portée. En effet, les fonctions de covariance au centre du domaine (vers 180 ◦ ) sont plus étroites et d’amplitude plus forte que les fonctions au début du domaine (vers 0◦ ). Décrivons les deux informations de variance et de portée.
|
Table des matières
1 Introduction
2 Assimilation de données et rôle de B
2.1 L’assimilation de données
2.1.1 Problématique de l’assimilation de données
2.1.2 Estimation objective : le BLUE
2.2 Information contenue dans les covariances d’erreur d’ébauche
2.2.1 Fonctions de covariance
2.2.2 Variance et écart type
2.2.3 Fonctions et matrice de corrélation
2.2.4 Longueur de portée
2.3 Filtrage et propagation de l’innovation
2.3.1 Assimilation d’une seule observation
2.3.2 Filtrage et propagation dans le formalisme du BLUE
2.3.3 Commentaires sur l’opérateur KH
2.3.4 Illustration sur le cercle
2.4 Équations du filtre de Kalman-Bucy
2.4.1 Distribution de probabilité et échantillonnage
2.4.2 Évolution temporelle de l’erreur d’analyse et l’erreur modèle
2.4.3 Filtre de Kalman-Bucy
2.4.4 Exemple de dynamique des covariances sur le cercle
2.5 Des stratégies pour résoudre le BLUE
2.6 Schémas de résolution variationnelle
2.6.1 Schéma 3D-Var/3D-Inc
2.6.2 Schéma 4D-Var/4D-Inc
2.6.3 Schéma 3D-FGAT
2.7 Description de la prévision à Météo-France
2.7.1 Modèle global Arpège
2.7.2 Cycle journalier d’analyses et de prévisions
2.7.3 Réseau d’observations
2.7.4 Schéma d’assimilation opérationnel
2.7.5 Spécification des statistiques d’erreur
2.8 Conclusions
3 Estimation et modélisation de la matrice B
3.1 Estimation de la matrice B
3.1.1 Principe de la méthode basée sur un ensemble d’assimilations perturbées
3.1.2 Formalisme des ensembles d’assimilations perturbées
3.1.3 Liens entre la matrice de gain utilisée et le filtrage spatio-temporel des covariances de l’ensemble
3.1.4 Articulation entre l’optimisation du filtrage et l’utilisation des nouvelles covariances filtrées
3.1.5 Mise en oeuvre avec un ensemble 3D-FGAT
3.2 Caractéristiques de la matrice B dans l’atmosphère
3.2.1 Expression formelle de la matrice B
3.2.2 Diagnostic de l’hétérogénéité
3.2.3 Non-séparabilité verticale
3.2.4 Aspects multivariés : influence des relations de balance
3.2.5 Dépendance à l’écoulement
3.3 Modélisation de la matrice B (auto-covariances)
3.3.1 Hypothèse diagonale spectrale
3.3.2 Illustration de l’hypothèse diagonale sur le cercle
3.3.3 Formulation ondelette
3.4 Conclusions
4 Propriétés de filtrage des ondelettes pour les corrélations locales d’erreur de prévision
4.1 Introduction
4.2 Moyennage spatial en ondelette des fonctions de covariance
4.2.1 Fonctions de covariance
4.2.2 Approche diagonale spectrale : une moyenne spatiale sur tout le domaine
4.2.3 Approche diagonale ondelette : une série de moyennes spatiales locales
4.2.4 Isotropie des ondelettes et de la moyenne spatiale des covariances
4.2.5 Détails de l’approche diagonale ondelette
4.3 Propriétés de filtrage des ondelettes dans un contexte analytique 1D
4.3.1 Matrice de covariance hétérogène analytique 1D
4.3.2 Échantillonnage de Ba et produit de Schur
4.3.3 Filtrage ondelette des fonctions de corrélation et de leurs variations
4.3.4 Expériences d’assimilation de données
4.4 Application à un ensemble de prévisons Arpège
4.4.1 Description de l’ensemble de prévisions Arpège sur le globe
4.4.2 Carte des portées « climatologiques »
4.4.3 Carte des portées pour un jour donné
4.5 Conclusions
4.6 Annexes
4.6.1 Annexe A : Formulation de la moyenne spatiale locale des covariances
4.6.2 Annexe B : Construction de B−1/2 w et de B 1/2 w
4.6.3 Annexe C : Illustration dans l’espace des ondelettes des propriétés de filtrage
5 Conclusion