L’assimilation de données
Problématique de l’assimilation de données
L’atmosphère est observée à l’aide de mesure. Les techniques de mesure les plus anciennes sont par exemple les mesures de la pression de surface, celles de la température ou encore celles du vent (direction et amplitude). Il y a aussi les techniques plus récentes telles que les mesures satellitaires de radiance, à partir desquelles il est possible de déduire le profil vertical de température, ou encore l’occultation GPS permettant de déduire le profil vertical d’humidité à partir de la réfraction dans l’atmosphère des signaux GPS.
Avec les notations usuelles, yo désigne le vecteur constitué de toutes ces observations, et xt désigne le vecteur d’état de l’atmosphère à un instant donné. L’indice t (pour true) indique ici qu’il s’agit de l’état exact, ou état vrai, pour l’instant considéré. Ce vecteur d’état désigne la représentation de l’atmosphère en machine. Un vecteur d’état x correspond donc à une représentation finie des champs sur la sphère et sur la verticale. Le passage d’un état du modèle à celui des observations est effectué à l’aide d’un opérateur d’observation H. Cet opérateur est généralement non linéaire. Il permet de transformer les quantités décrites par le modèle numérique (tourbillon, divergence, température, etc) en quantités mesurées (radiance, vent, etc).
Le problème de la spécification de l’état de l’atmosphère est celui de la détermination de l’état x tel que, pour les observations de l’atmosphère yo (que l’on peut supposer parfaites dans un premier temps), la relation suivante soit vérifiée :
yo = H(x). (2.1)
Ce problème est également désigné sous le nom de problème inverse. En effet, l’état vrai xt recherché est formellement donné par xt = H−1 (yo ), en supposant que l’opérateur H est directement inversible, ce qui n’est souvent pas le cas. Plusieurs difficultés rendent effectivement cette inversion difficile ou peu précise. Une première difficulté provient de la modélisation de l’atmosphère. L’atmosphère étant un milieu continu, sa représentation finie sous la forme d’un vecteur x induit des erreurs de représentativité, associées à la conversion (via l’opérateur H) de l’état x en vecteur d’observation y. Les erreurs de représentativité peuvent être associées à des problèmes d’interpolation, mais aussi à des défauts de modélisation (au niveau du transfert radiatif, par exemple). Une deuxième difficulté vient du fait que les observations sont entachées d’erreurs de mesure, induisant une erreur sur la détermination de l’état vrai. Un troisième problème est associé à l’hétérogénéité du réseau d’observation. En effet la densité spatio-temporelle des zones observées est inégale : il y a moins d’observations dans l’hémisphère Sud que dans l’hémisphère Nord, les zones océaniques sont très peu mesurées en surface (seulement quelques bateaux ou bouées). La conséquence est qu’il est plus difficile de déterminer l’état vrai dans l’hémisphère Sud ou sur les océans, qu’en Europe ou sur les États-Unis.
Par conséquent l’état vrai a peu de chances d’être effectivement obtenu, et le problème inverse se réduit à la détermination de l’état le plus proche de la réalité. Cet état est appelé état analysé, ou tout simplement analyse ; il est noté xa . L’erreur d’analyse εa est définie par xa = xt + εa.
L’analyse xa correspond donc à l’état le plus vraisemblable de l’atmosphère au vu des observations. Il n’y a pas si longtemps encore, cet état était construit à la main par les prévisionnistes (ou plutôt par les analystes). Ces professionnels ajustaient ainsi les isobares pour les faire correspondre au mieux avec les observations. Il s’agissait alors d’une analyse subjective de l’état de l’atmosphère. L’assimilation de données est utilisée dans la prévision météorologique pour déterminer de manière objective l’état analysé. Pour un jeu d’observations donné, l’analyse est l’unique état vérifiant certaines contraintes. Elle est généralement obtenue comme la solution d’un problème d’optimisation d’une certaine fonctionnelle. Ainsi, l’état résultant du processus d’assimilation de données est naturellement appelé analyse objective, en opposition à l’analyse subjective. Dans la suite, le terme analyse correspond à l’analyse objective. Le paragraphe suivant s’intéresse à la manière de construire cet état.
Estimation objective : le BLUE
Une méthode de prédiction/correction
Il existe différentes techniques pour déterminer l’état analysé. Pour les problèmes opérationnels, rencontrés en météorologie ou en océanographie, l’analyse est obtenue par une méthode de prédiction/correction. Ainsi, une ébauche (correspondant généralement à la dernière prévision) est ajustée à partir des observations. La raison de l’utilisation d’une approche prédiction/correction est double. D’une part, c’est une question de fermeture : le nombre d’observations disponibles est de l’ordre de p = O(10⁵ ) pour un vecteur d’état dont la taille est de l’ordre de n = O(10⁷ ). Il y a donc trop d’inconnues pour fixer l’état, le problème n’est pas fermé.
D’autre part, c’est une question de valeur ajoutée : il apparaît en pratique que l’ébauche apporte effectivement de l’information. Ceci est associé au fait que les prévisions sont en général de bonne qualité, et fournissent effectivement une information utile dans la recherche de l’analyse. C’est au fond cette deuxième raison qui prévaut sur la première. En effet, si l’ébauche n’apportait pas d’information supplémentaire, alors elle ne serait d’aucune utilité. L’unique solution serait de se ramener à un problème fermé : par exemple, ajuster la résolution du modèle pour éviter l’indétermination.
L’introduction de nouvelle inconnues
L’utilisation de cette approche de prédiction/correction induit de nouvelles inconnues qui sont la matrice de covariance d’erreur d’observation et la matrice de covariance d’erreur d’ébauche. L’erreur d’observation εo est définie comme l’écart entre la vérité vue dans l’espace des observations et les observations :
yo = H(xt ) + εo . (2.2)
En pratique, cette erreur est supposée nulle en moyenne, ce qui s’exprime formellement par E(εo ) = 0 où E désigne l’espérance mathématique. L’origine de cette erreur provient de deux contributions. La première contribution correspond à l’erreur de mesure : deux thermomètres, même identiques, ne donnent jamais la même température. En pratique les origines de l’incertitude peuvent être multiples. Cela peut venir par exemple de la présence d’eau au voisinage d’un capteur embarqué à bord d’un satellite. L’autre contribution correspond à l’erreur de représentativité : la résolution du modèle est finie, et il n’est pas rare de réaliser une mesure en un point ne correspondant pas à un point de grille du modèle. Cette erreur est donc associée aux interpolations, et aux autres défauts de l’opérateur d’observation H. Par exemple, un satellite observe la présence d’un nuage en un point intérieur à la maille du modèle, et pas de nuage ailleurs. Si le modèle est sec sur la maille, comme il ne « voit » pas ce qui est inférieur à sa maille, l’opérateur d’observation indiquera que l’intérieur de la maille est sèche, ce qui n’est pas le cas dans la réalité.
|
Table des matières
1 Introduction
2 Assimilation de données et rôle de B
2.1 L’assimilation de données
2.1.1 Problématique de l’assimilation de données
2.1.2 Estimation objective : le BLUE
2.2 Information contenue dans les covariances d’erreur d’ébauche
2.2.1 Fonctions de covariance
2.2.2 Variance et écart type
2.2.3 Fonctions et matrice de corrélation
2.2.4 Longueur de portée
2.3 Filtrage et propagation de l’innovation
2.3.1 Assimilation d’une seule observation
2.3.2 Filtrage et propagation dans le formalisme du BLUE
2.3.3 Commentaires sur l’opérateur KH
2.3.4 Illustration sur le cercle
2.4 Équations du filtre de Kalman-Bucy
2.4.1 Distribution de probabilité et échantillonnage
2.4.2 Évolution temporelle de l’erreur d’analyse et l’erreur modèle
2.4.3 Filtre de Kalman-Bucy
2.4.4 Exemple de dynamique des covariances sur le cercle
2.5 Des stratégies pour résoudre le BLUE
2.6 Schémas de résolution variationnelle
2.6.1 Schéma 3D-Var/3D-Inc
2.6.2 Schéma 4D-Var/4D-Inc
2.6.3 Schéma 3D-FGAT
2.7 Description de la prévision à Météo-France
2.7.1 Modèle global Arpège
2.7.2 Cycle journalier d’analyses et de prévisions
2.7.3 Réseau d’observations
2.7.4 Schéma d’assimilation opérationnel
2.7.5 Spécification des statistiques d’erreur
2.8 Conclusions
3 Estimation et modélisation de la matrice B
3.1 Estimation de la matrice B
3.1.1 Principe de la méthode basée sur un ensemble d’assimilations perturbées
3.1.2 Formalisme des ensembles d’assimilations perturbées
3.1.3 Liens entre la matrice de gain utilisée et le filtrage spatio-temporel des covariances de l’ensemble
3.1.4 Articulation entre l’optimisation du filtrage et l’utilisation des nouvelles covariances filtrées
3.1.5 Mise en oeuvre avec un ensemble 3D-FGAT
3.2 Caractéristiques de la matrice B dans l’atmosphère
3.2.1 Expression formelle de la matrice B
3.2.2 Diagnostic de l’hétérogénéité
3.2.3 Non-séparabilité verticale
3.2.4 Aspects multivariés : influence des relations de balance
3.2.5 Dépendance à l’écoulement
3.3 Modélisation de la matrice B (auto-covariances)
3.3.1 Hypothèse diagonale spectrale
3.3.2 Illustration de l’hypothèse diagonale sur le cercle
3.3.3 Formulation ondelette
3.4 Conclusions
4 Conclusion