Squelette du courant-jet obtenu par morphologie mathématique

Télécharger le fichier pdf d’un mémoire de fin d’études

Sélection et classification de structures

Caractéristiques

Les algorithmes de classification reposent sur une description des structures par un vecteur de caractéristiques de dimensions réduites, noté w ∈ Rq . Ces caractéristiques peuvent être classées en niveaux croissants de complexité algorithmique (Pankiewicz 1995) :
• spectrales, typiquement la température de brillance dans différents canaux ;
• texturales, décrivant l’organisation spatiale de pixels voisins ;
• spatiales, associées à la segmentation de l’image en cellules ;
• contextuelles, associées aux relations entre des structures.
On cherche à répartir les structures dans des classes ci en partitionnant l’espace des vec-teurs de caractéristiques. On effectue un apprentissage supervisé quand, sur un échan-tillon d’apprentissage, on associe les réalisations des éléments des classes et leurs ca-ractéristiques. A l’inverse, on peut aussi demander à l’algorithme de définir lui-même des classes. Il s’agit alors d’une partition effectuée automatique dans l’espace des ca-ractéristiques, ou apprentissage non-supervisé (voir par exemple le cas du suivi et de la définition des classes de dépressions atlantiques par Ayrault (1998)). Nous voulons dans notre cas effectuer une sélection supervisée des intrusions sèches.

Performance d’une sélection

Un cadre statistique approprié existe quand on peut évaluer, sur l’échantillon d’appren-tissage, les probabilités des caractéristiques sur les différentes classes ci (notamment lorsqu’elles sont gaussiennes, c.f. figure 1.10). Une structure associée à la réalisation du vecteur de caractéristiques w0 est attribuée à la classe j présentant la plus forte probabilité suivant la loi de Bayes : P(c w ) = P(w0|cj ) P(cj ) (1.3).
Pour certaines applications, il peut être très dommageable de mal classer certaines cellules. Plutôt que de choisir une frontière optimale en termes de probabilité, on peut estimer que l’on préfère avoir moins de bonnes détections mais un taux de mauvais classements réduit. Cela revient à déplacer la frontière dans la figure 1.10. Enfin dans le cas où les distributions des caractéristiques ne sont pas gaussiennes, on peut décider de la frontière en évaluant les bonnes détections et mauvais choix (ou fausses alarmes).
Plus précisément, lors d’une sélection (c’est-à-dire d’une partition en deux classes), la frontière de décision à l’intersection des contours d’équiprobabilité peut s’écrire sous forme paramétrique F(w) = 0 où F(w) < 0 classe la structure associée à w dans la classe c1 et inversement pour c2. On définit les probabilités de bonne détection et de fausses alarmes par
POD = P F(w) < 0|w ∈ c1 (1.4).
FAR = P w ∈ c2|F(w) < 0 (1.5).

Filtres de sélection satellitaires

Michel et Bouttier (2006) appliquent ce principe à des images satellites issues des ca-naux vapeur d’eau 6.3 m MVIRI de METEOSAT 7 et 6.7 m de GOES 12, tout en mentionnant l’application aux canaux vapeur d’eau 6.2 m et 7.3 m SEVIRI de MSG. Nous présentons ici l’application de ces principes directement à de nouveaux échantillons pour l’imagerie du canal 6.2 m. De manière générale, la méthode de sé-lection des filtres diffère légèrement des approches traditionnelles visant à établir une caractérisation climatologique des structures (Morel 2001, Morel et Sénési 2002a;b). En effet, dans ces cas–là, on dispose des trajectoires entières pour faire une décision. Une approche visant, comme application, l’assimilation de données en temps réel, doit au contraire établir sa décision le plus tôt possible, et si possible dans une durée inférieure à la fenêtre temporelle d’assimilation. Par ailleurs il est difficile de définir une vérité terrain objective (comme les impacts de foudre pour les systèmes convectifs) permet-tant de calculer les taux de fausses alarmes (équation 1.5). La disponibilité de produits ozone issu du canal 9.7 m de MSG pourrait permettre de définir un critère pour éva-luer ce taux ; en attendant nous effectuons des décisions basées sur un examen visuel des champs dynamiques de l’atmosphère pour définir les intrusions sèches ayant un rôle dynamique, ce qui limite la taille de l’échantillon de vérification.

Durée de vie

La durée minimale des trajectoires détectées dans l’échantillon d’apprentissage (Michel et Bouttier 2006, Table 1) est de douze heures, confirmant la persistance de ces structures (elle-même reliée aux propriétés de conservation du tourbillon potentiel). De nombreuses cellules indésirables ne durent par contre que quelques heures. Un filtre sur la durée est très efficace, mais l’approche, retenue ici, d’une application potentielle à l’assimilation de données implique de choisir un seuil aussi bas que possible (certainement inférieur à six heures qui est la durée de la fenêtre temporelle). La figure 1.11 présente les distributions des durées de vie dans l’échantillon d’apprentissage. On y voit que les intrusions sèches sont persistantes, d’une durée médiane de vingt heures, tandis que beaucoup de cellules détectées par RDT ont une durée inférieure à trois heures (environ 70%). Une durée de trois heures semble un bon compromis. Elle permet d’éliminer 70% des cellules détectées, tout en conservant 97% des intrusions sèches. Ce filtre n’est néanmoins pas suffisant car de nombreuses cellules indésirables sont encore présentes.

Problématique de l’assimilation de données et des structures cohérentes

L’assimilation de données compare les observations y et le modèle H(xb) au même em- placement géographique. Quand l’ébauche est affectée d’une erreur de positionnement d’une structure météorologique, l’analyse peut incorporer une correction inappropriée, ou distordue (Ravela et al. 2007). Cela arrive à la fois au cas par cas, et éventuellement de manière systématique si les erreurs d’ébauche ne sont pas de distribution gaussienne.
Par ailleurs, certaines observations sont naturellement disponibles sous la forme d’observations de la position d’une structure. C’est notamment le cas pour les cyclones tropicaux. Nous n’avons pas de restriction dans le formalisme de l’assimilation varia- tionnelle qui nous empêche d’utiliser des opérateurs d’observation de la position d’une structure cohérente autre que le problème de la non-linéarité et de la non-gaussianité des erreurs. Une première piste pouvant être explorée consiste donc à spécifier un opérateur d’observation de position non-linéaire. Le problème est que l’assimilation variationnelle requiert le gradient de H par rapport à l’état du modèle, qui peut ne pas exister (en particulier la définition du centre d’un cyclone tropical est une fonction non-dérivable par rapport à l’image, qui fait intervenir des algorithmes de traitement d’image compor- tant de nombreux seuils (Olander et Velden 2007)). Chen et Snyder (2007) ont souligné que dans un filtre de Kalman d’ensemble (EnKF), les matrices de covariances BHT et  HBHT de l’équation d’analyse sont évaluées sur un ensemble d’états, et peuvent donc être calculées en utilisant l’opérateur d’observation H complet, même s’il n’est pas différentiable :
BHT ≃ Cov ? xb,H(xb) (2.6)
HBHT ≃ Cov ? xb,H(xb) (2.7
Ils étudient ensuite des observations de tourbillon destinées à déplacer un vortex dans un modèle barotrope. L’opérateur d’observation mesure la position de maximum de tourbillon. Bien qu’évitant la différentiation explicite des opérateurs d’observations, l’EnKF dépend toujours de l’hypothèse de linéarisation. Chen et Snyder (2007) montrent que le succès de la méthode dépend des erreurs de position du vortex dans l’ébauche : quand cette dernière est trop éloignée de la réalité, les incréments linéaires en amplitude de l’EnKF sont fortement distordus (asymétrie prononcée, création de vortex fantômes. . . ).
La difficulté d’incorporer des observations de position n’est pas le seul motif d’intérêt pour le développement de procédures d’assimilation complémentaires. Une des hypothèses principales de l’ensemble des systèmes d’assimilation opérationnels concerne le caractère gaussien de la distribution des erreurs d’ébauche et d’observation.
La loi normale permet en effet de bien représenter les erreurs quand celles-ci sont aléatoires et dues à la superposition de nombreuses causes relativement indépendantes (en vertu du théorème de la limite centrale). Cependant cette loi n’est plus adaptée quand parmi ces causes d’erreur, l’une est dominante statistiquement. Par exemple, l’erreur liée au nuage domine généralement le comportement statistique de l’innovation des radiances, qui présente un caractère non-gaussien marqué. Les structures cohérentes réduisent elles-aussi la dimension de l’espace des erreurs, et peuvent donc imposer leur loi de distribution d’erreur. Si le positionnement de la structure suit une erreur de déplacement de distribution gaussienne, alors il est fréquent que l’erreur totale ne soit plus de distribution gaussienne.
Un exemple, inspiré de Lawson et Hansen (2005) et Ravela et al. (2007), est repré- senté sur la figure 2.2. Sur le panneau (a), on représente la vérité (trait noir gras), et des translations aléatoires qui obéissent à un tirage statistique gaussien (courbes grises). Le panneau (b) trace les différences entre les courbes translatées et la vérité, c’est-à-dire les erreurs d’ébauche. La moyenne de l’erreur d’ébauche est représentée en pointillés. On voit très clairement que les erreurs d’ébauche adoptent une distribution non gaussienne, et même biaisée. Les panneaux (c) et (d) illustrent les histogrammes obtenus au centre (s = 0) et sur un bord de la structure (s = 3). Au centre, l’ébauche sous-estime toujours le maximum de la fonction. Même si l’on pouvait estimer un tel biais, l’histogramme est vraiment de structure non-gaussienne, avec une occurrence marquée des fortes erreurs dans la distribution. Au bord (s = 3), on voit qu’il existe une probabilité importante d’avoir de fortes erreurs, qui ne peut pas être représentée par une loi gaussienne. Le panneau (e) représente la matrice B des covariances d’erreurs d’ébauche. Il s’agit de la 44 troncature, à l’ordre deux, de la distribution réelle des erreurs décrite par les panneaux (b), (c) et (d). Statistiquement, on voit que les erreurs sont spatialement anti-corrélées à partir d’une certaine distance, de manière à “déplacer” la structure présente dans l’ébauche. Le problème est que cette correction est symétrique, alors que les distribu- tion réelles sont très asymétriques. Le panneau (f) présente une analyse typiquement distordue, qui ne respecte pas la forme spatiale des ébauches, à cause de la troncature aux deux premiers moments de la distribution réelle des erreurs.

Formulations alternatives du modèle d’erreur

Une littérature croissante s’intéresse à des algorithmes d’assimilation alternatifs qui permettent d’initialiser les structures cohérentes dans l’espace des positions (Lawson et Hansen 2005, Ravela et al. 2007, Beezley et Mandel 2008). Ils partagent tous l’idée que l’analyse doit s’exprimer comme une translation – ou plus généralement une déformation – de l’ébauche. Dans ce cadre, les observations de position présentent l’avantage d’être directement assimilables. Lawson et Hansen (2005) étudient un modèle d’erreur où la réalité xt est la combinaison d’un déplacement de l’ébauche xb et d’une erreur en amplitude ǫA : xb = xt ? s + ǫD + ǫA (2.8) où s désigne la coordonnée spatiale. L’erreur de position ǫD peut être un champ vecto- riel, ou plus simplement un scalaire. Il est alors judicieux de rechercher l’analyse comme déformation de l’ébauche, à laquelle on rajoute éventuellement un terme d’amplitude classique : xa = xb ? s + δsa + δxA (2.9)
Ravela et al. (2007) formulent le problème précédent dans le cadre probabiliste bayésien.
L’idée est qu’il faut estimer l’état du modèle étendu par le vecteur de déplacement δs.
La probabilité cet l’état (x, δs) s’écrit : P(x, δs|y) ∝ P(y|x, δs)P(x|δs)P(δs) (2.10)
• le premier terme P(y|x, δs), est équivalent à une mesure de l’écart entre les observations et l’état déplacé. Traditionnellement (c’est-à-dire avec δs = 0) et sous l’hypothèse gaussienne, P(y|x) ∝ e−1 2 (y−Hx)TR−1(y−Hx) (2.11)
Ici, il faut comparer les observations au champ x déplacé, c’est-à-dire remplacer x par x(s + δs) dans l’équation précédente.
• le second terme est l’écart de l’état déplacé à l’ébauche, soit sous l’hypothèse gaussienne P(x|δs) ∝ e−1 2 ? x(s+δs)−xb)TB−1 δs ? x(s+δs)−xb) (2.12).

Une distribution d’erreur d’ébauche influencée par des erreurs de position

Comme rapporté par Lawson et Hansen (2005), les méthodes linéaires ou quasi-linéaires peuvent produire des états d’analyse dégradés dès lors que la distribution de ǫb n’est plus gaussienne. Cela arrive notamment si l’ébauche est affectée d’erreurs de positionnement de structures lagrangiennes cohérentes ou de fronts, qui induisent une distribution non- gaussienne pour ǫb. Cela est fondamentalement du au fait que la structure cohérente peut dominer les erreurs d’ébauche ou d’observation et imposer sa loi de distribution, rendant celle-ci non gaussienne. Nous illustrons ceci dans le cas simple du positionne- ment de la tropopause dynamique, en considérant une ébauche ayant un profil idéalisé mais réaliste en tourbillon potentiel (figure 2.3a) et présentant une incertitude en position.
L’hypothèse sous-jacente à cette formulation (simpliste) est que l’erreur d’ébauche en tourbillon potentiel est dominée par l’erreur de positionnement de la tropopause. Ce paragraphe illustre l’impact sur les erreurs en tourbillon potentiel d’une erreur de po- sitionnement de la tropopause, de manière similaire au cas du maximum présenté sur la figure 2.2.
Pour cela, nous utilisons un profil simple en PV inspiré de Juckes (1994) : la tropopause est représentée comme une frontière matérielle séparant la stratosphère et la troposphère de fréquences de Brünt-Vaisala respective Ns et Nt = Nt/2. A l’ordre 0 en nombre de Rossby, comme démontré par Guérin et al. (2006), le tourbillon potentiel est dominé par le terme de stabilité statique de l’état de base, soit PV ≃ (f + ξ) ∂θ ∂z ∂PV ∂z ≃ PV N2 s,t g.

Lien PV-WV : un résumé des études précédentes

L’importance du tourbillon potentiel dans la cyclogenèse (Hoskins et al. 1985), la mise en oeuvre de méthodes d’inversion du tourbillon potentiel (Arbogast 1998) et le lien entre vapeur d’eau et tourbillon potentiel (Santurette et Georgiev 2005) ont conduit à initialiser les modèles à partir de différences entre champs en PV et images satellites dans le canal vapeur d’eau (Demirtas et Thorpe 1999).
Pankiewicz et al. (1999) étudient la relation PV-WV à l’aide d’un réseau de neurones. Constatant comme Appenzeller et Davies (1992), Mansfield (1996), Røsting et al. (1996), Demirtas et Thorpe (1999), Georgiev (1999) que la relation est complexe, ils établissent un certain nombre de facteurs climatologiques intervenant : latitude, longitude, jour de l’année, valeur de l’imagerie dans les canaux vapeur d’eauet infrarouge. Une régression linéaire donne une corrélation de l’ordre de 0.5 entre le PV sur l’isopotentielle 315K et ces différents champs. Malgré un entraînement portant sur 17500 cas, la restitution du PV sur la surface 315K par le réseau de neurone demeure erronée, notamment pour les faibles valeurs de PV.
Un cas d’étude mené par Georgiev (1999) cherche à corréler les valeurs de PV à diffé- rents niveaux isobares avec les radiances vapeur d’eau dans des zones géographiquement limitées (correspondant à deux anomalies de tropopause) avec un seuil de sélection pour le tourbillon potentiel. La corrélation est de l’ordre de 0.5 à 0.7, maximale à 500 hPa, et les coefficients de régression exhibent une dépendance avec la latitude. Swarbrick (2001) effectue plusieurs cas d’étude aux résultats jugés mitigés. Il note qu’un renforcement de l’anomalie de PV entraîne très souvent une augmentation de l’intensité du cyclone et une baisse de la pression (une augmentation de 2 à 3 PVU induirait une baisse de 5 hPa en ordre de grandeur), mais que la relation PV-WV demeure trop imprécise pour en tirer des règles qualitatives1.
En regardant les réanalyses menées par les prévisionnistes ou les nombreux cas d’étude publiés, il nous apparaît empiriquement que deux sources distinctes d’information sont tirées de l’image vapeur d’eau. Tout d’abord, les propriétés de traceur de la dynamique d’altitude de grande échelle peuvent être utilisées pour replacer un courant- jet et notamment une ondulation (Santurette et Georgiev 2005, cas d’étude pages 154 à 158). Une autre source d’information consiste à observer un maximum localisé, de petite échelle spatiale, de température de brillance, et à l’associer à un développement dépressionnaire (Santurette et Georgiev 2005, cas d’étude pages 165 à 170). C’est ce dernier genre de structures que permet de détecter Antidote. La plupart des cas d’étude mêlent des changements dans l’intensité de la structure en PV et des déformations du courant-jet, rendant difficile une interprétation fiable des résultats. Nous choisissons d’étudier, dans un premier temps, la relation entre ces intrusions sèches localisées et la cyclogenèse.

Étude statistique de la relation PV-WV

Ces études quantitatives comparent toutes les températures de brillance satellite et des champs en tourbillon potentiel issus de modèles affectés d’erreurs. La performance des modèles de transfert radiatif actuels nous permet de nous affranchir de cette fai- blesse : nous comparons le tourbillon potentiel avec les températures de brillance issues des mêmes champs d’ébauche d’ARPEGE via le modèle de transfert radiatif RTTOV.
La littérature souligne que la relation PV-WV n’est valable que dans les zones des intrusions sèches, ce qui n’est pas pris en compte par Pankiewicz et al. (1999). Nous restreignons la comparaison aux cellules détectées par Antidote, donc dans des zones actives d’intrusions sèches.

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

1 Traitement de l’imagerie vapeur d’eau géostationnaire 
1.1 La détection par multi-seuillages dans RDT
1.1.1 Algorithme de multi-seuillage
1.1.2 Suivi temporel
1.1.3 Application à l’image vapeur d’eau
1.2 Sélection et classification de structures
1.2.1 Caractéristiques
1.2.2 Performance d’une sélection
1.3 Filtres de sélection satellitaires
1.3.1 Durée de vie
1.3.2 Évolution en température
1.3.3 Gradient périphérique moyen de température
1.3.4 Ellipticité
1.3.5 Nébulosité de l’environnement proche
1.4 Filtres de sélection basés sur l’information modèle
1.4.1 Squelette du courant-jet obtenu par morphologie mathématique
1.4.2 Filtre basé sur la distance au squelette du courant-jet
2 Assimilation des structures cohérentes 
2.1 Assimilation de données et structures cohérentes
2.1.1 Assimilation de données variationnelle
2.1.2 Assimilation de structures cohérentes
2.2 La tropopause, une surface aux erreurs de position ?
2.2.1 Une distribution d’erreur d’ébauche influencée par des erreurs de position
2.2.2 Application à des profils en tourbillon potentiel
2.3 L’opérateur d’observation “Tourbillon Potentiel’
2.3.1 Formulation
2.3.2 Comparaison des deux opérateurs
2.3.3 Diagnostics dans l’espace des observations
3 Relation entre vapeur d’eau et tourbillon potentiel 
3.1 Lien PV-WV : un résumé des études précédentes
3.2 Étude statistique de la relation PV-WV
3.2.1 Mise en oeuvre
3.2.2 Corrélations linéaires avec le PV sur des niveaux isobares
3.2.3 Corrélation multilinéaire
3.2.4 Analyse en composantes principales
3.2.5 Étude du résidu
3.2.6 Estimation du tourbillon potentiel
3.3 Un modèle conceptuel de la relation PV-WV
3.3.1 Modèle QG. de tropopause
3.3.2 Modèle de Wirth
3.3.3 Le modèle de Wirth pour les radiances vapeur d’eau
3.3.4 Résolution numérique
3.3.5 Ordres de grandeur
3.3.6 Anomalies de tourbillon potentiel isolées du réservoir stratosphérique
3.3.7 Analyse de données pour la vitesse verticale
3.3.8 Analyse de données pour le tourbillon potentiel
4 Pseudo-observations et erreurs de position 
4.1 Étude unidimensionnelle dans un cadre idéalisé
4.1.1 Cadre analytique
4.1.2 Cadre des études numériques
4.1.3 Pseudo-observations de déplacement pour une anomalie gaussienne
4.2 Expérimentation dans un système 4D-Var
4.2.1 Algorithme d’appariement
4.2.2 Mesure de l’erreur de position
4.2.3 Mise en oeuvre
4.2.4 Expériences de déplacement à un niveau
4.2.5 Expérience d’assimilation à plusieurs niveaux
4.3 Évaluation sur plusieurs cas de cyclogenèses
4.3.1 Cas d’étude et configuration adoptée
4.3.2 Anomalies en tourbillon potentiel analysés
4.3.3 Impact des pseudo-observations
5 Initialisation des cyclones tropicaux 
5.1 Le schéma d’initialisation des cyclones tropicaux
5.1.1 Nécessité et apports d’une procédure d’initialisation spécifique
5.1.2 Description du schéma d’initialisation du UK MetOffice
5.1.3 Différences introduites depuis Heming (1994)
5.2 Schéma d’écrémage et expériences d’assimilation
5.2.1 Le nouveau schéma d’écrémage des observations
5.2.2 Expériences d’assimilation
5.2.3 Cyclones tropicaux des périodes considérées
5.3 Scores objectifs
5.3.1 Analyse et prévision de trajectoires
5.3.2 Analyse et prévision de changements d’intensité
6 PV, assimilation et cyclogenèse : un cas d’étude 
6.1 Éléments descriptifs de la tempête des Landes
6.1.1 Description synoptique
6.1.2 Dynamique de structures cohérentes remarquables
6.1.3 Prévisions des différents réseaux
6.2 Application à la tempête des Landes
6.2.1 Méthodologie pour la génération des observations
6.2.2 Une première prévision
6.2.3 Réglage de l’écart-type d’erreur d’observation
6.2.4 Prévision avec un écart-type d’erreur d’observation réglé
6.3 Tourbillon potentiel et ozone
6.3.1 Données ozone
6.3.2 Régressions entre données ozone et tourbillon potentiel
6.3.3 Comportement du résidu sur un échantillon indépendant
6.3.4 Erreur d’observation des données régressées
6.3.5 Une première expérience d’assimilation
A Article Michel et Bouttier, QJRMS 2006 
B Schémas numériques d’intégration temporelle 
C Légende des ANASYG 
D Article complémentaire 
Bibliographie 

Télécharger le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *