Télécharger le fichier pdf d’un mémoire de fin d’études
Évolution de la compréhension du climat
Plusieurs éclairages sont ou ont été utilisés pour mieux appréhender les propriétés du climat. Il sont généralement très inter-dépendants et ne représentent pas un changement de paradigme en soi. Nous présenterons ici quelques axes qui ne constituent pas une classification exhaustive des sciences climatiques, mais plutôt des façons d’aborder la science présentant des liens étroits avec les sujets étudiés durant cette thèse.
Classification climatique
Le point de vue, peut être le plus ancien, est d’associer à différentes zones géographiques du globe, un climat. Cette approche a connu un âge d’or avec les travaux de Köppen [83]. Le but de cette perspective étant d’étudier et, dans le cas de Köppen, de classifier les climats en fonction des régions géographiques comme le montrent les figures 1.5 et 1.6. Cette vision des choses est cependant autrement plus compliquée à mettre en place dans un climat non-stationnaire. En effet, les régions représentatives de certains climats changent. Cet axe reste néanmoins un moyen d’analyse intéressant du climat. Köppen fournit une classification basée sur des indices de températures moyennes à proximité du sol, au pas de temps journalier, dans le but d’expliquer la distribution de la faune et de la flore à la surface du globe [83]. Les indices sont basés sur des périodes caractéristiques/prédéfinies durant lesquelles les températures restent dans un intervalle donné (durant une année). Pour la figure 1.5, les seuils sont 10 ‰ et 20 ‰ et les périodes caractéristiques sont 1 et 4 mois.
Ce premier graphique décrit le climat en fonction d’une seule variable, ceci est insuffisant pour caractériser les climats. En effet, les différentes régions sont très peu dépendantes de leurs longitudes, ce qui semble irréaliste. Geiger [45] propose alors de pousser l’idée un peu plus loin en rajoutant une variable du cycle hydrologique : la précipitation. Le résultat de cette classification est montré dans la figure 1.6.
Figure 1.6 – Cette carte est une reproduction d’une classification due à Geiger et Köppen datant de 1954. La classification discrimine entre les différents climats à l’aide des cycles annuels de précipitations et de température.
Analogues climatiques
Très proche de ces notions, et toujours dans un thème géographique, viennent les analogues climatiques. Il s’agit de rechercher pour un lieu x0 au temps t0 des lieux x1 présentant un climat similaire au temps t1. La question est donc de replacer sur le globe le climat (futur ou passé) d’une localisation donnée par le(s) lieu(x) ayant les caractéristiques climatiques les plus proches, et ce pour une période donnée. Par exemple, quelle(s) localisation(s) aurait le cycle saisonnier de températures (en climat actuel) le plus similaire à celui de Toulouse en 2100 ? Cette notion, déjà présente dans la littérature (e.g Kopf et al., 2008), est essentiellement utilisée pour représenter le changement climatique. En effet, dans leur article de 2008, Kopf et al.[82] proposent de replacer à l’aide de ce concept, les climats futurs de villes européennes dans le climat actuel. La figure 1.7 ci-dessous montre les analogues du climat futur de Paris en 2100 calculés à l’aide d’une distance définie sur les distributions de trois variables climatiques : Degré Jour Unifié (DJU), Degrés Jours de Climatisation (DJC) et un indice d’aridité due à Thornthwaite [82]). Ces variables mesurent les contraintes climatiques des villes tant en terme énergétique (chauffage et climatisation) qu’en terme de déficit en eau durant les mois arides. En effet, DJU (resp. DJC) est une mesure de l’écart moyen, sur l’année, des températures en-dessous (resp. au-dessus) d’une température de référence fixée à 18 ‰. L’indice d’aridité se définit comme la somme sur les mois arides des déficits d’eau relatifs à l’Evapo-Transpiration Potentielle (ETP) i.e (ETP-précipitations)/ETP. Les climats proches de celui de Paris en 2100 sont indiqués par des couleurs chaudes. Le meilleur analogue est atteint en Espagne près de la frontière portugaise dans la ville de Badajoz.
Modélisation physique du système climatique
L’approche apportée par la modélisation physique du système climatique est sûrement celle qui a connu le plus de développements, notamment avec l’avènement des modèles de climat. Les modèles de climat sont une version « simplifiée » du système climatique dans le sens où l’on choisit de modéliser les principaux phénomènes du système à l’aide d’équations physiques qui sont, pour la plupart, discrétisées (figure 1.8). Les objectifs d’une telle démarche sont mul-tiples. Ils permettent aux chercheurs de faire plusieurs expériences in silico, généralement sur de grandes échelles de temps et d’espace, permettant d’accroître la compréhension des méca-nismes climatiques. Cette méthodologie permet, en outre, de faire des expériences idéalisées, par exemple, en imposant une évolution de variables influant sur le système climatique telle que la concentration de gaz à effet de serre dans l’atmosphère. Le degré de simplification de tels modèles peut être hiérarchisé en fonction de la question posée :
• Energy Balance Models (EBMs) introduit par Budyko (1969) et Sellers (1969). Ces modèles ont été construits pour reproduire le bilan énergétique (radiatif) de la terre. Ils n’ont, en général, pas de description spatiale mais permettent, par exemple, de quantifier la réponse de la température moyenne globale pour un scénario d’accroissement de CO2.
• Earth-system Models of Intermediate Complexity (EMICs) ou Modèle Terre à Com-plexité Intermédiaire. À la (grande) différence des EBMs, ces derniers incluent une représentation spatiale (simplifiée) du système « Terre », donc de ses composantes atmo-sphériques et océaniques au minimum. Leur atout principal est de permettre d’étudier le climat sur des échelles de temps longues, on peut ainsi étudier l’impact de la répartition des continents sur le climat.
• General Circulation Models, Modèles de Circulation Générale (GCMs) ou encore leur évolution : Earth System Models (ESMs). Ils constituent, aujourd’hui, les outils les plus complets pour la réalisation des projections climatiques du 21ème siècle à l’échelle globale. Ceci, tant en terme de précision spatiale, que de représentation de processus dynamiques, physiques et, dans le cas des ESMs, bio-géo-chimiques.
Initialement, les GCM désignent des modèles ayant trois dimensions spatiales résolvant la dynamique et la physique d’une seule composante du système climatique, par exemple, l’atmosphère (AGCM) ou l’océan (OGCM). Pour résoudre numériquement les équations décrivant l’état de l’atmosphère (ou de l’océan) celui-ci est divisé en un grand nombre de petits volumes dans lesquels les variables sont supposées constantes (ou, en tout cas, admettent une représentation simplifiée). Les phénomènes dynamiques et physiques, principalement issus de la thermodynamique et de la mécanique des fluides, sont alors approchés par des méthodes de type volumes finis. Cela permet d’obtenir l’évolution des variables sur chacun des volumes de la maille (cf figure 1.8).
Ensuite, les connaissances des flux et interactions entre océan et atmosphère ont per-mis de mettre en place des modèles résolvant ’simultanément’ les deux composantes et leurs principaux échanges. On obtient alors un modèle de circulation générale océan-atmosphère (AOGCM)[59]. Nous appellerons, par abus de langage, modèle couplé, tout modèle résolvant simultanément deux composantes. Avec le temps, les modèles couplés ont pris en compte plus de composantes importantes du système (sol, cryosphère …) représenté dans la figure 1.9, jusqu’à arriver aux « Modèles du Système Terre » (ESM) résolvant de plus, les processus bio-géo-chimiques [14]. Ces derniers permettent de dé-crire la biosphère ainsi que la chemosphère et donc d’obtenir la répartition d’espèces chimiques dans le système. Ils offrent, en général, une représentation du cycle du car-bone.
L’importance des statistiques dans l’étude du climat
Le système climatique est un système dynamique chaotique. L’étude de tels systèmes, qu’ils soient considérés comme déterministes ou purement aléatoires, se fait en général au travers de leurs statistiques [64]. C’est une des raisons pour lesquelles les statistiques du système climatique y jouent un rôle central, le climat pouvant être vu comme l’analyse statistique de ses variables. En effet, on cherche à obtenir différentes informations sur le système climatique ainsi qu’à quantifier leurs incertitudes. Par exemple : y a-t-il un changement dans l’état du système climatique ? (Détection). Est-ce imputable à l’activité humaine ? (Attribution). Avec quelle précision peut-on quantifier l’évolution d’une variable ? C’est dans ce dernier point de vue que nous nous placerons pour étudier des séries chronologiques durant la majorité de ce manuscrit.
Les précédents points développés au cours des sections 1.4.1, 1.4.2, 1.4.3 peuvent être appréhendés dans le cadre des statistiques. En effet, la classification climatique (section 1.4.1) cherche à répondre à la question : quels sont les grands types de climat ? Ce qui revient à partitionner à l’aide de méthodes d’apprentissage non-supervisé. Le raisonnement avec les analogues de la section 1.4.2 est, quant à lui, à rapprocher d’une estimation par plus proches voisins. Enfin, les relations entre la modélisation physique et les statistiques sont nombreuses et apparaissent à plusieurs niveaux. Une première remarque est que les sorties des ESM visent à reproduire une réalisation du climat. Une des grandes forces des modèles réside dans la possibilité de rejouer plusieurs fois une situation climatique et d’obtenir alors, à l’aide de méthodes statistiques, une meilleure compréhension de la distribution des variables étudiées. En outre, la bonne utilisation des modèles pour analyser le climat est soumise à une évaluation de ces derniers. La validation, la calibration et parfois l’initialisation des modèles couplés donnent lieu à des problèmes d’apprentissage (au sens statistique). Cela revient à dire en termes probabilistes : peut-on reproduire les propriétés statistiques des observations, et comment inférer les paramètres du modèle au travers de l’assimilation de données [106, 19].
Modélisation de l’évolution saisonnière du climat
Le but premier de ce travail de thèse est d’étudier la déformation des cycles saisonniers de variables climatiques, considérées au pas de temps quotidien, sous l’influence du changement climatique. Nous effectuerons cette analyse sur deux caractéristiques des variables étudiées : l’espérance et les quantiles.
Nous serons donc amenés à estimer, qu’il s’agisse de l’espérance ou des quantiles de la variable, pour une localisation donnée, des fonctions prenant leurs valeurs sur le cylindre. Les cercles représentant l’aspect périodique, portant donc les jours de l’année d, et l’axe principal portant la variable annuelle y. Dans la suite de cette section, nous noterons la fonction d’intérêt Ψ: S1×[1,N]→ R . (d, y) 7→Ψ(d, y).
Nous supposerons de plus que Ψ satisfait des conditions de régularité qui seront détaillées dans les chapitres 3 et 4.
Un élément intéressant et primordial afin d’étudier le changement climatique saisonnier est de connaître la différence moyenne entre les cycles annuels de deux périodes. Prenons, par exemple deux périodes de 30 années, débutant aux années y1 et y2 ; les périodes s’écrivent alors P1 = {y1, . . . , y1 + 29} et P2 = {y2, . . . , y2 + 29}. Autrement dit, si la variable d’intérêt est la moyenne de température Td,y nous modélisons le changement saisonnier comme suit : Td,y1+t − Td,y2+t = hP1,P2 (d) + , t ∈ J0, 29K. L’élément hP1,P2 représente alors un cycle annuel donnant le réchauffement expérimenté pour chaque jour de l’année, en moyenne entre les deux périodes, et ε est un bruit centré. Dans la suite, nous utiliserons le terme « delta cycle » pour désigner les cycles portant une information du même type que celle donnée par h. Cette première modélisation ne nous informe cependant pas de l’évolution chronologique annuelle de la déformation du cycle saisonnier. Elle nous montre seulement la différence du comportement moyen entre deux périodes. Ce modèle suppose, de plus, que l’évolution annuelle moyenne à l’intérieur de chaque période est comparable ; une hypothèse qui n’est presque jamais vérifiée pour des périodes opposant un climat stationnaire (e.g. 30 années en climat pré-industriel) à une période subissant un réchauffement (e.g. période actuelle). C’est pour toutes ces raisons qu’il est naturel, lorsque nous nous intéressons à l’intégralité d’une série d’observations sur de longues périodes (60 ans ou plus), de contrôler la magnitude du changement saisonnier par une fonction g dépendant de l’année considérée g(y). Notre modélisation devient alors : Td,y2 − Td,y1 = (g(y2) − g(y1))h(d) + .
L’hypothèse principale faite par ce modèle est que la modulation du changement saisonnier est portée par le cycle h sur l’intégralité de la période. La magnitude du changement est alors gouvernée par la fonction g. Au cours de cette thèse, nous nous référerons à ce modèle comme un modèle multiplicatif ou bilinéaire. Cette approche a déjà porté ses fruits pour la modélisation de signaux temps-espace, il est alors mieux connu sous le nom de « pattern scaling »[96, 121].
Définition et premières propriétés
À la recherche de la fonction coût
L’objet de cette section est d’obtenir les quantiles d’une variable aléatoire Y conditionnelle-ment aux variables du vecteur aléatoire X = (X1, . . . , Xk) comme le minimiseur d’un pro-blème d’optimisation. Au cours de cette section, nous distinguerons les réalisations des va-riables aléatoires par deux notations différentes. Lorsqu’une seule réalisation est effectuée, elle sera notée en lettres minuscules ; par exemple y désignera une réalisation de Y, de même pour x1, . . . , xk et pour les variables X1, . . . , Xk. Lorsque plusieurs réalisations sont en jeu, nous noterons Y = (y1, . . . , yn)> ∈ Rn et X = (xi,j) ∈ Mn,k la matrice dont les colonnes sont constituées des n réalisations des régresseurs ou, de façon équivalente, dont les lignes sont composées des réalisations X1 = (x1,1, . . . , x1,k), . . . , Xn = (xn,1, . . . , xn,k) de X (design matrix).
Sélection de modèles et erreur de généralisation
Cadre et premières définitions
On cherche à expliquer une variable aléatoire Y , du moins une de ses caractéristiques (e.g telle que son espérance conditionnelle), par un vecteur aléatoire X de Rp. Pour cela, nous avons à notre disposition un échantillon T def= (X1, Y1), . . . , (Xn, Yn) issu de la même loi mère F , fˆ un estimateur entraîné sur T et L une fonction coût permettant de quantifier l’erreur commise entre fˆ(X) et Y : L(fˆ(X), Y ) où (Y, X) sont une nouvelle réalisation de F .
Pour ce qui est de la régression, nous avons déjà vu deux fonctions coûts : l’une associée à la moyenne (coût quadratique)
L:R2→R.
(a, b) 7→(a − b)2.
|
Table des matières
Introduction
1.1 Le système climatique
1.2 La notion de climat
1.3 Changement climatique
1.4 Évolution de la compréhension du climat
1.5 Modélisation de l’évolution saisonnière du climat
1.6 Quelles données pour évaluer le changement climatique ?
2 Méthodes statistiques
2.1 Espaces de Hilbert à noyaux reproduisant (RKHS)
2.2 Régression quantile
2.3 Sélection de modèles et erreur de généralisation
3 Étude de l’espérance d’une variable climatique au pas de temps journalier (déformation du cycle annuel)
3.1 Estimating daily climatological normals in a changing climate
3.2 Compléments
4 Étude de la déformation de la distribution d’une variable en climat nonstationnaire
4.1 Estimating daily climatological distribution in a changing climate
4.2 Complements
Conclusion et perspectives
4.1 Conclusion
4.2 Perspectives
A Appendice 1
A.1 Aire et volume de banquise Arctique
A.2 Minimales et maximales de températures sur un échantillon divisé par
A.3 Évolution des paramètres de la loi de Pareto
Bibliographie
Télécharger le rapport complet