La climatologie est une discipline scientifique dynamique à usages multiples dans un large champ d’application. De nouvelles techniques sont mises au point, des études sont entreprises pour savoir comment le climat s’applique à de nombreux domaines, notamment l’agriculture et l’énergie [1]. Elle étudie les phénomènes atmosphériques à diverses échelles ; comme l’échelle d’une région, d’un pays, ou de la planète entière. Elle utilise : des relevés de température, de précipitations, de vents, de pression sur une période d’au moins trente ans [2]. Ces relevés sont généralement obtenus à partir des stations de mesures.
Les conditions de mesure d’une station peuvent varier au cours du temps. Les modifications des conditions de mesure (déplacement de stations, remplacement d’instruments de mesure, changement des heures d’observations ou encore modification de l’environnement immédiat de l’instrument de mesure) peuvent introduire des ruptures artificielles dans les données qui ne reflètent pas les variations réelles du climat [3]. Par conséquent, il se peut que des décisions soient prises en se basant sur des données qui contiennent des erreurs [4]. Pourtant, c’est justement cela qu’il faut éviter, d’où la nécessité de l’homogénéisation des données. L’homogénéisation est un processus de détection et de correction des ruptures (qu’on appelle également inhomogénéité) d’origine non climatique. En homogénéisation, on compare souvent les données d’une station avec celles des stations voisines afin d’éviter qu’un changement climatique ne soit interprété comme une inhomogénéité .
Température
Définition
Etant une grandeur physique, la température est mesurée à l’aide d’un thermomètre et étudiée en thermométrie. Selon les conditions atmosphériques (vent, pluie, ensoleillement…), sa perception varie d’un individu à l’autre [5]. En générale, elle est reliée aux sensations de froid et de chaud, provenant du transfert thermique entre le corps humain et son environnement. En physique, c’est une variable d’état qui, du point de vue de la structure de la matière, caractérise le degré d’agitation de ses particules. C’est toujours la température d’une boule au voisinage d’un point que l’on mesure, et que l’on désigne par « température en ce point ».
Echelle
Plusieurs échelles ont été définies pour déterminer la grandeur physique de la température. Telle l’échelle Celsius (°C), Fahrenheit (°F) et kelvin (K). La majorité des pays utilise le degré Celsius. Le 0°C de cette échelle correspond au point de congélation de l’eau, et le 100°C au point d’ébullition de l’eau [1]. Le kelvin est l’unité légale du système internationale.
Homogénéisation
Comme nous avons déjà précisé dans l’introduction, l’homogénéisation est un processus de détection et de correction des ruptures d’origine non climatique. Une meilleure approche d’homogénéisation est de considérer l’information livrée par plusieurs stations voisines en évaluant la série à homogénéiser.
Méthode
Les techniques d’homogénéisations varient selon l’objectif pour lesquels on les applique et la philosophie de chaque équipe de travail. Malgré la grande diversité des méthodes d’homogénéisations, elles peuvent néanmoins être classifiées en deux catégories principales :
– Méthodes subjectives :
Lorsque l’emplacement d’une discontinuité est détecté à l’œil nu sur un graphique, la méthode appartient à la classe subjective même si des tests statistiques sont appliqués par la suite. Par exemple : l’analyse des doubles accumulations, les méthodes basées sur les déviations cumulées et l’analyse graphique des déviations cumulées.
– Méthodes objectives :
Quant aux méthodes objectives, elles ne dépendent pas du jugement de l’utilisateur pour localiser les inhomogénéités. Exemple : régression multiple, méthode de Jaruskova et méthode d’ Alexandersson (SNHT).
Métadonnée
La source d’information la plus importante pour appuyer toutes les méthodes existantes de détection des inhomogénéités dans des séries climatiques provient de la consultation des métadonnées. Elles sont formées des archives historiques propres à chaque station. Les métadonnées contiennent les enregistrements de la station, des annuaires météorologiques, des fiches d’inspection, des photographies de la station et de son environnement, etc. Une entrevue avec la personne responsable d’une station constitue également une source d’information. Les études comparatives réalisées sur les instruments peuvent aussi donner une bonne idée de l’effet d’un changement d’instrument dans une série de données.
Rupture
Une rupture désigne une modification subite dans les propriétés d’un processus aléatoire. Elle suppose que ses propriétés sont de part et d’autre de l’année de rupture. Il existe deux types de d’inhomogénéités :
Saut de moyenne
Les sauts dans une série de données climatiques peuvent être occasionnés par plusieurs types de changements :
– changement d’instrument,
– déménagement d’une station,
– changement de méthode de calcul des statistiques comme les moyennes mensuelles,
– changement de technicien
– changement des heures de mesure.
Les sauts abrupts sont faciles à détecter tandis que les sauts de faibles amplitudes sont plus problématiques.
Tendance
Une tendance (au sens mathématique) correspond à une certaine orientation prise par les valeurs d’une série de données en fonction du temps, c’est-à-dire à une évolution du processus observé en fonction du temps. Elle peut être causé par :
– une modification dans l’environnement immédiat de la station (urbanisation et industrialisation).
– reforestation graduelle autour de la station.
– vieillissement de l’appareil de mesure.
Une tendance est plus délicate à quantifier car il faut identifier correctement son début, sa fin et ainsi que son amplitude.
Série de base
La série qui peut potentiellement contenir des inhomogénéités est appelée : série de base.
Séries de référence
Une série de référence est une fonction d’une ou plusieurs stations climatiquement similaires à la station de base. Le rôle de telles séries est d’empêcher qu’une variation climatique régionale soit classifiée comme une inhomogénéité. La plupart des méthodes d’homogénéisation incluent une ou plusieurs séries voisines pour différencier les changements du climat régional des inhomogénéités observées à la station de base.
Série homogène
Une série est homogène si ces variations répondent exclusivement aux causes climatiques.
Série hétérogène
Une série est hétérogène si elle contienne des ruptures d’origine non climatique.
Test statistique
Généralité
Le test statistique est le moyen de comparer les deux hypothèses H0 et H1. C’est une valeur numérique calculée à partir de la série de données testée (on calcule la valeur d’une certaine variable appelée la « statistique » du test). Le test permet de choisir, parmi les deux hypothèses émises, celle qui a le plus de chances d’être vraie. Toutefois, en statistique, les hypothèses ne sont jamais « acceptées ». Il est préféré l’expression « on ne peut rejeter l’hypothèse H0 à un niveau de confiance » ou bien, dans le cas de l’alternative, « on doit rejeter l’hypothèse H0 et retenir l’hypothèse H1 à un niveau de confiance ».
Quelques définitions
En considérant une hypothèse nulle (privilégiée) H0, une alternative H1, et en bâtissant une règle permettant de décider de rejeter ou pas H0. L’erreur de première espèce est de rejeter H0 alors qu’elle est vraie. L’erreur de seconde espèce est de ne pas rejeter H0 alors qu’elle est fausse.
– α est la probabilité de rejeter à tort H0 (risque de première espèce).
– β est la probabilité de ne pas rejeter H0 alors que H1 est vraie (risque de première espèce).
– la région d’acceptation du test représente un intervalle regroupant (1- )% des valeurs que peut prendre la statistique si l’hypothèse H0 est vraie.et son complémentaire c’est la région critique.
– la p valeur (p-value) c’est la probabilité que la statistique théorique sous H0 soit supérieure à la statistique calculée (expérimentale).
|
Table des matières
INTRODUCTION
PARTIE I : GENERALITES
I.1. Température
I.1.1. Définition
I.1.2. Echelle
I.2. Homogénéisation
I.2.1. Méthode
I.2.2. Métadonnée
I.2.3. Rupture
I.2.3.1. Saut de moyenne
I.2.3.1. Tendance
I.2.4. Série de base
I.2.5. Séries de référence
I.2.6. Série homogène
I.2.7. Série hétérogène
I.3. Test statistique
I.3.1. Généralité
I.3.2. Quelques définitions
I.3.3. Etape du test statistique
I.3.4. Tests paramétriques et tests non paramétriques
I.3.4.1. Tests paramétriques
I.3.4.2. Tests non paramétriques
I.4. Exposant de Hurst
I.5. Modélisation ARIMA des séries chronologique
I.5.1. Box & Jenkins
I.5.2. Les processus ARMA
I.5.3. Les processus ARIMA
I.6. Moyenne des Erreurs Absolues en Pourcentage
PARTIE II: MATERIELS ET METHODES
II.1. Matériels
II.1.1. Localisation de la zone d’étude
II.1.2. Données utilisées
II.1.3. Outils informatique
II.1.4. Outils statistiques
II.1.4.1. Test de Buishand
II.1.4.2. Test de SNHT
II.1.4.2.1. Test pour un saut
II.1.4.2.2. Test pour une tendance
II.1.4.3. Test de Mann Kendall
II.1.4.4. Test de normalité de Shapiro-Wilk
II.2. Méthodes
II.2.1. Préparation des données
II.2.2. Homogénéisation des données
II.2.2.1. Homogénéité absolue
II.2.2.2. Homogénéité relative
II.2.2.2.1. Première approche : à partir de l’homogénéité absolue et corrélation
II.2.2.2.2. Deuxième approche : à partir des séries voisines initiales
II.2.2.2.3. Test d’homogénéité relative des séries de base
II.2.3. Recherche de meilleure méthode d’homogénéisation
II.2.4. Zonage et modélisation
PARTIE III: RESULTATS ET INTERPRETATIONS
III.1. Test de normalité
III.2. Test d’homogénéité absolue
III.2.1. Test de Buishand
III.2.2. Test de Mann Kendall
III.3. Ajustement
III.4. Résultat final d’homogénéité absolue après ajustement
III.5. Homogénéité relative
III.5.1. Première approche
III.5.1.1. Série avec un saut
III.5.1.2. Deux sauts
III.5.1.3. Tendance
III.5.1.4. Saut et tendance
III.5.2. Deuxième approche
III.6. Résultat de l’analyse en composante principale
III.7. Modélisation
III.7.1. Série moyenne de la sous zone A
III.8. Modélisation ARIMA
III.8.1. Etude de stationnarité de la série
III.8.2. Identification de modèle
III.8.2. Estimation du modèle
III.8.4. Prévision
II.9. Discussion
CONCLUSION
REFERENCES BIBLIOGRAPHIQUES
ANNEXES