Analyse spatiale et temporelle du retard de croissance en Côte d’Ivoire

Télécharger le fichier pdf d’un mémoire de fin d’études

Analyse spatiale et statistique spatiale

Concrètement, qu’est-ce qu’est l’analyse spatiale ? En quoi diffère-t-elle de la statistique spatiale ? Selon Grasland, l’analyse spatiale et la statistique spatiale se différencient par le fait que « le concept central en analyse spatiale est celui de l’interaction, tandis qu’en statistique spatiale, c’est l’autocorrélation qui est essentielle » [3]. L’interaction spatiale et l’autocorrélation spatiale sont deux termes très proches, à une différence que le premier s’intéresse à la relation entre deux endroits et le second à la ressemblance entre eux. En effet, l’interaction spatiale est une notion qui désigne la manière selon laquelle deux endroits tendent à avoir des relations, étant donné que leurs frontières sont poreuses aux mouvements de populations, ce qui facilite les contacts entre les populations. Ces relations peuvent être traduites par exemple par un processus de diffusion spatiale d’un phénomène donné. Cela veut dire qu’un endroit proche d’un endroit ayant par exemple un nombre important de personnes atteintes par une maladie infectieuse a de fortes chances de voir sa population atteinte par cette maladie. L’autocorrélation spatiale, que nous détaillerons plus loin, désigne quant à elle le degré ressemblance ou de dissemblance entre deux endroits, étant donné qu’en général deux endroits qui sont spatialement proches ont plus de chances de se ressembler que deux endroits éloignés. Cependant, cette notion de ressemblance ou de dissemblance entre les endroits géographiquement proches est à prendre avec précautions. En effet, deux endroits peuvent être caractérisés par les mêmes valeurs d’un phénomène donné, par exemple le paludisme, alors qu’ils sont éloignés dans l’espace (Afrique et Asie par exemple). Actuellement, l’analyse spatiale inclut les statistiques spatiales en tant que branche de la statistique qui s’intéresse à l’analyse des données géolocalisées.
Par ailleurs, l’analyse spatiale est une démarche méthodologique permettant de caractériser un phénomène indexé par des coordonnées géographiques en vue de le décrire, de l’expliquer et de modéliser son comportement dans l’espace et/ou dans le temps, tout cela dans le but d’identifier la tendance à former des structures particulières conduisant ainsi à la formulation des hypothèses et à la prise de décision.
L’interaction spatiale et l’autocorrélation spatiale que nous détaillerons plus loin sont deux étapes importantes et préalables à toute analyse spatiale qui s’intéresse aux similarités d’un phénomène décrit par des coordonnées géographiques. Plutôt que de s’intéresser aux singularités d’un phénomène qui n’ont d’intérêt que lorsque ce phénomène ne peut pas être connu ou n’est pas défini à ces points singuliers, l’analyse spatiale s’intéresse, quant à elle, à mettre en exergue les endroits de l’espace où ce phénomène présente des structures particulières, en liaison ou pas avec les caractéristiques de la population d’étude. Concrètement, l’analyse spatiale permettra de cartographier les zones à haut risque pour une maladie donnée, son évolution spatiale et temporelle, ainsi que de lier la probabilité de survenue de cette maladie aux caractéristiques notamment sociales, démographiques, économiques, environnementales et comportementales de la population d’étude. Utilisée au début pour étudier la distribution spatiale des phénomènes liés aux ressources naturelles et minéralogiques telles que le pétrole et l’or et des phénomènes liés à la gestion des territoires (délimitation des parcelles, traçage des routes), l’analyse spatiale est actuellement utilisée en épidémiologie et dans les sciences sociales [4,5]. Elle est également utilisée dans d’autres domaines tels que l’agronomie, l’environnement et l’océanographie.
Les données géographiques sont souvent stockées dans des bases de données de différente nature mais, dans certains cas, elles peuvent toutes être stockées dans une même configuration appelée « couche ».

Notion de couches et sources des données

Le type de couche (i.e fond de carte) en présence détermine le type d’opérations à mettre en œuvre pour réaliser une carte. Une couche est un objet qui contient toutes les informations d’une représentation cartographique à réaliser. Elle peut être de type vecteur (couche déformable) ou de type raster (image) (Figure 1).
Une couche vectorielle est constituée de vecteurs (lignes, polygones ou points). Elle contient des « entités géographiques » (en lignes) et des attributs (en colonnes), leur intersection étant appelée « champ ».
Ces entités peuvent être repérées soit à l’aide de leurs identifiants (Figure 1 a), soit à l’aide de leurs noms de la table d’attributs. Selon que les couches sont constituées de polylignes (Figure 1 b) ou de points (Figure 1 c et d), elles sont appelées couches de type linéaire ou de type ponctuel respectivement. Les termes de « linéarité » et « ponctualité » dont il s’agit ici font référence à la forme géométrique des unités spatiales. C’est ainsi qu’une ligne peut être simple (autoroute à sens unique), double (autoroute à double sens), multiple (route à voies multiples avec par exemple des allées pour piétons), en pointillé ou en hachures (chemin de fer), directionnelle (avec indication du sens de parcours ou du type d’automobile qui y a accès) et d’épaisseur différente (allée, piste, route). De même, les symboles utilisés pour les couches ponctuelles peuvent être simples (étoile, cercle, carré, losange, croix, flèche, triangle), déformés des symboles simples (ellipse, rectangle), sous forme de symboles utilisés dans le traitement des textes ou sous forme d’image (avion, voiture, homme, animal, statue).
La figure 1 a illustre la couche vectorielle de polygones représentant les provinces du Burundi (valable jusqu’en 2015), la figure 1 b la couche de polylignes qui est constituée du réseau routier du Burundi, la figure 1 c une couche ponctuelle représentant la localisation géographique des grappes ou zones de dénombrement de l’Enquête Démographique et de Santé (EDS) conduite en 2010 au Burundi, ces zones étant représentées par leurs centres géographiques appelés centroïdes. La figure 1 d illustre les mêmes grappes groupées dans les provinces du Burundi. Les couches vectorielles sont les plus fréquentes en épidémiologie spatiale tandis que les couches raster sont souvent présentes en télédétection. Les couches vectorielles peuvent contenir des données de type numérique (effectifs, mesures, proportions), de type alphanumérique, les coordonnées géographiques (longitude/latitude), l’identifiant de chaque entité, toutes ces données formant la table attributaire de cette couche (Tableau 1).

Projections et systèmes de projection

Le début de l’ère spatiale est caractérisée par le lancement du premier missile intercontinental et du premier satellite artificiel de la Terre en 1957 [6]. Depuis lors, des pays comme la Russie et les États-Unis d’Amérique n’ont cessé de fabriquer des outils permettant d’explorer l’espace, de recueillir les coordonnées géographiques des pays et de produire des images satellitaires des portions terrestres et lacustres. Ces portions sont représentées et localisées grâce à des coordonnées qui les caractérisent de manière univoque. Ces coordonnées sont mathématiquement transformées grâce à des systèmes de projection permettant de superposer les couches vectorielles ou les couches raster à l’aide des logiciels SIG tels que QGIS (Quantum Geographic Information System), ArcGIS (une collection de logiciel SIG), GeoDa et R. Un système de projection est un système dans lequel une couche est visualisée. Autrement dit, un système de projection est toute forme de représentation d’un objet à la surface de la Terre, une projection étant cette représentation ou tout simplement la correspondance entre les coordonnées géographiques et les coordonnées planimétriques, qui permet de réduire les déformations lors de la transformation de l’ellipsoïde en un plan. La Terre est une ellipsoïde, étant légèrement aplatie aux pôles. Ainsi donc, pour mieux visualiser un pays du globe terrestre, il convient de le projeter dans un espace à deux dimensions (un plan). Ces projections sont faites de telle sorte que les distorsions, c’est-à-dire les déformations subies lors de la projection, soient moindres. Ces distorsions concernent les surfaces, les angles, les distances, les frontières des pays et les directions. Parmi ces projections, certaines conservent les angles (projections conformes ou stéréographiques), laissant ainsi le champ aux déformations surfaciques, et d’autres conservent les surfaces (projections équivalentes), laissant ainsi le champ aux déformations des angles. Toutes les projections cartographiques engendrent donc des distorsions selon la position géographique des polygones à projeter et ces distorsions sont plus accentuées soit au niveau des pôles, soit au niveau de l’équateur ou du méridien de Greenwich. La meilleure de ces projectios est celle qui présente le moins de distorsions possibles.
La Terre ne pouvant pas être fendue et rabattue sur un plan à deux dimensions afin de visualiser tous les pays sur ce plan, elle ne constitue pas une forme développable au même titre que le cône, le cylindre et le plan lui-même. C’est sur ces trois formes que les points de la surface de la Terre sont projetés, aboutissant ainsi à une correspondance entre les coordonnées géographiques des points de la Terre et ces formes. Cette correspondance porte le nom de projection cartographique et permettra de faire le rendu cartographique.
Le système géodésique mondial de référence de 1984, dénommée WGS84 (World Geodetic System 1984), est un système de coordonnées de référence (SCR) mondiale développée par l’agence nationale géospatiale d’intelligence américaine. Il concerne les coordonnées géographiques (longitude/latitude) exprimées en degrés décimaux ou sexagésimaux. Les coordonnées géographiques exprimées en degrés peuvent être converties en kilomètres ou en mètres soit manuellement, soit en utilisant un système de projection. Plusieurs systèmes de projection correspondent au système de coordonnées WGS84, chacun portant son propre numéro. Par exemple, le système de projection le plus utilisé et qui est associé à ce système de coordonnées est EPSG : 4326 (European Petroleum Survey Group). Le géoïde représentant la forme de la Terre dans le système WGS84 peut être schématisé dans un espace à trois dimensions (Figure 3) [7]. Ce système utilise le géo-positionnement par satellite (GPS : Global Positioning System).
Les trois projections les plus utilisées sont la projection cylindrique, la projection conique et la projection planaire:
La projection cylindrique directe est une projection conforme qui consiste à projeter les points de la surface terrestre sur un cylindre de section elliptique, puis de le rabattre afin d’obtenir une carte du monde sur un plan à deux dimensions (Figure 4). Au moment de la projection, le cylindre est tangent (ou sécant) à la Terre avec un axe perpendiculaire au plan de l’équateur (Figure 4 a). Après rabattement, les méridiens et les parallèles sont des droites orthogonales (Figure 4 b). La projection cylindrique directe entraîne de fortes dispersions aux pôles.
Un autre cas de figure de la projection cylindrique est la projection cylindrique transverse où le cylindre est tangent (ou sécant) à la Terre avec un axe perpendiculaire au plan du méridien d’origine, ici le méridien de Greenwich (Figure 5). Comme pour le cas de la projection cylindrique directe, la Terre est projetée sur ce cylindre (Figure 5 a). Après rabattement, les méridiens et les parallèles sont des courbes orthogonales (Figure 5 b). La projection cylindrique transverse entraîne de fortes dispersions sur le méridien.

Type de données spatiales

Données ponctuelles

Considérons D le domaine borné représentant la zone d’étude dans laquelle un événement d’intérêt se produit. Les données relatives à cet événement sont dites géolocalisés dans l’espace et l’intérêt principal porte sur son organisation spatiale. Appelé aussi « champ », le domaine D est tel que la variable géographique qui décrit ce phénomène est supposée prendre des valeurs nulles en dehors de ce domaine. Dans ce domaine, les données sont recueillies à différents points de coordonnées géographiques. Ces points d’observation sont le résultat d’un processus spatial ponctuel, c’est-à-dire un processus stochastique au cours duquel le nombre de points et leur répartition spatiale sur un support discret D ⊆ R2 sont aléatoires, ces points étant observés dans une fenêtre S ⊂ D . De telles données sont dites ponctuelles. Les processus de base qui décrivent ce genre de données sont les processus ponctuels de Poisson, c’est-à-dire les processus au cours desquels le nombre de cas est de loi de Poisson et à accroissements indépendants. Ces points peuvent être les centres géographiques (centroides) des lieux de résidence des patients [9], les ménages ou les zones de dénombrement (ZD) lors d’une enquête de population. Une première représentation de la distribution spatiale de la variable d’intérêt se fait en la représentant, à chaque point d’observation, par un symbole dont la taille est proportionnelle à la valeur observée de la variable ou selon la classe d’appartenance de cette valeur afin de détecter la tendance (dérive) du phénomène auquel la variable se rapporte. Une illustration de ce genre de données concerne la prévalence du virus de l’immunodéficience humaine (VIH) par grappe ou ZD obtenue lors d’une enquête conduite au Burundi en 2010 (Figure 9).
Chaque couleur correspond à une classe de la prévalence du VIH. Aucune tendance régulière n’est observée dans la distribution spatiale de l’infection par le VIH. Plusieurs raisons expliquent la rareté de ce genre de données : coût élevé de l’enquête, difficultés liés à l’échantillonnage, confidentialité de la localisation géographique des enquêtés.
À vrai dire, il s’agit des données ponctuelles uniquement du fait qu’elles sont rapportées au niveau du centre géométrique de la grappe. Une grappe étant une zone de dénombrement, elle pourrait concerner des données de type agrégé.

Données géostatistiques

En géostatistique, les données se rapportant à la variable d’intérêt sont collectées de manière irrégulière sur la fenêtre S en un nombre fixé de sites s1 ,!, sn préalablement choisis lors de l’étape de la sélection de l’échantillon. Cette fenêtre constitue un sous-ensemble continu de D ⊆ « d ; d≥2 . L’intérêt principal de ce genre de données est qu’elles tiennent compte non seulement de l’information sur la localisation géographique (une seule réalisation en un site donné, sauf pour des données répétées) des données mais également du fait que la variable d’intérêt est elle-même considérée comme une variable aléatoire et les valeurs qu’elle est susceptible de prendre en différents sites comme ses réalisations. Elles permettent, en outre, d’intégrer l’information contenue dans d’autres variables afin de comprendre et de modéliser les variations spatiales, et de faire des prédictions spatiales (interpolation) des valeurs de la variable d’intérêt aux sites non échantillonnés et leur incertitude afin de reconstituer la variable d’intérêt en tout point du domaine d’étude [10].
SoitΩ, F , P un espace probabilisé où Ω est l’univers des possibles, F une algèbre et P une probabilité. Soit également E,ε un espace d’états mesurable. Gaetan et Guyon (2008) définissent un champ ou fonction aléatoire comme une famille Z = Z s , s ∈ D de variables aléatoires définies deΩ, F , P vers E,ε [11]. Nous noterons par Z s le champ aléatoire défini de « 2 vers E .
Un champ aléatoire est spatialement stationnaire d’ordre 1 s’il reste invariant par translation, c’est-à-dire si son espérance mathématique est constante sur tout le domaine d’étude. Autrement dit, cela veut dire qu’il ne dépend pas de la localisation géographique des points d’observation mais dépend uniquement de la distance séparant les points. Il est dit stationnaire d’ordre 2 si son espérance mathématique est constante et si sa covariance est invariante par translation [12,13] : où C# est la fonction de covariance ou covariogramme. Cette fonction a comme propriétés la symétrie et la défini-positivité de par la définition de la variance. La covariance caractérise le degré de ressemblance ou la corrélation entre les valeurs prises par la variable aléatoire en deux endroits. La stationnarité d’ordre 2 du champ aléatoire implique que sa variance ne dépend pas de la localisation des points mais dépend uniquement de l’ordre de grandeur et de la direction de h . Dans le cas où la fonction de covariance dépend uniquement de la norme de h et non de sa direction, lors C s h, s C h  . Dans ce cas, cette fonction est isotrope au même titre que la variable Z s . La stationnarité intrinsèque, quant à elle, considère que la variance existe et augmente de façon monotone lorsque la distance entre les paires de points augmente [14]. Les données géostatistiques ont comme clé principale le fait qu’elles sont non indépendantes et que la variable d’intérêt a une réalisation unique. De plus, ces données permettent de caractériser, à courte échelle, le degré de dépendance des données et présentent une organisation ou structure spatiale liée à leur caractère aléatoire.

Définition des poids entre les unités spatiales

Matrice des distances spatiales

La matrice W des distances spatiales permet de pondérer les observations lors de la vérification de la dépendance spatiale appelée autocorrélation spatiale ou corrélation de proche en proche. Elle se définit différemment selon qu’il s’agit des points ou des polygones. La matrice des distances euclidiennes entre deux points si et s j du domaine D est une matrice W dont les éléments Wij sont définis par la distance euclidienne d ij = d si , s j  = si − s j = Wij . Connaissant le nombre n de points, le nombre de valeurs de distances spatiales mutuelles vaut n ( n −1) . La distance euclidienne est une distance à vol d’oiseau ou distance selon la corde entre deux points si xi , yi et s j x j , y j dont les coordonnées x, y sont connues. Même si la distance euclidienne est la plus utilisée en analyse spatiale, d’autres types de distance peuvent être utilisés. Il s’agit notamment de la distance de Manhattan utilisée dans le cas où il y a des restrictions de déplacements (entre deux voies de circulation par exemple) Est-Ouest et Nord-Sud et définie par d ij = dsi , s j = xi − x j + yi − y j et de la distance de Minkowski définie par d = d si , s j = )+ / xi , k − yj , k – k 1 r * r où r est le paramètre indiquant la manière dont la , . distance varie en fonction de la valeur angulaire entre les points et l’axe de référence (Est-Ouest par exemple) et k la dimension[15]. La distance de Tchebychev donnée par max xi , k − y j , k peut également être utilisée. Si dij est la distance euclidienne entre k deux points si xi , yi et s j x j , y j se trouvant sur l’ellipsoïde, alors la distance de sur ) dij * l’ellipsoïde vaut de = 2 R arcsin + , où R = 6372 km est le rayon de la terre. – 2R .
La matrice des distances définies précédemment est utilisée pour pondérer les observations. Une autre façon de définir les poids spatiaux consiste à utiliser un voisinage global et à considérer que l’influence d’un point sur un autre décroit au fur et à mesure que la distance qui les sépare augmente et de ce fait, les éléments de la matrice des poids s’écrivent : W = 1 où α est un entier positif non nul (1.2)

Indices globaux d’autocorrélation spatiale

Les indices globaux de l’autocorrélation spatiale, appelés également méthodes globales de détection des agrégats spatiaux ou d’identification de l’hétérogénéité spatiale, permettent de mesurer la tendance à l’agrégation ou à la dispersion globales dans les unités géographiques prises dans leur ensemble, c’est-à-dire dans tout le domaine d’étude. L’analyse de l’autocorrélation spatiale permet de répondre par exemple à la question de savoir si les valeurs de la prévalence du VIH de l’EDS 2010 du Burundi observées dans des grappes géographiquement proches sont similaires à celles observées dans des grappes plus éloignées. S’il en est ainsi, la similarité dans l’espace traduit donc la similarité entre les valeurs de la variable. L’autocorrélation spatiale globale est évaluée à l’aide des indices globaux de l’autocorrélation spatiale et des corrélogrammes (que nous définirons plus loin). Leurs expressions mathématiques diffèrent principalement dans la définition des variables prises en compte pour définir ces indices et dans la définition des poids spatiaux à prendre en compte pour pondérer les observations.

Indice global de Tango

Contrairement aux indices précédents, l’indice de Tango était initialement destiné à détecter les agrégats temporaux de cas de maladies, notamment infectieuses, lors des études épidémiologiques [35]. L’espace de temps est divisé en k intervalles de temps réguliers d’effectifs Y1 , …,Yk contenant des cas de maladie et dans lesquels la population de taille N était supposée stable au cours du temps. Les observations sont alors les centres des intervalles de temps et la distance temporelle est définie comme étant la valeur absolue de la différence entre ces centres ou peut prendre diverses formes dont l’exponentielle décroissante de cette distance. L’indice d’agrégation de Tango C est alors défini comme une forme quadratique de la matrice W des distances et du vecteur des fréquences ) Y Y * r + 1 ,…, k , des cas dans – N N . chacun des k intervalles de temps : C r t Wr (1.15)
La distribution asymptotique de cet indice a été approximée par une loi normale lorsque le nombre d’intervalles de temps devient important [26]. D’autres auteurs avaient également approuvée que la distribution asymptotique de cet indice était normale [34,36]. Cependant, la distribution de C et de sa version standardisée est asymétrique. Ainsi, il a été recommandé d’utiliser une loi du chi-deux pour approximer sa distribution surtout lorsque la taille de l’échantillon n’est pas grande [26]. Une autre approximation de cet indice transforme celui-ci en une fonction linéaire de la statistique U définie comme une moyenne des distances entre les cas de maladie [37].
Cette version temporelle de l’indice de Tango a ensuite été étendue au cas où les intervalles de temps ne sont pas réguliers et au cas spatial. Dans ce dernier cas, plutôt que de considérer la population totale constituant la population à risque comme dénominateur, les nombres de cas de maladie sont rapportés à la population de chaque unité spatiale. Autrement dit, les cas sont groupés dans des unités spatiales représentées par leurs centroïdes, la population à risque est aussi supposée stable dans ces unités spatiales [38].
Sous l’hypothèse nulle d’absence d’agrégat spatial ou de risque uniforme dans le domaine d’étude, la statistique de Tango qui compare deux distributions s’écrit comme une somme pondérée des produits des écarts entre la proportion observée de cas dans chaque unité rapportée au nombre total de cas et la proportion attendue, sous l’hypothèse nulle, correspondant à la proportion de la population dans chaque unité spatiale [27] : k k ) Y n * ) Y j nj * T = //Wij + i − i , + − , (1.16)
où Wij sont les poids spatiaux définis par une relation de la forme (1.4) entre les unités i et j , k le nombre d’unités spatiales, ni la taille de la population à risque dans l’unité i , Y# le nombre total de cas et n# le nombre total d’individus à risque. Cet indice est vu comme la somme des produits spatialement pondérés des écarts entre les proportions observée et attendue de cas dans chaque unité spatiale. Le test de sa significativité est basé sur la loi du Chi-deux. En effet, la variable obtenue après la standardisation de la statistique T suit une loi du Chi-deux dont le degré de liberté dépend de la matrice W . Rogerson (1999) a proposé un indice R qui permet de corriger cet indice en le divisant par la racine carrée du produit des proportions observées de la population à risque se trouvant dans les unités i et j [39]. Du fait qu’une valeur élevée de l’indice de Tango (comme pour les autres indices tels que celui de Moran) peut ne pas être un signe d’une forte agrégation mais d’un manque d’ajustement, il a proposé de partitionner l’indice de Tango en une somme de deux indices : un indice de Tango avec i≠ j considéré comme un indice global d’agrégation spatiale (numérateur de l’indice de Moran) et un indice de Tango avec i j considéré comme un indice de la qualité de l’ajustement représentant la somme des carrés des écarts entre les proportions observées et attendues de cas dans les unités spatiales.

Indices locaux d’autocorrélation spatiale

Les indices locaux de l’autocorrélation spatiale, appelés tests locaux d’association spatiale, permettent de localiser les agrégats spatiaux dans des unités spatiales de niveau inférieur à celui du domaine d’étude et ainsi d’affirmer ou d’infirmer si les valeurs d’une variable dans une entité donnée sont similaires à celles des entités avoisinantes. À titre exemplatif, l’étude de l’autocorrélation spatiale locale de l’infection par le VIH au Burundi pourrait permettre de répondre à la question de savoir s’il existe un agrégat local de cas constituant une singularité locale, c’est-à-dire une agglomération de sujets VIH positifs dans une province ou un point chaud, c’est-à-dire un agrégat local de cas agglomérés dans plusieurs provinces avoisinantes.
L’autocorrélation spatiale locale est évaluée à l’aide des indices locaux d’autocorrélation spatiale et du scan spatial. Dans certains cas, le point-source de propagation d’une maladie peut être suspecté. C’est par exemple le cas de la détection des agrégats du nombre de cas d’une épidémie autour d’une source bien spécifiée comme les eaux stagnantes pour le paludisme. Le test de significativité de l’indice permettant de détecter des agrégats de cas avec un point-source prédéfini est qualifié de « focalisé » [41]. Dans la plupart des cas, le point-source n’est pas bien défini : le test de significativité de l’indice est alors qualifié de « non focalisé ». Les tests qui s’intéressent d’une part à la présence des agrégats spatiaux et d’autre part à l’évaluation du risque autour d’un point-source prédéfini respectivement ont été décrits dans la littérature [21]. Nous allons ici nous intéresser aux tests non focalisés.
Les tests locaux permettent, en outre, de détecter et de tester la significativité de 4 types d’endroits : les endroits avec des valeurs élevées (E) de la variable entourés par des endroits avec des valeurs élevées appelés points chauds, les endroits avec des valeurs basses (B) de la variable entourés par des endroits avec des valeurs basses appelés points froids, les endroits avec des valeurs basses (B) de la variable entourés par des endroits avec des valeurs élevées (E) et les endroits avec des valeurs élevées (E) de la variable entourés par des endroits avec des valeurs basses (B) dans les unités spatiales de la région d’étude. Ces endroits sont visualisés sur la carte en même temps que les valeurs élevées de la variable dans les unités spatiales. Le premier endroit est alors nommé EE (plus-plus ou high-high), le deuxième BB (moins-moins ou low-low), le troisième BE (moins-plus ou low-high) et le quatrième EB (plus-moins ou high-low).

Indice local de Moran

L’indice local de Moran est une version locale de l’indice global de Moran. De ce fait, il permet de tester s’il y a une autocorrélation spatiale entre les valeurs observées d’une variable dans chaque entité géographique du domaine d’étude en tenant en compte des entités avoisinantes.
Pour une entité i donnée du domaine d’étude, l’indice local de Moran s’écrit [31] : ρi = Z i −  / Wij Z j −  (1.18)
Comme pour l’indice global de Moran, la valeur moyenne et la variance de cet indice ont été établies [22]. Sa significativité est évaluée en utilisant la loi normale centrée-réduite.
Les indices local et global de Moran sont liés par : / ρi S 0 S 2 I = i (1.19)
où S0 représente le nombre de paires utilisées dans la calcul de l’indice local de Moran et S 2 la variance non réduite de la variable Zi . Le facteur de proportionnalité entre ces deux indices est donc S 0 S 2 et vaut S0 dans le cas des variables standardisées.
En plus de l’indice global de Moran et de sa version généralisée, le nuage de points de Moran (« Moran scatter plot ») peut être utilisé pour analyser l’autocorrélation spatiale globale. Utilisé conjointement avec l’indice local de Moran, le nuage de points de Moran est un outil essentiel dans l’évaluation des comportements locaux des phénomènes [42]. Pour le construire, il est porté en abscisses les valeurs de la variable quantitative Z d’intérêt, souvent sous sa forme standardisée, et en ordonnée les pas (lags) spatiaux WZ de cette même variable. Appelés « variable spatialement décalée », ces lags sont obtenus en faisant des moyennes spatialement pondérés des valeurs observées Z j dans les entités géographiquement voisines [43] : N /Wij Z j lN i /Wij j 1ag  j1 (1.20)
La normalisation de la matrice W des poids spatiaux et le centrage de la variable Z ont pour conséquence que les lags WZ et la variable Z soient de moyennes nulles. La variable WZ est régressée sur la variable Z , ce qui conduit à une droite d’ajustement passant par l’origine des axes et dont le coefficient (ou pente de la droite) correspond à la valeur de l’indice global de Moran. L’intérêt du nuage de Moran est de détecter notamment les valeurs aberrantes et de confirmer la positivité ou la négativité de l’indice global de Moran via le signe de la valeur de la pente de la droite de régression. Une fois la structure spatiale détectée, l’échelle spatiale à laquelle elle est la plus significativité est testée.
Appliqué aux données de prévalence du retard de croissance (que nous définirons plus loin au troisième chapitre) chez les enfants de moins de trois ans en Côte d’Ivoire en 1994 (Figure 15), le nuage de points de Moran est ajusté à l’aide d’une droite de régression linéaire dont la pente est égalent à l’indice global de Moran.

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

Liste des tableaux
Chapitre 1 : Généralités sur l’analyse spatiale
1.1. Introduction à l’analyse spatiale
1.1.1. Définition et système d’information géographique (SIG)
1.1.2. Analyse spatiale et statistique spatiale
1.1.3. Notion de couches et sources des données
1.1.4. Projections et systèmes de projection
1.1.5. Type de données spatiales
1.2. Définition des poids entre les unités spatiales
1.2.1. Matrice des distances spatiales
1.2.2. Graphe de voisinage entre les points
1.3. Autocorrélation spatiale
1.3.1. Indices globaux d’autocorrélation spatiale
1.3.2. Indices locaux d’autocorrélation spatiale
1.4. Techniques d’interpolation spatiale
1.4.1. Définition de l’interpolation spatiale, limites et utilisation
1.4.2. Analyse de la tendance spatiale
1.4.3. Analyse variographique
1.4.4. Méthodes d’interpolation spatiale
1.4.5. Krigeage ordinaire
1.4.6. Interpolation spatiale par la méthode des noyaux
1.5. Modélisation spatiale
1.5.1. Définition d’un modèle spatial
1.5.2. Définition d’un modèle spatial généralisé
1.5.3. Les modèles de régression spatiale binomial et de Poisson
1.6. Méthodes statistiques d’analyse spatio-temporelle
Chapitre 2 : Analyse spatiale du VIH/SIDA au Burundi
2.1. Épidémiologie de l’infection par le VIH dans le monde
2.2. Épidémiologie de l’infection par le VIH dans la région des Grands Lacs
2.3. Contexte du Burundi
2.3.1. Situation géographique, administrative et démographique
2.3.2. Organisation du système de santé
2.3.3. Historique de la lutte contre le VIH/SIDA
2.3.4. Organisation de la lutte contre le VIH/SIDA
2.3.5. Politique nationale de lutte contre le SIDA
2.3.6. Épidémiologie de l’infection par le VIH au Burundi
2.4. Contexte de notre recherche au Burundi
2.5. Objectif de l’étude
2.6. Méthodologie
2.6.1. Sélection de la population d’étude
2.6.2. Données géographiques
2.6.3. Analyses statistiques
2.6.4. Explicitation du modèle spatial utilisé dans l’étude
2.7. Article « Spatial analysis of HIV infection and associated individual characteristics in Burundi: indications for effective prevention »
Chapitre 3 : Analyse spatiale et temporelle du retard de croissance en Côte d’Ivoire
3.1. Introduction
3.2. Anciennes références et nouvelles normes de croissance de l’OMS
3.3. Situation nutritionnelle dans le monde
3.3.1. Période des 1000 jours, et la tranche d’âge 0-5 ans
3.3.2. Sous-alimentation et retard de croissance dans le monde
3.4. Situation nutritionnelle en Afrique subsaharienne
3.5. Situation nutritionnelle en Côte d’Ivoire et dans les pays limitrophes
3.6. Contexte de la Côte d’Ivoire
3.6.1. Situation géographique, administrative et démographique
3.6.2. Recensements de population en Côte d’Ivoire
3.6.3. Crise ivoirienne et ses conséquences
3.6.4. Lutte contre la malnutrition en Côte d’Ivoire
3.7. Contexte de notre recherche en Côte d’Ivoire
3.8. Objectifs
3.9. Méthodologie
3.9.1. Sélection de la population d’étude
3.9.2. Diagrammes des flux des enfants de 0-35 mois
3.9.3. Définition des variables
3.9.4. Analyse statistique
3.10. Article « Stunting among children under three years in Côte d’Ivoire: spatial and temporal variations between 1994 and 2011 »
Conclusion générale
Références bibliographiques

Télécharger le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *