La sélection des variables contextuelles : l’exemple des indices de défaveur sociale
Les relations entre inégalités sociales et territoires de santé sont multiples et complexes à caractériser. Une variabilité importante de la répartition des catégories sociales au sein d’un territoire est constatée quelle que soit l’échelle considérée. L’implantation différentielle des populations selon leur catégorie sociale résulte de processus complexes qui ont contribué à la partition des territoires (Haut Conseil de la santé publique 2009). La caractérisation et la typologie des quartiers en fonction de leur organisation et de leur aménagement deviennent ainsi un enjeu primordial pour identifier, mesurer et comprendre les inégalités sociales de santé à l’échelle des territoires.
La recherche d’indicateurs pertinents pour permettre cette caractérisation est nécessaire. Plus précisément, des indices ont été créés dans différents pays pour une caractérisation territoriale sociale permettant la prise en compte des spécificités territoriales, soit par une seule variable ou plusieurs. Dans le contexte des recherches conduites sur les inégalités sociales de santé, une multitude d’indices se sont développés en France, en Europe et à l’international. Ainsi nous pouvons citer : indice de Jarman (Angleterre, 1983), indice de Townsend (Angleterre, 1987), indice de Carstairs et Morris (Ecosse, 1991), indice de Pampalon (Québec, 2000), index of multiple deprivation (Royaume-Uni, 2000), European deprivation index (Pornet et al. 2012), FDep (France, 2009), indices Métropoles (France,2013).
Ces indices, basés sur les caractéristiques de l’aire de résidence, permettent de décrire le rôle des facteurs socio-économiques dans l’analyse de l’impact du quartier sur la santé. Les mesures territoriales de la pauvreté ou de la précarité peuvent être construites, soit à partir de méthodes additives (sommes pondérées de variables), comme pour les indices de Carstairs ou Townsend, soit par une approche multidimensionnelle de réduction de données (analyses en composantes principales), comme par exemple l’indice de « défavorisation » développé par Pampalon (Challier 2001; Declercq C. et al. 2004; Lorant et al. 2003; Pampalon et Raymond 2003). Une approche comme celle de Pampalon permet en effet de révéler le caractère multidimensionnel de la précarité, et notamment la mise en évidence d’une défaveur matérielle d’une part et d’une défaveur sociale d’autre part. De plus, dans ce cas, le poids de chaque indicateur dans l’indice n’est pas déterminé de façon arbitraire, mais en fonction des relations statistiques établies entre les indicateurs.
L’agrégation se justifie par le fait que la défaveur, tant sur le plan sanitaire que social, est perçue sur un territoire comme une accumulation de désavantages. Bien que le choix d’utiliser un indice plutôt qu’un autre est fonction des objectifs de l’étude de recherche, l’indice FDep est l’un des plus utilisé en France. Cet indice a été reconstruit à l’échelle de l’IRIS à partir des données de recensement de la population de 2008 (Insee) et des revenus fiscaux des ménages de 2008 (Insee-DGI). Quatre variables ont été pris en compte : le pourcentage d’ouvriers dans la population active, le pourcentage de bacheliers chez les 15 ans et plus, le pourcentage de chômeurs dans la population active et le revenu médian par foyer. Cet indice comporte quelques limites car il n’est pas extrapolable sur tout le territoire français (et plus spécifiquement dans les départements et territoires d’outremer) et il a été initialement développé à l’échelle communale (qui n’est pas l’échelle la plus fine). Ces indices de défaveur sociale permettent une première description des inégalités territoriales de santé et, dans une certaine mesure, une première évaluation – succincte – de l’adéquation des différents services de proximité. En revanche, ils sont peu utilisables pour détecter et mesurer la précarité au niveau individuel. Ils ne permettent pas de quantifier l’impact de la précarité et des conditions de vie sur la santé (Labbé et al. 2007). Négligeant l’hétérogénéité existante même à une échelle fine comme celle de l’IRIS, l’utilisation de ces indices agrégés ne prend pas en compte les particularités individuelles (nous y reviendrons). Enfin, la principale qualité de ces indicateurs – leur multidimensionnalité – en constitue également une limite : en cas d’association entre un indice de défaveur sociale et un indicateur de santé, ces « boites noires » posent conséquemment la question de savoir quelle(s) variable(s) de construction explique l’association observée. Ce dernier point nous a conduit à faire le choix, dans cette thèse, d’utiliser une seule variable (le revenu médian par unité de consommation des ménages) pour décrire nos quartiers et à construire un score d’exposition cumulée obtenu à partir de cette variable.
La méthode statistique appropriée : utilisation des modèles multiniveaux
Il est fréquent en épidémiologie de s’intéresser à l’association entre l’évolution d’une variable quantitative et la survenue d’un événement de santé. Les modèles de régression linéaire ou logistique sont les plus régulièrement utilisés en fonction des objectifs des études de la variable à expliquer. A partir de données recueillies au sien d’une étude longitudinale, si l’objectif est de modéliser un phénomène de santé sur différents facteurs, nous utilisons des modèles de régression logistique (l’évènement sanitaire est binaire). Par exemple, une étude s’intéressant à la survenue de la dépression, dans laquelle nous disposons de plusieurs variables comme le sexe, l’âge, le revenu, la nationalité, le niveau d’études, etc. Les résultats montrent que le risque de dépression est plus élevé chez les femmes âgées, peu instruites et de nationalité étrangère. Il n’est pas prudent de conclure directement à ces faits au risque de tomber dans un biais communément appelé biais atomiste, c’est-à-dire interpréter les résultats à partir des seuls facteurs individuels. Cette erreur naît lorsqu’on oublie de prendre en compte les contextes locaux, familiaux, sociaux, économiques et culturels dans lesquels les individus évoluent. Cette erreur a des conséquences sur les stratégies de prévention des maladies. Par exemple, les facteurs collectifs (économiques, sociaux et culturels) à l’origine d’un mode vie qui inclut ou non une forte consommation d’alcool seront passés sous silence et la prévention visera la consommation d’alcool, alors que des décisions politiques devraient viser ces facteurs collectifs. Pour éviter ce biais atomiste, les chercheurs (épidémiologistes, démographes, sociologues, géographes de la santé) utilisent des données administratives collectées au niveau de la population et agrégées par territoire (ex : les données de l’Insee) ou des données directement environnementale (ex : pollution ou météorologie). Cette approche couramment appelée approche écologique est largement utilisée actuellement. Les études écologiques sont relativement nombreuses car les bases administratives sont disponibles, gratuites, et fournissent toutes les informations nécessaires à une étude populationnelle tout en évitant la conduite d’enquêtes individuelles – longues et couteuses – indispensables à la connaissance des comportements et des conditions de vie des personnes qui constitue cette population.
Actuellement, ces études permettent de fournir des taux de mortalité, des taux de participation à un dépistage dans un territoire donné ; ainsi, elles permettent de dire que les populations les plus défavorisées ont un taux de dépistage plus faible mais elles ne permettent cependant pas de conclure que « parce que cette population est plus pauvre alors sa participation au dépistage est plus faible » au risque de tomber dans le piège du biais écologique, c’est-à-dire d’inférer – à tort – les associations observées à un niveau collectif, au niveau individuel (à tort parce que cela ne prend pas en compte, entre autres, la diversité des individus au sein de chaque unité écologique d’analyse). Pour étudier les ISS et prendre en compte simultanément les caractéristiques individuelles et contextuelles, il faut donc des méthodes appropriées comme les modèles multiniveaux. Le terme multiniveau se réfère à un ensemble de techniques statistiques qui permet le traitement de données hiérarchiques ; c’est-à dire provenant de plusieurs unités d’analyse. Ces unités d’analyse peuvent être la famille, l’école, le quartier (terme qui sera utilisé tout au long de cette partie), la région, par exemple. Un modèle standard à plusieurs niveaux permet de corriger la corrélation intra-quartiers et d’éviter des biais atomistes et écologiques explicités précédemment (Courgeau 2004; Singh, Harford, et Peres 2018). En d’autres termes, les modèles multiniveaux permettent de s’affranchir de l’erreur écologique (erreur qui consisterait à interpréter au niveau individuel, les résultats d’une modélisation effectuée à un niveau agrégé) et de l’erreur atomiste (ignorer le contexte dans lequel évolue l’individu et étendre à la dimension du contexte un ensemble d’effets individuels). Ces modèles sont de plus, reconnus comme des outils appropriés pour examiner les effets régionaux sur la santé individuelle (Pickett et Pearl 2001; Subramanian et Kawachi 2004; Chaix et Chauvin 2005; Rocha et al. 2017). En France, leur utilisation en épidémiologie s’est considérablement accrue depuis 15 ans (Chaix et Chauvin 2005). L’utilisation d’un modèle multiniveau pour évaluer l’influence des caractéristiques du quartier sur la santé est ainsi largement recommandée pour différencier les effets contextuels et compositionnels. Un modèle standard à plusieurs niveaux permet de corriger la corrélation intra-quartiers entre les observations individuelles et corrige ainsi les erreur-types, ce qui permet d’obtenir des estimations fiables des prédicteurs individuels et de quartiers. Il permet également d’évaluer les variations au sein d’un même quartier et entre les quartiers, et de quantifier la contribution des prédicteurs individuels et de quartiers à ces variations (Xu 2014).
|
Table des matières
INTRODUCTION GENERALE
1. L’approche territoriale
2. L’unité contextuelle appropriée : le choix de l’échelle spatiale
3. La sélection des variables contextuelles : l’exemple des indices de défaveur sociale
4. La méthode statistique appropriée : utilisation des modèles multiniveaux
Questions de recherche
Objectifs
MATERIELS ET METHODES
1. L’enquête SIRS
a. Stratégie d’échantillonnage
b. Collecte des données
c. Pondération, calage et représentativité
d. Questionnaire
e. Administration des questionnaires
f. Suivi et remplacement des personnes interrogées en 2005
g. Considérations éthiques
2. Les variables de santé d’intérêt
a. Participation au dépistage du cancer du col de l’utérus
b. Dépression
3. Les variables indépendantes
a. Caractéristiques individuelles
b. Perceptions et représentations de son corps et du quartier de vie
c. Caractéristiques biographiques
d. Caractéristiques contextuelles
e. Scores (mobilité et diversité socio-économique)
4. Analyses spatiales et statistiques (régression classique, multiniveaux, logiciels)
a. Analyses géographiques
b. Analyses statistiques
ZONE D’ETUDE : L’Île-de-France
PARTIE 1 : DISTRIBUTIONS SPATIALES DES MOBILITES
1. Mobilités résidentielles
2. Mobilités médicales
3. Mobilités professionnelles : quartier de travail ou d’études
4. Mobilités quotidiennes : espaces d’activité des individus
PARTIE 2 : RECOURS AUX SOINS
Le dépistage tardif du cancer du col utérin dans le Grand Paris
Résumé
Introduction
Matériel et méthodes
2.1. Conception de l’enquête
2.2. Outcome
2.3. Variables
2.4. Mesures
2.5. Méthodes statistiques
Résultats
3.1. Description de la population
3.2. Description de la distribution spatiale des différents quartiers
3.3. Facteurs individuels associés au dépistage tardif
3.4. Facteurs contextuels associés au dépistage tardif
3.5. Facteurs d’exposition cumulée associés au dépistage tardif
Discussion
4.1. Principaux résultats
4.2. Comparaison avec les études précédentes
4.3. Limites et points forts
Conclusion
PARTIE 3 : ETAT DE SANTE
Influence des perceptions individuelles, contextuelles et des quartiers multiples sur la dépression
Résumé
Introduction
Matériels et méthodes
2.1. Conception de l’enquête
2.2. Outcome
2.3. Distribution spatiale de la prévalence de la dépression
2.4. Variables de l’étude
2.4.1. Caractéristiques individuelles et de perception
2.4.2. Caractéristiques du quartier
2.5. Analyse statistique
2.6. Mise en œuvre statistique
Résultats
3.1. Description de la population
3.2. Répartition spatiale de la dépression
3.3. Facteurs individuels associés à la dépression (analyse univariée)
3.4. Facteurs contextuels associés à la dépression
3.5. Mesures des perceptions individuelles
3.6. Facteurs contextuels associés à la dépression
3.7. Comparaison entre les femmes et les hommes
Discussion
4.1. Principales conclusions
4.2. Comparaison avec les études précédentes
4.3. Limites et points forts
Conclusion
CONCLUSION
Télécharger le rapport complet