Statistique bayésienne appliquée en sciences humaines et sociales

L’essentiel des travaux présentés dans cette thèse est motivé par des questions soulevées par des problématiques issues de recherche en psychologie. En effet, depuis Septembre 2015, je suis PRAG de mathématiques affecté dans l’UFR de Psychologie à l’université de Nantes et je collabore avec les chercheurs des laboratoires de Psychologie de Nantes (LPPL , CREN et BePsyLab ).

L’analyse de médiation

L’analyse de médiation est utilisée dans de nombreux domaines des sciences humaines et sociales mais également en médecine. Elle fait partie d’une problématique plus globale appelée analyse de la causalité. Le but de cette partie est d’introduire les notions minimales de causalité qui vont nous permettre de définir les effets naturels directs et indirects qui sont les quantités que nous avons choisies d’estimer et de tester dans Galharret et al. (2019b); Galharret and Philippe (2019). L’analyse de médiation la plus simple concerne un triplet de variables (X, M, Y ) où X, M sont des variables prédictives et Y une variable à expliquer. Connaissant l’effet de M sur Y , on étudie à travers quel mécanisme la variable X va agir sur la variable Y . Ainsi on évalue l’effet de X sur Y qui ne transite pas à travers M (l’effet direct) et l’effet de X sur Y via M (l’effet indirect). La difficulté dans la définition de ces effets est qu’ils vont être liés à la nature de la variable Y . Lorsque Y est continue ces définitions sont immédiates. Pour Y binaire (qui sera le cadre de ma thèse) j’estime ces effets à partir d’une définition dans le contexte de l’étude de la causalité (voir Robins and Greenland, 1992; Pearl, 2001; Imai and Keele, 2010) qui sera vraie sous certaines hypothèses.

Dans la suite :
— la variable X désigne la variable d’exposition, ou de traitement,
— la variable M désigne la variable médiatrice ou médiateur,
— la variable Y désigne la variable réponse.

L’effet causal : approche contrefactuelle

Les premières références concernant la réponse potentielle (potential outcome) sont présentes dans les travaux sur les plans expérimentaux de Fisher (1935) et de Neyman (1935). Le statisticien Rubin (1974) est le premier à proposer un modèle causal contrefactuel dans lequel pour un même individu il existe plusieurs résultats hypothétiques (les résultats potentiels), qui sont fonction de l’exposition de l’individu. La principale difficulté réside dans l’impossibilité d’observer la contrefactuelle. Ces travaux ont été prolongés par Robins and Greenland (1992); Pearl (2001). L’ouvrage récent de Pearl and Mackenzie (2018) donne un état de l’art sur l’analyse causale.

X binaire
Pour définir l’effet causal, on définit deux nouvelles variables aléatoires Y0, Y1 appelées variables contrefactuelles dont les valeurs correspondent à ces réponses potentielles :
— Y0(u) serait la réponse si l’individu u n’avait pas été exposé,
— Y1(u) serait la réponse si l’individu u avait été exposé .

Example 1.1.1. Considérons X le fait de dédoubler ou pas la classe en CP dans des zones considérées ZEP et Y le niveau en mathématiques des élèves. Y peut être binaire (0 : endessous des attendus, 1 : au-dessus des attendus), ou mesurée (moyenne des notes de l’élève en mathématiques). Pour un élève u donné, étant donnée l’absence d’information dans l’état où il n’est pas observé, nous nous intéressons à un effet agrégé à la population, le plus souvent la moyenne.

Definition 1.1.2. (voir Robins and Greenland, 1992; Pearl, 2001) A partir des variables contrefactuelles Y0 et Y1, l’effet moyen causal de X sur Y est défini par :

ψ0 = E (Y1 − Y0) (1.1)

Aucune des deux variables Y0 et Y1 n’est observable, par contre si l’on considère un échantillon (Xi , Yi)i ∈{1,…,n} , les résultats observés sur les individus peuvent être utilisés pour connaître la valeur de ψ0 :
— les individus ayant été exposés vont contribuer à l’information de E(Y1)
— ceux qui ne l’auront pas été contribueront à l’information de E(Y0)
Cette hypothèse s’appelle l’hypothèse de consistance, elle peut être énoncée de la façon suivante :

Hypothèse de consistance Pour un individu u donné, on suppose que la réponse Y observée correspond à la valeur potentielle correspondant à son exposition X(u)= x. Autrement dit, on suppose que

X(u) = x =⇒ Y (u) = Yx(u) (1.2)

pour tout individu u, ce que l’on peut aussi écrire de façon condensée par Y = YX.

X continue
Supposons que la variable X ∈ X , on définit alors la fonction aléatoire contrefactuelle (Yx)x∈X , Yx étant la réponse potentielle si le sujet avait été exposé à la valeur X = x. On définit alors la fonction de régression causale ψ0(x):= E(Yx) et la fonction de régression ψ(x) := E(Y |X = x). Comme précédemment en général on a : ψ0(x) ≠ ψ(x), mais sous des hypothèses de consistance et d’ignorabilité on obtient

ψ0(x) = ψ(x), ∀x ∈ X .

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

1 Introduction
1.1 L’analyse de médiation
1.1.1 L’effet causal : approche contrefactuelle
1.1.2 Le modèle de médiation
1.1.3 L’effet naturel direct et indirect
1.1.4 Identification des effets naturels directs et indirects
1.2 Contribution à l’analyse de médiation
1.2.1 Le test non paramétrique de l’effet direct
1.2.2 Construction de différentes lois a priori informatives
1.3 Applications en psychologie
1.3.1 Les modèles et les outils de mesure en psychologie
1.3.2 Les modèles de médiation en psychologie
1.3.3 Contribution
1.4 Les modélisations pour la datation en archéologie
1.4.1 La datation par luminescence
1.4.2 Le problème des valeurs aberrantes
1.4.3 Contribution à la modélisation en archéologie
2 Non-parametric Mediation Analysis for direct effect with binary outcomes
2.1 Introduction
2.2 Strong absence of direct effect
2.3 The non-parametric test procedure
2.4 Numerical applications
2.4.1 Students’ Self-Efficacy Feeling
2.4.2 Simulated data
3 Priors Comparison in Bayesian mediation framework with binary outcome
3.1 Introduction
3.2 Brief introduction of Causal Mediation analysis
3.3 Bayesian inference of effects
3.4 Prior distribution choice
3.5 Numerical results
3.6 Testing the absence of effect
3.7 Application to schoolchildren’s Well-Being
3.8 Discussion and conclusion
3.9 Appendix
3.9.1 Proof of the Proposition 3.2.2
3.9.2 Proof of the proposition 3.6.1
4 Médiation modérée dans un modèle à plusieurs variables d’exposition
4.1 Contexte et objectif
4.1.1 Contexte de l’étude
4.1.2 Objectifs de l’étude
4.2 Modélisations statistiques
4.2.1 Modèle de médiation à plusieurs variables d’expositions
4.2.2 L’analyse de médiation modérée
4.2.3 Test de modération construit sur le facteur de Bayes
4.2.4 Modélisation associée à l’hypothèse 2
4.3 Résultats et discussion
4.3.1 Hypothèse 1
4.3.2 Hypothèse 2
4.3.3 Résultat du test basé sur le facteur de Bayes
5 Conclusion

Lire le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *