La vraisemblance composite par paires pour l’estimation de l’apparentement

Apparentement spatial

Mesure de la diversité génétique

L’étude de la diversité génétique a été réalisée sur le sous échantillon constitué des 193 individus génotypés. Le Tableau 4.2 donne les fréquences alléliques observées aux 12 locus. Tous les locus sont polymorphes et le nombre total d’allèles varie de 2 pour le locus B5 à 8 pour le locus E4 (Figure 4.4). La proportion des locus polymorphes pour lesquels la fréquence allélique la plus élevée ne dépasse pas 95% est de 85.7% (Tableau 4.4); ainsi près de 86% des locus présentent des variations alléliques importantes. Les paramètres mesurant le polymorphisme des différents locus et les FIS associés à chaque locus sont présentés au Tableau 4.3. L’indice de fixation varie de−0.287 (pour le locus F1) à 0.555 (pour le locus G7) (Tableau 4.3). Le taux, Ho, d’hétérozygotes observé varie de 0.258 (pour le locus G7) à 0.660 (pour le locus F1) et le taux moyen d’hétérozygotie pour l’ensemble des locus est 0.421 (Tableau 4.3 et Tableau 4.4). Nous notons pour certains locus (les locus E4, E6b, D10, G7 et D6) une déviation significative par rapport à l’hypothèse d’équilibre de Hardy-Weinberg au seuil nominal de α = 5%, ce qui correspond à un seuil ajusté de α/12 = 0.00417 (Tableau 4.3). Lorsque nous considérons, non plus individuellement mais globalement, l’ensemble des locus, l’indice de fixation FIS est significativement différent de 0.

Analyse en composantes principales

L’ACP a été donc réalisé sur le sous jeu de données réduit à 193 individus. La Figure 4.5 représente l’éboulis des valeurs propres. Le premier axe principal explique près de 12% de l’inertie et les deux premiers axes n’expliquent qu’un peu plus de 20% de l’inertie totale. La première composante principale oppose d’une part, les locus F5 et E6, et d’autre part, les locus D10 et D6 (Figure 4.6). La seconde composante oppose, dans une moindre mesure, les locus H4 et F1 d’une part, aux locus E11 et G7 d’autre part (Figure 4.7). L’observation du cercle des corrélations permet aussi de confirmer cette opposition entre ces 2 groupes de variables (Figure 4.8). La projection des individus sur le plan principal est donnée par la Figure 4.9. Nous pouvons ainsi distinguer le groupe des individus plutôt semblables du point de vue de leurs génotypes aux locus F5 et E6 des individus qui sont plutôt semblables aux locus D10 et D6.

Structure génétique spatiale

Test de Mantel Le test de Mantel a été effectué sur le sous-échantillon constitué des 58 individus dont les coordonnées spatiales et les génotypes à tous les locus sont disponibles. Le test de Mantel n’est pas significatif (Figure 4.10). En effet, la statistique de Mantel observée est ρm = −0.048 et la probabilité d’observer une valeur supérieure ou égale à cette dernière valeur sous l’hypothèse nulle,

APPLICATION DU MODÈLE SPATIAL 

Wang; pente= −0.038 et la p-value associée est inférieure à 10−4 pour la méthode de Lynch et Ritland). Ces résultats sont cohérents avec ceux obtenus avec le corrélogramme de Moran qui montrent qu’il y a une structure génétique significative à faible et grande distances. Nous n’avons, par contre, pas pu effectuer le test de signification duparamètre de la régression linéaire du coefficient d’apparentement estimé selon la méthode de (Milligan, 2003) en fonction de la distance. Nous notons cependant des différences dans l’allure générale des courbes présentées sur la Figure 4.12. Tout d’abord certaines valeurs estimées de l’apparentement par la méthode des moments sont négatives alors que celles données par la méthode de Milligan sont toutes positives; alors qu’avec la méthode de Lynchet Ritland, l’apparentement décroît de manière graduelle de 0 à 100 m puis de manière abrupte à partirde 120 m, l’estimateur de l’apparentement de Wang décroît avec la distance jusqu’à 140 m mais a une tendance à croître au delà de cette distance. Cependant un défaut majeur de ces deux dernières méthodes est qu’elles fournissent des valeurs estimées négatives. Ainsi respectivement près de 59% et 61% des valeurs estimées du coefficient d’apparentement d’un couple d’individus par les méthodes respectivement de Lynch et Ritland (1999) et Wang (2002) sont négatives; ce qui n’a pas vraiment de sens du point de vue de l’interprétation biologique (Milligan, 2003). Le coefficient d’apparentement moyen estimé selon la méthode de Milligan (2003) varie de 0.135 pour des individus distants de 10 à 20 m jusqu’à 0.017 pour des individus distants de plus de 150 m. La distribution des valeurs estimées du coefficient d’apparentement de Milligan est présentée aux Figures 4.13 et 4.14; la distribution est asymétrique et l’apparentement moyen est faible (0.09). Aussi, il faut souligner que contrairement aux méthodes d’estimation par les moments, l’estimation de l’apparentement par maximum de vraisemblance de Milligan (2003) est toujours comprise dans l’intervalle de définition du paramètre. Cette contrainte induit par contre un biais pour les valeurs du paramètre proches de 0; ceci est illustré par les Figures 4.13 et 4.14. Nous notons, en effet, qu’il y a un excès de valeurs estimées de l’apparentement qui sont proches de 0.

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

Introduction
1 Apparentement spatial
1.1 Introduction
1.2 Modèle de Milligan
1.2.1 Estimation des paramètres
1.2.2 Propriétés statistiques
1.2.3 Limites du modèle de Milligan
1.3 Cas de plus de 2 génotypes
1.3.1 La vraisemblance composite
1.3.2 La vraisemblance composite par paires pour l’estimation de l’apparentement
1.4 Prise en compte de l’information spatiale
1.4.1 Version hiérarchique bayésienne du modèle de Milligan
1.5 Conclusion
2 Héritabilité en milieu naturel
2.1 Introduction
2.2 Covariance phénotypique et covariance génétique
2.3 Revue bibliographique
2.3.1 Modèle de régression linéaire pour l’estimation de l’héritabilité
2.3.2 Modèle de la vraisemblance pour l’estimation de l’héritabilité
2.4 modèle pour l’apparentement et l’héritabilité
2.4.1 Modèle bayésien hiérarchique
2.4.2 Lois a posteriori des paramètres
2.5 Conclusion
3 Estimation
3.1 Inférence bayésienne
3.1.1 Les méthodes de Monte Carlo
3.1.2 Les méthodes de Monte Carlo par chaînes de Markov
3.2 Algorithmes d’estimation des paramètres
3.2.1 Version bayésienne du modèle de Milligan
3.3 Estimation dans le cas spatial
3.4 Estimation des paramètres génétiques
3.5 Conclusion
4 Applications
4.1 Application à des données sur le karité
4.1.1 Introduction
4.1.2 Analyse statistique des données
4.1.3 Résultats
4.2 Application du modèle spatial
4.2.1 Étude de l’effet du prior
4.2.2 Effet de la variance de dispersion sur les données simulées
4.3 Discussions
Conclusion générale et perspectives
Bibliographie

Rapport PFE, mémoire et thèse PDFTélécharger le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *