La sélection génomique dans des populations constituées de matériel élite et de ressources génétiques chez le pommier

Description de l’espèce

Taxonomie

Le pommier cultivé ou Malus domestica Borkh, appartient à la sous famille des Maloideae, de la famille des Rosaceae (Harris et al., 2002). Cette famille botanique regroupe de nombreuses autres cultures fruitières importantes sur le plan économique, telles que la poire, la pêche, la prune, l’abricot, l’amande, la cerise, la fraise et la framboise. Le genre Malus auquel appartient le pommier regroupe une trentaine d’espèces (Ma et al., 2017).

Origine

La domestication du pommier s’est faite il y a au moins 4000 ans (Cornille et al., 2014). De nombreuses études effectuées sur la domestication et l’origine de la pomme (Cornille et al., 2012 ; Cornille et al., 2014 ; Gross et al., 2014 ; Wani et al., 2015 ; Cornille et al., 2019) confirment qu’elle provient du continent asiatique. La région d’Asie centrale qui est identifiée comme le plus grand centre de diversité du pommier est considérée comme le lieu d’origine de la pomme domestiquée d’après Harris et al. (2002). Cette hypothèse est confortée par les travaux de Cornille et al. (2012), qui confirment que la pomme cultivée est originaire d’Asie centrale où l’on trouve encore aujourd’hui son ancêtre sauvage, Malus sieversii. Ces mêmes études ont permis d’identifier cette espèce comme le principal géniteur de M. domestica sur la base de la comparaison de séquences d’ADN. Par ailleurs, le génome du pommier montre des traces d’introgressions secondaires venant d’espèces sauvages dont les plus importantes sont M. sylvestris, M. baccata et M.orientalis (Wani et al., 2015).
Cet échange de fragments d’ADN aurait eu lieu le long des routes des caravanes commerciales communément appelées « Route de la soie », et qui reliaient l’Asie et l’Europe par voie terrestre. Parmi ces espèces identifiées, M. sylvestris serait l’espèce d’Europe occidentale la plus proche de M. domestica d’après les résultats d’analyse des marqueurs microsatellites de Cornille et al. (2012).

Sélection phénotypique et SAM chez le pommier

La sélection phénotypique de création variétale chez le pommier est un processus long avec des coûts élevés de phénotypage. Cela est dû en partie à la longue phase juvénile du pommier qui retarde le phénotypage de certains caractères nécessaires à l’identification des génotypes les plus intéressants.
C’est le cas de la productivité qui ne peut être évaluée qu’environ sept ans après les semis. Pour pallier de telles contraintes, des marqueurs moléculaires ont été développés pour permettre une identification précoce des génotypes les plus intéressants, comme ceux présentant un allèle de résistance à une maladie. Cependant, cette méthode de sélection assistée par marqueur est inefficace si le caractère d’intérêt est contrôlé par de nombreux gènes à effet faible (Muranty et al., 2014). Il est alors possible d’avoir recours à un grand nombre de marqueurs génétiques : cette approche a été baptisée sélection génomique.

Principe de la sélection génomique

Le phénotype de chaque individu dépend en partie des gènes qu’il porte. La somme des effets de ses gènes sur un caractère constitue sa valeur génétique. Elle peut être décomposée selon l’équation G = A + D + I avec A, la valeur génétique additive (ou breeding value), D, les effets de dominance résultant de l’interaction entre les allèles d’un même locus et I, les effets d’épistasies résultant des interactions entre les allèles de loci différents. La valeur génétique additive est la seule part de la valeur génétique qui est transmissible par reproduction sexuée à la descendance. Le principe de la sélection génomique repose sur la prédiction de la valeur génétique additive de chaque candidat à la sélection, par l’utilisation d’un nombre important de marqueurs couvrant tout leur génome (Meuwissen et al., 2001). Les effets additifs des marqueurs génétiques sont estimés grâce aux déséquilibres de liaison existant entre ces marqueurs et les QTL causaux (Goddard et Hayes, 2007). Ensuite, la valeur génétique additive de chaque individu est estimée en calculant la somme des effets additifs de tous ses marqueurs.
Les estimations des effets des marqueurs sont effectuées à l’aide d’une population dite d’entrainement (ou référence) puis reportées sur une autre population dite candidate (ou validation). Cela est traduit concrètement par l’élaboration d’un modèle de prédiction établi sur la population d’entrainement dont les données génotypiques et phénotypiques ont été préalablement acquises. A partir de ce modèle, il devient possible de prédire les valeurs génétiques additives des individus de la population candidate dont seules les données génotypiques sont obtenues.
La valeur génétique additive prédite chez un individu est appelée aussi Genomic Estimated Breeding Values (GEBV).

Apport de la sélection génomique chez le pommier

L’application de la sélection génomique chez le pommier permet d’augmenter considérablement le gain génétique qui représente la réponse à la sélection (Kumar et al., 2012a). L’application de la sélection génomique permet de réduire l’intervalle entre les générations, ce qui a comme avantage une réduction considérable de la durée des programmes d’amélioration variétale chez le pommier. Elle permet aussi d’augmenter l’intensité de sélection, car les jeunes plants sont moins coûteux à produire que des arbres phénotypés en verger, même si on peut envisager de phénotyper des individus après une pré-sélection par la sélection génomique. Cela permet de réduire l’effectif des arbres à phénotyper, ce qui représente une réduction des surfaces occupées et par conséquence une diminution du coût du phénotypage. Le gain génétique peut aussi augmenter avec une meilleure précision de prédiction.

Modèles statistiques de prédiction génomique

Les modèles statistiques utilisés en sélection génomique ont pour objectif de calculer les GEBV d’une population candidate. Cela peut se faire directement en prédisant la GEBV de chaque individu ou par estimation des effets additifs associés à chaque marqueur pour ensuite faire la somme. La complexité méthodologique de la sélection génomique réside dans le fait que le nombre de variables explicatives (les marqueurs) est nettement supérieur au nombre de variables à expliquer (individus).
Cette situation ne permet pas d’utiliser un modèle de régression linéaire multiple car le nombre de degrés de liberté est insuffisant et par conséquent il est impossible d’estimer les effets de tous les marqueurs. La solution à cette contrainte est d’appliquer dans les modèles, des méthodes statistiques de pénalisation comme le « shrinkage » qui est un rétrécissement vers 0 des effets estimés des marqueurs. En plus, selon les lois des modèles utilisés, différents types d’effets de marqueurs (fort faible ou nul) peuvent être autorisés. Les modèles les plus couramment utilisés en prédiction génomique, sont les modèles GBLUP, RRBLUP et les méthodes bayésiennes. Toutes ces méthodes sont basées sur des équations du modèle mixte d’évaluation de la valeur génétique.

Précision de la prédiction génomique et les facteurs qui l’influencent

La précision de prédiction (ou accuracy) est la corrélation entre les vraies valeurs génétiques appelées True Breeding Values (TBV) et celles estimées (GEBV).
En réalité, les vraies valeurs génétiques sont inconnues mais elles peuvent être estimées par BLUP, BLUE ou par calcul de phénotypes moyens obtenus à partir d’une évaluation multi environnementale.
L’efficacité de la sélection génomique dépend de la précision des prédictions, qui est influencée par plusieurs facteur tels que :
l’héritabilité du caractère : plusieurs études sur la sélection génomique ont montré que la précision de prédiction est fortement influencée par l’héritabilité du caractère étudié (Desta et Ortiz, 2014). Par exemple, les travaux de Muranty et al. (2015) ont montré que la précision de prédiction était plus élevée pour les caractères présentant les plus fortes héritabilités chez le pommier.
la densité de marqueur : Calus et al. (2008) ont montré que l’augmentation de la densité de marqueurs entraine une augmentation de la précision de prédiction. Mais la précision atteint un plateau à partir d’un seuil de densité de marqueurs.
la taille de la population d’entrainement : la précision de prédiction des GEBV dépend aussi de la taille de la population d’entrainement car l’augmentation de la taille de la population entraine une augmentation du nombre d’haplotypes à estimer pour un caractère (Edwards et al., 2019). De même que pour la densité de marqueurs, passé un seuil, le nombre d’individus de la population d’entrainement n’améliore pas la qualité de la prédiction.
apparentement entre la population d’entrainement et la population candidate : la prédiction génomique repose sur l’hypothèse selon laquelle les déséquilibres de liaison entre marqueurs et QTL identifiés dans la population d’entrainement sont les mêmes dans la population candidate. Pour que l’estimation des effets des marqueurs soit cohérente, les individus composant la population d’entrainement ne doivent pas être génétiquement éloignés de ceux de la population candidate (Clark et al., 2012; Pszczola et al., 2012). Ainsi, une faible précision de prédiction a été trouvée chez les bovins lorsque les GEBV de la race Holstein étaient calculées à partir de la race Jersey (Hayes et al., 2009a).

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

Introduction
1 Synthèse bibliographique
1.1 Description de l’espèce
1.1.1 Taxonomie
1.1.2 Origine
1.1.3 Caractéristiques biologiques
1.1.4 Diversité génétique
1.1.5 Sélection phénotypique et SAM chez le pommier
1.2 La sélection génomique
1.2.1 Principe de la sélection génomique
1.2.2 Apport de la sélection génomique chez le pommier
1.2.3 Modèles statistiques de prédiction génomique
1.2.4 Précision de la prédiction génomique et les facteurs qui l’influencent
1.3 Objectifs
2 Matériels et Méthodes
2.1 Populations d’étude
2.1.1 Matériel élite
2.1.2 Ressources génétiques
2.2 Phénotypage des populations
2.2.1 Matériel élite
2.2.2 Ressources génétiques
2.3 Génotypage des populations
2.3.1 Matériel élite
2.3.2 Ressources génétiques
2.4 Caractérisation des populations
2.4.1 Évaluation de la diversité génétique et de la structure des populations
2.4.2 Diversité génétique
2.4.3 Structure génétique
2.5 Prédiction génomique
2.5.1 Modèle de prédiction
2.5.2 Évaluation de la précision de prédiction
3 Résultats 
3.1 Diversité génétique
3.1.1 Indices de diversité génétique
3.1.2 Évaluations des fréquences alléliques minoritaires (MAF)
3.2 Structure des populations
3.3 Précision de prédiction
3.4 Corrélation entre précision de prédiction et effectif d’individus
4 Discussion
4.1 Diversité et différenciation génétique
4.2 Analyse et interprétation des précisions de prédiction
Conclusion

Rapport PFE, mémoire et thèse PDFTélécharger le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *