Les enjeux de la recherche sur les mutations
La diversité que nous pouvons observer sur Terre au sein des trois empires du vivant que sont les bactéries, les archées et les eucaryotes est issue des processus de sélection et de mutations. Les mutations sont une altération de la molécule d’ADN, à un niveau ponctuel ou chromosomique. Cette altération peut être le remplacement d’un nucléotide par un autre, une insertion ou une délétion de séquence, une cassure, une duplication, un réarrangement chromosomique ou autres modifications de l’ADN. Nous pouvons distinguer deux origines aux mutations: les mutations issues des erreurs de réplication d’une part, et issues de facteurs mutagènes d’autres part (rayonnement ultra violet, stress oxydatifs ou radioactivité par exemple); voir la revue de Maki, 2002 (Maki, 2002) .
Les mutations constituent un large enjeu pour la recherche en biologie et en médecine. En recherche fondamentale, elles sont étudiées pour répondre à des questions centrales sur l’évolution et les capacités d’adaptation des espèces. La diversité génétique, en partie issues des mutations, est étudiée en écologie pour la conservation des espèces menacées (Ellegren and Galtier, 2016). En médecine, elles sont étudiées en raison de leurs implications dans différentes maladies génétiques et cancers (Ding et al., 2015; Salk et al., 2010). Deux points essentiels intéressent particulièrement les évolutionnistes et la communauté scientifique en général: Le premier est de savoir comment les mutations impactent la fitness des organismes, c’est à dire leurs capacités de survie et de reproduction. L’effet des mutations se définit alors comme avantageux (la fitness augmente), neutre (la fitness ne change pas) ou délétère (la fitness diminue). Le second point est de comprendre à quelles fréquences les mutations apparaissent, et quels facteurs influencent le taux de mutation et ces éventuelles variations aux différentes échelles.
Les variations du taux de mutation
Au début des années 1960 apparaît la notion d’horloge moléculaire (Bromham and Penny, 2003). L’horloge moléculaire avance l’hypothèse d’une apparition constante et continue des mutations dans un génome. Cette horloge moléculaire sera utilisée pour dater les phylogénies, mais des études vont invalider cette hypothèse, avec des variations inter taxons (Britten, 1986; Bromham, 2009) et intra taxon (Bousquet et al., 1992; Bromham et al., 1996) du taux de mutation. De plus, les données actuelles montrent des variations importantes au sein d’une même espèce, par exemple en fonction du mode de reproduction, où le taux de mutation est plus fort dans une population asexuée (Henry et al., 2012; Neiman et al., 2010). C’est aussi le cas pour différentes souches de Chlamydomonas reinhardtii (Ness et al., 2015b) avec une variation d’un facteur 10 entre les taux de mutations les plus bas et les plus hauts. En plus de ces variations inter espèces, il existent des variations intra génomiques du taux de mutation, comme dans le génome mitochondrial des angiospermes (Laroche et al., 1997), ou entre les organelles et l’ADN nucléaire comme chez la drosophile ou Caenorhabditis elegans (Denver et al., 2000; Haag-Liautard et al., 2008; Smith, 2015; Xu et al., 2012). Une revue chez les mammifères expose les nombreuses variations du taux de mutation dans un génome (Hodgkinson and Eyre Walker, 2011), que ce soit aux échelles de sites adjacents, ou de chromosomes entiers. Nous savons par exemple que le taux de mutation est plus élevé au niveau du chromosome sexuel Y les chimpanzés par rapport aux autres chromosomes (Consortium, 2005; Ebersberger et al., 2002). Au niveau intra chromosomique, il a été montré que certains trinucléotides mutent préférentiellement par rapport à d’autres (Ness et al., 2015b; Sung et al., 2015), ou que les régions avec de petites séquences répétées mutent plus rapidement que le reste du génome (Ma et al., 2012; Tesson et al., 2013). Ces variations du taux de mutation mettent en avant l’importance de comprendre quelles forces évolutives l’impactent et le font varier aux échelles inter et intra génomiques. Ces types de résultats sont en partie obtenus par une étude directe du taux de mutation, via les expériences d’accumulation de mutations (EAM). C’est cette approche qui est utilisée dans ce travail de thèse sur les cinq espèces modèles.
Les expériences d’accumulation de mutations
Les premières expériences de Terumi Mukai
Les premières estimations du taux de mutation datent des années 1960 avec les expériences d’accumulation de mutations (EAM) de Terumi Mukai (Keightley and Eyre-Walker, 1999; Mukai, 1964) sur la drosophile, bien que les premières expériences portant sur les mutations ont été développées une cinquantaine d’années plus tôt par Muller (Crow and Abrahamson, 1997; Muller, 1927). A cette époque, l’estimation du taux de mutation ne se fait pas par séquençage, en raison de l’absence des technologies modernes, mais par l’estimation du taux de mutation délétères (Ud) à partir de données de fitness. Le principe des expériences d’accumulation de mutations est de maintenir des lignées filles issues d’une lignée mère pendant un certain nombre de générations et de comparer les lignées filles en fin d’expérience avec le type ancestral (Figure 2). Durant les expériences d’accumulation de mutations, une série de goulots d’étranglements est nécessaire pour maintenir une taille efficace (Ne) la plus faible possible dans les lignées. La taille efficace d’une population, notion introduite par Sewall Wright en 1931 (Wright, 1931), est la part de la population qui participe à la reproduction, ou la taille théorique qu’aurait la population dans un cas idéal (c’est à dire une population avec reproduction aléatoire, la panmixie) qui aurait la même diversité que la population réelle. Plus la taille efficace de la population est grande, plus la sélection est efficace. Inversement, plus la taille efficace est faible plus la dérive génétique sera forte. Réduire la taille efficace dans les lignées permet donc d’éliminer au maximum la sélection naturelle et d’estimer le taux de mutation avant sélection. Nous avons donc accès à la totalité des mutations (exception faite des mutations létales), définissant le taux de mutations spontanées (Drake et al., 1998). C’est pour cette raison qu’une étude de la diversité existante dans une population ou une espèce est insuffisante pour estimer le taux de mutations spontanées car seule la diversité après sélection est mesurée. Dans le cas de la drosophile, en raison de la diploïdie et de la reproduction sexuée, la lignée mère est généralement consanguine homozygote avant de commencer l’expérience (Keightley et al., 2014a, 2014b, 2009).
De cette façon, des variations de fitness dues à la recombinaison de plusieurs allèles lors de la méiose sont évitées. Les locus portant tous le même allèle, l’hypothèse est faite que seules les mutations créent une variation de fitness. Avec les données de fitness, estimées par le succès de reproduction (nombre d’œufs et nombre d’éclosions) .
L’effet des mutations sur la fitness
Les successeurs de Terumi Mukai
La méthode statistique de Mukai est utilisée par différents biologistes pour estimer Ud chez différents organismes modèles. Une revue a été publiée en 2009 (Halligan and Keightley, 2009). D’une manière générale, il est constaté une baisse de la fitness chez les lignées mutantes au cours des générations pour toutes les espèces qui ont été testées, dont quelques exemples sont cités ci-dessous:
– Drosophila melanogaster (Fernández and López-Fanjul, 1996; Fry, 2004, 2001, Fry et al., 1999, 1996; Fry and Heinsohn, 2002; Houle et al., 1992; Huey et al., 2003; Keightley, 1994; Schrider et al., 2013; Wang et al., 2014);
– Caenorhabditis elegans (Ajie et al., 2005; Baer et al., 2006, 2006; Davies et al., 1999; Estes et al., 2004; Katju et al., 2014; Vassilieva et al., 2000; Vassilieva and Lynch, 1999);
– Saccharomyces cerevisiae (Korona, 1999; Wloch et al., 2001; Zeyl and DeVisser, 2001);
– Daphnia pulex (Deng and Lynch, 1997; Korona, 1999, 1999; Latta et al., 2013; Schaack et al., 2013);
– Arabidopsis thaliana (Deng and Lynch, 1997; Rutter et al., 2012; Schultz et al., 1999; Shaw et al., 2000);
Il existe aussi des organismes un peu moins étudiés par EAMs, mais de plus en plus de données sont disponibles sur tout l’arbre du vivant; Chlamydomonas reinhardtii (Morgan et al., 2014), Tetrahymena thermophila (Brito et al., 2010), Dictyostelium discoideum (Hall et al., 2013), Escherichia coli (Cao et al., 2014; Kibota and Lynch, 1996).
De ce fait, il est avancé que la majorité des mutations sont délétères, c’est à dire qu’elles diminuent la capacité de survie. L’impact des mutations délétères dans une population ou chez un individu est défini comme le poids des mutations délétères, ou fardeau génétique (Agrawal and Whitlock, 2012; Charlesworth et al., 1990): c’est la différence de fitness qu’il existe entre la fitness optimale et la fitness réelle. Les mutations délétères sont normalement supprimées par la sélection naturelle, mais la dérive peut les maintenir ou les fixer dans une population. L’effet des mutations délétères sur les populations a largement été exploré (Agrawal and Whitlock, 2012; Charlesworth and Charlesworth, 1998; Kondrashov, 1995, 1988, Lande, 1994, 1988; Lynch et al., 1999), de même que l’estimation par des méthodes statistiques des paramètres mutationnels dans les populations naturelles (Deng et al., 2002; Deng and Lynch, 1996; Li and Deng, 2005). Une population de petite taille efficace est plus sensible aux mutations délétères en raison de la faible efficacité de la sélection naturelle (Eyre-Walker et al., 2002; Higgins and Lynch, 2001; Houle, 1992; Lande, 1998; Lynch et al., 1995; Lynch and Gabriel, 1990; Willi et al., 2006). Si la sélection est trop faible, elle ne permet pas une purge efficace des mutations délétères. Cela peut avoir un impact sur les espèces menacées avec de faibles tailles de population: la dérive et les mutations délétères peuvent accentuer la perte de diversité et de viabilité d’une population.
Cependant, le taux de mutation « optimal » résulte d’un compromis entre le coût des mutations délétères et le bénéfice de mutations avantageuses (Wielgoss et al., 2013). La taille efficace d’une population joue donc un rôle essentiel dans la force de sélection et la capacité adaptative de cette population (Gossmann et al., 2012). Ainsi, la probabilité de fixation d’une mutation dans une population va dépendre de l’intensité de la dérive et de la sélection, et de l’effet de cette mutation sur la survie (neutre, avantageux ou délétère).
Paysage adaptatif et distribution de l’effet des mutations
Comme nous venons de voir, la majorité des mutations semble être délétère, mais une partie est neutre ou avantageuse (Hall et al., 2008; Joseph and Hall, 2004). La distribution de fitness des mutations vient en partie du niveau de fitness d’un génome dans un environnement donné. En faisant l’hypothèse qu’il existe un niveau de fitness maximal possible dans un environnement, la proportion de mutations délétères augmente si la fitness du génome se rapproche du maximum. L’ensemble des fitness possibles se définit comme le paysage adaptatif (Orr, 2005; Petren, 2013), une notion introduite par Sewall Wright et Fisher (Mousseau and Roff, 1987; Edwards, 2000; Zhang, 2012). Il existe de nombreuses théories sur les modèles de paysages adaptatifs possibles, en particulier le « single-peak » (Wright, 1932), le « rugged » ou vallée (Martin and Wainwright, 2013; Steinberg and Ostermeier, 2016) ou le « holey » (Gavrilets, 1997).
Le « single-peak », le plus simple, est un pic de fitness avec un maximum possible (Figure 3). Dans ce cas, la fitness du génome, en fonction des mutations et de l’épigénétique (Kaity et al., 2008), va se déplacer sur le pic de fitness entre le maximum et le minimum. Plus la fitness du génome est proche du maximum, plus les mutations auront de fortes probabilités d’être délétères et, inversement, un génome avec un niveau de fitness bas va compter plus de mutations avantageuses (Tenaillon et al., 2016). Enfin, si la fitness du génome est trop basse, il peut simplement être éliminé par la sélection.
Le second modèle est le modèle « holey » (Gavrilets, 1997), où la fitness maximale est définie comme le plancher du paysage adaptatif. Les mutations avantageuses ne font que maintenir le génome à ce niveau. Ce plancher est marqué par des puits de fitness, dans lesquelles le génome « tombe » en cas de mutations délétères.
Enfin, le modèle le plus souvent accepté, et qui a déjà été mis en évidence chez les bactéries (Nahum et al., 2015) ou des espèces comme un téléostéen du genre Cyprinodon (Martin and Wainwright, 2013), est le « rugged ». Dans ce cas, il existe de nombreux pics de fitness avec des vallées ou des plateaux sur lesquels le génome va se déplacer. De plus, une vallée entre des pics de fitness peut entrainer une différenciation de deux populations, d’où l’importance de cette hypothèse en évolution. Avec ce modèle, une population avec une faible taille efficace peut atteindre un pic de fitness plus élevé qu’une population avec une taille efficace plus grande (Rozen et al., 2008). A cause de l’efficacité de la sélection, une grande population atteindra rapidement le sommet de fitness le plus proche. En revanche, une population avec une petite taille efficace pourrait atteindre un pic de fitness plus élevé, car la dérive génétique déplace la population dans le paysage de fitness.
Dans tous les cas, quel que soit le model admis, ce sont les mutations qui vont principalement augmenter ou diminuer la fitness du génome sur le paysage adaptatif et permettre l’accession à une fitness supérieure dans le cas de mutations avantageuses. Par ailleurs, le paysage adaptatif est spécifiquement défini pour un génotype et un environnement. La position d’un génome est donc le résultat de l’interaction génotype-environnement et du contexte génétique. On a donc une variation du paysage adaptatif suite à une variation environnementale (Matuszewski et al., 2014) ou le long d’un gradient environnemental (Laughlin and Messier, 2015), avec un compromis d’adaptation (Elena and Lenski, 2003) entre les environnements (Figure 4). Au delà des mutations avantageuses ou délétères, les mutations neutres sont tout aussi importantes en raison de la variation de la distribution de la fitness des mutations. Les mutations avantageuses peuvent voir leurs impacts augmentés ou diminués, et les mutations neutres dans un cas peuvent avoir un effet dans d’autres conditions. Le changement de distribution de fitness des mutations neutres met en avant l’importance de la variation existante comme base d’adaptation immédiate à un changement environnemental (Barrett and Schluter, 2008; Hermisson and Pennings, 2005). On parle de la « standing genetic variability ».
|
Table des matières
CHAPITRE 1: INTRODUCTION
1. Introduction générale
2. Les enjeux de la recherche sur les mutations
3. Les variations du taux de mutation
4. Les expériences d’accumulation de mutations
1. Les premières expériences de Terumi Mukai
2. L’effet des mutations sur la fitness
1. Les successeurs de Terumi Mukai
2. Paysage adaptatif
3. Interactions génotype-environnement
1. Les changements d’effet des mutations
2. Le stress et les hyper mutateurs
5. Les estimations directes du taux de mutation
1. Les variations inter génomiques du taux de mutation
1. La taille du génome
2. La taille efficace (Ne)
3. Le temps de génération
4. Le taux métabolique et la température
2. Les variations intra génomiques du taux de mutation
1. Le sens de la transcription et de la réplication
2. Le temps de réplication
3. Les régions codantes et le niveau d’expression
4. La composition en GC
6. Nouveaux modèles biologiques
1. L’importance écologique du phytoplancton
2. Présentation des espèces
1. Choix des modèles biologiques
2. Les Mamiellophyceae
3. Les Trebouxiophyceae
1. Présentation générale
2. Les transferts horizontaux de gènes
7. Les objectifs de thèse
CHAPITRE 2: EFFETS DES MUTATIONS SUR LA FITNESS
CHAPITRE 3: LE TAUX DE MUTATION CHEZ LES MAMIELLOPHYCEAE
CHAPITRE 4: LES TRANSFERTS HORIZONTAUX DE GENES: LE CAS DE
PICOCHLORUM RCC4223
CHAPITRE 5: IMPACT DU TAUX DE MUTATION POUR LES BIOTECHNOLOGIES
CHAPITRE 6: DISCUSSION ET CONCLUSION
1. Les variations de fitness indépendantes des mutations
1. La plasticité phénotypique
2. Les bactéries présentes dans les cultures d’O. tauri
3. Le rôle des variations structurelles sur le phénotype
2. Les limites à l’estimation du taux de mutation
3. Perspectives pour les EAMs
4. Conclusion générale
Annexes
Listes des figures et des tableaux
Bibliographie
Télécharger le rapport complet