La théorie de l’évolution au début du XXème siècle
Au début du XXème siècle, cela fait quarante ans que l’ouvrage fondateur de Charles Darwin, L’Origine des espèces, a été publié. Le concept général d’évolution a été rapidement accepté après la publication de l’ouvrage, mais le mécanisme proposé par Darwin, la sélection naturelle, reste controversé. Darwin base sa théorie de l’évolution par sélection naturelle sur trois principes : variations entre individus, adaptation au milieu et hérédité des caractères. Mais il ne fournit pas d’explication précise sur le mécanisme d’apparition de nouvelles espèces. Ainsi, d’autres alternatives sont encore défendues pour expliquer l’évolution. Certains s’appuient sur la théorie que Jean-Baptiste de Lamarck a formulée au début du XIXème siècle, et soutiennent que l’évolution s’effectue par transmission des caractères acquis. D’autres pensent que l’évolution se fait par sauts évolutifs importants en une seule génération : c’est le saltationnisme. Enfin, l’orthogenèse défend l’idée que les organismes sont soumis à des forces internes telles que des lois de développement, qui guident l’évolution dans une certaine direction.
Lois de Mendel et génétique des populations
En 1900, les travaux de Johann Gregor Mendel, initialement publiés en 1865, sont redécouverts indépendamment par trois botanistes européens, le Hollandais Hugo de Vries, l’Allemand Carl Correns et l’Autrichien Erich Tschermak (voir le numéro spécial « 1900 : Redécouverte des lois de Mendel » des Comptes rendus de l’Académie des sciences, série III, tome 323, no12, 1033-1196, décembre 2000). Cette redécouverte passe par des expériences ou des observations semblables à celles qu’avait faites Mendel. En particulier, ces résultats montrent que les contributions de chaque parent gardent leur intégrité dans la descendance, au lieu de se mélanger comme cela était souvent supposé dans les théories précédentes de l’hérédité. Dans le cas de De Vries, cette redécouverte s’associe à la notion de mutation qu’il introduit en décembre 1901 après avoir observé des variations brusques de certains caractères chez une plante qu’il étudie. Ces mutations sont selon lui à l’origine de la variabilité de l’espèce.
La redécouverte de ces lois en 1900 déclenche une opposition entre les « mendéliens » (parmi lesquels William Bateson et Hugo de Vries) et les biostatisticiens ou biométriciens (parmi lesquels Karl Pearson et Walter Weldon). Ces derniers cherchent, sous l’influence des idées de Francis Galton, à développer une théorie statistique de l’évolution. Ils veulent estimer les taux d’évolution et l’intensité de la sélection naturelle à partir de mesures de différents caractères, réalisées sur des populations animales, sur lesquels selon eux la sélection naturelle agit par des variations infimes. À l’inverse des biométriciens qui construisent leur théorie de la sélection en choisissant de ne pas se préoccuper de la nature de l’hérédité, les mendéliens se concentrent eux sur la théorie de la mutation d’Hugo de Vries et soutiennent que les nouvelles espèces apparaissent par des sauts mutationnels plutôt que par sélection graduelle.
Aucune des deux approches n’était réellement en contradiction avec la théorie de l’évolution de Darwin, mais elles s’intéressaient chacune à deux aspects différents de la théorie darwinienne : les biométriciens était focalisés sur la sélection et les mendéliens sur la modification, ce qui a causé cette controverse entre les deux visions. Le mendélisme était vu comme en désaccord avec la théorie de Darwin, car il était associé par Bateson au saltationnisme, alors que les biométriciens, qui se réclamaient héritiers de Darwin, défendaient une vue gradualiste (Nordmann, 1992).
Les lois de Mendel sont étendues aux espèces animales par Lucien Cuénot en 1902. Les termes de génétique et de gène apparaissent respectivement en 1906 (William Bateson) et 1909 (Wilhelm Johannsen). Le gène, qui remplace le facteur utilisé jusqu’à présent, bien que toujours abstrait, est maintenant une unité de mutation en plus d’être une unité de transmission. À partir de ces nouveaux concepts, ainsi que de ceux de génotype et phénotype introduits peu après, apparaissent deux voies de recherche. D’un côté on cherche à connaître le support matériel de l’hérédité, et de l’autre on s’intéresse au rôle de la mutation dans le mécanisme de sélection proposé par Darwin.
La recherche du support matériel de l’hérédité aboutit dans un premier temps à la théorie chromosomique selon laquelle les chromosomes sont le support des gènes (Walter Sutton, Theodor Boveri, équipe de Thomas H. Morgan), développée à partir de 1902 et largement acceptée par la communauté à partir de 1914. Les notions de gènes indépendants ou liés sont ainsi expliquées, et on met en évidence la recombinaison, via l’observation des crossing-over. Ainsi, le gène devient le support d’un caractère héréditaire qui peut recombiner et muter, et donc être à la base de la descendance avec modification proposée par Darwin. La génétique des populations, discipline qui apparaît à cette époque, a pour but de concilier les concepts de la génétique et de la biologie évolutive, en étudiant la composition génétique de populations et ses changements sous l’action de différents facteurs, dont la sélection. Plus précisément, des modèles mathématiques sont développés pour décrire les variations de fréquences alléliques, afin d’établir des prédictions générales et de les confronter aux données. Contrairement à la sélection artificielle, qui a pu être mise en évidence par la domestication, la sélection naturelle ne peut pas être testée expérimentalement, on ne connait pas précisément son mode de fonctionnement, il faut donc passer par de la modélisation.
Le premier résultat majeur de génétique des populations est proposé indépendamment par le mathématicien anglais Godfrey Hardy et le médecin allemand Wilhelm Weinberg en 1908 : c’est la loi dite de Hardy-Weinberg qui décrit les fréquences alléliques et génotypiques dans une population à l’équilibre. Pour une population de grande taille, dans laquelle les croisements sont aléatoires et les forces évolutives (sélection naturelle, mutation et migration) n’interviennent pas, les proportions génotypiques sont constantes de génération en génération. On peut attribuer une partie du succès de cette loi à sa simplicité mathématique (Hervé Le Guyader rapporte dans son ouvrage que « Hardy, qui fit le calcul sur un coin de table, à la fin d’un repas, ne voyait pas l’intérêt de sa publication »). Cette loi permet de tester si une population donnée est à l’équilibre. Les généticiens des populations vont progressivement complexifier les modèles pour évaluer les forces évolutives qui font qu’une population n’est pas à l’équilibre d’Hardy-Weinberg.
En 1924, John B.S. Haldane introduit la notion de valeur sélective, fitness en anglais, pour étudier les effets de la sélection. Cette valeur comprise entre 0 et 1, qui caractérise chaque génotype, représente la capacité de survie et de reproduction dans un environnement donné. Haldane établit une relation entre l’intensité de la sélection et les changements de fréquences alléliques et détermine ainsi les probabilités pour qu’un allèle se fixe dans une population, c’est à dire que sa fréquence atteigne 1, ou qu’il disparaisse, ou qu’il soit maintenu à un équilibre polymorphe si l’hétérozygote a la plus grande valeur sélective. Enfin, il introduit la notion d’équilibre mutation-sélection pour les allèles délétères : la mutation les fait apparaître et la sélection les élimine. Une synthèse de ses travaux est publiée en 1932 dans le livre The Causes of Evolution.
Ronald A. Fisher développe en parallèle des travaux similaires, portant notamment sur l’évolution de la dominance, la sélection sexuelle et le mimétisme. En 1918, il publie un article sur la corrélation entre individus apparentés, étudiée par des méthodes statistiques basées sur les hypothèses de l’hérédité mendélienne. En 1922, il introduit l’utilisation des méthodes stochastiques en génétique des populations, pour étudier la fluctuation aléatoire des fréquences géniques. Il considérera par la suite que l’effet de la fluctuation aléatoire peut être négligé puisqu’il est très faible pour les populations de grande taille que sont la majorité des espèces. Il introduit également dans son papier de 1922 la notion de superdominance qui aura une grande importance par la suite : si la sélection favorise l’état hétérozygote, les deux allèles sont maintenus dans la population. Fisher a eu une grande influence sur la conception de l’évolution selon laquelle la vitesse et la direction de l’évolution sont quasiment exclusivement déterminées par la sélection naturelle. C’est cette vision qui va être dominante par la suite. Il résume ses travaux en 1930 dans son livre The Genetical Theory of Natural Selection.
Haldane et Fisher étudient des populations de grande taille : ils ne tiennent pas compte de l’échantillonnage aléatoire des individus et des gamètes au moment de la reproduction, leur traitement des changements de fréquences alléliques est déterministe. À l’inverse, Sewall Wright met l’accent sur l’importance de l’échantillonnage aléatoire en définissant la dérive aléatoire, c’est à dire la fluctuation des fréquences alléliques dans une petite population, due à l’échantillonnage aléatoire. Son article Evolution in Mendelian populations paraît en 1931. Haldane, Fisher et Wright sont considérés comme les trois pères de la génétique des populations, dont ils ont quasiment achevé de développer l’essentiel de la théorie mathématique dès le début des années 1930.
Théorie Synthétique de l’Évolution
Les avancées en génétique des populations combinées à la théorie chromosomique de l’hérédité aboutissent à la fin des années 1930 à la Théorie Synthétique de l’Évolution, qui propose une vision unifiée de la génétique, la biologie naturaliste et la paléontologie pour expliquer l’origine des espèces. Elle est principalement due à Theodosius Dobzhansky (Genetics and the Origin of Species publié en 1937), Ernst Mayr (Systematics and the Origin of Species publié en 1942), et Julian Huxley (Evolution, the Modern Synthesis publié en 1942).
Hervé Le Guyader propose un résumé en sept points des idées majeures de cette Théorie Synthétique :
— Théorie chromosomique de l’hérédité : l’hérédité est exclusivement génétique, les caractères hérités des parents interagissent mais ne se mélangent pas. L’hérédité est portée par les gènes, il n’y a pas d’hérédité des caractères acquis.
— La mutation est à l’origine d’une grande variabilité des populations naturelles.
— L’évolution se fait à l’échelle de populations qui peuvent échanger des gènes via la migration, ou spécier dans le cas d’un isolement géographique.
— Les populations évoluent de façon graduelle par modifications de faible amplitude.
— La sélection naturelle est la force évolutive majeure expliquant les changements au sein des populations.
— La majorité des différences observées entre les individus sont des adaptations résultant de la sélection naturelle, positive ou négative.
— Les observations à l’échelle macro-évolutive (c’est à dire à l’échelle des espèces, des phylums, etc.) sont la résultante des processus micro-évolutifs (à l’échelle de quelques générations) qui ont contrôlé l’évolution des populations pendant une grande période de temps.
|
Table des matières
1 Introduction
1.1 Émergence de la théorie neutraliste de l’évolution moléculaire
1.1.1 La théorie de l’évolution au début du XXème siècle
1.1.2 La querelle du polymorphisme
1.2 Théorie neutraliste de l’évolution moléculaire
1.2.1 Hypothèses et paramètres
1.2.2 Outils mathématiques
1.3 Utilisation du modèle neutre en évolution moléculaire
1.3.1 Description de la diversité génétique
1.3.2 Inférences dans le cadre de la théorie neutraliste
1.3.3 Incohérences liées à l’utilisation du modèle neutre
1.4 D’autres modèles de génétique des populations
1.4.1 Processus Naissance-Mort
1.4.2 Coalescences multiples
1.5 Objectifs de la thèse
2 L’impact de la sélection, de la conversion génique et des biais d’échantillonnage sur l’inférence de démographie microbienne
2.1 Résumé de l’article
2.2 Article
2.3 Annexes
3 Exactitude des inférences démographiques basées sur le spectre de fréquence allélique : l’exemple de la population Yoruba
3.1 Résumé de l’article
3.2 Article
3.3 Annexes
3.3.1 Informations supplémentaires de l’article
3.3.2 Analyses complémentaires
4 D’autres modèles pour expliquer la diversité des données : l’exemple des modèles à coalescences multiples
4.0.0 Représentation graphique du spectre de fréquence
4.1 Données
4.1.1 Informations sur les données rassemblées
4.1.2 Spectres de fréquence observés
4.1.3 Virus : spectre de fréquence inadapté
4.2 Les erreurs d’orientation
4.2.1 Allèle ancestral
4.2.2 Effets des erreurs sur le spectre de fréquence
4.2.3 Estimer et corriger les erreurs à partir des données
4.3 Ajuster les données avec des coalescences multiples et de la démographie
4.3.1 Méthodes
4.3.2 Résultats
4.4 Le biais de conversion génique
4.5 Discussion
4.6 Perspectives
5 Conclusion générale