La paléogénétique
Historique
Les premières études de paléogénétique sont apparues dès le milieu des années 80 avec la publication de séquences mitochondriales d’un quagga taxidermisé de 150 ans, espèce éteinte du genre Eqqus (Higuchi et al., 1984), rapidement suivie par la publication de la première séquence humaine provenant d’une momie égyptienne datée du Vème siècle avant J.-C (Pääbo, 1985). Ces résultats amenèrent ainsi la preuve que l’ADN pouvait survivre au sein des organismes, même plusieurs années après leur mort, lançant ainsi la discipline. L’invention quasi simultanément de la PCR (Polymerase Chain Reaction) (Mullis and Faloona, 1987; Saiki et al., 1985) permettant d’amplifier en plusieurs centaines de milliers de copies une séquence d’ADN, se présenta comme un outil de choix et ne pouvait mieux tomber pour les paléogénéticiens. Raisonnables au début, les études ont voulu assez rapidement défier la limite de conservation de l’ADN et se sont dirigées vers des échantillons vieux de plusieurs milliers voire millions d’années, s’intéressant aux spécimens contenus dans l’ambre (Cano et al., 1993; DeSalle et al., 1992) et même aux dinosaures (Woodward et al., 1994). Un grand pas en arrière a été fait quelques années plus tard lorsque de nombreux résultats se sont avérés être des contaminations. La PCR, par sa sensibilité, avait donné accès aux informations du passé mais son plus grand avantage s’avéra aussi être le pire ennemi des études d’ADN ancien : l’amplification d’ADN exogène même présent en très faible quantité ! La remise en questions des résultats publiés a permis de mettre en évidence les difficultés inhérentes aux études d’ADN ancien. La meilleure compréhension des mécanismes de dégradation et de conservation de l’ADN, la mise en place de « bonnes pratiques », et les nombreux progrès méthodologiques réalisés ont finalement permis aux études d’ADN ancien, quelques années plus tard, de tenir leurs promesses.
L’ADN ancien, une molécule fragile
Les processus de dégradations
Dans une cellule vivante, les dommages subis par la molécule d’ADN peuvent être réparés grâce à la machinerie cellulaire qui permet de maintenir l’intégrité du génome. Lors de la mort cellulaire, ces mécanismes de réparation cessent, exposant ainsi le génome à de nombreux facteurs pouvant l’endommager. Post-mortem, l’ADN est donc soumis à toute une diversité de processus de dégradation aboutissant dans la plupart des cas à l’obtention d’un ADN fragmenté, chimiquement modifié et présent en faible quantité (Lindahl, 1993) .
La fragmentation
Plusieurs facteurs sont à l’origine de la fragmentation massive de l’ADN post mortem, aboutissant très rapidement à l’obtention de fragments de petites tailles (100pb) (Sawyer et al., 2012). Tout d’abord, des facteurs enzymatiques. Lors de la mort cellulaire, les nucléases qui étaient séquestrées dans la cellule vont être libérées et avoir accès à l’ADN, pouvant ainsi rompre les liaisons phosphodiesters entre les nucléotides. Lors de la décomposition du corps, l’activité enzymatique provenant des micro-organismes saprophages agira également sur la fragmentation des molécules d’ADN. Ces processus enzymatiques, vont être complétés par des phénomènes chimiques principalement sous la forme de réactions hydrolytiques et oxydatives .
L’hydrolyse va provoquer des ruptures simple-brin en s’attaquant aux liaisons phosphodiesters (entre 2 nucléotides), mais également provoquer la formation de sites abasiques par la rupture des liaisons N-glycosidiques (liaison entre la base azotée et le désoxyribose). Ces sites abasiques vont fragiliser la structure de la molécule d’ADN et favoriser sa fragmentation.
Les réactions oxydatives agiront quant à elles au niveau des liaisons chimiques des résidus ribosiques. Les causes de ces dommages oxydatifs sont entre autres les espèces réactives de l’oxygène et les radicaux libres, tels que le radical hydroxyle, le radical peroxyde et le peroxyde d’hydrogène (Pääbo et al., 2004).
Enfin, d’autres facteurs, tels que les rayonnements ionisants, peuvent fragiliser la molécule par une action directe ou indirecte. En effet, ils peuvent interagir avec des molécules d’eau, provoquant la création de radicaux libres qui peuvent dégrader la molécule d’ADN.
Les modifications de bases
Outre la fragmentation, la molécule d’ADN va subir des dommages provoquant des modifications de la nature chimique des bases (Pääbo, 1989). Parmi les causes de ces lésions, on retrouvera de nouveau les phénomènes d’hydrolyse et d’oxydation .
L’hydrolyse va entraîner une perte de groupement amine au niveau des bases azotées induisant la transformation de cytosine en uracile, et de l’adénine en hypoxanthine, un analogue de la guanine. Cela va provoquer lors de l’amplification par PCR l’incorporation de bases incorrectes sous la forme de substitutions C→ T et A→ G.
Des conditions oxydantes provoqueront quant à elles la formation de 8 hydroxyguanine, qui a la particularité de s’hybrider préférentiellement avec une adénine plutôt qu’avec une cytosine, créant ainsi des transversions C→A (Lamers et al., 2009).
Ces phénomènes sont particulièrement problématiques dans les études d’ADN ancien puisqu’ils ne vont pas forcément entraver la réplication de l’ADN lors de la PCR mais modifier l’information contenue dans la séquence primaire. Ils vont ainsi aboutir à l’incorporation de bases erronées et donc à de possibles erreurs lors de l’analyse et de l’interprétation des résultats (Ho et al., 2007) .
Les lésions bloquantes
La taille des fragments d’ADN amplifiés peut également être limitée par l’apparition de lésions bloquantes, empêchant le passage de la polymérase le long du brin d’ADN et donc son amplification. Plusieurs facteurs peuvent empêcher le passage de la Taq polymérase, que ce soit des modifications de bases telle que la formation d’hydantoïnes (produit d’oxydation des pyrimidines), mais aussi l’apparition de pontages intra-chaîne, inter-chaînes ou entre la molécule d’ADN et une protéine. Ces liaisons peuvent être dues à différents phénomènes tels que l’alkylation ou encore la formation de complexes de Maillard, provoqués par la liaison entre les sucres de la molécule d’ADN et les groupements amines des acides nucléiques ou des protéines. Décrit comme étant l’un des facteurs les plus limitant dans les études d’ADN ancien (Hansen et al., 2006), ces lésions bloquantes n’affecteraient pas plus de 40% des molécules d’ADNa (Heyn et al., 2010). Un traitement au bromure de N phenacylthiazolium (N-PTB), qui cliverait les produits de la réaction de Maillard, a été proposé afin d’augmenter la quantité d’ADN extrait (Poinar et al., 1998).
L’apport des séquenceurs de nouvelles générations à la compréhension des mécanismes de dégradation
Les séquenceurs de nouvelles générations (ou NGS pour Next Generation Sequencing), de par leur principe, c’est-à-dire un séquençage massif en parallèle, ont permis d’apporter de nouveaux éléments quant au profil de dégradation de l’ADN ancien. Aujourd’hui, plusieurs génomes anciens entiers (mitochondriaux et nucléaires) ont été séquencés, générant ainsi une quantité importante de données obtenues à partir de différentes plateformes de séquençage et à partir de prélèvements provenant de différents environnements et périodes. Outre le défi technique et l’apport de connaissances sur le sujet ancien étudié, les résultats obtenus ont permis d’en savoir un peu plus sur les phénomènes de dégradation. Ainsi, ont pu être mesurés directement : les taux de dépurination, de fragmentation et de désamination des cytosines. Au vu des résultats, un profil de dégradation similaire semble se dégager de toutes les études (Figure 3) dont les éléments majeurs sont : (i) les fragments séquencés débutent pour la plupart après une guanine, faisant ainsi de la dépurination (Figure 2) l’une des causes majeures du processus de fragmentation (Briggs et al., 2007). Cela peut s’expliquer par le fait que la guanine présente une structure nécessitant moins d’énergie pour cliver sa liaison Nglycosidique par rapport à l’adénine (Overballe-Petersen et al., 2012) ;(ii) le phénomène de désamination de la cytosine en uracile est augmenté par rapport aux autres substitutions et est majoritairement présent aux extrémités 5’ et 3’ des fragments d’ADN lus, dû à la présence d’extrémités simple-brin (Briggs et al., 2007; Orlando et al., 2011). Ce motif de dégradation peut être ainsi utilisé parmi d’autres critères pour assurer le caractère « ancien » des séquences amplifiées sur ces plateformes.
|
Table des matières
I INTRODUCTION
I.1 Introduction générale
I.2 La paléogénétique
I.2.1 Historique
I.2.2 L’ADN ancien, une molécule fragile
I.2.3 Critères d’authenticité
I.2.4 Champs d’applications des études paléogénétiques
I.2.5 Evolution de la discipline : d’un petit fragment au génome complet
I.3 Contexte général de l’étude
I.3.1 Contexte géographique
I.3.2 Peuplement de la région
I.3.3 Le peuplement actuel
I.4 L’apport des premières études paléogénétiques à la compréhension du peuplement du sud de la Sibérie et de l’Altaï
I.4.1 Les données mitochondriales
I.4.2 Les données du chromosome Y
I.4.3 Les données autosomales
I.5 Problématique et objectifs de l’étude
II MATÉRIEL ET MÉTHODES
II.1 Prélèvements biologiques anciens
II.1.1 Traitement des échantillons
II.1.2 Les analyses génétiques réalisées
II.1.3 Analyses des données génétiques
II.1.4 Précautions prises contre les contaminations
III RÉSULTATS
III.1 Résultats des analyses génétiques
III.1.1 Taux de réussite des différentes analyses génétiques menées
III.1.2 Résultats de l’analyse des STR autosomaux et de la détermination du sexe
III.1.3 Les données mitochondriales
III.1.4 Les données du chromosome Y
III.1.5 Résultats du typage des SNP autosomaux
III.1.6 Synthèse des résultats obtenus pour chaque échantillon
III.1.7 Etude des liens de parentés
III.2 Authenticité des résultats
IV DISCUSSION
IV.1 Apport de ce travail à la compréhension de la dynamique de peuplement du sud de la Sibérie et de l’Altaï à l’âge du Bronze
IV.1.1 Evolution du pool génique
IV.1.2 Dynamique de peuplement de la région, premières hypothèses
IV.2 Discussion sur la stratégie expérimentale employée et perspectives
V CONCLUSION
VI BIBLIOGRAPHIE
VII ANNEXES
VIII PUBLICATIONS