L’Acide Désoxyribonucléique
Dans une cellule eucaryote, le génome d’un individu, soit l’ensemble de ses gènes, est réparti au sein du noyau en molécules compactes d’ADN appelées chromosomes. Un être humain possède 23 paires de chromosomes : 22 paires d’autosomes numérotées de 1 à 22 par taille décroissante et une paire de chromosomes sexuels (XX pour les femmes et XY pour les hommes). Chaque molécule d’ADN est constituée d’une succession de molécules appelées nucléotides. Un nucléotide est formé par l’association d’une base azotée, d’un désoxyribose et d’un groupement phosphate. Il existe quatre nucléotides différents: l’Adénine (A), la Cytosine (C), la Guanine (G) et la Thymine (T).
Durant la seconde moitié du XXème siècle, les nombreuses recherches sur l’ADN vont permettre la découverte de sa structure. La première propriété majeure a été énoncée en 1949 par le chimiste autrichien Erwin Chargaff [1, 2]. Elle stipule que la quantité de A et de C dans n’importe quel segment d’ADN est sensiblement égale à celle de T et de G respectivement, seule la quantité de A et de C (et donc de T et de G) diffère. Ce résultat suggère alors une complémentarité des nucléotides. La seconde propriété, publiée en 1953 par James Watson et Francis Crick [3], établit que l’ADN a une structure hélicoïdale à double brins . Cette structure et la complémentarité des nucléotides assurent une stabilité cruciale à l’ADN permettant une réplication fiable de cette molécule lors de la division cellulaire.
Les deux brins de l’ADN étant complémentaires, il suffit donc de ne connaître qu’un seul de ces deux brins pour disposer de la totalité de l’information génétique. Ainsi, cet acide est représenté par une séquence non aléatoire de nucléotides correspondant à un des deux brins.
L’ADN est le support de l’information génétique
L’ADN contient toutes les informations nécessaires à la formation et à la vie de l’organisme. En effet, selon le dogme central de la biologie moléculaire, certaines portions de l’ADN, les gènes, sont à l’origine de la synthèse des protéines. Les régions codantes des gènes, dites exons, sont transcrites en Acide RiboNucléique messagers (ARNm) qui sont ensuite traduits en protéines . L’ARNm correspond au brin complémentaire de la séquence d’ADN transcrite à l’exception du T qui est remplacé par l’Uracile (U). Lors de la traduction, la succession de codons, triplets de nucléotides de l’ARNm, définit la succession d’acides aminés formant la protéine. En effet, à chaque codon correspond un acide aminé. Cette table de correspondance s’appelle le code génétique.
Jusqu’à présent, environ 25 000 gènes ont été recensés chez l’Homme mais ils ne constituent que 1,5% des 3 milliards de nucléotides formant l’ADN. Les fonctions des longues régions non codantes sont encore peu connues mais il a été établi que ces régions, et notamment les parties proches de gènes, peuvent intervenir dans des mécanismes de régulation de la synthèse des protéines.
L’ADN est aussi le support de l’hérédité
L’ADN joue également un rôle majeur dans l’hérédité. Chaque individu est diploïde, c’est-à dire qu’il possède une paire de chaque chromosome dans le noyau de ses cellules car il a hérité d’un chromosome de son père et d’un chromosome de sa mère. En effet, les cellules permettant la procréation, aussi appelées gamètes, présentes chez le père (spermatozoïde) comme chez la mère (ovule), ne possèdent qu’un seul exemplaire de chaque chromosome. Lors de la fécondation, c’est-à-dire la rencontre entre deux gamètes du sexe opposé, les chromosomes contenus dans chacune de ces deux cellules sont mis en commun et le fœtus possède donc une paire de chaque chromosome dont un est issu du père et l’autre de la mère. Ce mode de fonctionnement permet un brassage génétique puisque quatre combinaisons sont alors possibles .
La recombinaison génétique, aussi appelée « crossing-over », est un phénomène naturel qui se produit lors de la méiose. Au cours de cette division cellulaire à l’origine des gamètes, il se peut qu’au sein d’une paire chromosomique se produise un échange d’un segment d’ADN entre les deux chromosomes homologues .
La probabilité qu’une recombinaison à un endroit particulier d’un chromosome ait lieu est mesurée par le taux de recombinaison et varie en fonction des différentes paires de chromosomes mais aussi selon la position sur le chromosome. En effet, les extrémités des chromosomes ont plus de chance d’être soumises à ce phénomène que la partie centrale du chromosome. De plus, la probabilité qu’une recombinaison intervienne entre deux loci d’un même chromosome augmente avec la distance physique les séparant. Le « crossing-over » permet donc l’apparition d’une nouvelle séquence génétique et contribue largement à la diversité génétique, et donc des caractères, observée chez les individus d’une même espèce. Les séquences d’ADN présentent une diversité, à l’origine de celle des caractères observés, amplifiée par le brassage génétique dû à la reproduction et au phénomène de recombinaison. Les progrès techniques, et notamment le séquençage de l’ADN, ont permis la découverte de nombreux polymorphismes génétiques à l’origine de ces différences.
Les différents polymorphismes génétiques
Un polymorphisme génétique est une différence observée sur le même locus chromosomique chez des individus d’une même espèce. Chacune des versions de ce locus est appelée un allèle. Généralement, les polymorphismes apparaissent dans les cellules germinales en raison notamment d’erreurs dans la réplication de l’ADN et sont donc transmissibles d’une génération à l’autre. Ces modifications peuvent se produire à l’échelle d’un chromosome entier ou d’un nucléotide uniquement. Les différents allèles d’un gène peuvent soit n’avoir aucune conséquence sur la fonction de ce gène, soit en affecter la fonction selon trois modalités : perte de fonction, maintien partiel de la fonction avec interférences ou gain de fonction. Chez les espèces diploïdes, c’est-à-dire possédant des paires de chromosomes, la combinaison des deux allèles observés à un locus particulier est appelée le génotype. Un individu diploïde dont les deux allèles d’un locus sont différents est dit hétérozygote. S’ils sont identiques, l’individu est dit homozygote pour l’allèle observé.
Les polymorphismes chromosomiques
Les polymorphismes chromosomiques sont des variations structurales résultant d’événements de translocation (échange réciproque de segment d’ADN entre des chromosomes non homologues) , d’inversion (renversement bout à bout d’un segment du chromosome), de fusion ou de fission de fragments chromosomiques. Des anomalies dans le nombre de chromosomes peuvent également être observées . Ces variations ne sont pas nécessairement liées à des anomalies phénotypiques.
Les séquences répétées en tandem
Les séquences répétées en tandem sont des répétitions consécutives d’un motif de nucléotides. Le nombre de répétitions peut, tout comme le nombre de nucléotides composant le motif répété, être de tailles variables . Plusieurs types de séquences répétées sont distingués selon ces paramètres. Les microsatellites sont des motifs de 1 à 5 nucléotides, ou paire de bases (bp), répétés de 2 à 50 fois consécutivement. Les mini-satellites sont des motifs plus grands, entre 15 et 100 bp répétés entre 15 et 50 fois. Enfin, les satellites sont constitués de motifs plus grands (α : 171, β : 168, et γ : 220 nucléotides respectivement) répétés un grand nombre de fois. Le nombre de répétitions du motif caractérise l’allèle de ce polymorphisme.
|
Table des matières
Introduction
1 Introduction à la génétique
1.1 L’Acide Désoxyribonucléique
1.1.1 L’ADN est le support de l’information génétique
1.1.2 L’ADN est aussi le support de l’hérédité
1.2 Les différents polymorphismes génétiques
1.2.1 Les polymorphismes chromosomiques
1.2.2 Les séquences répétées en tandem
1.2.3 Les indels
1.2.4 Les Single Nucleotide Polymorphisms
1.2.5 Les Copy Number Variations
2 Notions de génétique des populations
2.1 Modèle de Hardy-Weinberg
2.1.1 Enoncé de l’équilibre d’Hardy-Weinberg
2.1.2 Influence des hypothèses
2.2 Déséquilibre gamétique et déséquilibre de liaison
2.2.1 Définition du déséquilibre gamétique
2.2.2 Evolution temporelle du déséquilibre gamétique
2.2.3 Déséquilibre de liaison
2.2.4 Les différentes mesures du déséquilibre de liaison
2.3 Haplotypes
3 Introduction à la génétique épidémiologique
3.1 Polymorphismes génétiques et pathologies
3.2 Les différents types d’études génétiques et génomiques
3.2.1 Etudes de liaison et études d’association
3.2.2 Etude gène ou SNPs candidats et étude génome entier
3.2.3 Etude longitudinale et étude transversale
4 Outils génomiques et bioinformatiques
4.1 Le génotypage et les puces à ADN
4.2 Bases de données bioinformatiques
4.2.1 dbSNP
4.2.2 Le projet HapMap
4.2.3 Le projet 1000 Genomes
4.3 Reconstruction des haplotypes
4.4 Imputation
5 Recherche d’association dans les études génome-entier
5.1 Contrôle qualité
5.1.1 Génotypage
5.1.2 Cohorte
5.2 Facteurs de confusion
5.3 Mesure statistique de l’association entre le polymorphisme et le phénotype
5.3.1 Tests statistiques d’hypothèses
5.3.2 Correction des tests multiples
5.3.3 Analyse d’un phénotype quantitatif
5.3.4 Analyse d’un phénotype qualitatif
5.3.5 Qualité des résultats
5.4 Analyses complémentaires
5.5 Nouvelles approches d’exploitation des données de GWAS
6 Peau et vieillissement
6.1 La peau, organe essentiel
6.1.1 Epiderme
6.1.2 Derme
6.1.3 Hypoderme
6.2 Vieillissement général
6.2.1 Modifications métaboliques
6.2.2 Vieillissement cellulaire
6.2.3 Perte de fonction moléculaire
6.3 Vieillissement cutané
6.3.1 Caractérisation du vieillissement cutané
6.3.2 Facteurs impactant le vieillissement cutané
6.3.3 Génétique du vieillissement cutané
7 Objectifs de ma thèse
Conclusion