Etude des polymorphismes altérant la régulation de l’expression des gènes chez le bovin

La transcription : de l’ADN à l’ARN

La transcription est la synthèse de l’ARN à partir d’une séquence d’ADN présent dans un gène. Chez les eucaryotes, la transcription se déroule dans le noyau en 3 étapes : l’initiation, l’élongation et la terminaison.

L’initiation

L’initiation est la phase de fixation de l’ARN polymérase à l’ADN. Il existe 5 polymérases différentes et c’est l’ARN polymérase II qui est impliquée pour la synthèse des précurseurs d’ARNm. Dans le cas de l’ARN polymérase II (ARN pol II) pour la synthèse de l’ARNm, cette fixation s’effectue au niveau du promoteur par le biais de nombreux cofacteurs protéiques qui forment le complexe d’initiation. Ce complexe est formé de la TBP (TATA box-Binding Protein) qui reconnaît la boîte TATA du promoteur du gène (Geiger et al., 1996) et de facteurs de transcription de l’ARN polymérase II (les TFII – Orphanides et al., 1996). Ces facteurs de transcription vont permettre l’initiation de la transcription, notamment en permettant l’ouverture de la double hélice (TFIIH – Drapkin et al., 1994) et permettre la reconnaissance précise du site d’initiation (TFIIB – Pinto et al., 1992). Ce complexe d’initiation est suffisant pour déclencher une activité transcriptionnelle mais elle est faible (Weil et al., 1979). D’autres facteurs spécifiques vont agir sur le complexe d’initiation pour influencer cette activité basale en l’amplifiant ou en l’inhibant. Ces protéines activatrices ou inhibitrices vont se fixer à des promoteurs distaux spécifiques (séquences cis-régulatrices) de l’ADN. Ces promoteurs sont appelés silenceurs (silencers) quand ils recrutent des cofacteurs inhibiteurs et amplificateurs (enhancers) quand ils recrutent des cofacteurs activateurs. Ces promoteurs distaux peuvent se situer à des milliers de nucléotides du promoteur proximal et ils vont pouvoir agir grâce à la courbure de l’ADN (Roberts et al., 1993). Dans le cas des enhancers, une fois liées les protéines activatrices peuvent réguler la synthèse de l’ARNm : soit en induisant un changement de conformation du complexe d’initiation par le biais d’un médiateur, soit en éliminant les répresseurs du promoteur, soit en facilitant le recrutement des éléments du complexe d’initiation (facteurs généraux et l’ARN pol II) sur le promoteur, soit en favorisant l’échappée de l’ARN pol II permettant le démarrage de la phase d’élongation (Roberts et al., 1993).

L’élongation

L’élongation est la phase de lecture de l’ADN par l’ARN polymérase II produisant au fur et à mesure l’ARN précurseur. La phosphorylation du domaine CTD (Carboxy Terminal Domain – un domaine spécifique d’une sous-unité de l’ARN polymérase II) va déplacer l’ARN polymérase jusqu’au lieu d’origine de la transcription et démarrer l’élongation (Spencer et Groudine, 1990). Un ARN précurseur complémentaire du brin matrice de l’ADN (brin antisens) commence à être synthétisé selon la direction 5’-3’ au rythme d’environ 25 nucléotides par seconde (Wickiser et al., 2005). Les facteurs protéiques d’élongation de l’ARN pol II (TFIIF et TFIIS principalement) vont relâcher la structure des chromatines permettant ainsi la progression le long de l’ADN et l’écartement progressif de ses deux brins.

La terminaison

La terminaison : durant cette phase l’ARN polymérase II va être stoppée pour libérer l’ARN précurseur. Chez les eucaryotes, cette terminaison se déroule en parallèle de la polyadénylation en 3’ de l’ARNm au niveau du signal de polyadénylation (séquence AAUAAA sur l’ARN synthétisé – Teixeira et al., 2004).
Il existe deux modèles pour expliquer le processus de terminaison de l’ARN pol II : le modèle allostérique/anti-terminateur  et le modèle Torpedo . Dans le modèle allostérique (ou anti-terminateur), la terminaison est causée par la déstabilisation et/ou par les changements de conformation du complexe d’élongation de l’ARN pol II après la transcription du signal de polyadénylation. La dissociation du complexe de transcription est enclenchée soit par la libération de facteur d’anti-terminaison  soit par le recrutement d’un facteur de terminaison. Dans le modèle Torpedo (Tollervey, 2004), le clivage au site de polyadénylation crée un site d’entrée pour une 5’ -> 3’ exonucléase (Xrn2 chez l’homme, West et al., 2004) : le site CoTC (CoTranscriptional Cleavage). Xrn2 va ensuite dégrader l’ARN en aval du site de clivage. On obtient un ARNm précurseur qui va alors subir des étapes de maturation.

Les modifications post-transcriptionnelles : variations et stabilisation de l’ARN

L’ARN précurseur va être maturé en ARN messager avant d’être exporté hors du noyau. Cette phase de maturation de l’ARN se déroule en 3 étapes : l’addition de la coiffe, l’excision-épissage et l’ajout de la queue poly-A. En plus de cette maturation, l’ARN va aussi être adapté en fonction des besoins de l’organisme, soit de manière permanente avec l’épissage alternatif ou l’édition de l’ARN, soit de manière réversible avec la modification épigénétique de l’ARN (épitranscriptomique).

L’addition de la coiffe

Elle a lieu au début de la transcription alors que l’ARN précurseur ne compte pas plus de 30 nucléotides. Elle consiste en l’ajout d’une coiffe protectrice à l’extrémité 5’ de l’ARNm afin de limiter la réactivité de cette extrémité (jonction non voulue par exemple) et sa reconnaissance par les exonucléases (protection contre la dégradation). Cette coiffe est formée par l’ajout d’une GMP (Guanosine Monophosphate) avec une méthylation sur l’azote 7 de la base (7-méthylguanosine ou m7G) et par la méthylation en 2’ du ribose du premier nucléotide et parfois du deuxième. Cette coiffe joue aussi un rôle dans l’exportation de l’ARNm vers le cytoplasme et lors de l’étape de l’initiation de la traduction (Bird et al., 2016).

L’excision-épissage

Chez les eucaryotes, les gènes sont constitués d’exons (parties codantes du gènes) séparés par des introns qui sont intégralement recopiés dans l’ARN précurseur. Cet ARN va subir une phase d’excision des introns suivie d’une phase d’épissage (ligature bout à bout des exons) afin de former l’ARNm. Ces phénomènes se déroulent au cours de la transcription. Les introns sont bornés par un site donneur à l’extrémité 5’ (séquence consensus 5’-GU) et un site accepteur à l’extrémité 3’ (séquence consensus 3’-AG). Dans la majorité des cas, les introns vont être épissés par le splicéosome mais certains vont s’auto-épissés.
Pour le premier cas, l’excision des introns est effectuée par une formation « en lasso » provoquée par le splicéosome composé de snRNP combinés à d’autres protéines (Jurica et Moore, 2003). L’épissage est réalisé par réaction d’un nucléotide à adénine situé dans la boîte de branchement (une séquence interne de l’intron situé à une quarantaine de bases du site receveur) avec un nucléotide à guanine situé dans le site donneur. En découle un clivage entre l’intron et l’exon situé en amont et la formation d’une boucle d’ARN de la forme d’un lasso. Ensuite, le site accepteur en 3’ est reconnu par deux snRNP du splicéosome et une liaison est créée avec l’extrémité 3’ de l’exon en amont. L’épissage des deux exons libère l’intron excisé dont la structure sera ensuite ouverte pour être dégradé par des ribonucléases. Le splicéosome est ensuite décroché par la translocation en 3’ vers 5’ de la protéine PRP22 (McManus et Graveley, 2008). Dans le cas des introns auto-épissables, il s’agît d’introns particuliers fortement structurés capables de s’épisser de manière autonome, c’est-à-dire sans l’aide du splicéosome ou d’autres complexes en trans. Ils sont regroupés en deux classes principales : les introns de groupe I (Vicens et al., 2008) et les introns de groupe II (Pyle, 2016). Les introns de groupe II sont excisés sous forme de lasso comme lors de l’action du splicéosome alors que les introns de groupe I sont dégradés par l’intervention d’un cofacteur nucléotidique externe (GMP, GDP ou GTP).

Les microARN : leurs rôles dans l’expression des gènes

Les microARN (ou miARN) sont de petits ARN d’environ 22 nucléotides (en général de 21 à 24 nucléotides) présents uniquement chez les eucaryotes. Les microARN jouent un rôle déterminant dans la régulation en s’appariant à des séquences complémentaires des ARNm entraînant la dégradation de cet ARNm ou inhibant sa traduction. Ils sont très abondants et ciblent environ 60% des gènes (Friedman et al., 2009).

Biogénèse des microARN : la voie canonique

Les gènes microARN ne sont pas directement transcrits en microARN. Comme les ARNm, ils doivent subir des modifications post-transcriptionnelles. De plus, les transcrits non codants des gènes de miARN sont souvent « polycistroniques », c’est-à-dire que plusieurs miARN différents sont générés à partir d’un seul transcrit général. On estime chez l’homme qu’environ 40% de miARN sont ainsi organisés en clusters (Altuvia et al., 2005).
Les étapes de la voie classique de la biosynthèse des miARN chez les métazoaires sont présentées (Wahid et al., 2010). Tout d’abord, le gène du microARN est transcrit par l’ARN polymérase II en un ARN primaire : pri-miARN (primary miARN). Ce pri-miARN est replié sur lui-même formant une tige-boucle imparfaite (une partie de la tige n’est pas 100% complémentaire). Les deux extrémités en dehors de la structure tige-boucle sont alors clivées par un complexe appelé « microprocesseur » pour former le miARN précurseur (pré-miARN). Ce complexe est composé de la protéine Drosha et d’une protéine de liaison aux ARN double-brin : DGCR-8 (DiGeorge syndrome Critical region Gene-8) chez les mammifères. Le pré-miARN d’une taille d’environ 65 nucléotides possède une souche excédentaire en 3’ de 2-3 nucléotides qui est reconnu par l’exportine 5 (EXP5). L’EXP5 va alors guider le pré-miARN jusqu’au cytoplasme en permettant sa sortie via les pores nucléaires. Dans le cytoplasme, la ribonucléase III Dicer va interagir avec une protéine possédant un domaine de fixation des ARN double brin : la TRBP (TAR RNA-binding Protein). Cette interaction va permettre à Dicer de reconnaître le pré-miARN pour hydrolyser la boucle du pré-miARN générant ainsi le duplex miARN/miARN. Le duplex va alors être fixé à une protéine de la famille des Argonautes (Ago1-4) et une hélicase. Un des deux miARN de cette structure double-brin va alors être sélectionné, généralement le brin avec l’extrémité 5’ la moins stable au niveau de l’appariement (Krol et al., 2010). L’hélicase va alors séparer les deux brins créant ainsi le complexe RISC (RNA-induced silencing complex) composé d’AGO1-4 et du miARN mature d’une taille d’environ 21 nucléotides. Le complexe RISC va alors pouvoir jouer un rôle dans la régulation.

Mode d’action des microARN dans la régulation

Les cibles des miARN se situent dans la région 3’UTR (Untranslated Transcribed Region) des gènes chez les animaux, la complémentarité cible-miARN est presque toujours partielle (dans le cas d’une complémentarité totale, l’ARNm sera coupé par Ago2). Les ARNm contiennent souvent plusieurs cibles pour le même miARN ou pour différents miARN (Pillai et al., 2007). De plus, l’efficacité inhibitrice du miARN est corrélée avec le nombre de cibles présentes dans la région 3’UTR de l’ARNm (Broderick et al., 2011).
Les microRNAs inhibent l’expression des gènes ciblés soit en encourageant la dégradation des ARNm ciblés soit en réprimant la traduction de ces ARNm. Lorsque l’appariement est parfait et que la protéine Ago2 est dans le complexe RISC, cette dernière va lyser l’ARNm entraînant sa dégradation (Meister et al., 2004). Une déadénylation des ARNm ciblés par des miARN peut aussi entraîner à la dégradation de l’ARNm. Les ARNm déadénylés sont ensuite décoiffés et dégradés (Behm-Ansmant et al., 2006).
Ils existent un grand nombre de mécanismes pouvant induire l’inhibition de la traduction par des microARN (Pillai et al., 2007; Gu et Kay, 2010). La traduction peut être inhibée au niveau de l’initiation soit par compétition avec le facteur d’initiation eIF4G, soit en empêchant la jonction du ribosome 60S avec le complexe d’initiation 48S. D’autres voies impliquent un ralentissement des ribosomes, diminuant l’efficacité de la phase d’élongation de la protéine. La traduction peut aussi être inhibée avec une terminaison prémature de la traduction entraînant une dégradation de la protéine. Les microARN vont ainsi ralentir et retarder la traduction en agissant sur ces trois phases, cela pourrait permettre une régulation plus précise en comparaison à la dégradation de l’ARNm (Gu et Kay, 2010).

Les longs ARN non codants : des ARN très polyvalents

Comme on l’a constaté dans les chapitres précédents, tous les ARN ne sont pas codants (ARNt, ARNr, miARN notamment) mais ils jouent principalement un rôle dans la traduction ou l’inactivation/dégradation de l’ARNm. Le rôle des ARN ne codant pas pour des protéines a tendance à être sous-estimé (Amaral et al., 2008) alors qu’une étude récente a montré que 20% des gènes annotés comme codants chez l’homme seraient en réalité non codants (Abascal et al., 2018). En plus, des ARN non codants, il existe les long ARN non codants (ou lncRNA : long non coding RNA). Les lncRNA sont définis arbitrairement comme étant des ARN non codants d’une taille supérieure à 200 nucléotides. Ils peuvent être retrouvés au sein des gènes soit dans les introns, soit antisens, soit chevauchant les exons ou alors être situés entre des gènes. Dans ce cas-là on parle de lincRNA (long intergenic non coding RNA) (Ma et al., 2013).
Les lncRNA sont généralement faiblement exprimés (Derrien et al., 2012; Cabili et al., 2011) mais malgré cela ils jouent un rôle significatif dans de nombreux processus (Ponting et al., 2009) : notamment l’épissage et la transcription (Geisler et Coller, 2013), la traduction (Carrieri et al., 2012), l’empreinte (Brockdorff et al., 1991; Gupta et al., 2010), la pluripotence des cellules souches (Yu et al., 2018), le cycle cellulaire (Yang et al., 2012) et l’apoptose (Han et al., 2014). Ils sont aussi impliqués dans le développement de cancers (Bhan et al., 2017).
Un des lncRNA le plus connu est codé par le gène Xist (X inhibitory specific transcript) et il est impliqué dans l’inactivation du X chez les femelles mammifères. L’inactivation du X est un processus entraînant l’inactivation d’un des chromosomes X au hasard (ou le chromosome X paternel dans le cas des marsupiaux – Cooper et al., 1971) durant les premières étapes du développement embryonnaire.
Le lncRNA Xist est transcrit en grande quantité et va se fixer sur le chromosome X dont il est issu pour l’inactiver (Brockdorff et al., 1991). La transcription de Xist par un des deux chromosomes X étant inactivée par la méthylation de son promoteur (Carrel et Willard, 2005). Cette inactivation de Xist est ensuite stabilisée de manière plus pérenne par des modifications épigénétiques.

Rôle de l’épigénétique dans l’expression des gènes

L’épigénétique désigne les mécanismes modifiant l’expression des gènes sans altérer leur séquence d’ADN ; ces modifications sont transmissibles (lors des divisions cellulaires et donc potentiellement transmises à la descendance) et réversibles (Dupont et al., 2009). Les modifications épigénétiques sont induites par l’environnement de la cellule et permettent d’expliquer la différenciation cellulaire.
En effet, presque toutes nos cellules contiennent la même séquence d’ADN et c’est lors de la morphogénèse (développement de l’œuf fécondé en embryon) que les cellules souches totipotentes vont se spécialiser en des lignées cellulaires pluripotentes pour ensuite acquérir un type cellulaire définitif (neurone, cellule musculaire, etc.). Cette différenciation se traduit par une différence d’expression des gènes certains étant activés et d’autres inhibés et elle est conservée grâce à des mécanismes épigénétiques (Reik, 2007).
Les modifications épigénétiques sont principalement des marques biochimiques (méthylation, acétylation, etc.) ajoutées par des enzymes spécifiques soit directement sur l’ADN, soit sur les histones.

La structure de la chromatine et état des histones

Pour comprendre l’intérêt des histones, il est important de souligner que les 46 chromosomes d’une cellule humaine représentent 2 mètres d’ADN et qu’ils doivent être contenus dans la cellule qui mesure entre 10 et 100 µm de diamètre. Les histones jouent alors un rôle important dans la condensation de l’ADN.Le nucléosome se compose de deux histones de chaque classe (H2A, H2B, H3 et H4) associé en un octamère. L’ADN double brin s’enroule d’abord autour de ces nucléosomes sur environ 150 paires de bases puis une histone de classe H1 stabilise le nucléosome en liant les deux brins d’ADN sortant du cœur du nucléosome. Les nucléosomes s’enroulent ensuite sur eux-mêmes formant ainsi des fibres de chromatine qui vont s’enrouler de plus en plus jusqu’à former la chromatide. Les chromosomes sont composés de deux chromatides complètement identiques reliées par le centromère. Les fibres de chromatine peuvent être plus ou moins denses. Quand elles sont très denses, il s’agit d’une hétérochromatine : l’ADN est tellement condensé que les ARN polymérases ne peuvent pas accéder aux gènes et ces derniers ne sont donc pas exprimés. A l’inverse, quand elles sont moins condensées (euchromatine), les gènes peuvent êtres exprimés. Le passage d’une densité à l’autre est contrôlé par les modifications épigénétiques des histones. Il existe toutefois des hétérochromatines constitutives (Hsu et Arrighi, 1971), c’est-à-dire qu’elles sont constamment condensées, les principales sont les centromères et les télomères (régions très répétitives présentes aux extrémités d’un chromosome).

La méthylation de l’ADN

Il existe un autre phénomène fréquent d’épigénétique : la méthylation de l’ADN. Elle consiste en l’ajout d’un groupement méthyle sur une cytosine formant une 5-méthylcytosine. Chez les mammifères, la méthylation se fait principalement au sein des îlots CpG (Cytosine-phosphate Guanine) des régions de l’ADN riches en Guanine et Cytosine (Bird, 1986). Cette réaction est catalysée par des ADN méthyl-transférases (DNMT). La DNMT1 maintient les méthylations présentes lors de chaque division cellulaire en parallèle de la réplication de l’ADN (Bestor, 2000; Robert et al., 2003). La DNMT2 plus courte se fixe à l’ADN et joue un rôle dans la conservation de la structure et de la fonction des centromères (Dong et al., 2001). La DNMT2 joue aussi un rôle dans la méthylation de l’ARN vu précédemment. DNMT3a et DNMT3b sont impliquées dans les mutations de novo (Okano et al., 1999).
Les DNMTs régulent aussi l’expression des gènes en agissant directement ou indirectement sur la transcription. Lorsque la région promotrice d’un gène est méthylée, les facteurs de transcription ne peuvent plus s’y fixer ce qui réprime l’expression de ce gène (Comb et Goodman, 1990; Bell et Felsenfeld, 2000). La méthylation de l’ADN peut aussi favoriser l’action des HDAC permettant la condensation des chromatines (El-Osta et Wolffe, 2001; Irvine et al., 2002).
La méthylation de l’ADN peut aussi jouer un rôle positif sur la transcription en augmentant son activité. Alors que les méthylations du promoteur bloquent l’initiation, celles présentes au sein des gènes peuvent stimuler la phase d’élongation (Jones, 2012). Les méthylations de l’ADN intragénique peuvent aussi moduler l’épissage alternatif (Maunakea et al., 2013) et peuvent être modulées durant la différenciation cellulaire et les cancers (Kulis et al., 2013).

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

Introduction 
A Expression des gènes : les différentes étapes de la régulation 
A.1 La transcription : de l’ADN à l’ARN
A.2 Les modifications post-transcriptionnelles : variations et stabilisation de l’ARN
A.3 Le transport de l’ARNm : du noyau au cytoplasme
A.4 La traduction : la synthèse de la protéine
A.5 Dégradation de l’ARNm
A.6 Modification post-traductionnelle : activation de la protéine
A.7 Les microARN : leurs rôles dans l’expression des gènes
A.8 Les longs ARN non codants : des ARN très polyvalents
A.9 Rôle de l’épigénétique dans l’expression des gènes
B Étudier les mécanismes de régulation de l’expression des gènes 
B.1 Séquençages des génomes et des transcriptomes
B.2 Importance des polymorphismes : détection des variants
B.3 Etude bio-informatique de la régulation de l’expression des gènes
B.4 Validation expérimentales de la régulation de l’expression des gènes
Stratégies de la thèse 
Article 1 : Etude de l’expression allèle-spécifique dans le muscle bovin
Article 2 : Etude de l’expression allèle-spécifique intra individu et inter tissu chez la vache holstein
A Introduction 
B Matériels et méthodes 
B.1 Animaux et échantillonnage
B.2 Séquençage génome entier (WGS) et alignement de séquence
B.3 RNA-Seq et alignement de séquence
B.4 Identification et annotation des SNPs
B.5 Détection des ASE-SNPs
B.6 Analyse de l’expression tissu-spécifique
C Résultats et discussions
C.1 Statistiques sur les données de séquençage ARN et ADN
C.2 Détection des variants
C.3 Comparaison des SNPs
C.4 Identification des ASE-SNPs
C.5 Expression tissu-spécifique
Discussion générale
A Apports des résultats
B Retour sur les approches employées
B.1 Validation à approfondir
B.2 Approche ASE
B.3 Tests et améliorations
Bibliographie 
Annexe A : Rapport scientifique de la mission de 3 mois au Roslin Institute

Rapport PFE, mémoire et thèse PDFTélécharger le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *