Les facteurs de régulation de la biogénèse des ribosomes
LE RIBOSOME
STRUCTURE DU RIBOSOME
Le ribosome est un complexe ribonucléoprotéique; il est composé au tiers de protéines ribosomiques et au deux tiers d’ARNr. Il est formé de deux sous-unités, soit le 40S et le 60S, le S indiquant leur taux de sédimentation ou Svedberg. La grande sous-unité (le 60S) se compose de trois ARNr : le 28S, le 5.8S et le 5S ainsi que d’environ 49 protéines ribosomiques. La petite sous-unité (le 40S), quant à elle, comporte un ARNr, le 18S, et contient environ 33 protéines ribosomiques (Hernandez-Verdun et Louvert, 2004; Moss et al., 2007). Le taux de sédimentation du ribosome en entier est de 80S.
RIBOSOMOPATHIES
Des mutations dans des gènes responsables de la transcription des gènes de l’ARNr, la maturation des ARNr, le transport et l’assemblage des ribosomes peuvent mener à ce qu’on appelle des ribosomopathies (Hannan et al, 2013). Ces maladies visent plusieurs processus, mais ont en commun certains symptômes tels que des dysfonctionnements immunologiques et hématologiques, un vieillissement accéléré, une déficience de la moelle osseuse ainsi qu’une prédisposition au cancer.
Dans les cas de cancer, la taille du nucléole sert de prédiction concernant le développement futur de l’état d’un patient (Derezini et al., 2000; Sirri et al., 2008). En effet, un nucléole de grande taille est signe d’un mauvais pronostic, car il indique un potentiel marqué de prolifération chez les cellules cancéreuses. La biogénèse des ribosomes est donc une cible de traitement possible contre le cancer puisqu’elle est en lien étroit avec la prolifération et la croissance cellulaire.
LA BIOGÉNÈSE DES RIBOSOMES
LES GÈNES DE L’ARNR
Les 200 copies des gènes de l’ARNr, réparties sur 5 chromosomes, sont organisées en tandem, c’est-à-dire que les unités répétées sont directement adjacentes les unes aux autres. Une unité d’ADNr contient environ 45 kilobases (kb) chez la souris et environ 43 kb chez l’humain. Elle est composée d’abord d’un segment non-transcrit d’environ 30 kb, l’Intergenic Spacer (IGS) qui contient les éléments régulateurs tels que le Spacer promoter (SpPr), l’enhancer repeat, le 47S promoteur ainsi que les terminateurs. Le 47S promoteur se compose de deux parties : l’Upstream Control Element (UCE) et le Core Promoter Element (CPE). Le CPE est la portion minimale requise pour une initiation de la transcription efficace; il est situé au site d’initiation de la transcription (TSS) (Moss et al., 2007). L’UCE, situé à 100 paires de bases (pb) en amont, permet, quant à lui, d’augmenter l’efficacité de la transcription (Learned et al., 1986). Le SpPr est connu pour stimuler la transcription ribosomique par RPI (Moss, 1983; de Winter et Moss, 1986; Caudy et Pikaard, 2002). Par contre, cela nécessite la présence de l’enhancer repeat entre le SpPr et le 47S promoteur (de Winter et Moss, 1987; Paalman et al., 1995). Le SpPr peut aussi servir de plateforme de recrutement pour les molécules de RPI qui sont ensuite livrées au 47S promoteur pour permettre une transcription rapide et efficace (Moss, 1983; Kuhn et Grummt, 1987). Il a été montré que les transcrits provenant de l’IGS sont essentiels à l’établissement et au maintien de la structure hétérochromatinienne d’un sous-ensemble d’ADNr (Mayer et al., 2006). L’unité d’ADNr est composée de plusieurs sites terminateurs : le T0 situé à 170 pb en amont de l’UCE et le T1 à T10 situés en aval de la région codante (Grummt et al., 1986; Henderson et Sollner-Webb 1986).
L’unité d’ADNr contient aussi une région transcrite comprenant le précurseur des ARNr d’environ 14 kb (le 47S), les External Transcribed Spacer (ETS) aux extrémités de la région transcrite et les Internal Transcribed Spacers (ITS) entre le 28S et le 5.8S et entre le 5.8S et le 18S (Figure 1.3).
Figure 1.3 – Représentation non à l’échelle de l’ADNr. L’intergenic spacer (IGS) est en gris et la région transcrite est en jaune. Les promoteurs sont indiqués par SP pour le Spacer promoter et P pour le 47S promoteur. Les terminateurs sont indiqués par T0 et T (T1 à T10). En rouge sont indiqués le Upstream control element (UCE) et le Core promoter element (Core). Les ARNr sont en bleu. Extrait de Russel et Zomerdijk, 2005 et reproduit avec permission.
Les ARNr sont extrêmement conservés entre les espèces. Par contre, l’IGS, les ETS et les ITS ne le sont pas (Moss et al., 2007).
Le séquençage de nouvelle génération du génome n’est pas parvenu à obtenir la séquence complète des ADNr étant donné leur nature répétitive et leur grand nombre. Par contre, une unité complète de l’ADNr a été publiée chez l’humain et la souris (Gonzalez et Sylvester, 1995; Grozdanov et al., 2003). Celles-ci sont disponibles sur GenBank aux numéros d’accession U13369.1 et BK000964.3 respectivement. Cela a été rendu possible grâce à la technologie de séquençage développée par Sanger dans les années 1970 (Sanger et al., 1977).
TRANSCRIPTION DES GÈNES DE L’ARNR
La biogénèse des ribosomes nécessite le fonctionnement de trois machineries transcriptionnelles de la cellule (Figure 1.4). Premièrement, RPI permet la transcription du précurseur des ARNr, le 47S. L’ADNr est l’ADN qui est le plus activement transcrit dans la cellule. En effet, environ 80 % des ARN cellulaires sont d’origine ribosomique (Moss et al., 2007).
snoRNA
Protein
Figure 1.4 – La biogénèse des ribosomes requiert l’apport de trois polymérases. RPI transcrit le précurseur des ARNr, le 47S. RPIII synthétise le dernier ARNr, le 5S. RPII transcrit les ARNm des protéines ribosomiques (RPL = ribosomal protein from the large subunit, RPS = ribosomal protein from the small subunit) ainsi que d’autres protéines non ribosomiques. Adapté de van Riggelen et al., 2010 et reproduit avec permission.
Le processus de transcription peut même être observé au microscope électronique par la technique de Miller Chromatin Spreading (Miller Spread) (Raska, 2003). La structure résultante, rappelant un arbre de Noël, a l’ADNr et les ARN polymérase I en guise de tronc et les transcrits d’ARNr en guise de branches (Figure 1.5).
Deuxièmement, l’ARN polymérase III (RPIII) est en charge de la transcription du dernier ARNr, soit le 5S, ainsi que des small nucleolar RNA (snoRNAs). Ces derniers permettent les modifications nucléosidiques nécessaires aux étapes de clivage du précurseur de l’ARNr (Bachellerie et al., 2002). Troisièmement, l’ARN polymérase II effectue la transcription des ARN messagers (ARNm) des protéines ribosomiques, mais aussi des protéines non ribosomiques impliquées dans la biogénèse des ribosomes (Figure 1.4) (Chédin et al., 2007).
Figure 1.5 – Transcription ribosomique. Structure en arbre de Noël (Christmas Trees) obtenus par la technique de Miller Spread dans des cellules de souris Ltk- en culture. Extrait de Moss et al., 2007 et reproduit avec permission.
MATURATION DES ARNR ET ASSEMBLAGE DU RIBOSOME
La biogénèse des ribosomes est un processus complexe; elle comprend plusieurs étapes et fait intervenir de nombreuses protéines. Celles-ci sont, entre autres, des ATP/GTPases, des hélicases, des chaperonnes, des ribonucléases, des méthyltransférases, des endonucléases, des exonucléases et des Small nucleolar ribonucleoprotein (SnoRNP) comprenant des SnoRNA.
Les snoRNA permettent le clivage du précurseur de l’ARNr, et ce, même avant la fin de sa transcription, c’est-à-dire de manière co-transcriptionnelle (Granneman et Baserga, 2005). Les snoRNP permettent de guider les enzymes jusqu’aux sites de modifications.
Plus de 200 nucléotides de l’ARNr sont modifiés soit par pseudouridination ou par méthylation (Nazar, 2004). L’ARNr subit, d’autre part, plusieurs clivages successifs effectués par des exo et des endonucléases (Mullineux et Lafontaine, 2012).
Les transcrits pré-ribosomiques sont modifiés et clivés dans le DFC. Ils sont ensuite transportés au GC où ils subissent la maturation finale et sont assemblés aux protéines ribosomiques. Les deux sous-unités du ribosome, soit le 40S et le 60S, sont alors exportés au cytoplasme pour accomplir leur fonction (Figure 1.6).
Figure 1.6 – Assemblage du ribosome. Les transcrits pré-ribosomiques sont traités par les snoRNP au sein du DFC. Dans le GC, le 5.8S et le 28S forment le 60S avec le 5S et des ribonucléoprotéines, les protéines ribosomiques. Le 18S quant à lui s’assemble avec d’autres ribonucléoprotéines pour former le 40S. Ce dernier ainsi que le 60S sont exportés au cytoplasme et se lient à l’ARNm pour former le ribosome fonctionnel. Extrait de Boisvert et al., 2007 et reproduit avec permission.
LA MÉTHYLATION AUX PROMOTEURS DES GÈNES DE L’ARNR
La méthylation de l’ADN, c’est-à-dire la méthylation d’une cytosine en 5-méthylcytosine (m5C), est une modification épigénétique considérée comme étant caractéristique de la répression de la transcription des gènes (Bernstein et al., 2007). Chez les vertébrés, cette marque survient principalement sur des séquences C-G connues sous le nom de CpG. Chez les plantes, la méthylation de l’ADN existe dans les contextes CHG et CHH où H est égal à A, C ou T. Chez les bactéries et les eucaryotes unicellulaires, des méthylations peuvent aussi survenir sur les adénines en N6-méthyladénine (m6A) (O’Brown et Greer, 2016).
Environ 1 % des base totales sont méthylées, cela représente donc de 70 à 80 % de tous les CpG du génome (Bird, 2002). Il existe, par contre, des régions riches en CpG non méthylées aux promoteurs des gènes que l’on nomme des îlots CpG (CpG islands). On estime qu’il y a environ 30 000 îlots CpG dans le génome haploïde humain (Bird et al., 1987).
La méthylation des gènes est effectuée par trois DNA methyltransferases (DNMT) DNMT1, 3a et 3b. Il existe aussi DNMT2 dont le rôle n’est pas encore bien caractérisé et DNMT3l qui est inactif enzymatiquement parlant. DNMT3a et 3b sont responsables des méthylations aux sites CpG n’étant pas méthylés (méthylations de novo) tandis que DNMT1 est responsable de la maintenance, lors de la réplication, du patron de méthylation présent sur l’ADN (Klose et Bird, 2006).
La méthylation de l’ADN par DNMT3a et 3b intervient dans plusieurs fonctions biologiques telles que l’empreinte parentale (imprinting), l’inactivation du chromosome X, l’extinction des transposons, le vieillissement ainsi que le cancer (Law et Jacobsen, 2010; Galamb et al., 2016). De plus, le profil épigénétique est hérité durant la division cellulaire grâce à DMNT1 (Meehan et Stancheva, 2001). La méthylation de l’ADN est un processus réversible (Zhang et al., 2017).
Le promoteur des gènes de l’ARNr de l’humain comprend 26 sites de méthylation potentiels (Pietrzak et al., 2016). Il a été montré par des études in vitro chez la souris que la méthylation d’un seul CpG, à la position -133 par rapport au site d’initiation de la transcription de l’ADNr, inhibe la transcription (Santoro et Grummt, 2001). Il a été suggéré que cela est dû au fait qu’UBF est incapable de se lier au promoteur. Il n’y a donc pas de recrutement de Selectivity Factor 1 (SL1) pour former le complexe de préinitiation ni d’initiation de la transcription. On estime qu’environ 50 % des gènes de l’ARNr sont méthylés, et donc éteints (silenced) dans les cellules différenciées (Santoro et Grummt, 2001).
LES FACTEURS DE RÉGULATION DE LA BIOGÉNÈSE DES RIBOSOMES
INTRODUCTION DES DIFFÉRENTS FACTEURS DE RÉGULATION
Les facteurs de régulation de la biogénèse des ribosomes sont nombreux. Premièrement, il y a UBF qui agit à titre de facteur architectural et qui permet la formation d’un complexe de préinitiation stable. Deuxièmement, on retrouve SL1 qui permet l’activation de la transcription en recrutant Transcription Initiation Factor IA (Rrn3). Troisièmement, RPI a pour rôle la transcription de l’ADNr à proprement parler. Quatrièmement, Rrn3 fait le lien entre SL1 et RPI. Finalement, Transcription Termination Factor I (TTF1) est responsable de la terminaison de la transcription ribosomique. La figure suivante représente les différents facteurs de régulation de la biogénèse des ribosomes (Figure 1.7).
Figure 1.7 – Modèle du complexe de préinitiation au promoteur des gènes de l’ARNr. SL1 est composé de TBP et au moins 3 TAFs. UBF est lié sur l’ADN sous forme de dimères. Deux dimères d’UBF sont représentés en bleu sur cette figure. TTF1, en brun, se lie sur l’ADN à la hauteur du T0. L’UCE et le CPE sont représentés en orange. Rrn3 et RPI sont en bleu.
UBF
UBF est une protéine de 97 kilo Dalton (kDa) composée de 764 acides aminés qui fait partie de la famille des protéines High Mobility Group box (HMG-box) (Bell et al., 1988; Jantzen et al., 1990). Les HMG-box sont composées de 3 hélices alpha. UBF comprend 6 de ces HMG-box permettant de lier l’ADNr sous forme de dimère (Figure 1.8) (Bachvarov et Moss, 1991; Bazett-Jones et al., 1994; Stefanovsky et al., 2001-1). Les HMG-box sont connues pour lier l’ADN de façon non spécifique. Elles permettent d’ailleurs de moduler la structure de la chromatine en y effectuant une courbure. Pour cette raison, UBF est considéré comme étant un facteur architectural (Stefanovsky et Moss, 2008). UBF comprend un domaine de dimérisation en N-terminal et une queue acidique en C-terminal (Figure 1.8). Son domaine de dimérisation, tel que son nom l’indique, permet la dimérisation de la protéine (O’Mahony et al., 1992; Stefanovsky et al., 2001-1). Sa queue acidique, quant à elle, permet, lorsque phosphorylée, des interactions protéines-protéines avec certains complexes tels que le facteur SL1 (Tuan 1999).
|
Table des matières
1 – Introduction
1.1 – Le nucléole
1.1.1 – Structure du nucléole
1.1.2 – NORs
1.1.3 – Fonctions du nucléole
1.2 – Le ribosome
1.2.1 – Structure du ribosome
1.2.2 – Ribosomopathies
1.3 – La biogénèse des ribosomes
1.3.1 – Les gènes de l’ARNr
1.3.2 – Transcription des gènes de l’ARNr
1.3.3 – Maturation des ARNr et assemblage du ribosome
1.3.4 – La méthylation aux promoteurs des gènes de l’ARNr
1.4 – Les facteurs de régulation de la biogénèse des ribosomes
1.4.1 – Introduction des différents facteurs de régulation
1.4.1 – UBF
1.4.2 – SL1
1.4.3 – RPI
1.4.4 – Rrn3
1.4.5 – TTF1
1.5 – La formation du complexe de préinitiation
1.5.1 – Mécanisme
1.5.2 – Initiation
1.5.3 – Élongation
1.5.4 – Terminaison
1.5.5 – Réinitiation
1.6 – La bio-informatique
1.6.1 – Historique de la bio-informatique
1.7 – Techniques de séquençage haut-débit
1.7.1 – Historique du séquençage
1.7.2 – Illumina HiSeq 2000
1.7.3 – ChIP-seq
1.7.4 – DNase-seq
1.8 – Hypothèses et objectifs
1.8.1 – Hypothèses du mémoire
1.8.2 – Objectifs du mémoire
2 – A deconvolution protocol for ChIP-seq reveals analogous enhancer structures on the mouse and human ribosomal RNA genes
2.1 – Avant-propos
2.2 – Résumé
2.3 – Abstract
2.4 – Introduction
2.5 – Materiels and Methods
2.5.1 – Chromatin immunoprecipitation (ChIP)
2.5.2 – Analysis of ChIP sample by massively parallel sequencing
2.5.3 – ChIP-Seq data alignment
2.5.4 – Deconvolution protocol
2.5.5 – Alignment of ChIP-nexus data
2.5.6 – Data availability
2.6 – Results
2.6.1 – ChIP-Seq profiles result from a convolution of the protein crosslinking and sequencing coverage profiles
2.6.2 – Deconvolution of ChIP-Seq data provides greatly improved resolution in protein-DNA interaction maps
2.6.3 – Reproducibility of deconvolution factor-binding profiles
2.6.4 – UBF positionning over the 47S transcribed region is not random
2.6.5 – Applying deconvolution ChIP-Seq to map the mouse rDNA Spacer Promoter
2.6.6 – Deconvolution ChIP-Seq also identifies a Spacer Promoter within the Human rDNA
2.6.7 – The chromatin contexts of the human and mouse Spacer Promoters are closely similar
2.6.8 – A common mode of TBP-complex binding at the human Spacer and 47S Promoters
2.6.9 – Identification of potential Enhancer Repeat in the human rDNA
2.7 – Discussion
2.8 – Acknowledgments
2.9 – Conflict of interest
2.10 – References
3 – Étude du rôle du facteur architectural UBF : une étude à la grandeur du génome
3.1 – Avant-propos
3.2 – Résumé
3.3 – Abstract
3.4 – Introduction
3.5 – Matériels et méthodes
3.5.1 – Description et utilisation de Bowtie2
3.5.2 – Description et utilisation de MACS2
3.5.3 – Description et utilisation de BEDOPS
3.5.4 – Description et utilisation de GREAT
3.5.5 – Description et utilisation de R
3.5.6 – Description et utilisation de HOMER
3.6 – Résultats
3.6.1 – Distance des pics d’UBF par rapport aux sites d’initiation de la transcription
3.6.2 – Chevauchement avec les marques d’histones actives et répressives
3.6.3 – Chevauchement avec les régions sensibles à la DNase I
3.6.4 – Perte d’accessibilité à la DNase I lors du KO d’UBF
3.6.5 – Colocalisation des gènes dérégulés dans les expériences de microarray avec les pics d’UBF plus enrichis avant le KO d’UBF
3.7 – Discussion
3.7.1 – UBF se retrouve près des sites d’initiation de la transcription
3.7.2 – UBF colocalise avec les marques d’histones actives
3.7.3 – UBF se retrouve aux endroits accessibles à la DNase I
3.7.4 – Il y a peu de perte d’accessibilité à la DNase I après le KO d’UBF
3.7.5 – La perte d’accessibilité à la DNase I après le KO d’UBF n’est pas en lien avec la dérégulation des gènes
4 – Discussion et Conclusion
4.1 – La procédure de déconvolution
4.2 – Utilisation de la déconvolution dans le but de cartographier le spacer promoter
4.3 – Utilisation de la déconvolution dans le but de cartographier les différents facteurs de transcription
4.4 – Rôle d’UBF à l’échelle du génome
4.5 – Conclusion
Bibliographie
Annexe I – Script DeconvoNorm
Annexe II – Article publié 4e auteur
Annexe II – Résumé
Télécharger le rapport complet