Caractéristiques générales des facteurs de transcription à domaine HLH
Les protéines à motif hélice-boucle-hélice, ou HLH pour « helix-loop-helix », forment une superfamille de régulateurs transcriptionnels très représentés dans l’ensemble du taxon eucaryote. Un nombre important d’études menées chez la drosophile, le xénope, les mammifères a largement démontré le rôle crucial des HLH dans la régulation de nombreux processus développementaux aussi variés que la myogenèse, la lymphopoïèse et la neurogenèse (Lee, 1997; Arnold et Win ter, 1998; Guillemot, 2000; Bertrand et al. , 2002; Brand-Saberi, 2005; Kageyama et al., 2005; MUITe, 2005). Ces protéines interviennent aussi dans des pathologies humaines impliquant des dérégulations de la prolifération et de la différenciation cellulaires (Norton, 2000; Hasskarl et Munger, 2002).
Les motifs conservés
Le motif commun à toutes les protéines de la superfamille Hélice-Boucle-Hélice (HLH) comporte 40 à 50 acides aminés et se compose de deux hélices a amphipathiques très conservées, désignées 1 et II, séparées par une boucle flexible non conservée et de taille variable (Ferre-D’Am are et al., 1993; Ellenberger et al. , 1994; Garvie et Wolberger, 2001). Les hélices 1 et II sont composées de 12 à 15 acides aminés chacune et portent des résidus hydrophobes orientés le long de l’axe de l’hélice nécessaires à la fonction de dimérisation inter-HLH.
La fixation à l’ADN de ces facteurs de transcription est assurée directement par une région basique fortement conservée, directement adjacente au coté N-terminal du domaine HLH et stabilisée par la formation de dimères au niveau du domaine HLH. L’hélice II participe aussi directement à la reconnaissance spécifique du motif d’ADN cible, puisque sa substitution par un autre motif hélice II abolit la capacité de reconnaissance de la protéine MYOD pour son site de prédilection (Voronova et Baltimore, 1990).
Le rôle de chacun de ces domaines dans la dimérisation et/ou la fixation à l’ADN a été évalué par mutagenèse (délétions, substitutions de domaines ou d’acides aminés) ce qui a permis de mettre en évidence la relation entre ces domaines protéiques et leur importance fonctionnelle (Voronova et Baltimore, 1990; Davis et Halazonetis, 1993; Kophengnavong et al. , 2000).
La structure tridimensionnelle du motif basique HLH (bHLH) a été déterminée. Les polypeptides bHLH correspondant aux deux protéines MAX et E47 ont été cristallisés en présence d’un fragment d’ADN contenant la séquence hexa-nucléotidique cible pour la liaison de ces protéines. La structure de ces protéines liées à leur motif cible a été déterminée avec une résolution de 3,3 Aet 2,8 A, respectivement (Ellenberger et al. , 1994; FeITe-D’Amare et al. , 1994). Les structures tridimensionnelles du complexe dimère Max/ADN à l’état libre ou activé sont représentées sur les planches A et C de la Figure 1 (Ferre-D’Amare et al. , 1993; Ellenberger et al. , 1994; Ferre-D’Amare et al., 1994; Garvie et Wolberger, 2001 ; Marmorstein et Fitzgerald, 2003; Sauve et al., 2004).
Classification phylogénétique des protéines HLH
Il n’existe pas de critères absolus capables d’établir si deux gènes sont des orthologues. Lors de la construction d’arbres phylogénétiques (le plus souvent à l’aide d’algorithmes d’ analyse du plus proche voisin: « neighbor-joining »), chaque branche de l’ arbre est soumise a un calcul statistique itératif (1000 fois). On appelle valeur de « bootstrap » le nombre de fois qu’ une position identique d’une branche a été retrouvée sur 1000 itérations. Cette valeur permet d’ évaluer la robustesse d’une prédiction avant de définir les groupes monophylétiques (Ledent et Vervoort, 2001 ; Ledent et al. , 2002). Ce type d’analyse sur de grands échantillons (plus de 350 alignements) a permis de définir 44 groupes d’orthologues, dont 36 sont exclusifs des métazoaires et deux sont communs aux levures et aux eucaryotes supérieurs.
En tenne d’évolution moléculaire, la fonction des HLH chez les eucaryotes unicellulaires, tels que la levure S. Cerevisiae, est restreinte principalement aux voies métaboliques vitales, comme par exemple l’adsorption de phosphate et la biosynthèse des phospholipides (Robinson et Lopes, 2000). Il semble évident que les fonctions des HLH entre organismes uni et pluri cellulaires ont largement divergé. Dans les organismes multicellulaires, les facteurs de HLH sont engagés dans une multitude de processus développementaux importants et variés, incluant la neurogenèse, la myogenèse, l’hématopoïèse, pour ne citer que ces quelques fonctions abondamment illustrées dans la littérature. L’absence de protéines HLH de classe V (Id) chez la levure et le nématode (Ruvkun et Hobert, 1998) pourrait suggérer une évolution tardive de la fonction d’inhibition de l’activité HLH par la formation d’un complexe interdisant la liaison à l’ADN.
RELAX : un nouveau bHLH, une nouvelle famille
Un peu d’histoire: le clonage de Relax
Au laboratoire, le gène Relax a été isolé par « RT-PCR dégénérée » à partir d’ARNm extraits de ganglion cervical supérieur de rat nouveaux nés (Ravassard et al., 1997a). L’alignement multiple (Figure 4) de différents domaines bHLH neuronaux disponibles à l’ époque (AS-C : transcrit T3 (lethal ofscute), T4 (scute), T5 (achaete), T8 (asense) ; MASHI et 2 et M-twist) a permis de choisir et de synthétiser des oligonucléotides dégénérés (représentés par les flèches rouge et bleue) afin d’amplifier par PCR les séquences comprises entre les régions basiques et l ‘hélice II.
Dans le cas particulier du clonage de Relax, 40% des clones isolés après « RT-PCR dégénérée » possédaient une séquence homologue à l’hélice Ides bHLH, et seul un clone correspondait à un nouveau bHLH. L’obtention des régions en 3′ et 5′ du produit de PCR initialement isolé a été réalisée par la technique de PCR ancrée mise au point dans le laboratoire (Ravassard et al. , 1997a; Ravassard et al. , 2003). L’utilisation de la PCR ancrée est une alternative au criblage d’une banque d’ADNc. Cette méthode a permis d’isoler un ADNc de 1491pb contenant une phase ouverte de lecture codant une protéine bHLH de 214 acides aminés. L’expression de ce nouveau facteur bHLH dans la moelle épinière d’embryon de rat est organisée en bandes longitudinales. Cette caractéristique a conduit à nommer cet ADNc Relax, pour Rat Embryonic Longitudinal AXis (Ravassard et al. , 1997a) (GenBank Y10619). En parallèle du clonage de Relax, les équipes de François Guillemot (IGBMC Strasbourg) et de David 1. Anderson (California Institute of Technology-Pasadena) ont identifié chez la souris de nouveaux gènes bHLH : les neurogénines 1 à 3 (Ngn1, 2 et 3), initialement appelés Math4C, A et B (Gradwohl et al., 1996; Sommer et al., 1996a; Cau et al., 1997). Les premières comparaisons avec Relax ont révélé qu’il s’agit de gènes homologues constituant une nouvelle famille de gènes bHLH .
La structure génomique de RelaxlNgn3
Le transcrit Relax
Au vu des orientations de mon projet de thèse, la distribution spatio-temporelle des ARNm Relax fera l’objet d’un intérêt particulier et donc d’un paragraphe indépendant (§2.4). L’ADNe Relax isolé à l’origine chez le rat comprend 1491pb et contient une phase ouverte de lecture de 645pb. L’environnement nucléotidique du premier ATG de la séquence codante correspond à la séquence consensus de type Kozak (A/GNNATGA/G) importante pour le démarrage de la traduction. Aucun site de polyadénylation n’a été identifié dans cet d’ADNc. L’analyse par tlNorthern blotti de l’ARNm de Relax a révélé un transcrit unique de 3,lkb dans la moelle épinière d’embryons E12,5 de rat (Ravassard et al. , 1997a) L’homologue humain de Relax, NEUROG3, a été isolé par RT-PCR à partir d’ARNm de moelle épinière d’ embryon humain âgé de sept semaines (Ravassard, données personnelles enregistrées sur la GenBank AJ133776). Cet ADNc contient une phase ouverte de lecture de 645pb identique à 81 % à la séquence Relax. Il code une protéine NEUROG3 de 214 acides aminés, qui possède un taux de conservation de 78% avec son homologue RELAX. Par soucis de clarté et bien que la nomenclature de ce gène soit maintenant homogène (neurog3), nous maintiendrons l’utilisation de la terminologie Relax pour la séquence du gène de rat, de Ngn3 pour la souris et NEUROG3 pour la séquence humaine. De plus les homologues des autres espèces présentés dans le paragraphe §2.4 seront annotés de la façon suivante: à savoir la première lettre indiquant l’espèce suivie du symbol du gène Ngn3 .
|
Table des matières
INTRODUCTION
1 Caractéristiques générales des facteurs de transcription à domaine HLH
1.1 Les motifs conservés
1.2 Classification des protéines HLH
1.3 Diversité des protéines HLH
1.4 Orthologues et organisation phylogénétique
1.4.1 Orthologues ou paralogues ? Tous homologues!
1.4.2 Classification phylogénétique des protéines HLH
2 RELAX: un nouveau bHLH, une nouvelle famille
2.1 Un peu d’histoire: le clonage de Relax
2.2 La structure génomique de Relax/Ngn3
2.2.1 Le transcrit Relax
2.2.2 Isolement du gène Relax
2.2.3 Région promotrice et identification du site d’initiation de la transcription
2.2.4 Localisation chromosomique
2.3 Les propriétés de RELAX
2.3.1 Le domaine basique de RELAX! liaison à une boîte E
2.3.2 Modulation de l’activité transcriptionnelle par RELAX
2.3.3 Localisation nucléaire
2.3.4 Existe-t-il d’autres domaines protéiques d’intérêts?
2.4 Patron d’expression de Relax/Ngn3
2.4.1 Système Nerveux Central
2.4.2 Epithéliums pancréatique et digestif
2.4.3 Epithélium séminifère
2.4.4 Distribution protéique de neurogénine 3
2.5 Appartenance à une famille de protéines: les neurogénines
2.5.1 RELAX, neurogénines & co.
2.5.2 Neurogénines, ARP oufamille indépendante
2.5.3 Un motif spécifique, une signature discriminante des neurogénines
3 bHLH et neurogenèse
3.1 Spécification et détermination neurale chez D. melanogaster
3.1.1 Singularité du développement du tissu neural chez la drosophile
3.1.2 Définition des gènes proneuraux
3.1.3 Définition des gènes neurogéniques
3.1.4 Inhibition latérale
3.1.5 Bilan
3.2 Neurogenèse chez les Vertébrés
3.2.1 bHLH de vertébrés et fonction proneurale
3.2.2 Voie de signalisation Notch
3.2.3 Activité proneurale et Cycle cellulaire
3.2.4 Gènes proneuraux et spécification de sous types neuronaux chez les vertébrés.
3.2.5 Gènes proneuraux et spécification gliale chez les vertébrés
3.2.6 Conservation de la/onction proneurale entre la drosophile et les vertébrés: conclusion
4 Développement du système digestif
4.1 Organisation du tube digestif primitif
4.1 .1 Organogenèse de l’épithélium pancréatique
4.1.2 Organogenèse intestinale
4.2 Cascade moléculaire et lignage cellulaire endocrine, rôle central de NGN3
CONCLUSION
Télécharger le rapport complet