Les protéines PACE
Les protéines PACE (protéines d’archaea conservées chez les eucaryotes) ont été mises en évidence par une approche génomique effectuée par l’équipe de Patrick Forterre, de l’Institut Pasteur à Paris (Matte-Tailliez et al., 2000) (http://www-archbac.u-psud.fr). Ces protéines de fonction biologique inconnue sont particulièrement intéressantes car, d’une part elles sont conservées chez les archaea et les eucaryotes malgré 3 milliards d’années de divergence, et d’autre part, elles n’ont pas d’homologue bactérien. Cette conservation entre les deux règnes archaea et eucaryotes, est souvent retrouvée pour des protéines impliquées dans des processus fondamentaux comme la réplication, la transcription ou la traduction de l’ADN (Olsen and Woese, 1997).
Ces processus fondamentaux chez les archaea ressemblent beaucoup à ceux retrouvés chez les eucaryotes, mais ils en sont une copie simplifiée, pour exemple le complexe RF-C et le protéasome. Le complexe du facteur de réplication RF-C sert à charger l’anneau de processivité PCNA (Proliferating Cell Nuclear Antigen) sur l’ADN. Ceci permet aux ADN polymérases de répliquer l’ADN. Le complexe RF-C est de 5 sous-unités (une grande et 4 petites) arrangées sous forme d’anneau. Chez les eucaryotes les petites sous-unités sont formées par 4 protéines différentes nommées RFC-A à RFC-D (Bowman et al., 2004). Chez les archaea les petites sous-unités sont formées par la même protéine, elles conservent la conformation en anneau comme chez les eucaryotes (Henneke et al., 2002). Un autre exemple connu de cette simplification chez les archaea est celui de la machinerie de dégradation des protéines : le protéasome. Ce complexe est composé de 2 anneaux-α externes et deux anneaux-β internes, chaque anneau étant composé de 7 sous-unités. Chez les eucaryotes, les 7 sous-unités de chaque anneau sont constituées par des protéines différentes soit 14 protéines au total (Coux et al., 1996). Chez les archaea, chaque anneau est constitué de 7 protéines identiques, soit seulement deux protéines différentes répétées chacune 14 fois (Dahlmann et al., 1991).
Ces ressemblances d’organisation, entre les deux règnes, nous laissent supposer que nos résultats structuraux et fonctionnels seront directement applicables aux homologues eucaryotes et plus précisément à l’homme. Nous nous sommes donc intéressés aux protéines d’archaea qui ayant une organisation simplifiée facilite la compréhension du mécanisme. Les résultats pourront par la suite servir à l’étude du mécanisme chez l’homme, facilitant la mise en évidence des différences entre les deux règnes. Sur le plan expérimental, les protéines d’archaea que nous avons étudiées présentent un autre intérêt, elles sont issues de Pyrococcus abyssi un organisme hyperthermophile. Elles sont donc très stables. Ceci facilite les essais de cristallisation car la solution de protéine reste homogène.
L’équipe de Patrick Forterre a identifié à ce jour 36 protéines PACE. Nous nous sommes intéressés à la protéine de Pyrococcus abyssi produit du gène PAB0955, membre de la famille de protéines nommée PACE12.
Le contexte génomique des protéines de la famille PACE12
La protéine PAB0955 possède un contexte génomique très intéressant au sein des archaea, d’où notre intérêt particulier pour cette protéine parmi les PACE. En effet chez les archaea les gènes des protéines PACE12 sont situés à proximité de gènes codant pour des protéines impliquées dans la réplication de l’ADN ou dans la division cellulaire .
La conservation de l’ordre des gènes peut mener à une interaction physique de leur produit. Cette observation décrite par Thomas Dandekar (Dandekar et al., 1998) permet de prédire la fonction, l’interaction avec des partenaires pour le produit de ces gènes.
Puisque l’organisation des gènes est conservée chez les archaea, nous pouvons supposer qu’une interaction physique existe entre ces protéines. D’un côté, la protéine PAB0955 de Pyrococcus abyssi est proche des gènes des protéines MinD (division cellulaire) (Sakai et al., 2001) et de l’autre de GinS 2-3 (Marinsek et al., 2006) et du Mini Chromosome Maintenance MCM (réplication de l’ADN) (Pape et al., 2003). Sur la base de l’hypothèse ci-dessus nous supposons que PAB0955 pourrait être impliquée à l’interface entre la réplication de l’ADN et la division cellulaire.
Les homologues eucaryotes des protéines PACE12
Il existe trois homologues des PACE12 chez les eucaryotes, et aucun homologue dans les 311 génomes bactériens séquencés à ce jour. Les trois homologues humains sont de taille différente : 374 résidus (Q9HCN4), 310 résidus (Q9NUE1) et 284 résidus (Q8NEI2). Parmi ces trois protéines, Q9HCN4 est la seule qui a été étudiée.
En 2000, Masahiko Nitta et ses collaborateurs ont nommé cette protéine Q9HCN4, XAB1, pour XPA binding protein 1. La protéine XAB1 interagit XPA (Xeroderma pigmentosum group A), cette dernière joue un rôle central dans la réparation de l’ADN par excision de nucléotide (NER) (Nitta et al., 2000). Par des expériences de double-hybride, les auteurs ont montré que XAB1 se lie à la partie Nter de XPA, et entraîne la localisation nucléaire de XPA. La protéine XAB1 qui est cytoplasmique (déterminé par immuno-fluoresence), servirait donc de transporteur à XPA. De plus, XAB1 présente une activité spécifique d’hydrolyse du GTP. En 2003, Francesca Lembo et ses collaborateurs ont identifié une protéine interagissant avec MBD2 (mCpG-binding domain 2) qu’ils ont nommée MBDin (MBD interacting protein). Cette protéine s’est révélée être identique à XAB1 (Lembo et al., 2003). C’est également par des techniques de double hybride que cette interaction MBD2 MBDin a été identifiée. MBD2 est une des 5 protéines qui forme le complexe MeCP1 (methyls-CpG-binding proteins) capable de détecter les méthylations sur l’ADN. La protéine MBD2 dans ce complexe est responsable de la répression de la transcription des gènes fortement méthylés. Ces auteurs ont montré que XAB1/MBDin, XPA et MBD2 interagissaient ensemble. Ils proposent donc que ces trois protéines appartiennent à un même complexe, il y aurait donc un lien entre la méthylation des gènes et la réparation NER.
L’identité de séquence varie entre les différents homologues de la famille des protéines PACE12, elle est de 80% entre les génomes de Pyrococcus, de 30% avec les autres archaea et de 20% avec les eucaryotes. Nous avons pu remarquer dans l’alignement de séquence que la conservation était parfaite pour certains motifs . Ces motifs sont au nombre de 5 et sont séquentiellement conservés dans les 66 protéines PACE12 identifiées aujourd’hui. Nous verrons par la suite qu’ils sont importants pour la fonction enzymatique de PAB0955, et qu’ils forment également la signature de cette famille.
De plus, la délétion systématique de chacun des trois gènes codant pour les protéines de la famille PACE12 chez la levure Saccharomyces cerevisiae a été testée. Leur délétion est létale, soulignant l’importance de ces protéines au niveau cellulaire (http://mips.gsf.de/genre/proj/yeast). Chez cette levure, les gènes sont Yjr072c homologue de Q6FNF1, Yor262w homologue de Q6BKW4 et YLR243w homologue de Q6CQA6.
La protéine PAB0955
La protéine PAB0955 contient une séquence reconnue pour fixer les nucléotides triphosphates tel que l’ATP (adénosine tri-phosphate) ou le GTP (guanosine tri phosphate) en Nter. Cette séquence est un motif de Walker de type A GX1X2X3X4GK[T/S], nommée aussi Ploop (phosphate binding loop), qui sert à fixer les groupements phosphates des nucléotides (Walker et al., 1982).
La similitude de séquence (environ 10% d’identité) entre les protéines de la famille PACE12 et les petites protéines G a fait que ces protéines ont été classées dans le COG1100 (Natale et al., 2000). Le COG 1100 (cluster of orthologous groups of proteins) regroupe différentes protéines hydrolysant le GTP (GTPases) dont Sar1, une petite protéine G. L’activité d’hydrolyse spécifique du GTP par PAB0955 a été vérifiée en solution, confirmant sa qualité de GTPase. Afin de mieux situer cette nouvelle GTPase, qui potentiellement peut être une petite protéine G, l’introduction est consacrée aux différentes GTPases dont la structure est connue.
Les GTPases
Les GTPases sont des enzymes capables de fixer et d’hydrolyser le GTP. La plupart des GTPases (exception faite de la tubuline et de son homologue bactérien FtsZ) conservent une organisation tridimensionnelle semblable, avec un cœur formé par un domaine G qui fixe les nucléotides et d’éventuelles insertions greffées sur ce cœur.
Le domaine G, qui caractérise la plupart des GTPases, forme le site de fixation et d’hydrolyse des nucléotides (Paduch et al., 2001). Il s’arrange en repliement de type Rossmann, c’est-àdire avec un feuillet-β entouré d’hélicesα. Ce domaine G est une alternance de brins-β, classiquement au nombre de 6, et d’hélices-! qui sont généralement au nombre de 5. En plus de sa conservation structurale, le domaine G possède également une conservation de séquence pour 5 motifs nommés G1 à G5 qui forment des boucles. Le motif G1 forme la P-loop qui fixe les phosphates du nucléotide, sa séquence est celle d’un motif de Walker de type A, elle est située entre le brin-β1 et l’hélice-α1 c’est-à-dire en Nter du domaine G. Le motif G2 sert à fixer le Mg 2+ nécessaire à l’hydrolyse du GTP et selon la famille de GTPases, c’est un résidu thréonine ou acide aspartique conservé. Le motif G3 fixe le phosphate-γ du GTP et le Mg2+ , sa séquence, DX1X2G, correspond à un motif de Walker de type B (Walker et al., 1982). Ces trois premiers motifs G sont situés du même côté que les groupements phosphates du nucléotide. Alors que les motifs G4 et G5 servent à fixer la base guanine, et donnent la spécificité pour le GTP et le GDP aux protéines qui les portent. Le motif G4 possède une séquence consensus NKXD. Le motif G5 n’est pas présent dans toutes les GTPases, il est plus difficile à repérer en séquence car il peut être formé uniquement d’une alanine, qui est le plus souvent précédé d’une cystéine ou d’une sérine.
|
Table des matières
INTRODUCTION
1. Présentation du projet PAB0955
1.1. Les protéines PACE
1.2. Le contexte génomique des protéines de la famille PACE12
1.3. Les homologues eucaryotes des protéines PACE12
1.4. La protéine PAB0955
2. Les GTPases
3. Une classification des GTPases
3.1. La famille des interrupteurs moléculaires : domaine G avec un feuillet-! mixte
3.1.1. Les petites protéines G
3.1.2. Les facteurs d’élongation et d’initiation (EF-Tu, EF-G, IF)
3.1.3. Les protéines G hétérotrimériques, sous unité alpha
3.1.4. Les GBP (guanlylate-binding protein)
3.1.5. Les Dynamines
3.1.6. Les GTPases non classiques
3.2. La famille des SRP : domaine G avec un feuillet-! parallèle
3.3. La famille des tubulines : sans domaine G
CHAPITRE I BIOCHIMIE ET CRISTALLISATION
I.1. Biochimie de PAB0955
I.1.1. Expression et purification de PAB0955
I.1.2. Degré d’oligomérisation de PAB0955
I.1.3. Activité GTPase de PAB0955
I.1.4. Repliement de PAB0955
I.2. Cristallisation de PAB0955
I.2.1. Principe de la Cristallisation
I.2.1.1. Diagramme de phase
I.2.1.2. Technique de la goutte suspendue
I.2.2. Cristallisation de PAB0955
I.2.2.1. Cristallisation de la protéine Native et Apo
I.2.2.2. Cristallisation de la protéine avec des sels d’atomes lourds
I.2.2.3. Cristallisation de la protéine en complexe avec des nucléotides
CHAPITRE II RESOLUTION DES STRUCTURES
II.1. L’expérience de diffraction
II.1.1. Le phénomène de diffraction
II.1.2. Le traitement des données cristallographiques
II.1.2.1. Indexation des taches de diffraction
II.1.2.2. Intégration des intensités mesurées
II.1.2.3. Mise à l’échelle
II.1.2.4. Quelques facteurs de qualité
II.2. La détermination de la structure de PAB0955
II.2.1. Utilisation du signal de différence isomorphe
II.2.1.1. Enregistrement d’un jeu de données sur un cristal natif
II.2.1.2. Enregistrement d’un jeu de données sur un cristal dérivé
II.2.2. Utilisation du signal anomal
II.2.2.1. Principe du signal anomal
II.2.2.2. Tentative de phasage par la méthode MAD
II.2.2.3. Réussite du phasage par la méthode SIRAS
II.2.3. Construction de la structure de PAB0955
II.2.4. Le remplacement moléculaire
II.3. Les structures de PAB0955
II.3.1. La structure de la protéine sans nucléotide
II.3.1.1. Description de la structure
II.3.1.2. Description de l’interface dimérique
II.3.2. Les structures de PAB0955 avec des nucléotides tri-phosphate
II.3.2.1. PAB0955 co-cristallisée avec du GTP »S
II.3.2.2. PAB0955 co-cristallisée avec du GTP à 18°C
II.3.2.3. PAB0955 co-cristallisée avec du GTP à 4°C
II.3.2.4. PAB0955 co-cristallisée avec du GTP et de l’EDTA
II.3.3. Les structures de PAB0955 avec des nucléotides di-phosphate
II.3.3.1. PAB0955 co-cristallisée avec du GDP
II.3.3.2. PAB0955 co-cristallisée avec du GDP et additifs
CHAPITRE III ANALYSE STRUCTURALE
III.1. Comparaison des structures de PAB0955
III.1.1. Superposition des différentes structures de PAB0955
III.1.1.1. Méthode de superposition
III.1.1.2. Résultat de la superposition
III.1.2. Analyse des changements structuraux
III.1.2.1. Le motif G1 : la P-loop
III.1.2.2. Le motif G3 : 101 DTPGQ105
III.1.2.3. Le motif G5 : 223 SAK225
III.1.2.4. La lysine 40
III.1.2.5. Le motif 65 GPN67
III.1.3. Les différentes conformations de l’insertion I2
III.1.4. La rigidité du site nucléotidique
III.1.4.1. La conformation arquée du GTP »S
III.1.4.2. La position particulière du GTP par rapport au GDP
III.1.5. Le film de l’hydrolyse du GTP
III.2. Recherche d’homologues structuraux et analyse
III.2.1. Recherche d’homologues structuraux par le serveur DALI
III.2.1.1. La déthiobiotine synthétase d’Escherichia coli
III.2.1.2. La SRP de Thermus aquaticus
III.2.1.3. L’arsenite d’Escherichia coli
III.2.1.4. La N10-Formyltetrahydrofolate Synthétase de M. thermoacetica
III.2.1.5. La petite protéine G Ras de l’homme
III.2.1.6. Informations issues de DALI
III.2.2. Recherche d’homologues structuraux dans la PDB
III.2.3. Recherche d’homologue pour l’insertion I2
III.3. Identification d’une nouvelle famille
III.3.1. L’interface dimérique
III.3.2. Conservation des motifs G
III.3.3. Conservation du motif spécifique GPN
CHAPITRE IV LES MUTANTS DE PAB0955
IV.1. Le choix des différents mutants
IV.1.1. La glutamine 105
IV.1.2. La lysine 40
IV.1.3. L’asparagine 67
IV.1.4. L’aspartate 36
IV.2. Le comportement des mutants en solution
IV.2.1. Le mutant Q105A en solution
IV.2.2. Les mutants K40A et K40R en solution
IV.2.3. Les mutants N67A et N67D en solution
IV.2.4. Les mutants D36A et D36N en solution
IV.3. Structure et analyse des mutants
IV.3.1. La cristallisation des mutants
IV.3.2. Enregistrement cristallographique des mutants
IV.3.3. Analyse structurale des mutants
IV.3.3.1. Analyse structurale des mutants D36A et D36N
La structure du mutant D36A avec du GTP
La structure du mutant D36N avec du GTP
La structure du mutant D36A avec du GDP
IV.3.3.2. Analyse structurale des mutants N67A, N67D et K40R
Les structures du mutant N67A avec du GTP et du GDP
La structure du mutant N67D avec du GDP
La structure du mutant K40R avec du GDP
CHAPITRE V RECHERCHE DE PARTENAIRES
CONCLUSION