Du cristal biologique à la structure de la macromolécule : l’intérêt des complexes de lanthanide en biocristallographie
Du cristal à la structure de la macromolécule biologique
La diffraction par un cristal et le problème des phases
L’interaction entre le rayonnement X et la matière est la diffusion élastique par les électrons. Si cette matière est un cristal, de par le motif cristallin, c’est à dire la répétition périodique d’une maille élémentaire dans les trois directions de l’espace, l’onde est diffusée dans des directions spécifiques. On parle alors de diffraction. Les plans d’atomes (ou plans réticulaires) du cristal vont réfléchir les rayons avec formation d’interférences liées à la différence de marche des rayons X diffractés par deux plans voisins. Chaque fois que la différence de marche est égale à un multiple de la longueur d’onde, on observe une interférence constructive, c’est la loi de Bragg :
2dsinθ=n.λ
Avec :
d, distance inter-réticulaire (distance entre deux plans réticulaires)
θ, angle de Bragg (moitié de l’angle entre le faisceau incident et la direction du détecteur)
n, ordre de diffraction
λ, longueur d’onde des rayons X
Chaque rayon X diffracté qui a traversé le plan vertical que constitue le détecteur génère une “tâche de diffraction” ou “réflexion”. L’ensemble des tâches de diffraction provenant des rayons X diffractés ayant traversé le détecteur pendant le même intervalle de temps ∆t est enregistré et constitue le “cliché de diffraction”. Seules sont visibles sur les clichés de diffraction les réflexions résultantes des rayons X ayant interféré de façon constructive. La position de ces réflexions sur les clichés de diffraction forme le réseau réciproque (dans “l’espace réciproque”, abstrait) et correspond à la transformée de Fourier du réseau cristallin (qui, lui, se trouve dans “l’espace réel”). On assigne à chaque réflexion un point particulier du réseau réciproque, à l’aide de trois indices h, k, l, nommés indices de Miller.
La mesure de l’intensité I(hkl) de chacune de ces réflexions permet de déterminer l’amplitude de l’onde diffractée dans la direction correspondante, puisque l’intensité est proportionnelle au carré de l’amplitude. Or, pour calculer la densité électronique à partir de ces mesures, il faut connaître non seulement l’amplitude de l’ensemble des ondes diffractées mais aussi leur déphasage par rapport au rayonnement incident. Cela revient à connaître, pour la réflexion considérée, l’amplitude complexe de chacune des ondes diffractées. Cette amplitude complexe, transformée de Fourier de la densité électronique, est appelée facteur de structure, F(hkl).
Pour les réflexions (hkl) ≡ h, l’intensité I(h) est donc proportionnelle au carré du module de facteur de structure F(h) :
I(h) = F(h) · F(h) = |F(h)|²
Les différentes méthodes de phasage
Parmi les méthodes permettant de calculer ces phases, nous nous intéresserons plus particulièrement aux méthodes de phasage de novo.
Le remplacement moléculaire
Avant d’exposer les méthode de phasage de novo, il convient de présenter la méthode du remplacement moléculaire, méthode la plus couramment utilisée pour la résolution de structures de macromolécules biologiques (Rossmann, 1972; Taylor, 2010). Cette méthode ne fait pas partie des méthodes de phasage de novo car l’information de phase recherchée provient d’un modèle déjà existant et que l’on suppose proche de la structure à déterminer. Le choix du modèle est orienté par le postulat qui stipule que l’homologie de séquences entre deux protéines implique très fréquemment une similarité structurale. Le modèle doit présenter une forte identité de séquences (au moins 30 %) avec celle de la protéine dont la structure est à déterminer. En outre, le modèle choisi peut correspondre à l’ensemble ou à une partie de la structure d’intérêt. Une fois le modèle choisi, il faut alors rechercher la position et l’orientation de ce modèle dans la maille qui conduit au calcul des intensités qui correspondent aux intensités observées, tout en évitant le chevauchement de molécules symétriques. Les phases obtenues pour les modèles, positionnés et orientés, qui donnent les meilleurs accords sont appliquées aux données expérimentales. L’avantage de cette méthode est qu’elle ne nécessite que des données de diffraction d’un cristal natif. De plus, le nombre croissant de structures résolues enrichit le “catalogue” de modèles disponibles. Cependant, cette méthode peut être mise en défaut dans deux occasions. D’un part, si la structure de la protéine à déterminer présente un nouveau repliement et/ou diffère significativement des modèles existants, le recours aux méthodes de phasage expérimental est nécessaire. D’autre part, la solution obtenue peut être biaisée par les informations apportées par le modèle choisi et dans ce cas, l’information introduite peut être difficile à supprimer ou à modifier au cours du processus d’affinement.
Protocole que nous avons utilisé en cas d’échec du phasage de novo
Au cours de ce travail de thèse, comme décrit par la suite, nous nous sommes parfois heurtés à des situations où la contribution anomale des atomes n’a pas toujours permis d’aboutir à la construction d’un modèle suite à un phasage expérimental. De plus, si la synthèse de Fourier anomale (cf. ci-après) présentait toutefois des pics dont la hauteur préfigurait un taux d’occupation suffisant pour modéliser une partie du complexe, nous avons eu alors recours au remplacement moléculaire. En guise de modèle, nous avons toujours choisi une structure de la même protéine déjà résolue par nos soins. Nous avons mis au point un protocole de phasage dont le but est de permettre de s’affranchir au maximum du biais que pourrait introduire le modèle choisi. Voici la description de ce protocole :
1. Construction d’un modèle protéique de départ épuré pour s’affranchir au maximum du biaismodèle :
(a) Si la protéine à étudier est oligomérique, seul un monomère est conservé pour le modèle initial,
(b) tous les atomes ne faisant pas partie de la protéine ainsi que ceux qui constituent toutes les chaines latérales des acides aminés de la protéine sont effacés. Le modèle réside alors en une seule chaine principale poly-alanine.
2. Obtention d’un jeu de phases par remplacement moléculaire à l’aide du modèle décrit en 1) et du programme Phaser de la suite CCP4 :
(a) Les paramètres utilisés ont été : le nombre de molécules présentes dans l’unité asymétrique et la recherche de la solution à la plus haute résolution à partir des amplitudes mesurées, tant dans le groupe d’espace indiqué que dans les groupes d’espace énantiomorphes (si il y en a). En effet, pour des cristaux de groupes d’espace centrosymétriques, la question de la main ne se pose pas : la configuration tridimensionnelle périodique des atomes et son inverse conduit au même profil de diffraction. Mais dans le cas de groupes d’espace non centrosymétriques, cela conduit à une ambiguité de main (Blundell and Johnson, 1976).
3. Calcul d’une carte de densité électronique grâce aux phases alors obtenues et reconstruction d’un modèle :
(a) Amélioration des phases calculées par Phaser à l’aide du programme DM de la suite CCP4 (Cowtan and Main, 1996), en absence de tout modèle. Par modification de densité, le programme DM affine les phases calculés précédemment par le programme Phaser (cf. protocole utilisé pour les expériences SAD et MAD). Lors de cette étape, la “combinaison de phases” a toujours été désactivée afin que le calcul de la carte aplatie s’affranchisse un peu plus du biais qu’a pu introduire le modèle dans le calcul des phases initiales. Dans ce cas, la combinaison de ces phases initiales avec les nouvelles phases améliorées n’est plus utilisée et seules ces dernières sont utilisées.
(b) Construction automatique de modèle par le programme Buccaneer (Cowtan, 2006) à l’aide des amplitudes expérimentales, des phases améliorées et de la séquence primaire de la protéine, sans cycle d’affinement entre les cycles de construction.
A l’issue de ce remplacement moléculaire, trois indicateurs statistiques sont calculés permettant de juger la qualité des solutions proposées : le gain du logarithme de maximum de vraisemblance global (“LLG”) et les “Z-scores” des fonctions de rotation (“RFZ”) et de translation (“TFZ”) du modèle orienté. La valeur du “LLG” indique à quel point les données calculées à partir du modèle orienté sont meilleures que celles qui auraient été prédites à partir d’un modèle atomique aléatoire (autrement dit, qu’un maximum de vraisemblance calculé à partir d’une distribution de Wilson). Si cette valeur est négative, cela signifie que notre modèle orienté est moins bien choisi qu’un modèle atomique aléatoire. Pour la solution choisie, la valeur du LLG doit donc être positive. Aussi permet-elle d’estimer la précision de la solution : plus elle est élevée, plus la solution est correcte. Note : d’après le manuel d’utilisation, une valeur de LLG globale supérieure à 400 caractérise une solution non-équivoque.
|
Table des matières
Introduction générale
Du cristal biologique à la structure de la macromolécule : l’intérêt des complexes de lanthanide en biocristallographie
Du cristal à la structure de la macromolécule biologique
1 La diffraction par un cristal et le problème des phases
2 Les différentes méthodes de phasage
1.2.1 Le remplacement moléculaire
1.2.2 Les méthodes directes (méthodes de phasages ab initio)
1.2.3 Détermination de la sous-structure par les méthodes de Patterson
1.2.3.1 La fonction de Patterson
1.2.3.2 La fonction de Patterson anomale
1.2.3.3 La fonction de Patterson isomorphe
1.2.3.4 Choix du protocole de détermination des positions des diffuseurs anomaux
1.2.3.5 La synthèse de Fourier anomale
1.2.4 Un triste sire en ligne de mire, son seuil franchi, la triste Hélène de Troie devint folle : description des méthodes de phasage de novo
1.2.4.1 Les méthodes de remplacement isomorphe, SIR et MIR
1.2.4.2 Les méthodes exploitant la diffusion anomale, SAD et MAD
1.2.4.3 Les méthodes combinées SIRAS et MIRAS
1.2.4.4 Protocole retenu pour la détermination des phases par les méthodes SAD et MAD
1.2.4.5 Evaluation de la qualité des phases expérimentales dans SHARP
1.2.4.6 Evaluation de la qualité des phases expérimentales améliorées par SOLOMON
3 La diffusion anomale
1.3.1 Présentation du phénomène
1.3.2 Les raies blanches
4 La brisure de la loi de Friedel
5 Evaluation du signal anomal et de la qualité des données de diffraction
1.5.1 L’importance du taux d’occupation du diffuseur anomal choisi
1.5.2 L’importance de la résolution des données
1.5.3 L’importance du rapport signal sur bruit
1.5.4 L’importance de la redondance des données
1.5.5 La complétude
1.5.6 Les facteurs résiduels
1.5.6.1 Le facteur Rmerge
1.5.6.2 Le facteur Rpim
1.5.6.3 Le facteur Rano
1.5.7 Stratégie d’enregistrement des données de diffraction choisie au cours de ces travaux de thèse
1.5.8 Protocole d’intégration des données de diffraction retenu
1.5.8.1 Obtention des intensités
1.5.8.2 Calcul des amplitudes des facteurs de structure à partir des intensités
1.5.8.3 Estimation de la proportion de solvant dans l’unité asymétrique
6 Affinement de la structure et interprétations
1.6.1 Les facteurs résiduels utilisés lors du processus d’affinement
1.6.1.1 Le facteur Rwork
1.6.1.2 Le facteur Rfree
1.6.2 Protocole d’affinement retenu pour nos travaux
1.6.3 Les cartes de densité électronique
1.6.4 Les facteurs de qualité d’affinement de structure
7 Des cristaux dérivés présentant un signal anomal pour un phasage de novo
1.7.1 Utilisation de protéines séléniées
1.7.2 Utilisation de la diffusion anomale des atomes intrinsèques
1.7.3 Utilisation de gaz nobles
1.7.4 Introduction d’atomes lourds par trempage et co-cristallisation
1.7.5 Protocole d’obtention de cristaux dérivés par trempage et par co-cristallisation avec les complexes de lanthanide
8 Utilisation des lanthanides en tant que diffuseurs anomaux
1.8.1 Les lanthanides, des diffuseurs anomaux sous-utilisés lorsqu’il s’agit de la préparation de cristaux dérivés
1.8.2 La luminescence des lanthanides
Conclusion générale