Les différentes théories du repliement
Les fondements du repliement protéique découlent d’une expérience faite par Anfinsen (1973). Dans cette expérience il a observé la dénaturation de la structure d’une protéine sous l’effet de solvants dénaturants. Ceci a permis de confirmer que les protéines se replient d’elles mêmes dans la bonne conformation puisqu’après dialyse des agents dénaturants la protéine retrouve sa fonction, donc sa structure. Ceci a écarté les premières théories qui stipulaient que les protéines adoptaient leur conformation finale grâce à une matrice. On peut imaginer qu’une protéine explore tous les possibles de son espace conformationnel. C’est sans compter sur la démonstration de Levinthal (Levinthal, 1968; Rooman et al., 2002; Zwanzig et al., 1992). Il a calculé le nombre total de conformations possibles que peut adopter une petite protéine de cent acides aminés. Il ne faudrait pas moins de 10^27 années pour explorer toutes ces conformations. Or on sait qu’une protéine se replie en quelques secondes au plus dans la plupart des cas. C’est donc que le repliement d’une chaîne protéique fait intervenir des mécanismes séquentiels au cours desquels l’évolution vers l’état natif s’accompagne d’une augmentation de la stabilité conformationnelle.
Le modèle hiérarchique
Certaines hypothèses tendent à démontrer que le processus du repliement est hiérarchique. C’est-à-dire que les structures secondaires se forment en premier et s’assemblent ensuite pour donner naissance à la structure tertiaire. Elles mêmes définissent des domaines qui s’associent à leur tour pour former la protéine dans sa conformation native. Une expérience de stopped flow (Jennings & Wright, 1993) a démontré que l’apparition des premières structures secondaires se fait dans la milliseconde ou moins après le début du repliement. Le début du repliement étant contrôlé par le passage de la chaîne peptidique des conditions dénaturantes à renaturantes. La formation des structures secondaires est étudiée par l’analyse du dichroïsme circulaire de la solution. Les structures secondaires ne sont pas nécessairement formées dans l’ordre qu’elles occupent dans la chaîne protéique. Ce modèle a été proposé par Karplus au début des années 70 sous l’appellation de diffusion-collision (Karplus & Weaver, 1996) : les structures secondaires sont formées avant la structure tertiaire.
Vision modulaire des protéines : TEF, foldons et building blocks
Beaucoup de protéines sont à l’évidence composées d’une concaténation de plusieurs domaines, qui peuvent se replier indépendamment dans leur conformation native. Des unités plus petites que le domaine ont été envisagées. Le fait que différentes parties de la protéine se replient indépendamment entraîne que des interactions guidant la protéine vers sa structure native sont contenues dans des parties discrètes et contiguës de la séquence (Kippen et al., 1994). De plus un argument entropique et évolutionniste vient démontrer la cohérence de la construction modulaire des protéines. Selon le facteur entropique, les parties de séquences correspondant à des structures repliées (donc ordonnées) auraient tendance au cours de l’évolution à se raréfier en parallèle de l’augmentation en taille des séquences. Panchenko et al. ont une vision modulaire des protéines qui les ont mené à réfléchir sur les unités structurales fondamentales constituant les protéines (Panchenko et al., 1996). Il est vrai que les structures des grandes protéines montrent plusieurs domaines, chacun comparable en taille aux plus petites protéines correctement repliées, donc d’une taille moyenne d’environ 150 acides aminés. Dans de nombreux cas, des domaines ayant des fonctions physiologiques bien différentes ont été mélangés ou dupliqués au cours de l’évolution. Si des modules protéiques peuvent se replier indépendamment, le temps de repliement de grandes molécules devrait être comparable aux plus petites, plutôt que d’être fortement proportionnel à la longueur de la chaîne (ce que l’on ne constate pas expérimentalement). Des modules isolés ont été observés (Wetlaufer, 1981 ; Ikura et al., 1993) et montrent que certains modules de protéines peuvent se replier en structures natives. De plus les expérimentations sur les intermédiaires du repliement indiquent que des unités structurales bien définies de la protéine native peuvent être présentes dans les intermédiaires pas complètement repliés (Kippen et al., 1994 ; Jennings & Wright, 1993). Ceci suggère que des parties distinctes d’une protéine peuvent se replier quasiindépendamment à des temps différents. Beaucoup d’équipes de chercheurs aiment voir les domaines comme un assemblage de structures élémentaires. La plupart des structures natives peuvent être reproduites en assemblant un nombre restreint de motifs simples composés de quelques structures secondaires en interaction. Ces motifs simples, qui pourraient être des super structures secondaires, peuvent être vus comme les briques élémentaires qui participeront à la construction de l’édifice. Ces briques élémentaires ont été appelées Foldons ou Building Blocks selon les équipes. Cette approche repose sur l’hypothèse d’une modularité des protéines. En effet, la recherche de la plus petite unité structurale d’une protéine se révèle intéressante afin de faciliter la compréhension de la complexité de la séquence et de la structure des protéines (Panchenko et al., 1996). L’approche fondée sur les fragments a été initiée par Lesk et Rose (Lesk et Rose, 1981 ) et a été suivie par bon nombre de chercheurs. Par exemple, le groupe de Nussinov a proposé une dissection hiérarchique des domaines grâce à un algorithme fondé sur trois paramètres : la compacité, le degrè d’isolation et l’hydrophobie des fragments (Kifer et al., 2008; Tsai et al., 2000; Tsai et Nussinov, 2001). Le niveau le plus bas dans la décomposition des structures des chaînes est celui des Building Blocks, dont la longueur moyenne est de 29 acides aminés (Haspel et al., 2003a; Haspel et al., 2003b).
Les réseaux cubiques
Plusieurs méthodes sont employées pour représenter les acides aminés de la chaîne peptidique afin de simuler le processus du repliement. Cela va du modèle gros grains où l’acide aminé entier est modélisé par une boule dure, jusqu’aux modèles tout atome. D’autres perspectives parallèles à cet axe des dimensions décrites, sont de modéliser l’acide aminé entier par un point à un nœud d’un réseau. Le réseau choisi est celui développé par Skolnick et Kolinski (Skolnick & Kolinski, 1991) et il correspond à un déplacement de type (2, 1, 0) par rapport à un réseau cubique sous jacent. Ce réseau montre une certaine flexibilité et les structures secondaires peuvent être représentées avec un RMSD de 0,7 Angstrom pour les motifs hélicaux et 0,6 Angstrom pour les brins bêta car il autorise une gamme d’angles entre carbones alpha successifs allant de 64° à 143°. D’autres types de réseau ont été testés, tel le réseau en « diamant ». Cependant ces réseaux ne se sont pas montrés cohérents avec les conformations observées au sein des protéines. Ils montrent de grandes déficiences quant à l’entassement d’hélices alpha et de brins bêta dans une orientation parallèle, quant au pré-requis de 3,6 résidus par tour dans les hélices et l’inaptitude des feuillets bêta à adopter un vrillage (Skolnick & Kolinski, 1991). Le groupe de Shakhnovich (Abkevich et al., 1994) a été parmi les premiers à étudier le mécanisme du repliement sur un réseau cubique. Les résultats montrent selon eux une croissance par nucléation, c’est-à-dire la formation d’un noyau essentiellement hydrophobe avec un patron spécifique de contacts. La recherche de ce noyau est le facteur limitant du repliement et correspond au passage de la barrière énergétique la plus importante. « Le noyau est une structure spatialement localisée d’une sous structure de la protéine native ». L’environnement, le comportement d’un état natif de la chaîne protéique et sa dynamique peuvent être étudiés par des modèles avec une représentation tout atome de la protéine. Cependant l’investigation de l’espace conformationnel par de tels modèles implique des temps de calculs prodigieusement longs. Il est donc nécessaire de simplifier les modèles utilisés pour étudier le repliement protéique. De tels modèles perdent en détails, mais l’un des termes du paradoxe de Levinthal est conservé : en effet sur un réseau cubique la chaîne protéique modélisée par un chapelet de perles conserve un éventail de conformations initiales possibles. Shakhnovich et al soulèvent néanmoins une condition pour l’utilisation de ces modèles. En effet, un pré-requis est que la simulation doit aboutir au même résultat quelle que soit la conformation initiale de la chaîne, comme le font les protéines dans la nature. Un autre critère nécessaire au modèle est que des interactions entre paires de chaînes latérales doivent être indépendantes de la conformation du squelette protéique. Ce critère doit être respecté afin d’éliminer la construction d’un motif particulier. En d’autre termes, la structure native ne peut pas être spécifiée par un potentiel cible de l’algorithme (Skolnick & Kolinski, 1991). La représentation la plus employée sur de tels réseaux consiste en une permutation cyclique de vecteurs de type (±2, ±1, 0) joignant les carbones alphas contigus en séquence. Ces vecteurs correspondent sur le réseau à un « pas de cavalier » dans un jeu d’échecs, mais ici dans les trois dimensions. Ce type de réseau sera nommé par la suite réseau (2,1,0) pour plus de simplicité.
MATRAS
Matras est un serveur web comparant les structures tridimensionnelles des protéines (Kawabata, 2003). Un avantage de MATRAS est son score de similitude de structures, qui est défini comme les log-odds des probabilités évolutives, c’est-à-dire la probabilité qu’une structure change en une autre (Kawabata, 2003). Les log-odds sont des mesures d’effets de taille décrivant l’association ou l’indépendance entre deux groupes de données binaires. Ce score est dédié à la reconnaissance de la similitude structurale de deux protéines reliées en termes d’évolution (homologues). Le serveur propose des superpositions par paires, des superpositions d’une chaîne sur elle-même pour la recherche de domaines dupliqués, mais aussi des alignements multiples jusqu’à 10 structures. Le programme emploie un algorithme d’alignement progressif par lequel les alignements par paires sont assemblés dans le bon ordre. Le dernier service du serveur est de comparer une structure à un grand nombre de structures de la PDB (Berman et al., 2000). MATRAS est disponible à l’adresse suivante : http://biunit.aist-nara.ac.jp/matras/
|
Table des matières
0. Introduction
0.1. Qu’est‐ce qu’une protéine ?
0.2. Les acides aminés
0.3. Objectifs de la thèse
1. Première Partie : Prédiction du noyau du repliement
1.1. Le repliement protéique
1.1.1. Les différentes théories du repliement
1.1.2. Le modèle hiérarchique
1.1.3. Le modèle de nucléation condensation
1.1.4. Le modèle de l’entonnoir
1.1.5. Lien entre états intermédiaires et noyau du repliement
1.2. Concept de TEF
1.2.1 Vision modulaire des protéines : TEF, foldons et building blocks
1.2.2. Description du concept
1.3. Concept de MIR
1.3.1. Les réseaux cubiques
1.3.2. Description du modèle utilisé
1.3.3. Monte‐Carlo
1.3.4. Champ de force
1.3.5. Description de la méthode
1.4. Conservatism of conservatism
1.5. Alignements structuraux
1.5.1. Généralités sur les alignements
1.5.2. Alignement structural par paire
1.5.2.1. MAMMOTH
1.5.2.2. RAPIDO
1.5.2.4. MATRAS
1.5.2.5. MUSTANG
1.6. Concept HTOO
1.7. Concept des valeurs de Phi
1.8. Prédiction des résidus clés du noyau du repliement
1.8.1. Pourquoi la théorie de la nucléation condensation ?
1.8.2. Pourquoi le repliement immunoglobuline ?
1.8.3. Pourquoi un alignement multiple ?
1.9. Matériels et méthodes
1.9.1 Récupération des données de séquences et de structures
1.9.2. Formatage de données de structures
1.9.3. Analyse des identités en séquence et vérification de la non redondance
1.9.4. Données de structuration secondaire
1.9.5. Données de MIR
1.9.6. Données de TEF
1.9.7. Données de HTOO
1.10. Analyse des corrélations
1.10.1. Détermination des positions du cœur et de structure secondaire conservée
1.10.2. TEF et cœur
1.11. Présentation des résultats
1.12. Résultats
1.12.1. Banque
1.12.2. Identité
1.12.3. Alignement
1.12.4. Le cœur protéique
1.12.5. Corrélation cœur/extrémité de TEF/structuration secondaire
1.12.6. Corrélation cœur/MIR/structuration secondaire
1.12.7. Accord TEF/MIR
1.12.8. Corrélation MIR/HTOO
1.12.9. Corrélation MIR / hautes valeurs de PHI
1.12.10. Comparaison avec les CoC
1.13. Le repliement de type Flavodoxine
1.13.1. Banque
1.13.2. Taux d’identité
1.14. Discussion des résultats de corrélation
1.15 Conclusion
2. Seconde partie : Classification structurale d’une banque de fragments de protéines
2.1. Introduction
2.1.1. Les propriétés structurales des interfaces protéine – protéine
2.1.2. Matrice de contacts et tesselation de Voronoï
2.1.3. Discriminer entre multimères biologiques et multimères d’entassement cristallin
2.1.3.1. Thornton
2.1.3.2. DiMoVo
2.1.4. Pistes de classification structurale qui n’ont pas été suivies
2.1.4.1 Introduction au projet interdisciplinaire proposé
2.1.4.2. Descriptions des interactions
2.1.4.3. Prédiction topologique
2.1.4.4. Sélection des modèles
2.2. Matériels et Méthodes
2.2.1. Nettoyage de la banque
2.2.2. Attribution des TEF
2.2.3. Découpage des fichiers PDB
2.2.4 Détermination des cylindres enveloppant
2.2.5 Classification des TEF
2.2.6 Analyse des contacts par tesselation de Voronoï
2.2.7 Attribution des interactions correspondant aux différentes classes
2.2.8 Comptabilisation des interactions par couples de classes
2.3 Résultats
2.3.1 Résultats généraux
2.3.1.1. Numérotation des différents multimères
2.3.1.2 Énumération des TEF par classe
2.3.2 Interactions entre TEF dans les complexes
2.3.3 Interaction des différentes classes de TEF
2.4 Discussion
2.5. Conclusion
BIBLIOGRAPHIE
ANNEXES
Télécharger le rapport complet