Interactions protéine-protéine et domaines PDZ

Interactions protéine-protéine et domaines PDZ

Dans la cellule, les interactions protéine-protéine (PPI) jouent un rôle majeur dans des activités aussi variées que la transduction du signal, le contrôle de l’activité enzymatique ou la conversion d’énergie en mouvement. Toutes ces activités doivent être finement régulées pour le bon fonctionnement de la cellule, leur dérégulation étant souvent responsable de pathologies comme les cancers. L’intérieur de la cellule est un milieu dense dans lequel les protéines sont en constante interaction les unes avec les autres et doivent donc pouvoir reconnaitre spécifiquement leurs partenaires. Cette reconnaissance est assurée par des domaines protéiques capables de lier une région située à la surface du partenaire et possédant des caractéristiques physico-chimiques (charge, hydrophobicité, etc…) particulières. Il existe différents types de domaines de reconnaissance, chacun spécialisé dans la reconnaissance d’un type d’interface. Par exemple, les domaines SH3 se lient à des régions riches en prolines quand les domaines PDZ reconnaissent majoritairement l’extrémité C-terminale du partenaire. D’autres domaines comme les domaines SH2, PTB et FHA se fixent sur des régions modifiées des protéines (phosphorylation, acétylation et méthylation).

Au cours de cette étude nous nous intéresserons à la famille des domaines PDZ et plus particulièrement au domaine PDZ de la protéine Tiam1 qui est impliquée dans l’organisation et la motilité cellulaire. Nous présenterons dans un premier temps le rôle et l’organisation des domaines PDZ au sein de la cellule ainsi que les études computationnelles ayant été effectuées sur ces domaines. Nous détaillerons ensuite le rôle et les données disponibles concernant la protéine Tiam1 et son domaine PDZ.

Les domaines PDZ

Les domaines PDZ (Postsynaptic protein-95/Disk large/Zonula occludens-1 ) font partie des domaines de reconnaissance les plus abondants dans le règne du vivant. On estime actuellement à environ 270 le nombre de domaines présents dans le génome humain, répartis sur 150 protéines (Luck et al. [2012]). Certaines protéines, comme MUUP1, possèdent jusqu’à 13 domaines PDZ (Ye & Zhang [2013]). La présence de ces domaines au sein des protéines permet de reconnaître et de lier spécifiquement les partenaires protéiques (Baruch & Wendell [2001]). Les domaines PDZ sont impliqués dans un grand nombre de processus cellulaires comme la polarité, la migration, la croissance et la différenciation cellulaire ou encore le développement embryonnaire.

Organisation des domaines PDZ

Structure des domaines PDZ

Les PDZ sont des petits domaines globulaires d’environ 90 acides aminés. Ils présentent tous une structuration similaire composée de cinq ou six brins β (β1 à β6) et deux hélices α (α1 et α2), reliées par des boucles de tailles variables (figure 1.2A). D’autres structures secondaires sont parfois présentes au niveau des extrémités N- et C-terminales, qui modulent la structure et la fonction du domaine (Wang et al. [2010]). Dans une protéine, les domaines PDZ peuvent être seuls ou organisés en tandem, chaque domaine étant alors séparé du suivant par une séquence courte et très conservée. Dans cette organisation, les domaines PDZ ne fonctionnement pas indépendamment les uns des autres mais s’associent pour former des supramodules (Ye & Zhang [2013]). L’activité et la stabilité des domaines sont alors dépendantes des autres PDZ (Long et al. [2008]).

Mécanismes de reconnaissance

Les domaines PDZ lient généralement l’extrémité C-terminale de leur partenaire qui vient former un brin β au niveau d’un sillon situé entre β2 et α2 (figure 1.2B). D’autres modes de liaison ont cependant été observés, notamment avec des boucles internes (Gee et al. [1998] ; Hillier [1999] ; Wong et al. [2003]), des régions intrinsèquement désordonnées (Ivarsson [2012]) et des phospholipides (Gallardo et al. [2010]). Nous nous intéressons ici uniquement au mode de reconnaissance le plus courant, c’est-à-dire la liaison d’une extrémité C-terminale. Les domaines PDZ reconnaissent les quatre à sept acides aminés C-terminaux de leurs partenaires (Appleton et al. [2006] ; Tonikian et al. [2008]) mais peuvent également lier des peptides d’une dizaine d’acides aminés. Par convention, ces positions sont numérotées négativement, la position P0 correspondant à l’extrémité C-terminale. La nature des acides aminés présents à l’interface de liaison est responsable de la grande spécificité des domaines PDZ pour leurs partenaires. Cette spécificité ne semble cependant pas dépendre exclusivement de la nature des résidus de l’interface puisque deux domaines PDZ liant le même ligand ne présentent pas obligatoirement la même séquence (Ernst et al. [2010]). Certaines zones d’ombres
persistent donc sur les mécanismes mis en jeu dans l’interaction des PDZ avec leurs partenaires. L’analyses des structures cristallographiques et l’étude de bibliothèques combinatoires de peptides a cependant permis d’identifier certaines régions importantes dans la liaison de l’extrémité C-terminale de la protéine cible. Ainsi, la boucle β1-β2 est responsable de la liaison aspécifique du partenaire tandis que les résidus présents au niveau des brins β2 et β3 et de l’hélice α1 jouent un rôle dans la spécificité de la liaison. L’interface entre le domaine PDZ et l’extrémité C-terminale est présentée en figure 1.3. La boucle β1-β2 présente le motif R/K-XXX-G-Φ-G-Φ (où Φ est un acide aminé hydrophobe) qui est très conservé au sein des domaines PDZ. Cette région est impliquée dans la liaison du groupement carboxylate de la position P0 (Doyle et al. [1996] ; Songyang et al. [1997]). Cette interaction s’effectue avec le squelette de la deuxième glycine et la chaine latérale du résidu R/K, par l’intermédiaire d’une molécule d’eau.

Les régions responsables de la spécificité d’un domaine pour sa cible sont l’hélice α2 et le brin β2, qui forment l’interface de liaison, mais également le brin β3. La position P0 est certainement la plus importante dans la reconnaissance du partenaire. Cette dernière est la plupart du temps enfouie au sein d’une poche hydrophobe formée par la boucle β1-β2, α2 et β2 appelée S0. Une seconde sphère de résidus autour de S0 est également importante pour la spécificité (Murciano-Calles et al. [2014]). La poche S0 reconnait préférentiellement les résidus de type hydrophobe mais est souvent optimisée pour un type particulier (Tonikian et al. [2008]). La position P−1 est le plus souvent un résidu hydrophobe mais peut, dans certains cas, être un résidu chargé (Ernst et al. [2014]). La spécificité à cette position provient des résidus présents au niveau des feuillets β2 et β3 et d’interactions avec le squelette de β2. La position P−2 est également une position importante dans la spécificité. Elle est reconnue au niveau d’une poche appelée S−2 composée de résidus de β2 et α2. La position P−3 interagit avec des résidus de β2 et β3. On trouve souvent un résidu hydrophobe à cette position bien que dans certains cas, les types E/D et S/T soient préférés (Ernst et al. [2014]). Au-delà de la position P−3, le rôle des résidus sur la reconnaissance semble très dépendante du système.

Classification des domaines PDZ

Selon la nature des résidus reconnus aux positions P0 à P−2, les domaines PDZ ont été classés en trois groupes (Songyang et al. [1997] ; Stricker et al. [1997] ; Nourry et al. [2003]) : S/T-X-Φ pour la classe I, Φ-X-Φ pour la classe II et D/E-X-Φ pour la classe III (où Φ est un acide aminé hydrophobe). Une quatrième classe correspondant au motif X-Ψ-D/E (où Ψ correspond à une acide aminé aromatique) est parfois ajoutée (Vaccaro & Dente [2002]). Cette classification ne prend en compte que les trois résidus C-terminaux et est donc imparfaite puisque les résidus en amont de la position P−2 jouent également un rôle dans la spécificité. En analysant environ 3100 peptides reconnus par des domaines PDZ, Tonikian et al. [2008] ont défini 16 classes basées sur les 6 positions C-terminales. La classification des domaines PDZ reste cependant toute relative car de nombreux chevauchements sont observés entre les différentes classes (Stiffler et al. [2007]).

Les domaines PDZ comme cibles thérapeutiques

De par leur implication dans un grand nombre de processus cellulaires, les domaines PDZ sont d’excellentes cibles thérapeutiques dans le traitement de certaines pathologies, notamment neuronales, ou dans les cancers. En effet, en inhibant un domaine PDZ, il est possible d’interrompre une voie de signalisation. Différents domaines PDZ se sont révélés être de bonnes cibles comme PSD-95 (Aarts [2002]) et PICK1 (Thorsen et al. [2009]) dans le cas de maladies neuronales, et NHERF1 (Mayasundari et al. [2008]), AF6 (Joshi et al. [2006]) et MAGI3 (Fujii et al. [2003]) dans le cas de cancers.

Le développement de petites molécules inhibitrices des PPI est difficile en raison de la surface de contact importante entre les deux partenaires (Wells & McClendon [2007]) qui, dans le cas des domaines PDZ, est un long et profond sillon (Fry & Vassilev [2005]). Une alternative consiste à développer des peptides inhibiteurs en se basant sur la séquence des partenaires naturels. Cette approche a notamment été testée sur le domaine PDZ2 de la protéine PSD-95 (Aarts [2002]) et la protéine CAL (Amacher et al. [2014]). Dans certains cas, il est également possible de cibler deux domaines PDZ organisés en tandem en reliant deux peptides par un lien. Cette approche a été appliquée avec succès aux domaines PDZ1-2 de PSD95 et augmente l’affinité de l’inhibiteur (Bach et al. [2012]). L’une des principales difficultés à l’utilisation de peptides thérapeutiques est leur instabilité in vivo. Elle peut toutefois être réduite par l’incorporation d’acides aminés non naturels (Udugamasooriya et al. [2008] ; Patra et al. [2012]), la modification chimique du squelette (Bach et al. [2011]) ou l’utilisation de peptides cycliques (LeBlanc et al. [2010]).

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

I Introduction
1 Interactions protéine-protéine et domaines PDZ
1.1 Les domaines PDZ
1.1.1 Organisation des domaines PDZ
1.1.1.1 Structure des domaines PDZ
1.1.1.2 Mécanismes de reconnaissance
1.1.1.3 Classification des domaines PDZ
1.1.2 Les domaines PDZ comme cibles thérapeutiques
1.1.3 Études computationnelles existantes
1.1.3.1 Caractérisation des domaines PDZ par dynamique moléculaire
1.1.3.2 Prédiction des séquences liantes et des affinités
1.1.3.3 Dessin computationel de protéine
1.2 La protéine Tiam1
1.2.1 Structure et rôle biologique
1.2.2 Partenaires du domaine PDZ de Tiam1
1.2.3 Positions impliquées dans la spécificité du domaine PDZ de Tiam1
1.2.4 Données disponibles concernant le domaine PDZ de Tiam1
1.2.4.1 Données structurales disponibles
1.2.4.2 Affinités expérimentales
II Étude du domaine PDZ de Tiam1 par des approches de dessin computationel de protéine
2 Le dessin computationel de protéine
2.1 Modélisation de l’espace conformationnel
2.1.1 Modélisation de l’état replié
2.1.1.1 Modélisation des chaines latérales
2.1.1.2 Modélisation du squelette
2.1.2 Modélisation de l’état déplié
2.2 Fonction d’énergie
2.2.1 Fonction d’énergie issue de la mécanique moléculaire
2.2.1.1 Énergie d’interactions liées
2.2.1.2 Énergie d’interactions non liées
2.2.1.3 Modélisation implicite du solvant
2.2.2 Décomposition de l’énergie par paires pour le CPD
2.3 Algorithmes d’explorations
2.3.1 Algorithmes stochastiques ou heuristiques
2.3.2 Algorithmes déterministes ou exacts
2.4 Les principaux programmes de CPD
2.4.1 Le programme Proteus
2.4.1.1 Fonction d’énergie
2.4.1.2 Algorithmes d’exploration
2.4.2 Le programme Rosetta fixbb
2.4.2.1 Fonction d’énergie
2.4.2.2 Algorithme d’exploration
3 Paramétrisation du modèle pour le dessin des domaines PDZ
3.1 Optimisation des énergies de référence
3.1.1 Protocole d’optimisation
3.1.2 Séquences expérimentales et modèles structuraux
3.1.2.1 Choix des modèles structuraux
3.1.2.2 Recherche de séquences homologues proches
3.1.3 Détermination des énergies de référence initiales
3.1.3.1 Le peptide Sdc1 comme modèle déplié
3.1.3.2 Énergies diagonales
3.1.4 Optimisation des énergies de référence
3.1.5 Optimisation dans un environnement natif
3.2 Convergence des optimisations
3.2.1 Convergence des énergies de référence
3.2.2 Convergence des fréquences
3.3 Validation des paramètres
3.3.1 Génération des séquences Proteus
3.3.2 Génération des séquences Rosetta
3.3.3 Caractérisation des séquences de Tiam1 et Cask
3.3.3.1 Compatibilité des séquences avec le repliement des domaines PDZ
3.3.3.2 Comparaison des séquences générées avec l’alignement Pfam
3.3.3.3 Entropie de séquence
3.3.4 Application du modèle à deux autres domaines PDZ
3.4 Introduction d’un potentiel de biais
3.5 Dessin de positions impliquées dans la spécificité
3.5.1 Modèles structuraux
3.5.2 Génération des séquences
3.5.3 Impact du squelette et du peptide sur les séquences générées
3.5.4 Stabilité des séquence générées
3.5.5 Estimation de l’énergie libre de liaison
3.6 Discussion et conclusions
4 Étude de la stabilité des séquences générées par Proteus à partir du squelette du domaine PDZ de Tiam1
4.1 Génération des séquences
4.1.1 Conservation des résidus de l’interface protéine-peptide .
4.1.2 Jeux d’énergies de référence utilisés
4.2 Sélection des séquences
4.2.1 Critères de sélection des séquences à simuler
4.2.2 Sélection automatique
4.2.3 Sélection manuelle
4.3 Stabilité des séquences produites en simulation de dynamique moléculaire
4.3.1 Préparation des systèmes
4.3.2 Critères de stabilité
4.3.2.1 Convergence des simulations
4.3.2.2 Fluctuations atomiques
4.3.2.3 Rayon de giration
4.3.2.4 Stabilité des structures secondaires
4.3.2.5 Analyse en composantes principales (ACP)
4.4 Comportement des simulations de dynamique moléculaire
4.4.1 Convergence et stabilité des simulations
4.4.2 Identification des résidus responsables des fluctuations
4.4.3 Analyse en composantes principales
4.4.4 Comparaison des dynamiques aux données RMN
4.5 Stabilité des séquences in vitro
4.5.1 Analyse de la séquence 6 par RMN
4.5.2 Modification manuelle des séquences
4.5.3 Analyses expérimentales des séquences modifiées
4.6 Conclusions
III Conclusion