Télécharger le fichier pdf d’un mémoire de fin d’études
Une histoire d’interaction
La majorité des processus biologiques font intervenir des interactions protéine-protéine ou domaine-domaine. Ces interactions entraînent la formation de complexes protéiques. Ces complexes vont jouer différents rôles en fonction de leur composition, de leur affinité mais également de la durée pendant laquelle le complexe reste formé. Les interactions protéine-protéine sont impliquées dans le transport, la régulation de voies métaboliques ou enzymatiques et la signalisation… L’étude et l’identification de ces interactions permettent donc une meilleure compréhension du monde du vivant. (Nooren, I.M. and Thornton, J.M., 2003) Pourquoi un domaine X va interagir avec un domaine Y plutôt qu’avec un domaine Z ? Comment prédire les interactions que peut effectuer un domaine avec une protéine ?
Plusieurs études ont visé à répondre à ces questions et notamment à la prédiction des interactions protéine-protéine et domaine-domaine. Ces études reposent sur l’analyse de bases de données (InterPro, PFAM, SCOP) regroupant les interactions déjà caractérisées entre protéines et domaines. Le principe étant d’identifier des séquences d’acides aminés spécifiques interagissant ensemble au sein de ces bases de données, par la suite divers modèles sont mis en place pour extrapoler à des interactions non caractérisées. (Nye, T.M., et al., 2005; Riley, R., et al., 2005; Doerks, T., et al., 2002; Sprinzak, E. and Margalit, H., 2001; Stelzl, U., et al., 2005) L’équipe de J. M. Carazo a développé ce même genre d’approche en prenant en compte la dimension structurale des interactions, en se basant sur les données de la protein data bank (pdb). Ils ont ainsi pu améliorer la précision des prédictions tout en en augmentant leur nombre. (Segura, J., et al., 2015)
En cas d’une protéine non caractérisée, l’utilisation de ces prédictions peut également aider à comprendre son fonctionnement. Par exemple, si une protéine est prédite pour interagir avec un domaine de liaison à l’ADN, il peut être intéressant d’étudier expérimentalement les effets de cette protéine sur l’ADN.
Les linkers : Des entremetteurs protéiques
L’étude des linkers permet également de mieux comprendre ces interactions et les processus qui en découlent. En effet, les linkers ne présentent pas tous la même taille, la même structure ou la même composition. Or, ces paramètres peuvent avoir des conséquences fondamentales dans les protéines multidomaines. En effet, un linker, s’il est flexible, pourra permettre des configurations qui ne seront pas accessibles si le linker adopte une structure plus rigide et donc par exemple empêcher des interactions intramoléculaires. De la même manière un lien trop court entre deux domaines pourra empêcher leur interaction, la taille est donc également importante.
L’équipe d’Heringa J. a par exemple réalisé une classification détaillée de la composition de 1280 linkers (12 776 résidus) en fonction de leurs structures. Cette étude montre qu’au sein des linkers, il existe pour chaque type de structure une fréquence d’utilisation des acides aminés spécifique et différente de celle des domaines protéiques. Ainsi, on trouve de manière générale plus de Proline, Arginine, Phénylalanine, Thréonine, Glutamate et Glutamine (par ordre décroissant en termes de préférence) dans les linkers que dans les protéines repliées. La présence de proline en tant que résidu le plus présent est probablement due au fait qu’elle ne peut créer de liaison hydrogène et permet alors une isolation structurale entre linker et domaines. La composition du linker en fonction de la structure varie également, il y a ainsi plus de proline dans les linkers non structurés que dans les linkers hélicoïdaux. Cela peut s’expliquer par le fait que les prolines vont donner une certaine rigidité au linker, celle-ci peut être nécessaire au repliement des protéines. Fait intéressant, les auteurs ont remarqué que 10% des linkers hélicoïdaux étudiés possédaient une proline centrale (contre seulement 2% dans les hélices en général). La présence de cette proline perturbe le réseau de liaisons hydrogènes de l’hélice et peut permettre en fonction des conditions une torsion de l’hélice à la manière d’une charnière. (George, R.A. and Heringa, J., 2003) Les auteurs n’ont cependant pas regardé si les protéines possédant ce genre de linker présentaient des mécanismes impliquant de tels changements structuraux. Cela aurait pu expliquer la conservation de cette proline centrale au cours de l’évolution.
Conclusion
L’ensemble des études sur l’évolution a permis d’obtenir une meilleure compréhension du monde des protéines. Compréhension sur le fonctionnement de l’évolution et les moyens par lesquelles, de nouvelles fonctions ont pu être obtenues. La réutilisation de domaines aurait ainsi permis une évolution rapide et expliquerait pourquoi certains sont retrouvés dans plusieurs protéines aux fonctions diverses. De plus, les prédictions d’interfaces et l’étude des linkers permettent notamment de mieux anticiper et comprendre le comportement des protéines à l’aide de leur séquence. L’ensemble de ces informations permet d’une part, de comprendre la complexité du monde vivant et d’autre part représente une bonne base de départ pour créer et concevoir des outils moléculaires plus ou moins complexes par ingénierie protéique.
Ingénierie protéique
La création de nouvelles fonctions basées sur l’utilisation des protéines représente un enjeu majeur, que cela soit dans le domaine pharmaceutique ou dans le domaine industriel. En effet, d’une part, l’obtention de nouveaux médicaments innovants est toujours nécessaire pour de nombreuses maladies. D’autre part, à l’heure de la chimie verte, les protéines semblent être une excellente alternative pour catalyser des réactions nécessitant jusqu’alors l’utilisation de produits chimiques polluants.
Deux approches bien distinctes sont envisageables pour la conception d’outils moléculaires : L’évolution dirigée et la conception rationnelle.
Évolution dirigée
L’évolution dirigée est une approche visant à mimer l’évolution darwinienne à l’échelle de la paillasse. C’est-à-dire qu’une population de départ bien définie va être amenée à évoluer dans un milieu spécifique pour obtenir les propriétés désirées. Cette méthode se base sur la création de diversité génétique via des bibliothèques de variants puis dans la majorité des cas, sur une réduction de celle-ci par l’application d’une pression de sélection, et enfin d’un criblage phénotypique des variants présentant les caractéristiques recherchées. Cette pression de sélection n’est cependant pas toujours nécessaire, par exemple, lorsque l’on souhaite améliorer une fonction enzymatique, seule l’étape de criblage est nécessaire après création de diversité. L’évolution dirigée est une méthode permettant l’obtention rapide d’un petit nombre de protéines aux propriétés choisies. (Figure 2-A)
La création de diversité génétique peut se faire par différentes méthodes : mutagénèse aléatoire, recombinaisons d’ADN, utilisations de souches mutagènes… La taille des bibliothèques de variants à créer dépend de l’objectif désiré. Il est généralement préférable expérimentalement d’avoir le plus grand nombre de séquences possibles. Il est cependant impossible de couvrir l’ensemble de l’espace des séquences d’une protéine typique. En effet, pour un décapeptide, le nombre de séquences théoriques possibles est de 1013, en considérant que chacun des vingt acides aminés naturels peut occuper chacune des positions. Or il s’agit de la limite actuelle des méthodes de génération de diversité et de criblage. (Arnold, F.H., 2018; Cobb, R.E., et al., 2013; Packer, M.S. and Liu, D.R., 2015)
Cela pose la question de savoir si la diversité au sein de l’espace des séquences composant une bibliothèque est suffisante pour sélectionner un variant aux propriétés désirées ?! Avec une banque suffisamment exhaustive, l’expérience montre qu’il est possible de sélectionner une séquence, si ce n’est plus, codant pour un ou des variants ayant les propriétés recherchées. Ainsi, bien que n’étant pas totalement exhaustive une bibliothèque de taille suffisante peut amplement suffire à l’obtention d’une, voire de plusieurs protéines, possédant les propriétés recherchées. Il ne s’agira peut-être pas du variant le plus optimal, ce dernier pouvant être obtenu a priori avec une banque totalement exhaustive, mais il s’en rapprochera.
Une fois la diversité génétique obtenu, il est nécessaire d’effectuer une étape où une pression de sélection est appliquée. La pression de sélection va permettre de réduire la diversité génétique. Celle-ci peut être basé sur le fitness de bactérie en exprimant les variants dans des conditions variables, sur la reconnaissance de cible, … Dans le cas où l’on cherche à sélectionner des protéines interagissant avec une cible donnée, la pression de sélection va se faire en se basant sur l’utilisation de méthodes d’expositions («display»), les principales étant le Phage-display, le Ribosome-display ou le Yeast–display. (Li, M., 2000) Ces méthodes permettent l’exposition des protéines à une cible d’intérêt fixée sur un support. Pour cela, elles sont liées à des modules d’exposition (phages, ribosomes, levures…) contenant l’information génétique spécifique de la protéine exposée. Si celle-ci présente une affinité pour la cible, alors, le complexe cible-protéine-module d’exposition ne se détachera pas lors de lavages successifs. Il sera ainsi possible en augmentant la stringence des conditions de sélection (lavages, compétiteurs, temps d’incubation…) de sélectionner des protéines de plus en plus affines.
La plasticité enzymatique peut également être exploitée en évolution dirigée. Par exemple, l’équipe de F.H. Arnold a remarqué que les protéines à hème et notamment le cytochrome P450 possède une activité résiduelle de cyclopropanation des alcènes en présence de diazo carbène et cela dans l’eau. Par évolution dirigée, les auteurs ont réussi à augmenter cette activité résiduelle pour produire du cis-cyclopropane, un précurseur du levomilnacipran, un antidépresseur. (Wang, Z.J., et al., 2014)
Conception rationnelle
La conception rationnelle présente un avantage par rapport à l’évolution dirigée : il n’est pas nécessaire de cribler expérimentalement les bibliothèques de variants. Par conséquent une partie très lourde de l’évolution dirigée peut être évitée.
Cette approche se base sur les connaissances acquises et sur le postulat que la séquence en acides aminés va définir la structure et les propriétés des protéines. Ainsi grâce à une approche de design computationnel, il est possible de créer des protéines aux fonctions désirées en prédisant le repliement de la séquence d’acides aminés. Le design de protéines nécessite alors l’utilisation de base de données structurale (pdb) et d’interaction (BioGRID). (Figure 2-B) (Eriksen, D.T., et al., 2014; Chen, T.S. and Keating, A.E., 2012; Huang, P.S., et al., 2016)
Les stratégies employées sont de plusieurs types. Il peut s’agir de la « simple » ingénierie rationnelle d’un site actif pour augmenter la spécificité ou la sélectivité. Par exemple, Zha et al. ont modifié rationnellement l’acide gras synthase, une enzyme bifonctionnelle, afin d’inhiber sa fonction céto réductase et pour uniquement produire de l’acide tri acétique lactone. (Zha, W., et al., 2004)
La conception rationnelle peut aller jusqu’à la création de novo de molécule. C’est ce qu’a fait l’équipe de D. Baker en créant la première molécule possédant un repliement n’étant pas observé dans la nature et présentant une haute stabilité avec un Tm supérieur à 100°C. (Kuhlman, B., et al., 2003) Cette même équipe a également réalisé une enzyme capable de catalyser la réaction de Diels-Alder. Le modèle fut conçu in silico en utilisant le programme de modélisation Rosetta. Le site actif a été le premier élément créé puis les auteurs ont conçu une structure stable permettant d’obtenir ce site actif. La caractérisation fonctionnelle et structurale de cette enzyme a montré que le modèle se superposait à la structure expérimentale et que l’enzyme catalysait bien la réaction souhaitée. (Siegel, J.B., et al., 2010)
Design semi-rationnel
Avec la modernisation des outils informatiques et l’augmentation de leur puissance, la combinaison des deux approches est devenue une stratégie très courante. Désormais, le design semi-rationnel qui consiste en la combinaison de l’évolution dirigée et du design rationnel est souvent l’alternative choisie pour le développement de nouvelles protéines par ingénierie. Cette stratégie se base sur l’utilisation de données structurales, fonctionnelles, et sur les informations extraites des séquences mais aussi sur des algorithmes de design rationnel. Il devient alors possible d’identifier préalablement à la création de diversité génétique, les zones présentant un intérêt à être mutées. Dans le cas d’un site actif par exemple, il est alors possible de cibler les résidus du site actif pour changer la spécificité d’une enzyme. Cela permet de diminuer la diversité génétique initialement nécessaire en ciblant des positions et donc de réduire la taille des bibliothèques. (Figure 2-C) (Lutz, S., 2010)
|
Table des matières
I. LE MONDE DES PROTÉINES
A. L’évolution du répertoire protéique
B. Une histoire d’interaction
C. Les linkers : Des entremetteurs protéiques
D. Conclusion
II. INGÉNIERIE PROTÉIQUE
A. Évolution dirigée
B. Conception rationnelle
C. Design semi-rationnel
III. OPTIMISATION ET CRÉATION DE RECONNAISSANCE
A. Les anticorps et leurs dérivés
1) Les anticorps « classiques »
2) Intégration des ScFv dans des constructions plus complexes
3) Les anticorps de camélidés
4) Conclusion
B. Un système immunitaire ancestral
C. Les architectures artificielles comme alternative
1) Une variété d’architectures
2) Les protéines à motifs répétés
a) Quelles ossatures ?
b) L’exemple des Darpins
3) Création de reconnaissance de novo
IV. CRÉATION D’OUTILS MOLÉCULAIRES COMPLEXES
A. Chimeric Antigen Receptor (CAR)
B. De la reconnaissance à la détection : Les biosenseurs
1) Biosenseurs basés sur la variation d’un signal lumineux
a) Le FRET : Förster Resonance Energy Transfer
b) L’apport des protéines fluorescentes et bioluminescente
c) Biosenseurs basés sur du FRET
d) Biosenseurs basés sur le BRET
e) Un nouveau couple Donneur / Accepteur pour voir plus loin :
2) Biosenseurs basés sur une résistance aux antibiotiques
3) Basés sur la permutation circulaire de protéine fluorescente
4) Biosenseurs basés sur la complémentation fonctionnelle
5) Biosenseurs basés sur la stabilité des biosenseurs in vivo
C. Contrôle des fonctions par la lumière
D. Des multidomaines pour aider à l’expression et à cristallisation
1) Expression
2) Cristallisation
E. Création d’avidité par clam
V. CONTEXTE SCIENTIFIQUE
A. Les αReps
1) À l’origine des αReps : les protéines HEAT
2) Design de la séquence consensus
3) Construction de la bibliothèque ΑReps
a) Bibliothèque 1.0
b) Bibliothèques 2.0 et 2.1
4) Reconnaissance in vivo
5) Sélection d’αReps contre des cibles définies
B. Les αReps comme briques élémentaires
VI. BIBLIOGRAPHIE
Télécharger le rapport complet