Télécharger le fichier pdf d’un mémoire de fin d’études
La promiscuité enzymatique, un point de départ pour l’ingénierie
Bien que les enzymes soient des catalyseurs d’une remarquable spécificité, il est commun qu’elles présentent d’autres propriétés catalytiques, en conditions non physiologiques. On parle alors de promiscuité enzymatique. Ce terme ambigu regroupe deux définitions spécifiques : il peut s’agir d’une promiscuité de substrat (une enzyme catalysant le même type de réaction sur deux substrats différents) ou d’une promiscuité de réaction (deux réactions différentes à partir du même substrat). Cette promiscuité peut provenir soit du fait que l’activité secondaire n’a pas été sélectionnée négativement au cours de l’évolution, soit parce que la protéine n’est pas suffisamment spécifique pour discriminer les deux substrats. La ribulose Bis-phosphate Carboxylase Oxygenase (RuBisCO), enzyme responsable de la fixation du CO2 par les organismes photosynthétiques, est un parfait exemple de promiscuité de réaction et de substrat. Son activité principale est la carboxylation du ribulose bis-phosphate par le CO2 et son activité secondaire, l’oxydation de ce même substrat par une molécule d’O2. Malgré l’effet très délétère de cette réaction secondaire sur le rendement de fixation du CO2 par les végétaux, il n’est pas possible d’améliorer la spécificité sans baisser la vitesse de la réaction, et la nature a dû mettre en place des mécanismes très couteux en énergie pour répondre à ce problème.13
Figure 9 : Promiscuité enzymatique de la RuBisCO a) réaction bénéfique conduisant à l’incorporation de carbone dans la plante b) réaction néfaste, conduisant à un cycle appelé photorespiration nécessaire à la régénération des composés, provoquant une perte nette en carbone incorporé par la photosynthèse.
La promiscuité enzymatique est le point de départ de la réaffectation d’une enzyme vers une autre activité, tant dans la nature qu’au laboratoire. Une fois qu’une activité catalytique, aussi faible soit-elle, a été observée dans une protéine, il est a priori possible de l’améliorer. La question se pose alors de la méthode à employer pour créer suffisamment de diversité pour explorer le paysage adaptatif de la molécule pour la réaction désirée. Nous verrons ici les différentes méthodes de création de diversité génétique, classées en termes d’efficacité croissante. Le terme efficacité se réfère ici à la réduction de la taille de la banque de gènes nécessaire pour obtenir un catalyseur désiré, éliminant au maximum les protéines peu intéressantes. Nous aborderons ensuite différents moyens utilisés pour discriminer les variants d’une banque, et les difficultés que pose l’amélioration de l’énantiosélectivité. Nous verrons qu’une banque plus efficace nécessite également plus de connaissances structurales et fonctionnelles sur l’objet à faire évoluer. La génération de diversité : vers des banques de plus en plus rationnelles
Différentes méthodes de génération de diversité peuvent être utilisées pour la génération d’enzymes stéréosélectives. Celles-ci seront présentées en s’appuyant sur l’exemple de l’évolution dirigée d’une lipase, qui a bénéficié d’une étude comparative entre les différentes méthodes par l’équipe du Pr. Manfred T. Reetz pour l’optimisation du dédoublement cinétique d’un mélange racémique de p-nitrophenyl2-methyldecanoate (figure 10).
Figure 10 : Réaction standard énantiosélective (ici en faveur de l’hydrolyse de l’énantiomère (R)) étudiée par l’équipe de Reetz, la sélectivité peut être étudiée par la réalisation de deux cinétiques séparées d’hydrolyse d’un mélange énantiopur du substrat. La réaction est suivie grâce à l’absorbance à 405 nm du p-Nitrophénol.
Ce substrat libère lors de son hydrolyse du p-Nitrophénol dont la forme phénolate absorbe à 405 nm. L’excès énantiomérique et le facteur E sont calculés grâce une cinétique d’apparition du produit lors de deux expériences jumelées. Dans un puits, la réaction est effectuée sur l’un des deux énantiomères du substrat, l’autre énantiomère étant utilisé dans le puits adjacent. Ce mode opératoire permet le criblage de 48 mutants différents par plaque, il est ainsi possible de comparer les stratégies de mutagénèse. Ces différentes stratégies sont résumées dans la figure 11, où sont représentées par des étiquettes oranges les différents variants obtenus et leur sélectivité, et par des étiquettes grises les différentes stratégies de mutagénèse ayant permis d’obtenir lesdits variants.
Figure 11 : Evolution de la lipase selon différentes méthodes d’évolution dirigée. Les étiquettes grises représentent les méthodes de mutagénèse utilisées pour constituer les différentes banques de protéines. Les étiquettes oranges représentent les meilleurs catalyseurs obtenus pour la réaction d’hydrolyse énantiosélective présentée en figure 10. Selon14
Les méthodes non ciblées : mutations sur la totalité du gène
Les méthodes non ciblées nécessitent le moins de connaissances préalables pour la génération de banques géniques, et permettent d’introduire des mutations au hasard sur la totalité du gène. Un autre avantage est de pouvoir trouver des mutations que l’on n’aurait pas pu prédire du fait d’effets épistatiques à longue distance. Cependant cette approche possède deux inconvénients : la fraction utile des mutations est très faible, certaines positions fixées au cours de l’évolution étant très délétères pour l’intégrité structurale de la protéine si mutées, ou d’autres positions étant tout à fait neutres. De plus, comme vu plus haut, la combinatoire des séquences mutées aléatoirement sur toute la longueur d’un gène étant gigantesque, l’exploration de l’espace des séquences ne peut être que très partielle.15
La mutagénèse aléatoire
La mutagénèse aléatoire est la méthode la moins ciblée de toutes, mais également la plus facile à mettre en place. La technique in vitro de base utilise d’une version modifiée de la réaction en chaine par polymérase (PCR), elle est désignée par son acronyme anglais EpPCR pour Error prone PCR, le but étant de réduire la fidélité de la polymérase afin d’introduire des erreurs avec un taux contrôlé (généralement 1 à 10 mutations par 1000 pb). La polymérase est généralement rendue moins fidèle par l’ajout de Mn2+ au lieux de Mg2+ dans le milieu réactionnel 16. D’autres techniques existent également comme l’utilisation de souches de E. coli possédant une polymérase infidèle 17, la Sequence Saturation Mutagenesis (SeSaM) 18, l’insertion/deletion aleatoire (RID) 19 ou d’autres encore 20,21, mais nous nous focaliseront sur l’EpPCR. Cette dernière est celle encore actuellement la plus utilisée dans la construction de banques géniques naïves pour sa simplicité bien qu’elle possède deux biais majeurs : i/ La fréquence de permutation est dépendante du type de base, les bases A-T étant généralement plus sujettes aux mutations que les G-C. Des kits d’enzymes spécialement optimisés promettent une diminution de ce biais. ii/ La dégénérescence du code génétique favorise l’apparition des acides aminés les plus représentés.
La première utilisation de l’EpPCR pour l’évolution dirigée d’une enzyme date du début des années 90 avec les travaux pionniers de Frances Arnold sur la subtilisine E 22–24. Ces travaux visaient à augmenter l’activité de l’enzyme en présence de diméthylformamide (DMF). La méthode de criblage employée était visuelle : les protéines étaient sécrétées par B. subtilis sur des boites de pétri contenant des concentrations variables DMF et de la caséine, la taille du halo de dégradation de la caséine autour de la colonie reflétant l’activité de la protéine. Les gènes présents dans les colonies présentant un plus grand halo que le contrôle étaient utilisés pour un criblage d’activité en tube contre le substrat chromogénique de protéase s-AAPF-pNA. Le meilleur candidat était utilisé pour nouveau cycle de mutagénèse. Après plusieurs tours de mutagénèse et sélection successifs, des enzymes portant 3, 10, puis 13 acides aminés changés ont été trouvées et caractérisées. Ces variant possédaient une efficacité catalytique supérieure à celle de la protéine native dans un solvant purement aqueux, et la conservaient (et même l’augmentaient !) en présence de moins de 40% de DMF. Il a été décrit que ces améliorations étaient dues à la baisse de l’affinité apparente pour le substrat modèle, ainsi qu’à une plus grande stabilité de l’enzyme modifiée en présence de DMF. Il est intéressant de noter que toutes ces mutations se situent sur la surface de la protéine, la plupart étant dans la poche de fixation du substrat ou autour du site catalytique et qu’un grand nombre sont également présentes dans d’autres subtilisines. A contrario, dans une étude cherchant à augmenter la thermostabilité de l’enzyme, les mutations stabilisantes se trouvaient à longue distance du site catalytique. Cependant F. Arnold ne s’est pas intéressée à la stéréosélectivité dans ces études.
C’est en 1997 que Reetz publia la première optimisation de l’énantiosélectivité de la lipase de P. Aeruginosa envers le p-nitrophenyl2-methyldecanoate par mutagénèse aléatoire. Les paramètres de l’EpPCR étaient empiriquement mis au point de manière à n’avoir qu’une seule mutation en moyenne par gène. Le premier postulat de cette approche était que les mutations étaient essentiellement additives. Le second était que la présence d’un trop grand nombre de mutations sur le même gène pouvait cacher une mutation bénéfique à cause d’une deuxième mutation très délétère. La taille de la banque pour une substitution d’un acide aminé par un des 19 autres disponibles dans une protéine est donnée par l’équation : ?= 19??![(?−?)!?!] X étant la taille de la protéine (ici 285 aa) et M le nombre de mutations par protéine (ici 1). Le nombre de protéines différentes est donc de 5415. On peut noter qu’avec un taux de mutation de 2 on passe à 15.106 protéines différentes, et 52.109 pour seulement 3 mutations, agrandissant considérablement le criblage nécessaire. Quatre tours de sélection de seulement 1000 à 2400 clones de cette banque (8000 au total) suffirent à trouver des candidats passant de 2% d’excès énantiomérique pour le type sauvage à 81% pour le type évolué (Variant A, figure 11), correspondant à des ratios énantiomériques de 1,1 et 11,3 respectivement. Bien que remarquable pour seulement 4 tours de sélection avec si peu de clones criblés, un ratio énantiomérique de 11,3 est cependant insuffisant pour une utilisation pratique. Une tentative d’amélioration par d’autres cycles à un taux de mutation bas ne s’avéra pas concluante. Une approche par EpPCR à haut taux de mutation donna après criblage de 15 000 variants, deux clones à l’énantiosélectivité faible (Variant D (E = 3) et E (E = 6,5), figure 11), confirmant le premier postulat selon lequel un nombre plus élevé de mutations augmente drastiquement la fraction non utile (possiblement instable) des variants de la banque. Bien que relativement peu efficace, l’approche de mutagénèse aléatoire peut permettre de déterminer les positions intéressantes à faire varier (les « hot spots » de mutation). C’est également un moyen pour créer de la diversité génétique pour un autre type d’approche non ciblé : les méthodes par recombinaison de gènes.
Les méthodes par recombinaison de gènes
Les méthodes de recombinaison se basent sur le fait que les acides aminés importants pour l’intégrité de la structure d’une protéine sont conservés au cours de l’évolution (naturelle ou artificielle). L’alignement de différentes séquences homologues codant pour des enzymes équivalentes chez des espèces différentes, fait apparaitre des points chauds et des points froids de mutation dans la séquence d’un gène. Une analyse de la séquence « consensus » issue de ces alignements permet de recombiner ces séquences, en s’assurant de la pertinence des mutations, contrairement aux méthodes de mutagénèse aléatoire décrites précédemment. La première méthode appelée « gene shuffling » ou « PCR sexuelle », introduite par Willem P. C. Stemmer dans les années 1990, utilise la PCR sur des gènes fragmentés, se recombinant par homologie durant la phase d’hybridation. 25 Cette méthode induit cependant un biais en faveur de la recombinaison des fragments les plus homologues, réduisant la diversité créée. Nombre de variantes ont été imaginées pour palier à ce problème, avec ou sans PCR.26–35 Dans le cas de la lipase de P. Aeruginosa de l’étude de Reetz, la recombinaison entre les variants sélectionnés au sein d’une banque générée par des méthodes de PCR mutagène à bas taux d’erreur s’est soldée par un échec. Une recombinaison entre ces mêmes enzymes et les autres variants peu performants provenant de la banque à haut taux de mutation citée plus haut a cette fois permis de passer d’un facteur E de 25 avant recombinaison à 32 après recombinaison puis sélection (variants C et F respectivement, figure 11). Bien que peu performants, les variants provenant de la banque à haut taux d’erreur possédaient donc tout de même des mutations bénéfiques pour la sélectivité.
Les méthodes à alea ciblé
Les méthodes ciblées, qui consistent à choisir précisément les positions qui seront mutées, nécessitent une connaissance plus profonde de l’objet à modifier. Les points chauds de mutations peuvent être déterminés par alignement de séquences natives comme des séquences des variants provenant de banques aléatoires. Les positions peuvent également être sélectionnés de manière rationnelle par inspection de la crevasse d’un site actif (CAST) par exemple ou par des méthodes de modélisation moléculaire.
La mutagénèse combinatoire à cassettes
La méthode de mutagénèse combinatoire à multiples cassettes (MCMC) se rapproche des méthodes de recombinaison évoquées précédemment, cependant elle prend en compte la présence de points chauds de mutations, elle est donc un point intermédiaire entre les méthodes de recombinaison et les méthodes de mutagénèse ciblées. Son utilisation sur seulement deux positions (155 et 162) de la Lipase de P.aeruginosa a permis de découvrir des variants possédant un facteur E jusqu’à 34 (variants I et J, figure 11). Par l’utilisation de la combinaison de ce type de mutagénèse et des méthodes de recombinaison classiques, l’équipe de Reetz a obtenu des facteurs E encore meilleurs (E de >51: Variant J, figure 11).
La mutagénèse à saturation
La mutagénèse à saturation est employée pour muter un acide aminé ciblé de la protéine. La méthode couramment utilisée est semblable à la mutagenèse dirigée, utilisant des amorces dégénérées pour une amplification PCR circulaire. Les schémas de mutagénèse peuvent cependant être volontairement biaisés pour réduire la diversité, éviter certains acides aminés ou des codons non-sens, ou contrer la dégénérescence naturelle du code génétique. Ainsi le triplet NNK est souvent utilisé car il encode les 20 acides aminés en divisant le nombre de codons par deux et éliminant deux codons stop sur trois. Cependant différentes expériences d’évolution dirigés utilisant des alphabets très réduits d’acides aminés ont donné des résultats très satisfaisants tout en réduisant drastiquement le nombre de combinaisons possibles, prouvant qu’une très grande diversité n’était pas forcément nécessaire. 8,36–38
Postulant que l’énantiosélectivité d’une enzyme est principalement gouvernée par les acides aminés proches du substrat dans le site actif, le principe de mutagénèse à saturation de site actif apparut (CAST), réduit considérablement l’espace des possibles. 39 L’utilisation de la méthode CAST de manière itérative sur chacune des positions choisies l’une après l’autre est nommée mutagénèse à saturation itérative (ISM, figure 12). 40 Afin d’illustrer l’efficacité de cette méthode, le groupe de Reetz a optimisé l’énantiosélectivité de la lipase de P. aeruginosa jusqu’à un facteur E de 436 avec seulement 10 000 variants testés (variant K, figure 11).41 Elle a depuis été reprise avec succès par nombre de groupes de recherche dans l’évolution de la spécificité de substrat de différentes enzymes. 42–51 Cette méthode semble donc être une des plus efficaces dans l’exploration de l’espace des séquences pour l’amélioration de l’énantiosélectivité.
Figure 12 : Illustration schématique de la mutagénèse à saturation itérative (ISM) avec quatre positions à randomiser (A, B, C et D). L’espace des séquences est exploré par des expériences successives de mutagénèse à saturation de manière combinatoire. L’exploration de l’espace des séquences se fait jusqu’à l’obtention d’une activité satisfaisante. Selon 40
Les apports de l’outil informatique
Le nombre croissant de données structurales disponibles, ainsi que les avancées récentes dans la modélisation des protéines nous permettent aujourd’hui de rationaliser l’existence de certains points chauds de mutation et de prédire dans une certaine mesure les mutations nécessaires à l’amélioration de propriétés d’enzymes. Elles sont cependant généralement couplées à des expériences d’évolution dirigée.
Figure 13 : Les informations fournies par les alignements de séquence et de structure, et également la modélisation moléculaire, font aujourd’hui partie intégrante de la stratégie d’évolution dirigée d’enzymes. Le but recherché étant la création de banques de variants toujours plus petites mais intelligentes.
Ces analyses peuvent s’appuyer sur des homologies de séquences ou de structures : L’application web 3DM, conçu par l’entreprise Bio-Prodict, utilise les comparaisons de protéines d’une même famille ainsi que la littérature existante pour prédire les résidus concernés dans la sélectivité d’une enzyme, et a été utilisé avec succès dans des stratégies d’évolution dirigée.46 Dans cette étude de Bornscheuer, les comparaisons de séquence de la famille d’une estérase ont servi à « conseiller » la mutation de quatre positions avec un alphabet spécifique pour chacune. Une comparaison d’un peu plus de 500 clones provenant de banques CAST conçues selon trois schémas de dégénérescences a été effectuée : codons NNK (tous les acides aminés possibles, graphe vert figure 14), codons « conseillés » (graphe bleu, figure 14) et « déconseillés » (graphe rouge, figure 14). Cette étude montre de façon très convaincante que le schéma déduit de la comparaison de séquences permet la découverte de plus d’enzymes, plus actives et plus énantiosélectives. En d’autres termes la banque conçue avec les acides aminés conseillés par l’alignement de séquence est plus efficace.
|
Table des matières
Préambule Chimie verte et catalyse sélective, des enjeux d’actualité
– La réaffectation enzymatique
L’évolution dirigée d’enzymes : une approche darwinienne « Voyage » dans l’espace des séquences
La promiscuité enzymatique, un point de départ pour l’ingénierie
La génération de diversité : vers des banques de plus en plus rationnelles
Réduction de la diversité : sélection versus criblage
Conclusion
– Les métaux dans les enzymes: métalloenzymes artificielles et biohybrides
Le design de centre métallique datif
Insertion d’un cofacteur métallique au sein d’une architecture protéique: les catalyseurs biohybrides.
– Contexte scientifique de la thèse
Une architecture protéique modulaire
Construction de la banque de protéines αRep.
La structure αRep, une architecture de choix pour la conception de catalyseurs biohybrides ?
La protéine αRep-A3, un représentant particulier de la banque αRep
Choix des complexes métalliques
Bibliographie
– Résultats
– Utilisation du dimère αRep-A3
Etude structurale du complexe αRep-A3 et choix des positions
Obtention des biohybrides
Analyse biophysique des variants fonctionnalisés
Mime d’une activité RNAse par les biohybrides dérivés d’αRep A3
Etude d’une activité catalytique énantiosélective : la réaction de Diels-Alder
Analyse structurale des différents variants
Résumé de l’étude du dimère A3s
– Utilisation de la protéine αRep-A3sA3
Construction génétique codant la protéine A3sA3
Caractérisation de la protéine A3sA3
Couplage de petits ligands phénanthroline et terpyridine
Couplage de la protéine A3sA3 avec une porphyrine.
Résumé de l’utilisation des variants de A3sA3 pour le greffage d’une porphyrine
Bibliographie
– Matériel et méthodes
– Chimie
Synthèse des ligands
Synthèse des substrats et authentiques
Cristallographie du complexe Cu(II)[(phen)2(NO3)]+
– Biologie
Constructions génétiques
Obtention des protéines
– Biohybride
Couplage des cofacteurs
Caractérisation
Catalyse
– Bio-informatique
Représentations moléculaires
Modélisation de docking moléculaire
PDB-Mining des protéines binucléaires à zinc
Bibliographie
– Conclusion
– La protéine αRep A3 : une architecture prometteuse pour la génération de nouveaux biocatalyseurs hybrides
– Plasticité du dimère et dynamique entre les sous-unités
– Poursuite du projet
Vers une stratégie d’évolution dirigée basée sur A3sA3
Utilisation des αRep pour une autre stratégie : la liaison directe du métal
Utilisation d’un catalyseur commutable
Bibliographie
– Annexes
Tables cristallographiques
Article
Télécharger le rapport complet