Télécharger le fichier pdf d’un mémoire de fin d’études
Les xyloglucanes
Les xyloglucanes sont retrouvés dans toutes les espèces de plantes terrestres. Ce sont les hémicelluloses les plus abondantes (20 à 25%) dans la paroi primaire des angiospermes (tableau 1). La chaîne principale est composée de D-glucopyranoses liés en β-1,4. Les ramifications sont majoritairement constituées de résidus D-xylopyranosides liés en α-1,6. Ces résidus peuvent eux-mêmes être ramifiés par des β-D-galactopyranosides ou des L-arabinofuranosides liés en α-1,2. Les résidus β-D-galactopyranosides peuvent être ramifiés par des L-fucopyranosides liés en α-1,2. De plus, les résidus β-D-glucopyranoses peut être acétylés (figure 3A) (Scheller et Ulvskov 2010).
Les xylanes
Les xylanes sont répartis en sous-groupes possédant tous une chaîne principale de D-xylopyranoses liés en β-1,4. Ces hémicelluloses sont retrouvées dans les parois primaires et/ou secondaires de tous les végétaux (tableau 1) (Kulkarni, Shendye, et Rao 1999 ; Scheller et Ulvskov 2010). Les différents xylanes possèdent des ramifications de résidus d’acides glucuroniques liés en α-1,2- pouvant être méthylés en position 4 (Scheller et Ulvskov 2010). Les xylanes possédant majoritairement ce type de ramifications sont appelés glucuronoxylanes et sont les hémicelluloses les plus représentées dans les parois secondaires des angiospermes (figure 3B) (Scheller et Ulvskov 2010). Les autres unités osidiques composant les ramifications des xylanes sont des résidus L-arabinofuranosides liés en α-1,2 et/ou α-1,3. Ces xylanes sont alors appelés (glucurono)arabinoxylanes selon la proportion des 2 résidus branchés (figure 3C). Certains arabinoxylanes ne possèdent pas de résidus acides glucuroniques dans leurs ramifications. Le motif de branchement des décorations (notamment les résidus L-arabinofuranosides) est fonction du type de plante (Scheller et Ulvskov 2010). Ces polysaccharides sont retrouvés en grande quantité dans les parois primaires et secondaires des graminées (20 à 40 % et 40 à 50 %, respectivement) et sont aussi présents dans les parois secondaires des conifères (5 à 15 %) (tableau 1). Les xylanes sont estérifiés à différents degrés, selon le type de plante, principalement sur la position 3 des D-xylopyranoses de la chaîne principale. Les résidus L-arabinofuranosyls peuvent aussi être féruloylés sur leur carbone en position 5 (Scheller et Ulvskov 2010).
Les glucomannanes
Les (gluco)mannanes ont une chaîne principale composée uniquement de D-mannopyranoses pour les mannanes (figure 3D) ou d’une alternance de D-mannopyranoses et de D-glucopyranoses pour les glucomannanes (figure 3E) liés en β-1,4. Ces 2 types de polysaccharides sont ramifiés par des résidus D-galactopyranosides liés en α-1,6 sur les D-mannopyranoses. Les (gluco)mannanes sont souvent acétylés et sont majoritairement retrouvés dans les parois secondaires (10 à 30 % chez les conifères) (tableau 1). Ce sont les hémicelluloses principales des algues vertes (Scheller et Ulvskov 2010).
Les β-(1→3,1→4)-glucanes
Les β-(1→3,1→4)-glucanes sont des polymères de D-glucopyranoses liés en β-1,4 et en β-1,3 intercalés de façon régulière tous les 3 ou 4 D-glucopyranoses (figure 3F). Ces polysaccharides sont principalement retrouvés dans les parois primaires des graminées (2 à 15 %) (tableau 1) (Scheller et Ulvskov 2010).
Les pectines
Les pectines sont les polysaccharides les plus complexes et hétérogènes (Cosgrove 2005 ; Bashline et al. 2014). Les pectines sont une famille de polysaccharides riches en acides 11 galacturoniques liés de manière covalente sur les positions O-1 et O-4 des unités osidiques (Willats et al. 2001 ; Mohnen 2008 ; Voragen et al. 2009). Les principales pectines sont l’homogalacturonane (le plus abondant), le rhamnogalacturonane I, le rhamnogalacturonane II, l’apiogalacturonane et le xylogalacturonane. L’homogalacturonane est le seul de ces polysaccharides à être linéaire, les autres sont ramifiés par différentes unités osidiques comme présenté en figure 4. Le rhamnogalacturonane II peut s’organiser en dimères par l’intermédiaire de diesters de borate entre deux résidus apiosyl (figure 4A) ou en interagissant avec des ions calcium (Willats et al. 2001 ; Ridley, O’Neill, et Mohnen 2001 ; (Voragen et al. 2009). Les rhamnogalacturonanes I et II sont liés de façon covalente par des liaisons glycosidiques avec les autres pectines et notamment l’homogalacturonane ainsi qu’à d’autres polysaccharides de la paroi (Willats et al. 2001 ; Voragen et al. 2009). Tous ces polysaccharides sont constitués de domaines distincts liés entre eux de façon covalente (figure 4B). Les pectines sont estérifiées par des groupements acétyl (Willats et al. 2001 ; Mohnen 2008 ; Voragen et al. 2009). Comme les hémicelluloses, les pectines sont synthétisées dans l’appareil de Golgi par des glycosyltransférases membranaires puis sécrétées dans la paroi par l’intermédiaire de vésicules allant de l’appareil de Golgi à la membrane (Driouich, Faye, et Staehelin 1993 ; Mohnen 2008 ; Driouich et al. 2012).
Dégradation des polysaccharides de la paroi végétale
Valoriser la biomasse végétale, et particulièrement les hémicelluloses, est devenu un enjeu majeur de ces dernières années notamment dans le recyclage des déchets végétaux et pour la production d’énergie afin de remplacer les énergies fossiles. En effet, la biomasse lignocellulosique représente une source d’énergie renouvelable de choix car elle permettra de diminuer l’émission de gaz à effet de serre, comme le CO2 produit par l’utilisation et le transport des énergies fossiles (IPCC, climate change 2007). Cela permettra aussi de développer une indépendance énergétique sans entrer en compétition avec l’alimentation humaine et animale via l’utilisation des déchets de production alimentaire.
La première génération de biocarburant consiste en la fermentation des sucres de plantes à sucre (betterave ou canne à sucre) ou des produits de dégradation de l’amidon de céréales (blé, maïs) pour produire du biofuel. Le biodiesel est, quant à lui, produit à partir d’huiles végétales. Cependant cette première génération de biocarburant utilise des ressources alimentaires, ce qui pose problème.
La deuxième génération de biocarburant utilise la biomasse lignocellulosique. Actuellement, c’est très majoritairement la cellulose qui est utilisée pour produire de l’éthanol et pour cela il faut tout d’abord l’extraire de la paroi végétale (Himmel et al. 2007 ; Chundawat et al. 2011 ; Bornscheuer, Buchholz, et Seibel 2014 ; Várnai et al. 2014). Pour extraire la cellulose, deux grands types de traitements sont utilisés actuellement afin de rompre les liaisons qui permettent le maintien de la paroi : un traitement thermochimique ou un traitement chimique. Le traitement thermochimique se fait à haute température (140-200 °C) sous pression. Le traitement chimique peut se faire en conditions acide ou basique avec l’utilisation d’acide sulfurique, de soude ou d’ammoniac principalement (Himmel et al. 2007 ; Várnai et al. 2014).
Ces traitements sont polluants et coûteux en énergie il est donc nécessaire de développer l’utilisation de catalyseurs afin de diminuer l’impact des prétraitements sur l’environnement. Pour cela, les chercheurs s’intéressent aux enzymes permettant de catalyser la dégradation de la biomasse végétale.
La base de données CAZy
Toutes les enzymes impliquées dans la dégradation, la biosynthèse et la modification des oligosaccharides, des polysaccharides et des glycoconjugués sont référencées dans la base de données CAZy (Carbohydrate Active enZymes) (« CAZy – Home » 2016). Toutes les enzymes référencées dans la base de données CAZy sont appelées CAZymes (Lombard et al. 2014). Les CAZymes sont des enzymes potentiellement modulaires, actives sur les glucides et divisées en 5 classes :
o Les glycosides hydrolases (GH) qui hydrolysent les liaisons glycosidiques et/ou ajoutent des unités osidiques en bout de chaîne (transglycosylation) (Henrissat et Davies 1997),
o Les glycosyl transférases (GT) qui sont les principales enzymes responsables de la synthèse de glycosides (Coutinho et al. 2003),
o Les polysaccharides lyases (PL) qui réalisent des coupures des liaisons glycosidiques par β-élimination (Lombard et al. 2010),
o Les carbohydrate estérases (CE) qui catalysent des N- et O-déacétylations sur les sucres estérifiés (Jayani, Saxena, et Gupta 2005),
o Les enzymes ayant des activités auxiliaires (AA) qui sont toutes les enzymes ayant des activités d’oxydo-réduction et qui agissent de façon conjuguée avec d’autres CAZymes (Levasseur et al. 2013a).
A l’intérieur de chacune de ces classes, les CAZymes sont réparties en familles et sous-familles basées sur la similarité de séquence. L’appartenance à une famille corrèle avec un repliement et un mécanisme catalytique identiques. Cependant, des spécificités variées de substrats et de produits sont retrouvées au sein d’une même famille. Le terme module sera utilisé pour parler de la totalité ou d’une partie d’une séquence protéique possédant une activité catalytique ou étant capable de se lier sur un polysaccharide. Une protéine peut se composer d’un seul module ou posséder plusieurs modules ayant des activités ou fonctions similaires ou différentes.
Les glycosides hydrolases
Les glycosides hydrolases (GH) hydrolysent les liaisons glycosidiques et sont réparties en 135 familles, à ce jour, dans la base de données CAZy (Cantarel et al. 2009). Certaines de ces 16 familles sont regroupées en clans en fonction de leur structure 3D et de leur mécanisme (tableau 2) (Henrissat et Bairoch 1996). Il s’agit d’un niveau de classification supérieur à celui ne concernant que la séquence où le lien structure/fonction est établi. Très souvent les acides aminés catalytiques sont conservés dans un même clan. Le clan des GH-A est celui qui contient le plus grand nombre de familles. Les structures retrouvées dans tous les clans sont représentées figure 6.
Carbohydrate estérases (CE)
Les carbohydrate estérases ont pour fonction d’éliminer les estérifications qui pourraient gêner l’action des glycosides hydrolases. Les CE catalysent les O ou N-desestérifications de polysaccharides. On considère deux classes de substrats : ceux dont le sucre joue le rôle d’acide et ceux dont le sucre joue le rôle d’alcool. Dans la base de données CAZy, il existe 16 familles de CE et les enzymes y sont réparties en fonction de la similarité de séquence (Cantarel et al. 2009). Toutes les CE d’une même famille ont le même repliement. Le motif catalytique le plus retrouvé est constitué de la triade Sérine-Histidine-Aspartate. Le site catalytique des CE est lui aussi divisé en sous-sites catalytiques. La fonction ester à hydrolyser est située dans le sous-site 0. L’extrémité réductrice de l’oligo- ou du polysaccharide est du côté des sous-sites positifs et l’extrémité non réductrice du côté des sous-sites négatifs (figure 10) (Biely 2012).
Figure 10 : Schéma montrant l’action d’une acétylxylane estérase. A. Hydrolyse d’un groupement acétyl en milieu de chaîne. L’hydrolyse se fait dans le sous-site 0 et est symbolisée par les flèches. Hydrolyse du groupement acétyl d’un 2-O-acetyl-4-nitrophenyl β-D-xylopyranoside (en haut) et du groupement acétyle d’un actéylglucuronoxylane (en bas). B. Hydrolyse d’un groupement acétyle en bout de chaîne. Le substrat est un xylotriose acétylé en position 4 (en haut) ou un acide aldotétra-uronique (en bas) (Biely 2012).
Les structures 3D retrouvées présentent des repliements de type (α/β/α) sandwich, tonneau (β/α)7, hélice β, tonneau (β/α)8, sandwich à 2 couches, ou de type α/β (figure 11) (Biely 2012).
Figure 11 : Repliements des Carbohydrate Esterases : (α/β/α) sandwich (A), tonneau (β/α)7 (B), hélice β (C), tonneau (β/α)8 (D), sandwich à deux couches (E), repliement α/β (F) et les structures caractéristiques des CE2 (G) et 15 (H) qui n’ont pas de nom. Les structures illustrant les repliements caractéristiques des CE sont les structures A) d’une mycolyltransférase de Mycobacterium tuberculosis appartenant à la famille CE1 (code pdb 1R88), B) d’une peptidoglycane déacétylase de Ammonifex degensii appartenant à la famille CE4 (code pdb 4WCJ), C) d’une pectine methylestérase de Escherichia coli appartenant à la famille CE8 (code pdb 3GRH), D) d’une N-acétylglucosamine déacétylase de Escherichia coli appartenant à la famille CE9 (code pdb 1YRR), E) d’une N-acétylglucosamine déacétylase de Aquifex aeolicus appartenant à la famille CE11 (code pdb 1BHE), F) d’une diacylchitobiose déacétylase de Pyrococcus horikoshii appartenant à la famille de CE14 (code pdb 3WE7), G) d’une acétylxylane estérase de Cellvibrio japonicus appartenant à la famille de CE2 (code pdb 2WAA) et H) d’une méthylglucuronyl transférase de Thermothelomyces thermophila appartenant à la famille de CE15 (code pdb 4G4G). Les hélices α sont représentées en rouge, les feuillets β en jaune et les boucles en vert.
Enzymes à activité auxiliaire (AA)
Cette classe d’enzymes, créée plus récemment, regroupe les enzymes qui catalysent des réactions d’oxydo-réduction ou des réactions radicalaires et sont réparties en 16 familles à ce jour. Parmi les activités retrouvées au sein des AA, un type d’activité est particulièrement étudié ces dernières années car il permet la dégradation de polysaccharides récalcitrants tels que la cellulose et la chitine (Vaaje-Kolstad et al. 2010 ; Forsberg et al. 2011). Il s’agit des « lytic polysaccharide mono-oxygénases » (LPMO) qui sont classées dans les familles d’AA 9 et 10. Ces enzymes sont impliquées dans la dégradation de la cellulose et de la chitine cristalline (Vaaje-Kolstad et al. 2010 ; Forsberg et al. 2011).
Les LPMO de la famille AA9 sont des polysaccharides mono-oxygénases dépendantes du cuivre. Elles possèdent 2 résidus histidine impliqués dans un centre-cuivre de type 2 qui consiste en un atome de cuivre maintenu par 4 liaisons de coordination sur un même plan par trois azotes de deux histidines (figure 12A) et l’oxygène d’une molécule d’eau (Pujol 2010 ; Frandsen et al. 2016). L’histidine N-terminale impliquée dans la coordination du cuivre est méthylée (sur l’azote du cycle imidazole ne participant pas à la coordination du cuivre, figure 12A) mais le rôle de cette méthylation reste encore inconnu (Li et al. 2012). Le clivage oxydatif de la cellulose, catalysé par les AA9, nécessite la présence d’agents réducteurs. La réaction se fait par oxydation du carbone anomérique du D-glucopyranose mais peut aussi avoir lieu sur les carbones 4 et 6. Les LPMO de la famille AA9 ont principalement été identifiées dans des génomes de champignons (figure 12A) (Westereng et al. 2011 ; Quinlan et al. 2011 ; Levasseur et al. 2013a ; Frandsen et al. 2016).
Les LPMO de la famille AA10 sont aussi des mono-oxygénases dépendantes du cuivre qui utilisent une molécule de dioxygène et des histidines mais, contrairement aux AA9, oscillent entre un centre cuivre I où la coordination du cuivre est sous forme trigonale et un centre cuivre II où la coordination du cuivre est plane (Forsberg et al. 2016). Le clivage de cellulose ou de chitine cristalline par des LPMO de la famille AA10 produit des acides aldoniques.
Contrairement aux enzymes de la famille AA9, les LPMO de la famille AA10 n’ont qu’un seul résidu histidine conservé, situé du côté de l’extrémité N-terminale de la protéine. Ce résidu est aussi impliqué dans le maintien de l’atome de cuivre (Forsberg et al. 2016). Les AA10 ne sont pas spécifiques d’un règne mais sont particulièrement retrouvées chez les bactéries (figure 12B) (Aachmann et al. 2012 ; Levasseur et al. 2013a ; Wu et al. 2013 ; Forsberg et al. 2016).
Les enzymes de ces 2 familles sont souvent multimodulaires. Les AA9 sont retrouvées associées à des CBM1 et 18, tandis que les AA10 sont associées à des CBM2, 5, 10 et 12 (Levasseur et al. 2013a).
Figure 12 : Structures de LPMO des familles AA9 (A) et AA10 (B) avec les zooms respectifs sur la
coordination du cuivre. Les structures illustrant les repliements caractéristiques des LPMO sont les structures A) d’une LPMO de Lentinus similis appartenant à la famille AA9 (code pdb 5ACH) et B) d’une LPMO de Cellvibrio japonicus appartenant à la famille AA10 (code pdb 5FJQ). Les hélices α sont représentées en rouge, les brins β en jaune et les boucles en vert. L’ion cuivre II est représenté par une sphère cyan en (A) et l’ion cuivre I en orange en (B) (Frandsen et al. 2016).
Modules de liaison aux glucides (CBM)
Les CBM (Carbohydrate Binding Module) sont des modules généralement associés aux GH qui dégradent des substrats difficilement accessibles. Ils permettent à l’enzyme de se fixer au substrat, d’augmenter la concentration de substrat autour de l’enzyme et ainsi d’accroître de deux à cinq fois leur activité (Guillén, Sánchez, et Rodríguez-Sanoja 2009 ; Cuskin et al. 2012). Certains CBM ont la capacité de pouvoir perturber l’organisation et les propriétés physico-chimiques de certains polysaccharides (Guillén, Sánchez, et Rodríguez-Sanoja 2009). Par exemple, certains CBM sont capables de diminuer la cristallinité de la cellulose en modifiant le réseau de liaisons hydrogène qui maintiennent la cellulose ce qui va faciliter l’action des GH (Guillén, Sánchez, et Rodríguez-Sanoja 2009 ; Kang et al. 2013). Tout comme les GH, les CBM sont classés en familles en fonction de leur séquence en acides aminés. Il existe à ce jour 81 familles de CBM. Différents repliements sont retrouvés comme illustré sur la figure 13 (Boraston et al. 2004 ; Guillén, Sánchez, et Rodríguez-Sanoja 2009). Les CBM ne présentant pas d’activité catalytique propre sont très souvent associés à un domaine catalytique, principalement des GH. Les séquences codant les CBM sont présents isolés ou en tandem sur des fragments d’ADN comme dans le cas des CBM impliqués dans les cellulosomes (complexes multienzymatiques ancrés à la surface des bactéries qui les produisent, permettant d’avoir une grande concentration de protéines caractérisées principalement pour l’hydrolyse de la cellulose, détaillé en section IV. B.) (Bayer et al. 2004 ; Flint et al. 2008 ; Cantarel et al. 2009).
Les endo-β-1,4-xylanases
Les GH10
Les GH10 sont principalement des endo-β-1,4-xylanases (figure 14, flèche en vert foncé). Toutes les enzymes de cette famille présentent un repliement en tonneau (β/α)8 caractéristique du clan GH-A (figures 6A et 15A). Les GH10 ont un mécanisme d’action avec rétention de la configuration (Henrissat et Davies 1997). Les résidus catalytiques sont deux acides glutamiques, l’un jouant le rôle d’acide/base et l’autre de nucléophile, et sont localisés près de l’extrémité C-terminale des brins β4 et β7 (Jenkins et al. 1995). Le site catalytique est un sillon ouvert dans lequel se trouvent 4 à 7 sous-sites catalytiques (5 ou 6 le plus souvent) (figure 15B) (Pell et al. 2004 ; Alvarez, Goldbeck, dos Santos, et al. 2013). Les sous-sites -2, -1 et +1 sont les plus conservés. Le sous-site -2 présente une très forte affinité pour les D-xyloses ainsi que pour les groupements féruloyl (Vardakou et al. 2005). Du côté réducteur, le polysaccharide est maintenu principalement par des interactions de van der Waals s’établissant entre le polysaccharide et des résidus aromatiques tels que des tryptophanes. Du côté non-réducteur, il est maintenu par des liaisons hydrogène s’établissant avec des acides glutamiques et aspartiques, des histidines, des asparagines, des lysines et des tryptophanes (figure 15C et D). Les résidus impliqués dans la fixation et le maintien du substrat sont eux aussi très conservés (Alvarez, Goldbeck, dos Santos, et al. 2013). Les substrats accommodés peuvent être des xylanes aussi bien linéaires que ramifiés ou des xylooligosaccharides. De plus, de nombreuses GH10 sont associées à des CBM et leur caractérisation montre un effet important de la présence des CBM dans l’activité enzymatique (Pollet, Delcour, et Courtin 2010).
B. Zoom sur le site catalytique. Superposition des résidus impliqués dans le maintien du substrat de 2 GH10 dans les sous-sites négatifs (C) et positifs (D). Les structures illustrant les sous-sites proviennent de xylanases du métagénome de sol de canne à sucre et de Cellvibrio mixtus appartenant à la famille GH10 (codes pdb 4K68 et 1QUY) (Alvarez, Goldbeck, dos Santos, et al. 2013).
L’autre principale famille de xylanases est la famille des GH11.
Les GH11
Les GH11 qui ont été caractérisées sont, contrairement aux GH10, presque exclusivement des endo-β-1,4-xylanases qui sont souvent séparées en 2 catégories, les xylanases acides et les xylanases basiques, en fonction de leur pH optimal (autour de pH 2 et pH 11 respectivement) (Joshi et al. 2000 ; Sapag et al. 2002 ; Pollet, Delcour, et Courtin 2010). Elles appartiennent au clan GH-C et adoptent un repliement en β-jelly roll caractéristique de ce clan. Leur repliement est assimilable à la forme d’une main droite, la paume formée par la partie vrillée du feuillet β et l’hélice α, le pouce formé par boucle entre les brins β7 et β 8 et les doigts formés par les boucles connectant les brins β faisant face au pouce (figures 6B et 16A) (Henrissat et Davies 1997 ; Paës et al. 2007 ; Lammerts van Bueren et al. 2012). Ces enzymes fonctionnent avec un mécanisme de rétention de la configuration absolue du carbone anomérique pour hydrolyser leurs substrats. Les résidus catalytiques sont 2 acides glutamiques, l’un jouant le rôle d’acide/base et l’autre de nucléophile (Henrissat et Davies 1997 ; Gruber et al. 1998). Les résidus catalytiques sont situés dans la partie creuse de la paume. Les résidus autour du nucléophile sont plus conservés que ceux autour de l’acide/base. Les sous-sites catalytiques sont au nombre de 5 ou 6 et sont très conservés (figure 16B). Les résidus D-xylosides sont particulièrement bien fixés dans les sous-sites -2, -1 et +1, alors que dans les autres sous-sites, le maintien des résidus est plus lâche (Gruber et al. 1998 ; Pollet et al. 2010). Dans le sous-site -2, les résidus sont stabilisés par des liaisons hydrogène notamment avec une tyrosine. Les résidus d’acides aminés du pouce participent au maintien de la partie non-réductrice du polysaccharide. Le maintien du substrat peut aussi se faire via les groupements féruloyles accommodés dans les sous-sites – 3 et +2 (Vardakou et al. 2008 ; Pollet, Delcour, et Courtin 2010). La position de la boucle constituant le pouce détermine la largeur de la poche catalytique (Paës et al. 2007 ; Paës, Berrin, et Beaugrand 2012 ; Song et al. 2014).
Figure 16 : A. Représentation en cartoon en présence d’un substrat d’une GH11. B. Représentation des sous-sites catalytiques. La structure illustrant les sous-sites provient d’une xylanase de Bacillus subtilis appartenant à la famille GH11 (code pdb 2QZ3). Le substrat, un xylotriose, est représenté en jaune (Pollet et al. 2010).
Les β-xylosidases
Les xylosidases sont décrites dans les familles GH 3, 30, 39, 43, 52 et 120. Les GH39 appartiennent au clan des GH-A et comme toutes les enzymes de ce clan, elles adoptent un repliement caractéristique en tonneau (β/α)8. Ce sont majoritairement des β-xylosidases (figure 14 flèches en vert clair), toutefois on retrouve dans cette famille quelques α-L-iduronidases. Les enzymes de la famille GH39 ont un mécanisme d’action avec rétention de configuration absolue du carbone anomérique et les résidus catalytiques sont deux acides glutamiques, l’un jouant le rôle d’acide/base et l’autre de nucléophile (Henrissat et Davies 1997). Les GH39 libèrent du D-xylopyranose à partir de xylooligosaccharides, d’arabinoxylooligosaccharides ou d’arabinoxylane (Czjzek et al. 2005 ; Lagaert et al. 2014). Par contre, ces enzymes ne présentent qu’une très faible activité hydrolytique sur du xylobiose (Adelsberger et al. 2004 ; Wagschal et al. 2005). En revanche, le mécanisme catalytique de rétention de la configuration absolue du carbone anomérique par double inversion, confère une activité transglycosidase aux enzymes de cette famille. Elles sont donc capables de former du xylobiose ou du xylotriose à partir de xyloses (Smaali, Rémond, et O’Donohue 2006 ; Muzard et al. 2009). Les GH39 possèdent 3 domaines structuraux 33 distincts, mais à ce jour seul le domaine catalytique a été caractérisé. Le site catalytique contient au moins 3 sous-sites (+2, +1 et -1) (figure 17) (Czjzek et al. 2005).
Figure 17 : Représentation en cartoon (A) et en surface (B) d’une GH39 en présence de son substrat. La structure illustrant les sous-sites provient d’une β-xylosidase de Geobacillus stearothermophilus appartenant à la famille GH39 (code pdb 2BFG). Les hélices α sont représentées en rouge, les brins β en jaune et les boucles en vert. Le substrat, un dinitrophényl β-xyloside, est représenté en bleu. Représentation des acides aminés impliqués dans la réaction, vue avec l’intermédiaire covalent xylosyl-enzyme (C). Les interactions sont représentées par des pointillés (Czjzek et al. 2005).
Pour dégrader totalement un arabinoxylane il faut retirer les ramifications qui, par ailleurs, peuvent gêner l’activité des endo-β-1,4-xylanases et des β-xylosidases. Cela nécessite l’action conjointe d’α-L-arabinofuranosidases (GH3, 43, 51, 54, 62) qui vont être spécifiques ou non des liaisons α-1,2 ou α-1,3 (figure 14, flèches bleues foncées et bleues claires respectivement) et d’α-glucuronidases (GH4, 67 et 115) (figure 14, flèches en orange). Les 2 familles d’α-L-arabinofuranosidases les mieux caractérisées sont les GH43 et 51. Les 2 principales familles d’α-glucuronidases sont les GH67 et 115. Cette dernière famille hydrolyse les acides 4-O-méthyl α-glucuroniques.
Les α-L-arabinofuranosidases
Les GH43
Les GH43 sont principalement des α-L-arabinofuranosidases mais on retrouve aussi des β-xylosidases dans cette famille. Beaucoup d’enzymes de cette famille sont bi-fonctionnelles et possèdent ces 2 activités (Lagaert et al. 2014). Les GH43 appartiennent au clan GH-F et adoptent le repliement en 5-fold β-propeller (Henrissat et Davies 1997). La famille des GH43 est divisée en 37 sous-familles à ce jour (Mewis et al. 2016). Ces enzymes hydrolysent principalement les L-arabinofuranosides liés en α-1,2 (figure 14, flèches en bleu foncé) ou les doubles substitutions (L-arabinofuranosides liés en α-1,2 et en α-1,3) (figure 14, flèches en bleu foncé et bleu clair respectivement) (Cartmell et al. 2011a). Ces enzymes ont un mécanisme d’action avec inversion de la configuration du carbone anomérique. Les résidus catalytiques sont un acide aspartique qui joue le rôle de nucléophile/base et un acide glutamique qui joue le rôle de donneur de protons (Davies et Henrissat 1995). Trois résidus sont parfaitement conservés au sein de la famille des GH43, il s’agit de deux acides aspartiques et d’un acide glutamique. Un des acides aspartiques joue le rôle de modulateur de pKa de l’acide catalytique pour maintenir une valeur élevée de pKa de ce dernier (Cartmell et al. 2011a ; McKee et al. 2012). Les deux autres résidus conservés sont les résidus catalytiques. Les GH43 libèrent du L-arabinose à partir d’arabinoxylane, d’arabinane et d’arabinooligosaccharides et du D-xylose à partir de xylane et de xylooligosaccharides. Le site catalytique des GH43 possède jusqu’à 7 sous-sites (-1, +1, +2NR*, +2NR, +3NR, +2R et +3R). Le maintien du substrat se fait majoritairement par des interactions de van der Waals avec des résidus tels que des tryptophanes ou des phénylalanines et par des liaisons hydrogène avec des tyrosines ou des histidines (figure 18). Enfin, les GH43 sont très souvent associées à un CBM (Cartmell et al. 2011a ; McKee et al. 2012 ; Lagaert et al. 2014 ; Mewis et al. 2016).
Figure 18 : Représentation en cartoon (A) et en surface (B) d’une GH43 en présence de son substrat. La structure illustrant les sous-sites provient d’une α-L-arabinofuranosidase de Humicola insolens appartenant à la famille GH43 (code pdb 3ZXK). Les hélices α sont représentées en rouge, les feuillets β en jaune et les boucles en vert. Le substrat, un xylopentaose doublement substitué par des L-arabinofuranosides en α-1,2 et α-1,3 (XXA2+3XX), est représenté en bleu. C : Représentation des acides aminés impliqués dans la réaction. Les interactions sont représentées par des pointillés. La carte de densité 2mFobs-DFcalc est montrée autour du substrat. D. Zoom sur le site catalytique. E. Représentation des sous-sites catalytiques. Les D-xylosides sont en bleu, le résidu L-arabinofuranoside lié en α-1,3- est en jaune, le résidu L-arabinofuranoside lié en α-1,2 est en orange et les résidus d’acides aminés impliqués dans le maintien du substrat (McKee et al. 2012) sont en vert.
Parmi les différentes familles d’α-L-arabinofuranosidases citées précédemment, une autre est bien caractérisée, la famille des GH51.
Les GH51
Les GH51 sont très majoritairement des α-L-arabinofuranosidases mais on retrouve quelques endo-glucanases également. Cette famille de GH appartient au clan GH-A. Les enzymes de la famille GH51 adoptent donc un repliement en tonneau (β/α)8. En plus du domaine catalytique, un domaine supplémentaire en β-sandwich est très conservé, bien que son rôle ne soit pas encore connu. Les acides aminés catalytiques sont deux acides glutamiques, l’un jouant le rôle d’acide/base et l’autre de nucléophile et ces enzymes agissent avec un mécanisme de rétention de configuration absolue du carbone anomérique (Davies et Henrissat 1995). Les α-L-arabinofuranosidases de cette famille libèrent des α-L-arabinoses à partir d’arabinoxylanes, d’arabinoxylooligosaccharides, arabinane et arabinooligosaccharides. Les GH51 sont actives spécifiquement sur les substitutions en α-1,2 ou α-1,3 (figure 14 flèches bleu foncé et bleu clair respectivement) et sont rarement actives sur les doubles substitutions. Le site catalytique comporte jusqu’à 5 sous-sites (-1, +1, +2, +2’ et +3). De nombreux tryptophanes sont impliqués dans le maintien de la chaîne principale du substrat. Des liaisons hydrogène faites par des asparagines, des tyrosines, des acides aspartiques et glutamiques sont aussi impliquées dans la liaison au sucre (figure 19) (Taylor et al. 2006 ; Paës et al. 2008 ; Lagaert et al. 2014).
Figure 19 : Représentation en cartoon (A) et en surface (B) d’une GH51 en présence de son substrat, un XA3XX. La structure illustrant les sous-sites provient d’une α-L-arabinofuranosidase de Thermobacillus xylanilyticus appartenant à la famille GH51 (code pdb 2VRQ). Les hélices α sont représentées en rouge, les brins β en jaune et les boucles en vert. Le substrat est représenté en bleu. C : Représentation des résidus impliqués dans la réaction. Les liaisons hydrogène sont représentées par des pointillés (Paës et al. 2008).
Les α-glucuronidases
Les GH67
Les GH67 sont des α-glucuronidases (figure 14, flèches en orange). Cette famille n’est assignée à aucun clan. Les GH67 ont un repliement du domaine catalytique en tonneau (β/α)8, un autre domaine est présent mais sa fonction n’est pas encore connue. Deux acides glutamiques et un acide aspartique sont très conservés, un des acides glutamiques est l’acide/base. Les 2 autres résidus semblent être de bons candidats pour activer une molécule d’eau et l’un des deux serait donc le nucléophile qui n’a pas encore été identifié. Des résidus arginine, valine et tryptophane semblent être impliqués dans le maintien du substrat (figure 20) (Nurizzo et al. 2002 ; Golan et al. 2004). Les enzymes de cette famille ont un mécanisme d’inversion de la configuration absolue du carbone anomérique (Davies et Henrissat 1995). Toutes les enzymes de cette famille qui ont été caractérisées libèrent un 4-O-méthyl-glucuronate à partir d’oligosaccharides ramifiés par des 4-O-méthyl-glucuronate et n’ont pas d’activité sur polysaccharide. Les polysaccharides doivent donc être traités par d’autres enzymes au préalable pour que les GH67 puissent agir (Nurizzo et al. 2002 ; Golan et al. 2004).
Figure 20 : Représentation en cartoon (A) et en surface (B) d’une GH67 en présence de son substrat. La structure illustrant les sous-sites provient d’une α-glucuronidase de Geobacillus stearothermophilus appartenant à la famille GH67 (code pdb 2VRQ). Les hélices α sont représentées en rouge, les brins β en jaune et les boucles en vert. Le substrat est représenté en bleu.
Représentation des acides aminés impliqués dans la réaction en présence du substrat (C) et des produits d’hydrolyse (D). Les interactions sont représentées par des pointillés. Le substrat est représenté en jaune et les résidus de la protéine en vert (Golan et al. 2004).
Les GH115
Les GH115 sont, comme les GH67, des α-glucuronidases (figure 14 flèches orange). Cette famille n’est assignée à aucun clan. Les GH115 ont un repliement en tonneau (β/α)8 (figure 21). Ni le résidu nucléophile, ni le résidu acide/base n’ont été identifiés à ce jour (Rogowski et al. 2014 ; Wang et al. 2016). Les enzymes de cette famille ont un mécanisme d’inversion de la configuration absolue du carbone anomérique (Davies et Henrissat 1995). Des études biochimiques laissent penser que le site catalytique de ces enzymes possèderait au moins 5 sous-sites (-1, +1, +2R, +2NR, +3R) (Rogowski et al. 2014 ; Wang et al. 2016). Les GH115 possèdent 3 domaines supplémentaires dont un en β-sandwich et un en hélice α (entourés en rouge et en orange respectivement sur la figure 21). Certains résidus ont été montrés comme étant essentiels pour l’activité, ce sont les acides glutamiques 162 et 375 et les acides aspartiques 192, 206, 332 et 478 ainsi que l’arginine 328, les tryptophanes 169, 245 et 249, la tyrosine 420 et l’histidine 422 dans le cas de l’α-glucuronidase de Bacteroides ovatus BoAgu115A (Rogowski et al. 2014). Toutes les enzymes de cette famille qui ont été caractérisées libèrent un 4-O-méthyl-glucuronate à partir de xylooligosaccharides ramifiés par des 4-O-méthyl-glucuronates et n’ont pas d’activité sur polysaccharides comme les GH67. Les enzymes de cette famille nécessitent donc l’action préalable d’endo-xylanases (Sunna et Antranikian 1997 ; Rogowski et al. 2014 ; Wang et al. 2016).
Les systèmes de dégradation de la biomasse végétale, des réservoirs naturels d’enzymes
Le microbiote intestinal humain
L’Homme est omnivore et lors de la consommation de végétaux nécessaires à sa santé, il ne possède pas le bagage enzymatique permettant de dégrader les polysaccharides des parois végétales. Pour l’aider, il possède un microbiote produisant des enzymes capables de les dégrader. Les principaux embranchements bactériens retrouvés dans le microbiote humain sont les Bacteroidetes, les Firmicutes et les Actinobactéries. Les deux premiers embranchements cités représentent 90% des bactéries du microbiote (Eckburg et al. 2005 ; Ley, Peterson, et Gordon 2006 ; Flint et al. 2008). La plupart des bactéries de l’intestin sont actives sur polysaccharides isolés. Très peu sont actives directement sur la paroi végétale (Flint et al. 2008). Les bactéries cellulolytiques (peu de Bacteroidetes et beaucoup de Firmicutes) se fixent sur les parois végétales et les dégradent (Walker, A. W. 2006). Les produits d’hydrolyse et les polysaccharides ainsi libérés sont ensuite dégradés par les autres bactéries de l’intestin (Walker, A. W. 2006).
Bacteroides thetaiotaomicron est la bactérie la plus étudiée du microbiote intestinal humain et appartient à l’embranchement le plus abondant de celui-ci (Xu et al. 2003 ; Bjursell, Martens, et Gordon 2006 ; Flint et al. 2008 ; Koropatkin, Cameron, et Martens 2012). C’est une bactérie Gram- appartenant à l’embranchement des Bacteroidetes. C’est une des bactéries qui possède le plus de GH parmi les bactéries dont le génome a été séquencé. Le génome de B. thetaiotaomicron code 226 GH et 15 PL. 61% de ces GH sont dans le périplasme, la membrane externe ou sont extracellulaires. Ces bactéries sont réparties en différents endroits de l’intestin appelés niches et se nourrissent des glucanes de la paroi des cellules intestinales ainsi que des polysaccharides de notre alimentation. Cette bactérie est connue pour dégrader un grand nombre de polysaccharides ce qui fait qu’elle participe à la digestion d’une grande partie de notre alimentation (Xu et al. 2003 ; Bjursell, Martens, et Gordon 2006 ; Flint et al. 2008 ; Koropatkin, Cameron, et Martens 2012). Afin de dégrader les polysaccharides, B. thetaiotaomicron possède dans son génome des groupes de gènes. Le groupe de gènes le mieux caractérisé est le système Sus (Starch utilisation system), qui est un système de dégradation de l’amidon. Ce groupe de gènes contient 8 gènes susR, A, B, C, D, E, F et G. Les produits des gènes susC, D, E, F et G sont des protéines qui sont situées sur la membrane externe de la bactérie. SusC est transmembranaire et les 4 autres sont exposées à l’extérieur et liées à la membrane externe par une ancre N-acyl-S-diacylglyceryl liée de façon covalente à une cystéine de l’extrémité N-terminale de la protéine (Bos, Robert, et Tommassen 2007). Ces 5 enzymes sont responsables de la reconnaissance spécifique de l’amidon et de sa dégradation en oligosaccharides. SusC assure le transport des oligosaccharides de l’extérieur de la cellule vers le périplasme (figure 23). Les protéines SusA et SusB sont situées dans le périplasme et sont responsables de la dégradation en monosaccharides et en disaccharides, des oligosaccharides qui sont entrés dans le périplasme. Les mono et disaccharides ainsi obtenus sont internalisés dans la cellule afin d’être utilisés dans le métabolisme de la bactérie (figure 23). Enfin SusR est un senseur/régulateur situé dans la membrane plasmique qui fixe les mono et disaccharides issus de la dégradation de l’amidon du côté du périplasme, ce qui provoque l’activation de la transcription des autres protéines Sus (figure 23) (D’Elia et Salyers 1996).
D’autres systèmes de ce type ont été retrouvés pour la dégradation d’autres polysaccharides, ils sont appelés systèmes Sus like (Martens et al. 2009 ; Martens et al. 2011 ; Bolam et Koropatkin 2012). Ces systèmes ont été trouvés dans des Bacteroidetes et sont actifs sur gomme guar (additif alimentaire principalement composée de galactomannane) (Valentine, Arnold, et Salyers 1992), sur cellulose (Xie et al. 2007) ou encore sur arabinane (Arnal 2014).
La métagénomique fonctionnelle
Dans l’équipe Catalyse et Ingénierie Moléculaire Enzymatiques (CIMEs) du LISBP, la métagénomique fonctionnelle est effectuée avec un criblage fonctionnel à haut débit. L’idée ici, est de prélever l’ADN total d’un écosystème dédié à la dégradation de la lignocellulose. Cet ADN est ensuite purifié puis fragmenté. Les fragments d’ADN sont ensuite purifiés par électrophorèse en champ pulsé. Après cette étape, des fragments de grande taille sont récupérés et sont sous-clonés dans des fosmides. Des bactéries E. coli sont transformées avec les fosmides ce qui permet la création de banques métagénomiques (figure 26A) (Tasse et al. 2010 ; Bastien-Uluis 2012 ; Heux et al. 2015).
Une fois créées, les banques sont criblées directement avec des substrats chromogéniques. Dans l’équipe CIMEs, les substrats utilisés sont des substrats indolylés synthétisés par le Dr. Régis Fauré ou des AZO- et AZCl-polysaccharides commerciaux. Les substrats indolylés vont mimer des di ou tri-saccharides et être internalisés dans les bactéries, si la colonie possède l’activité pour dégrader le substrat celle-ci va se colorer (figure 26B). Si des colonies ont des activités pour dégrader les AZO- et AZCl-polysaccharides, il y aura apparition d’un halo coloré autour des colonies (figure 26C). Les clones positifs sont ensuite séquencés et annotés (Tasse et al. 2010 ; Bastien-Uluis 2012 ; Heux et al. 2015).
Figure 26 : A. Schéma général des étapes de la métagénomique fonctionnelle. B. Crible fonctionnel
d’une banque métagénomique par des substrats indolylés : le 5-bromo-3-indolyl β-D-xylopyranoside en bleu foncé et le 5-bromo-4-chloro-3-indolyl-α-L-arabinofuranoside en bleu clair.
Cette méthode permet de cribler rapidement un grand nombre de substrats et a permis de découvrir des enzymes fonctionnelles sur un ou plusieurs des substrats testés. Dans un deuxième temps, l’annotation permet d’identifier un très grand nombre d’enzymes putatives qui peuvent être ensuite étudiées (Li et al. 2011 ; Bastien et al. 2013 ; Heux et al. 2015).
Les inconvénients de cette méthode sont qu’il est possible de négliger certaines activités qui ne sont pas criblées au départ car « on ne trouve que ce que l’on cherche » (Heux et al. 2015). D’autre part, comme les banques sont créées dans des bactéries, certaines enzymes eucaryotes peuvent ne pas être produites ou être non fonctionnelles du fait de l’absence de modifications post-traductionnelles, dès lors elles ne seront pas identifiées lors du crible fonctionnel. Enfin, il est parfois difficile de parvenir à une annotation taxonomique poussée et donc de déterminer de quels organismes proviennent les enzymes identifiées.
La métagénomique
La métagénomique permet l’étude d’un écosystème entier. Les étapes sont les mêmes que pour la métagénomique fonctionnelle sauf la dernière. En effet une fois les banques créées il n’y a pas d’étape de criblage fonctionnel mais directement un séquençage de celles-ci. Il peut y avoir alors une annotation fonctionnelle des gènes codant des enzymes présents dans le métagénome et une annotation taxonomique (Thomas, Gilbert, et Meyer 2012).
La métagénomique 16S
Cette méthode permet l’étude taxonomique d’un écosystème entier. Il ne s’agit pas de prélever l’ADN total mais les ARN ribosomaux 16S. Ces ARN possèdent des régions variables entre taxons mais conservées au sein d’un taxon. Ces régions sont encadrées par des régions flanquantes très conservées qui ont permis de dessiner des amorces générales pour la PCR (Claesson et al. 2009). Cette méthode permet de cribler à haut débit l’écosystème choisi. L’ADN total est extrait. Des PCR sont réalisées avec les amorces citées ci-dessus afin de n’amplifier que les ADN codant les ARNr 16S, appelés ADNr. Ces ADNr sont alors purifiés sur gel et les bandes d’intérêt sont excisées pour générer une banque d’amplicon de taille voulue. Les ADNr sont quantifiés par qPCR et enfin séquencés par séquençage 454 ou illumina. Comme les régions choisies pour créer les amorces sont spécifiques d’un taxon il est donc possible, après le séquençage, de faire des alignements de la séquence d’intérêt contre celles déposées dans différentes bases de données et à partir des résultats de réaliser des annotations taxonomiques (figure 27) (Hall et al. 2008 ; Schloss et al. 2009 ; Engelbrektson et al. 2010 ; Kozich et al. 2013 ; Razzauti et al. 2015).
|
Table des matières
oduction générale
I. Préambule
II. La paroi végétale et ses constituants
A. La paroi végétale
B. La cellulose
C. Les hémicelluloses
1. Les xyloglucanes
2. Les xylanes
3. Les glucomannanes
4. Les β-(1→3,1→4)-glucanes
D. Les pectines
E. La lignine
III. Dégradation des polysaccharides de la paroi végétale
A. La base de données CAZy
B. Les glycosides hydrolases
C. Carbohydrate estérases (CE)
D. Enzymes à activité auxiliaire (AA)
E. Modules de liaison aux glucides (CBM)
F. Exemple de la dégradation totale d’un arabinoxylane
3. Les α-L-arabinofuranosidases
4. Les α-glucuronidases
5. Les carbohydrate estérases (CEs)
IV. Les systèmes de dégradation de la biomasse végétale, des réservoirs naturels d’enzymes
A. Le microbiote intestinal humain
B. Le rumen bovin
C. Les champignons
D. Les vers de terre
E. Les termites
V. L’exploration de la diversité
A. La métagénomique fonctionnelle
B. La métagénomique
C. La métagénomique 16S
D. Le RNA seq ou « transcriptome sequencing »
E. Comparaison de ces méthodes
VI. Projet de thèse
I. Annotation des banques métagénomiques de termites
A. Assemblages puis sélection des contigs
B. Recherche des cadres ouverts de lecture
C. Annotation fonctionnelle et taxonomique
II. Etude structurale et fonctionnelle de GH*
A. Sous clonage
B. Recherche des meilleures conditions pour l’expression de GH*
C. Purification
1. Chromatographie d’affinité sur ions métalliques immobilisés (IMAC)
2. Chromatographie d’exclusion-diffusion
D. Fluorimétrie différentielle à balayage
1. Activité sur pNP-substrats
2. Activité de phosphorolyse sur oligosaccharides
3. Activité sur polysaccharides
F. Chromatographie échangeuse d’anion à haute performance couplée à un système de détection ampérométrique pulsée (HPAEC-PAD)
G. Détermination des paramètres optimaux
H. Cristallisation
I. Congélation des cristaux et collecte de données
J. Détermination de la structure de GH*
I. Introduction
II. Résultats de l’annotation fonctionnelle
III. Comparaison des familles de GH retrouvées dans les deux banques
A. Familles retrouvées dans les deux banques
B. Familles présentes dans une seule banque
1. Familles identifiées majoritairement chez N. corniger (termite xylophage) (tableau 8)
2. Familles identifiées majoritairement chez T. hispaniolae (termite humivore et xylophage) (tableau 8)
C. Liens avec le mode de vie des termites
D. Comparaison avec d’autres espèce
IV. Comparaison des autres enzymes participant à la dégradation des polysaccharides
A. Les estérases
B. Les polysaccharides lyases
C. Domaines de liaison aux glucides (CBM)
V. Comparaison des microbiotes
VI. « Polysaccharide utilization locus » (PUL)
VII. Conclusion – Discussion
I. Introduction
II. Détermination des conditions optimales pour l’expression de GH*
A. Sous-clonage
B. Expression
III. Optimisation des conditions de purification
A. Chromatographie d’affinité sur ions métalliques immobilisés
B. Chromatographie d’exclusion-diffusion
IV. Stabilité de GH*
V. Détermination de l’activité de GH*
A. Criblage des pNP-glycosides
B. Recherche d’activité de phosphorolyse sur oligosaccharides
C. Criblage sur polysaccharides
VI. Conditions retenues pour l’étude fonctionnelle de GH*
A. Détermination du pH optimal
B. Détermination de la température optimale
VII. Analyse des produits d’hydrolyse du xylane de hêtre et des arabinoxylanes de blé (WAX) et de seigle (RAX)
VIII. Analyse des produits d’hydrolyse de xylooligosaccharides par GH*
IX. Conclusion
I. Introduction
II. Rappels sur GH*
A. Connaissances générales
B. Activité
III. Conditions de cristallisation
IV. Résolution de la structure
A. Données de diffraction
B. Obtention de la structure
V. Analyse de la structure de GH
VI. Mécanisme catalytique
VII. Conclusions et perspectives
Conclusion générale
Télécharger le rapport complet