Glycosylation des protéines et glycohormones
Les protéines subissent, en aval de leur synthèse, des modifications chimiques souvent régies par des réactions enzymatiques, appelées « modifications posttraductionnelles » ou PTMs (de l’anglais « Post-Translational Modifications »). Ce terme désigne également, par extension, les modifications survenant lorsque la chaine peptidique est encore en cours de synthèse, et qui sont donc à proprement parler des modifications co-traductionnelles. Il existe de nombreuses PTMs différentes, de par la nature chimique des modifications ou leur localisation sur la protéine. Pas moins de 1493 modifications covalentes sont répertoriées dans la base de données de modifications publique Unimod en 2019. Ces modifications incluent, entre autres, le clivage de liaisons peptidiques (peptide signal, peptide C de la forme immature de l’insuline), et la modification covalente d’acides aminés particuliers par des groupements de natures variées, tels des phosphates (phosphorylation), groupements acétyle (acétylation) ou des polysaccharides (glycosylation et glycation). Elles peuvent être réversibles, alors souvent associées à des processus biologiques de régulation ou de signalisation, ou bien être irréversibles et dans ce cas potentiellement associées à des phénomènes de vieillissement cellulaire ou de dégradation (1). La glycosylation est un processus enzymatique (contrairement à la glycation qui est un processus passif) aboutissant à la liaison covalente d’une protéine et d’un mono- ou oligosaccharide. Il s’agit d’une famille de PTMs extrêmement courante retrouvée chez les organismes eucaryotes, pour lesquels on estime que la majorité des protéines sécrétées sont glycosylées (2), mais aussi sur les protéines synthétisées par les organismes du domaine bactérien (3), contrairement à ce qui fut longtemps admis. Ces modifications ont un impact sur la stabilité, la conformation, la fonction et les capacités d’interaction des glycoprotéines.
Les monosaccharides existent sous deux formes, linéaire ou cyclique . Lorsqu’ils adoptent une forme cyclique, ce sont des molécules hétérocycliques (leur cyclisation provoque l’intégration d’un hétéroatome d’oxygène au cycle carboné), poly hydroxylées et chirales. L’orientation des groupements hydroxyles sur chaque carbone stéréogène (à environnement asymétrique) a un tel impact sur les propriétés du monosaccharide que chaque diastéréoisomère possède une identité et un nom qui lui est propre . Chaque monosaccharide sous forme linéaire possède un unique groupement aldéhydique dont la réactivité est conservée lors de la cyclisation (Carbone-1 hémiacétal). Ce carbone étant impliqué dans la liaison de formation des oligosaccharides, la majorité des polymères d’oses n’ont qu’une extrémité réductrice, généralement impliquée dans la liaison à la protéine glycosylée. Un polysaccharide, aussi appelé glycane, est le nom donné au polymère linéaire ou ramifié composé de monosaccharides (ou oses) reliés entre eux par des liaisons covalentes, dites « osidiques ».
Différents types de glycosylation sont décrits en fonction du groupement chimique modifié ou de la molécule intermédiaire entre le polysaccharide à la protéine glycosylée. Chaque famille de glycosylation utilise des voies de synthèse différentes, aboutissant à des structures osidiques variées mais également à des fonctions biologiques propres. La N-glycosylation et la Oglycosylation sont les formes les plus étudiées et sont les deux formes de glycosylation identifiées sur les hormones gonadotropes, tandis que d’autres types de glycosylation moins courants existent, comme la C-mannosylation, la glypiation et la glycosylation des phosphosérines.
La N-glycosylation chez les organismes eucaryotes est la plus étudiée de toutes les glycosylations. Elle implique la modification d’un résidu asparagine (Asn) présent au sein d’une séquence particulière Asn-X-Ser/Thr par un N-glycane (X étant un acide aminé quelconque sauf une proline). Les N-glycanes ont en commun un noyau pentasaccharidique composé de deux Nacétylglucosamines et trois mannoses (appelé « core »), lesquels peuvent être différemment modifiés et étendus. La famille des oligomannoses (ou « highmannose ») regroupe les N-glycanes constitués du core et d’un nombre variable de mannoses supplémentaires (au nombre total généralement supérieur à cinq), les formes dites « complexes » sont modifiées par un nombre variable d’antennes trisaccharidiques (composée d’une GlcNAc, d’un Gal et d’un NeuAc), et les formes hybrides sont intermédiaires et sont composées d’au moins une antenne et d’un mannose sur leur core . De nombreuses protéines sont N-glycosylées, les plus étudiées étant les immunoglobulines de par leur utilisation biothérapeutique sous forme notamment d’anticorps monoclonaux ou d’ADC (« Antibody-Drug Conjugate » ou médicament couplé à un anticorps).
Le terme « O-glycosylation » désigne la modification d’un résidu thréonine (Thr) ou sérine (Ser) d’une protéine par un O-glycane au niveau du groupement hydroxyle libre de leur chaine latérale. Contrairement aux sites de Nglycosylation, les sites de O-glycosylation ne nécessitent pas d’être impliqués dans une séquence consensus particulière. Les mucines sont des protéines ubiquitaires fortement O-glycosylées situées à la surface des épithéliums de nombreux organismes ayant un rôle important dans leur fonction de barrière. Leurs O-glycanes sont amorcés par une liaison commune O-GalNAc qui constitue la structure commune à tous les noyaux de type mucine, et sont allongés et ramifiés par l’ajout d’un nombre variable de monosaccharides. Le noyau O-GlcNAc est une forme moins courante de O glycosylation surtout détectée sur les protéines nucléaires, mitochondriales et cytoplasmiques. Cette modification, très dynamique, n’est constituée que du core GlcNAc et permet de prévenir la phosphorylation de ces protéines et réguler leur activité. Ainsi, les protéines O-acétylglucosaminées ont souvent un rôle dans l’adaptation au stress cellulaire, la régulation de phénomènes épigénétiques et de la transcription, ainsi que dans la production, la stabilité et la dégradation des protéines.
Les autres familles moins documentées de glycosylation incluent la Cmannosylation, une glycosylation située au niveau d’un atome de Carbone d’un résidu tryptophane (Trp) (la sous-unité α de la protéine C8 du complément est un exemple de protéine C-mannosylée), la glypiation, qui implique l’ancrage d’une protéine à un lipide membranaire par l’intermédiaire d’un glycosylphosphatidylinositol (GPI), et la modification de résidus phosphosérines. La glycation quant à elle est un processus non-enzymatique impliquant la réaction entre le groupement carbonyle de molécules osidiques avec une fonction amine d’une protéine. L’exemple le plus courant de protéine glyquée est l’hémoglobine, dosée dans les cas de suspicion ou de diabète avéré.
La nomenclature textuelle est aussi définie par le SNFG pour la représentation des structures polysaccharidiques dont les liaisons glycosidiques sont connues. Il s’agit d’une version condensée de l’écriture recommandée par l’IUPAC représentant de façon linaire ou ramifiée la composition des glycanes et les liaisons glycosidiques entre ses constituants monosaccharidiques, en écrivant dans le sens « extrémité(s) non réductrice(s) » → « extrémité réductrice ». Un trisaccharide linaire pourra ainsi s’écrire NeuAcα2-3Galβ1-3GalNAc. Si ses liaisons ou sa stéréochimie ne sont pas intégralement caractérisées, le sucre sera représenté graphiquement en utilisant les symboles SNFG non colorés ou en détaillant uniquement la composition du sucre, NeuAc1Gal1GalNAc1 ou HexNAc(1)Hex(1)NeuAc(1) dans le cas du sucre précédent.
Les structures des N-glycanes étant très conservées, la notation Oxford peut être utilisée car plus compacte : Pour les formes high-mannose on indique le nombre total de mannoses « K » sous la forme MK (par exemple, M9 correspond à un N-glycane à neuf mannoses), tandis que les formes complexes suivent la forme générale « FAXBGYSZ », avec « X » le nombre d’antennes, « Y » le nombre de galactoses et « Z » le nombre d’acides sialiques (acide Nacétylneuraminique, NeuAc ou NANA) terminaux. L’utilisation des lettres « F » et « B » indique respectivement la présence d’un fucose à la base du N- glycane, ou la bissection du core par une N acétylglucosamine (située sur le mannose lié en β1-4. Les formes hybrides adoptent une notation similaire, indiquant à la fois le nombre total de mannoses et la composition des antennes .
Fonctions biologiques
Du fait de leur omniprésence sur la majorité des protéines et de leur grande hétérogénéité, les glycanes sont susceptibles de remplir des fonctions extrêmement diverses. Les glycanes peuvent être impliqués dans le repliement des protéines dans le réticulum endoplasmique, le caractère hydrophile et la solubilité des protéines, leur stabilité, l’adhésion cellulaire, ou encore le caractère pro- ou anti- inflammatoire ou immunogène de certaines protéines ou cellules. Ces propriétés biologiques sont généralement liées au caractère hydrophile, à la densité de charge ou à la reconnaissance des glycoconjugués par des récepteurs membranaires.
Les glycoprotéines les plus étudiées pour leur fonction biologique sont probablement les immunoglobulines (de classe IgG) du fait de leur fort intérêt pharmaco-médical. En effet la glycosylation des immunoglobulines a un rôle structural et modulateur des fonctions effectrices de l’anticorps. Les anticorps ont un site de N-glycosylation conservé en position N297 de leur Fc (fragment cristallisable) et parfois un site de glycosylation dans leur région variable, les deux modifications étant retrouvées sur la chaine lourde de l’immunoglobuline (8). Sur ces glycoprotéines, les N-glycanes sont majoritairement des formes complexes biantennaires, sialylées et fucosylées. La simple absence de N-glycanes est associée à un taux d’agrégation plus important et une sensibilité aux traitements thermiques, chaotropiques (Guanidine-HCl), ou protéasiques (papaïne) augmentée, et donc une plus courte période de stabilité (9). La conformation du domaine CH2 des anticorps est particulièrement affectée par leur glycosylation, ainsi que leur affinité pour les récepteurs anti-Fc et les protéines du complément. Au-delà de la simple présence de N-glycanes, la composition de ceux ci impacte également les fonctions effectrices des anticorps. En particulier, la présence de GlcNAc en position bissectrice a un effet pro-inflammatoire (activation de la voie ADCC), tandis que la fucosylation du core augmente l’activation du complément. Les Gal et NeuAc terminaux sont quant à eux anti-inflammatoires (10). Dans le cadre du design d’anticorps thérapeutiques ou d’ADCs (anticorps couplé à une molécule active), la maitrise de leur glycosylation permet donc d’optimiser leurs propriétés.
L’état anormal de glycosylation de certaines protéines est un promoteur de la progression et de l’évolution de cellules cancéreuses, et donc un excellent biomarqueur de ce type d’anomalie. Les modifications que subissent les Nglycanes et les O-glycanes sont les plus décrites, probablement du fait de la meilleure connaissance de ces familles. Du fait de l’altération des niveaux d’expression des enzymes liées à la glycosylation dans ces cellules, on observe alors des modifications structurales des cores O-glycosidiques et de l’état de ramification et de complexité des chaines polysaccharidiques. Plusieurs motifs semblent conservés et associés à différentes formes de cancer. Notamment, la présence de structures O glycosidiques particulières (antigènes T, Tn, STn) a été décrite dans des cas de cancers colorectaux (13,14), pour lesquels une augmentation de la concentration des mucines sialylées (α2-6) a également été observée et associée à la formation de métastases et l’échec des traitements (15,16). L’extension des antennes des N-glycanes complexes par des répétitions Gal-GlcNAc (poly-N-acétyllactosamine, ou polylacNAc) est également un marqueur de cancer pulmonaire et colorectal (17). Les polylacNAc ont en effet une haute affinité pour la galectine-3 qui est connue pour promouvoir la formation de métastases pulmonaires (18). L’état de glycosylation de la β-hCG semble lié au développement de cellules tumorales, les formes hyperglycosylées de la hCG étant plus prépondérantes chez les patients touchés par ces cancers .
|
Table des matières
Valorisation
Liste des figures
Liste des tables
Liste des abréviations
A. Introduction
B. Première Partie : Etat de l’art
1. Glycosylation des protéines et glycohormones
1.1 Introduction
1.2 Nomenclature
1.3 Fonctions biologiques
1.4 Les hormones glycoprotéiques gonadotropes
1.4.1 La gonadotrophine chorionique humaine (hCG)
1.4.2 La gonadotrophine chorionique équine (eCG)
1.5 Synthèse in vivo
1.5.1 N-glycanes
1.5.2 O-glycanes (O-GalNAc)
1.5.3 Autres glycoconjugués
2. Chimie analytique et glycoprotéomique
2.1 Introduction à la spectrométrie de masse
2.2 N-glycomique
2.2.1 Production des N-glycanes
2.2.2 Etude structurale des N-glycanes par MS
2.3 Glycoprotéomique bottom-up
2.3.1 Généralités
2.3.2 Glycoprotéomique bottom-up
2.4 Approches intacte et top-down
C. Deuxième Partie : N-glycomique pour l’étude des choriogonadotropines
1. Développement d’une méthode de N-glycomique sensible pour l’étude de
la glycosylation des glycohormones
1.1 Introduction
1.2 Développement de la méthode
1.2.1 Reproduction du protocole publié
1.2.2 Optimisation de la méthode
1.3 N-glycomique pour l’analyse de glycohormones urinaires
1.4 Conclusions
D. Troisième Partie : Caractérisation structurale de la glycosylation des gonadotrophines chorioniques par approche bottom-up
1. Protéolyse aspécifique et fragmentations stepped-HCD pour la comparaison
de deux hCG d’origines géographiques distinctes
1.1 Introduction et problématique
1.2 Protocole de glycoprotéomique bottom-up et identification
1.2.1 Préparation de l’échantillon
1.2.2 Analyse LC-MS/MS
1.2.3 Identification des glycoprotéines
1.3 Résultats
1.3.1 Traitement des résultats d’interrogation
1.3.2 Comparaison des méthodes de protéolyse
1.3.3 Fragmentation stepped-HCD
1.4 Glycosylation de la hCG et origine géographique
1.5 Conclusions
2. Analyse approfondie des données spectrales pour l’identification de
glycoformes minoritaires
2.1 Introduction et problématique
2.2 Protocole de glycoprotéomique bottom-up et identification
2.2.1 Préparation de l’échantillon
2.2.2 Analyse LC-MS/MS
2.2.3 Identification glycoprotéique
2.2.4 Extraction des signaux d’intérêt
2.3 Résultats : Analyse des données spectrales
2.4 Conclusions
E. Synthèse et Discussion
F. Annexes
1. Monosaccharides et glycanes
2. Spectrométrie de masse
2.1 Notions en MS
2.2 Source d’ionisation
2.3 Analyseur
2.4 Modes de fragmentation (MS/MS)
Article 1
Article 2
Bibliographie
Télécharger le rapport complet