Les phosphoprotéines sécrétées liant le calcium (SCPP)
L’émergence des tissus minéralisés tels que l’os et la dent représente une innovation importante dans l’évolution des vertébrés. La formation de ces tissus est liée à la présence d’une famille de protéines possédant la capacité de fixer le calcium, les phosphoprotéines sécrétées liant le calcium (SCPP, pour Secretory Calcium-binding PhosphoProtein). Les événements de duplication de génome qui ont eu lieu très tôt dans la lignée des vertébrés, et aussi des duplications de gènes en tandem ont permis la diversification et l’évolution de cette famille. En effet, leurs gènes ont été recrutés à la suite de duplications à partir d’un gène ancestral, supposé être apparenté à SPARC-L1 (Secreted Protein Acidic and Rich in Cysteine – like 1) (Kawasaki et al., 2004).
Bien que les protéines appartenant à cette famille ne présentent pas de similarité de séquences évidentes, elles partagent des caractéristiques qui témoignent de leur parenté. Comme ce sont des protéines sécrétées, elles possèdent un peptide signal, et celui-ci est très conservé au cours de l’évolution. De plus, elles possèdent un ou plusieurs sites de phosphorylation SXE (Ser-Xaa-Glu où Xaa représente n’importe quel acide aminé), l’un étant codé par la région 3′ de l’exon 3 (Fig. 4). Ces protéines lient le calcium via leurs résidus phosphorylés. La structure des gènes des SCPP possède d’autres caractéristiques. La région non traduite en 5′ (5′ UTR pour UnTranslated Region) est composée d’un (ou deux) exon suivi d’un exon (généralement l’exon 2) dont la structure est invariable chez les SCPP: une courte partie 5′ non traduite, suivie d’une partie codant le peptide signal, puis les deux premiers acides aminés de la protéine mature. Tous les introns sont en phase 0 (Fig. 4) à quelques exceptions près, dans la région 3′. Les exons peuvent donc être épissés sans modifier la phase de lecture.
Chez les mammifères les gènes des SCPP, à l’exception du gène AMEL, résident tous sur un même chromosome, et sont distribués en deux clusters de part et d’autre de SPARC-L1 (Fig. 5). Ces deux clusters regroupent, d’une part, les gènes codant des protéines riches en acides aminés acides (« acid-rich SCPP cluster »), impliquées dans la minéralisation de l’os et de la dentine, et, d’autre part, des gènes codant des protéines riches en proline et glutamine (« P/Q-rich SCPP cluster »), comprenant les protéines impliquées dans la minéralisation de l’émail, les caséines du lait et des protéines salivaires (Kawasaki & Weiss, 2003, 2006). Chez les sauropsides (reptiles et oiseaux), les deux clusters résident sur des chromosomes différents (Fig. 5) (AlHashimi et al., 2010).
Les SCPP de la dentine et de l’os, riches en acides aminés acides
Chez l’homme, cinq SCPP se trouvent dans cette catégorie: la sialophosphoprotéine dentinaire (Dentin sialophosphoprotein – DSPP), la phosphoprotéine acide 1 de la matrice dentinaire (Dentin Matrix acidic Phosphoprotein 1 – DMP1), la sialoprotéine liant les intégrines (Integrin-Binding SialoProtein – IBSP), aussi connue sous le nom de sialoprotéine de l’os (Bone SialoProtein – BSP), la phosphoglycoprotéine de la matrice extracellulaire (Matrix Extracellular, Phosphoglycoprotein – MEPE), et la phosphoprotéine 1 secrétée (Secreted PhosphoProtein 1 – SPP1) aussi connue sous le nom d’ostéopontine (OPN). Ces protéines sont impliquées dans la minéralisation de l’os et/ou de la dentine et ont un pI très acide, en raison de leur composition riche en acides aminés acides (Glu et Asp) et à la présence de nombreux résidus phosphorylés (Kawasaki et al., 2004). Elles sont également caractérisées par la présence d’un motif RGD (Arg-Gly-Asp) de liaison aux intégrines qui leur valut le nom de « Small Integrin-Binding LIgand, N-linked Glycoprotein » (SIBLING) (Fisher et al., 2001; Fisher & Fedarko, 2003). Chez le lézard Anolis carolinensis, ces cinq gènes sont arrangés de la même manière que chez l’homme. Toutefois, un sixième gène similaire à DSPP, DSPP-Like1, se situe entre DMP1 et IBSP (Fig. 5) (Kawasaki, 2011).
Les SCPP riches en proline et en glutamine
Cette catégorie de SCPP regroupe les SCPP de la salive et du lait, et celles de l’émail. Il en existe 18 chez l’homme, et seulement six ont été identifiées à ce jour chez le lézard (Fig. 5) (Kawasaki, 2011). FDC-SP, bien qu’étant présente dans la salive chez l’homme (Guo et al., 2006) et classifiée dans les SCPP de la salive et du lait par Kawasaki et Weiss (2006), est incluse dans cette revue dans les SCPP de l’émail. En effet, FDCSP est également exprimé dans les tissus dentaires et n’est pas exclusivement trouvé chez les mammifères, comme c’est le cas pour les SCPP de la salive et du lait.
Les SCPP de la salive et du lait
Ces protéines sont connues uniquement chez les mammifères. On en dénombre onze chez l’homme (Fig. 5).
Les SCPP du lait
Ce sont les caséines. Elles fournissent du phosphate de calcium aux nouveaux-nés pour le développement de leurs os et leurs dents. Il en existe de deux types : celles qui sont sensibles au calcium et celles qui ne le sont pas. Parmi les caséines sensibles au calcium on trouve les caséines αs1, αs2 et β codées par les gènes CSN1S1, CSN1S2 (invalidé chez l’homme) et CSN2 respectivement. Il n’y a qu’une seule caséine insensible au calcium, la caséine κ codée par le gène CSN3. Cette dernière a la capacité de stabiliser les complexes (caséines sensibles au calcium – phosphates de calcium) et de les maintenir en solution dans le lait (Kawasaki et al., 2011). Tous les gènes des caséines ont leur dernier exon non traduit. Cette caractéristique est commune aux SCPP riches en P/Q situés entre CSN1S1 et CSN3 et à SCPP-PQ1 (Fig. 5) (Kawasaki, 2009). Les caséines sensibles au calcium dériveraient toutes de SCPP-PQ1, tandis que la caséine insensible au calcium dériverait de FDC-SP. SCPP PQ1 et FDC-SP provenant toutes deux d’ODAM, celle ci ci serait donc l’ancêtre commun de toutes les caséines (Kawasaki et al., 2011).
Les SCPP de la salive
Les SCPP de la salive protègent les dents en régulant la précipitation des sels de phosphate de calcium à la surface de l’émail. Certaines possèdent également des propriétés antibactériennes et antifongiques. Il en existe huit chez l’homme. La stathérine (STATH), les histatines 1 et 3 (HTN1 et HTN3), la mucine 7 (MUC7), les protéines Proline-rich 1 (PROL1 ou BPLP), 3 (PROL3 ou SMR3B), 5 (PROL5 ou SMR3A) et 27 (LOC401137 ou PRR27). STATH, HTN1 et HTN3 partagent, avec les gènes codants des SCPP du lait, un exon non traduit en 3’. Ces trois gènes dériveraient de CSN1S2 (Kawasaki & Weiss, 2003). Ils n’ont été identifiés que chez les primates, leur duplication serait donc très récente (Sabatini et al., 1993). Chez la souris le pseudogène de STATH a été identifié, indiquant que STATH a probablement dupliqué de CSN1S2 avant la séparation de la lignée des rongeurs (Kawasaki & Weiss, 2003). La duplication entre STATH et HTN est estimée à 40-50 millions d’années (Ma) tandis que celle entre HTN1 et HTN3 est de 15-30 Ma (Sabatini et al., 1993). Les gènes codant les protéines Proline-rich 1, 3, 5 et 27 sont exprimés à la fois par les glandes salivaires et les glandes lacrymales (Kawasaki & Weiss, 2006). Les gènes PROL1, PROL3, PROL5 et MUC7 partagent la même structure génique et sont situés entre AMTN et CSN3 (Kawasaki & Weiss, 2003) tandis que LOC401137, situé entre ODAM et HTN1, a l’exon non traduit en 3’ comme les caséines, STATH, HTN1 et HTN3 (Kawasaki & Weiss, 2006).
Les SCPP de l’émail
Les SCPP de l’émail sont au nombre de sept chez l’homme. Elles sont classées en deux catégories : les protéines de la matrice de l’émail (EMP pour « Enamel Matrix Protein »), AMEL, ENAM et AMBN, et les SCPP jouant un rôle dans la maturation de l’émail et l’épithélium de jonction : AMTN, ODAM, SCPP-PQ1 et FDC-SP (Ganss & Abbarin, 2014). Chez le lézard, seulement six SCPP de l’émail ont été identifiés dans le génome (Fig. 5). En effet, ODAM n’a pas été trouvé dans le génome du lézard, alors qu’il est présent dans celui du xénope (Kawasaki, 2011).
Les protéines de la matrice de l’émail
Amélogénine
Caractérisation
Dès les années 1980, la séquence protéique complète de l’amélogénine (AMEL) a été déterminée chez la souris (Snead et al., 1983), la vache (Takagi et al., 1984), l’homme (Catalano-Sherman et al., 1993), le rat (Bonass et al., 1994), le cochon (Hu et al., 1996a), l’opossum (Hu et al., 1996b), et le hamster (Lyaruu et al., 1998). AMEL
représente 90% de la fraction protéique de l’émail bovin en formation (Termine et al., 1980). C’est la seule donnée quantitative que nous possédons à ce jour. Le gène de l’amélogénine réside, sur le brin antisens, dans un intron du gène ARHGAP6 chez tous les sarcoptérygiens (Kawasaki & Amemiya, 2014). Chez les mammifères placentaires, il est localisé sur les chromosomes sexuels, tandis que chez les marsupiaux, les monotrèmes et les non-mammaliens il est autosomal (Sire et al., 2005). AMEL est composé de sept exons chez les mammifères thériens (marsupiaux et placentaires). Cependant l’exon 4 n’est fonctionnel que chez certaines espèces de placentaires (homme, souris, rat, vache et cochon) et peut être épissé (Sire et al., 2012). De plus, trois exons supplémentaires ont été identifiés dans le génome de rongeurs en aval de l’exon 7, les exons 4b, 8 et 9. Les exons 4b et 8 sont les homologues des exons 4 et 5 (Bartlett et al., 2006). L’exon 4b n’a jamais été trouvé dans les transcrits. Les exons 8 et 9 ne sont présents que dans l’ARNm des muridés après épissage alternatif de l’exon 7 (Li et al., 1998; Baba et al., 2002; Papagerakis et al., 2005; Sire et al., 2012). L’épissage alternatif des transcrits d’AMEL est très fréquent et permet de générer une grande hétérogénéité dans les protéines qui en résultent (Lau et al., 1992). En amont du gène, la région du promoteur d’AMEL a été caractérisée chez quelques mammifères (Salido et al., 1992; Chen et al., 1994). Un peptide signal de 16 acides aminés est codé par l’exon 2, et l’exon 3 code pour un site de phosphorylation SXE. Le grand exon 6 code pour une région hydrophobe contenant de nombreuses répétitions de triplets PXQ (Delgado et al., 2005b). La région C-terminale est très chargée et possède un pI de 4,2, tandis que celui de la protéine entière est de 8,0 (Fincham et al., 1999). AMEL ne possède qu’un seul site de modification post-traductionnelle : un site de phosphorylation sur Ser16 (Takagi et al., 1984; Fincham & Moradian-Oldak, 1995). Une fois secrétée la protéine est progressivement clivée par la métalloprotéinase 20 (MMP20) puis par la kallikréine 4 (KLK4) (Nagano et al., 2009; Bartlett, 2013).
|
Table des matières
INTRODUCTION GÉNÉRALE
CHAPITRE 1 – REVUE DES CONNAISSANCES
I. Les phosphoprotéines sécrétées liant le calcium (SCPP)
II. Les SCPP de la dentine et de l’os, riches en acides aminés acides
III. Les SCPP riches en proline et en glutamine
1. Les SCPP de la salive et du lait
a) Les SCPP du lait
b) Les SCPP de la salive
2. Les SCPP de l’émail
a) Les protéines de la matrice de l’émail
i. Amélogénine
ii. Enaméline
iii. Améloblastine
b) Les SCPP jouant un rôle dans la maturation de l’émail et l’épithélium de jonction
i. ODontogenic, AMeloblast-associated protein
ii. Follicular Dendritic Cell-Secreted Protein
iii. Secretory Calcium-binding PhosphoProtein-
Proline/Glutamine-rich 1
iv. Amélotine
CHAPITRE 2 – MATÉRIEL ET MÉTHODES
I. Matériel biologique
1. Espèces utilisées pour l’extraction d’acides nucléiques
2. Origine des échantillons pour l’extraction des acides nucléiques
a) Mammifères
b) Sauropsides
c) Amphibiens
3. Matériel pour l’hybridation in situ
a) Anolis carolinensis
b) Pleurodeles waltl
c) Monodelphis domestica
II. Méthodes
1. Histologie
a) Fixation et inclusion dans l’epon
b) Coupes et coloration
2. Biologie moléculaire
a) Extraction de l’ADN génomique
b) Extraction des ARN totaux de mâchoire
c) Conception des amorces pour la PCR
d) Polymerase Chain Reaction
i. Principe
ii. Protocole
e) RT-PCR en deux étapes
i. Synthèse de l’ADN complémentaire à partir des ARN
ii. Amplification des séquences d’intérêt
f) Electrophorèse sur gel d’agarose
i. Préparation du gel d’agarose 1%
ii. Dépôt et migration des échantillons
g) Purification des produits de PCR avant clonage
h) Clonage
i. Principe
ii. Ligation
iii. Transformation
iv. Culture et sélection des clones
i) Purification des plasmides
j) Linéarisation des plasmides et purification pour la transcription in vitro
k) Synthèse de sondes froides ARN
i. Transcription in vitro des sondes sens et antisens
ii. Purification des sondes
l) Préparation des échantillons pour l’hybridation in situ
i. Fixation et déminéralisation
ii. Déshydratation et inclusion
m) Hybridation in situ sur coupes
i. Traitement des coupes et hybridation
ii. Lavage des lames et immunoréaction
iii. Révélation
n) Composition des tampons pour l’hybridation in situ
i. Tampon d’hybridation
ii. Tampon de lavage
iii. MABT
iv. Solution de blocage
v. NTMT
3. Analyses in silico
a) Bases théoriques de l’analyse évolutive des protéines
b) Recherche des séquences dans les bases de données
c) Alignement de séquences
d) Modèle de substitution
e) Construction d’un arbre phylogénétique
f) Calcul de la séquence ancestrale
g) Calcul de la pression de sélection par la méthode « sliding window »
h) Calcul de la pression de sélection à chaque site par SLAC
i) Prédiction des peptides signaux
j) Prédiction des modifications post-traductionnelles
CHAPITRE 3 – Evolutionary analysis suggests that AMTN is enamel-specific and a candidate for AI
Abstract
Introduction
Material et methods
Results
Discussion
Supplementary data
CHAPITRE 4 – Amelotin: an enamel matrix protein that experienced distinct evolutionary histories in amphibians, sauropsids and mammals
Abstract
Introduction
Material and methods
Results
Discussion
Conclusions
Supplementary data
CHAPITRE 5 – Amelotin gene structure and expression in the opossum Monodelphis domestica
Abstract
Introduction
Material and methods
Results
Discussion
CHAPITRE 6 – Comparative expression of the ameloblast-secreted genes, amelogenin, ameloblastin, enamelin and amelotin during amelogenesis in the lizard Anolis carolinensis
Abstract
Introduction
Material and methods
Results
Discussion
DISCUSSION – CONCLUSION
Télécharger le rapport complet