Phylogénie moléculaire, modéliser les relations de parenté de séquences homologues

Les bases de données de séquences biologiques

Il existe un grand nombre de bases de données de séquences biologiques [CHW17]. Le but de cette section est de présenter les bases de données de séquences génétiques utilisées dans cette thèse.

DDBJ, ENA et GenBank : une collaboration entre bases de données de nucléotides

La DDBJ (DNA Data Bank of Japan) [Kod+15], lŠENA (European Nucleotide sequence database) [Kul+07] et GenBank (GenBank nucleotide sequence database) [Aga+18] sont trois bases de données de nucléotides, gérées par des organismes différents, faisant partie de lŠINSDC (International Nucleotide Database Collaboration ). Cette collaboration permet l’échange de données de manière très régulière entre les soumissions faites dans chacune de ces bases de données aĄn que les bases de données DDBJ, ENA et GenBank présentent strictement le même contenu. En mars 2022, elles contenaient 2 688 127 662 séquences, pour un total de 17 470 756 718 739 bases.

CCDS : un consensus du codant

La base de données CCDS (Consensus Coding Sequence) [Far+14] regroupe les informations convergentes sur les régions codantes (CDS) de lŠhumain et la souris. Différentes ressources (e.g., transcrits alternatifs, protéines isoformes, annotation de génome) peuvent présenter des informations différentes à propos dŠun même gène et sa séquence codante, le but du projet CCDS est de regrouper les informations convergentes au sein dŠun consensus.
Les protéines, transcrits et gènes annotés différemment et issus de différentes ressources sont regroupés sur la base de leur région codante. CŠest ainsi que CCDS met à disposition des consensus de bonne qualité des leurs positions génomiques ainsi que des transcrits alternatifs associés, et cela, sur la base de curation manuelle par des experts. En Juin 2022, CCDS contenait 19 030 gènes humains et 20 486 gènes murins.

RefSeq : une base de données controlée

La base de données RefSeq [PTM07] du NCBI (National Center for Biotechnology Information ) recense toutes les séquences avec un identiĄant unique des génomes, des transcrits et des protéines pour tous types dŠorganismes (archées, bactéries, eucaryotes, virus). Les séquences issues de GenBank sont contrôlées de manière à avoir une entrée Partie I, Chapitre 1 Ű Gènes, protéines et famille de protéines par séquence et sont ensuite annotées avec des informations telles que les domaines, les variations génétiques et les entrées bibliographiques correspondantes. La totalité des informations présentes dans RefSeq sont facilement accessibles, que ce soit par le site, les recherches via lŠoutil dŠalignement BLAST, le serveur ftp ou par accès de programmation.
En mai 2022 (release 212 ) la base de données RefSeq contenait 229 417 182 protéines, 44 805 833 transcrits, correspondant à 119 373 organismes.

UniprotKB, Swiss-prot

UniprotKB et Swiss-prot sont deux bases de données de séquences protéiques du consortium Uniprot, constitué dŠéquipes de lŠEBI (European Bioinformatics Institute), du SIB Swiss Institute of Bioinformatics) et du PIR (Protein Information Ressource).
UniprotKB est considérée comme la ressource centrale pour les séquences protéiques et leurs annotations fonctionnelles. UniprotKB est divisée en deux grandes sections : 1)
UniProtKB/Swiss-Prot [BA99] et 2) UniProtKB/TrEMBL [Bat+15]. La différence entre ces deux sections se situe au niveau de la qualité des annotations : les entrées SwissProt sont validées par curation manuelle et annotées à base dŠinformations extraites de la littérature, alors que les entrées TrEMBL sont annotées automatiquement par des méthodes computationnelles. Début 2022, TrEMBL contenait 231 354 261 séquences alors que Swiss-Prot en contenait 567 483. La majorité des entrées de UniprotKB sont annotées avec leurs domaines protéiques, leurs isoformes, leur localisation cellulaire, leur expression tissulaire, leurs structures connues ainsi que d’autres informations connues associées aux différentes entrées.

Liens et spéciĄcités des bases de données

Chaque base de données contient différentes informations, que ce soit par leur type, leur quantité et les problématiques dans lesquelles elles sŠancrent. En effet, une base de données ne se résume pas à un stockage de données, mais vise à répondre à un besoin. Que ce soit le stockage d’un grand nombre de données brutes (e.g., DDBJ, ENA, GenBank), le besoin de connecter des données de manière à gagner des plus-values (e.g., CCDS) ou de les annoter en les connectant à différents types de connaissances (e.g., Swiss-Prot). La diversité d’information que présente chaque base de données pour potentiellement parler dŠun même gène est tant une richesse qu’un problème à surmonter. Permettre de relier les informations de chaque base de données, sans pour autant perdre les spéciĄcités de chacune, est faisable via les références croisées (Cross-References). Les entrées d’une base de données sont associées à un identiĄant qui lui est propre, mais elles présentent aussi les identiĄants d’autres bases de données qui décrivent la même entité biologique.

Obtention d’une structure de protéine

Il existe différentes méthodes expérimentales permettant de capturer des informations sur la structure d’une protéine. Les plus répandues sont la cristallographie à rayons X, la spectroscopie RMN (Résonance Magnétique Nucléaire) ou la cryo-microscopie électronique (et ses dérivées). Ces méthodes permettent d’obtenir des informations sur la position tridimensionnelle de chaque atome de la protéine à un instant précis. Les coordonnées cartésiennes de chaque atome composant la protéine sont écrites dans un Ąchier au format .pdb, qui décrit ainsi la structure tridimensionnelle dŠune protéine. La Protein Data Bank (PDB) est la base de donnée qui regroupe la majorité de ces structures [Bur+21]. Cependant, puriĄer, isoler, cristalliser une protéine aĄn dŠen obtenir la structure nécessite une démarche expérimentale longue et coûteuse et peut se révéler très complexe pour certaines protéines. Par conséquent, de nombreuses protéines ne possèdent pas de structure PDB ou n’ont pas de structures complètes [DC15] (Figure 1.6).
Le coût, le temps et la complexité que représentent les approches expérimentales d’une part, et l’intérêt colossal que de telles structures représentent pour la pharmacologie, a motivé le développement d’approches prédictives de structure de protéine. Et bien que le problème soit complexe, l’information nécessaire est présente dans la séquence primaire de la protéine. L’idée générale est de faire le lien entre l’information de la séquence et la structure qui en résulte, en se basant sur les structures déjà résolues stockées dans laPDB.
C’est ainsi que depuis presque trois décennies, des scientiĄques développent des outils et programmes ayant pour but de prédire la structure d’une protéine, sur la seule base de sa séquence. I-TASSER [Yan+15] est un des premiers programmes permettant de prédire la structure d’une séquence ab initio, par recherche de séquences similaires dont des structures sont disponibles dans la PDB. Mais lŠavancée récente la plus notable dans le domaine de la prédiction de structures revient à AlphaFold [Jum+21]. Développée par
Deepmind depuis 2018, AlphaFold est un logiciel d’intelligence artiĄcielle de prédiction de structure 3D de protéines, nécessitant uniquement des alignements multiples contenant la séquence de la protéine (Figure 1.6). Les prédictions d’AlphaFold ont permis la mise à disposition des structures complètes du protéome de l’humain, ainsi que de 47 autres organismes [Var+22].

Les briques de base de l’évolution des protéines

Nous pouvons faire une analogie dans laquelle la séquence dŠune protéine peut être vue comme une phrase dont le sens sera la ou les fonctions de la protéine. Les domaines étant les mots composant cette phrase [Yu+19]. Ces domaines étant construits sur des segments plus conservés, qui comme des syllabes seraient partagées par divers mots/domaines.

Domaine et organisation modulaire des protéines

Au sein des structures des protéines, les scientiĄques ont identiĄé des briques de base structurale, appelées domaines. Un domaine est une unité structurale minimale autonome de repliement de la séquence dŠacides aminés. LŠorganisation modulaire des protéines [Doh+20] correspond à la réutilisation dŠun nombre limité de domaines au sein d’une très grande variété de protéines [KWK02]. En effet, il existe un nombre limité de repliements possibles pour une séquence en acide aminés et la diversité des protéines repose sur la réutilisation de domaines comme briques de bases dŠévolution [Doo95]. De plus, 67 % des protéines Eucaryotes sont des protéines multidomaines [Mar+06]. L’accumulation de ces différents domaines, leur répétition et la combinatoire engendrée contribuent globalement à la fonction de la protéine (comme illustré en Figure 1.7 pour le domaine PHqui se retrouvent dans différentes protéines, aux combinatoires en domaines différentes).

Segment de sous-domaines comme point de départ des domaines

Bien que les domaines soient généralement considérés comme les briques ou les segments de bases des protéines, de récentes études ont mis en lumière la présence de segments récurrents plus petits que les domaines [Kol+21 ; Kol21]. Ces segments sont des sous unités de domaines présents dans un grand nombre de domaines, contextes et architectures différents. Les domaines seraient ainsi constitués sur la base de segments plus petits, conservés et partagés par d’autres domaines. Le reste du domaine étant variable et différent d’un domaine à l’autre. À la différence des domaines qui sont déĄnis par un repliement structural, ces segments de sous-domaines ne sont pas forcément assez longs pour avoir un repliement autonome.

Enzymes et pseudoenzymes

Les enzymes sont des protéines possédant une propriété catalytique. C’est-à-dire qu’elles ont la capacité de modiĄer la cinétique d’une réaction chimique (e.g., en abaisser l’énergie d’activation). Une réaction catalysée par une enzyme prend en entrées des molécules que l’on appelle substrats, et crée un ou plusieurs produits, l’enzyme nŠétant pas modiĄée suite à la réaction. La grande particularité des enzymes comparées aux autres catalyseurs est leur très grande spéciĄcité vis-à-vis de leurs substrats, et donc des réactions qu’elles catalysent. En effet, comme toute protéine, les enzymes possèdent une structure tridimensionnelle qui leur est propre, leur permettant d’interagir spéciĄquement avec des substrats. Le modèle accepté actuellement pour la liaison enzyme-substrat est le modèle de l’ajustement induit (Figure 1.8). Ce modèle décrit la structure de l’enzyme comme Ćexible, remodelant en permanence son site actif, de manière à créer une liaison substratenzyme stable. Il s’oppose à l’ancien modèle clé-serrure qui considérait la structure de l’enzyme et de ses substrats comme stable et ainsi complémentaire, ce qui permettait leur liaison.

Sélection naturelle et pressions de sélection

Les évènements de modiĄcation des séquences surviennent à différentes échelles. À lŠéchelle de lŠindividu les mutations affectent les lignées germinales, sont transmises aux descendants puis sont soumises au tri de la sélection naturelle. À lŠéchelle des populations une mutation est dite Ąxée quand lŠallèle sŠest substitué, au Ąl des générations, à tous les autres allèles. À lŠéchelle des espèces les différences ponctuelles Ąxées sont nommées substitutions pour les nucléotides et remplacement pour les aides aminés. Par commodité dans le cas des protéines, nous parlerons de substitutions dans la suite du manuscrit.
On distingue plusieurs types de pressions de sélection naturelle, neutre, positive ou négative. Lorsque les mutations ne changent pas le phénotype sous pression de sélection, ou que la pression de sélection est faible, les chances de survie de la descendance ne sont pas changées. La mutation est neutre et la sélection naturelle, dite neutre, n’a pas d’effet sur sa Ąxation dans la population. on parle de la dérive de la séquence.
Dans certains contextes environnementaux nécessitant des adaptations, les mutations de la séquence provoquant une modiĄcation du phénotype peuvent conférer un avantage adaptatif. Elles seront plus souvent Ąxées dans la population. La divergence de la séquence peut alors être plus rapide comparée à la dérive, et de nouvelles fonctions apparaissent.
On parle de sélection naturelle positive. Au contraire, une fonction de la séquence peut avoir une telle importance que les mutations modiĄant le phénotype sont éliminées par la sélection naturelle. La séquence diverge alors plus lentement et on parle de sélection naturelle négative.
C’est le phénomène de sélection naturelle négative qui provoque donc la conservation des séquences entre les espèces. Des régions des protéines, les domaines notamment, vont être conservées durant l’évolution car elles participent à une fonction importante. On dira par la suite que la fonction et les régions sont sous pression de sélection. Nous généraliserons ce raisonnement dans cette thèse, en interprétant les régions fortement conservées de protéines homologues comme une implication de ces régions dans une fonction ou un phénotype important.

Arbre phylogénétique

Un arbre phylogénétique représente les liens de parenté entre des entités (e.g., espèces, séquences) et sa topologie représente leur histoire évolutive (Figure 2.1). Il est composé de nœuds et de branches, où chaque nœud correspond à une instance de l’entité observée (e.g., un gène), les entités actuelles sur lesquelles a été basée l’inférence de l’arbre sont les feuilles de l’arbre (e.g., gène actuel dont la séquence a permis l’inférence), les autres nœuds sont internes et correspondent à des nœuds ancestraux (e.g., gène ancestral). Dans le cas d’un arbre binaire, chaque nœud est lié à trois branches, et dans le cas où cet arbre est enraciné (i.e., on en connaît l’origine), une branche le lie à son ancêtre, et les deux autres branches à ses descendants. Si l’arbre nŠest pas binaire, il possède au minimum un nœud qui n’est pas résolu et son nombre de descendants est alors supérieur à deux. La topologie d’un arbre peut être décrite par l’ensemble de ces bipartitions : chaque branche sépare l’arbre en deux parties, avec un sous ensemble de taxons dans chacune (e.g., seq1 seq2 | seq3 seq4 sur la Figure 2.1). La longueur dŠune banche représente la quantité d’évolution qui s’est produite entre deux nœuds (e.g., le nombre de substitutions par site). Une branche peut également être associée à des valeurs de supports statistiques (e.g., bootstrap)

Robustesse de la phylogénie de référence à l’échantillonnage taxonomique

Un arbre phylogénétique peut être sujet à des biais dus aux séquences sélectionnées pour l’inférer. Nous avons effectué différents rééchantillonnages du jeu de séquences utilisé, dans le but d’estimer la robustesse de l’arbre de référence et des ancêtres pour lesquels nous établirons des conclusions dans les chapitres suivants. Nous commencerons par présenter la méthode de rééchantillonnage taxonomique utilisée (Section 5.3.2.1), avant d’en présenter une application sur un jeu de séquences alternatif (Section 5.3.2.2). Pour Ąnir,nous effectuerons différents rééchantillonnages du dataset-214 aĄn dŠestimer la robustesse des différents clades de lŠarbre de référence (Section 5.3.2.3).

Support des bipartitions et robustesse à l’échantillonnage taxonomique

Les bipartitions, déĄnies comme des ensembles de feuilles disjointes dans un arbre phylogénétique, peuvent varier quand le protocole de reconstruction dont il provient varie. Cependant, deux arbres phylogénétiques aux topologies différentes peuvent tout de même partager des bipartitions (Figure 5.18). Au cours de cette section, nous allons nous intéresser aux bipartitions les plus présentes au sein dŠun jeu dŠarbres dŠADAMTS-TSL, c’est-à-dire aux bipartitions les plus robustes, dans le but dŠidentiĄer les regroupements récurrents dŠADAMTS-TSL. En ce sens, une bipartition robuste est déĄnie comme insensible à la méthode de reconstruction utilisée.
AĄn d’estimer la robustesse de notre phylogénie de référence, nous avons opté pour un rééchantillonnage taxonomique dŠun jeu de séquences (présenté en Figure 5.19). Pour ceci, nous utilisons deux jeux de séquences, le premier étant celui qui nous intéresse (séquences du jeu de référence), le second comprenant des séquences homologues appartenant à des espèces non considérées dans le premier jeu (séquences alternatives). Les deux jeux de séquences dŠintérêts et de séquences alternatives sont ainsi mutuellement exclusifs. Le principe est le suivant : nous sélectionnons n séquences du jeu de séquences alternatives, que lŠon ajoute au jeu de données dŠintérêt. Nous obtenons ainsi un jeu de séquences comprenant toutes les séquences dŠintérêts ainsi que quelques séquences alternatives sélectionnées aléatoirement. Ensuite, nous réalisons lŠalignement multiple de ce jeu de séquences rééchantillonné, avant dŠen inférer la phylogénie

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières
Table des Ągures 
Liste des tableaux 
Introduction 
I Contexte de la thèse 
1 Gènes, protéines et famille de protéines 
1.1 Des gènes aux protéines
1.1.1 Les protéines comme produits de l’expression du gène
1.1.2 L’information du gène sous forme de séquences
1.1.2.1 Plusieurs alphabets pour l’information d’un gène
1.1.2.2 Traduction et code génétique : passage d’un alphabet à un autre
1.1.3 Les bases de données de séquences biologiques
1.1.3.1 DDBJ, ENA et GenBank : une collaboration entre bases de données de nucléotides
1.1.3.2 CCDS : un consensus du codant
1.1.3.3 RefSeq : une base de données controlée
1.1.3.4 UniprotKB, Swiss-prot
1.1.3.5 Liens et spéciĄcités des bases de données
1.2 Séquence, structure et fonction d’une protéine
1.2.1 Repliements et structure d’une protéine
1.2.1.1 Quatre niveaux de repliement
1.2.1.2 Obtention d’une structure de protéine
1.2.2 Les briques de base de l’évolution des protéines
1.2.2.1 Domaine et organisation modulaire des protéines
1.2.2.2 Segment de sous-domaines comme point de départ des domaines
1.2.3 Interaction protéine-protéine
1.2.3.1 La structure d’une protéine comme discriminant de ses interactions
1.2.3.2 Enzymes et pseudoenzymes
1.2.3.3 PSICQUIC : un accès standardisé et mutualisé aux bases de données d’interactions moléculaires
1.3 Famille de protéines homologues
1.3.1 Évolution de protéines homologues
1.3.1.1 Protéines homologues et ancêtre commun
1.3.1.2 Copie et divergence de séquences et de fonctions
1.3.1.3 Sélection naturelle et pressions de sélection
1.3.1.4 Alignement multiple de séquences
2 Phylogénie moléculaire, modéliser les relations de parenté de séquences homologues
2.1 Reconstruction des relations de parenté de séquences homologues
2.1.1 Arbre phylogénétique
2.1.2 Modéliser l’évolution des séquences
2.1.3 Construction d’un arbre phylogénétique
2.2 Reconstruction de scénarios ancestraux de caractères
2.3 Évolution d’une famille multidomaines
2.3.1 Évolution modulaire des protéines : les histoires propres des éléments d’un gène
2.3.2 Réconciliation Domaine Gène (Espèce)
2.3.3 Réconciliation Domaine Gène Espèce avec SEADOG
3 Annotation fonctionnelle de protéines 
3.1 Propagation d’annotations par homologie
3.1.1 Modéliser les conservations d’un MSA
3.1.2 Modéliser une région conservée d’un MSA
3.1.3 Modéliser l’enchaînement possible des régions conservées via un PLMA
3.2 Méthode de prédiction fonctionnelle phylogénomique
3.2.1 Prédictions de PPI par proĄlage phylogénétique
3.2.2 Propager des fonctions sur la base d’un arbre phylogénétique
4 ADAMTS-TSL, une famille multigène, multidomaine et multifonctionelle 
4.1 L’évolution dŠune famille multigène
4.1.1 Des duplications chez les vertébrés
4.1.2 Les événements évolutifs à l’origine de la complexité de la famille
4.2 Des protéines multidomaines
4.3 Des protéines multifonctionnelles
4.3.1 Des fonctions très variées
4.3.2 Association composition domaine/fonction
II Contributions 
5 Phylogénie des ADAMTS-TSL 
5.1 Études préliminaires des séquences ADAMTS-TSL
5.1.1 Séquences de nucléotides ou dŠacides aminés ?
5.1.2 Taxonomie des espèces
5.1.3 Méthodes préliminaires de construction du jeu de séquences
5.1.3.1 Jeu de séquences issues d’annotations
5.1.3.2 Jeu de séquences issues de relations d’orthologies
5.1.3.3 Relations indirectes et recherche itérative d’homologues
5.2 Construction d’un jeu de séquences considérant orthologues, paralogues et isoformes
5.2.1 Disponibilité des génomes annotés, des protéomes complets et sélection d’espèces
5.2.2 Récupération d’homologues ADAMTS-TSL avec OrthoFinder
5.2.3 Filtrage des isoformes et sélection dŠune séquence représentative
5.2.3.1 Regroupement des produits d’un gène
5.2.3.2 Séquence représentative et graphe de segments de gènes
5.2.4 Construction du jeu de données de référence
5.3 Inférence et contrôle de la phylogénie de référence des ADAMTS-TSL
5.3.1 Phylogénie de référence des ADAMTS-TSL
5.3.1.1 Inférence de l’arbre de référence des gènes ADAMTS-TSL
5.3.1.2 Arbre de référence ADAMTS-TSL
5.3.1.3 Comparaison avec la littérature
5.3.2 Robustesse de la phylogénie de référence à l’échantillonnage taxonomique
5.3.2.1 Support des bipartitions et robustesse à l’échantillonnage taxonomique
5.3.2.2 Exemple sur 8 espèces
5.3.2.3 Robustesse de l’arbre de référence
5.3.3 Contrôle des données et des méthodes exploitées pour calculer la phylogénie de référence
5.3.3.1 Robustesse des phylogénies aux méthodes d’alignement
5.3.3.2 Sélection d’un groupe externe
6 Évolution des compositions en modules des ADAMTS-TSL 
6.1 Description dŠun module de conservation
6.1.1 IdentiĄcation des modules
6.1.2 Visualisation des modules
6.2 Décomposition en modules conservés des 214 ADAMTS-TSL
6.3 Inférer lŠévolution des modules au cours de lŠhistoire des gènes
6.3.1 Considérer lŠévolution des segments dŠun module
6.3.1.1 Inférence dŠarbres phylogénétiques de modules
6.3.1.2 Réconciliation Module-Gène-Espèce
6.3.2 Interpréter la réconciliation en présence/absence de modules aux gènes ancestraux
6.3.2.1 Interprétation de mapping de feuille
6.3.2.2 Interprétation de mapping de co-divergence
6.3.2.3 Interprétation de mapping de duplication de module
6.3.2.4 Interprétation de mapping de transfert intra-gènes
6.3.2.5 Implémentation et inférence des compositions ancestrales en modules des ADAMTS-TSL
6.4 Arbre des gènes et évolution des compositions en modules
6.4.1 Visualisation quantitative des modules gagnés/perdus sur l’arbre de référence ADAMTS-TSL
6.4.2 Visualisation des modules présents, gagnés et perdus à un gène ancestral
6.4.3 Signature de modules
6.4.3.1 Visualisation d’une signature de modules
6.4.3.2 Automate d’une signature de modules
7 Évolution des phénotypes des ADAMTS-TSL 
7.1 Construction d’un jeu d’Interactions Protéine-Protéine
7.1.1 Extraction de PSICQUIC : 447 PPI impliquant les 26 ADAMTSTSL humaines
7.1.2 Substrats et recherche manuelle : 296 PPI impliquant les 26 ADAMTSTSL humaines
7.1.3 Synthèse des PPI des ADAMTS-TSL humaines
7.2 Annoter les séquences ADAMTS-TSL avec leurs interactions
7.2.1 Première approche : propager systématiquement les interactions aux orthologues
7.2.2 Seconde approche : laisser PastML inférer les interactions chez les orthologues
7.3 Évolution des Interactions Protéine-Protéine au sein de l’évolution des gènes ADAMTS-TSL
7.3.1 Interactions ancestrales des ADAMTS-TSL
7.3.2 Gains et pertes d’interactions au cours de l’évolution des gènes ADAMTS-TSL
8 Joindre l’évolution des modules et des interactions protéine-protéine au sein de l’arbre des gènes ADAMTS-TSL 201
8.1 L’arbre des gènes comme modèle
8.1.1 Une implémentation de la méthode
8.2 Représentation des évolutions jointes modules-interactions
8.2.1 Description du modèle par des Ąchiers tabulaires
8.2.2 Le problème de la visualisation des données
8.2.3 Description du modèle via une visualisation interactive de l’arbre sur Itol
8.3 Coapparition Module-Interaction
8.3.1 IdentiĄcation de 45 événements de coapparition modules-interactions
8.3.1.1 Diversité des événements de coapparitions
8.3.1.2 Localisation des modules impliqués dans des événements de coapparition
8.3.2 Convergence évolutive des interactions avec les protéines COMP et CCN2
8.3.2.1 Acquisitions multiples des interactions avec COMP et CCN2
8.3.2.2 Trois signatures en modules distinctes
8.3.2.3 La réinvention dŠinteractions comme acteur de la complexité de la matrice extracellulaire ?
8.3.3 Expansion paralogue des hyalectanases et spéciĄcités fonctionnelles d’ADAMTS-5
8.3.3.1 ADAMTS-5 : une hyalectanase particulière
8.3.3.2 Caractérisation de modules fonctionnels des hyalectanases et de ADAMTS-5
III Discussions et Perspectives
9 Discussions et Perspectives
10 Annexes 
10.1 Analysis of the uncertainty in the ADAMTS-TSL phylogenetic tree
10.2 Browsing the ADAMTS-TSL Itol tree
Bibliographie 

Lire le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *