Présentation des interactions protéine-protéine 

Télécharger le fichier pdf d’un mémoire de fin d’études

Caractérisation de la réponse cellulaire

Nous avons d’abord voulu mener une analyse préliminaire de manière à dégager les principales tendances des réponses transcriptionnelles étudiées. Pour cela, nous avons normalisé les données brutes et utilisé une méthode heuristique pour déterminer si u gène donné était induit ou réprimé à un temps donné.
Cette analyse nous ayant permis de mettre en évidence des phases de réponse, nous avons développé dans un second temps une analyse statistique, afin d’identifier les gènes mettant en évidence un comportement différent au cours des phases de réponse. Finalement, nous avons voulu comprendre les mécanismes biologiques sous-jacents.

Normalisation des données

Comme expliqué dans l’étude bibliographique (voir page 29), les puces sont scannées par un laser en utilisant différentes longueurs d’onde de manière à obtenir les intensités numériques de chaque spot. Ainsi, une mesure relative à l’intensité globale d’hybridation est obtenue pour chaque élément sur la puce. Dans notre cas, les puces à ADN ont été scannées avec le logiciel GenePix (GenePixTM Pro 4.0). Or, ces données de transcriptome sont bruitées et biaisées (voir page 31). Dans un premier temps, il était donc nécessaire de normaliser les données brutes. Nous avons alors choisi d’appliquer la méthode de normalisation la plus classiquement utilisée, à savoir le traitement du bruit de fond, puis le traitement du biais par rapport à l’intensité totale. Pour cela, nous avons tout d’abord soustrait le bruit de fond pour obtenir l’intensité du signal pour chaque spot. Nous avons ensuite utilisé le logiciel TIGR ExpressConverter (version 1.7) [Saeed et al., 2003] pour appliquer la normalisation lowess [Cleveland et Devlin, 1988] en nous basant sur la fonction locfit du logiciel TIGR Midas (version 2.19). Nous avons réglé le paramètre de lissage (smooth) à 0,33 comme cela est recommandé [Quackenbush, 2002] (voir page 32 pour le principe de cette normalisation). Les valeurs normalisées de chacun des deux canaux (Cy3 et Cy5) ont ensuite été combinées pour obtenir un ratio (voir Équation 1.1) ou un log-ratio (voir Équatio 1.2).ratio = log2(ratio) = log2(Cy3 Cy5) (1.2)

Analyse préliminaire des résultats

Une heuristique a tout d’abord été utilisée pour déterminer les tendances majeures des réponses transcriptionnelles des cellules soumises aux différents stress étudiés. Pour cela, nous avons sélectionné deux groupes de gènes : les gènes induits étaient ceux dont le ratio était supérieur à 1,9 ; les gènes réprimés étaient ceux dont le ratio était inférieur à 0,52 (= 1/1, 9).
Pour la réponse transcriptionnelle suite à un stress Cd, nous avons identifié deux phases. La première phase s’étale du point de départ jusqu’à 60 minutes (voir la Table 1.1). Elle est plutôt modérée dans la mesure où seulement 210 gènes sont différentiellement exprimés. Ces gènes sont majoritairement induits (63%). La seconde phase se produit entre 90 et 360 minutes. Elle est massive puisque 1 315 gènes sont différentiellement exprimés (37% du génome). Ces gènes sont répartis entre les induits et les réprimés de manière assez équilibrée (692 réprimés et 623 induits).
Concernant la réponse au stress induit par H2O2, elle apparaissait plus rapide et plus courte (voir la Table 1.2). Nous avons également identifié deux phases principales. La première phase comprend les deux premiers temps de la cinétique (15 et 30 minutes). Elle est massive car 1 459 gènes sont différentiellement exprimés. Ces gènes sont répartis entre les induits et les réprimés de manière assez équilibrée (781 réprimés et 678 induits). La seconde phase se situe à partir de 180 minutes. Seulement 446 gènes sont encore différentiellement exprimés au cours de cette phase (177 réprimés et 269 induits). Nous avons qualifiée cette phase de tardive dans la mesure où il s’agit d’une période pendant laquelle la plupart des gènes ayant répondu rapidement et fortement retrouvent un niveau d’expression normal, c’est-à-dire à peu près similaire à celui des gènes des cellules non traitées.
Les deux autres expériences réalisées dans le cas d’un stress permanent, à savoir l’excès de Fe et l’excès de Zn, n’ont pas permis de mettre en évidence des phases de réponse puisque seulement deux temps différents ont été considérés pour chaque stress. Dans le cas de l’excès de Zn d’abord, 28% des gènes sont différentiellement exprimés (406 réprimés et 429 induits). Très peu de gènes sont régulés lors du premier temps (60 gènes à 30 min). La réponse est plus importante lors du second temps (466 gènes régulés à 240 min). Ensuite, dans le cas de l’excès de Fe, 10% des gènes sont différentiellement exprimés (100 réprimés et 201 induits). Dans ce cas-ci, les deux temps (240 et 360 min) sont relativement similaires en termes de nombre de gènes induits et réprimés (voir Table 1.2).
Enfin, dans le cas du stress ponctuel mimé par la carence en Fe, il ne peut y avoir de phase de réponse puisqu’un temps unique est considéré. Certes une cinétique pourrait être construite en considérant les concentrations utilisées et non les temps, mais là encore, seules deux concentrations ont été considérées, ne permettant pas l’identification de phases. Dans le cas de ce stress, 15% des gènes sont différentiellement exprimés (226 réprimés et 220 induits). Pour les deux concentrations, les nombres de gènes induits et réprimés sont proches (voir Table 1.2).
Après avoir recherché les gènes régulés et identifié ces phases de réponse par une méthode heuristique, nous avons voulu vérifier la pertinence de ces résultats par une méthode statistique plus appropriée.

Identification des gènes globalement régulés

Afin d’identifier les gènes globalement régulés, c’est-à-dire induits ou réprimés au cours des réponses transcriptionnelles lors des différents stress étudiés, nous avons choisi d’utiliser un modèle linéaire. Pour cela, nous avons considéré les différents réplicats de tous les points de mesure de façon séparée, c’est-à-dire que nous n’avons pas calculé la moyenne des valeurs pour un temps donné. L’idée était de comparer l’ensemble des valeurs d’un gène donné à la valeur neutre qu’aurait un échantillon de contrôle, c’est-à-dire la valeur 0 si on considère les log-ratios. Nous avons choisi d’utiliser la construction de modèles linéaires implémentée dans le package Limma du logiciel Bioconductor [Gentleman et al., 2004], [Reimers et Carey, 2006] car cette méthode possède les deux principaux avantages de pouvoir prendre en compte un faible nombre de réplicats et d’être applicable rapidement sur des données réelles. En effet, nous ne disposions que de deux réplicats par point de mesure dans la plupart des cas. Pour identifier les gènes dont les niveaux d’expression étaient globalement régulés, nous avons donc utilisé une analyse bayésienne empirique pour estimer les paramètres du modèle (voir page 34). Ensuite nous avons effectué un test statistique (t-test) pour évaluer dans quelle mesure chaque gène suivait le modèle. Enfin, nous avons corrigé les p-values obtenues par une correction pour les tests multiples qui permettait de contrôler le taux de faux positifs (FDR) [Hochberg et Benjamini, 1990]. Pour limiter le taux de faux positifs à 5%, nous avons pu fixer un seuil à 103 sur la p-value en suivant la méthode de Benjamini-Hochberg (voir page 34).
En utilisant cette méthode, nous avons identifié un grand nombre de gènes régulés au cours de la cinétique Cd (voir la Table 1.3). En effet, 1 330 gènes ont été identifiés comme régulés, soit 37% du génome de Synechocystis. Pour les autres stress étudiés, moins de 60 gènes ont été identifiés.

Identification des gènes répondant en deux phases

Afin de vérifier la pertinence des phases identifiées dans les réponses transcriptionnelles induites par le Cd et par H2O2, nous avons également choisi d’utiliser un modèle linéaire. Pour chacune des deux cinétiques, nous avons extrait deux groupes de mesures représentant chacun une des deux phases précédemment identifiées (voir Section 1.2.2). Ainsi, dans le cas du Cd, le premier groupe comprend huit réplicats (15 à 60 minutes) et le second groupe comprend 10 réplicats (90 à 360 minutes). Dans le cas de H2O2, le premier groupe comprend quatre réplicats (15 à 30 minutes) et le second groupe comprend six réplicats (180 à 420 minutes)
Comme précédemment, nous avons utilisé le package Limma du logiciel Bioconductor [Gentleman et al., 2004], [Reimers et Carey, 2006] afin d’identifier les gènes dont les niveaux d’expression étaient significativement différents entre les deux phases des ciné- tiques. La procédure de Benjamini-Hochberg a également été appliquée afin de corriger les tests multiples avec le même seuil à 103.

Identification des classes de gènes co-exprimés

Pour regrouper les gènes co-exprimés, nous avons choisi d’étudier les profils d’expression des gènes, et en particulier leur similarité. L’une des approches les plus couramment utilisées pour identifier des classes de gènes ayant des profils d’expression similaires est la classification hiérarchique [Eisen et al., 1998]. Cette méthode permet d’obtenir plusieurs partitions possibles de l’ensemble des gènes. Cela implique entre autres que chaque gène appartient à une et une seule classe. Pourtant, un gène peut avoir plusieurs fonctions et par conséquent faire partie de plusieurs classes.
C’est pourquoi une autre approche a été développée en utilisant une classification pyramidale (voir page 38). Cette approche est une généralisation des hiérarchies (voir page 37). Elle permet notamment d’obtenir des classes éventuellement recouvrantes, et donc de tenir compte du fait qu’un gène peut avoir plusieurs fonctions. Toutefois, la complexité de l’algorithme qui réalise cette classification est telle qu’il ne peut être utilisé que sur un ensemble de départ d’au plus 250 individus.
Un modèle composite de classification a été proposé notamment pour palier ce problème de complexité (voir page 40). Ce modèle composite permet de combiner deux niveaux de flexibilité différents en se basant sur les hiérarchies et les pyramides. En effet, le modèle pyramidal est plus contraint et son utilisation locale permet de préciser l’ordre entre les objets.
À ce stade, nous avons alors voulu développer une méthode de classification mixte hiérarchique-pyramidale en nous basant sur ce modèle composite. Pour cela, nous avons d’abord adapté le modèle composite afin de l’appliquer au problème de la classification des profils de gènes. Ainsi, une hiérarchie est d’abord construite en partant de l’ensemble des gènes à classer, puis elle est découpée afin de définir des classes. Ces classes sont ensuite analysées plus finement à l’aide de pyramides. Pour réaliser cela, nous avons automatisé le découpage de la hiérarchie afin de développer une méthode de classification mixte hiérarchique-pyramidale que nous avons ensuite appliquée aux données d’expression chez Synechocystis.

Adaptation du modèle composite de classification

L’objectif était d’adapter le modèle composite afin de développer une méthode de classification mixte hiérarchique-pyramidale permettant d’identifier des classes de gènes éventuellement recouvrantes et applicable aux données biologiques. L’ensemble des individus est constitué des gènes que nous voulons classer. La méthode s’articule en trois étapes.
Dans un premier temps, nous avons défini une matrice de dissimilarité entre les gènes. Puis, nous avons construit une hiérarchie à partir de ces gènes et de leur dissimilarité.
Dans un deuxième temps, la hiérarchie a été découpée à un niveau d’indice donné de manière à obtenir une partition de l’ensemble de départ (voir Figure 1.1). En effet, si nous fixons une valeur seuil d’indice h de la hiérarchie, nous pouvons alors considérer la section de la hiérarchie à cette hauteur h. Toutes les classes dont l’indice est supérieur à h sont supprimées. Il nous reste alors un certain nombre n de nouvelles racines qui définissent des arbres disjoints. Chacun des ces n arbres engendre un sous-ensemble d’objets de l’ensemble de départ, autrement dit une classe. Ainsi, une partition de l’ensemble des objets à étudier est obtenue.
Dans un troisième temps, une pyramide a été construite pour chacune des n classes de gènes identifiées pour permettre une analyse plus fine des relations entre les gènes (voir Figure 1.1).

Automatisation du découpage de la hiérarchie

Une des questions principales de la méthode de classification mixte hiérarchiquepyramidale est de savoir comment déterminer le seuil de découpage de la hiérarchie. Notre but était d’automatiser ce choix. Pour cela, nous avons défini des critères tenant compte de la qualité globale de la partition obtenue pour un seuil de découpage donné, ainsi qu’un critère technique concernant l’algorithme de construction des pyramides.

Définition de critères de partitionnement

La question principale était donc de déterminer la valeur de l’indice à fixer pour le découpage de la hiérarchie et l’obtention de la partition. Il est clair que plus cette valeur est élevée et plus le nombre de classes est faible. Mais la taille de ces classes en est d’autant plus grande. Or, nous sommes confrontés à une limitation technique puisque l’algorithme de construction des pyramides, la CAP (voir page 38), ne peut s’appliquer qu’à 250 individus au plus.
La valeur maximale est celle de l’indice de la racine. Dans ce cas, la partition possède une classe unique qui est l’ensemble de départ. Par conséquent, ce découpage ne présente aucun intérêt. A l’inverse, une valeur d’indice proche de 0 se situe près des feuilles dont l’indice est nul par convention. Le nombre de classes est alors très élevé, proche du nombre total d’individus, et la taille des classes est très faible.
À ce stade, l’objectif était donc de définir un critère de partitionnement pour indiquer la valeur d’indice permettant d’obtenir la meilleure partition. Pour cela, nous avons choisi de quantifier la qualité d’une partition par la distance intra-classe d’une part et la distance inter-classes de l’autre. La distance intra-classe caractérise l’homogénéité de chaque classe. Par conséquent, la distance intra-classe globale d’une partition est d’autant plus faible que les éléments de chaque classe sont proches les uns des autres. La distance inter-classes, quant à elle, caractérise l’éloignement des classes les unes par rapport aux autres. Ainsi, une partition dont les classes sont très espacées a une distance inter-classes élevée. Notre objectif était d’obtenir une partition telle que ses classes étaient homogènes et éloignées les unes des autres. Par conséquent, nous avons choisi de maximiser la distance inter-classes et de minimiser la distance intra-classe. Nous avons utilisé les critères de Dunn et Davies-Bouldin définis par Bolshakova et al. comme suit [Bolshakova et Azuaje, 2003] : D(U) = min 1ic ( 1min jc,j=i ½max1δ(kXci, X {∆( j)Xk)}

Développement d’une méthode de découpage automatique d’une hiérarchie

Le but de cette méthode était d’utiliser une hiérarchie pour partitionner l’ensemble des individus considérés, afin de créer des classes de taille compatible avec l’algorithme de CAP et de meilleure qualité possible, en se basant sur les critères de taille et de partitionnement. Pour cela, nous avons suivi un parcours de la hiérarchie par indice décroissant, c’est-à-dire en partant de la racine et en descendant vers les feuilles. Un nombre de classes à étudier était fixé au départ comme paramètre. En effet, le but n’était pas d’obtenir directement des classes de petite taille mais plutôt de sélectionner des groupes d’individus assez différenciés, homogènes, quitte à recouper ceux qui contenaient trop d’individus. Néanmoins, il pourrait être intéressant de tester d’autres approches plus fines. Une idée serait par exemple de calculer une valeur d’indice pour certaines partitions régulièrement espacées, et d’en déduire, par une méthode de gradient, la zone de l’optimum du critère considéré.
Pour une hauteur donnée, nous avons donc testé la coupe de la hiérarchie à cette hauteur. Pour cela, nous avons considéré la qualité de la partition obtenue en calculant les indices de Dunn et Davies-Bouldin. Les classes qui optimisaient les différents critères étaient alors retenues.
À ce stade, si les critères sélectionnaient la même hauteur, cette dernière était choisie pour le découpage. Sinon, parmi les hauteurs qui optimisaient les critères, nous avons choisi de conserver la plus élevée dans la hiérarchie car ceci permettait de découper le moins possible la hiérarchie de départ, tout en sachant que les classes trop grandes étaient de toute façon redécoupées par la suite jusqu’à avoir un nombre d’individus inférieur au seuil fixé.
Cette méthode permet donc de découper automatiquement une hiérarchie en respectant strictement le critère de taille et en optimisant le critère de partitionnement.

Application de la classification mixte

Nous avons appliqué cette méthode de classification aux données transcriptome obtenues en réponse aux différents stress étudiés chez Synechocystis afin de classer les gènes. Nous considérons pour cela la distance euclidienne entre les valeurs d’expression des gènes. Dans un premier temps, nous avons étudié les gènes globalement régulés. Dans un second temps, nous avons étudié les réponses transcriptionnelles en deux phases mises en évidence dans le cas du Cd et de l’H2O2.

Classification des gènes globalement régulés

Dans le cas de la réponse au stress induit par le Cd, nous avons identifié 1 330 gènes globalement régulés (voir Section 1.2.3). Nous avons alors retiré les gènes qui avaient des valeurs manquantes provenant de problèmes techniques (hybridation des puces ; spots de mauvaise qualité) n’ayant pas permis d’obtenir des valeurs pour le niveau d’expression. Nous avions alors un ensemble de 1 264 gènes, représenté par une matrice des modalités de 1 264 × 22 (voir page 36). En effet, nous avions pour ce jeux de données 22 réplicats décrivant les deux phases. Puis, nous avons calculé la matrice de distance entre ces gènes.
Nous avons alors appliqué la méthode de classification mixte hiérarchique pyramidale à ces données. Nous avons obtenu une hiérarchie qui a ensuite été découpée pour obtenir huit classes de gènes pour lesquelles nous avons construit des pyramides. À partir des 1 264 gènes de départ, nous avons ainsi construit huit pyramides contenant 62, 238, 97, 211, 218, 140, 148 et 150 gènes (voir la Figure 1.2 et l’Annexe D).
Nous avons observé que les deux premières classes reflétaient les deux tendances majeures de comportement, à savoir l’induction (profil positif) et la répression (profil négatif). L’ensemble des 608 gènes induits étaient séparés en quatre classes (les classes 1, 2, 7 et 8 sur la Figure 1.2). Les gènes réprimés étaient également séparés en quatre classes (les classes 3, 4, 5 et 6 sur la Figure 1.2). Certaines classes montraient des gènes dont les profils étaient proches, comme les classes 7 et 8. La classe d’origine était effectivement relativement homogène mais a du être découpée car sa taille (308 gènes) excédait le seuil de 250 autorisé pour réaliser une pyramide.

Classification des gènes répondant en deux phases

Deux phases de réponse ont pu être identifiées pour les deux cinétiques Cd et H2O2. Nous avons donc appliqué la classification mixte à ces deux jeux de données.
Dans le cas de la réponse au stress induit par le Cd, nous avons identifié 791 gènes répondant en deux phases (voir Section 1.2.3). Puis, nous avons retiré les gènes qui avaient des valeurs manquantes comme précédemment (voir Section 1.3.3.1). Nous avions alors une matrice des modalités de 754 × 18 (voir page 36) que nous avons utilisée pour construire la matrice de distance.
L’application de la méthode de classification mixte hiérarchique pyramidale à ces données nous a permis d’obtenir une hiérarchie découpée en cinq classes. À partir des 754 gènes de départ, nous avons ainsi construit cinq pyramides contenant 43, 172, 161, 228 et 150 gènes (voir la Figure 1.3).

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

Introduction
I Étude bibliographique 
1 Analyses de données transcriptome 
1.1 Sélection des gènes différentiellement exprimés
1.2 Classification des profils d’expression des gènes
1.2.1 Formalisation des données
1.2.2 Le modèle hiérarchique
1.2.3 Le modèle pyramidal
1.2.4 Le modèle composite de classification
1.3 Relations entre propriétés et niveau d’expression
2 Présentation de la notion d’homologie 
2.1 Définitions
2.2 Détection des homologues
3 Présentation des interactions protéine-protéine 
3.1 Identification des interactions protéine-protéine
3.1.1 Le double-hybride : Y2H
3.1.2 La spectrométrie de masse de complexes purifiés : AP-MS
3.2 Modélisation des interactions protéine-protéine
3.3 Prédiction des interactions protéine-protéine
3.3.1 Méthodes de conservation du contexte génomique
3.3.2 Méthodes de co-évolution
3.3.3 Méthodes basées sur les domaines
3.3.4 Méthodes basées sur la structure
3.3.5 Méthodes d’apprentissage
4 Intégration des données 
4.1 Présentation des questions biologiques
4.2 Présentation des méthodes d’intégration
II Démarche 
1 Caractérisation des classes de gènes régulés 
1.1 Présentation du dispositif expérimental
1.1.1 Choix des agents inducteurs de stress
1.1.2 Choix de l’organisme d’étude
1.1.3 Choix des procédures expérimentales
1.2 Caractérisation de la réponse cellulaire
1.2.1 Normalisation des données
1.2.2 Analyse préliminaire des résultats
1.2.3 Identification des gènes globalement régulés
1.2.4 Identification des gènes répondant en deux phases
1.2.5 Interprétation biologique des résultats
1.3 Identification des classes de gènes co-exprimés
1.3.1 Adaptation du modèle composite de classification
1.3.2 Automatisation du découpage de la hiérarchie
1.3.3 Application de la classification mixte
1.4 Mise en évidence de biais de composition
1.4.1 Développement d’une méthode de détection de biais
1.4.2 Application à Synechocystis
1.4.3 Implémentation d’un outil de détection de biais
2 Inférence de réseaux d’interactions protéine-protéine 
2.1 Développement de méthodes de prédiction
2.1.1 La méthode InteroRBH
2.1.2 La méthode InteroBH
2.1.3 La méthode InteroPorc
2.2 Construction d’un réseau PPI chez Synechocystis
2.2.1 Les interactions sources
2.2.2 Les relations d’orthologie potentielles
2.2.3 Les interactions obtenues avec la méthode InteroRBH
2.2.4 Les interactions obtenues avec la méthode InteroBH
2.2.5 Les interactions obtenues avec la méthode InteroPorc
2.3 Analyse du réseau d’interactions chez Synechocystis
2.3.1 Domaines d’interaction
2.3.2 Annotations fonctionnelles
2.3.3 Conservation à travers les espèces
2.3.4 Identification par différentes techniques expérimentales
2.3.5 Mise en évidence expérimentale
2.3.6 Comparaison avec STRING
2.4 Développement d’un outil de prédiction de PPIs
2.4.1 Introduction
2.4.2 Présentation de l’outil automatique InteroPorc
2.4.3 Applications de l’outil InteroPorc
3 Comparaison avec les données expérimentales 
3.1 Analyse des données expérimentales
3.1.1 Représentation des données
3.1.2 Sélection et description des jeux de données
3.1.3 Évaluation de la couverture
3.1.4 Analyse de l’asymétrie des méthodes de détection
3.2 Comparaison des listes d’interactions
3.2.1 Identification de l’intersection
3.2.2 Description de l’intersection
3.3 Comparaison des topologies
3.3.1 Analyse des paramètres globaux
3.3.2 Distributions des coefficients
3.3.3 Recherche d’un modèle de graphe aléatoire
3.4 Comparaison des décompositions en modules
3.4.1 Méthodes d’extraction de modules
3.4.2 Détermination des paramètres optimaux
3.4.3 Comparaison des résultats
4 Étude de la dynamique des relations entre protéines 
4.1 Identification de modules co-exprimés
4.1.1 Extraction de modules
4.1.2 Extraction de modules régulés
4.1.3 Extraction de modules d’intérêt
4.2 Caractérisation de la dynamique des modules
4.2.1 Création des modules
4.2.2 Analyse des transitions
4.2.3 Identification de modules stables
4.2.4 Identification de groupes isolées
Discussion 
Conclusion 
III Annexes 
A Profils d’expression de familles de gènes 
B Propriétés des acides aminés 
B.1 Liste des acides aminés
B.2 Calcul des paramètres étudiés dans BiasSeeker
B.2.1 Caractérisation des propriétés générales
B.2.2 Caractérisation des propriétés des acides aminés
B.2.3 Caractérisation de la composition en acides aminés
B.2.4 Caractérisation de la composition en atomes
C Tests statistiques 
C.1 Test de Wilcoxon
C.2 La cinétique Cd chez S. cerevisiae
C.3 La cinétique Cd chez Synechocystis
C.3.1 Comparaison des gènes globalement régulés
C.3.2 Comparaison des gènes répondant en deux phases
C.4 La cinétique H2O2 chez Synechocystis
C.4.1 Comparaison des gènes globalement régulés
C.4.2 Comparaison des gènes répondant en deux phases
C.5 Test hypergéométrique
D Classes de gènes 
E Mesure de similarité 
F Informations sur l’outil InteroPorc 
G Jeux de données d’interactions protéine-protéine 
G.1 Obtention des données
G.2 Caractérisation des données
H Topologie 
H.1 Étude des données expérimentales
H.2 Définition des paramètres topologiques
H.2.1 Définitions des paramètres
H.2.2 Comparaisons des paramètres
H.3 Simulations avec des modèles de graphes
I Identification de modules 
I.1 Décomposition des temps des cinétiques par MCL
I.2 Obtention d’une liste de protéines d’intérêt
I.3 Analyse des transitions
Quelques liens 
Références 

Télécharger le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *