Evolution et modélisation de processus biologiques

La biologie des systèmes

   Les systèmes biologiques comme les organismes, les cellules ou les biomolécules sont des systèmes organisés au travers de leurs structures et leurs fonctions. Ces systèmes ont été façonnés par l’évolution. Le dogme central de la biologie moléculaire peut être résumé de la façon suivante : les gènes codent pour des ARN messagers, les ARN messagers servent de modèles de synthèse pour les protéines et les protéines effectuent le travail de maintien et de développement cellulaire. Bien que l’information soit stockée dans les gènes sous la forme de séquence ADN, l’expression est rendue possible au travers de la machinerie cellulaire qui décode cette séquence, la traduit, donnant ainsi naissance à une structure et à une fonction. La description des entités biologiques et de leurs propriétés peut se penser sur plusieurs niveaux d’organisation et sur différentes échelles de temps : nous pouvons étudier des phénomènes biologiques à l’échelle de populations, d’individus, de tissus, d’organes, de cellules, de compartiments et jusqu’à l’échelle moléculaire. Ces systèmes, ou entités, peuvent avoir des dimensions allant de l’ordre du mètre (pour l’homme) au micromètre pour de nombreux types cellulaires. Les échelles de temps, au cours desquelles ces systèmes évoluent, vont de millions d’années de processus évolutifs à la seconde pour de nombreuses réactions biochimiques. De plus, chaque action dans la cellule implique différents niveaux d’organisation, incluant les voies de signalisation, les réseaux de régulation ainsi que le métabolisme de la cellule. Ces différents niveaux organisationnels interagissent entre eux et chaque réseau individuel doit ainsi être pensé, sinon intégré, dans un cadre plus large. En étudiant ces réseaux biologiques, nous pouvons être confrontés à des processus complexes qui ne peuvent pas être a priori expliqués, et dont l’issue ne peut être prédite par la seule intuition. En effet, des expériences permettent de générer des hypothèses sur le fonctionnement de processus biologiques, mais il demeure difficile de déterminer si ces hypothèses peuvent être combinées car il est souvent délicat de prévoir le comportement global d’un système complexe à partir de la seule connaissance de ses parties. Des modèles mathématiques et des simulations numériques peuvent alors aider à appréhender la dynamique de processus biologiques dans leurs globalités, à prédire leurs comportements et à comprendre l’effet de leurs interactions avec l’environnement. Cette approche holistique contraste avec l’approche plus réductionniste de la biologie moléculaire. Le basculement vers une approche systémique s’effectue de façon progressive depuis la fin du 20e siècle, notamment avec l’émergence de nouvelles techniques de séquençage ayant permis une observation, à l’échelle d’un système, de l’organisation des réseaux cellulaires. Ces observations ont révélé la grande complexité de ces réseaux qu’il était difficile d’appréhender en étudiant individuellement leurs composants. L’approche traditionnelle en biologie moléculaire consiste à scinder un système en plusieurs parties, d’en analyser chaque élément pour ensuite réassembler les parties en un système entier. En complément, l’intention de la biologie des systèmes consiste à modéliser et à comprendre le système entier en se fondant sur le paradigme suivant : le système entier contient plus d’informations que la somme de ses parties et ne peut être compris que comme un tout (Kitano, 2002). Au sens large, un modèle est une représentation mathématique d’objets ou de processus qui explique les caractéristiques de ces objets ou de ces processus. Il existe cependant plusieurs paradigmes de modélisation : un ensemble de réactions biochimiques peut être représenté par un graphe avec des sommets correspondant aux métabolites et où les arrêtes spécifient les réactions entre métabolites ; ou bien, ce même réseau peut aussi être décrit par un système d’équations différentielles qui permet de prédire sa dynamique au cours du temps. Au-delà des concepts physiques généraux, un modèle doit également tenir compte des spécificités du système d’intérêt qui peuvent être justifiées par des travaux expérimentaux, par les connaissances biochimiques acquises sur plusieurs acteurs ainsi que par l’extrapolation de propriétés de systèmes proches dans l’évolution : un modèle doit être capable de résumer les connaissances acquises sur un système dans un cadre mathématique cohérent. Aussi, un modèle peut se définir comme la description d’un système en utilisant un langage et des concepts mathématiques. Les modèles sont toujours composés d’un ensemble de variables, de liens établissant des relations entre les variables, et d’un ensemble de contraintes (Le Novère, 2015). Le modèle mathématique d’un système sera constitué de ces trois structures, quel que soit le formalisme de modélisation utilisé. Premièrement, les variables représentent des constituants physiques (comme les molécules) ou des paramètres (comme les vitesses de synthèse et de dégradation, les constantes d’association) qui peuvent varier pendant la simulation. Ces variables correspondent aux entités biologiques, entités connues dont nous souhaitons prédire la cinétique. Notons aussi qu’elles sont utilisées pour comparer les prédictions du modèle et les résultats expérimentaux. Deuxièmement, les liens mathématiques unissent les variables et représentent ce qui est déjà connu ou ce que nous souhaitons tester au travers du modèle. Ces relations mathématiques peuvent prendre plusieurs formes. Sans être exhaustif, il peut s’agir d’un changement de vitesse de synthèse d’une variable en fonction de la valeur d’une autre variable, d’une règle logique dans le cadre des modèles booléens ou l’assignation d’une valeur à une variable en fonction de la valeur d’une autre variable pour les formalismes basés sur des règles d’assignement. Troisièmement, les contraintes représentent le contexte de l’analyse mais aussi les processus ignorés lors de celle-ci. Parmi les contraintes, nous pouvons citer les conditions initiales du système (les valeurs prises par l’ensemble des variables au début de la simulation), les quantités qui ne peuvent pas être négatives ou, par exemple, ne pas être supérieures à un certain seuil pour certaines variables. Même des processus cellulaires simples impliquent de nombreux composants moléculaires et présentent des comportements non linéaires qui peuvent, de surcroît, interagir de manière complexe. Des modèles mathématiques d’interactions pertinentes à l’intérieur d’un système peuvent alors aider à décrire la structure du système de façon non ambiguë, à fournir une compréhension de sa fonction et à prédire le bon (ou le mauvais) comportement du réseau construit en regard des résultats expérimentaux. Grâce, entre autres, aux modèles mathématiques de réseaux de régulation, la biologie des systèmes est donc devenue une part importante des méthodologies utilisées en recherche en biologie. En complément du travail expérimental, les simulations numériques ont comme objectif de comprendre les bases moléculaires des fonctions cellulaires et de prédire les propriétés émergentes de systèmes complexes. Par exemple, les travaux sur la chimiotaxie bactérienne (Bray et al., 1993, Tindall et al., 2012) fournissent un exemple de recherche collaborative entre approche expérimentale et modélisation. Dans ce travail pionnier de modélisation du chimiotactisme bactérien, Bray et collaborateurs ont regroupé dans un réseau de réactions biochimiques l’ensemble des mécanismes connus jusqu’alors. Le réseau simulé reproduit précisément le phénotype de plus de 30 mutants, parmi lesquels des composés sont supprimés et/ou surexprimés, fournissant des cinétiques de réponses similaires à celles observées in vivo. Par ailleurs, notons que les modèles développés ces dernières années ont augmenté en taille comme le montre la reconstruction récente du métabolisme humain (Thiele et al., 2013). De plus, la modélisation complète d’un microorganisme (Karr et al., 2012) réalisée chez Mycoplasma genitalium ou encore les modèles multi-échelles d’organismes chez Arabidopsis thaliana (Chew et al., 2014) prouvent qu’il est maintenant possible de modéliser, généralement sous forme modulaire, des réseaux de régulation avec des niveaux de précision et de complexité de plus en plus élevés. Les modèles mathématiques fournissent donc un moyen de tester, in silico, des hypothèses biologiques (Nelander et al., 2008, Ogilvie et al., 2015). Ils permettent également de résumer de façon cohérente l’ensemble des résultats publiés et d’assembler l’information disséminée dans un cadre mathématique cohérent en fonction des données disponibles et des questions auxquelles l’on souhaite répondre. La modélisation permet aussi de comparer le modèle généré avec des données publiées disponibles ou de le mettre en regard de nouveaux résultats expérimentaux (mutants ou traitement médicamenteux par exemple (Flobak et al., 2015). Après plusieurs cycles de raffinement du modèle, ce dernier est particulièrement utile lorsqu’il permet de confirmer (ou d’infirmer) des hypothèses par rapport à l’intuition initiale, ou bien lorsqu’il permet de suggérer de nouvelles expériences (voir Figure 1 pour une vue schématique du processus de reconstruction et d’analyse de modèle).

État de l’art sur les différents formalismes de modélisation

   À un niveau abstrait, les composants d’un réseau peuvent être réduits à un ensemble de nœuds. Ces nœuds sont connectés les uns aux autres par des arêtes, chaque arête représentant une interaction entre deux composants. Les nœuds et les arêtes forment ensemble un réseau ou, selon un langage mathématique plus formel, un graphe. Habituellement, les interactions entre gènes sont représentées par des réseaux dans lesquels les gènes sont des sommets et les arêtes représentent les connexions régulatrices. Ces réseaux sont connus sous le nom de réseaux de régulation (Figure 2). La protéine pz agit comme inhibiteur de l’expression du gène y alors que py agit comme activateur de l’expression de du gène x. (b) Les interactions entre les entités du réseau peuvent être représentées sous forme de graphe. (c) Variables du modèle. (d) Relation mathématique entre les variables sous la forme d’équations différentielles ordinaires. (e) En résolvant les équations du modèle, nous pouvons obtenir des prédictions pour les concentrations des variables d’état au cours du temps. L’augmentation des ressources computationnelles associée à la génération de grandes quantités de données sous forme numérique a permis le développement d’un certain nombre de méthodes afin de modéliser et de simuler ces réseaux de régulation. Cette diversité d’approches a parallèlement conduit à la naissance d’une incertitude quant au choix de la méthode la plus adaptée lors de la mise en œuvre d’une approche de modélisation (Le Novère, 2015). Plusieurs paradigmes de modélisation ont été développés dans le cadre de l’analyse des réseaux de régulation. Ces modèles peuvent globalement être divisés en deux classes de modèles : les modèles qualitatifs, et les modèles quantitatifs. Nous pouvons définir les modèles qualitatifs comme des modèles mathématiques dans lesquels les valeurs discrètes des variables sont déterminées par les combinaisons logiques des valeurs des autres variables. En complément, les modèles quantitatifs sont des modèles mathématiques dans lesquels les valeurs des variables sont déterminées par les paramètres du système et par l’analyse numérique des variables. Chaque approche possède ses avantages et ses faiblesses. Suite à des développements récents, il est aussi possible que les approches dites hybrides, mélangeant à la fois paradigmes quantitatifs et qualitatifs, prennent une place de plus en plus importante en modélisation. Les modèles quantitatifs qui sont souvent basés sur l’application des cinétiques chimiques ont été utilisés pour simuler pléthore de réseaux métaboliques, de voies de signalisation et de réseaux de régulation de gènes (voir l’article de revue Chen et al., 2010). Ces modèles permettent d’obtenir des concentrations exactes de molécules et d’examiner de façon fine la temporalité des acteurs du système. Parallèlement, l’apport d’expérimentations conduisant à une compréhension qualitative du système, comme des criblages phénotypiques, ont mené au développement de méthodes pour modéliser des réseaux de régulation de gènes sur la base de règles logiques (modélisation logique) (Thomas, 1973), permettant de répondre à des questions de nature plus qualitative. Dépendant à la fois de la taille du modèle, de la nature et de la quantité de données disponibles et de la granularité des réponses attendues des simulations, différentes approches peuvent être utilisées pour représenter des mécanismes de régulation. Utilisés avec des données expérimentales quantitatives, les modèles quantitatifs sont des outils puissants pour décrire et comprendre des systèmes biologiques. Leurs simulations fournissent des prédictions quantitatives dans le temps qui peuvent être déterminantes dans la compréhension de processus biologiques. Cependant, bien que la modélisation quantitative soit un formalisme naturel pour représenter des réseaux de molécules et qu’elle fournisse des prédictions précises, le manque de données cinétiques empêche son utilisation dans un certain nombre de cas, rendant alors l’utilisation des formalismes qualitatifs préférable (Figure 3). Les formalismes de modélisation sont listés le long de l’échelle, allant des modèles qualitatifs aux modèles quantitatifs. Nous présenterons ici, sans être exhaustif, certains formalismes de modélisation (réseaux booléens, réseaux de Petri, les équations différentielles ordinaires ainsi que les modèles stochastiques). Ainsi, les équations différentielles linéaires par morceaux, formalisme proche des modèles logiques par leur niveau d’abstraction ne seront pas présentées (de Jong et al., 2004, Casey et al., 2006). De même, les analyses de flux, très largement utilisées pour les modèles de métabolismes ne seront pas traitées ici (Dandekar et al., 2014).

Les réseaux de Petri

   Les réseaux de Petri, nommés d’après Carl Petri (Petri, 1964), offrent une représentation graphique et un formalisme mathématique applicable à la modélisation de systèmes concurrents (Petri, 1962, Murata, 1989, Chaouiya, 2007, Koch et Heiner, 2008). Un réseau de Petri standard est un graphe orienté biparti (composé de deux classes de sommets tels que deux sommets de la même classe ne sont pas connectés) : les places et les transitions (voir Figure 5). En biologie, les places représentent généralement les ressources du système comme, par exemple des protéines, des métabolites ou même des gènes. Les transitions représentent les événements pouvant changer l’état des ressources. Les places et les transitions sont alors interconnectées par des arcs dirigés et orientés qui décrivent les relations entre ressources et événements. Ainsi, les arcs ne connectent seulement que des sommets de nature différente. Dans la représentation graphique, les places sont représentées par des cercles, les transitions par des carrés et les arcs dirigés par des flèches. Un arc connecte ainsi une réaction (une transition) avec ses préconditions, les substrats de la réaction d’une réaction (les pré-places), avec les post-conditions, les produits d’une réaction (post-places). Le poids des arcs définit le nombre d’éléments d’une ressource qui est consommé ou produit par une transition. Ce sont les coefficients stœchiométriques des réactions. Enfin, les jetons sont les éléments dynamiques du réseau et peuvent se déplacer d’une place à une autre selon la transition connectant les deux places. Pour une place représentant une ressource, le nombre de jetons de cette place indique le nombre de ressources disponibles pour cette place (par exemple le nombre de protéines). À chaque instant dans réseau de Petri, une place peut contenir 0 ou un nombre entier positif de jetons. La distribution du nombre de jetons sur l’ensemble des places décrit un état du système, appelé aussi marquage du réseau de Petri. Le marquage initial exprime l’état initial du système. Pour démarrer le réseau, les transitions doivent être réalisables. Une transition est dite réalisable si ses pré-places contiennent au moins autant de jetons que le nombre défini par le poids des arcs connectés aux pré-places de la transition. À tout moment, chaque transition qui a suffisamment de jetons dans ses préplaces peut être déclenchée. Si une transition est réalisée, le nombre requis de jetons est retiré des pré-places et le nombre requis de jetons est ajouté aux post-places, selon le poids de chaque arc. Ce mouvement de jetons représente alors l’évolution dynamique du système. Dans l’exemple présenté, les transitions t1 et t3 peuvent être déclenchées en alternance indéfiniment, alors qu’aucune autre transition ne peut être déclenchée après le déclenchement de t2 (Figure 5).

Les modèles stochastiques

   En complément des modèles déterministes, les modèles stochastiques permettent d’introduire du bruit, de l’aléatoire, dans le comportement des systèmes. En effet, de nombreuses preuves expérimentales suggèrent que l’expression génique, à la fois chez les eucaryotes et les procaryotes, est un processus intrinsèquement stochastique (Elowitz et al., 2002, Rao et al., 2002, Longo et al., 2006). Cela est particulièrement vrai lorsque les réactions biochimiques cellulaires (e.g. liaison/dissociation de facteurs de transcription aux promoteurs, traduction, etc.) sont réalisées par des molécules présentes en faible quantité, rendant les formalismes déterministes peu précis pour décrire le comportement d’une cellule (Paulsson 2002, Wilkinson 2006). En effet, il existe une variabilité inter-cellulaire, dite « intrinsèque », liée au déplacement des molécules de façon aléatoire à l’intérieur de la cellule entraînant une fluctuation de l’expression génique et une variabilité, dite « extrinsèque », liée à la fluctuation des autres composants cellulaires (Elowitz et al., 2002). La stochasticité des processus biologiques n’est pas considérée lors de la modélisation par équations différentielles ordinaires en moyennant les comportements divergents au sein d’une population cellulaire. Tout réseau biologique est composé de réactions de nature stochastiques et peut alors avoir des issues différentes à partir d’une même condition initiale. Lorsque le nombre de molécules impliquées dans un processus est important, la loi d’action de masse peut être utilisée pour calculer la variation de concentration et quasi aucun effet stochastique n’est observable. Cependant, lorsque le nombre de molécules impliquées dans la régulation d’un processus est faible, il est alors possible d’observer des effets stochastiques comme dans le processus décisionnel du phage lambda d’entrée en phase lytique ou en phase lysogénique (Arkin et al., 1998) ou lors du déclenchement de la compétence chez Bacillus subtillis (Süel et al., 2006). Ainsi, des expériences menées à l’échelle de la cellule unique ont montré l’aspect stochastique des processus de transcription et de traduction (Ozbudak et al., 2002, Raj et al., 2006, Cai et al., 2006).

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

I. Introduction
1. La biologie des systèmes
2. État de l’art sur les différents formalismes de modélisation
a. Les réseaux booléens
b. Les réseaux booléens probabilistes
c. Les réseaux de Petri
d. Les équations différentielles ordinaires
e. Les modèles stochastiques
f. Limites des approches quantitatives et qualitatives
g. Les modèles hybrides
3. Description du modèle biologique : la régulation de la transformation génétique
a. Le transformasome
b. Description de la régulation
c. Chez Bacillus subtilis
d. Chez les streptocoques
4. État de l’art des modèles développés de régulation de la compétence
a. Chez Bacillus subtilis
b. Chez les streptocoques
II. Construction et analyse statique du réseau de régulation ComCDE
1. Simplifications réalisées pour concevoir le modèle
2. Initiation de l’état de compétence : le système à deux composantes ComD/ComE
3. Le régulateur central ComX
4. L’arrêt de l’état de compétence
5. Construction du réseau de Petri
6. Analyse des invariants structuraux
III. Analyse dynamique du réseau de régulation ComCDE
1. Construction du système d’équations différentielles ordinaires
2. Utilisation des données de fusion transcriptionnelle
3. Traitement des données de luminescence
4. Évidences expérimentales aidant à l’estimation des paramètres
5. Optimisation des paramètres du modèle
6. Analyse de la dynamique du système
7. Comparaison des modèles alternatifs
8. Étude de l’effet du pH du milieu sur le développement de la compétence 
9. Effet du niveau basal d’expression de comCDE
10. La cinétique de ComE~P et analyse de l’espace des phases
11. Étude de la période de non réponse au CSP
IV. Discussion
V. Conclusion et perspectives
VI. Liste des abréviations
VII. Bibliographie

Rapport PFE, mémoire et thèse PDFTélécharger le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *