Génomes bactériens : contraintes et tolérances de l’organisation génétique

Génomes bactériens : contraintes et tolérances de l’organisation génétique

L’ADN est le support universel de l’information génétique. La réplication, semi-conservative et fidèle, est un élément de préservation de l’information à l’identique, ou presque, au travers des générations. Malgré ce mécanisme universel de préservation de l’information génétique, les variations des différents paramètres qui caractérisent les génomes sont telles qu’un génome bactérien modèle n’existe pas.

Organisation et expression des gènes 

Différents niveaux d’organisation des gènes, liés ou pas à leur expression, structurent le génome bactérien.

Taille et densité en gènes des génomes bactériens

La taille des génomes bactériens est extrêmement variable et ce indépendant de l’appartenance à un phylum en particulier,construite à partir de tous les génomes bactériens complets disponibles dans la base de données RefSeq (13.921 génomes). Dans cette liste, le plus petit des génomes mesure 105.760 paires de bases (pb) et correspond à un endosymbiote appartenant au phylum des Protéobactéries, Candidatus Hodgkinia cicadicola (Łukasik et al., 2019). À l’opposé, le plus grand génome bactérien de cette liste est Minicystis rosea (Garcia et al., 2014). Il appartient aussi au phylum des Protéobactéries, est 150 fois plus grand et mesure 16.040.666 pb.

De ces observations émerge la question du génome minimal et à l’inverse du génome maximal. Les plus petits génomes correspondent à des organismes endosymbiotiques (Moran and Bennett, 2014), vivant donc dans un environnement bien défini et où des fonctions cellulaires obligatoires sont assurées par l’organisme hôte. À l’inverse, les plus grands génomes bactériens correspondent à des espèces vivant de manière autonome dans des milieux complexes et changeants, en effet dans des conditions stables, des modifications drastiques du génome sont rares (Barrick et al., 2009). Des bactéries vivant dans de tels milieux doivent être “armées” pour résister à un très grand nombre de stress différents. Cela se traduit par un plus grand nombre de gènes et donc des génomes plus grands (corrélation directe entre la taille des génomes et le nombre de gènes (Bird, 1995)) distinguant deux catégories fonctionnelles : les gènes essentiels, obligatoires au développement végétatif de la cellule quelles que soient les conditions et les gènes accessoires permettant à la cellule de s’adapter à des conditions données. En se plaçant dans une niche écologique extrêmement riche, tolérant l’auxotrophie de la cellule pour un maximum de composés organiques, la notion de génome minimal a été abordée dès l’accès aux deux premiers génomes entièrement séquencés et assemblés en 1995 (Koonin, 2000; Maniloff, 1996) : Haemophilus influenzae (Fleischmann et al., 1995) et Mycoplasma genitalium (Fraser et al., 1995). À partir de la comparaison entre ces deux génomes, un groupe commun de 250 (A. R. Mushegian and Koonin, 1996) puis 206 (Gil et al., 2004) gènes a été extrait, largement inférieur au nombre de gènes de chaque organisme, respectivement de 1.815 et 525 gènes. De nombreux travaux ont été conduits pour construire le plus petit génome possible pour qu’un organisme puisse se développer de manière autonome. Ce génome serait composé, a priori, des seuls gènes obligatoires au développement d’un organisme dans des conditions idéales. En 2016, à partir du génome de Mycoplasma mycoides, un génome minimal de 473 gènes fut construit (Hutchison et al., 2016) avec pour objectif de construire une “cellule si simple que l’on peut déterminer les fonctions moléculaires et biologiques de chaque gène”. Parmi ces 473 gènes, 149 possèdent une fonction biologique inconnue montrant l’existence de facteurs et/ou d’interactions nécessaires à la vie non caractérisés à ce jour.

D’un point de vu plus général, les bactéries symbiotiques sont caractérisées par une tendance à la réduction de leur génome (Moran and Bennett, 2014; McCutcheon and Moran, 2012). Cette observation est probablement une conséquence combinée du biais mutationnel vers les délétions communément observé chez les bactéries (Mira et al., 2001), de l’absence de sélection contre les pertes de gènes dans les environnements stables. À l’inverse, dans des environnements complexes et changeants, une expansion des génomes induisant une accumulation de différents répertoires de gènes est observée. Les processus qui conduisent à l’expansion des génomes regroupent principalement l’intégration de gènes étrangers et l’amplification de familles de gènes (Wang et al., 2011; Tsai et al., 2018). Différents facteurs limitent la taille maximale d’un génome comme le temps de génération, la vitesse de réplication, l’énergie nécessaire à la réplication et enfin la taille physique du génome et celle de la cellule.

Les génomes procaryotes présentent une densité d’ADN codant élevée (ie proportion de la somme des taille des séquences codantes par rapport à la taille totale d’un génome en paire de bases), entre 85 et 90 % (Land et al., 2014; McCutcheon and Moran, 2012) . Cela révèle une pression forte sur la taille des génomes qui s’oppose à l’accumulation de séquences d’ADN non fonctionnelles. L’augmentation de la taille du génome chez les bactéries s’accompagne donc d’une augmentation du nombre de gènes à la différence des eucaryotes. Les rares génomes qui présentent une faible densité appartiennent à des organismes symbiotiques ou des pathogènes obligatoires. C’est la cas de Serratia symbiotica str. Cinara cedri, par exemple, qui est un symbiote d’insecte et présente une densité en gènes de 38 % ou encore de Nostoc azollae 0708 est un symbiote de plante avec une densité de 52 % (Land et al., 2015). Un autre cas bien décrit est celui de Mycobacterium leprae, espèce proche Mycobacterium tuberculosis. Le génome complet de M. leprae contient 3.268.203 pb (Cole et al., 2001) et 49,5 % d’ADN codant contre un génome de 4.411.532 pb et 90,8 % d’ADN codant pour M. tuberculosis (Cole et al., 1998). Chez M. leprae, 27 % du génome correspond à des pseudogènes qui ont des homologues fonctionnels chez M. tuberculosis. Cet exemple illustre un cas extrême d’évolution dite réductive (Cole et al., 2001) où le changement brusque d’habitat lève la pression de sélection sur de nombreux gènes favorisant leur délétion ou dégénérescence (pseudogénisation) à grande échelle. Une des rares exceptions connues à ce jour est la Cyanobactérie Trichodesmimum erythraeum avec seulement 63 % de densité en gènes, mais qui ne présente aucune condition de vie particulière pouvant expliquer la réduction de sa proportion en génome codant (Pfreundt et al., 2014).

Le core et pan-génome

La disponibilité croissante de génomes complètement séquencés a changé notre vision de l’évolution des génomes et a révélé les flux des gènes importants entre les organismes. Le concept de stabilité d’un génome a cédé la place à une vision plus dynamique dans laquelle les génomes peuvent perdre ou gagner des gènes (Snel, 2001). Au sein d’un même groupe taxonomique, comme par exemple l’espèce, la variabilité génomique peut être très importante (Touchon et al., 2009). Le terme pan-génome fut proposé pour représenter l’ensemble de la diversité génétique d’un ensemble d’individus (Tettelin et al., 2005), c’est-à-dire l’ensemble des gènes de tous les génomes analysés. Par opposition, les gènes partagés par tous les individus du groupe, définissent le core-génome. Dans la littérature, de nombreux autres termes sont utilisés pour décrire ces répertoires de gènes et dépendent parfois de la relation phylogénétique entre les organismes étudiés : gènes “dispensables” (Medini et al., 2005), supra-génome, gènes distribués et uniques (Hiller et al., 2007). Dans ce manuscrit, en plus des termes pan et core génome nous allons utiliser la notion de génome accessoire qui fait référence aux gènes partagés par un sous-groupe d’espèces, autrement dit, le pan-génome est composé de l’ensemble du génome accessoire et du core-génome .

Opérons et regroupements de gènes

Dès les années 50, il fut montré que les gènes ne sont pas distribués aléatoirement dans les génomes (Demerec and Hartman, 1959). Au travers des travaux de François Jacob et Jaques Monod, un premier modèle d’organisation des gènes fonctionnellement associés et co-transcrits fut proposé : l’opéron. L’opéron consiste en une séquence d’ADN regroupant plusieurs gènes dont l’expression est régulée par un même promoteur, comme l’opéron lacZYA mis en évidence chez E. coli (Jacob et al., 1960). Cette organisation est répandue chez les bactéries avec en moyenne 3 à 4 gènes par opéron (Zheng et al., 2002). Les gènes d’un opéron codent souvent pour des protéines qui interagissent physiquement (Huynen et al., 2000) ou qui possèdent des fonctions complémentaires (Rogozin et al., 2002). L’opéron n’est pas le seul procédé de co-régulation retenu par l’évolution; de nombreux gènes distribués le long des génomes bactériens sont co-régulés en trans. Le nombre et la taille des opérons diminuent avec la taille du génome, et cela est corrélé avec l’augmentation de la proportion de gènes de régulation chez les bactéries possédant un grand génome (Nuñez et al., 2013; Stover et al., 2000). Ainsi chez Streptomyces coelicolor A3(2), 965 gènes, soit environ 12 % des gènes, codent pour des protéines régulatrices (Bentley et al., 2002).

Chez les Streptomyces, les gènes impliqués dans la synthèse de métabolites spécialisés sont regroupés pour former des regroupements (cette organisation n’implique pas obligatoirement une unique unité de transcription et donc un opéron) (Rudd and Hopwood, 1980; Rudd and Hopwood, 1979). Un regroupement comprend outre les gènes de biosynthèse, des gènes de régulation, d’export et/ou de résistance (notamment lorsque le composé produit est toxique, comme les antibiotiques). Un génome de Streptomyces peut contenir de nombreux regroupements de biosynthèse. Ainsi chez S. coelicolor A3(2) au moins 29 regroupements ont été identifiés, 37 chez S. avermitilis (Liu et al., 2013). En considérant 3 espèces de Streptomyces : S. coelicolor, S. avermitilis et S. griseus des regroupements de métabolisme secondaire sont conservés. Par exemple les regroupements codant pour l’hopanoïde et la desferrioxamine sont conservés et sont arrangés de manières similaires (taille, orientation et localisation chromosomique) entre ces 3 espèces .

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

INTRODUCTION
A- Génomes bactériens : contraintes et tolérances de l’organisation génétique
1- Organisation et expression des gènes
a- Taille et densité en gènes des génomes bactériens
b- Le core et pan-génome
c- Opérons et regroupements de gènes
d- Impact de l’organisation en opérons et en regroupements sur la synténie
e- Impact de la localisation chromosomique
d – L’effet dose
2- Organisation du nucléoïde
a- Organisation en chromosome et plasmide (unités de réplication)
b- Organisation en macro-domaines
c- Les domaines topologiques
d- Les protéines associées au nucléoïde
e- Autres facteurs
B- Plasticité et dynamique des génomes bactériens
1- Les mutations ponctuelles
2- Les réarrangements chromosomiques
a- Les cassures double brin de l’ADN
b- Impact de la recombinaison homologue sur les réarrangements chromosomiques
c- Impact de la recombinaison illégitime sur les réarrangements chromosomiques
3- Le transfert horizontal et intégration de matériel exogène
C- Comment fonder une approche de génomique comparée robuste ?
1 – Evolution des méthodes de séquençage
2- Estimer la qualité des séquences génomiques disponibles
D- Le genre Streptomyces, modèle d’étude de la diversité génétique
1- Définition du genre et caractéristiques générales
2- Des caractéristiques génomiques originales parmi les bactéries
a- Organisation du chromosome
b- La compartimentation du chromosome
3- La plasticité génomique des Streptomyces
a- L’instabilité génétique chez Streptomyces
b- La variabilité des TIRs
c- Une forte variabilité génétique
E – Objectifs
RÉSULTATS
I- Exploration de la dynamique des génomes au niveau du genre Streptomyces
A- Constitution de la collection de génomes du genre Streptomyces
1- Un jeu de données représentatif du genre Streptomyces
a- Réduction du nombre d’espèces/génomes considérés
b- Estimation de la complétude des génomes
2- Uniformisation des données génomiques
a- Annotation
b- Identification des TIR
c- Les gènes dupliqués
d- Uniformisation des données de séquences chromosomiques
B- Evolution du contenu en gènes
1- Définition des relations d’orthologie
2- Le pan-génome et le core-génome du genre Streptomyces
3- La phylogénie du genre Streptomyces
C- Evolution des régions subtélomériques du chromosome linéaire des Streptomyces
II- Évolution du génome des Streptomyces isolés à partir d’un micro-habitat
A- Obtention d’une collection sympatrique de Streptomyces
1- Première campagne de séquençage génomique
a- Séquençage selon la technologie Illumina paired-end
b- Mise en évidence des variations génomiques
2- Deuxième campagne de séquençage : séquençage et assemblage de 11 souches conspécifiques
B- Diversité génétiques des souches conspécifiques
III – Diversité des regroupements de gènes codant des métabolites spécialisés entre espèces proches
DISCUSSION
A- Streptomyces, une classification discutée
B – Évolution des répertoires de gènes chez Streptomyces
C- Un chromosome compartimenté
1- Extrémités chromosomiques et adaptation
2 – Les TIR ont-elles une fonction ?
3- Compartimentalisation du chromosome de Streptomyces
4 – Une région centrale contrainte
5- Mécanismes de recombinaison et plasticité des régions terminales des Streptomyces
PERSPECTIVES
MATERIELS ET METHODES
CONCLUSION

Lire le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *