Cartographie physique de l’haplotype cible
Cartographie physique de l’haplotype contenant legène Bru1
Stratégies
Stratégies générales
La carte physique de la région de Bru1 disponible au début de ma thèse comprenait 15 clones BAC regroupés en sept haplotypes hom(é)ologues dont un correspondant à l’haplotype cible porteur du gène Bru1 (Figure 2.1). Pour tous les haplotypes, un seul clone BAC comprend l’ensemble de la région cible (entre les marqueurs cBR37 et R15N23), excepté pour l’haplotype cible qui comprend quatre clones BAC qui ne se chevauchent que partiellement, laissant deux espaces non couverts nommés « espace de gauche » et « espace de droite » (Figure 2.1). Cette situation résulte notamment de la présence d’une insertion dans l’haplotype porteur de Bru1 (Le Cunff et al., 2008). Le séquençage et l’annotation de l’ensemble de ces BAC ont montré qu’il existe une importante conservation de la synténie et de la colinéarité au niveau des gènes et des régions intergéniques mais pas au niveau des éléments transposables (Garsmeur et al., 2010). D’autre part, ces données ont permis de démontrer que l’espace de gauche est inclus dans l’insertion spécifique de l’haplotype cible. Sur la base de la colinéarité entre les haplotypes, nous avons estimé la taille de l’espace de droite à environ 30 kb. La taille de l’espace de gauche ne peut en revanche pas être estimée du fait de la présence d’une insertion. Pour combler l’espace de droite, la synténie existant avec les autres haplotypes de la région de Bru1 a été exploitée. Par contre, cette stratégie n’était pas envisageable pour combler l’espace de gauche et nous avons cherché une région orthologue chez le sorgho. Notre stratégie générale pour combler ces deux espaces non couverts a donc été 1) d’exploiter les données issues du séquençage et de l’annotation des BAC de la région de Bru1 pour définir de nouvelles sondes dans les régions flanquant les deux espaces non couverts de la carte physique et dans la région homologue sur les autres haplotypes pour l’espace de droite afin de cribler les deux banques BAC HindIII existantes. A.2. Ressources BAC utilisées et développées Deux banques BAC réalisées avec l’enzyme HindIII étaient disponibles au début de ma thèse. Nous en avons construit une troisième avec l’enzyme BamHI. Les banques utilisées (Figure 2.2) sont : – Une banque BAC du cultivar R570 construite à l’université de Clemson (Tomkins et al., 1999) contenant 103 296 clones avec une taille moyenne des inserts de 130 kb, soit un taux de recouvrement de 1,2 fois le génome total. L’ensemble de la banque est contenu sur six filtres haute densité. – Une banque BAC construite au CIRAD avec quatre individus résistants à la rouille issus de l’autofécondation du cultivar R570 possédant deux doses de l’haplotype cible (Le Cunff et al., 2008). Ces individus ont été utilisés afin de multiplier par deux la représentation de l’haplotype cible dans la banque. En effet, le cultivar R570 possédant une copie du gène Bru1, la descendance issue de son autofécondation se compose de 25% d’individus ne possédant pas le gène Bru1, de 50% possédant une copie du gène Bru1 et de 25% possédant deux copies du gène Bru1. Ces quatre individus ont été identifiés en comparant leur profil RFLP (intensité deux fois supérieure des bandes) avec celui de R570 pour quatre marqueurs encadrant le gène Bru1. Les clones BAC ont été regroupés par six. Cette banque comprend 110 592 clones avec une taille moyenne des inserts de 130 kb, soit un taux de recouvrement de 1,4 fois le génome total et de 2,8 fois la région de Bru1. Les BAC provenant de cette banque sont nommés CIR + cordonnées du BAC. L’ensemble de la banque est contenu sur un filtre haute densité.
– Une banque BAC que nous avons construite avec l’enzyme de restriction BamHI, selon le protocole de Vilarinhos et al, (2003). Cette banque a été réalisée avec les quatre mêmes individus issus de l’autofécondation de R570 porteurs d’une double dose de l’haplotype cible. Elle contient 119 040 clones avec une taille moyenne des inserts de 130 kb.
Le taux de recouvrement est de 1,6 fois le génome total et de 3,2 fois la région de Bru1. Les BAC provenant de cette banque sont nommés CIRB + cordonnées du BAC. L’ensemble de la banque est contenu sur six filtres haute densité. Nous disposons donc de 3 banques BAC représentant une couverture totale du génome du cultivar R570 de 4,2 X et une couverture de la région de Bru1 de 7,3 X (Figure 2.2). A.3. Principe d’identification des clones BAC correspondant à l’haplotype cible Pour cribler les banques BAC, nous avons hybridé les filtres haute densité avec des sondes définies dans les régions flanquantes des deux espaces non couverts de la carte physique de l’haplotype cible, sur la base de la conservation de la synténie entre les différents haplotypes hom(é)ologues de la région. La polyploïdie et l’hétérozygotie de la canne à sucre sont deux contraintes majeures pour la construction d’une carte physique. En effet, les BAC identifiés par hybridation appartiennent aux différents haplotypes hom(é)ologues couvrant la région d’intérêt et donc potentiellement à autant de contigs de BAC qu’il y a d’haplotypes hom(é)ologues. En comparaison, chez une plante diploïde homozygote, les BAC identifiés correspondraient à un unique contig de BAC. Donc il est nécessaire de définir une stratégie pour cribler nos ressources BAC et tester l’appartenance d’un BAC à l’haplotype cible. Notre méthode est basée sur trois points 1) Vérification par amplification PCR : les couples d’amorces ayant servi à faire les sondes et les autres marqueurs PCR disponibles dans la région de Bru1 sont utilisés pour l’étape de vérification par amplification PCR des BAC hybridés par les sondes. Certains de ces marqueurs PCR sont spécifiques de l’haplotype cible et dans la suite du texte seront identifiés par leur nom suivi d’un astérisque (*).
2) DNA Fingerprinting : un profil de digestion du clone BAC est réalisé et comparé aux profils des BAC de l’haplotype cible déjà connus. Ceci permet de vérifier la présence d’un chevauchement entre le BAC candidat et un des BAC appartenant à l’haplotype cible. Le fingerprint nous permet aussi de déterminer approximativement la taille du fragment couvrant un des deux espaces. Toutefois, l’interprétation des fingerprint n’est pas toujours facile quand nous devons comparer des BAC clonés avec des enzymes différentes (HindIII, BamHI). 3) Séquençage des extrémités des BAC (BES) : les deux extrémités des BAC candidats sont séquencées. Les séquences sont ensuite comparées avec les séquences connues des BAC hom(é)ologues de la région de Bru1 pour rechercher un point d’ancrage et déterminer si ce BAC correspond à un des haplotypes connus de la région de Bru1. Ces séquences sont aussi comparées avec les BES déjà séquencées et avec la séquence des génomes complets du sorgho et du riz, afin d’identifier la région orthologue potentielle chez ces autres espèces.
B. Cartographie physique pour compléter l’espace de gauche La carte physique de l’haplotype cible décrite sur la figure 2.3 montre que l’espace de gauche se situe dans l’insertion présente sur l’haplotype cible (Le Cunff et al., 2008). Nous n’avons donc pas pu exploiter la synténie avec les autres haplotypes de la région de Bru1 pour combler l’espace de gauche. Nous avons dans un premier temps utilisé la technique de longrange PCR pour essayer d’amplifier le fragment d’ADN correspondant à cet espace. Dans un second temps, nous avons recherché s’il existait chez le sorgho une région orthologue à l’insertion présente sur l’haplotype cible. Enfin, nous avons utilisé des marqueurs flanquant l’espace de gauche pour tenter de combler cet espace. B.1. Long-range PCR Nous avons essayé de combler cet espace de gauche en utilisant la technique de longrange PCR. Afin de mettre au point le protocole, nous avons défini des amorces tests sur le BAC CIR9O20 permettant d’amplifier 5 kb, 10 kb et 20 kb de séquence. Ces tests nous ont permis d’amplifier un fragment PCR de 10 kb aussi bien à partir d’ADN génomique qu’à partir d’ADN de BAC. Des amorces sens sur l’extrémité du BAC CIR9O20 et des amorces antisens sur l’extrémité du BAC 22M06 ont été définies le plus près possible de l’espace de gauche. Nous n’avons obtenu aucune amplification à partir de l’ADN génomique du cultivar de référence R570. Ces résultats suggèrent donc que cet espace de la carte physique de Recherche d’une région orthologue chez le sorgho correspondant à l’insertion sur l’haplotype cibl Pour réaliser la cartographie génétique fine du cultivar R570, une des stratégies a été d’exploiter les relations synténiques entre le sorgho et la canne à sucre (Le Cunff et al., 2008), le sorgho étant l’espèce présentant les meilleures relations synténiques avec la canne à sucre. Dans la même optique, nous avons essayé d’identifier la région du sorgho orthologue à l’insertion présente sur l’haplotype cible. Pour réaliser ce travail, nous avons créé un fichier avec toutes les séquences des gènes présents dans l’insertion sur le contig 22M06_CIR12E03 : deux gènes codant pour des S/T kinases, un gène codant une CHP (Conserved Hypothetical Protein), un fragment de gène codant pour une NADP-dependent malic enzyme et un gène codant pour une zinc knuckle family protéine. Ces séquences nucléotidiques ont été alignées avec la séquence totale du génome du sorgho. Les résultats sont présentés dans la figure 2.4. Seuls les alignements de plus de 100 nucléotides avec une e-value minimum de 1 E-05 sont représentés sur la figure. Les deux S/T kinases et la CHP n’ont pas présenté de forte homologie avec des séquences du génome du sorgho. Les meilleurs alignements pour les deux S/T kinases ne dépassent pas 30 nucléotides. La séquence codant pour la NADP-dependent malic enzyme présente quant à elle des homologies avec des séquences sur le chromosome 3 (95.2 % d’identité nucléotidique) et le chromosome 9 du sorgho (95.8 % d’identité nucléotidique). Les régions des chromosomes 9 et 3 du sorgho correspondent à un gène codant pour une NADP-dependent malic enzyme. Le gène codant pour une zinc knuckle family protéine présente des homologies avec plusieurs régions du sorgho situées sur plusieurs chromosomes. Le meilleur alignement se situe sur le chromosome 8 du sorgho (75.2 % d’identité nucléique) dans une région non annotée. Ce gène présente aussi une homologie avec une séquence sur le chromosome 3 du sorgho (73 .2 % d’identité nucléique), mais pas dans la même région que la séquence codant pour la NADPdependent malic enzyme. Les résultats obtenus ne nous permettent donc pas d’identifier clairement une région du sorgho orthologue à l’insertion.
Nous avons défini des sondes à l’extrémité du BAC 22M06 à partir des données de séquençage. Très peu de sondes utilisables avaient été obtenues dans cette région. En effet, l’annotation de l’extrémité 5’ du BAC 22M6 a révélé la présence de nombreux éléments transposables (les quatorze premiers kb du BAC) (Figure 2.3). Pour résoudre ce problème, nous avons défini deux sondes (TG22M6 – 643 pb – et TG22M6_2 – 649 pb) dans une région intergénique d’environ 4 kb entre la fin de la région comprenant les éléments transposables et le gène 15 codant pour la S/T kinase. Il a été très difficile de définir des sondes car la région est très riche en GC. Les résultats n’ont pas pu être exploités car les sondes utilisées s’hybrident sur un nombre trop important de BAC (sondes polymorphes), ce qui rendait la lecture des filtres impossible.
Côté gauche de l’espace de gauche
Le BAC CIR9O20 présente à son extrémité un gène codant pour un fragment de NADP-dependent D-sorbitol-6-phosphate déshydrogénase (S6PDH, gène 11a) interrompu par le site de clonage du BAC. Ce gène est aussi présent chez les autres haplotypes hom(é)ologues. Nous supposons que l’exon 1 du gène se trouve dans l’espace de gauche. En alignant les séquences des gènes S6PDH11a des différents haplotypes hom(é)ologues, nous avons dérivé une sonde dans un domaine conservé de l’intron 1 (sonde Sc1001 – 625 pb). Les banques BAC ont été criblées avec cette sonde : 8 clones BAC ont été identifiés sur la banque Clemson et 3 sur la banque CIRAD. Sur ces 11 BAC identifiés, 8 clones BAC étaient déjà connus comme n’appartenant pas à l’haplotype cible. .
|
Table des matières
Chapitre I : Introduction
A. La canne à sucre
A.1. Importance économique
A.2. Biologie et physiologie de la canne à sucre
A.3. Le complexe Saccharum
A.4. Evolution et domestication de la canne à sucre
A.5. Structure des génomes des cultivars modernes
A.6. Cartes génétiques de canne à sucre disponibles
A.7. Relations synténiques entre génomes de Poacées
B. Les champignons de la rouille
B.1. Caractéristiques générales et taxonomie
B.2. La rouille brune chez la canne à sucre : Puccinia melanocephala
C. Les interactions plantes / microorganismes phytopathogènes
C.1 Mécanismes de résistance 6
C.2 Les gènes R de résistance
C.3 Gènes de résistance à la rouille chez les Poacées
D. Clonage positionnel chez les plantes à grand génome
D.1. Contraintes du clonage positionnel chez les plantes à grand génome
D.2. Stratégies utilisées/déployées pour contourner ces contraintes
E. Etape et stratégies mis en place pour le clonage positionnel de Bru1
F. Organisation du locus de Bru1
G. Objectifs de la thèse
Chapitre 2. Cartographie physique de l’haplotype cible
A. Stratégies
B. Cartographie physique pour compléter l’espace de gauche
C. Cartographie physique pour compléter l’espace de droite
D. Séquençage et annotation des nouveaux BAC de l’haplotype cible
E. Conclusion
Chapitre 3 : Analyse des gènes candidats présents sur la séquence partielle de l’haplotype
A. Méthodes
B. Endoglucanase de la région de Bru1 (gène 12)
C. Kinases présentes sur l’haplotype cible (gènes 6, 10, 15, 16)
Chapitre 4 : Origine de l’insertion contenant le gène Bru1
A. Matériels et Méthodes
B. Distribution des marqueurs dans la collection
C. Conclusion sur l’origine de l’insertion
Discussion générale et perspectives
A. Cartographie physique de l’haplotype porteur du gène Bru1
B. Gènes candidats
C. Origine de l’insertion
Conclusion générale
Références Bibliographiques
Annexe 1
Annexe 2.
Télécharger le rapport complet