Développement de la méthodologie de déréplication de nouvelles levures

Télécharger le fichier pdf d’un mémoire de fin d’études

Les réseaux moléculaires pour la métabolomique

Les expériences UHPLC-MS/MS génèrent de lourds jeux de données. L’utilisation d’outils automatisés de traitement de données est nécessaire pour limiter le caractère chronophage d’une investigation manuelle des résultats analytiques. La plateforme en ligne de Global Social Natural Products molecular networking (GNPS [168]) fut sélectionnée pour la construction de réseaux moléculaires. Il s’agit un bon exemple de l’application de programmes informatisés pour analyser des données et les représenter d’une façon aidant l’utilisateur à accélérer le processus d’interprétation de résultats. L’objectif est la création de réseaux et la visualisation de ceux-ci sous le logiciel libre Cytoscape afin d’aider à l’exploration des extraits de levures.

Conversion des données spectrales

La première étape nécessaire à la construction de réseaux moléculaires sur l’interface GNPS est la conversion des données dans un format libre. En effet, en spectrométrie de masse, chaque constructeur d’instrument utilise un format de données spécifique pour la création de fichiers après une analyse. Par exemple, les instruments Waters permettent l’acquisition de données sous format « .raw », tandis que ceux de Bruker acquièrent des spectres au format « .d ». Il existe cependant des formats libres, tels que le format « mzML », le format « mzXML » ou le format « MGF ».

Conversion par MSConvert

Dans le but de construire des réseaux moléculaires sur la plateforme GNPS à partir des données UHPLC-MS/MS, il est nécessaire de convertir les données du format « .raw » vers un format libre. Notre choix s’est porté sur la conversion en format « mzML » ou en format « mzXML » grâce à l’application MSConvert, une interface utilisateur téléchargeable en local faisant partie de la suite d’outils ProteoSafe. L’interface MSConvert est illustrée dans la Figure 31.
Les données spectrales peuvent être chargées sous différents formats, venant de différents instruments, et le format de sortie est sélectionné (« mzML », « mzXML », ou « MGF » parmi d’autres). Il est possible d’appliquer des opérations sur les spectres traités. Par exemple, la fonction la plus utilisée est celle du « peak picking », ou détection du signal. Un algorithme transforme les pics d’un spectre de masse. Ils ont dans un premier temps une allure Gaussienne et l’apex se situe au niveau du rapport m/z.
Ce sont des profils, et plus la résolution d’un analyseur est grande, plus les profils sont fins et les rapport m/z proches sont différenciés.
L’algorithme permet ensuite de convertir les signaux en profils dans un format en « bâtons », à une dimension, caractérisés par une valeur de m/z en abscisse et une intensité sur l’axe des ordonnées. On appelle ce format de pic un « centroïde ». Cette valeur de m/z en abscisse correspond à la valeur m/z mesurée de l’ion considéré. Ces spectres de masse centroïdés permettent l’obtention de données plus légères en terme de mémoire dans le système informatique (un bâton est plus léger à enregistrer qu’une multitude de points formant une enveloppe). Il est également favorable de centroïder les spectres de masse pour la création de réseaux moléculaires par GNPS.
Figure 31 : interface de l’application MSConvert servant à convertir des formats de données spectrales variés en formats libres.
Cette étape de centroïde est donc essentielle, et l’algorithme employé pour ce traitement l’est tout autant. Nous nous sommes cependant rendu compte que le centroïde des données au format Waters (.raw) par l’application MSConvert créait un décalage dans la mesure du rapport m/z, et donc dans la mesure de masse. Un tel décalage en masse est forcément délétère pour la qualité des analyses car il impacte toutes les étapes de traitement de données ainsi que d’interprétation des résultats avec des erreurs d’attribution de formules moléculaires. Nous avons comparé le rapport m/z d’une molécule connue avant centroïde et après centroïde avec la masse théorique du composé en question. Nous avons déterminé que le décalage en masse était créé quel que soit l’algorithme sélectionné. Il était donc nécessaire de modifier le processus de pré-traitement de données en trouvant un moyen de convertir les données sans créer de décalage ou encore un moyen de centroïder les données spectrales avant une conversion par MSConvert.

Centroïde des pics des spectres de masse acquis par MassLynx

Le logiciel utilisé pour piloter le spectromètre de masse de l’instrumentation UHPLC-MS/MS du laboratoire, MassLynx, est également utilisable pour la visualisation et un traitement basique des données. Le module « Automatic peak detection » centroïde les données spectrales directement sous MassLynx. Deux spectres, l’un centroïdé et l’autre non, sont fournis en guise d’illustration en Figure 32. Ce module ne crée pas de décalage en masse. Cette étape supplémentaire a permis de centroïder les données en amont de la conversion. Les données sont allégées et les pics sont détectés selon le rapport m/z le plus juste possible. Les spectres de masse sont ensuite convertis via MSConvert du format constructeur vers un format libre avant de les utiliser pour la création de réseaux moléculaires par GNPS.
Figure 32 : exemple de spectre centroïdé sous MassLynx. A : spectre centroïdé grâce au module « Automatic peak detection ». B : spectre en mode profil. Issu d’une analyse d’un extrait DCM/AE de S. cerevisiae en mode d’ionisation positif.

Construction des réseaux

Des réseaux moléculaires furent construits à partir des analyses par UHPLC-MS/MS d’extraits de levures ayant subi le protocole d’extraction et de préparation d’échantillon optimisé. Le workflow classique a été sélectionné, avec une sélection des groupes pour séparer et comparer les analyses entre elles. Aucun pré-traitement des données spectrales n’a été intégré au procédé d’analyse de données à ce stade, les réseaux furent construits directement après conversion des données.
La visualisation des réseaux moléculaires créés montre les composés fragmentés sous forme de noeuds, ceux-ci étant connectés entre eux en fonction de leurs similitudes structurales. Plus les spectres MS/MS sont semblables et plus le cosine score se rapproche de 1. Les réseaux construits ne présentent qu’assez peu de composés qui se connectent entre eux. On observe néanmoins des annotations fournies par le système de comparaison avec les bases de données spectrales de GNPS. Une capture des différents noeuds résultant de l’une de ces analyses est présentée en Figure 33. Les réseaux sont visualisés sous Cytoscape, un logiciel avec de nombreuses options de paramétrage. Des analyses d’un extrait de culture de levure avec celles d’un extrait de milieu de culture sont comparées.
Le code couleur permet d’identifier l’échantillon de provenance du composé correspondant au noeud considéré. Cette configuration permet d’envisager les avantages d’un système regroupant les données entre elles pour les traiter, les analyser et/ou les comparer entre elles. Elle pointe cependant également les limites du traitement actuel par le workflow classique de GNPS.
En effet, aucun ion de l’extrait de levure n’est en commun avec le milieu de culture. De plus, bien que les composés soient séparés selon leur échantillon d’origine (grâce au code couleur), il reste possible dans cette situation qu’un composé A soit présent dans les deux extraits comparés mais qu’il apparaisse sous la forme de deux noeuds différents, un noeud par extrait d’origine. Il existe aussi le cas inverse où des isomères peuvent être considérés comme un seul et même composé bien qu’ils éluent à des temps de rétention différents, le workflow actuel ne prenant pas ce descripteur en compte à l’heure où ces tests ont été conduits.
Ces écueils peuvent nuire à l’interprétation des résultats, néanmoins les étapes de pré-traitement par MZMine2 sont déjà envisagées à ce stade de la thèse, et pourraient remédier à ces problèmes [179].
Figure 33 : résultats de traitement par GNPS d’analyse UHPLC-MS/MS d’un extrait de culture de S. cerevisiae (noeuds rouges) avec celle d’un extrait de milieu de culture (bleu).

Application et optimisation des outils de traitement de données

L’utilisation classique de l’outil de réseaux moléculaires a révélé quelques inconvénients et limites dans sa mise en oeuvre. Le pré-traitement des données en amont de la construction de réseaux moléculaires est une solution pour pallier à ces problèmes. Ces outils permettent l’emploi d’algorithmes afin de détecter les différentes masses et de convertir les données en features ainsi que de les trier et les aligner. L’utilisateur peut alors limiter les doublons, prendre en compte le temps de rétention des composés pour éviter la confusion entre des isomères mais aussi limiter la création de noeuds correspondant à des signaux du bruit de fond.

MZMine2 pour le prétraitement des données d’analyse UHPLC-MS/MS

L’outil MZMine2 est spécialisé dans la visualisation et le traitement de données LC-MS. Il possède l’avantage de permettre l’import de données Waters au format « .raw » et de se passer de l’étape de conversion par MSConvert. Nous conservons néanmoins la fonction de centroïde des données spectrales par MassLynx car celle-ci s’est révélée plus performante pour la détection de pics et pour garantir la précision de mesure de masse.
Durant le traitement, les données spectrales sont transformées en features. Chacune est caractérisée par un rapport m/z, un temps de rétention, un EIC du rapport m/z correspondant ainsi que des spectres MS/MS associés. Des modules spécifiques créent des listes de features, et optimisent ces listes en dissociant les isomères ou en supprimant les signaux du bruit de fond. De plus, l’interface permet la prévisualisation des graphiques traités, chromatogrammes comme spectres de masse, pour chaque étape de traitement.
Le logiciel est également défini comme très utile pour le pré-traitement des données spectrales issues d’expériences LC-MS en vue de construire des réseaux moléculaires, en raison de la prise en compte du temps de rétention dans la création des tables de features ce qui permet de se passer de l’algorithme MSCluster de GNPS [179].

Comparaison de l’outil UNIFI avec MZMine2 pour la détection des pics

L’outil UNIFI est également évoqué pour le pré-traitement des données avant export pour construction de réseaux moléculaires sur GNPS. Il s’agit d’un logiciel du constructeur Waters spécialisé dans la visualisation et le traitement automatisé des données acquises au cours d’expériences LC-MS. L’objectif de l’utilisation du logiciel UNIFI est d’exploiter ses fonctionnalités pour la détection des masses au sein des données spectrales, avant de les exporter en format libre.
Le logiciel Unifi applique la correction liée à la mesure de la lockmass (l’étalon semi-interne ionisé en parallèle de l’échantillon), tandis que MZMine2 n’applique pas cette correction. Cela signifie que les données comparées doivent provenir d’analyses différentes, les unes avec correction et les autres sans.
Des analyses supplémentaires ont été réalisées sur les extraits de levures. Un outil Microsoft Office Excel, sous forme de macro programmée à partir de l’interface Visual Basic for Applications (VBA), a été créé afin de comparer deux listes de pics entre elles. La comparaison de listes d’ions détectés par MZMine2 d’un côté et détectés par UNIFI de l’autre montre que les deux procédés donnent des résultats très similaires (82 % des masses retrouvées sont communes). La plupart des composés détectés exclusivement par le logiciel UNIFI et manquant à ceux détectés par MZMine2 correspondent à des ions provenant du bruit de fond.
En conclusion, le logiciel UNIFI pourrait être une alternative très utile pour la détection de masses et une identification grâce à la comparaison avec les bases de données spectrales accessibles par ce logiciel. Cependant, les listes de pics obtenues étant similaires, l’outil MZMine2 est sélectionné pour la suite du traitement des données UHPLC-MS/MS issues d’analyses d’extraits de levure. Ce choix est confirmé par l’existence de nombreux modules inhérents à MZMine2 permettant d’approfondir le traitement de données après l’étape de détection des masses.

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

Introduction
Préambule : Les produits naturels et les moyens analytiques applicables à leur exploration
I. La nature, source essentielle pour l’humanité
1. Les substances naturelles
2. La biodiversité structurale
II. Les levures
1. Définitions
2. Saccharomyces cerevisiae, un modèle omniprésent
3. Autres genres de levures
III. La métabolomique
1. Définition et historique
2. Le profilage métabolique
3. Différentes approches
4. La déréplication
IV. Les méthodes d’extraction de métabolites appliquées aux microorganismes
1. Arrêt de la prolifération cellulaire
2. Disruption mécanique des cellules
3. Élimination des débris cellulaires
4. Influence de la température sur l’extraction
5. Concentration et reprise des extraits
V. Les techniques analytiques utilisées en métabolomique
1. Aperçu des méthodes employées
2. La séparation chromatographique des composés d’un mélange
3. Les méthodes spectroscopiques
4. L’application de la résonance magnétique nucléaire à la métabolomique
5. La spectrométrie de masse
6. Les possibilités d’injection en spectrométrie de masse
7. Bilan du profilage métabolique de S. cerevisiae
8. Traitement de données en métabolomique
Chapitre I : Développement de la méthodologie de déréplication de nouvelles levures.
I. Sélection des souches
II. Développement du protocole d’extraction des métabolites secondaires
1. Culture de levures
2. Extrait apolaire de levures
3. Extrait polaire de levures
4. Extrait du témoin, le milieu de culture sans levures
5. Préparation des échantillons pour analyse
III. Analyse d’extraits de levures pour évaluation de la méthode d’extraction
1. Etude préliminaire d’extraits de S. cerevisiae
2. Vérification de l’efficacité de l’extraction par chromatographie sur couche mince
IV. Optimisation de la méthode d’extraction
Chapitre II : Optimisation de la méthode analytique et application du traitement de données pour l’exploration d’extraits de levures
I. Les réseaux moléculaires pour la métabolomique
1. Conversion des données spectrales
2. Construction des réseaux
II. Application et optimisation des outils de traitement de données
1. MZMine2 pour le prétraitement des données d’analyse UHPLC-MS/MS
2. Comparaison de l’outil UNIFI avec MZMine2 pour la détection des pics
3. Optimisation du prétraitement de données spectrales
4. Traitement de données : feature-based molecular networking
III. Finalisation de la méthode
1. Comparaison des différents extraits
2. Paramètres de chromatographie liquide
3. Modification du protocole d’extraction pour regrouper les extraits
4. Analyse par GC-MS de l’extrait apolaire
5. Spectrométrie de masse et problème de fragmentation en source
6. Vérification des triplicats d’analyse de S. cerevisiae
IV. Résultats sur Saccharomyces cerevisiae
1. Annotation des composés
2. Investigation manuelle des résultats
Chapitre III : Ajout de la FTICR-MS et approfondissement du traitement de données pour application sur S. cerevisiae.
I. La FTICR-MS appliquée à la déréplication
1. Optimisation pratique de la méthode
2. Corrélation entre résultats UHPLC-MS/MS et FTICR-MS
3. Traitement de données FTICR-MS
II. Résultats de la déréplication de S. cerevisiae : publication des résultats
Chapitre IV : Application de la méthode de déréplication à de nouvelles souches de levures.
I. Ajout de nouveaux outils de traitement de données
1. Utilisation de modules supplémentaires de MZMine2
2. Application d’outils intégrés à la plateforme GNPS
II. Résultats de l’application de la méthode finalisée à deux souches récemment découvertes : Starmerella reginensis et Starmerella kourouensis
III. Perspectives : Kurtzmaniella hittingeri comme support de l’amélioration de la gamme de composés détectés
1. Confirmation de l’efficacité de conservation d’extraits secs
2. Perspectives : améliorations analytiques par emploi de différentes sources d’ionisation
Conclusion
Matériel et méthodes
Références
Annexe 1
Annexe 2

Télécharger le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *