La chemoinformatique: concepts et outils

L’informatique joue un rôle croissant dans la recherche en Chimie. Des secteurs très variés de la recherche fondamentale ou appliquée nécessitent des spécialités du traitement informatique, de l’information chimique, de la modélisation moléculaire ou de la chimie théorique. La chimie se prête à un traitement informatique car elle est complexe et nécessite des capacités d’acquisition, de traitement et d’archivage considérables. D’importantes bases de données se constituent à travers le monde pour permettre aux chercheurs de suivre quasiment en temps réel l’avancement de la chimie. Le but est de montrer l’implication de l’informatique dans différentes applications de la chimie. Ce domaine est appelé « Chemoinformatique ».

Le terme « chemoinformatique  » est apparu il y a quelques années et a rapidement gagné l’utilisation répandue, Greg Paris a proposé une définition beaucoup plus large [1] Chemoinformatique est un terme générique qui entoure la conception, création, organisation, gestion, récupération, analyse, diffusion, visualisation, et utilisation d’information chimique.

Clairement, la transformation des données en information et d’information en connaissance est un effort requis dans n’importe quelle branche de la chimie non seulement dans la conception de médicament. Nous partageons donc l’opinion que des méthodes de chemoinformatique sont nécessaires dans tous les secteurs de la chimie et adhérer à une définition beaucoup plus large : Chemoinformatique est l’application des méthodes d’informatique pour résoudre des problèmes chimiques. Pourquoi nous devons employer des méthodes d’informatique dans la chimie ? Beaucoup de problèmes en chimie sont trop complexes pour être résolus par des méthodes basées sur les premiers principes par des calculs théoriques. C’est vrai, premièrement, pour la relation entre la structure d’un composé et son activité biologique. Cependant, il s’applique également à beaucoup d’aspects de la réactivité chimique comme l’influence d’un catalyseur ou d’une température.

Définition

La chemoinformatique, également dénommée chemoinformatique (anglicisme) ou chimioinformatique, est le domaine de la science qui consiste en l’application de l’informatique aux problèmes relatifs à la chimie. Elle a pour objectif de fournir des outils et des méthodes pour l’analyse et le traitement des données issues des différents domaines de la chimie.

Elle est notamment utilisée en pharmacologie pour la découverte de nouvelles molécules actives et la prédiction de propriétés à partir de structures moléculaires. Certaines applications de la chemoinformatique reposent sur les équations de la physique quantique. Elles permettent ainsi de modéliser les conformations des molécules [3].

Historique

La chemoinformatique est une nouvelle discipline apparue il y a environ 40 ans. Au début des années soixante, dans le but d’élucider la structure de composés chimiques inconnus, les données provenant des méthodes existantes (spectroscopie) ont été mises en commun sur informatique, C’était la naissance de la chemoinformatique. Le projet DENDRAL initié en 1964 à l’université de Stanford a été le premier à développer des générateurs de structures chimiques à partir de spectres de masses. Ce n’est qu’à la fin des années 60 que Sasaki à l’université de technologie de Toyohashi et Munk à l’université d’Arizona ont utilisé plusieurs méthodes de spectroscopie afin d’élucider la structure chimique de leurs composés. En 1969, Corey et Wipke ont présenté un travail similaire concernant les systèmes de représentation des molécules. Peu après d’autres groupes comme Ugi, Hendrickson et Gelernter ont développés des systèmes pour représenter des molécules organiques. La chemoinformatique (qui n’avait pas encore de nom) a été reconnue à la fin des années 60 comme une méthode utile d’analyse des données. Dès lors, beaucoup d’articles concernant cette discipline ont commencé à apparaître dans les journaux scientifiques. C’est seulement en 1998 que F.K Brown a défini pour la première fois cette discipline comme étant la chemoinformatique [5].

Concepts de base

La chimie

La chimie est une science de la nature divisée en plusieurs spécialités, à l’instar de la physique et de la biologie avec lesquelles elle partage des espaces d’investigations communs ou proches.

Pour reprendre un canevas de présentation proposée par la plus grande association de chimistes au monde, l’American Chemical Society, la chimie étudie [6] :
1. les éléments chimiques à l’état libre, atomes ou ions atomiques, et les innombrables et diverses associations par liaisons chimiques qui engendrent notamment des composés moléculaires stables ou des intermédiaires plus ou moins instables. Ces entités de matière peuvent être caractérisées par une identité reliée à des caractéristiques quantiques et des propriétés précises.
2. les processus qui changent ou modifient l’identité de ces particules ou molécules de matière, dénommés réaction, transformation, interaction…
3. les mécanismes intervenant dans les processus chimiques ou les équilibres physique entre deux formes. Leurs définitions précises permettent de comprendre ou d’interpréter avec des hypothèses l’évolution matérielle avec en vue une exploitation des résultats de façon directe ou induite.
4. les phénomènes fondamentaux observables en rapport avec les forces de la nature qui jouent un rôle chimique, favorisant les réactions ou synthèse, addition, combinaison ou décomposition, séparation de phases ou extraction. L’analyse permet de découvrir les compositions, le marquage sélectif ouvre la voie à un schéma réactionnel cohérent dans des mélanges complexes.

Une science segmentée en de multiples disciplines

La recherche et l’enseignement en chimie sont organisés en disciplines qui, souvent en absence de services, de coopération ou d’aides réciproques, s’ignorent et se développent en toute autonomie [7] :

❖ la biochimie qui étudie les réactions chimiques dans des milieux biologiques (cellules…) et/ou avec des objets biologiques (protéines…).

❖ la chimie analytique est l’étude des méthodes d’analyses qualitatives et/ou quantitatives qui permettent de connaître la composition d’un échantillon donné ; ses principaux domaines sont : la chromatographie et la spectroscopie;

❖ la chimie des matériaux est la préparation et l’étude de substances avec une application en tant que matériau. Ce domaine intègre des éléments des autres domaines classiques de la chimie avec un intérêt particulier pour les problèmes fondamentaux concernant les matériaux.

❖ la chimie inorganique ou chimie minérale, concerne la description et l’étude des éléments chimiques et des composés sans squelette carboné.

❖ la chimie organique est la description et l’étude des composés comportant un squelette d’atomes de carbone (composés organiques) ;

❖ la chimie physique dont l’objet est l’étude des lois physiques des systèmes et procédés chimiques ; ses principaux domaines d’étude comprennent : la thermochimie, la cinétique chimique, l’électrochimie, la radiochimie, la sonochimie et les spectroscopies.

❖ la chimie théorique est l’étude de la chimie à travers un raisonnement théorique fondamental (habituellement à l’aide des mathématiques et de la physique). En particulier, l’application de la mécanique quantique à chimie a donné naissance à la chimie quantique. Depuis la fin de la seconde guerre mondiale, le progrès des ordinateurs a permis le développement de la chimie numérique (ou computationnelle).

L’atome : est formé d’un noyau atomique contenant des nucléons qui maintient autour de lui un nombre d’électrons équilibrant la charge positive du noyau.

L’élément chimique : est l’ensemble des atomes qui ont un nombre donné de protons dans leur noyau. Ce nombre est son numéro atomique. Par exemple, tous les atomes avec 6 protons dans leurs noyaux sont des atomes de l’élément carbone.

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

Introduction générale
Problématique
Objectif de la thèse
Contribution
Organisation du mémoire
Chapitre 1 : La chemoinformatique: concepts et outils
1.1 Définition
1.2 Historique
1.3 Concepts de base
1.3.1 La chimie
1.3.2 L’atome
1.3.3 L’élément chimique
1.3.4 La liaison chimique
1.3.5 La molécule
1.3.6 L’ion
1.3.7 Le composé chimique
1.3.8 La réaction chimique
1.3.9 Propriété physico-chimique de molécule (des protéines)
1.3.10 Prédiction de propriété ou d’activité (Relation quantitative structure à activité)
1.4 Vue d’ensemble
1.4.1 Représentation des composés chimiques
1.4.2 Représentation des réactions chimiques
1.4.3 Données en chimie
1.4.4 Les sources de données et les bases de données
1.4.5 Méthodes pour calculer des données physiques et chimiques
1.4.6 Calcul des descripteurs de structure
1.4.7 Méthodes d’analyse de données
1.5 Méthodes et outils
1.5.1 Méthodes de la modélisation moléculaire
1.5.2 Méthodes de recherche de médicaments
1.6 Quelques logiciels
1.6.1 Logiciels utilisés pour la représentation moléculaire
1.6.2 Logiciels utilisés pour les calculs de propriétés
1.7 Applications de chemoinformatique
1.7.1 Commentaires généraux
1.7.2 Applications de chemoinformatique par secteurs de chimie
1.8 Applications
1.8.1 L’utilisation de QSAR et de méthodes informatiques dans la conception de médicament
1.8.2 Prévisions confiantes de ségrégation des propriétés des produits chimiques pour le criblage virtuel des médicaments
1.8.3 Classification de composée chimique avec les modèles de structure extraits automatiquement
1.8.4 Méthode d’arbres à sortie noyau pour la prédiction de sorties structurées et l’apprentissage de noyau
1.8.5 Approche multi-classes de représentation des molécules pour la conception des produits-procédés assistées par ordinateur
1.8.6 Relation structure moléculaire-odeur (Utilisation des réseaux de neurones pour l’estimation de l’odeur balsamique)
1.8.7 Une distance d’écoulement de réseau entre les graphes étiquetés
1.8.8 La fouille de graphes dans les bases de données réactionnelles au service de la synthèse en chimie organique
1.8.9 Regrouper des molécules : influence des mesures de similitude
1.9 Conclusion
Chapitre 2 : Méthodes de modélisations
2.1 Les descripteurs
2.1.1 Les descripteurs moléculaires
2.1.2 Réduction du nombre de variables
2.2 Modélisation par optimisation sans contrainte
2.2.1 Réseaux de neurones
2.2.2 Sélection du modèle
2.3 Autres méthodes de QSPR/QSAR
2.3.1 Méthode de contribution de groupes
2.3.2 Analyse comparative de champs moléculaires (CoMFA)
2.4 Conclusion
Chapitre 3 : Modélisation à l’aide des graph machines
3.1 Les graphes (définition et caractéristiques)
3.1.1 Graphes simples
3.1.2 Graphes orientés
3.1.3 Graphes étiquetés
3.1.4 Matrice d’adjacence
3.2 Apprentissage à partir de graphes :RAAMs et LRAAMs
3.2.1 Les Mémoires Auto-Associatives Récursives
3.2.2 Les Mémoires Récursives Auto-Associatives Etiquetées
3.3 Les graph machines
3.3.1 Modélisation à partir de graphes acycliques
3.3.2 Structure mathématique des graph machines
3.3.3 Les étiquettes
3.4 L’apprentissage des graph machines
3.4.1 Propriété d’approximation universelle
3.4.2 Utilisation des algorithmes traditionnels
3.4.3 Sélection de modèle
3.5 Modélisation à partir de graphes cycliques
3.5.1 Transformation de graphes quelconques en arborescences
3.5.2 Méthode alternative de modélisation à partir de graphes cycliques
3.6 Exemple de prédiction d’une propriété moléculaire par les graph machines (coefficient de partage eau /octanol)
3.7 Conclusion
Chapitre 4 : Modèle virtuel pour la prédiction de propriétés chimiques
4.1 Méthodologie de la modélisation à base des graph machines
4.2 Conclusion
Conclusion générale
Bibliographie

Lire le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *