La chemoinformatique: concepts et outils

L’informatique joue un rรดle croissant dans la recherche en Chimie. Des secteurs trรจs variรฉs de la recherche fondamentale ou appliquรฉe nรฉcessitent des spรฉcialitรฉs du traitement informatique, de l’information chimique, de la modรฉlisation molรฉculaire ou de la chimie thรฉorique. La chimie se prรชte ร  un traitement informatique car elle est complexe et nรฉcessite des capacitรฉs d’acquisition, de traitement et d’archivage considรฉrables. D’importantes bases de donnรฉes se constituent ร  travers le monde pour permettre aux chercheurs de suivre quasiment en temps rรฉel l’avancement de la chimie. Le but est de montrer l’implication de l’informatique dans diffรฉrentes applications de la chimie. Ce domaine est appelรฉ ยซย Chemoinformatiqueย ยป.

Le terme ยซย chemoinformatique ย ยป est apparu il y a quelques annรฉes et a rapidement gagnรฉ lโ€™utilisation rรฉpandue, Greg Paris a proposรฉ une dรฉfinition beaucoup plus large [1] Chemoinformatique est un terme gรฉnรฉrique qui entoure la conception, crรฉation, organisation, gestion, rรฉcupรฉration, analyse, diffusion, visualisation, et utilisation d’information chimique.

Clairement, la transformation des donnรฉes en information et d’information en connaissance est un effort requis dans n’importe quelle branche de la chimie non seulement dans la conception de mรฉdicament. Nous partageons donc l’opinion que des mรฉthodes de chemoinformatique sont nรฉcessaires dans tous les secteurs de la chimie et adhรฉrer ร  une dรฉfinition beaucoup plus large : Chemoinformatique est l’application des mรฉthodes d’informatique pour rรฉsoudre des problรจmes chimiques. Pourquoi nous devons employer des mรฉthodes d’informatique dans la chimie ? Beaucoup de problรจmes en chimie sont trop complexes pour รชtre rรฉsolus par des mรฉthodes basรฉes sur les premiers principes par des calculs thรฉoriques. Cโ€™est vrai, premiรจrement, pour la relation entre la structure d’un composรฉ et son activitรฉ biologique. Cependant, il s’applique รฉgalement ร  beaucoup d’aspects de la rรฉactivitรฉ chimique comme l’influence d’un catalyseur ou d’une tempรฉrature.

Dรฉfinition

La chemoinformatique, รฉgalement dรฉnommรฉe chemoinformatique (anglicisme) ou chimioinformatique, est le domaine de la science qui consiste en l’application de l’informatique aux problรจmes relatifs ร  la chimie. Elle a pour objectif de fournir des outils et des mรฉthodes pour l’analyse et le traitement des donnรฉes issues des diffรฉrents domaines de la chimie.

Elle est notamment utilisรฉe en pharmacologie pour la dรฉcouverte de nouvelles molรฉcules actives et la prรฉdiction de propriรฉtรฉs ร  partir de structures molรฉculaires. Certaines applications de la chemoinformatique reposent sur les รฉquations de la physique quantique. Elles permettent ainsi de modรฉliser les conformations des molรฉcules [3].

Historique

La chemoinformatique est une nouvelle discipline apparue il y a environ 40 ans. Au dรฉbut des annรฉes soixante, dans le but d’รฉlucider la structure de composรฉs chimiques inconnus, les donnรฉes provenant des mรฉthodes existantes (spectroscopie) ont รฉtรฉ mises en commun sur informatique, Cโ€™รฉtait la naissance de la chemoinformatique. Le projet DENDRAL initiรฉ en 1964 ร  l’universitรฉ de Stanford a รฉtรฉ le premier ร  dรฉvelopper des gรฉnรฉrateurs de structures chimiques ร  partir de spectres de masses. Ce n’est qu’ร  la fin des annรฉes 60 que Sasaki ร  l’universitรฉ de technologie de Toyohashi et Munk ร  l’universitรฉ d’Arizona ont utilisรฉ plusieurs mรฉthodes de spectroscopie afin d’รฉlucider la structure chimique de leurs composรฉs. En 1969, Corey et Wipke ont prรฉsentรฉ un travail similaire concernant les systรจmes de reprรฉsentation des molรฉcules. Peu aprรจs d’autres groupes comme Ugi, Hendrickson et Gelernter ont dรฉveloppรฉs des systรจmes pour reprรฉsenter des molรฉcules organiques. La chemoinformatique (qui n’avait pas encore de nom) a รฉtรฉ reconnue ร  la fin des annรฉes 60 comme une mรฉthode utile d’analyse des donnรฉes. Dรจs lors, beaucoup d’articles concernant cette discipline ont commencรฉ ร  apparaรฎtre dans les journaux scientifiques. C’est seulement en 1998 que F.K Brown a dรฉfini pour la premiรจre fois cette discipline comme รฉtant la chemoinformatique [5].

Concepts de base

La chimie

La chimie est une science de la nature divisรฉe en plusieurs spรฉcialitรฉs, ร  l’instar de la physique et de la biologie avec lesquelles elle partage des espaces d’investigations communs ou proches.

Pour reprendre un canevas de prรฉsentation proposรฉe par la plus grande association de chimistes au monde, l’American Chemical Society, la chimie รฉtudie [6] :
1. les รฉlรฉments chimiques ร  l’รฉtat libre, atomes ou ions atomiques, et les innombrables et diverses associations par liaisons chimiques qui engendrent notamment des composรฉs molรฉculaires stables ou des intermรฉdiaires plus ou moins instables. Ces entitรฉs de matiรจre peuvent รชtre caractรฉrisรฉes par une identitรฉ reliรฉe ร  des caractรฉristiques quantiques et des propriรฉtรฉs prรฉcises.
2. les processus qui changent ou modifient l’identitรฉ de ces particules ou molรฉcules de matiรจre, dรฉnommรฉs rรฉaction, transformation, interaction…
3. les mรฉcanismes intervenant dans les processus chimiques ou les รฉquilibres physique entre deux formes. Leurs dรฉfinitions prรฉcises permettent de comprendre ou d’interprรฉter avec des hypothรจses l’รฉvolution matรฉrielle avec en vue une exploitation des rรฉsultats de faรงon directe ou induite.
4. les phรฉnomรจnes fondamentaux observables en rapport avec les forces de la nature qui jouent un rรดle chimique, favorisant les rรฉactions ou synthรจse, addition, combinaison ou dรฉcomposition, sรฉparation de phases ou extraction. L’analyse permet de dรฉcouvrir les compositions, le marquage sรฉlectif ouvre la voie ร  un schรฉma rรฉactionnel cohรฉrent dans des mรฉlanges complexes.

Une science segmentรฉe en de multiples disciplines

La recherche et l’enseignement en chimie sont organisรฉs en disciplines qui, souvent en absence de services, de coopรฉration ou d’aides rรฉciproques, s’ignorent et se dรฉveloppent en toute autonomie [7] :

โ– la biochimie qui รฉtudie les rรฉactions chimiques dans des milieux biologiques (cellulesโ€ฆ) et/ou avec des objets biologiques (protรฉinesโ€ฆ).

โ– la chimie analytique est l’รฉtude des mรฉthodes d’analyses qualitatives et/ou quantitatives qui permettent de connaรฎtre la composition d’un รฉchantillon donnรฉ ; ses principaux domaines sont : la chromatographie et la spectroscopie;

โ– la chimie des matรฉriaux est la prรฉparation et l’รฉtude de substances avec une application en tant que matรฉriau. Ce domaine intรจgre des รฉlรฉments des autres domaines classiques de la chimie avec un intรฉrรชt particulier pour les problรจmes fondamentaux concernant les matรฉriaux.

โ– la chimie inorganique ou chimie minรฉrale, concerne la description et l’รฉtude des รฉlรฉments chimiques et des composรฉs sans squelette carbonรฉ.

โ– la chimie organique est la description et l’รฉtude des composรฉs comportant un squelette d’atomes de carbone (composรฉs organiques) ;

โ– la chimie physique dont l’objet est l’รฉtude des lois physiques des systรจmes et procรฉdรฉs chimiques ; ses principaux domaines d’รฉtude comprennent : la thermochimie, la cinรฉtique chimique, l’รฉlectrochimie, la radiochimie, la sonochimie et les spectroscopies.

โ– la chimie thรฉorique est l’รฉtude de la chimie ร  travers un raisonnement thรฉorique fondamental (habituellement ร  l’aide des mathรฉmatiques et de la physique). En particulier, l’application de la mรฉcanique quantique ร  chimie a donnรฉ naissance ร  la chimie quantique. Depuis la fin de la seconde guerre mondiale, le progrรจs des ordinateurs a permis le dรฉveloppement de la chimie numรฉrique (ou computationnelle).

Lโ€™atome : est formรฉ d’un noyau atomique contenant des nuclรฉons qui maintient autour de lui un nombre d’รฉlectrons รฉquilibrant la charge positive du noyau.

Lโ€™รฉlรฉment chimique : est l’ensemble des atomes qui ont un nombre donnรฉ de protons dans leur noyau. Ce nombre est son numรฉro atomique. Par exemple, tous les atomes avec 6 protons dans leurs noyaux sont des atomes de l’รฉlรฉment carbone.

Le rapport de stage ou le pfe est un document dโ€™analyse, de synthรจse et dโ€™รฉvaluation de votre apprentissage, cโ€™est pour cela chatpfe.com propose le tรฉlรฉchargement des modรจles complet de projet de fin dโ€™รฉtude, rapport de stage, mรฉmoire, pfe, thรจse, pour connaรฎtre la mรฉthodologie ร  avoir et savoir comment construire les parties dโ€™un projet de fin dโ€™รฉtude.

Table des matiรจres

Introduction gรฉnรฉrale
Problรฉmatique
Objectif de la thรจse
Contribution
Organisation du mรฉmoire
Chapitre 1 : La chemoinformatique: concepts et outils
1.1 Dรฉfinition
1.2 Historique
1.3 Concepts de base
1.3.1 La chimie
1.3.2 Lโ€™atome
1.3.3 Lโ€™รฉlรฉment chimique
1.3.4 La liaison chimique
1.3.5 La molรฉcule
1.3.6 Lโ€™ion
1.3.7 Le composรฉ chimique
1.3.8 La rรฉaction chimique
1.3.9 Propriรฉtรฉ physico-chimique de molรฉcule (des protรฉines)
1.3.10 Prรฉdiction de propriรฉtรฉ ou dโ€™activitรฉ (Relation quantitative structure ร  activitรฉ)
1.4 Vue dโ€™ensemble
1.4.1 Reprรฉsentation des composรฉs chimiques
1.4.2 Reprรฉsentation des rรฉactions chimiques
1.4.3 Donnรฉes en chimie
1.4.4 Les sources de donnรฉes et les bases de donnรฉes
1.4.5 Mรฉthodes pour calculer des donnรฉes physiques et chimiques
1.4.6 Calcul des descripteurs de structure
1.4.7 Mรฉthodes dโ€™analyse de donnรฉes
1.5 Mรฉthodes et outils
1.5.1 Mรฉthodes de la modรฉlisation molรฉculaire
1.5.2 Mรฉthodes de recherche de mรฉdicaments
1.6 Quelques logiciels
1.6.1 Logiciels utilisรฉs pour la reprรฉsentation molรฉculaire
1.6.2 Logiciels utilisรฉs pour les calculs de propriรฉtรฉs
1.7 Applications de chemoinformatique
1.7.1 Commentaires gรฉnรฉraux
1.7.2 Applications de chemoinformatique par secteurs de chimie
1.8 Applications
1.8.1 Lโ€™utilisation de QSAR et de mรฉthodes informatiques dans la conception de mรฉdicament
1.8.2 Prรฉvisions confiantes de sรฉgrรฉgation des propriรฉtรฉs des produits chimiques pour le criblage virtuel des mรฉdicaments
1.8.3 Classification de composรฉe chimique avec les modรจles de structure extraits automatiquement
1.8.4 Mรฉthode dโ€™arbres ร  sortie noyau pour la prรฉdiction de sorties structurรฉes et lโ€™apprentissage de noyau
1.8.5 Approche multi-classes de reprรฉsentation des molรฉcules pour la conception des produits-procรฉdรฉs assistรฉes par ordinateur
1.8.6 Relation structure molรฉculaire-odeur (Utilisation des rรฉseaux de neurones pour lโ€™estimation de lโ€™odeur balsamique)
1.8.7 Une distance dโ€™รฉcoulement de rรฉseau entre les graphes รฉtiquetรฉs
1.8.8 La fouille de graphes dans les bases de donnรฉes rรฉactionnelles au service de la synthรจse en chimie organique
1.8.9 Regrouper des molรฉcules : influence des mesures de similitude
1.9 Conclusion
Chapitre 2 : Mรฉthodes de modรฉlisations
2.1 Les descripteurs
2.1.1 Les descripteurs molรฉculaires
2.1.2 Rรฉduction du nombre de variables
2.2 Modรฉlisation par optimisation sans contrainte
2.2.1 Rรฉseaux de neurones
2.2.2 Sรฉlection du modรจle
2.3 Autres mรฉthodes de QSPR/QSAR
2.3.1 Mรฉthode de contribution de groupes
2.3.2 Analyse comparative de champs molรฉculaires (CoMFA)
2.4 Conclusion
Chapitre 3 : Modรฉlisation ร  lโ€™aide des graph machines
3.1 Les graphes (dรฉfinition et caractรฉristiques)
3.1.1 Graphes simples
3.1.2 Graphes orientรฉs
3.1.3 Graphes รฉtiquetรฉs
3.1.4 Matrice dโ€™adjacence
3.2 Apprentissage ร  partir de graphes :RAAMs et LRAAMs
3.2.1 Les Mรฉmoires Auto-Associatives Rรฉcursives
3.2.2 Les Mรฉmoires Rรฉcursives Auto-Associatives Etiquetรฉes
3.3 Les graph machines
3.3.1 Modรฉlisation ร  partir de graphes acycliques
3.3.2 Structure mathรฉmatique des graph machines
3.3.3 Les รฉtiquettes
3.4 Lโ€™apprentissage des graph machines
3.4.1 Propriรฉtรฉ dโ€™approximation universelle
3.4.2 Utilisation des algorithmes traditionnels
3.4.3 Sรฉlection de modรจle
3.5 Modรฉlisation ร  partir de graphes cycliques
3.5.1 Transformation de graphes quelconques en arborescences
3.5.2 Mรฉthode alternative de modรฉlisation ร  partir de graphes cycliques
3.6 Exemple de prรฉdiction dโ€™une propriรฉtรฉ molรฉculaire par les graph machines (coefficient de partage eau /octanol)
3.7 Conclusion
Chapitre 4 : Modรจle virtuel pour la prรฉdiction de propriรฉtรฉs chimiques
4.1 Mรฉthodologie de la modรฉlisation ร  base des graph machines
4.2 Conclusion
Conclusion gรฉnรฉrale
Bibliographie

Lire le rapport complet

Tรฉlรฉcharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiรฉe. Les champs obligatoires sont indiquรฉs avec *