Conception d’inhibiteurs de protéines kinases à partir de méthodes in silico basées sur les fragments

Chémoinformatique

Définition

La première définition de la chémoinformatique date de 1998, où F.K. Brown indique que la chémoinformatique est le mélange d’informations issues du processus de découverte de médicaments pour obtenir des connaissances permettant d’identifier et d’optimiser, plus rapidement, de meilleurs candidats médicaments . Cette discipline a été officiellement déclarée en Europe en 2006, pendant un congrès à Obernai (France) « Workshop chemoinformatics in Europe : Research and Teaching ». La définition complète qui a été donnée pour la chémoinformatique est :

« Chemoinformatics is a scientific discipline that has evolved in the last 40 years at the interface between chemistry and computer science. It has been realized that in many areas of chemistry, the huge amount of data and information produced by chemical research can only be processed and analyzed by computer methods. Furthermore, many of the problems faced in chemistry are so complex that novel approaches utilising solutions that are based on informatics methods are needed. Thus, methods were developed for building databases on chemical compounds and reactions, for the prediction of physical, chemical and biological properties of compounds and materials, for drug design, for structure elucidation, for the prediction of chemical reactions and for the design of organic syntheses. Research and development in chemoinformatics is essential:

♦ For increasing our understanding of chemical phenomena
♦ For industry to remain competitive in a global economy .

Chemoinformatics methods can be applied in any field of chemistry, from analytical chemistry to organic chemistry. It is of particular importance in drug design and development […] ».

Pour résumer cette définition en une phrase, la chémoinformatique est une discipline permettant l’analyse de données chimiques à partir d’outils informatiques. Les méthodes chémoinformatiques reposent sur :
♦ La construction de chimiothèques (bases de données faites de composés et de réactions chimiques)
♦ La conception de médicaments
♦ La détermination de structures chimiques
♦ La prédiction de :
o Propriétés physiques, chimiques et biologiques de composés
o Réactions chimiques
o Synthèse de composés organiques .

À la suite de ce congrès et de la première journée nationale en chémoinformatique, en 2007, naît la Société Française de Chémoinformatique. Elle regroupe plus de 100 chémoinformaticiens francophones, industriels (27 sociétés privées) et académiques (35 laboratoires académiques) . Cette association est actuellement présidée par le Pr Matthieu Montes. L’apport de l’informatique à la chimie permet de manipuler de grands nombres d’informations, ce qui aurait été impossible autrement. Les bases de données (BDD) contiennent souvent plusieurs millions de molécules et les criblages virtuels à haut débit (virtual High Throughput Screening, vHTS) génèrent autant de résultats à analyser que de molécules testées. L’informatique permet d’estimer la relation quantitative structure-activité (Quantitative Structure Activity Relationship, QSAR) pour prédire l’activité de composés par des modèles statistiques . Ces modèles QSAR sont difficilement applicables à de nouveaux composés . L’intelligence artificielle (IA) est utilisée pour estimer l’activité de nouveaux composés sur de nouvelles cibles . L’apprentissage  par réseaux de neurones profonds est de plus en plus utilisé en chémoinformatique, apportant de meilleurs outils de prédiction de bioactivité, des outils de conception de molécules de novo et des outils de prédiction de synthèse de composés . La chémoinformatique permet, comme je l’évoquais en avant propos, un gain considérable de temps qui entraîne aussi un gain d’argent. Différents échecs peuvent survenir lors des différentes étapes de la conception d’un médicament. Il s’agit par exemple du manque d’efficacité du médicament ou de la présence de toxicité obligeant à arrêter et recommencer les essais cliniques menés. En réduisant ces échecs par des calculs ou prédictions, l’argent non dépensé est économisé.

Représentations moléculaires

Une molécule est « une entité électriquement neutre faite de plus d’un atome (n>1)» . Les atomes composant une molécule peuvent être identiques ou non et sont liés par liaisons covalentes. De nombreuses représentations moléculaires existent, la plus simple étant la formule brute qui indique combien d’atomes de chaque type constituent la molécule. Cette représentation ne précise pas le positionnement de chaque atome et une même formule brute peut représenter différentes molécules. Ainsi, pour observer la manière dont sont liés les atomes d’une molécule, il est possible de la représenter en deux dimensions (2D), par exemple, sous sa formule développée ou topologique. D’autres représentations, comme celles de Cram, permettent d’obtenir une représentation de la molécule en trois dimensions (3D). Bien que ces représentations soient utiles pour qu’un humain puisse interpréter les molécules, elles ne le sont pas pour un ordinateur.

Les programmes informatiques peuvent interagir avec des molécules lorsque celles-ci sont stockées sous la forme de graphes moléculaires. Dans ce type de graphe, les nœuds correspondent aux atomes et les arêtes aux liaisons chimiques entre eux. Ces représentations informatiques des molécules peuvent contenir plus ou moins d’informations, allant de la 2D à la 3D.

Les différents formats utilisés pour transcrire ces représentations sont des chaînes de caractères ou des tables de connectivité. Les chaînes de caractères sont traitées en tant que tableaux à une dimension (1D) ou vecteurs.

Représentations à partir de chaînes de caractères

Les chaînes de caractères encodent de manière légère la représentation 2D d’une molécule. Parmi les formats couramment utilisés, il y a la nomenclature International Union of Pure and Applied Chemistry (IUPAC) , l’International Chemical Identifier (InChI) et le Simplified Molecular Input Line Entry Specification (SMILES) . Il existe de nombreux autres formats pour encoder la représentation 2D d’une molécule, mais dans ce paragraphe, je me focaliserai sur ceux que j’ai utilisé au cours de ma thèse.

La nomenclature IUPAC énumère chaque groupe fonctionnel présent dans la molécule. Elle permet par sa lecture de dessiner la molécule. La nomenclature IUPAC est faite pour être comprise par l’humain. Elle repose sur trop de règles et de manières différentes de décrire une même molécule pour être optimisée pour son utilisation par un programme informatique.

Le format SMILES est un format initialement propriétaire, développé par Daylight Chemical Information Systems , devenu libre de droits depuis 2007 avec le projet OpenSMILES. Il est compréhensible et interprétable par l’humain et la machine. Il repose sur un nombre minimal de règles simples pour encoder le graphe d’une molécule. Lors de son utilisation dans une BDD, où les redondances doivent être évitées, il peut être converti en SMILES canonique pour éviter d’avoir deux représentations SMILES encodant la même molécule. Cependant, la forme canonique dépend de l’algorithme utilisé pour l’obtenir, elle n’est donc pas unique pour une même molécule.

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

Chapitre 1 : Introduction
1.1 Chémoinformatique
1.1.1 Définition
1.1.2 Représentations moléculaires
1.1.3 Descripteurs moléculaires
1.1.4 Bases de données en chémoinformatique
1.2 Les médicaments
1.2.1 Définition d’un médicament
1.2.2 Généralités sur les médicaments
1.3 Conception de médicaments
1.3.1 Recherche
1.3.2 Développement
1.3.3 Commercialisation
1.4 Conception de médicaments basée sur les fragments
1.4.1 Définition
1.4.2 Historique
1.4.3 Création d’une chimiothèque de fragments
1.4.4 Criblage de fragments
1.4.5 Identification des meilleures touches
1.4.6 Optimisation des touches vers une tête de série
1.5 L’intelligence artificielle dans la conception d’inhibiteurs de novo
1.6 Les protéines kinases
1.6.1 Définition
1.6.2 Historique
1.6.3 Implications pathologiques
1.6.4 Classification
1.6.5 Structure 3D
1.7 Les inhibiteurs de protéines kinases
1.7.1 Définition
1.7.2 Catégories
1.7.3 PKI déjà connus
1.8 Étude des scaffolds des inhibiteurs de protéines kinases
1.9 Conclusion
Chapitre 2 : Frags2Drugs, un logiciel basé sur les fragments pour la conception d’inhibiteurs de protéines kinases
2.1 Présentation de Frags2Drugs
2.1.1 Historique
2.1.2 Conception de F2D
2.1.3 Recherche de macrocycles
2.2 Analyse de F2D et poursuite du développement
2.2.1 Analyse par reconstruction des ligands d’origine
2.2.2 Ajout de branches Git au code source de F2D
2.2.3 Analyse de l’architecture du code source de F2D
2.2.4 Mise en place d’une installation facilitée via Docker
2.3 Conclusion et perspectives
Chapitre 3 : Plateforme d’outils SB&C – Ouverture à l’utilisation des outils de l’équipe SB&C
3.1 Présentation des outils
3.2 Environnement technique de la plateforme SB&C
3.2.1 Reverse proxy (serveur mandataire inverse)
3.2.2 Docker et Docker Compose
3.3 MetaPredict
3.3.1 Description
3.3.2 Mise en production
3.3.3 Améliorations apportées
3.3.4 Améliorations possibles
3.4 Moldesc
3.4.1 Description
3.4.2 Django
3.4.3 Améliorations apportées
3.4.4 Améliorations possibles
3.5 KinoMine
3.5.1 Description
3.5.2 Base de données
3.5.3 Article de présentation de KinoMine
3.5.4 Améliorations apportées
3.5.5 Améliorations possibles
3.5.6 Conclusion
3.6 Frags2Drugs
3.6.1 Bases de données
3.6.2 Celery
3.6.3 Améliorations possibles
3.7 Conclusion et perspectives
Chapitre 4 : Découverte de nouvelles molécules bioactives à l’aide d’outils in silico
4.1 Introduction
4.2 ICOA – Orléans (LabEx SynOrg)
4.2.1 Contexte biologique
4.2.2 Graines utilisées
4.2.3 Agrandissement des fragments
4.2.4 Bilan du projet LabEx ICOA
4.3 COBRA – Rouen (LabEx SynOrg)
4.3.1 Contexte biologique
4.3.2 Graines utilisées
4.3.3 Agrandissement des fragments
4.3.4 Bilan du projet LabEx COBRA
4.4 GICC – Tours (LabEx SynOrg)
4.4.1 Contexte biologique
4.4.2 Recherche de petites molécules inhibitrices
4.4.3 Recherche de macrocycles
4.4.4 Bilan du projet LabEx GICC
4.5 Recherche de sondes fluorescentes
4.5.1 Contexte biologique
4.5.2 Graines utilisées
4.5.3 Agrandissement des fragments
4.5.4 Bilan du projet de recherche de sondes fluorescentes
4.6 Conclusion et perspectives
Chapitre 5 : Conclusion

Lire le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *