Le contexte de l’industrie pharmaceutique

Le contexte de l’industrie pharmaceutique

   La majorité des publications abordant le travail de Swanson est d’origine académique ou universitaire. Si l’on se base sur la littérature, l’industrie ne semble pas encore s’être réellement penchée sur le sujet. Or, il est aujourd’hui courant de trouver des articles sur le datamining ou le traitement de grands volumes de données par des méthodes bio-informatiques dans les revues de drug discovery. A notre connaissance, seuls Mack et Hehenberger ont abordé le sujet dans ce cadre [Mack, 2002]. Revenant sur le défi que représente la gestion de volume croissant d’informations, ils exposent quelques méthodes d’extraction d’informations et abordent, entre autres, l’exemple de la maladie de Raynaud et de l’huile de poisson. Mack et Hehenberger insistent sur le fait que les technologies aujourd’hui utilisées dans la découverte de nouveaux médicaments produisent de grandes quantités de données : le séquençage de génomes, le séquençage de protéines, les puces à ADN, les tests à haut débit (HTS, high throughput screening), etc…

Le processus de recherche et développement d’un médicament est long car il faut compter une dizaine d’années avant de pouvoir mettre une molécule sur le marché. Le taux d’attrition est très élevé, puisqu’une molécule sur 10.000 aura peut-être la chance d’être mise sur le marché [Lawrence, 2002]. Le coût de développement d’un médicament est estimé en moyenne à 802 millions de dollars US [DiMasi, 2003]. Les laboratoires pharmaceutiques prennent donc beaucoup de risques car ils ne peuvent compter que sur un nombre limité de produits pour financer leur R&D. Aujourd’hui, l’industrie pharmaceutique a mis en place des stratégies de traitement à haut débit pour la phase précoce de découverte de molécules – drug discovery – [Warne, 2003] : il s’agit de gagner en productivité dans les étapes où il est possible d’automatiser les manipulations répétitives. Nous verrons comment notre méthode peut intervenir comme outil d’aide à la sélection dans ces phases ou également être utilisée pour tenter de réorienter un médicament dans d’autres indications que celle pour laquelle il a été mis sur le marché

Maladie de Raynaud et huile de poisson : la première découverte de Don Swanson et le modèle ABC

  En 1986, Don Swanson, professeur à l’Université de Chicago, publie le premier article d’une longue série, dans lequel il expose une méthode originale de découverte de connaissances dans les bases de données bibliographiques [Swanson, 1986a]. Une des idées majeures qui a guidé les travaux de Swanson est qu’avec l’explosion du nombre de publications scientifiques et la fragmentation des communautés de chercheurs autours de thèmes toujours plus complexes, il existe certainement des connections latentes à découvrir. Supposons qu’un champ de la médecine lie une substance A avec des symptômes B et qu’un autre champ de la médecine, bien distinct du premier, lie ces mêmes symptômes B à une maladie C. Si ces deux faits sont décrits séparément dans la littérature, il existe une connexion cachée implicite et logique entre A et C, à travers B. Cependant, jusqu’à ce qu’un chercheur étudie de concert les littératures AB et BC, ce lien restera latent.

Son travail sur la maladie de Raynaud conduit Swanson à formuler l’hypothèse selon laquelle l’huile de poisson pourrait agir sur cette pathologie. A l’époque de ces travaux, il était bien établi que les patients atteints de la maladie de Raynaud avaient des problèmes d’agrégation plaquettaire et une viscosité sanguine élevée. Il était également connu que l’huile de poisson a pour effet, entre autres, d’inhiber l’agrégation plaquettaire et de diminuer la viscosité sanguine. Ces deux faits étaient largement repris à travers la littérature. Par contre, il n’existait aucune publication suggérant que l’huile de poisson pourrait traiter la maladie de Raynaud. Après analyse de la littérature, Swanson fut le premier à proposer d’utiliser l’huile de poisson comme traitement pour la maladie de Raynaud. On peut ainsi décrire le modèle de Swanson [Pierret, 2004] : entre un savoir sur une substance thérapeutique A et une maladie C, il existe des liens B, classiquement des phénomènes physiologiques. A travers la littérature biomédicale, les connaissances sur les liens AB et BC peuvent exister bien que la connexion implicite AC ne soit pas connue.

Introduction du modèle ABC

    Poursuivant sa réflexion sur les 3 mondes de Popper [Swanson 1986b], Swanson illustre comment exploiter le monde 3 pour révéler des savoirs latents. Le processus de recherche d’information, à l’instar d’une théorie scientifique, peut être critiqué et amélioré, mais on ne pourra jamais vérifier qu’il est capable de tel-00011704, version 1 – 1 Mar 2006 retrouver toute l’information pertinente pour un problème ou une théorie donné, l’exhaustivité n’étant pas assurée. C’est un processus imparfait ce qui, aux yeux de Swanson, le rend particulièrement intéressant dans le contexte de la découverte de connaissances. C’est sur cette faiblesse que repose la notion du savoir public non découvert (undiscovered public knowledge).

Faiblesse à double tranchant, qu’il convient d’exploiter dans le bon sens. Ainsi, la proposition « tous les chats que nous avons rencontré étaient gris, donc tous les chats sont gris » est vraie tant que nous ne rencontrons pas un chat d’une autre couleur. L’observation d’une multitude de chats gris, n’assure pas la véracité de cette proposition alors que l’observation d’un seul chat noir l’infirme. C’est toute la fragilité du raisonnement inductif basé sur l’exploitation de données incomplètes, non exhaustives. D’un autre coté, la fragmentation des connaissances qui ajoute à l’impossibilité d’effectuer une recherche complète d’information, ouvre le champ à la découverte de nouveaux savoirs, basée sur la complémentarité d’éléments disponibles dans la bibliographie. Ainsi, si A cause B et B cause C, alors A cause ou implique C. Si les relations AB et BC sont connues, mais ne sont liés d’aucune manière, alors AC restera caché. Pour que ce lien soit découvert, il faut qu’une même personne au même moment s’intéresse à AB et BC et perçoive l’implication logique AC. Remarquer que A implique C est la découverte d’une nouvelle connaissance par un explorateur du monde 3. Swanson suggère que la recherche d’information et le savoir public non découvert, bien qu’illimités en diversité et complexité, présentent une certaine structure, un certain ordre qui mérite d’être étudié plus en avant.

La croissance du savoir scientifique est habituellement perçue comme porteuse de nouvelles découvertes à partir du monde 1. Cependant, les professionnels de l’information pourraient explorer et exploiter le monde 3 afin d’en dégager denouvelles connaissances. Swanson n’oppose pas la découverte de connaissances par l’exploitation de la littérature à la découverte de connaissances par l’expérimentation. Son propos est d’examiner la structure logique des connexions cachées et le processus de découverte de telles connexions. Les théories scientifiques dépendent étroitement des connaissances disponibles dans la littérature et il est illusoire de vouloir séparer les découvertes basées sur la littérature de celles basées sur l’expérimentation au laboratoire.

Etude des co-citations

   L’étude des co-citations part de l’idée que des relations peuvent exister entre documents qui sont cités ensemble. Par exemple, deux documents qui ne sont cités qu’une seule fois ensemble n’auront peut-être pas de relation entre eux. En revanche, deux documents cités ensemble à de nombreuses reprises par différents autres documents seront probablement liés. Swanson a réalisé l’étude des co-citations pour estimer à quel point les deux littératures sont disjointes. Son but est de rechercher un ou des articles quelconques qui citent en même temps un article de chaque littérature au moins. L’analyse des citations d’un ou plusieurs de ces 59 articles à l’aide de SciSearch identifie 489 articles citants [Swanson, 1986a] et [Swanson, 1987]. 173 de ces articles citent plus d’une fois un élément des littératures sur l’huile de poisson ou la maladie de Raynaud, ce qui permet d’isoler 194 paires d’articles différentes, co-citées 500 fois. Seulement quatre sur 489 citent à la fois au moins un article parmi les 34 sur la maladie de Raynaud et au moins un article parmi les 25 sur l’huile de poisson.

Ces quatre articles sont des revues traitant des prostaglandines. Deux ne présentent aucun intérêt dans notre contexte, puisque la maladie de Raynaud n’est citée qu’une seule fois par article, indépendamment de l’huile de poisson [Preston, 1985] et [Weksler, 1984]. De plus, leurs vastes bibliographies contribuent à diluer l’impact de la présence simultanée des articles des deux groupes (respectivement 66 [Preston, 1985] et 113 citations [Weksler, 1984]). Les deux autres articles sont pratiquement identiques en terme de contenu et d’auteur ; Swanson considère qu’il s’agit d’une même revue de la littérature [Moncada, 1983, 1984]. Bien qu’ils ne mentionnent pas de lien entre l’huile de poisson et la maladie de Raynaud, le fait qu’ils exposent les deux sujets – de manière séparée – suggère un rôle important de ce type d’article. Dans ce cas, les deux sujets sont discutés isolément, mais sur des bases physiologiques communes. Les revues de la littérature, de portée générale, qui proposent un aperçu global d’un sujet, offre un support au rapprochement dedeux sujets disjoints mais complémentaires (sans que les auteurs n’en aient forcément conscience).

Pour ces deux articles, l’importance de la bibliographie citée tend à cacher la connexion (198 pour celui de 1983 et 159 pour celui de 1984). Enfin, Swanson a regardé un par un les titres des 489 articles, identifiant deux autres articles intéressants. L’un suggère de traiter le syndrome de Sjorgren et la sclérodermie avec des acides gras essentiels [Horrobin, 1984]. L’autre décrit une étude clinique de l’huile essentielle de primevère (EPO, evening primerose oil) comme traitement de la maladie de Raynaud [Belch, 1985b]. Ces quatre articles identifiés par Swanson constituent la seule relation, ténue, entre la maladie de Raynaud et l’huile de poisson. Leur analyse ne permet pas d’envisager ce lien. Bien que les deux littératures fassent l’objet d’un grand nombre de co-citations, très peu de ces co-citations concernent à la fois l’huile de poisson et la maladie de Raynaud. De ce point de vue, les deux littératures sont isolées.

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

Introduction
Augmentation du volume d’informations et fragmentation du savoir vers un nouveau mode d’exploitation des bases de données bibliographiques
Le contexte de l’industrie pharmaceutique
Maladie de Raynaud et huile de poisson : la première découverte de Don Swanson et le modèle ABC
Pour résumer
Plan de la thèse
Première Partie : état de l’art 
1.1 Historique de la découverte de Don Swanson 
1.2 Le cadre épistémologique
1.3 Maladie de Raynaud et huile de poisson 
1.3.1 Introduction du modèle ABC
1.3.2 Méthode bibliographique
1.3.2.1 Etude des co-citations
1.3.2.2 Etude du couplage bibliographique
1.3.2.3 Analyse des littératures complémentaires : effet plausible de l’huile de poisson sur la maladie de Raynaud
1.4 Migraine et magnésium, une seconde découverte à partir de la méthode bibliographique 
1.5 La méthodologie explore/exclude ou trial-and-error 
1.5.1 Première partie : exploration
1.5.2 Seconde partie : exclusion
1.5.3 Résumé de la méthode bibliographique
1.6 Le modèle ABC 
1.6.1 Le savoir public caché
1.6.2 Processus de découverte ouvert ou fermé
1.6.3 Logique non-booléene
1.7 Systèmes d’aide à la découverte de connaissance 
1.7.1 Arrowsmith
1.7.2 Le DAD
1.7.2.1 Générer C→B
1.7.2.2 Générer B→A
1.7.2.3 Tester A→B←C
1.7.2.4 Etude DAD sur de nouveaux usages potentiels de la thalidomide
1.7.2.5 Effets indésirables désirables
1.7.3 Autres systèmes
1.8 Conclusion de la première partie : valeur de la méthode de Swanson 
Deuxième partie : le DPM (Diseases – Physiopathology – Molecules)
2.1 Anamnèse 
2.2 Les sources de la National Library of Medicine 
2.2.1 La citation Medline
2.2.2 Le MeSH
2.2.2.1 Le MeSH Tree
2.2.2.2 Descripteurs et subheadings
2.2.2.3 Descripteurs majeurs
2.2.2.4 Explosion : utilisation de la hiérarchie
2.2.2.5 Supplementary Concepts Records
2.2.2.6 Mises à jours du MeSH
2.3 La première expérience DPM 
2.3.1 Constitution des dictionnaires
2.3.2 Interrogation de Medline sur la maladie de Raynaud
2.3.3 Extraction des concepts B
2.3.4 Interrogation de Medline à partir des concepts B
2.3.5 Extraction des concepts A
2.3.6 Au-delà de l’huile de poisson
2.3.7 Epilogue de la première expérience DPM
2.4 La deuxième expérience DPM 
2.4.1 Extraction des concepts B de la littérature sur la maladie de Raynaud
2.4.2 Extraction des concepts B de la littérature sur l’huile de poisson
2.4.3 Identification des concepts B communs aux deux littératures : tester C→B←A
2.4.4 Une première modification du tableau des concepts communs
2.5 La troisième expérience DPM 
2.5.1 Etape 1 : définition de la physiopathologie
2.5.2 Etape 2 : requêtes Medline
2.5.3 Etape 3 : extraction des concepts,création des tableaux
2.5.3.1 Extension du calcul du coefficient à n colonnes
2.5.3.2 Autres tableaux
2.5.3.3 Présentation graphique
2.5.4 Etape 4 : analyse par l’expert
2.6 Les biais du DPM 
2.6.1 La nature du lien entre deux concepts
2.6.2 L’utilisation du MeSH
2.6.3 Choix des phénomènes physiologiques
2.6.4 Problèmes de hiérarchie
2.6.5 Thesaurus et résultats négatifs
2.7 Conclusion de la deuxième partie 
Troisième partie : Evolutions possibles du DPM 
3.1 Le DPM et Medline
3.1.1 DPM et texte libre
3.1.1.1 Travail sur les titres seuls
3.1.1.2 Travail sur les titres et abstracts
3.1.1.3 Remarques sur le travail sur les titres et/ou abstracts
3.1.2 DPM et champs contrôlés
3.1.2.1 EC/RN Number
3.1.2.2 Secondary Source ID
3.2 Découverte de connaissances et autres sources d’information 
3.2.1 Bases de données bibliographiques
3.2.2 Découverte de connaissances et Internet
3.3 Conclusion de la troisième partie
Conclusion 
4.1 DPM, industrie pharmaceutique et expertise 
4.2 Diffusion du modèle de Swanson 
4.3 Retour sur le travail de Swanson 
Bibliographie
Annexe 1 : bibliographie supportant la première découverte de Swanson
A1.1 Bibliographie sur la maladie de Raynaud – 34 articles
A1.2 Bibliographie sur l’huile de poisson – 25 articles
A1.3 Bibliographie complémentaire (articles cités, couplage …)
Annexe 2 : exemple de citation Medline
Annexe 3 : dictionnaires DPM selon le MeSH 2005
A3.1 Tree Drugs
A3.2 Tree Proteins/Targets
A3.3 Tree Physiology
A3.4 Tree Diseases
A3.5 Tree Anatomy
A3.6 Tree Dietary Factors
Annexe 4 : liste des concepts B (physiologie) du premier DPM maladie de Raynaud/huile de poisson
Annexe 5 : liste des concepts A (dietary factors) du premier DPM maladie de Raynaud/huile de poisson

Le contexte de l’industrie pharmaceutiqueTélécharger le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *