L’addiction : détournement de l’apprentissage motivé par la récompense

L’addiction : détournement de l’apprentissage motivé par la récompense 

Les apprentissages motivés par la récompense

Nos comportements sont motivés par des récompenses de différentes natures parmi lesquelles nous devons constamment choisir. Le système nerveux central (SNC) doit intégrer les informations concernant les différentes récompenses et les comparer pour choisir les options avec la valeur subjective la plus élevée. Ces récompenses, ainsi que les stimuli environnementaux et internes qui y sont associés, influencent l’activité des réseaux neuronaux du circuit de la récompense pour réguler l’apprentissage et adapter les comportements dirigés vers un but. Cette plasticité des neurones du système de la récompense joue un rôle central dans les apprentissages motivés par la récompense et elle est altérée dans l’addiction.

Depuis plus d’un siècle, les chercheurs étudient le comportement animal pour comprendre les bases des actions orientées vers un but. Sur la base de l’observation du comportement animal, Thorndike a formulé la loi de l’effet qu’on peut résumer ainsi : « Lorsqu’une réponse est suivie d’une récompense, la connexion entre la réponse et la situation (de récompense) sera renforcée ; et si la réponse est punie, ou non récompensée, la connexion sera affaiblie » (Thorndike, 1911). Selon ce principe, toute action qui amène à une récompense a plus de chance d’être répétée dans le futur. Mais qu’est-ce qu’une récompense et quels rôles jouent-elles ? On peut définir la récompense grâce à ses trois grandes fonctions : le plaisir, l’apprentissage et la motivation (« liking », « learning », « wanting ») (Berridge et al., 2009; Schultz, 2006). Le plaisir : les récompenses ont des propriétés hédoniques, c’est-à-dire qu’elles induisent des émotions positives. Cette propriété de la récompense est centrale car c’est la sensation de plaisir associée à la récompense qui motive et permet de mieux apprendre. Ceci prend tout son sens du point de vue évolutif, car le plaisir associé à des actions telles que manger, boire ou se reproduire aurait été sélectionné par l’évolution pour renforcer l’apprentissage et la répétition de ces comportements indispensables à la survie de l’individu et de l’espèce (Rolls, 1999). L’apprentissage : selon Pavlov, la récompense est un objet produisant un changement comportemental assimilé à de l’apprentissage. Certains stimuli, dits primaires, agissent comme des récompenses de façon innée, dès la naissance. C’est par exemple le cas du lait maternel. D’autres stimuli, dits secondaires, peuvent acquérir leur valeur de récompense au travers d’un apprentissage associatif, comme le montre les expériences de Pavlov. En effet, lorsqu’un son de cloche précède la présentation d’une saucisse de manière régulière, les chiens salivent au son de la cloche et pas seulement lorsqu’ils sentent la saucisse (Pavlov, 1927). Une valeur a donc été conférée au son de cloche, un stimulus initialement neutre qui, par association, est devenu prédictif de l’arrivée imminente de la récompense (Figure 1). Dans cette forme d’apprentissage appelée conditionnement « pavlovien » ou «classique », la récompense est considérée comme un « stimulus inconditionnel » (US) et le stimulus prédictif (le son de la cloche) est considéré comme un « stimulus conditionnel » (CS).

Le circuit de la récompense

La notion de circuit de la récompense, également appelé « système de la récompense » ou « système mésocorticolimbique », a été introduite en 1954 par les expériences légendaires de James Olds et Peter Milner qui travaillaient à l’époque dans le laboratoire de Donald Hebb à l’université de McGill (Olds and Milner, 1954). Olds et Milner étudiaient à l’époque le système réticulaire activateur ascendant, une région du mésencéphale qui jouerait un rôle dans l’état d’éveil et d’excitation. Pour tester leur hypothèse, ils implantèrent une électrode de stimulation dans cette région pour essayer d’induire un état d’excitation chez des rats circulant librement dans leur cage. L’expérience est un échec, mais Olds et Milner remarquent qu’un rat retourne systématiquement puis reste à l’endroit où il a reçu la stimulation. Avec cette observation Olds fabrique une boîte de Skinner permettant au rat de s’auto-stimuler en appuyant sur un levier. Le rat apprit très rapidement à actionner le levier pour recevoir la stimulation. Certains rats comme le rat n°34 s’auto-stimulait de manière compulsive (jusqu’à 7 500 fois par jour). En vérifiant l’emplacement de l’électrode, Olds et Milner se sont rendu compte qu’elle était mal placée, elle était située dans l’aire septale (Figure 2). Les sites de stimulations produisant ces mêmes effets ont été appelés les « centres du plaisir » (Olds and Milner, 1954; Olds, 1958).

Ces expériences furent étendues et les résultats ont apporté la preuve qu’il existait, dans le cerveau, des régions spécialisées dans le traitement de la récompense, on parla alors de BSR pour « Brain stimulation reward » pour décrire ces expériences. Ces régions comprennent le faisceau médian du télencéphale, le pallidum ventral, le thalamus ventral, le striatum ventral ou noyau accumbens (NAc) et le cortex préfrontal médian, ayant tous en commun de recevoir des projections de l’aire tegmentale ventrale (VTA) (Olds, 1958; Olds and Fobes, 1981; McBride et al., 1999). Cette expérience a été reproduite chez de nombreuses espèces avec les mêmes résultats (Olds and Fobes, 1981). Elle a même été testée de manière très immorale chez l’homme dans une expérience rapportée dans un article en 1972 et intitulé « stimulation septale pour l’évocation d’un comportement hétérosexuel chez un individu homosexuel mâle », où un sujet homosexuel de 24 ans, le patient B19, a été implanté avec des électrodes dans le septum. Selon l’article, le sujet B19 devait s’auto-stimuler tout en visionnant un film montrant un rapport sexuel entre un homme et une femme, et B19 se stimula jusqu’à se plonger dans un état d’euphorie quasi permanente et dû être déconnecté contre son gré (Moan and Heath, 1972). Heureusement, cette thérapie fut rapidement abandonnée. Enfin, des expériences ont montré que les animaux préféraient la stimulation de ces régions aux récompenses naturelles (Olds, 1958; Shizgal, 1997). Parallèlement, des expériences ont révélé que certaines régions du mésencéphale ventral, dont la VTA et la substance noire compacte (SNc), abritent les corps cellulaires des neurones produisant la dopamine (DA), projetant sur les aires répondant à la BSR (Falck and Hillarp, 1959). De plus, il a été établi que l’autostimulation chez le rat est accrue lorsque les électrodes sont implantées dans des régions riches en corps cellulaires dopaminergiques (Corbett and Wise, 1980). Il est important de mentionner également que l’auto-administration d’agonistes dopaminergiques dans les sites BSR produit des effets motivationnels aussi forts que l’auto-stimulation de la BSR, et que l’utilisation d’antagonistes dopaminergiques produit l’effet opposé, suggérant un rôle de la signalisation dopaminergique dans ce comportement d’auto-stimulation (Shizgal, 1997; McBride et al., 1999). D’autre part, la BSR induit une libération massive de DA dans les sites de stimulation surtout dans le striatum et le cortex préfrontal de manière similaire à celle induite par les drogues d’abus (Phillips et al., 1989; Wise, 1996). Ces études démontrent l’existence et définissent les contours du circuit de la récompense, un ensemble de régions sous-corticales et corticales innervées par les neurones dopaminergiques du mésencéphale, et dont la stimulation induit une sensation de plaisir et une augmentation de la motivation. Ces régions comprennent l’amygdale, l’hippocampe et le système dopaminergique mésocorticolimbique issu de la VTA et la SNc projetant vers le cortex et le striatum (Figure 3).

La dopamine et son rôle dans les apprentissages par la récompense

La DA fait partie de la famille des catécholamines, des composés jouant le rôle de neuromodulateurs, parmi lesquels on compte également l’adrénaline et la noradrénaline… Les catécholamines véhiculent des informations modulatrices dont la valence et l’intensité varient selon la zone cérébrale ciblée et le type de récepteur activé. La DA été détectée pour la première fois en 1951 par Goodall (Goodall, 1951) dans le cœur et les surrénales de chèvres et quelques années plus tard dans le cerveau (Carlsson and Waldeck, 1958; Montagu, 1957), principalement dans les ganglions de la base au niveau du striatum (Bertler and Rosengren, 1959, p. 195). Peu après il a été montré que la concentration de DA est anormalement basse chez les sujets Parkinsoniens (Carlsson, 1959; Ehringer and Hornykiewicz, 1960) ce qui suggérait son rôle dans la motricité. La DA est synthétisée dans les neurones dopaminergiques à partir de la tyrosine, qui est d’abord transformée en L-DOPA par la tyrosine hydroxylase (TH). La L-DOPA est ensuite prise en charge par la dopamine décarboxylase pour donner la dopamine (Blaschko, 1959). Une fois synthétisée, la DA est accumulée dans des vésicules grâce au transporteur vésiculaire des monoamines VMAT2. Une fois stockée dans les vésicules VMAT2, elle est libérée de manière volumique au niveau des varicosités axonales à proximité de la densité post-synaptique (Descarries et al., 1996). La quantité de DA extracellulaire est régulée par les transporteurs dopaminergiques (DAT) situés sur l’élément présynaptique des neurones dopaminergiques qui sont capables de recapter la DA du milieu extracellulaire vers le milieu intracellulaire afin qu’elle soit recyclée (Giros et al., 1991; Nirenberg et al., 1996).

Pendant longtemps, la DA a été désignée comme le neurotransmetteur du plaisir, associé à la valeur hédonique d’un stimulus. De nombreuses études ont depuis infirmé cette hypothèse. En effet, la lésion des neurones dopaminergiques ou l’invalidation génétique de la TH permettant la synthèse de la DA chez la souris, n’empêche pas les animaux de montrer une préférence hédonique pour une solution de sucrose (Berridge and Robinson, 1998). Selon les auteurs, la DA serait nécessaire pour signaler la valeur motivationnelle de certains stimuli (dont des récompenses, des punitions, la nouveauté et d’autres stimuli non attendus), pour motiver des comportements, pour prédire une récompense et pour faciliter la consolidation de la mémoire d’évènements saillants (Berridge and Robinson, 1998; Schultz et al., 1998). L’enregistrement unitaire des neurones dopaminergiques pendant des tâches comportementales a conduit à l’émergence d’hypothèses influentes sur le rôle de la libération de la DA. Il est important de préciser que les neurones dopaminergiques de la VTA sont trouvés dans trois états électrophysiologiques différents : 1) Un état hyperpolarisé, dit inactif ; 2) Une activité tonique avec un profil de décharge lent et 3) Une activité phasique irrégulière avec des décharges en bouffée (Goto et al., 2007). Au cours des années 90, Schultz et ses collaborateurs ont mesuré l’activité des neurones dopaminergiques (Figure 4) chez le singe réalisant un apprentissage opérant motivé par la récompense (association récompense-stimulus). Ils ont montré une augmentation de l’activité électrophysiologique phasique des neurones dopaminergiques, principalement de la voie mésolimbique, temporellement associée à l’obtention d’une récompense inattendue, puis au stimulus prédisant la récompense après l’apprentissage associatif ; et une diminution de cette activité électrophysiologique lorsque l’animal n’obtient pas la récompense prédite par le stimulus conditionné (Schultz et al., 1993; Mirenowicz and Schultz, 1996; Schultz et al., 1998).

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

INTRODUCTION
I. L’ADDICTION : DETOURNEMENT DE L’APPRENTISSAGE MOTIVE PAR LA RECOMPENSE
A. Les apprentissages motivés par la récompense
B. Le circuit de la récompense
C. La dopamine et son rôle dans les apprentissages par la récompense
D. L’addiction détourne le circuit de la récompense
1. L’addiction
2. Les drogues d’abus
3. La cocaïne
a) Historique
b) Epidémiologie
c) Effets comportementaux et pharmacocinétique
d) Mécanisme d’action
4. Les modèles animaux
a) La sensibilisation comportementale
b) La préférence de place conditionné
c) L’auto-administration
II. NEURO-CIRCUITERIE, SUBSTRATS NEURONAUX ET MOLECULAIRES DE L’ADDICTION : UN FOCUS SUR LE STRIATUM
A. Les ganglions de la base
1. Les structures cibles des ganglions de la base
2. Afférences des ganglions de la base : focus sur le striatum
3. Les voies directe et indirecte des ganglions de la base
B. Le striatum
C. Les neurones épineux moyens du striatum et leurs rôles dans les réponses aux drogues
1. Les neurones épineux moyens (MSN)
2. Autres types neuronaux du striatum
a) Les interneurones
3. Rôles des D1R-MSN et D2R-MSN dans les réponses aux psychostimulants
4. Les récepteurs de la dopamine et leur implication dans les réponses à la cocaïne.
a) Les récepteurs de la dopamine de type D1
b) Les récepteurs de la dopamine de type D2
5. Les récepteurs du glutamate
a) NMDAR
b) AMPAR
c) mGluR
d) Récepteurs du Kainate
III. INTERACTIONS ENTRE LES SYSTEMES DOPAMINERGIQUES ET GLUTAMATERGIQUES DANS LE STRIATUM ET EFFETS DE LA COCAÏNE
A. Régulation de la libération de neurotransmetteurs
B. Interactions entre DAR et NMDAR par le biais de voies de signalisation intracellulaires
C. Les hétéromères DAR-NMDAR
1. D1R-GluN1
2. D2R-GluN2B
II. OBJECTIFS
III. RESULTATS
A. Article
1. ABSTRACT
2. INTRODUCTION
3. RESULTS
4. DISCUSSION
5. ACKOWLEDGEMENTS
6. REFERENCES
7. FIGURES
8. ONLINE METHODS
IV. CONCLUSION GENERALE, DISCUSSION ET PERSPECTIVES
A. Modulation des hétéromères DAR/NMDAR par la cocaïne et mécanismes sous-jacents.
1. Modulation des hétéromères DAR/NMDAR dans le paradigme de sensibilisation locomotrice
a) Types cellulaires exprimant les hétéromères DAR/NMDAR
b) Localisation subcellulaire des hétéromères DAR/NMDAR
c) Cinétique de formation des hétéromères DAR/NMDAR
d) Modulation des hétéromères DAR/NMDAR et conditionnement opérant
e) Modulation des hétéromères DAR/NMDAR par d’autres drogues d’abus
2. Mécanismes potentiellement impliqués dans la formation des hétéromères DAR/NMDAR en réponse à la cocaïne.
a) Niveaux d’expression et adressage des récepteurs partenaires
b) Modulation des niveaux d’expression de la protéine PSD-95 par la cocaïne.
c) Implication de la stimulation des récepteurs de la DA et du glutamate dans la formation des hétéromères
D1R/GluN1 et D2R/GluN2B en réponses à la cocaïne
d) Modification post-traductionnelles des récepteurs de la DAR et NMDAR et hétéromérisation
B. Rôle des hétéromères DAR/NMDAR dans les adaptations à long-terme induites par la cocaïne
1. Validation d’une approche permettant d’étudier les fonctions des hétéromères D1R/GluN1 et D2R/GluN2B in vivo
2. Rôle des hétéromères DAR/NMDAR dans les altérations synaptiques induites par la cocaïne au sein du striatum.
3. Rôle des hétéromères DAR/NMDAR dans la sensibilisation locomotrice et la préférence de place conditionné à la cocaïne
4. Les hétéromères DAR/NMDAR ne sont pas impliqués dans la préférence de place pour la nourriture
C. Modulation des hétéromères D2R/GluN2B chez les individus dépendants à la cocaïne.
V. REFERENCES
VI. ANNEXES

Rapport PFE, mémoire et thèse PDFTélécharger le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *