Le parcours du son de l’oreille au cerveau
Le parcours du son de lโoreille au cerveau peut รชtre rรฉsumรฉ en cinq รฉtapes principales. La premiรจre รฉtape correspond ร lโoreille externe composรฉe du pavillon et du conduit auditif externe (CAE) ; (Figure 1.A). La fonction de l’oreille externe est de diriger les sons vers l’oreille moyenne. Elle joue รฉgalement un rรดle essentiel dans la localisation auditive en modifiant le spectre des ondes sonores selon leur angle dโincidence. Ces modifications sont reconnues par le systรจme auditif pour situer la source sonore dans lโespace en combinaison avec dโautres indices liรฉs aux diffรฉrences de temps dโarrivรฉe et dโintensitรฉ des ondes sonores entre les deux oreilles. Les HRTFs (de lโanglais Head Related Transfer Function) peuvent รชtre capturรฉes via la mesure de la fonction de transfert liรฉe ร la tรชte (Wightman & Kistler, 1989). Filtrer un signal auditif prรฉsentรฉ sous casque avec des HRTFs produit la sensation de percevoir ce signal comme provenant dโune position prรฉcise de lโespace. Le CAE protรจge la dรฉlicate membrane tympanique du froid, de la saletรฉ et de la dรฉshydratation, en expulsant la saletรฉ et la poussiรจre par le cรฉrumen. La deuxiรจme รฉtape coรฏncide avec lโarrivรฉe du son ร la membrane tympanique dans lโoreille moyenne (Figure 1.B). Le tympan, en vibrant, transmet les ondes sonores aux trois osselets : le marteau, l’enclume et l’รฉtrier. Le mouvement des trois osselets amplifie les vibrations du tympan qui atteignent l’oreille interne.
La troisiรจme รฉtape correspond donc ร l’arrivรฉe du son ร lโoreille interne (Figure 1.C). Lโoreille interne, remplie de liquides, comprend la cochlรฉe, organe de lโaudition, et le vestibule, organe de lโรฉquilibre. Elle est composรฉe de trois canaux contigus et parallรจles, enroulรฉs en spirale depuis la base jusqu’ร lโapex : la rampe vestibulaire, le canal cochlรฉaire, et la rampe tympanique. Les deux rampes, remplies de liquide pรฉrilymphatique, sont en continuitรฉ ร l’apex de la cochlรฉe au niveau de l’hรฉlicotrรฉma. ร lโintรฉrieur du canal cochlรฉaire, plongรฉ dans le liquide endolymphatique, se trouve lโorgane de Corti qui contient les cellules sensorielles de lโaudition (Figure 2) โcโest lโorigine du message nerveux. Les cellules sensorielles sont de deux types : les cellules ciliรฉes internes (CCI) et les cellules ciliรฉes externes (CCE). On dรฉnombre environ 3500 CCI et entre 10000 et 12000 CCE rรฉparties respectivement sur une et trois rangรฉes (Ashmore, 2008).
Lโarrivรฉe du son au tronc cรฉrรฉbral constitue la quatriรจme รฉtape du parcours du son et le premier stade du son ร l’intรฉrieur du cerveau. ร ce stade, les sons sont dรฉchiffrรฉs et leur durรฉe, leur intensitรฉ et leur frรฉquence sont dรฉterminรฉes. L’รฉtape suivante se situe au niveau du thalamus qui collecte toutes les informations perรงues par les sens, ร l’exception de l’odorat. Le thalamus interprรจte les informations et les transmet au cortex cรฉrรฉbral, correspondant ร la derniรจre รฉtape. Le message sonore est alors en grande partie dรฉchiffrรฉ, mais le cortex cรฉrรฉbral ajoute une signification aux sons. Ici, les sons sont reconnus et mรฉmorisรฉs. Cette rรฉgion du cortex cรฉrรฉbral, appelรฉe cortex auditif, intรจgre aussi les souvenirs ou les รฉmotions liรฉs aux sons qui vont donner une certaine coloration idiosyncrasique en fonction de chaque expรฉrience.
Sรฉgrรฉgation des flux sonores
Au cours du traitement de lโinformation sonore permettant la comprรฉhension dโune voix cible dans des situations dโรฉcoute complexe, la premiรจre รฉtape consiste ร sรฉparer les diffรฉrents flux sonores. Les diffรฉrents flux sonores prรฉsents dans la scรจne auditive sont constituรฉs de plusieurs objets sonores. Ces derniers sont reconnus et identifiรฉs par notre cerveau grรขce ร une vรฉritable analyse de la scรจne auditive (Bregman, 2009). En effet, ce qui n’est au dรฉpart quโun ensemble de frรฉquences sonores indistinctes et chaotiques, est transformรฉ par le cerveau en objets sonores reconnaissables et dotรฉs d’une signification prรฉcise. Un objet sonore peut รชtre dรฉfini comme une estimation perceptuelle des entrรฉes sensorielles qui proviennent d’un รฉlรฉment physique distinct dans le monde externe (Shinn Cunningham, 2008). Par exemple, la structure spectro-temporelle des objets sonores dรฉtermine la segmentation de ceux-ci sur de courtes รฉchelles de temps (c.-ร -d., la formation de syllabes). Les caractรฉristiques d’ordre supรฉrieur (c.-ร -d., le timbre, la hauteur, la localisation) dรฉterminent la faรงon dont ces objets sonores sont organisรฉs sur des รฉchelles de temps plus longues qui vont former les flux sonores (Shinn Cunningham, 2008). Cette sรฉgrรฉgation des flux sonores est indispensable pour que l’auditeur puisse se concentrer sur une voix cible.
Masquage informationnel et masquage รฉnergรฉtique
Lโauditeur peut se trouver dans un contexte oรน le bruit interfรจre avec la comprรฉhension de la voix cible (appelรฉ speech-in-noise en anglais pour parole dans le bruit) ou dans un contexte oรน d’autres messages interfรจrent avec la comprรฉhension de la voix cible (appelรฉ speech-in-speech en anglais pour parole dans la parole). On parle de masquage รฉnergรฉtique dans le premier cas et de masquage informationnel dans le second (Brungart, 2001). Ces interfรฉrences peuvent compromettre la comprรฉhension de la voix cible lorsquโelles sont suffisamment fortes. Lorsque les propriรฉtรฉs spectro-temporelles des sons en entrรฉe (voix cible et masque) se superposent et deviennent inaudibles, cela crรฉe du masquage informationnel. Dans le masquage informationnel, les informations sont audibles mais non distinguables dans la mesure oรน elles ne peuvent pas รชtre sรฉparรฉes et attribuรฉes ร un locuteur prรฉcis. Ihlefeld & Shinn-Cunningham (2008) indiquent que dans une situation de masquage informationnel les participants reportent rarement des mots absents du mรฉlange sonore. Les participants se trompent gรฉnรฉralement en rapportant un mรฉlange de mots de diffรฉrents locuteurs (erreurs de mรฉlange) ou en reportant tous les mots du mauvais locuteur (erreurs de masquage). Par ailleurs, Nakai et al. (2005) ont utilisรฉ une tรขche de speech-in speech dans laquelle ils demandaient aux participants de suivre une histoire qui pouvait รชtre masquรฉe par le mรชme locuteur ou par un locuteur de sexe diffรฉrent. Le masquage par le mรชme locuteur รฉtait la condition la plus difficile du fait de la similaritรฉ (c.-ร d., mรชme genre) des locuteurs.
La sรฉgrรฉgation des voix repose sur la disponibilitรฉ de plusieurs indices sonores qui peuvent รชtre ร disposition de lโauditeur (Bronkhorst, 2015). Parmi ces indices, il existe :
โข Les indices liรฉs aux caractรฉristiques frรฉquentielles de la voix (c.-ร -d., le genre du locuteur).
โข Les indices liรฉs aux diffรฉrences dโintensitรฉ entre la voix cible (target, en anglais) et les autres voix masques (masker, en anglais), dโoรน le terme anglais : target-to-masker ratio (ou TMR ; c.-ร -d., rapport cible sur masque).
โขย Les indices liรฉs ร la sรฉparation spatiale des locuteurs.
La familiaritรฉ avec la voix du locuteur peut rรฉduire le masquage informationnel (Johnsrude et al., 2013). Dans leur รฉtude, Johnsrude et al. (2013) ont montrรฉ quโรฉcouter la voix de son partenaire de vie peut faciliter la sรฉgrรฉgation des voix dans un protocole dโรฉcoute multilocuteurs. Le TMR et la sรฉparation spatiale des sources seront examinรฉs plus en dรฉtail dans le paragraphe suivant.
Ce quโil faut retenir
โข La scรจne auditive est composรฉe dโobjets sonores, reconnaissables et dotรฉs dโune signification prรฉcise, qui se regroupent en diffรฉrents flux sonores.
โข Plusieurs indices sonores de la scรจne auditive peuvent aider ร sรฉgrรฉger les flux dont : le TMR et la sรฉparation spatiale des locuteurs en sont deux principaux.
Target-to-masker ratio
Plusieurs รฉtudes ont montrรฉ que le TMR peut รชtre un indice utile afin de sรฉgrรฉger les diffรฉrents flux sonores (Andรฉol et al., 2017 ; Bronkhorst, 2015 ; Brungart & Simpson, 2005 ; Eddins & Liu, 2012). Lโefficacitรฉ du TMR peut รชtre affectรฉe par 1) la diffรฉrence de genre entre les locuteurs, car ces diffรฉrences de caractรฉristiques vocales dominent sur les indices de sรฉgrรฉgation offerts par la prรฉsence du TMR ; 2) la prรฉsence de bruits supplรฉmentaires qui peuvent couvrir le locuteur le plus silencieux et c) lโaugmentation du nombre de locuteurs qui interfรจrent sur la dรฉtection de la voix cible. Pour ces raisons, la premiรจre รฉtude rรฉalisรฉe au cours de la thรจse sโest focalisรฉe sur lโefficacitรฉ du TMR en prรฉsence dโune seule voix masque du mรชme sexe que la voix cible.
Il est en gรฉnรฉral plus facile de prรชter attention au locuteur dont la voix est plus forte que les autres. Ainsi, intuitivement, en contexte opรฉrationnel, une amรฉlioration de lโintelligibilitรฉ de la voix cible devrait รชtre obtenue en augmentant ร la radio le volume du locuteur cible. Mais, comme indiquรฉ dans lโarticle de Brungart & Simpson (2007), il peut รชtre difficile en milieu opรฉrationnel de prรฉvoir quelle sera la voix cible. En pratique, il est frรฉquent que les opรฉrateurs novices manipulent en permanence les niveaux des radios. Les opรฉrateurs experts parviennent ร utiliser le TMR comme outil de sรฉgrรฉgation, que la voix cible ait un niveau supรฉrieur ou infรฉrieur aux autres voix, du moment que la valeur absolue de la diffรฉrence de niveau entre les voix est suffisante. L’un des protocoles comportementaux les plus largement utilisรฉs pour รฉtudier les situations multilocuteurs est le Coordinate Response Measure (CRM corpus, Bolia et al., 2000). Ce corpus est composรฉ de phrases qui respectent toutes la mรชme structure : ยซ Ready call sign go to color number now ยป. Dans la version que nous utilisons, il existe 7 identifiants diffรฉrents (7 call sign : Baron, Charlie, Ringo, Eagle, Arrow, Hopper, Tiger, Laker), 4 couleurs (bleu, vert, rouge, blanc) et 8 chiffres (de 1 ร 8). Gรฉnรฉralement, lโauditeur doit indiquer la couleur et le chiffre donnรฉs par la voix cible qui est dรฉfinie par un identifiantspรฉcifique (par exemple Baron). La voix cible peut รชtre prรฉsentรฉe simultanรฉment avec une ou plusieurs voix masques et toutes indiquent ร lโauditeur un couple couleur-chiffre diffรฉrent. La littรฉrature nous montre que les performances sont plus รฉlevรฉes lorsque la voix cible est prรฉsentรฉe ร une intensitรฉ plus รฉlevรฉe que les autres voix masques (Andรฉol et al., 2017 ; Brungart, 2001 ; Thompson et al., 2015). Toutefois, quand la voix cible est prรฉsentรฉe ร une intensitรฉ plus faible par rapport ร la voix masque, les performances au sein de la population sont plus variables (Andรฉol et al., 2017). Il apparait que la population se divise grossiรจrement en deux catรฉgories de personnes : les participants dont la performance sโamรฉliore au fur et ร mesure que le TMR augmente (voix cible de plus en forte) et les participants dont la performance est รฉlevรฉe en prรฉsence dโun TMR positif mais aussi dโun TMR fortement nรฉgatif. Enfin, en prรฉsence dโun TMR intermรฉdiaire (c.- ร -d., quand les deux voix ont plus ou moins le mรชme niveau dโintensitรฉ), la performance chute (Andรฉol et al., 2017 ; Brungart, 2001 ; Brungart & Simpson, 2007 ; Cooke et al., 2008 ; Thompson et al., 2015). Ces rรฉsultats suggรจrent que dans les deux cas opposรฉsโTMR positif et TMR nรฉgatifโcโest prรฉcisรฉment la diffรฉrence nette de volume entre les deux voix qui permet une meilleure sรฉgrรฉgation de celles-ci avec une meilleure comprรฉhension de la voix cible, bien quโelle soit a priori dรฉfavorisรฉe dans le dernier cas.
|
Table des matiรจres
INTRODUCTION
OBJECTIFS DE LA THESE
Fondamental
Clinique
Opรฉrationnel
PARTIE 1. รTAT DE LโART
CHAPITRE I. SITUATIONS MULTILOCUTEURS
I. Le parcours du son de l’oreille au cerveau
II. Sรฉgrรฉgation des flux sonores
III. Masquage informationnel et masquage รฉnergรฉtique
IV. Target-to-masker ratio
V. Sรฉparation spatiale des locuteurs
VI. Attention auditive sรฉlective : focalisation et inhibition
CHAPITRE II. NEURO-ANATOMIE FONCTIONNELLE DU TRAITEMENT DU LANGAGE
I. La voie dorsale et la voie ventrale
II. Le traitement du langage en situation dโรฉcoute complexe : core speech network
II.1. Gyrus frontal infรฉrieur (IFG)
II.1.1. LโIFG et lโeffort dโรฉcoute
II.1.2. LโIFG dans lโentraรฎnement
II.2. Cortex prรฉfrontal dorsolatรฉral
III. Du langage aux mรฉcanismes general domain
III.1. Le rรฉseau cingulo-operculaire
III.2. Le rรฉseau fronto-pariรฉtal
III.3. Collaboration entre les rรฉseaux fronto-pariรฉtal et cingulo-operculaire
CHAPITRE III. LโEFFORT DโECOUTE
I. Charge cognitive
II. La nature multidimensionnelle de lโeffort dโรฉcoute
III. Facteurs influenรงant lโeffort dโรฉcoute
III.1. Ressources cognitives : attention, mรฉmoire
III.2. Motivation
III.3. Lโรฉtat auditif et la difficultรฉ de son รฉvaluation
III.3.1. Les lรฉsions auditives chez le personnel militaire
III.3.3. Lโaudiomรฉtrie tonale liminaire
III.3.4. Otoรฉmission
IV. Mesures pour รฉvaluer lโeffort dโรฉcoute
IV.1. รvaluations subjectives
IV.2. Mesures comportementales
IV.3. Mesures psychophysiologiques
IV.3.1. Neurophysiologique
IV.3.2. La spectroscopie en proche infrarouge (f/NIRS)
V. Pourquoi รฉtudier lโeffort dโรฉcoute ?
PARTIE 2. CONTRIBUTIONS EXPERIMENTALES
CHAPITRE I. PREMIERE ETUDE
I. Introduction
II. Matรฉriels et mรฉthode
III. Acquisition des donnรฉes
III.1. fNIRS
III.2. Prรฉtraitement donnรฉes fNIRS
IV. Analyses
IV.1. Comportement โ Phase initiale
IV.2. Comportement โ Phase dโentraรฎnement
IV.3. fNIRS โ Phase initiale
IV.3.1. Activation de la tรขche
IV.3.2. Relation entre lโactivitรฉ corticale et les scores dโintelligibilitรฉ de la parole
IV.4. fNIRS โ Phase dโentraรฎnement
V. Rรฉsultats โ Phase initiale
V.1. Comportement
V.2. f/NIRS
V.2.1. Effet de la condition
V.2.2. Corrรฉlation comportement et activitรฉ corticale
VI. Rรฉsultats โ Phase dโentraรฎnement
VI.1. Comportement
VI.2. f/NIRS
VII. Discussion gรฉnรฉrale
CHAPITRE II. DEUXIEME ETUDE
I. Introduction
II. Matรฉriels et mรฉthode
II.1. Participants
II.2. Tรขche dโintelligibilitรฉ
III Acquisition des donnรฉes
III.1 f /NIRS
III.2. Prรฉtraitement donnรฉes f/NIRS
IV. Analyses
IV.1. Comportement
IV.1.1 f/NIRS
V. Rรฉsultats
V.1. Comportement
V.2. f/NIRS
VI. Discussion
CHAPITRE III. TROISIEME รTUDE
I. Introduction
II. Matรฉriels et mรฉthode
II.1. Participants
II.2. Plan expรฉrimental
II.3. Mesures subjectives
II.3.1. Questionnaire dรฉmographique
II.3.2. Effort Scaling Categorical Unit – ESCU
II.3.3. Motivation
II.3.4. Speech, Spatial and Qualities Hearing
II.4. Mesures audiologiques
II.4.1. Audiomรฉtrie
II.4.2. Otoรฉmissions
II.5. Caractรฉristiques des participants
III. Analyses
III.1. Tรขche dโintelligibilitรฉ โ CRM
IV. Rรฉsultats
IV.1. Effet de lโรฉcartement des voix masques de 20ยฐ ร 60ยฐ sur lโintelligibilitรฉ
IV.2. Effet de lโรฉcartement des voix masques de 20ยฐ ร 60ยฐ sur lโeffort dโรฉcoute ressenti
IV.3. Relation entre la variation de lโintelligibilitรฉ et la variation de lโeffort
IV.4. Relation entre la diffรฉrence dโintelligibilitรฉ liรฉe ร un รฉcartement des voix masques de 20ยฐ ร 60ยฐ et lโรฉtat auditif
IV.4.1. Audiomรฉtries tonales liminaires classique et haute frรฉquence
IV.4.2. Produits de distorsion acoustique (PDA)
IV.5. Relation entre la variation de lโeffort dโรฉcoute ressenti entre 20ยฐ ร 60ยฐ et lโรฉtat auditif
IV.5.1. Audiomรฉtries tonales liminaires classique et haute frรฉquence
IV.5.2. Produits de distorsion acoustique (PDA)
IV.6. Comprรฉhension de la voix cible dans le bruit
IV.7. Intelligibilitรฉ et motivation
IV.8. Relation entre la mesure de la motivation et les variables mesurรฉes dans les diffรฉrentes conditions expรฉrimentales
IV.9. Relation entre lโรขge et les variables mesurรฉes dans les diffรฉrentes conditions expรฉrimentales
IV.10. Relation entre les rรฉponses au SSQ et les variables mesurรฉes pertinentes
IV.11. Relation entre la variabilitรฉ interindividuelle observรฉe ร 60ยฐ de sรฉparation et les autres mesures
V. Discussion
CONCLUSION