Validation expérimentale
Au cours de notre travail de caractérisation des cris, nous avons entrepris des tests de validation concernant la faisabilité du système de diagnostic ainsi que l’apport de certaines caractéristiques acoustiques quantifiées dans la classification des cris pathologiques. La première série d’expériences a été conduite pour différencier deux classes de cris (pathologiques et sains). Pour cela nous avons utilisé les paramètres tels que : les coefficients MFCC (Mel-Frequency Cepstrum Coefficients) et les coefficients WPT (entropie) (Wavelet Packet Transform). Nous avons testé aussi l’apport de l’application de l’ACP (analyse en composantes principales) et l’algorithme BSAT (Best Structure Abstract Tree) pour réduire la dimension des coefficients WPT. La méthodologie et le détail des résultats obtenus se trouvent dans l’article de conférence qui est présenté en annexe I. La deuxième série d’expériences réalisées concerne principalement l’utilisation de quelques caractéristiques acoustiques qui ont été quantifiées comme le pourcentage de l’hyperphonation et le pourcentage de l’irrégularité de la fréquence fondamentale. Deux types de tests ont été conduits : 1) différencier deux classes de cris (pathologiques et sains) avec ou sans utilisation des caractéristiques quantifiées pour les deux catégories de bébés (prématurés et à terme). 2) distinguer les cris selon les pathologies étudiées avec ou sans utilisation des caractéristiques quantifiées pour les deux catégories de bébés (prématurés et à terme). La méthodologie et le détail des résultats trouvés, sont présentés dans le chapitre 2.
Organisation de la thèse
Cette thèse s’organise en cinq chapitres. Dans l’introduction, nous avons présenté une description de la problématique de notre projet de recherche ainsi que nos objectifs et la méthodologie suivie pour atteindre ces objectifs. Le chapitre 1 fait une synthèse de l’état de l’art. Les chapitres 2, 3, et 4 rassemblent les articles publiés ou soumis à des journaux scientifiques avec comité de lecture. Le chapitre 5 présente la synthèse des résultats et la conclusion. Le premier chapitre est consacré à la synthèse bibliographique où nous présentons des définitions sur les cris des bébés et leurs caractéristiques ainsi que les méthodes de mesures utilisées dans ce domaine. Ce chapitre est consacré aussi aux travaux effectués sur les cris des bébés. Le deuxième chapitre présente le premier article intitulé : « Frequential Characterization of Healthy and Pathologic Newborns Cries ». Cet article publié dans le journal « American Journal of Biomedical Engineering » décrit la caractérisation qualitative et quantitative des cris pathologiques et des cris des nouveau-nés en bonne santé en utilisant deux principales caractéristiques fréquentielles telles que l’hyperphonation et l’irrégularité de la fréquence fondamentale. Ce chapitre présente aussi une analyse statistique des résultats obtenus ainsi qu’une validation expérimentale concernant l’utilisation des caractéristiques étudiées dans le système de diagnostic des bébés malades.
Le troisième chapitre présente le deuxième article intitulé : « Acoustic Measures of The Cry Characteristics of Healthy Newborns and Newborns with Pathologies » qui est publié dans le journal « J. Biomedical Science and Engineering ». Dans cet article nous introduisons l’utilisation de nouvelles caractéristiques acoustiques dans la discrimination des cris pathologique telles que la dysphonation, le changement de mode et les cris non voisés. Dans le cadre de l’estimation de la dysphonation et dans le but de remédier à la surestimation du bruit dans les sons des cris, nous avons proposé et implémenté une nouvelle méthode de mesure adaptée aux cris des nouveau-nés. L’analyse statistique des résultats obtenus a été effectuée aussi dans cet article. Le quatrième chapitre concerne le troisième article intitulé: « Resonance Frequencies Behavior in Pathologic Cries of Newborns ». Cet article qui est publié dans le «Journal of Voice» introduit de nouveaux paramètres pour la caractérisation des cris. Ces paramètres qualifient principalement l’interaction des fréquences de résonance avec les harmoniques de la fréquence fondamentale. Les résultats obtenus par la caractérisation des cris en utilisant les paramètres étudiés permettent la discrimination des cris pathologiques, car la distribution de ces paramètres dépend de la pathologie qui touche le nouveau-né. Nous terminons cette thèse par le chapitre 5 qui présente la synthèse des articles et les principaux résultats obtenus. Nous présentons également dans ce chapitre les contributions de notre recherche et nos recommandations.
Le modèle physioacoustique du cri
Le cri des bébés est défini comme l’alternation rythmique de sons (énoncés) et d’inspiration. Donc, il fait partie de la phase d’expiration, pendant laquelle le larynx produit un son ou une phonation (LaGasse, Neal et Lester, 2005). Le modèle physioacoustique de la production du cri comprend deux parties : une partie acoustique qui décrit la génération du son et une partie physiologique qui décrit le mouvement et la configuration du conduit vocal. Le mécanisme de production des cris chez les nourrissons ressemble au processus de production de la parole chez les adultes. Mais la forme du conduit vocal des nouveau-nés est différente de celle des adultes. Elle ressemble plutôt à celle des « chimpanzés ». Chez les nourrissons, le larynx est positionné très haut dans le conduit vocal qui est plus court que celui de l’adulte (voir Figure 1.1). Dans ce cas, l’espace pharyngé qui constitue un des résonateurs les plus importants dans la phonation est réduit. C’est pour cette raison que les bébés ne respirent pas par leur bouche quand leur nez est bouché. La position du larynx commence à descendre à partir de 6 mois, elle atteint la position des adultes à deux ans (Laitman JT, 1980; Laitman, Heimbuch et Crelin, 1978). La production du cri est un processus complexe dans lequel sont impliqués de nombreux organes (voir Figure 1.2).
La source du cri provient des poumons qui émettent un flux d’air. Ce flux d’air va traverser le larynx pour faire vibrer ou non les cordes vocales à une fréquence fondamentale F0. Le son des cris est déterminé alors par la vibration des cordes vocales qui se trouvent dans le conduit vocal et par d’autres vibrations d’ondes à des fréquences différentes nommées ondes complexes. L’onde sonore devient plus complexe en traversant les voies respiratoires produisant une concentration de l’énergie sonore à des niveaux élevés nommés formants (Lester et LaGasse, 2008). En d’autres termes, la dimension et le contour du conduit vocal supérieur qui est constitué par les cavités nasales, la bouche et le pharynx forment le son des cris en produisant des fréquences de résonances ou des formants RF1 et RF2 au-dessus de F0 (Lester et LaGasse, 2008). Le cri des bébés change avec l’âge grâce à la maturation de l’appareil vocal et à l’évolution du système de contrôle neural et aussi grâce au développement des muscles de la cage thoracique qui induit une réduction dans la vitesse de respiration durant les cris. Chaque cri d’enfant est acoustiquement unique. Il est caractérisé par des sons voisés et des sons non voisés ainsi que des F0 plus élevées que celles des adultes. Pour la plupart des enfants, F0 varie entre 250 Hz et 450 Hz avec un premier formant RF1 de 1200 Hz et un deuxième formant RF2 de 3200 Hz. Les sons non voisés ou turbulences sont produits par le passage de l’air à travers les constrictions du conduit vocal et les sons voisés sont produits par le passage de l’air à travers la glotte (Manfredi C., 1998).
La neuropsychologie du cri
Le cri est une réaction du bébé à une stimulation aversive interne ou externe (faim, douleur…). Il est premièrement initié dans le cerveau du bébé qui traduit cette stimulation en une série de commandes à travers le système nerveux aux organes de production de la parole (Jam et Sadjedi, 2009). Donc, le cri est le résultat d’une interaction complexe entre plusieurs structures anatomiques et des mécanismes physiologiques. Cette interaction implique le système nerveux central (CNS), le système respiratoire, le système nerveux périphérique et une variété de muscles (Soltis, 2004). C’est le CNS qui contrôle la capacité, la stabilité et la coordination des mouvements de ces muscles (Michelsson et Michelsson, 1999). Donc, le cri des nouveau-nés peut nous informer sur le niveau de fonctionnement du CNS. Le signal du cri est aussi le résultat d’une coordination de plusieurs régions du cerveau y compris le tronc cérébral, mésencéphale (Midbrain) et le système limbique qui contrôle la respiration et la vibration des cordes vocales (LaGasse, Neal et Lester, 2005; Michelson Katarina 2007; Zeskind et Lester, 2001). Le tronc cérébral inférieur du cerveau contrôle les muscles du larynx, du pharynx, la poitrine et le cou supérieur à travers les nerfs crâniens et les nerfs phréniques et thoraciques (Lester et Boukydis, 1992). D’après (LaGasse, Neal et Lester, 2005): • les éléments responsables de la formation de F0 sont la variation de tension des muscles du larynx, cricothyroïde vocale et les muscles respiratoires abdominaux; • le tronc cérébral contrôle également le contour des voies respiratoires transversales du système supra-glottal, qui façonne les fréquences des formants; • les autres régions du crâne telles que le système limbique et l’hypothalamus participent dans l’initialisation du cri.
|
Table des matières
INTRODUCTION
0.1 Cadre de recherche
0.2 Problématique et justification
0.3 Objectifs
0.4 Méthodologie
0.4.1 Étude de l’état de l’art
0.4.2 Enregistrement des cris
0.4.3 Construction de la base de données
0.4.4 Étude spectrographique de cris
0.4.5 Caractérisation qualitative
0.4.6 Sélection des caractéristiques
0.4.7 Estimation automatique des caractéristiques
0.4.8 Quantification des caractéristiques
0.4.9 Validation expérimentale
0.4.10 Caractérisation des pathologies étudiées
0.5 Organisation de la thèse
CHAPITRE 1 ETAT DE l’ART
1.1 Introduction
1.2 Le modéle physioacoustique du cri
1.4 Les caractéristiques du cri
1.5 Les caractéristiques des cris dans différents cas cliniques
1.6 Travaux antérieurs
1.6.1 L’analyse acoustique des cris
1.6.2 La perception des cris
1.6.3 La classification des cris
1.7 Modèle électrique des cris
1.8 Prétraitement des signaux de cris
1.9 Analyse par prédiction linéaire
1.10 Analyse cepstrale
1.10.1 Coefficients cepstraux
1.10.2 Coefficients MFCC
1.11 Analyse par ondelette
1.11.1 Transformée en ondelette discrète (DWT)
1.11.2 Transformée en paquet d’ondelettes
1.12 Analyse en composante principale
1.13 Techniques d’extraction de la fréquence fondamentale
1.13.1 Méthode des coefficients cepstraux
1.13.2 Méthode SSM
1.13.3 La méthode AMDF
1.14 Techniques de classification des cris
1.14.1 Hidden Markov Model (HMM)
1.14.2 Gaussian Mixture Model (GMM)
1.15 Conclusion
CHAPITRE 2 FREQUENTIAL CHARACTERIZATION OF HEALTHY AND PATHOLOGIC NEWBORNS CRIES
2.1 Introduction
2.2 Acoustic definition of cries
2.3 The characteristics of cries under certain medical conditions
2.3.1 The cries of healthy newborns
2.3.2 The cries of premature newborns
2.3.3 Cries of newborns with various pathologies
2.4 Methodology for qualitative and quantitative characterization
2.4.1 Cry database
2.4.2 Qualitative characterization of cries
2.4.3 Quantitative characterization of cries
2.4.4 Fundamental frequency estimation
2.5 Results analysis
2.6 Experimental validation
2.6.1 Features Extraction
2.6.2 Experimental results
2.7 Conclusions
CHAPITRE 3 ACOUSTIC MEASURES OF THE CRY CHARACTERISTICS OF HEALTHY NEWBORNS AND NEWBORNS WITH PATHOLOGIES
3.1 Introduction
3.2 Dysphonic cry
3.3 Cry database
3.4 Methodology
3.5 Dysphonation estimation in newborn cries
3.5.1 Normalized noise energy estimation (NNE)
3.5.2 ACF-based noise estimator
3.5.3 MMSE-based noise estimator
3.6 Results and analysis
3.7 Conclusions
CHAPITRE 4 RESONANCE FREQUENCIES BEHAVIOR IN THE CRIES OF HEALTHY NEWBORNS AND NEWBORNS WITH PATHOLOGIES
4.1 Introduction
4.2 Physioacoustic Model and Neurological Basis of the Newborn Cry
4.3 Newborn Cry Characteristics in a Medical Environment
4.4 Method
4.4.1 Recording sessions
4.4.2 Procedure
4.4.3 Resonance frequencies estimation
4.4.4 Fundamental frequency estimation
4.5 Results and Analysis
4.5.1 F0, RF1, and RF2 estimation results
4.5.2 RF1:RF2 ratio and RF2 slope evaluation results
4.5.3 TUP and TRP evaluation results for RF1 and RF2
4.6 Discussion
4.7 Conclusion
CHAPITRE 5 SYNTHÈSE ET CONCLUSION
5.1 Synthèse des articles
5.2 Contribution
5.3 Recommandations
5.4 Conclusion
ANNEXE I NEWBORN’S PATHOLOGICAL CRY IDENTIFICATION SYSTEM
ANNEXE II CHARACTERISATION OF PATHOLOGIC CRIES OF NEWBORNS BASED ON FUNDAMENTAL FREQUENCY
ESTIMATION
BIBLIOGRAPHIE
Télécharger le rapport complet