Audition – Perception
ย ย ย ย ย ย ย ย ย ย ย Les ondes sonores sont recueillies par lโappareil auditif, ce qui provoque les sensations auditives. Ces ondes de pression sont analysรฉes dans lโoreille interne qui envoie au cerveau lโinflux nerveux qui en rรฉsulte, le phรฉnomรจne physique induit ainsi un phรฉnomรจne psychique grรขce ร un mรฉcanisme physiologique complexe. Lโappareil auditif comprend lโoreille externe, lโoreille moyenne, et lโoreille interne (figure 1.09). Le mรฉcanisme dโaudition consiste ร la transmission des vibrations acoustique perรงu par lโoreille externe jusquโau tympan et vers la cochlรฉe oรน se passe la transformation de la vibration en signal nerveux via le nerf auditif. Le rรดle de lโoreille interne (marteau, enclume, รฉtrier) est lโadaptation dโimpรฉdance entre lโair externe et le milieu liquide dans lโoreille. Lโoreille ne rรฉpond pas รฉgalement ร toutes les frรฉquences. La figure 1.08 prรฉsente le champ auditif humain, dรฉlimitรฉ par la courbe de seuil de l’audition et celle du seuil de la douleur. Sa limite supรฉrieure en frรฉquence (โ 16000 Hz, variable selon les individus) fixe la frรฉquence d’รฉchantillonnage maximale utile pour un signal auditif (โ 32000 Hz). A l’intรฉrieur de son domaine d’audition, l’oreille ne prรฉsente pas une sensibilitรฉ identique ร toutes les frรฉquences. La figure ยซ 1.09.a ยป fait apparaรฎtre les courbes de lโimpression de puissance auditive – physiologique (aussi appelรฉe sonie, exprimรฉe en sones) en fonction de la frรฉquence. Elles rรฉvรจlent un maximum de sensibilitรฉ dans la plage [500Hz, 10kHz], en dehors de laquelle les sons doivent รชtre plus intenses pour รชtre perรงus. Enfin, un son peut en cacher un autre. Cette propriรฉtรฉ, appelรฉe phรฉnomรจne de masquage, peut รชtre visualisรฉe sous la forme de courbes de masquage (figure ยซ 1.09.b ยป), qui mettent en รฉvidence la modification locale du seuil d’audition en fonction de la prรฉsence d’un signal dรฉterminรฉ (un bruit ร bande รฉtroite centrรฉ sur 1kHz dans le cas de la figure ยซ 1.09.b ยป). Une modรฉlisation efficiente des propriรฉtรฉs de masquage de l’oreille permet de rรฉduire le dรฉbit binaire nรฉcessaire au stockage ou ร la transmission d’un signal acoustique, en รฉliminant les composantes inaudibles (mรฉthode ร lโorigine de la compression MP3).
Echelle des Mels Apres 500Hz, la puissance perรงue par lโoreille diminue largement avec lโaccroissement de la frรฉquence. Des expรฉriences ont alors permis dโรฉtablir la loi qui relie la frรฉquence et la hauteur perรงue : lโรฉchelle des Mels oรน le ยซ Mel ยป est une unitรฉ reprรฉsentative de la hauteur perรงue dโun son.
Echelle de Bark Le Bark n’est pas vraiment une unitรฉ physique. C’est une bande de frรฉquence (bande critique) รฉtablie par Zwicker dans le cadre de la sonie spรฉcifique. Les Barks se divisent en 24 bandes critiques comprises entre 0 et 15500 Hz. Le Bark est un outil qui permet de crรฉer l’axe des abscisses de la courbe de sonie spรฉcifique d’un son complexe, lorsque les 24 Barks sont mis bout ร bout. [5] [6] [7]
Les matรฉriels de simulation
– Microphone : Le choix du microphone est essentiel parce que la prรฉsence รฉventuelle du bruit de fond risque de donner un rรฉsultat erronรฉ. La distance entre la bouche et le microphone joue aussi un rรดle important.
– Logiciel MATLAB : Version R2007b, il peut fonctionner avec une configuration minimale dโun PC avec un processeur Intel Pentium 4 avec 512 Mo de RAM.
– Une carte audio de bonne qualitรฉ.
Test avec prononciation dรฉcoupรฉ en syllabe
ย ย ย ย ย ย ย ย ย Le premier test consiste ร refaire les sรฉries de tests prรฉcรฉdents en prononรงant les mots avec des silences assez longs entre les syllabes, les rรฉsultats obtenus sont rรฉsumรฉs dans le graphique suivant.
Interprรฉtation des rรฉsultats
ย ย ย ย ย ย ย ย ย ย La modification massive de locution diminue fortement le taux de reconnaissance ร cause du changement dโintonation pour certains mots (aoka, vaovao,…). Ce qui entraine une large diffรฉrence entres les spectres du mot prononcรฉ et ceux du rรฉsultat attendu. De plus pendant le dรฉcoupage en syllabe, il peut sโintroduire des bruits entre les silences, bruits dโenvironnement ou due au bruit de fond du microphone, qui changent aussi les caractรฉristiques acoustiques du mot.
|
Table des matiรจres
REMERCIEMENTS
LISTE DES ABREVIATIONS ET NOTATIONS
INTRODUCTION GENERALE
CHAPITRE 1 : LA PAROLE
1.1 Description au niveau acoustique
1.1.1 Numรฉrisation du signal vocal
1.1.2 Frรฉquence fondamentale
1.2 Description au niveau phonรฉtique
1.2.1 La phonation
1.2.2 Phonรฉtique articulatoire
1.2.3 Audition – Perception
1.2.3.1. Echelle des Mels
1.2.3.2. Echelle de Bark
1.3. Conclusion
CHAPITRE 2 : ANALYSE FREQUENTIELLE DU SIGNAL VOCAL
2.1 Le spectrographe
2.2 Transformรฉe de Fourier ร court terme
2.2.1 Principe
2.2.2 Spectrogramme
2.3 Modรจle de prรฉdiction โ LPC (Linear Predictive Coding)
2.3.1 Principe
2.3.2 Coefficients LPC
2.4 Analyse cepstrale
2.4.1 Traitement homomorphique
2.4.2 Coefficients MFCC (Mel Frequency Cepstrum Coefficient)
2.4.2.1 Banc de Filtre
2.4.2.2 Mรฉthode de calcul
2.5 Conclusion
CHAPITRE 3 : RECONNAISSANCE DE LA PAROLE
3.1 Historique
3.2 Niveaux de complexitรฉ
3.3 Les techniques de reconnaissance vocale
3.3.1 Approche globale
3.3.2 Approche analytique
3.3.3 Lโalgorithme de comparaison
3.3.3.1 Dรฉformation temporelle linรฉaire
3.3.3.2 Dรฉformation temporelle dynamique (DTW)
3.4 Classification des systรจmes
3.4.1 Nombre de locuteurs
3.4.2 Longueur de mots
3.5 Applications de la reconnaissance vocale
3.5.1 Domaine dโapplication
3.5.2 Limites
3.6 Conclusion
CHAPITRE 4 : SIMULATION DE LA RECONNAISSANCE DES MOTS ISOLES
4.1 Les matรฉriels de simulation
4.2 Description de la simulation
4.2.1 Extraction des paramรจtres caractรฉristiques
4.2.1.1. Avantages de la mรฉthode
4.2.1.2. Choix des paramรจtres pour lโalgorithme
4.2.2 Apprentissage du systรจme
4.2.3 Reconnaissance
4.3 Rรฉsultat de la simulation
4.3.1 Test avec prononciation dรฉcoupรฉ en syllabe
4.3.2 Test avec prononciation lente
4.3.3 Interprรฉtation des rรฉsultats
4.4 Conclusion et perspectives
CONCLUSION GENERALE
BIBLIOGRAPHIE
PAGE DE RENSEIGNEMENTS
RESUME
ABSTRACT
Tรฉlรฉcharger le rapport complet