RECONNAISSANCE VOCALE DE MOTS ISOLES A PETIT VOCABULAIRE

Audition – Perception

ย  ย  ย  ย  ย  ย  ย  ย  ย  ย  ย Les ondes sonores sont recueillies par lโ€™appareil auditif, ce qui provoque les sensations auditives. Ces ondes de pression sont analysรฉes dans lโ€™oreille interne qui envoie au cerveau lโ€™influx nerveux qui en rรฉsulte, le phรฉnomรจne physique induit ainsi un phรฉnomรจne psychique grรขce ร  un mรฉcanisme physiologique complexe. Lโ€™appareil auditif comprend lโ€™oreille externe, lโ€™oreille moyenne, et lโ€™oreille interne (figure 1.09). Le mรฉcanisme dโ€™audition consiste ร  la transmission des vibrations acoustique perรงu par lโ€™oreille externe jusquโ€™au tympan et vers la cochlรฉe oรน se passe la transformation de la vibration en signal nerveux via le nerf auditif. Le rรดle de lโ€™oreille interne (marteau, enclume, รฉtrier) est lโ€™adaptation dโ€™impรฉdance entre lโ€™air externe et le milieu liquide dans lโ€™oreille. Lโ€™oreille ne rรฉpond pas รฉgalement ร  toutes les frรฉquences. La figure 1.08 prรฉsente le champ auditif humain, dรฉlimitรฉ par la courbe de seuil de l’audition et celle du seuil de la douleur. Sa limite supรฉrieure en frรฉquence (โ‰ˆ 16000 Hz, variable selon les individus) fixe la frรฉquence d’รฉchantillonnage maximale utile pour un signal auditif (โ‰ˆ 32000 Hz). A l’intรฉrieur de son domaine d’audition, l’oreille ne prรฉsente pas une sensibilitรฉ identique ร  toutes les frรฉquences. La figure ยซ 1.09.a ยป fait apparaรฎtre les courbes de lโ€™impression de puissance auditive – physiologique (aussi appelรฉe sonie, exprimรฉe en sones) en fonction de la frรฉquence. Elles rรฉvรจlent un maximum de sensibilitรฉ dans la plage [500Hz, 10kHz], en dehors de laquelle les sons doivent รชtre plus intenses pour รชtre perรงus. Enfin, un son peut en cacher un autre. Cette propriรฉtรฉ, appelรฉe phรฉnomรจne de masquage, peut รชtre visualisรฉe sous la forme de courbes de masquage (figure ยซ 1.09.b ยป), qui mettent en รฉvidence la modification locale du seuil d’audition en fonction de la prรฉsence d’un signal dรฉterminรฉ (un bruit ร  bande รฉtroite centrรฉ sur 1kHz dans le cas de la figure ยซ 1.09.b ยป). Une modรฉlisation efficiente des propriรฉtรฉs de masquage de l’oreille permet de rรฉduire le dรฉbit binaire nรฉcessaire au stockage ou ร  la transmission d’un signal acoustique, en รฉliminant les composantes inaudibles (mรฉthode ร  lโ€™origine de la compression MP3).
Echelle des Mels Apres 500Hz, la puissance perรงue par lโ€™oreille diminue largement avec lโ€™accroissement de la frรฉquence. Des expรฉriences ont alors permis dโ€™รฉtablir la loi qui relie la frรฉquence et la hauteur perรงue : lโ€™รฉchelle des Mels oรน le ยซ Mel ยป est une unitรฉ reprรฉsentative de la hauteur perรงue dโ€™un son.
Echelle de Bark Le Bark n’est pas vraiment une unitรฉ physique. C’est une bande de frรฉquence (bande critique) รฉtablie par Zwicker dans le cadre de la sonie spรฉcifique. Les Barks se divisent en 24 bandes critiques comprises entre 0 et 15500 Hz. Le Bark est un outil qui permet de crรฉer l’axe des abscisses de la courbe de sonie spรฉcifique d’un son complexe, lorsque les 24 Barks sont mis bout ร  bout. [5] [6] [7]

Les matรฉriels de simulation

– Microphone : Le choix du microphone est essentiel parce que la prรฉsence รฉventuelle du bruit de fond risque de donner un rรฉsultat erronรฉ. La distance entre la bouche et le microphone joue aussi un rรดle important.
– Logiciel MATLAB : Version R2007b, il peut fonctionner avec une configuration minimale dโ€™un PC avec un processeur Intel Pentium 4 avec 512 Mo de RAM.
– Une carte audio de bonne qualitรฉ.

Test avec prononciation dรฉcoupรฉ en syllabe

ย  ย  ย  ย  ย  ย  ย  ย  ย  Le premier test consiste ร  refaire les sรฉries de tests prรฉcรฉdents en prononรงant les mots avec des silences assez longs entre les syllabes, les rรฉsultats obtenus sont rรฉsumรฉs dans le graphique suivant.

Interprรฉtation des rรฉsultats

ย  ย  ย  ย  ย  ย  ย  ย  ย  ย  La modification massive de locution diminue fortement le taux de reconnaissance ร  cause du changement dโ€™intonation pour certains mots (aoka, vaovao,…). Ce qui entraine une large diffรฉrence entres les spectres du mot prononcรฉ et ceux du rรฉsultat attendu. De plus pendant le dรฉcoupage en syllabe, il peut sโ€™introduire des bruits entre les silences, bruits dโ€™environnement ou due au bruit de fond du microphone, qui changent aussi les caractรฉristiques acoustiques du mot.

Le rapport de stage ou le pfe est un document dโ€™analyse, de synthรจse et dโ€™รฉvaluation de votre apprentissage, cโ€™est pour cela rapport-gratuit.com propose le tรฉlรฉchargement des modรจles complet de projet de fin dโ€™รฉtude, rapport de stage, mรฉmoire, pfe, thรจse, pour connaรฎtre la mรฉthodologie ร  avoir et savoir comment construire les parties dโ€™un projet de fin dโ€™รฉtude.

Table des matiรจres

REMERCIEMENTS
LISTE DES ABREVIATIONS ET NOTATIONS
INTRODUCTION GENERALE
CHAPITRE 1 : LA PAROLE
1.1 Description au niveau acoustique
1.1.1 Numรฉrisation du signal vocal
1.1.2 Frรฉquence fondamentale
1.2 Description au niveau phonรฉtique
1.2.1 La phonation
1.2.2 Phonรฉtique articulatoire
1.2.3 Audition – Perception
1.2.3.1. Echelle des Mels
1.2.3.2. Echelle de Bark
1.3. Conclusion
CHAPITRE 2 : ANALYSE FREQUENTIELLE DU SIGNAL VOCAL
2.1 Le spectrographe
2.2 Transformรฉe de Fourier ร  court terme
2.2.1 Principe
2.2.2 Spectrogramme
2.3 Modรจle de prรฉdiction โ€“ LPC (Linear Predictive Coding)
2.3.1 Principe
2.3.2 Coefficients LPC
2.4 Analyse cepstrale
2.4.1 Traitement homomorphique
2.4.2 Coefficients MFCC (Mel Frequency Cepstrum Coefficient)
2.4.2.1 Banc de Filtre
2.4.2.2 Mรฉthode de calcul
2.5 Conclusion
CHAPITRE 3 : RECONNAISSANCE DE LA PAROLE
3.1 Historique
3.2 Niveaux de complexitรฉ
3.3 Les techniques de reconnaissance vocale
3.3.1 Approche globale
3.3.2 Approche analytique
3.3.3 Lโ€™algorithme de comparaison
3.3.3.1 Dรฉformation temporelle linรฉaire
3.3.3.2 Dรฉformation temporelle dynamique (DTW)
3.4 Classification des systรจmes
3.4.1 Nombre de locuteurs
3.4.2 Longueur de mots
3.5 Applications de la reconnaissance vocale
3.5.1 Domaine dโ€™application
3.5.2 Limites
3.6 Conclusion
CHAPITRE 4 : SIMULATION DE LA RECONNAISSANCE DES MOTS ISOLES
4.1 Les matรฉriels de simulation
4.2 Description de la simulation
4.2.1 Extraction des paramรจtres caractรฉristiques
4.2.1.1. Avantages de la mรฉthode
4.2.1.2. Choix des paramรจtres pour lโ€™algorithme
4.2.2 Apprentissage du systรจme
4.2.3 Reconnaissance
4.3 Rรฉsultat de la simulation
4.3.1 Test avec prononciation dรฉcoupรฉ en syllabe
4.3.2 Test avec prononciation lente
4.3.3 Interprรฉtation des rรฉsultats
4.4 Conclusion et perspectives
CONCLUSION GENERALE
BIBLIOGRAPHIE
PAGE DE RENSEIGNEMENTS
RESUME
ABSTRACT

Tรฉlรฉcharger le rapport complet

Tรฉlรฉcharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiรฉe. Les champs obligatoires sont indiquรฉs avec *