Complexité et variabilité du signal vocal

Besoin d'aide ?

(Nombre de téléchargements - 0)

Catégorie :

Pour des questions et des demandes, contactez notre service d’assistance E-mail : info@chatpfe.com

Table des matières

ABSTRACT
REMERCIEMENTS
LISTE DES TABLEAUX
LISTE DES FIGURES
LISTE DES ABRÉVIATIONS ET SIGLES
INTRODUCTION
CHAPITRE 1 LA RECONNAISSANCE DE LA PAROLE 
1.1 Complexité et variabilité du signal vocal
1.2 Redondance du signal vocal
1.3 Extraction des paramètres
1.3.1 Échantillonnage
1.3.2 Pré-accentuation
1.3.3 Fenêtrage
1.3.4 Calcul des coefficients cepstraux
1.4 Les modèles de Markov cachés (HMM)
1.5 Les outils statistiques de la reconnaissance de la parole
1.5.1 Entraînement d’un modèle: Méthode du maximum de vraisemblance
1.5.2La reconnaissance d’un modèle: Méthode de l’algorithme de Viterbi
1.5.2.1 Probabilité d’émission des observations
1.5.2.2 Algorithme de Viterbi
1.6 La reconnaissance de la parole continue
1.6.1 Modèles connectés
1.6.2 Apprentissage
1.6.3 Décodage
CHAPITRE2 ÉTUDE DU CANAL TÉLÉPHONIQUE
2.1Bruits liés à l’acquisition et au transport de la parole au travers du réseau téléphonique commuté
2.1.1 Les bruits additifs
2.1.2 Les bruits convolutifs
2.2 Effets du canal téléphonique sur la parole

2.3 Effets du canal en terme de performances de reconnaissance
2.4 Techniques d’égalisation du canal PSTN
2.4.1 La normalisation par moyenne cepstrale (CMN)
2.4.2 La normalisation par moyenne cepstrale améliorée (CMN Best)
2.4.2.1 Algorithme utilisé de détection d’activité de la voix
2.4.2.1.1 Energie d’une trame
2.4.2.1.2 Méthode simple de détection
2.4.2.1.3 Méthode plus élaborée de détection
2.4.2.2 Le calcul de la nouvelle valeur du cepstre du canal
2.4.3 La normalisation cepstrale augmentée (ACN)
2.4.3.1 Calcul de la probabilité a posteriori Pi
2.4.3.1.1 Estimation discrète
2.4.3.1.2 Estimation continue
2.4.4 La méthode du filtrage RASTA 

CHAPITRE 3 MISE EN PLACE DU SYSTÈME DE RECONNAISSANCE
3.1 AVECHTK
3.2 Calcul des coefficients mel-cepstraux (MFCC)
3.2.1 Apprentissage par monophone
3.2.2 Création d’un prototype de HMM
3.2.3 Initialisation des modèles de HMM
3.2.4 Apprentissage
3.2.5 La reconnaissance des modèles
3.3 L’obtention du taux de reconnaissance
3.4 Nouvel apprentissage suite à l’amélioration du modèle de silence
3.5 Nouvel apprentissage suite au réalignement des données
d’entraînement
3.5.1 Apprentissage par triphones
3.5.2 Création de triphones à partir de phonèmes
3.5.3 Clonage
3.6 Création de triphones avec états partagés
3.7 Augmentation du nombre de Gaussiennes par état
Conclusion
CHAPITRE 4 MÉTHODE PROPOSÉE ET RÉSULTATS EXPÉRIMENTAUX
4.1 Modélisation du canal téléphonique
4.1.1 Construction de filtres modélisant le canal téléphonique
4.1.1.1Exemple avec le canal de type 3002
4.1.1.1.1 Génération de la réponse en amplitude
4.1.1.1.2 Génération de l’enveloppe du retard
4.1.1.1.3 Génération du filtre
4.1.1.2 Génération des 3 autres canaux
4.1.1.3 Généralisation à une multitude de canaux
4.2 Description de la base de données utilisée
4.3 Description des tests de reconnaissance

4.3.1 Evaluation du système de référence
4.3.2 Evaluation des techniques de compensation
4.3.2.1 Adaptations des paramètres
4.3.2.2 Méthode proposée : apprentissage multiréférences
4.3.2.3
Méthode proposée combinée à l’adaptation des paramètres
CONCLUSION
BIBLIOGRAPHIE

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *