Les mécanismes de la parole

Besoin d'aide ?

(Nombre de téléchargements - 0)

Catégorie :

Pour des questions et des demandes, contactez notre service d’assistance E-mail : info@chatpfe.com

Table des matières

ABSTRACT
REMERCIEMENTS
LISTE DES TABLEAUX
LISTE DES FIGURES
LISTE DES ABRÉVIATIONS ET SIGLES
INTRODUCTION
CHAPITRE 1 LE SIGNAL DE PAROLE 
1.1 Introduction 
1.2 Les mécanismes de la parole 
1.2.1 L’appareil phonatoire
1.2.2 Production de la parole
1.3 L’information vocale 
1.3 .1 Traits acoustiques du signal de parole
1.3.1.1 La fréquence fondamentale
1.3 .1.2 Le spectre du signal de parole
1.4 La perception de la parole 
1.4.1 Le système auditif
1.4.2 Analyse fréquentielle
1.4.3 Aire d’audition
1.4.4 Échelles de modélisation
1.4.4.1 L’échelle de Bark
1.4.4.2 L’échelle de Mel
1.5 Conclusion 
CHAPITRE 2 SYSTÈME DE RÉFÉRENCE POUR LA RECONNAISSANCE DU LOCUTEUR
2.1 Introduction
2.2 Principe de la reconnaissance du locuteur
2.3 Module de pré-traitement et de paramétrisation
2.3.1 Pré-traitement
2.3.2 Extraction des points caractéristiques – Méthode des MFCC
2.3.2.1 Blocage des trames
2.3.2.2 Fenêtrage et mise en trames
2.3.2.3 Transformée de Fourier Rapide (FFT)
2.3.2.4 Application de l’échelle de perception de Mel
2.3.2.5 Coefficients MFCC
2.3.2.6 Dérivées temporelles des coefficients MFCC
2.3.2.7 Motivation de l’utilisation des coeffcients cepstraux MFCC
2.4 Module de modélisation et d’apprentissage
2.4.1 Modélisation du locuteur par mélange de Gaussiennes (GMM)
2.4.2 Modèle du locuteur avec les GMM
2.4.2.1 Définition
2.4.2.2 Type de modèle
2.4.3 Estimation à maximum de vraisemblance des paramètres des GMM – phase d’entraînement
2.4.3.1 Maximisation directe
2.4.3.2 Maximisation à l’ aide de l’ algorithme EM
2.5 Module de reconnaissance – phase de test
2.5.1 Étape préliminaire
2.5.2 Identification du locuteur
2.6 Derniers réglages de perfectionnement pour la mise au point du système de référence pour la reconnaissance du locuteur
2.6.1 Choix du nombre de Gaussiennes pour les GMM
2.6.2 Initialisation des paramètres du modèle pour l’algorithme EM
2.6.2.1 Méthode d’initialisation des poids
2.6.2.2 Méthode d’initialisation des centres
2.6.2.3 Méthode d’initialisation des covariances
2.6.3 Nombre d’itérations pour l’algorithme EM
2.7 Expérimentation du système d’identification de référence
2.7.1 Paramètres optimaux du système de référence
2.7.1.1 Normalisation du signal de parole
2.7.1.2 Extraction des vecteurs de caractéristiques avec les MFCC
2.7.1.3 Phase d’apprentissage
2.7.1.4 Phase de test
2.7.2 Résultats expérimentaux trouvés pour le système de référence
2.8 Conclusions 
CHAPITRE 3 LES ONDELETTES ET SES APPLICATIONS 
3 .1 Introduction 
3 .1.1 Position du problème
3.1.2 Introduction aux ondelettes
3.2 Étude de la méthode des ondelettes 
3.2.1 Qu’appelle-t-on une ondelette?
3 .2.1.1 Présentation générale
3.2.1.2 Condition d’admissibilité
3.2 .1.3 Condition de régularité
3 .2.1.4 Compression et dilatation d’une ondelette
3.2.2 Exemples classiques d’ondelettes continues ID
3.2.2.1 Présentation de l’ondelette de Morlet
3.3 Étude de la transformée en ondelettes continue
3.3.1 La transformée en ondelettes continue
3.3.2 Transformée de Fourier d’une ondelette ; analyse temps fréquence
3.3.3 Avantages de la TOC
3.3.4 La transformée en ondelettes continue inverse
3.3.5 Qu’y a-t-il de continu dans la TOC?
3.4 Passage en revue des autres transformées en ondelettes
3.4.1 Décomposition discrète en série d’ondelettes
3.4.2 Transformée en ondelettes à temps discret
3.4.3 Transformée en ondelettes discrète
3.5 Conclusion
CHAPITRE 4 MODIFICATION DU SYSTÈME DE RECONNAISSANCE RÉFÉRENCE À L’AIDE DE LA TOC: UTILISATION D’UNE GRILLE DE SÉLECTION DES COEFFICIENTS DE LA TOC DE
4.1 Introduction
4.2 Présentation des bases de données utilisées dans la phase de tests
4.2.1 Base de données YOHO
4.2.2 Bases de données dérivées de YOHO
4.3 Modification du système de reconnaissance de référence avec la TOC
4.3.1 Mise en place de la TOC pour essayer d’améliorer les performances du système
4.3.1.1 Empreinte graphique du locuteur
4.3.1.2 Proposition d’utilisation de la TOC pour faire de la  reconnaissance de mots isolés
4.3.1.3 Méthode proposée pour exploiter l’empreinte du locuteur
4.3.2 Présentation des systèmes de reconnaissance hybrides proposés
4.3.2.1 Procédure
4.3.2.2 Systèmes de reconnaissance hybrides utilisant une grille pour la sélection des coefficients de la TOC : systèmes hybrides G
4.3.2.3 Recombinaison des coefficients de la TOC en un nouveau signal1D
4.4 Phase expérimentale
4.4.1 Paramètres optimaux additionnels pour les systèmes hybrides
4.4.1.1 Ondelette analysante
4.4.1.2 Échelle d’analyse
4.4.2 Essais expérimentaux pour les systèmes hybrides G
4.4.2.1 Tests des systèmes d’identification hybrides G 1
4.4.2.2 Tests des systèmes d’identification hybrides G2
4.5 Conclusions
CHAPITRE 5 MODIFICATION ET AMÉLIORATION DU SYSTÈME DE RECONNAISSANCE HYBRIDE PROPOSÉ : UTILISATION DE LIGNES POUR SÉLECTIONNER LES COEFFICIENTS DE LA TOC  
5.1 Introduction 
5.2 Présentation du système de reconnaissance hybride amélioré 
5.2.1 Systèmes de reconnaissance hybrides utilisant une combinaison de lignes pour la sélection des coefficients de la TOC : systèmes hybrides C
5.2.2 Tests du système d’identification hybride C
5.2.3 Conclusions sur le système hybride C
5.3 Présentation d’un nouveau système hybride amélioré 
5.3.1 Systèmes de reconnaissance hybrides utilisant une seule ligne pour la sélection des coefficients de la TOC : systèmes hybrides L
5.3.2 Tests du système d’identification L
5.3.3 Conclusions sur le système hybride L
5.4 Amélioration des performances du système hybride L par un raffinement d’échelles  
5.4.1 Sélection des coefficients de la TOC : premier raffinement des échelles
5.4.2 Performances
5.4.3 Conclusions sur le premier raffinement des échelles
5.4.4 Nouvelle sélection des coefficients de la TOC : second raffinement
des échelles
5.4.5 Performances
5.4.6 Conclusions sur le second raffinement des échelles
5.5 Vérification des tests 
5.6 Conclusions 
CHAPITRE 6 CHOIX DE L’ÉCHELLE D’ANALYSE DE LA TOC POUR  LA RECONNAISSANCE AUTO MA TIQUE DU LOCUTEUR
6.1 Introduction
6.2 Étude des lignes de coefficients de la TOC 
6.2.1 Analyses statistiques du premier ordre
6.2.2 Analyses énergétiques
6.2.3 Analyse du taux de passage par zéro
6.2.4 Conclusions sur l’ étude des lignes de coefficients de la TOC
6.3 Étude des coefficients MFCC extraits à partir des lignes de la TOC
6.3.1 Analyses statistiques du premier ordre
6.3.2 Analyses graphiques des histogrammes
6.3.3 Hypothèse
6.3.3.1 Analyse de l’ énergie
6.3.3.2 Analyse de l’entropie
6.3.4 Conclusions sur l’étude des coefficients MFCC extraits à partir des lignes de la TOC
6.4 Proposition d’une technique pour la reconnaissance automatique du locuteur utilisant la TOC
6.4.1 Méthodologie
6.4.2 Essais expérimentaux
6.4.3 Conclusions sur la méthode pour la reconnaissance automatique du locuteur
6.5 Conclusions 
CONCLUSION
ANNEXE 1 REPRÉSENTATION DES ÉCHELLES DE MEL ET DE BARK PAR UN BANC DE FILTRES
ANNEXE 2 L’OPTIMISATION DE LAGRANGE
ANNEXE 3 L’ALGORITHME DES K-MEANS
ANNEXE 4 BASE DE DONNÉES DE YOHO
ANNEXE 5 SOUS BASES DE DONNÉES DE YOHO
ANNEXE 6 RÉSULTATS COMPLETS DES TESTS DU SYSTÈME DE RECONNAISSANCE HYBRIDE L
ANNEXE 7 RÉSULTATS COMPLETS DES TESTS DE RAFFINEMENT (1ère partie) DU SYSTÈME DE RECONNAISSANCE HYBRIDE L
ANNEXE 8 RÉSULTATS COMPLETS DES TESTS DE RAFFINEMENT (2ème partie) DU SYSTÈME DE RECONNAISSANCE HYBRIDE L
ANNEXE 9 RÉSULTATS COMPLETS DES TESTS DE RAFFINEMENT (3ème partie) DU SYSTÈME DE RECONNAISSANCE HYBRIDE L
ANNEXE 10 L’ESTIMATEUR DE DENSITÉ DE KERNEL
BIBLIOGRAPHIE

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *