Traitement de la parole spontanée

Traitement de la parole spontanée

Contenu du memoire

Table des figures
Liste des tableau
Acronymes
Introduction
1 Le projet ANR EPAC
2 Problématique
3 Structure du document
Partie I Contexte de travail et état de l’art
Chapitre 1: Reconnaissance de la parole
1.1 Principe de base
1.2 Extraction de paramètres
1.3 Modèles acoustiques
1.3.1 Modèles de Markov Cachés
1.3.2 Apprentissage
1.3.2.1 Techniques
1.3.2.2 Dictionnaire de phonétisation
1.3.2.3 Alignement phonème/signal
1.3.3 Adaptation
1.3.3.1 Méthode MLLR
1.3.3.2 Adaptation SAT-CMLLR
1.3.3.3 Méthode MAP
1.4 Modèle de langage
1.4.1 Modèle n-gramme
1.4.2 Estimation des probabilités
1.4.3 Lissage
1.4.4 Évaluation du modèle de langage
1.4.5 Mesures de confiance
1.4.5.1 Théorie
1.4.5.2 Évaluation des mesures de confiance
1.4.6 Évaluation des systèmes de RAP
1.5 Système du LIUM
1.5.1 Apprentissage
1.5.1.1 Données d’apprentissage
1.5.1.2 Vocabulaire
1.5.1.4 Modèles de langage
1.5.2 Transcription
1.5.2.1 Système de segmentation et de regroupement en locuteurs
1.5.2.2 Système de transcription multi-passes
1.6 Campagnes d’évaluation ESTER 1 et 2
Chapitre 2: Traitement de la parole spontanée
2.1 Spécificités de la parole spontanée
2.1.1 Les disfluences
2.1.1.1 Les pauses
2.1.1.2 Les troncations, répétitions et faux-départs
2.1.1.3 L’élision
2.1.1.4 Les hésitations
2.1.2 Autres phénomènes
2.1.2.1 Agrammaticalité
2.1.2.2 L’intonation
2.1.2.3 Le débit de parole et l’état émotionnel du locuteur
2.2 Gestion des disfluences
2.2.1 Objectifs
2.2.2 Détection automatique
2.2.3 Correction automatique
2.3 Impacts et solutions pour la reconnaissance de la parole
2.3.1 Modélisation acoustique
2.3.2 Modélisation linguistique
2.3.3 Dictionnaire de prononciations
2.3.3.1 Approche guidée par les données
2.3.3.2 Approche à base de connaissances
2.4 Conclusion
Chapitre 3: Homophonie
3.1 Description générale
3.1.1 Mots homophones sémantiquement différents
3.1.2 Mots homophones sémantiquement identiques
3.2 Systèmes de RAP et homophonie
3.2.1 Quelques particularités du français
3.2.2 Analyse des erreurs d’homophonie
3.3 Méthodes automatiques appliquées aux erreurs de reconnaissance des systèmes de RAP
3.3.1 Approches statistiques globales
3.3.1.1 Détection automatique des erreurs
3.3.1.2 Correction automatique des erreurs
3.3.2 Approches ciblées sur les homophones
3.3.2.1 Approches par règles linguistiques
3.3.2.2 Approches statistiques
3.3.3 Combinaison des approches
3.4 Conclusion
Partie II Contributions
Chapitre 4: Étude comparative de la parole préparée et spontanée en français
4.1 Caractérisation de la parole spontanée
4.1.1 Étiquettes et classes de spontanéité
4.1.2 Impact du degré de spontanéité
4.1.3 Extraction de caractéristiques de la parole spontanée
4.1.3.1 Caractéristiques prosodiques
4.1.3.2 Caractéristiques linguistiques
4.1.3.3 Mesures de confiance
4.2 Apprentissage automatique : le Boosting
4.2.1 Principe général
4.2.2 L’algorithme AdaBoost
4.3 Approche proposée
4.4 Détection automatique des segments de parole spontanée
4.4.1 Classification au niveau du segment
4.4.2 Décision globale au moyen d’un modèle probabiliste
4.4.2.1 Présentation du modèle
4.4.2.2 Résolution de l’équation
4.5 Expériences
4.5.1 Données expérimentales
4.5.1.1 Corpus
4.5.1.2 Performances du système de RAP
4.5.1.3 Détection et catégorisation automatiques des segments de parole
4.5.2 Conclusion
Chapitre 5: Modélisation spécifique de la parole spontanée pour la reconnaissance de la parole
5.1 Dictionnaire et variantes de prononciation
5.1.1 Analyse de variantes de prononciation spécifiques à la parole spontanée
5.1.2 Construction du nouveau dictionnaire de prononciations
5.1.3 Expériences
5.1.4 Résultats
5.1.5 Analyse des erreurs
5.1.5.1 Au niveau de variantes de prononciation
5.1.5.2 Au niveau du type de parole
5.1.5.3 Au niveau du segment
5.2 Adaptation des systèmes de RAP
5.2.1 Principe général
5.2.1.1 Adaptation non-supervisée des modèles acoustiques et de langage
5.2.1.2 Combinaison des systèmes
5.2.2 Adaptation automatique des modèles
5.2.2.1 Modélisation acoustique
5.2.2.2 Modélisation linguistique
5.2.3 Corpus
5.2.4 Expériences
5.2.4.1 Analyse du système adapté
5.2.4.2 Combinaison des systèmes
5.2.5 Conclusion
5.3 Approches spécifiques : le cas de l’homophonie en français
5.3.1 Approche proposée
5.3.1.1 Méthodologie générale
5.3.1.2 Règle grammaticale
5.3.1.3 Méthode statistique
5.3.2 Expériences réalisées
5.3.2.1 Mots et classes de mots étudiés
5.3.2.2 Outils
5.3.2.3 Données expérimentales
5.3.3 Résultats obtenus
5.3.3.1 Avec les règles grammaticales
5.3.3.2 Avec la méthode statistique
5.3.4 Conclusion
5.4 Résultats finaux des méthodes spécifiques
5.5 Perspectives
Conclusion et perspectives
1 Détecteur de la parole spontanée
2 Modélisation spécifique des systèmes de RAP à la parole spontanée
2.1 Apprentissage non-supervisé des modèles acoustiques et linguistiques
2.2 Combinaison des systèmes
3 Correction d’erreurs spécifiques d’homophonie
4 Perspectives.
Bibliographie personnelle
Bibliographie
Résumé

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *