La transcription et l’annotation du corpus EPAC

Besoin d'aide ?

(Nombre de téléchargements - 0)

Catégorie :

Pour des questions et des demandes, contactez notre service d’assistance E-mail : info@chatpfe.com

Table des matières

Introduction
Chapitre 1 : Parcours de recherche
1.1 Le projet EPAC : présentation générale
1.1.1 Sous-projet 1 : Management du projet
1.1.2 Sous-projet 2 : Extraction de caractéristiques acoustiques de bas niveau
1.1.3 Sous projet 3 : Reconnaissance automatique de la parole conversationnelle
1.1.4 Sous-projet 4 : Identification nommée du locuteur
1.1.5 Sous-projet 5 : Traitement du langage naturel
1.1.6 Sous-projet 6 : Structuration et agrégation
1.1.7 Sous-projet 7 : Annotation et évaluation
1.1.8 Résultats et conséquences attendus
1.2 Autres projets « corpus » similaires
1.2.1 VARILING
1.2.2 RHAPSODIE
1.3 La transcription et l’annotation du corpus EPAC
1.3.1 Introduction
1.3.2 Corpus de transcription
1.3.3 Difficultés liminaires
1.3.4 La parole superposée
1.3.5 De la transcription manuelle à la transcription assistée
1.3.6 Facteurs humains
1.4 Avenir du corpus EPAC
1.4.1 Enrichissement des données pour la communauté Parole
1.4.2 Études lexicales, sémantiques et autres
1.4.2.1 Quelques précisions sur l’annotation du corpus EPAC
1.4.2.2 Études lexicales
1.4.2.3 Études sémantiques
1.4.2.4 Études sur le traitement automatique de la langue
1.5 Autres travaux de transcription ou d’annotation
1.5.1 Transcription d’émissions télévisées
1.5.2 Annotation en frames sémantiques du corpus MEDIA
1.5.3 Segmentation en locuteurs du corpus vidéo LIA GERARD
1.6 Conclusion
Chapitre 2 : La transcription
2.1 Corpus disponibles et conventions existantes
2.1.1 Historique
2.1.2 Inventaire des corpus existants / disponibles
2.1.3 Les conventions de transcription
2.2 Transcription manuelle ou assistée
2.2.1 Transcription manuelle vs assistée : une étude chiffrée
2.2.1.1 Protocole
2.2.1.2 Principaux résultats
2.2.1.3 Principaux enseignements
2.2.2 Relevé, classement et analyse des principaux types d’erreur de LIUM RT
2.2.2.1 Homonymes / paronymes
2.2.2.2 « e » ouvert / « e » fermé
2.2.2.3 Assimilations
2.2.2.4 Répétitions, faux départs, troncations
2.2.2.5 Autres observations
2.2.3 Perspectives pour optimiser les systèmes de reconnaissance automatique de la parole
Chapitre 3 : Les logiciels d’aide à la transcription
3.1 TRANSCRIBER
3.2 PRAAT
3.3 WINPITCHPRO
3.4 EXMARaLDA
3.5 ELAN
3.6 TRANSANA
3.7 ANVIL
3.8 XTRANS
3.9 Conclusion
Chapitre 4 : Le codage
4.1 Quelques généralités
4.2 La TEI
4.2.1 Introduction
4.2.2 SGML : un langage de balisage
4.2.3 XML : le SGML simplifié
4.2.4 La TEI : un codage fait pour les corpus oraux
4.2.4.1 La TEI en quelques balises
4.2.4.2 Le codage de la parole selon la TEI
4.3 Conclusion
Chapitre 5 : La parole spontanée
5.1 La parole spontanée : des chiffres pour établir une théorie
5.1.1 Protocole
5.1.2 Résultats généraux
5.1.3 Résultats détaillés
5.2 La parole spontanée : approches et analyses croisées
5.2.1 La morpho-syntaxe
5.2.1.1 L’élision
5.2.1.2 La troncation
5.2.1.3 Le faux départ
5.2.1.4 La répétition
5.2.1.5 Les constructions interrogatives
5.2.2 L’énonciation
5.2.3 Le lexique
5.2.3.1 euh
5.2.3.2 ben
5.2.4 La phonétique et la phonologie
5.2.4.1 Le schwa
5.2.4.2 L’élision du schwa et les assimilations
5.2.5 La prosodie
5.2.5.1 La fréquence fondamentale de la voix (F0
5.2.5.2 L’intensité
5.2.5.3 La durée
5.2.5.4 La pause
5.2.6 La reconnaissance automatique de la parole
5.3 Les disfluences : un critère réellement discriminant
5.3.1 Protocole
5.3.2 Résultats généraux
5.3.3 Résultats détaillés
5.4 La parole spontanée et l’interaction
5.4.1 Analyse générale des résultats
5.4.2 Radio / télévision : une seule parole spontanée ? L’exemple du débat
5.4.3 Sous les étoiles exactement : un bon exemple de variation interactionnelle
5.5 Conclusion
Conclusion générale et perspectives
Bibliographie personnelle
Bibliographie

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *