Communication orale, communication écrite

Télécharger le fichier pdf d’un mémoire de fin d’études

Les actes de discours

En linguistique et en philosophie du langage, un acte de discours est un énoncé porteur d’une fonction performative. En effet, pour Austin, qui a introduit le terme dans la langue contemporaine, les énonciations doivent être considérées comme des actions effectuées par le locuteur. Apparaît ici l’idée selon laquelle tout acte d’énonciation serait la réalisation d’un acte social. Les verbes qui spécifient ces actions sont appelés verbes performatifs (i.e. « Je vous confère le titre de capitaine »). Mais les actes de discours ne sont pas constitués uniquement de ces types de verbes.
Austin (1975) développe une théorie des actes de discours défendant la thèse selon laquelle tout énoncé peut être analysé à trois niveaux. D’abord, au niveau locutoire : il s’agit de sa forme de surface, i.e. de la signification de l’énoncé, représenté par ses aspects phonétique, syntaxique et sémantique. Puis au niveau de l’acte illocu-toire, porteur de l’intention rhétorique du locuteur. Et enfin, au niveau de l’acte perlocutoire, qui s’intéresse aux conséquences de l’exécution de l’énoncé ou de son interprétation par les allocutaires : son effet pragmatique.
La notion d’acte illocutoire est centrale au concept d’acte de discours. Cet acte permet de décrire les énoncés en termes de fonctions communicatives portées par chacun d’eux (e.g. question, réponse, remerciement…). Austin propose cinq classes d’actes de discours : les verdictifs (qui donnent un verdict), les exercitifs (qui exercent un pouvoir), les promissifs (qui engagent le locuteur), les comportatifs (qui expriment l’attitude) et les expositifs (qui exposent de l’information). Pour Searle (1969), dont la conception des actes de discours diffère légèrement de celle d’Austin, tout acte de discours est illocutoire (sa définition se rapproche ainsi de ce que Austin appelle « acte de dialogue »). Il propose cinq classes d’actes : les assertifs (qui affirment un état de fait), les directifs (qui poussent l’interlocuteur à agir), les promissifs (qui engagent le locuteur), les expressifs (qui expriment un état psychologique) et les déclaratifs (qui ont un impact réel, e.g. prononcer un jugement) (Searle, 1976). La table 2.1 illustre ces deux taxonomies fondatrices et montre comment elles peuvent être alignées.
Historiquement, cette théorie a rapidement gagné en influence dans un ensemble de disciplines varié. En psychologie, par exemple, il a été suggéré que l’acquisition des actes de discours puisse être un prérequis pour l’acquisition du langage (Bruner, 1975). Des experts littéraires se sont tournés vers Austin pour mettre en lumière des particularités textuelles (Ohmann, 1971). En linguistique, des chercheurs ont trouvé que des notions de la théorie des actes de discours permettaient d’expliquer des problèmes en sémantique (Fillmore, 1971), en syntaxe (Sadock, 1974) et en apprentissage d’une seconde langue (Jakobovits et Gordon, 1974). Même en philo-sophie, des applications pouvaient être trouvées, par exemple pour déterminer le statut de postulats éthiques (Searle, 1969).
En informatique, les actes de discours sont communément utilisés pour modéliser les conversations dans le cadre d’applications de classification automatique et de recherche d’information (Twitchell et al., 2004). Des modèles pour l’interaction homme-machine ont également été développés en se basant sur ces concepts (Morelli et al., 1991). Ainsi, c’est en termes d’actes de discours que les interactions entre participants d’une conversation sont modélisées par de nombreux travaux liés à la linguistique informatique.

Des actes de discours aux actes de dialogue

Dans cette section nous nous intéressons aux travaux qui ont été produits autour de la théorie des actes de discours d’Austin et Searle, et qui ont mené au développement du concept d’acte de dialogue tel qu’il est utilisé dans la littérature contemporaine.

Analyse des conversations fonctionnelles

Jusque dans les années 1990, la théorie des actes de discours s’est largement limitée à l’examen d’énoncés isolés, et n’a pas cherché à prendre en charge l’analyse de conversations entières où plusieurs participants peuvent interagir (Vanderveken, 1992). Cependant, les locuteurs accomplissent des actes illocutoires tout au long des conversations qu’ils peuvent avoir avec d’autres participants. Vanderveken sou-ligne que ces derniers répondent et accomplissent à leur tour leurs propres actes de discours, tout en cherchant collectivement à atteindre des objectifs communs. Une application sociale du langage est donc constituée, en général, de séquences ordonnées d’énoncés par différents locuteurs qui cherchent ensemble à poursuivre un même but, comme décider d’une marche à suivre, résoudre un problème, accomplir une action, etc.
Dans le cas de ces deux derniers exemples, on parlerait de « conversation fonction-nelle », i.e. d’une conversation construite autour d’une tâche, c’est-à-dire consacrée à la transmission d’information dans le but de réaliser un objectif individuel ou collectif dans le monde réel. C’est à ce type de conversations, qui inclue notamment les conversations porteuses de demandes d’assistance, que s’intéressent la plupart des travaux cherchant à étendre la théorie des actes de discours aux interactions multi-partites. Cela s’explique par le fait que les applications informatiques de l’analyse du dialogue sont presque toujours motivées par le besoin de faciliter ou d’automatiser l’exécution d’une tâche par un utilisateur humain.

Théorie des actes de la conversation

Dans cette perspective d’extension de la théorie des actes de discours, Traum et Hinkelman (1992) décrivent une théorie des actes de la conversation (Conversation Act Theory), qui se veut plus générale. Ils étudient le corpus TRAINS (Gross et al., 1993) 3, tiré du projet éponyme, dont l’objectif est de développer un assistant de planification intelligent qui puisse communiquer en langage naturel avec des opérateurs humains. Le corpus est constitué de dialogues fonctionnels entre un manager devant résoudre des problèmes de planification et une personne jouant le rôle du système, disposant d’informations additionnelles sur la tâche, et chargé d’assister le manager. Traum et Hinkelman constatent que l’un des traits les plus flagrants des dialogues fonctionnels est la prépondérance des signes d’accord et d’acquittement (e.g. « There are oranges at Corning, right ? » « Right. »). C’est l’un des éléments qui les poussent à remettre en question certains postulats généralement implicites dans les travaux antérieurs. Le premier de ces postulats voudrait que les énoncés soient toujours entendus et correctement compris par les allocutaires, d’une part, et que les par-ticipants ne s’attendent jamais à ce que ce ne soit pas le cas, d’autre part. Mais non seulement les énoncés sont souvent mal compris ou mal perçus, mais en plus Traum et Hinkelman avancent que les conversations sont structurées de manière à prendre en compte ce phénomène : les participants cherchent systématiquement à obtenir des preuves que leur interlocuteur a bien compris ce qu’il voulaient dire. Ces preuves peuvent prendre la forme d’un acquittement explicite (e.g. « Right. »), d’un acquittement implicite via une réaction pertinente (par exemple en répondant à la question posée), ou encore par des signaux non-verbaux (hochement de tête, etc.). Cette quasi-nécessité de l’acquittement les pousse également à remettre en cause l’idée selon laquelle les actes de discours sont des actions réalisées uniquement par le locuteur, et que l’allocutaire n’a qu’une fonction passive face à eux. Les actes de discours ne peuvent être analysés que dans le contexte d’un dialogue multi-agent. Enfin, le troisième postulat que Traum et Hinkelman remettent en cause suite à cette observation, c’est que chaque énoncé n’est porteur que d’un seul acte de discours. En effet, si certains énoncés peuvent non seulement réaliser leur fonction communi-cative affichée et en plus servent à acquitter un autre énoncé, c’est qu’ils peuvent réaliser deux actes simultanément.
La taxonomie des actes de la conversation qu’ils proposent prend en compte ces trois observations. Elle détaille une catégorisation de ces actes en quatre classes : les actes de prise de parole (turn-taking acts), les actes de synchronisation (grounding acts), les actes de discours fondamentaux (core speech acts), et les actes argumentatifs (argumentation acts). En terme d’unité textuelle, les actes de prise de parole se situent à un niveau inférieur à l’énoncé, les actes de synchronisation au niveau de l’énoncé, tandis que les actes de discours fondamentaux (informer, promettre et requérir) se trouvent au niveau de ce qu’ils appellent une « unité de discours ». Cette unité peut contenir un énoncé introductif suivi d’autant d’énoncés de synchronisation que nécessaire pour assurer une bonne communication (e.g. « Because there are oranges in Vermont. Right ? You agree ? »). Enfin, les actes argumentatifs se situent à un niveau encore supérieur puisqu’ils peuvent contenir un nombre illimité d’unités de discours dont les actes fondamentaux sont utilisés pour former des composés complexes (par exemple le descriptif d’un système, l’exposé d’un problème etc.).

Contexte et connaissances communes

Poesio et Traum (1997) s’accordent à dire que les conversations, même fonctionnelles, ont des aspects nettement séparés de la réalisation de la tâche qui en est l’objet, et que l’exercice du langage est une action coordonnée, ce qui impose le développement d’une théorie du contexte. Les théories développées à ce sujet se déclinent en deux traditions : d’une part, les approches linguistiques construites autour notamment de la résolution d’anaphores, et d’autre part les modèles computationnels proposés pour représenter les effets des actes de discours sur les participants d’une conversation, par exemple en termes de croyances, d’obligations et de besoins. C’est cette deuxième approche qui nous intéresse, puisque la première n’a que peu de rapport avec les exercices de planification et de coordination de l’information qui sont propres aux conversations fonctionnelles, et a fortiori aux conversations orientées vers la résolution de problèmes. Si la résolution d’anaphores peut évidemment présenter un intérêt pour suivre le fil des conversations, ce problème purement linguistique doit être traité séparement de la question de la synchronisation inter-participants.
Quand Poesio et Traum parlent de contexte, ils font référence à l’information que les participants doivent utiliser pour interpréter les énoncés d’une conversation. Ce contexte est caractérisé notamment par la notion, centrale, de connaissances communes, ou « terrain d’entente » (common ground) entre les participants. Cette information est cruciale pour pouvoir comprendre à quoi un énoncé fait référence, puisque c’est le contexte qui contient tous les référents disponibles, les référents étant ajoutés aux connaissances communes au travers des nouveaux actes de discours qui sont accomplis. Bien modéliser ces connaissances nécessite donc de bien modéliser les mises à jour du contexte. C’est là que se situe la nuance entre un acte de discours et un acte de dialogue : si l’acte de discours cherche bien à capturer l’intention communicative du locuteur, l’acte de dialogue inscrit cette intention dans un contexte particulier et capture également l’impact que l’énoncé a sur la conversation.

Schémas d’annotation

Dans cette section, nous présentons trois schémas d’annotations utilisés pour la modélisation des conversations en termes d’actes de dialogue : DAMSL, DIT++ et le standard ISO 24617-2. Nous détaillons leurs fondamentaux conceptuels ainsi que leurs taxonomies.

Concepts pratiques et théoriques

Nous décrivons ici les partis pris et postulats conceptuels qui sont partagés par les schémas d’annotations que nous allons présenter.
Mise à jour du contexte :
DIT++, DAMSL et le standard ISO partent du principe que les applications nécessitant une analyse automatique du dialogue doivent prendre en compte les modifications dynamiques du « terrain d’entente », et pour ce faire proposent d’annoter les fonc-tions communicatives des actes de dialogue. Pour Core et Allen (1997), ces fonctions doivent représenter des manipulations directes du contexte informationnel d’une conversation. La première caractéristique de ces taxonomies est donc qu’elles défi-nissent les actes de dialogue comme des opérations de mise à jour du contexte. Multi-dimensionnalité :
Comme nous l’avons vu, la communication est une activité complexe. Les participants d’une conversation cherchent souvent à accomplir une tâche particulière au travers du dialogue, tout en contrôlant le processus de conversation, mais également en veillant à respecter les conventions sociales et à structurer thématiquement et discursivement la conversation. Puisque les participants accomplissent ces activités variées plus ou moins en même temps, ce n’est pas surprenant que les énoncés soient souvent multi-fonctionnels, et servent plusieurs objectifs à la fois. Par exemple, un énoncé peut répondre à une question, fournir un retour à propos de la compréhension de la question, et passer le tour à l’allocutaire.
Pour répondre à cette problématique, un aspect important des schémas d’annotations que nous allons détailler est leur multi-dimensionnalité. En effet, une des limites de la théorie des actes de discours d’Austin et Searle, qui a été souvent soulignée par les chercheurs, est son incapacité à prendre en compte la pluralité des intentions qu’un locuteur peut chercher à exprimer dans un seul énoncé. Comme préconisé par Traum et Hinkelman (1992), les taxonomies proposées par Core et Allen et Bunt prennent en compte ce problème et autorisent l’application de plusieurs labels à un seul énoncé. On parle alors de dimensions ou de couches (layers), chacune permettant d’annoter un aspect différent de l’énoncé.
Généricité :
L’annotation des conversations en termes d’actes de dialogue peut suivre deux approches. La première, ontologique, consiste à proposer une taxonomie spécifique au domaine ou à la tâche étudiée. La seconde, plus ambitieuse, cherche à atteindre une couverture plus générique du dialogue (Leech et Weisser, 2003). C’est le cas de deux schémas d’annotation largement utilisés : DAMSL et DIT++, ainsi que du standard ISO 24617-2, largement basé sur DIT++.
Leur caractère générique est un de leurs attributs les plus importants, et proba-blement celui qui a le plus contribué à leur popularité. Les annotations proposées sont toutes de suffisamment haut niveau pour pouvoir être appliquées à différents types de dialogues. Néanmoins, tous se focalisent nettement sur les conversations fonctionnelles, et ils ont d’ailleurs été d’abord développés autour du même corpus TRAINS que les travaux que nous avons détaillés en sous-section 2.3.

DAMSL

DAMSL, dont l’acronyme signifie Dialogue Act Markup in Several Layers, ou « balisage d’actes de dialogue en plusieurs couches », est le premier schéma d’annotation à implémenter une approche multidimensionnelle, permettant d’assigner de multiples labels aux énoncés (Core et Allen, 1997). Catégories de labels :
DAMSL propose quatre catégories distinctes de labels indépendantes les unes des autres : les fonctions prospectives, les fonctions rétrospectives, le niveau d’informa-tion et le statut communicatif. Ce choix est justifié par la réalité des conversations, où certains énoncés sont de toute évidence liés entre eux. Par exemple, prenons l’échange suivant :
1. Participant 1 : « Le ciel commence à se dégager. »
2. Participant 1 : « Quelle heure est-il ? »
3. Participant 2 : « Il est bientôt midi. »
Il est immédiatement apparent que l’énoncé 3 fait réponse à l’énoncé 2, et diffère en ce sens de l’énoncé 1, qui n’a pas été sollicité. Pourtant, les deux apportent une information factuelle au contexte, et pourraient être classés comme « informer ». Core et Allen notent que si des travaux avaient déjà tenté de répondre à ce problème en proposant des sous-classes de type « informer-répondre » ou « informer-accepter », ce n’est pas satisfaisant car les actes d’acquitter, de répondre ou d’accepter un énoncé semblent appartenir à un genre d’actes bien distinct de « informer ». Ils disent des fonctions de ces actes qu’elles sont rétrospectives (backward-looking), puisqu’elles sont orientées vers la partie antérieure de la conversation. Les autres fonctions (e.g. affirmer, ordonner, promettre, etc.) sont donc dites prospectives (forward-looking), puisqu’elles en impactent la partie ultérieure. Ces deux groupes de fonctions consti-tuent les deux premières catégories de labels 4 de la taxonomie DAMSL. Ce sont elles qui permettent d’étiqueter les énoncés par leur intention communicative.
Les deux autres catégories définies par DAMSL sont celles des traits énonciatifs (Utterance Features). Ces traits ne s’intéressent pas à la fonction communicative de l’énoncé, mais capturent les propriétés de son contenu. Ils indiquent sur quoi l’énoncé porte (s’il porte directement sur la tâche, sur le processus de communication, du processus de résolution de la tâche, ou d’autre chose) : c’est la catégorie niveau d’information (Information Level). Ils permettent également d’identifier les énoncés qui peuvent être ignorés sans danger (parce qu’incompréhensibles ou interrompus) : c’est la catégorie statut communicatif (Communicative Status).

ISO 24617-2

Le standard ISO 24617-2 (Bunt et al., 2012) a été développé avec la volonté de répondre au besoin croissant d’un schéma d’annotation qui réponde à plusieurs critères :
1. Indépendant du domaine applicatif
2. Théoriquement et empiriquement fondé
3. Compatible avec les dialogues parlés, écrits, et multi-modaux
4. Efficacement utilisable par les annotateurs humains comme les algorithmes automatiques
Le standard est composé de différents composants, tels que le schéma d’annotation, des concepts pour l’annotation de relations rhétoriques, un langage de modélisation du dialogue (DiAML), et des spécifications pour la représentation en XML des annotations. Dans cette section, nous nous intéressons uniquement au schéma d’annotation proposé. Sur ce point, le standard est très largement basé sur DIT++. Les principes fondamentaux restent les mêmes : les actes de dialogue sont similairement définis, et chaque énoncé peut être annoté avec une fonction communicative par dimension sémantique. Les informations annotées peuvent également être enrichies par des qualifieurs, et les actes de dialogue peuvent être liés entre eux par des relations rhéthoriques ou de dépendance fonctionnelle.
Les taxonomies des dimensions sémantiques et des fonctions communicatives sont simplifiées : le nombre de fonctions a été réduit de 86 à 56, et les dimensions sémantiques sont passées de 10 à 9, avec le retrait de la dimension Contact Mana-gement. Néanmoins, le standard précise que ces fonctions et dimensions ne sont que les éléments fondamentaux, transverses à toutes les applications et tous les domaines, et peuvent être étendus. Pour adapter le schéma à un domaine ou une tâche particulière, il est possible de l’étendre en ajoutant des fonctions, dimensions, qualifieurs et relations rhétoriques. Cependant, pour rester dans le cadre du stan-dard, ces modifications sont conditionnées au respect des principes fondamentaux du standard ISO, à savoir:
— Le dialogue est multi-fonctionnel, par conséquent le schéma d’annotation doit être multi-dimensionnel.
— Les dimensions sont des types d’activités communicationnelles distinctes, por-tant sur des aspects distincts de la conversations, et doivent donc capturer des informations catégoriquement distinctes.
— Toutes les dimensions doivent être justifiées théoriquement, observées empiri-quement, reconnaissables avec une précision raisonnable par des annotateurs humains et par des systèmes de reconnaissance automatique, et indépendantes des autres dimensions.
— La fonction communicative est définie comme la façon dont le locuteur veut que l’état informationnel de l’allocutaire soit mis à jour.
— Les fonctions communicatives doivent être correctement assignées à des seg-ments fonctionnels, ces derniers étant définis comme les unités de dialogue minimales portant au moins une fonction communicative.
— L’ensemble des fonctions communicatives est divisé en sous-ensembles de fonctions spécifiques pour chaque dimension, ainsi qu’un sous-ensemble de fonctions génériques.
— Pour chaque dimension, les fonctions communicatives spécifiques doivent être connectées sémantiquement, de manière à ce qu’aucun segment fonctionnel ne puisse nécessiter d’être annoté avec plus d’une fonction communicative pour une dimension donnée.
Le standard est donc un schéma d’annotation solide et extensible. Par ailleurs, des efforts récents ont été produits pour démocratiser son usage, notamment au travers de Tilburg DialogBank (Bunt et al., 2016). Ce projet vise à publier des annotations pour plusieurs corpus fréquemment utilisés au travers du standard, tels que Switchboard, DBOX ou TRAINS. Si la taxonomie et les données proposées ne sont pas spécifiquement conçues pour le domaine qui nous intéresse, il nous est cependant normalement possible de l’étendre et de l’adapter pour l’appliquer aux conversations écrites en ligne porteuses de demandes d’assistance.

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

Glossaire
1 Introduction
1.1 Contexte général
1.2 Objectifs de recherche
1.3 Projet ODISAE
1.4 Plan de la thèse
2 Actes de dialogue
2.1 Introduction
2.2 Les actes de discours
2.3 Des actes de discours aux actes de dialogue
2.3.1 Analyse des conversations fonctionnelles
2.3.2 Théorie des actes de la conversation
2.3.3 Contexte et connaissances communes
2.4 Schémas d’annotation
2.4.1 Concepts pratiques et théoriques
2.4.2 DAMSL
2.4.3 DIT++
2.4.4 ISO 24617-2
2.5 Conclusion
3 Communication médiée par les réseaux
3.1 Introduction
3.1.1 Les réseaux : un handicap à la communication ?
3.1.2 Communication orale, communication écrite
3.1.3 Modalités synchrones et asynchrones
3.2 Spécificités des modalités étudiées
3.2.1 Courriels
3.2.2 Forums
3.2.3 Chats
3.3 ISO 24617-2 : étude d’applicabilité
3.3.1 Cadre de l’étude
3.3.2 Dialogues et polylogues
3.3.3 Contraintes techniques
3.3.4 Asynchronicité et pseudo-synchronicité
3.3.5 Conversations multi-canaux
3.4 Conclusion
4 Interopérabilité taxonomique : enjeux et proposition
4.1 Introduction
4.2 Standardisation vs Interopérabilité
4.2.1 Le standard ISO
4.2.2 Interopérabilité entre taxonomies
4.3 Méta-modélisation
4.3.1 Intuitions
4.3.2 Caractéristiques méta-modélisables d’une taxonomie
4.3.3 Le méta-modèle
4.3.4 Formalisation des traits
4.3.5 Intérêts
4.3.6 Extraction des traits primitifs
4.4 Cadre expérimental
4.4.1 Corpus et taxonomies
4.4.2 Méta-modèle expérimental
4.5 Expériences
4.5.1 Conversion d’annotations
4.5.2 Classification inter-taxonomique
4.5.3 Méthode
4.5.4 Résultats
4.6 Autres usages
4.7 Conclusion
5 Corpus Ubuntu
5.1 Introduction
5.2 Travaux et ressources similaires
5.3 Construction du corpus
5.3.1 Modélisation des conversations écrites en ligne
5.3.2 Méthode de collecte
5.3.3 Pré-traitement des données
5.3.4 Statistiques sur le corpus
5.4 Annotation d’une partie du corpus en termes d’actes de dialogue et d’informations Opinion-Sentiment-Émotion
5.4.1 Taxonomie employée
5.4.3 Annotations et statistiques
5.5 Conclusion
6 Reconnaissance automatique des actes de dialogue
6.1 Introduction
6.2 Travaux similaires
6.3 Méthode
6.3.1 Approche et implémentation
6.3.2 Traits
6.4 Expériences et discussion
6.4.1 Comparaison d’un classifieur SVM à l’approche de base
6.4.2 Comparaison d’approches et de jeux de traits sur différentes modalités
6.5 Comparaison de classifieurs trans-modalités
6.6 Conclusion
7 Conclusion générale
7.1 Synthèse des contributions
7.1.1 Modélisation des actes de dialogue
7.1.2 Méta-modélisation des taxonomies d’actes de dialogue
7.1.3 Corpus Ubuntu-fr
7.1.4 Classification automatique des actes de dialogue
7.2 Perspectives
7.2.1 Réseaux de neurones
7.2.2 Interopérabilité inter-taxonomique
Annexes
A Taxonomie d’actes de dialogue employée pour le corpus Ubuntu-fr
A.1 Dimensions sémantiques
A.2 Fonctions communicatives
A.2.1 Fonctions communicatives génériques
A.2.2 Fonctions communicatives spécifiques
B Liste des traits primitifs
B.1 Composants
B.1.1 Participants
B.1.2 Objets
B.1.3 Verbes
B.1.4 Propriétés
B.2 Traits primitifs
Bibliographie