Des actes de discours aux actes de dialogue
Dans cette section nous nous intéressons aux travaux qui ont été produits autour de la théorie des actes de discours d’Austin et Searle, et qui ont mené au développement du concept d’acte de dialogue tel qu’il est utilisé dans la littérature contemporaine.
Analyse des conversations fonctionnelles
Jusque dans les années 1990, la théorie des actes de discours s’est largement limitée à l’examen d’énoncés isolés, et n’a pas cherché à prendre en charge l’analyse de conversations entières où plusieurs participants peuvent interagir (Vanderveken, 1992). Cependant, les locuteurs accomplissent des actes illocutoires tout au long des conversations qu’ils peuvent avoir avec d’autres participants. Vanderveken souligne que ces derniers répondent et accomplissent à leur tour leurs propres actes de discours, tout en cherchant collectivement à atteindre des objectifs communs. Une application sociale du langage est donc constituée, en général, de séquences ordonnées d’énoncés par différents locuteurs qui cherchent ensemble à poursuivre un même but, comme décider d’une marche à suivre, résoudre un problème, accomplir une action, etc.
Dans le cas de ces deux derniers exemples, on parlerait de « conversation fonctionnelle », i.e. d’une conversation construite autour d’une tâche, c’est-à-dire consacrée à la transmission d’information dans le but de réaliser un objectif individuel ou collectif dans le monde réel. C’est à ce type de conversations, qui inclue notamment les conversations porteuses de demandes d’assistance, que s’intéressent la plupart des travaux cherchant à étendre la théorie des actes de discours aux interactions multipartites. Cela s’explique par le fait que les applications informatiques de l’analyse du dialogue sont presque toujours motivées par le besoin de faciliter ou d’automatiser l’exécution d’une tâche par un utilisateur humain.
Théorie des actes de la conversation
Dans cette perspective d’extension de la théorie des actes de discours, Traum et Hinkelman (1992) décrivent une théorie des actes de la conversation (Conversation Act Theory), qui se veut plus générale. Ils étudient le corpus TRAINS (Gross et al., 1993) , tiré du projet éponyme, dont l’objectif est de développer un assistant de planification intelligent qui puisse communiquer en langage naturel avec des opérateurs humains. Le corpus est constitué de dialogues fonctionnels entre un manager devant résoudre des problèmes de planification et une personne jouant le rôle du système, disposant d’informations additionnelles sur la tâche, et chargé d’assister le manager.
Traum et Hinkelman constatent que l’un des traits les plus flagrants des dialogues fonctionnels est la prépondérance des signes d’accord et d’acquittement (e.g. « There are oranges at Corning, right ? » « Right. »). C’est l’un des éléments qui les poussent à remettre en question certains postulats généralement implicites dans les travaux antérieurs. Le premier de ces postulats voudrait que les énoncés soient toujours entendus et correctement compris par les allocutaires, d’une part, et que les participants ne s’attendent jamais à ce que ce ne soit pas le cas, d’autre part. Mais non seulement les énoncés sont souvent mal compris ou mal perçus, mais en plus Traum et Hinkelman avancent que les conversations sont structurées de manière à prendre en compte ce phénomène : les participants cherchent systématiquement à obtenir des preuves que leur interlocuteur a bien compris ce qu’il voulaient dire. Ces preuves peuvent prendre la forme d’un acquittement explicite (e.g. « Right. »), d’un acquittement implicite via une réaction pertinente (par exemple en répondant à la question posée), ou encore par des signaux non-verbaux (hochement de tête, etc.). Cette quasi-nécessité de l’acquittement les pousse également à remettre en cause l’idée selon laquelle les actes de discours sont des actions réalisées uniquement par le locuteur, et que l’allocutaire n’a qu’une fonction passive face à eux. Les actes de discours ne peuvent être analysés que dans le contexte d’un dialogue multi-agent. Enfin, le troisième postulat que Traum et Hinkelman remettent en cause suite à cette observation, c’est que chaque énoncé n’est porteur que d’un seul acte de discours. En effet, si certains énoncés peuvent non seulement réaliser leur fonction communicative affichée et en plus servent à acquitter un autre énoncé, c’est qu’ils peuvent réaliser deux actes simultanément.
La taxonomie des actes de la conversation qu’ils proposent prend en compte ces trois observations. Elle détaille une catégorisation de ces actes en quatre classes : les actes de prise de parole (turn-taking acts), les actes de synchronisation (grounding acts), les actes de discours fondamentaux (core speech acts), et les actes argumentatifs (argumentation acts). En terme d’unité textuelle, les actes de prise de parole se situent à un niveau inférieur à l’énoncé, les actes de synchronisation au niveau de l’énoncé, tandis que les actes de discours fondamentaux (informer, promettre et requérir) se trouvent au niveau de ce qu’ils appellent une « unité de discours ». Cette unité peut contenir un énoncé introductif suivi d’autant d’énoncés de synchronisation que nécessaire pour assurer une bonne communication (e.g. « Because there are oranges in Vermont. Right ? You agree ?»). Enfin, les actes argumentatifs se situent à un niveau encore supérieur puisqu’ils peuvent contenir un nombre illimité d’unités de discours dont les actes fondamentaux sont utilisés pour former des composés complexes (par exemple le descriptif d’un système, l’exposé d’un problème etc.).
Contexte et connaissances communes
Poesio et Traum (1997) s’accordent à dire que les conversations, même fonctionnelles, ont des aspects nettement séparés de la réalisation de la tâche qui en est l’objet, et que l’exercice du langage est une action coordonnée, ce qui impose le développement d’une théorie du contexte. Les théories développées à ce sujet se déclinent en deux traditions : d’une part, les approches linguistiques construites autour notamment de la résolution d’anaphores, et d’autre part les modèles computationnels proposés pour représenter les effets des actes de discours sur les participants d’une conversation, par exemple en termes de croyances, d’obligations et de besoins. C’est cette deuxième approche qui nous intéresse, puisque la première n’a que peu de rapport avec les exercices de planification et de coordination de l’information qui sont propres aux conversations fonctionnelles, et a fortiori aux conversations orientées vers la résolution de problèmes. Si la résolution d’anaphores peut évidemment présenter un intérêt pour suivre le fil des conversations, ce problème purement linguistique doit être traité séparement de la question de la synchronisation inter-participants.
Quand Poesio et Traum parlent de contexte, ils font référence à l’information que les participants doivent utiliser pour interpréter les énoncés d’une conversation. Ce contexte est caractérisé notamment par la notion, centrale, de connaissances communes, ou « terrain d’entente » (common ground) entre les participants. Cette information est cruciale pour pouvoir comprendre à quoi un énoncé fait référence, puisque c’est le contexte qui contient tous les référents disponibles, les référents étant ajoutés aux connaissances communes au travers des nouveaux actes de discours qui sont accomplis. Bien modéliser ces connaissances nécessite donc de bien modéliser les mises à jour du contexte. C’est là que se situe la nuance entre un acte de discours et un acte de dialogue : si l’acte de discours cherche bien à capturer l’intention communicative du locuteur, l’acte de dialogue inscrit cette intention dans un contexte particulier et capture également l’impact que l’énoncé a sur la conversation.
Schémas d’annotation
Dans cette section, nous présentons trois schémas d’annotations utilisés pour la modélisation des conversations en termes d’actes de dialogue : DAMSL, DIT++ et le standard ISO 24617-2. Nous détaillons leurs fondamentaux conceptuels ainsi que leurs taxonomies.
Concepts pratiques et théoriques
Nous décrivons ici les partis pris et postulats conceptuels qui sont partagés par les schémas d’annotations que nous allons présenter.
Mise à jour du contexte :
DIT++, DAMSL et le standard ISO partent du principe que les applications nécessitant une analyse automatique du dialogue doivent prendre en compte les modifications dynamiques du « terrain d’entente », et pour ce faire proposent d’annoter les fonctions communicatives des actes de dialogue. Pour Core et Allen (1997), ces fonctions doivent représenter des manipulations directes du contexte informationnel d’une conversation. La première caractéristique de ces taxonomies est donc qu’elles définissent les actes de dialogue comme des opérations de mise à jour du contexte.
Multi-dimensionnalité :
Comme nous l’avons vu, la communication est une activité complexe. Les participants d’une conversation cherchent souvent à accomplir une tâche particulière au travers du dialogue, tout en contrôlant le processus de conversation, mais également en veillant à respecter les conventions sociales et à structurer thématiquement et discursivement la conversation. Puisque les participants accomplissent ces activités variées plus ou moins en même temps, ce n’est pas surprenant que les énoncés soient souvent multi-fonctionnels, et servent plusieurs objectifs à la fois. Par exemple, un énoncé peut répondre à une question, fournir un retour à propos de la compréhension de la question, et passer le tour à l’allocutaire.
Pour répondre à cette problématique, un aspect important des schémas d’annotations que nous allons détailler est leur multi-dimensionnalité. En effet, une des limites de la théorie des actes de discours d’Austin et Searle, qui a été souvent soulignée par les chercheurs, est son incapacité à prendre en compte la pluralité des intentions qu’un locuteur peut chercher à exprimer dans un seul énoncé. Comme préconisé par Traum et Hinkelman (1992), les taxonomies proposées par Core et Allen et Bunt prennent en compte ce problème et autorisent l’application de plusieurs labels à un seul énoncé. On parle alors de dimensions ou de couches (layers), chacune permettant d’annoter un aspect différent de l’énoncé.
Généricité :
L’annotation des conversations en termes d’actes de dialogue peut suivre deux approches. La première, ontologique, consiste à proposer une taxonomie spécifique au domaine ou à la tâche étudiée. La seconde, plus ambitieuse, cherche à atteindre une couverture plus générique du dialogue (Leech et Weisser, 2003). C’est le cas de deux schémas d’annotation largement utilisés : DAMSL et DIT++, ainsi que du standard ISO 24617-2, largement basé sur DIT++.
Leur caractère générique est un de leurs attributs les plus importants, et probablement celui qui a le plus contribué à leur popularité. Les annotations proposées sont toutes de suffisamment haut niveau pour pouvoir être appliquées à différents types de dialogues.
|
Table des matières
1 Introduction
1.1 Contexte général
1.2 Objectifs de recherche
1.3 Projet ODISAE
1.4 Plan de la thèse
2 Actes de dialogue
2.1 Introduction
2.2 Les actes de discours
2.3 Des actes de discours aux actes de dialogue
2.3.1 Analyse des conversations fonctionnelles
2.3.2 Théorie des actes de la conversation
2.3.3 Contexte et connaissances communes
2.4 Schémas d’annotation
2.4.1 Concepts pratiques et théoriques
2.4.2 DAMSL
2.4.3 DIT++
2.4.4 ISO 24617-2
2.5 Conclusion
3 Communication médiée par les réseaux
3.1 Introduction
3.1.1 Les réseaux : un handicap à la communication ?
3.1.2 Communication orale, communication écrite
3.1.3 Modalités synchrones et asynchrones
3.2 Spécificités des modalités étudiées
3.2.1 Courriels
3.2.2 Forums
3.2.3 Chats
3.3 ISO 24617-2 : étude d’applicabilité
3.3.1 Cadre de l’étude
3.3.2 Dialogues et polylogues
3.3.3 Contraintes techniques
3.3.4 Asynchronicité et pseudo-synchronicité
3.3.5 Conversations multi-canaux
3.4 Conclusion
4 Interopérabilité taxonomique : enjeux et proposition
4.1 Introduction
4.2 Standardisation vs Interopérabilité
4.2.1 Le standard ISO
4.2.2 Interopérabilité entre taxonomies
4.3 Méta-modélisation
4.3.1 Intuitions
4.3.2 Caractéristiques méta-modélisables d’une taxonomie
4.3.3 Le méta-modèle
4.3.4 Formalisation des traits
4.3.5 Intérêts
4.3.6 Extraction des traits primitifs
4.4 Cadre expérimental
4.4.1 Corpus et taxonomies
4.4.2 Méta-modèle expérimental
4.5 Expériences
4.5.1 Conversion d’annotations
4.5.2 Classification inter-taxonomique
4.5.3 Méthode
4.5.4 Résultats
4.6 Autres usages
4.7 Conclusion
5 Corpus Ubuntu
5.1 Introduction
5.2 Travaux et ressources similaires
5.3 Construction du corpus
5.3.1 Modélisation des conversations écrites en ligne
5.3.2 Méthode de collecte
5.3.3 Pré-traitement des données
5.3.4 Statistiques sur le corpus
5.4 Annotation d’une partie du corpus en termes d’actes de dialogue et d’informations Opinion-Sentiment-Émotion
5.4.1 Taxonomie employée
5.4.2 Annotation et accord inter-annotateurs
5.4.3 Annotations et statistiques
5.5 Conclusion
6 Reconnaissance automatique des actes de dialogue
6.1 Introduction
6.2 Travaux similaires
6.3 Méthode
6.3.1 Approche et implémentation
6.3.2 Traits
6.4 Expériences et discussion
6.4.1 Comparaison d’un classifieur SVM à l’approche de base
6.4.2 Comparaison d’approches et de jeux de traits sur différentes modalités
6.5 Comparaison de classifieurs trans-modalités
6.6 Conclusion
7 Conclusion générale
Télécharger le rapport complet