Des actes de discours aux actes de dialogue
Dans cette section nous nous intรฉressons aux travaux qui ont รฉtรฉ produits autour de la thรฉorie des actes de discours dโAustin et Searle, et qui ont menรฉ au dรฉveloppement du concept dโacte de dialogue tel quโil est utilisรฉ dans la littรฉrature contemporaine.
Analyse des conversations fonctionnelles
Jusque dans les annรฉes 1990, la thรฉorie des actes de discours sโest largement limitรฉe ร lโexamen dโรฉnoncรฉs isolรฉs, et nโa pas cherchรฉ ร prendre en charge lโanalyse de conversations entiรจres oรน plusieurs participants peuvent interagir (Vanderveken, 1992). Cependant, les locuteurs accomplissent des actes illocutoires tout au long des conversations quโils peuvent avoir avec dโautres participants. Vanderveken souligne que ces derniers rรฉpondent et accomplissent ร leur tour leurs propres actes de discours, tout en cherchant collectivement ร atteindre des objectifs communs. Une application sociale du langage est donc constituรฉe, en gรฉnรฉral, de sรฉquences ordonnรฉes dโรฉnoncรฉs par diffรฉrents locuteurs qui cherchent ensemble ร poursuivre un mรชme but, comme dรฉcider dโune marche ร suivre, rรฉsoudre un problรจme, accomplir une action, etc.
Dans le cas de ces deux derniers exemples, on parlerait de ยซ conversation fonctionnelle ยป, i.e. dโune conversation construite autour dโune tรขche, cโest-ร -dire consacrรฉe ร la transmission dโinformation dans le but de rรฉaliser un objectif individuel ou collectif dans le monde rรฉel. Cโest ร ce type de conversations, qui inclue notamment les conversations porteuses de demandes dโassistance, que sโintรฉressent la plupart des travaux cherchant ร รฉtendre la thรฉorie des actes de discours aux interactions multipartites. Cela sโexplique par le fait que les applications informatiques de lโanalyse du dialogue sont presque toujours motivรฉes par le besoin de faciliter ou dโautomatiser lโexรฉcution dโune tรขche par un utilisateur humain.
Thรฉorie des actes de la conversation
Dans cette perspective dโextension de la thรฉorie des actes de discours, Traum et Hinkelman (1992) dรฉcrivent une thรฉorie des actes de la conversation (Conversation Act Theory), qui se veut plus gรฉnรฉrale. Ils รฉtudient le corpus TRAINS (Gross et al., 1993) , tirรฉ du projet รฉponyme, dont lโobjectif est de dรฉvelopper un assistant de planification intelligent qui puisse communiquer en langage naturel avec des opรฉrateurs humains. Le corpus est constituรฉ de dialogues fonctionnels entre un manager devant rรฉsoudre des problรจmes de planification et une personne jouant le rรดle du systรจme, disposant dโinformations additionnelles sur la tรขche, et chargรฉ dโassister le manager.
Traum et Hinkelman constatent que lโun des traits les plus flagrants des dialogues fonctionnels est la prรฉpondรฉrance des signes dโaccord et dโacquittement (e.g. ยซ There are oranges at Corning, right ? ยป ยซ Right. ยป). Cโest lโun des รฉlรฉments qui les poussent ร remettre en question certains postulats gรฉnรฉralement implicites dans les travaux antรฉrieurs. Le premier de ces postulats voudrait que les รฉnoncรฉs soient toujours entendus et correctement compris par les allocutaires, dโune part, et que les participants ne sโattendent jamais ร ce que ce ne soit pas le cas, dโautre part. Mais non seulement les รฉnoncรฉs sont souvent mal compris ou mal perรงus, mais en plus Traum et Hinkelman avancent que les conversations sont structurรฉes de maniรจre ร prendre en compte ce phรฉnomรจne : les participants cherchent systรฉmatiquement ร obtenir des preuves que leur interlocuteur a bien compris ce quโil voulaient dire. Ces preuves peuvent prendre la forme dโun acquittement explicite (e.g. ยซ Right. ยป), dโun acquittement implicite via une rรฉaction pertinente (par exemple en rรฉpondant ร la question posรฉe), ou encore par des signaux non-verbaux (hochement de tรชte, etc.). Cette quasi-nรฉcessitรฉ de lโacquittement les pousse รฉgalement ร remettre en cause lโidรฉe selon laquelle les actes de discours sont des actions rรฉalisรฉes uniquement par le locuteur, et que lโallocutaire nโa quโune fonction passive face ร eux. Les actes de discours ne peuvent รชtre analysรฉs que dans le contexte dโun dialogue multi-agent. Enfin, le troisiรจme postulat que Traum et Hinkelman remettent en cause suite ร cette observation, cโest que chaque รฉnoncรฉ nโest porteur que dโun seul acte de discours. En effet, si certains รฉnoncรฉs peuvent non seulement rรฉaliser leur fonction communicative affichรฉe et en plus servent ร acquitter un autre รฉnoncรฉ, cโest quโils peuvent rรฉaliser deux actes simultanรฉment.
La taxonomie des actes de la conversation quโils proposent prend en compte ces trois observations. Elle dรฉtaille une catรฉgorisation de ces actes en quatre classes : les actes de prise de parole (turn-taking acts), les actes de synchronisation (grounding acts), les actes de discours fondamentaux (core speech acts), et les actes argumentatifs (argumentation acts). En terme dโunitรฉ textuelle, les actes de prise de parole se situent ร un niveau infรฉrieur ร lโรฉnoncรฉ, les actes de synchronisation au niveau de lโรฉnoncรฉ, tandis que les actes de discours fondamentaux (informer, promettre et requรฉrir) se trouvent au niveau de ce quโils appellent une ยซ unitรฉ de discours ยป. Cette unitรฉ peut contenir un รฉnoncรฉ introductif suivi dโautant dโรฉnoncรฉs de synchronisation que nรฉcessaire pour assurer une bonne communication (e.g. ยซ Because there are oranges in Vermont. Right ? You agree ?ยป). Enfin, les actes argumentatifs se situent ร un niveau encore supรฉrieur puisquโils peuvent contenir un nombre illimitรฉ dโunitรฉs de discours dont les actes fondamentaux sont utilisรฉs pour former des composรฉs complexes (par exemple le descriptif dโun systรจme, lโexposรฉ dโun problรจme etc.).
Contexte et connaissances communes
Poesio et Traum (1997) sโaccordent ร dire que les conversations, mรชme fonctionnelles, ont des aspects nettement sรฉparรฉs de la rรฉalisation de la tรขche qui en est lโobjet, et que lโexercice du langage est une action coordonnรฉe, ce qui impose le dรฉveloppement dโune thรฉorie du contexte. Les thรฉories dรฉveloppรฉes ร ce sujet se dรฉclinent en deux traditions : dโune part, les approches linguistiques construites autour notamment de la rรฉsolution dโanaphores, et dโautre part les modรจles computationnels proposรฉs pour reprรฉsenter les effets des actes de discours sur les participants dโune conversation, par exemple en termes de croyances, dโobligations et de besoins. Cโest cette deuxiรจme approche qui nous intรฉresse, puisque la premiรจre nโa que peu de rapport avec les exercices de planification et de coordination de lโinformation qui sont propres aux conversations fonctionnelles, et a fortiori aux conversations orientรฉes vers la rรฉsolution de problรจmes. Si la rรฉsolution dโanaphores peut รฉvidemment prรฉsenter un intรฉrรชt pour suivre le fil des conversations, ce problรจme purement linguistique doit รชtre traitรฉ sรฉparement de la question de la synchronisation inter-participants.
Quand Poesio et Traum parlent de contexte, ils font rรฉfรฉrence ร lโinformation que les participants doivent utiliser pour interprรฉter les รฉnoncรฉs dโune conversation. Ce contexte est caractรฉrisรฉ notamment par la notion, centrale, de connaissances communes, ou ยซ terrain dโentente ยป (common ground) entre les participants. Cette information est cruciale pour pouvoir comprendre ร quoi un รฉnoncรฉ fait rรฉfรฉrence, puisque cโest le contexte qui contient tous les rรฉfรฉrents disponibles, les rรฉfรฉrents รฉtant ajoutรฉs aux connaissances communes au travers des nouveaux actes de discours qui sont accomplis. Bien modรฉliser ces connaissances nรฉcessite donc de bien modรฉliser les mises ร jour du contexte. Cโest lร que se situe la nuance entre un acte de discours et un acte de dialogue : si lโacte de discours cherche bien ร capturer lโintention communicative du locuteur, lโacte de dialogue inscrit cette intention dans un contexte particulier et capture รฉgalement lโimpact que lโรฉnoncรฉ a sur la conversation.
Schรฉmas dโannotation
Dans cette section, nous prรฉsentons trois schรฉmas dโannotations utilisรฉs pour la modรฉlisation des conversations en termes dโactes de dialogue : DAMSL, DIT++ et le standard ISO 24617-2. Nous dรฉtaillons leurs fondamentaux conceptuels ainsi que leurs taxonomies.
Concepts pratiques et thรฉoriques
Nous dรฉcrivons ici les partis pris et postulats conceptuels qui sont partagรฉs par les schรฉmas dโannotations que nous allons prรฉsenter.
Mise ร jour du contexte :ย
DIT++, DAMSL et le standard ISO partent du principe que les applications nรฉcessitant une analyse automatique du dialogue doivent prendre en compte les modifications dynamiques du ยซ terrain dโentente ยป, et pour ce faire proposent dโannoter les fonctions communicatives des actes de dialogue. Pour Core et Allen (1997), ces fonctions doivent reprรฉsenter des manipulations directes du contexte informationnel dโune conversation. La premiรจre caractรฉristique de ces taxonomies est donc quโelles dรฉfinissent les actes de dialogue comme des opรฉrations de mise ร jour du contexte.
Multi-dimensionnalitรฉ :
Comme nous lโavons vu, la communication est une activitรฉ complexe. Les participants dโune conversation cherchent souvent ร accomplir une tรขche particuliรจre au travers du dialogue, tout en contrรดlant le processus de conversation, mais รฉgalement en veillant ร respecter les conventions sociales et ร structurer thรฉmatiquement et discursivement la conversation. Puisque les participants accomplissent ces activitรฉs variรฉes plus ou moins en mรชme temps, ce nโest pas surprenant que les รฉnoncรฉs soient souvent multi-fonctionnels, et servent plusieurs objectifs ร la fois. Par exemple, un รฉnoncรฉ peut rรฉpondre ร une question, fournir un retour ร propos de la comprรฉhension de la question, et passer le tour ร lโallocutaire.
Pour rรฉpondre ร cette problรฉmatique, un aspect important des schรฉmas dโannotations que nous allons dรฉtailler est leur multi-dimensionnalitรฉ. En effet, une des limites de la thรฉorie des actes de discours dโAustin et Searle, qui a รฉtรฉ souvent soulignรฉe par les chercheurs, est son incapacitรฉ ร prendre en compte la pluralitรฉ des intentions quโun locuteur peut chercher ร exprimer dans un seul รฉnoncรฉ. Comme prรฉconisรฉ par Traum et Hinkelman (1992), les taxonomies proposรฉes par Core et Allen et Bunt prennent en compte ce problรจme et autorisent lโapplication de plusieurs labels ร un seul รฉnoncรฉ. On parle alors de dimensions ou de couches (layers), chacune permettant dโannoter un aspect diffรฉrent de lโรฉnoncรฉ.
Gรฉnรฉricitรฉ :
Lโannotation des conversations en termes dโactes de dialogue peut suivre deux approches. La premiรจre, ontologique, consiste ร proposer une taxonomie spรฉcifique au domaine ou ร la tรขche รฉtudiรฉe. La seconde, plus ambitieuse, cherche ร atteindre une couverture plus gรฉnรฉrique du dialogue (Leech et Weisser, 2003). Cโest le cas de deux schรฉmas dโannotation largement utilisรฉs : DAMSL et DIT++, ainsi que du standard ISO 24617-2, largement basรฉ sur DIT++.
Leur caractรจre gรฉnรฉrique est un de leurs attributs les plus importants, et probablement celui qui a le plus contribuรฉ ร leur popularitรฉ. Les annotations proposรฉes sont toutes de suffisamment haut niveau pour pouvoir รชtre appliquรฉes ร diffรฉrents types de dialogues.
|
Table des matiรจres
1 Introduction
1.1 Contexte gรฉnรฉral
1.2 Objectifs de recherche
1.3 Projet ODISAE
1.4 Plan de la thรจse
2 Actes de dialogue
2.1 Introduction
2.2 Les actes de discours
2.3 Des actes de discours aux actes de dialogue
2.3.1 Analyse des conversations fonctionnelles
2.3.2 Thรฉorie des actes de la conversation
2.3.3 Contexte et connaissances communes
2.4 Schรฉmas dโannotation
2.4.1 Concepts pratiques et thรฉoriques
2.4.2 DAMSL
2.4.3 DIT++
2.4.4 ISO 24617-2
2.5 Conclusion
3 Communication mรฉdiรฉe par les rรฉseaux
3.1 Introduction
3.1.1 Les rรฉseaux : un handicap ร la communication ?
3.1.2 Communication orale, communication รฉcrite
3.1.3 Modalitรฉs synchrones et asynchrones
3.2 Spรฉcificitรฉs des modalitรฉs รฉtudiรฉes
3.2.1 Courriels
3.2.2 Forums
3.2.3 Chats
3.3 ISO 24617-2 : รฉtude dโapplicabilitรฉ
3.3.1 Cadre de lโรฉtude
3.3.2 Dialogues et polylogues
3.3.3 Contraintes techniques
3.3.4 Asynchronicitรฉ et pseudo-synchronicitรฉ
3.3.5 Conversations multi-canaux
3.4 Conclusion
4 Interopรฉrabilitรฉ taxonomique : enjeux et proposition
4.1 Introduction
4.2 Standardisation vs Interopรฉrabilitรฉ
4.2.1 Le standard ISO
4.2.2 Interopรฉrabilitรฉ entre taxonomies
4.3 Mรฉta-modรฉlisation
4.3.1 Intuitions
4.3.2 Caractรฉristiques mรฉta-modรฉlisables dโune taxonomie
4.3.3 Le mรฉta-modรจle
4.3.4 Formalisation des traits
4.3.5 Intรฉrรชts
4.3.6 Extraction des traits primitifs
4.4 Cadre expรฉrimental
4.4.1 Corpus et taxonomies
4.4.2 Mรฉta-modรจle expรฉrimental
4.5 Expรฉriences
4.5.1 Conversion dโannotations
4.5.2 Classification inter-taxonomique
4.5.3 Mรฉthode
4.5.4 Rรฉsultats
4.6 Autres usages
4.7 Conclusion
5 Corpus Ubuntu
5.1 Introduction
5.2 Travaux et ressources similaires
5.3 Construction du corpus
5.3.1 Modรฉlisation des conversations รฉcrites en ligne
5.3.2 Mรฉthode de collecte
5.3.3 Prรฉ-traitement des donnรฉes
5.3.4 Statistiques sur le corpus
5.4 Annotation dโune partie du corpus en termes dโactes de dialogue et dโinformations Opinion-Sentiment-รmotion
5.4.1 Taxonomie employรฉe
5.4.2 Annotation et accord inter-annotateurs
5.4.3 Annotations et statistiques
5.5 Conclusion
6 Reconnaissance automatique des actes de dialogue
6.1 Introduction
6.2 Travaux similaires
6.3 Mรฉthode
6.3.1 Approche et implรฉmentation
6.3.2 Traits
6.4 Expรฉriences et discussion
6.4.1 Comparaison dโun classifieur SVM ร lโapproche de base
6.4.2 Comparaison dโapproches et de jeux de traits sur diffรฉrentes modalitรฉs
6.5 Comparaison de classifieurs trans-modalitรฉs
6.6 Conclusion
7 Conclusion gรฉnรฉrale
Tรฉlรฉcharger le rapport complet