Construction non supervisée d’un modèle expressif spécifique à la personne

L’analyse des émotions fait partie intégrante de notre vie quotidienne dans les interactions sociales. En effet, les émotions peuvent être vues comme les interfaces de notre organisme avec le monde extérieur. Le processus émotionnel consiste alors en une réponse de notre organisme à des stimuli extérieurs [1]. Analyser les émotions de notre interlocuteur lors d’une interaction nous permet donc de nous renseigner sur ses réactions et ses intentions. Pour ce faire, nous analysons diverses informations vecteurs de l’état émotionnel : la voix (intonation, contenu du message, …), l’expression faciale ou le mouvement du corps (pose de la tête, gestuelle, …). Parmi ces modalités, les expressions faciales ont fait l’objet d’un grand nombre d’études sur le plan psychologique, que ce soit sur leurs origines et leur signification ou sur l’interprétation que nous en faisons. Ces études montrent que les expressions faciales sont d’une importance cruciale lorsque nous cherchons à analyser l’état émotionnel de notre interlocuteur. Il a notamment été montré que 55% de l’impact d’une communication est dû au langage corporel et aux expressions faciales [2]. Les travaux d’Ekman ont mis en évidence l’existence de 6 émotions de base, chacune se manifestant par une expression faciale particulière, appelée « expression prototypique » [3]. Ces travaux ont cherché à montrer que ces expressions prototypiques sont reconnues universellement, i.e. indépendamment de l’origine culturelle.

Théorie de l’émotion 

Parmi les premiers travaux de recherche sur les émotions, l’ouvrage de Darwin intitulé The expression of the emotion in man and animals publié en 1872 [15] a eu un impact notable. Il y reprend sa théorie évolutionniste en considérant que l’humain a hérité son expressivité émotionnelle des systèmes comportementaux des autres espèces animales. Depuis lors, la recherche sur les émotions connaît un certain engouement.

Il n’existe pas de définition unique et arrêtée de l’émotion, cela reste une question ouverte pour les psychologues. Parmi les théories qui ont eu le plus d’influence, on peut citer Scherer et son modèle de processus par composantes (« Component Process Model ») [1]. Les émotions sont définies comme étant les interfaces de l’organisme avec le monde extérieur. Le processus émotionnel est alors vu comme une réponse à des stimuli extérieurs, se décomposant en 3 étapes : analyse des stimuli par l’organisme, mise en place d’actions aux niveaux physiologique et psychologique en réponse aux stimuli, et communication par l’organisme de l’état de l’individu à son environnement [1].

Modes de représentation des émotions

Plusieurs modes de représentation des émotions ont été proposés par les psychologues ces 50 dernières années. Nous présentons brièvement ici les trois modes de représentation les plus populaires : la représentation catégorielle, la représentation dimensionnelle et la représentation basée sur l’évaluation. Par la suite, la communauté de vision par ordinateur et de traitement du signal a utilisé certaines de ces représentations pour analyser automatiquement les émotions. Le lecteur peut se référer à [16] pour avoir une revue plus complète des différentes théories de l’émotion.

Représentation catégorielle 

La représentation catégorielle des émotions consiste à associer un mot de la vie courante à chaque émotion identifiable. Elle repose sur l’hypothèse de l’universalité des émotions [3, 17, 18] selon laquelle il existe un ensemble d’émotions de base qui sont communes à toutes les cultures. Chaque émotion de base est identifiée par une même expression faciale et est interprétée de la même manière quelle que soit la culture. Une méta-analyse a été menée sur les études de l’universalité des émotions [19]. Elle montre que le taux de reconnaissance des émotions, au sein d’un même groupe culturel et entre des groupes culturels différents, est meilleur que le hasard. Ceci étant dit, les auteurs ont mis en évidence un avantage pour la reconnaissance au sein d’un même groupe culturel, ce qui vient nuancer le propos sur l’universalité des émotions.

La catégorisation la plus populaire à ce jour résulte des travaux d’Ekman sur l’universalité des émotions [3]. Il a identifié 6 émotions de base [3, 20] : la colère, le dégoût, la peur, la joie, la tristesse et la surprise.  Le mépris a ensuite été ajouté à cette liste d’émotions de base universelles [21]. Par la suite sont apparues d’autres catégorisations incluant des émotions secondaires, c’est-à-dire résultant des interactions sociales. Par exemple, dans [23] une taxonomie est développée à partir d’une analyse linguistique des termes émotionnels de la langue anglaise. Elle résulte en une catégorisation de 412 émotions arrangées en 24 groupes, incluant par exemple l’ennui, l’intérêt ou la frustration. Malgré son aspect exhaustif, cette catégorisation est moins utilisée que les 6 émotions de base d’Ekman [3] pour l’analyse automatique des expressions faciales. Cela est notamment dû au fait que moins d’études ont porté sur l’universalité de ces émotions secondaires. De plus, il est plus complexe d’obtenir de bons taux de reconnaissance sur 412 classes ou 42 classes que sur 6 classes et l’acquisition d’une base de données avec autant d’émotions s’avère compliquée.

Représentation dimensionnelle 

Une autre approche très populaire parmi les psychologues est la représentation dimensionnelle. L’émotion est alors définie de manière continue selon plusieurs dimensions émotionnelles, aux antipodes de la représentation catégorielle. Dans [24], il est proposé de définir l’état émotionnel à partir de trois dimensions indépendantes et bipolaires que sont la valence (plaisir – mécontentement ou positif – négatif), l’arousal (degré d’activation physiologique, actif – passif) et le pouvoir (dominance – soumission). Des études ont suivi sur la représentation à deux dimensions en utilisant uniquement la valence et l’arousal [25, 26, 27]. Le but de cette représentation bidimensionnelle est de rendre compte des similarités et des différences des émotions ressenties .

Plus récemment, la représentation bidimensionnelle valence/arousal a été étendue à une représentation à 4 dimensions [28] : la valence, l’arousal, le pouvoir et l’imprévisibilité. D’autres combinaisons de dimensions ont été étudiées pour la représentation des émotions. Par exemple, la roue émotionnelle de Genève (« Geneva Emotion Wheel ») [30] repose sur un représentation bidimensionnelle valence-pouvoir .

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

Introduction
Contexte et motivations
Enoncé du problème
Organisation de la thèse
1 État de l’art
1.1 Théorie de l’émotion
1.2 Analyse des expressions faciales
2 Modèle expressif et reconnaissance d’expressions robuste à la pose
2.1 Modèle expressif spécifique à la personne
2.2 Reconnaissance d’expressions faciales robuste à la pose
3 Adaptation non supervisée du modèle expressif spécifique à la personne
3.1 Initialisation du modèle spécifique à la personne
3.2 Adaptation non supervisée du modèle spécifique à la personne de manière séquentielle
3.3 Adaptation non supervisée du modèle spécifique à la personne sur une fenêtre temporelle
4 Résultats de l’adaptation non supervisée
4.1 Protocole
4.2 Inititalisation du modèle spécifique à la personne
4.3 Résultats de l’adaptation séquentielle
4.4 Résultats de l’adaptation sur une fenêtre temporelle
Conclusion
Contributions
Résultats
Perspectives
Publications
A Recensement des bases de données d’expressions faciales
B Robustesse à la pose des caractéristiques angle-distance
B.1 Contexte et hypothèses
B.2 Démonstration
C Rectification de pose

Lire le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *