Jeux sérieux et forage de données
Le forage de données est actuellement utilisé dans de nombreux domaines. Il combine les techniques de statistique, d’analyse de données et d’intelligence artificielle et offre ainsi un moyen puissant d’exploration et d’analyse de grande base de données afin d’en extraire de nouvelles connaissances. Nous présentons dans cette section la définition du forage de données, les étapes de son processus et la classification de ses techniques. Nous effectuons également un survol des études portant sur le forage de données des jeux vidéo et des JS.
Définition du forage de données (Data Mining)
Tufféry définit le Forage de données (ou fouille de données) comme étant : l’ensemble des méthodes et techniques destinées à l’exploration et l’analyse de (souvent grandes) bases de données informatiques, de façon automatique ou semiautomatique, en vue de détecter dans ces données des règles, des associations, des tendances inconnues ou cachées, des structures particulières restituant l’essentiel de l’information utile tout en réduisant la quantité de données. (Tufféry, 2010, p. 4)
Autrement dit, le forage de données est l’ensemble de techniques permettant la découverte et la description de patrons (pattern) dans un grand volume de données. Il aide à trouver des explications pour ces données et à faire des prédictions (Witten, 2011).
Étapes de forage de données
Le processus de forage de données se déroule en trois étapes principales (Ratté-1, 2013):
• Le prétraitement : Pendant cette étape, le travail se concentre sur la compréhension du domaine, la compréhension des données et leur préparation;
• La modélisation : Elle consiste à sélectionner les modèles appropriés et les tester sur les données. Par la suite, une évaluation des résultats est réalisée;
• Le post-traitement : C’est l’étape d’analyse des résultats et de leur visualisation.
Classification des techniques de forage de données
Les techniques de forage de données se répartissent en deux grandes classes (Tufféry, 2010) :
• Les techniques descriptives : Elles permettent de mettre en évidence les informations cachées dans les données. Nous retrouvons dans cette classe les méthodes de partitionnement, l’analyse en composantes principales, la recherche d’association, etc.;
• Les techniques prédictives : Elles permettent de faire l’extrapolation de nouvelles informations à partir des informations présentes. Parmi ces techniques, il y a les arbres de décision, la régression linéaire, l’analyse discriminante, les réseaux de neurones, etc.
Exemples d’études sur le forage de données des jeux sérieux
Les jeux vidéo et les JS font l’objet de plus en plus d’études en vue d’en faire de véritables outils d’aide à l’apprentissage, la stimulation cognitive, la réhabilitation et même au diagnostic. L’évaluation de l’efficacité et la pertinence de tels outils exigent l’analyse des résultats des différentes expériences (données du jeu, appréciation du joueur et son comportement). Cela constitue un volume important de données que les techniques de forage de données peuvent traiter efficacement. Dans cette section, nous décrivons quelques études qui ont utilisé le forage de données pour le traitement des données des jeux.
Afin d’évaluer la capacité prédictive d’un jeu vidéo (Supermarket Game) à détecter les cas de trouble du déficit de l’attention avec ou sans hyperactivité (TDAH), Santos et son équipe ont analysé les données du jeu (âge, sexe, score, durée et classification-TDAH) d’un groupe de 80 enfants (âgés de 10 à 17 ans) à l’aide de deux techniques de forage de données, à savoir : Naive Bayes et les arbres de décision. Les résultats obtenus ont permis de conclure que le jeu était capable de classer des enfants comme ayant le TDAH ou non, à travers les deux techniques employées avec de bonnes mesures de performance (spécificité, sensibilité autour de 0,7). Seulement, il n’était pas possible de préciser plus la classification avec les types du TDAH à cause du peu de cas dans le corpus d’apprentissage (Santos, 2011). De cette étude, nous retenons quatre éléments relatifs à notre approche : 1) le jeu vidéo comme outil d’aide à la prise de décision ou le diagnostic; 2) le forage des données du joueur (âge et sexe), son score et la durée du jeu et 3) la constitution du sous-ensemble d’attributs pour l’étude en sélectionnant les plus corrélés d’entre eux à la classification.
L’effet d’un jeu sérieux (Food Force) sur la motivation et l’apprentissage chez le joueur a été examiné dans l’étude de Derbali et Frasson. Dans le but de prédire l’état motivationnel du joueur, les chercheurs ont utilisé le modèle de régression linéaire multiple sur des mesures électrophysiologiques (électroencéphalographie EEG, conduction cutanée et fréquence cardiaque) ainsi que des évaluations prétest et post-test (questionnaires) sur la motivation et les connaissances apprises (Derbali, 2010). L’analyse des résultats a permis de : 1) déterminer les variables explicatives significatives (exemple : conduction cutanée) pour la motivation du joueur; et 2) de constater l’accroissement de la motivation (attention et confiance) et de l’apprentissage.
Également, Shim et al. ont construit des modèles afin de prédire la performance future du joueur dans un contexte de jeu vidéo en ligne massivement multijoueurs (Shim, 2011). En premier lieu, ils ont exploré les corrélations entre les données, ensuite ils ont appliqué le modèle de régression linéaire simple et multiple sur les données corrélées. Leurs résultats indiquaient que les modèles utilisant la performance passée et la diversité sociale (activités de mentorat entre apprenti joueur et mentor) comme variables explicatives donnent de meilleurs résultats, et la prévision des mentors est généralement meilleure que celle des apprentis.
Une autre approche effectuée par Anagnostou et son collègue consiste à proposer la modélisation des joueurs en se basant sur le regroupement de leurs données (sexe, joueur familier avec les jeux vidéo ou pas, durée, précision des tirs, armes utilisées, nombre d’ennemis détruits, résultat final, etc.) collectées durant un jeu vidéo d’action (Anagnostou, 2009). Ils ont défini deux types de joueurs : le joueur d’action et le joueur tactique et ils ont utilisé l’algorithme CURE (Clustering Using REpresentatives) pour déterminer les regroupements de joueurs et par la suite, ils les ont comparés avec la classification faite manuellement selon le style de jeu. Les résultats obtenus étaient satisfaisants. Ainsi, la connaissance du type du joueur pourrait être utilisée pour l’ajustement des niveaux de difficulté du jeu et offrir une meilleure expérience lors des sessions de jeu.
|
Table des matières
INTRODUCTION
CHAPITRE 1 JEUX SÉRIEUX
1.1 Introduction
1.2 Définition d’un jeu sérieux
1.3 Classification des jeux sérieux
1.4 Jeux sérieux dans le contexte de l’éducation
1.4.1 Les jeux sérieux éducatifs et l’intelligence artificielle
1.4.2 Les jeux sérieux éducatifs et la motivation des apprenants
1.4.3 Les jeux sérieux éducatifs et l’apprentissage collaboratif : Jeu 2.0
1.5 Jeux sérieux pour la stimulation cognitive
1.6 Adaptation des jeux sérieux
1.6.1 Définition de l’adaptation
1.6.2 Exemples d’études sur l’adaptation des jeux sérieux
1.7 Jeux sérieux et évaluation
1.8 Jeux sérieux et forage de données
1.8.1 Définition du forage de données (Data Mining)
1.8.2 Étapes de forage de données
1.8.3 Classification des techniques de forage de données
1.8.4 Exemples d’études sur le forage de données des jeux sérieux
1.9 Conclusion
CHAPITRE 2 MÉTHODES DE FORAGE DE DONNÉES : RÉGRESSION LINÉAIRE ET REGROUPEMENT
2.1 Introduction
2.2 Modèles de régression linéaire
2.2.1 Régression linéaire simple
2.2.2 Régression linéaire multiple
2.2.3 Indicateurs de qualité des modèles de régression linéaire
2.3 Regroupement (Clustering)
2.3.1 Regroupement : définition et méthodes
2.3.2 Méthode de partitionnement K-moyennes (Kmeans)
2.3.3 Indicateurs de qualité du regroupement
2.4 Conclusion
CHAPITRE 3 SCÉNARIOS D’ANALYSE
3.1 Introduction
3.2 Scénarios d’analyse
3.2.1 Scénario d’analyse basé sur le jeu
3.2.2 Scénario d’analyse basé sur le joueur
3.2.3 Choix du scénario d’analyse
3.3 Conclusion
CHAPITRE 4 EXPÉRIMENTATION
4.1 Introduction
4.2 Prétraitement
4.2.1 Description du jeu sérieux « Science en jeu »
4.2.2 Description de la base de données «Scienceenjeu»
4.2.3 Description des outils
4.2.4 Préparation des données
4.2.4.1 Transformation des données
4.2.4.2 Détection et élimination des valeurs aberrantes
4.2.4.3 Détection et élimination des valeurs extrêmes
4.3 Modélisation : modèle de régression linéaire multiple
4.3.1 Contexte de l’expérimentation
4.3.1.1 Choix de la méthode de régression et critères d’évaluation du modèle
4.3.1.2 Variables dépendantes et variables indépendantes
4.3.1.3 Échantillonnage
4.3.2 Corrélation entre les variables
4.3.3 Résultats de l’application du modèle de régression linéaire multiple
4.3.3.1 Résultats de la régression linéaire multiple pour le nombre de neurones
4.3.3.2 Résultats de la régression linéaire multiple pour le nombre de talents
4.3.3.3 Résultats de la régression linéaire multiple pour le nombre de cortex
4.3.3.4 Résultats de la régression linéaire multiple pour la durée totale des sessions
4.3.4 Analyse des résultats
4.3.5 Interprétation des résultats
4.4 Modélisation : Regroupement (Clustering)
4.4.1 Contexte de l’expérimentation
4.4.2 Résultats de l’application du regroupement avec K-moyennes
4.4.2.1 Résultats du regroupement pour le nombre de neurones
4.4.2.2 Résultats du regroupement pour le nombre de talents
4.4.2.3 Résultats du regroupement pour le nombre de cortex
4.4.2.4 Résultats du regroupement pour la durée totale des sessions
4.4.3 Analyse des résultats
4.4.4 Interprétation des résultats
4.5 Conclusion
CONCLUSION
Télécharger le rapport complet