Les étapes du processus de la fouille de données
Les types de données temporelles
Conceptuellement, les données temporelles peuvent être classifiées en deux types différents: les séquences et les séries temporelles [38].
Les séquences
Une séquence peut être définie comme un ensemble ordonné d’événements souvent représentée par une série de symboles nominaux [14]. Dans le contexte de l’habitat intelligent qui nous concerne, la matinée de la personne observée peut être vue comme une séquence d’activité. Une séquence qui peut ressembler à celle schématisée dans la Figure 2.2.
La seule information temporelle qu’on peut ressortir de ce type de séquence, les séquences ordonnées, est que les événements sont ordonnés dans le temps et se produisent séquentiellement. Par exemple, l’événement 2 se produit après l’événement 1, etc. Pour certaines applications, nous aurons besoin d’informations temporelles encore plus précises. Pour cette raison, nous pouvons décider d’ajouter le temps réel où l’événement s’est produit. De cette façon, à la place d’une séquence ordonnée, nous allons avoir une séquence horodatée qui peut être schématisée dans la figure 2.3.
Les séries temporelles
Une série temporelle est une séquence de valeurs continues d’éléments [14]. Pour comprendre ce type de données temporelles, il suffit de penser à un capteur qui envoie en continu des mesures de températures, de pression ou la position d’une tasse, etc. Par conséquent, ce que nous enregistrons dans la base de données, ce sont des mesures prises par le capteur ainsi que le temps réel où les mesures étaient faites. La Figure 2.4 montre un cas typique d’une série temporelle.C’est ce type de données, les séries temporelles, qui agrandi d’une façon spectaculaire les bases de données et rend les techniques d’extraction de connaissance impraticables. Pour remédier à ce problème, la fouille de données temporelles effectue une transformation pour mieux présenter ces types de données. Une étape qui sera expliquée dans la prochaine section.
La fouille de données temporelles
La fouille de données temporelles est un domaine relativement nouveau. Il est devenu plus populaire dans la dernière décennie en raison de la capacité accrue des systèmes informatiques modernes qui sont devenus capable de stocker et de traiter de grandes quantités de données de plus en plus complexes. Il n’est pas inhabituel de voir des équipements modernes générer des mégaoctets de données temporelles pendant leur surveillance constante des différents paramètres. Même une simple puce d’un capteur peut produire une quantité énorme d’informations temporelles, ce qui rend son analyse très difficile sans l’utilisation des techniques de la fouille de données temporelle.La fouille de données temporelles peut donc être définie exactement comme la fouille de donnée avec la particularité de bien traiter les données temporelles. Les étapes qui la composent sont aussi les mêmes sauf l’étape de transformation qui est un peu plus poussée pour pouvoir gérer la complication des données temporelles. Cette étape sera décrite dans la prochaine section, alors que la section d’après sera réservée à la présentation des tâches de la fouille de données temporelles.
L’étape de transformation dans le processus de FDT
L’étape de transformation dans le processus de la fouille de données temporelles a pour objectif de réduire la complexité des données originales et de les présenter sous un format plus adéquat à l’analyse. En tout, il existe six techniques de transformation dont quatre sont spécifiques aux séries temporelles :
• Pas de transformation
• Série temporelle divisée
• Point dans un espace de dimension N
• Langage
Tandis que les deux autres s’alignent pour les deux types [38] :
• Séquence
• Modèle
|
Table des matières
Résumé
Remerciements
Table des matières
Liste des Figures
Liste des Tableaux
Liste des Algorithmes
Introduction
1.1. Contexte
1.2. Problématique générale
1.3. La maladie d’Alzheimer
1.4. La fouille de données temporelles
1.5. Les travaux existants sur la reconnaissance d’activités
1.5.1. Les approches classiques
1.5.2. Les approches récentes
1.6. Contribution
1.7. Objectifs et méthodologie de la recherché
1.8. Organisation de ce mémoire
Chapter 2 La fouille de données temporelles
2.1. Introduction
2.2. La fouille de données
2.2.1. Les origines de la fouille de données
2.2.2. Définition de la fouille de données
2.2.3. Les étapes du processus de la fouille de données
2.3. Les types de données temporelles
2.3.1. Les séquences
2.3.2. Les séries temporelles
2.4. La fouille de données temporelles
2.4.1. L’étape de transformation dans le processus de FDT
2.5. Les opérations de la fouille de données temporelles
2.5.1. La classification
2.5.2. La segmentation
2.5.3. La découverte de règles d’association
2.6. Conclusion
Chapter 3 Les principaux travaux sur la reconnaissance d’activités utilisant la FDT
3.1. Introduction
3.2. La reconnaissance d’activité
3.2.1. Les activités de la vie quotidienne (AVQ)
3.2.2. Les types de reconnaissance d’activité
3.3. Les principales approches utilisant la fouille de données temporelles
3.3.1. La reconnaissance d’activité basée sur la vision
3.3.2. La reconnaissance d’activité basée sur les senseurs
3.3.2.2.1 Approche de Jakkula et Cook
3.3.2.2.2 Évaluation de l’approche
3.4. Conclusion
Chapter 4 Une approche de reconnaissance d’activité utilisant la FDT
4.1. Introduction
4.2. LeUARA
4.3. La création des plans d’activités
4.3.1. Introduction
4.3.2. Application de l’algorithme BIDE pour la découverte des plans d’activités
4.3.3. Validation de la découverte des plans d’activités
4.4. La segmentation temporelle
4.4.1. La création des intervalles temporels
4.4.2. Validation de la segmentation temporelle
4.5. La recherche d’activité
4.5.1. Le système de recherche d’activité
4.5.2. Validation du système de recherche d’activité
4.6. Conclusion
Chapter 5 Conclusion générale
5.1. Réalisation des objectifs fixés
5.2. Apport de ce mémoire
5.3. Limitations et développements futurs
5.4. Bilan personnel sur ce travail de recherche
Télécharger le rapport complet