Modélisation avec les MMCs
Exemple de données temporelles
De nombreux phénomènes physiques sont représentés sous forme de séquences temporelles et elles apparaissent dans différents domaines. On peut trouver quelques bons exemples de séquences temporelles dans [Lendasse].
Les séquences financières, comme les indices boursiers : le Dow Jones, le Bel20, le CAC40, etc. Pour ces séquences la période d’échantillonnage peut être d’une journée ; dans ce cas les valeurs successive sont les valeurs des indices à l’ouverture ou à la fermeture des marchés. Cette période peut être également d’une heure ou de quelques minutes ; Les séquences environnementales : Par exemple, le débit d’une rivière. Les séquences industrielles Par exemple, la consommation électrique d’une entreprise, d’une région ou d’un pays. La période d’échantillonnage peut être dans ce cas de 15 minutes, d’une heure ou d’une journée.
L’intérêt des séries temporelles
L’intérêt d’étudier les séries temporelles réside dans une large gamme de systèmes qui sont concernés par ce type de données. Pour chacun de ces systèmes, les enjeux sous-jacents sont présentés [Lendasse] :
Les séries financières comme les indices boursiers. Elles influencent la vie de tous les jours : quand on fait le plein de carburant ou de manière plus dramatique quand les grandes multinationales licencient des milliers de travailleurs afin d’augmenter leur rentabilité.
L’étude des séries d’environnement est d’un intérêt primordial pour tout ceux qui vivent de l’agriculture ou pour tout ceux qui vivent près des cours d’eau.
L’étude des séries de consommation d’électricité permet non seulement aux producteurs et aux consommateurs de faire des économies, mais permet aussi de sauvegarder les ressources naturelles utilisées.
En astronomie, l’études des séries, comme le nombre de taches solaires est utile pour comprendre le fonctionnement du soleil, et permet également de mieux connaître les champs magnétiques qui en résultent et qui sont, par exemple, les causes du disfonctionnement dans les réseaux GSM.
ETC.
L’utilité de l’étude de ces séries temporelles est donc indéniable. Il s’agit de comprendre la série et son comportement pour enfin faire une prédiction ou une classification. Pour cela, il est nécessaire de ramener la série à un environnement formel adéquat afin de bien maitriser sa dimension temporelle et ainsi comprendre son comportement.
MMC clustering avec seuil
Le clustering à base des MMCs avec seuil [Rabiner, 89] tente d’améliorer la probabilité globale de données en améliorant la probabilité de séquences ayant une valeur faible. Cela se fait par l’identification des séquences dont la probabilité est faible sur les modèles actuels de la partition et de construire un modèle distinct pour tenir compte de ces séquences. L’algorithme commence par l’apprentissage d’un MMC basé sur l’ensemble des séquences d’observation. Ensuite, une valeur t comme un seuil de risque est déterminée de manière dynamique, et toutes les séquences ayant la probabilité séquence-à-modèle inférieure à t sont retirées de leur modèle actuel pour former un nouveau modèle λ. Après chaque extension de la partition, les paramètres de tous les modèles sont mis à jour avec les séquences d’observation en cours dans chaque cluster. La procédure est ensuite répétée sur tous les clusters dans la partition actuelle.
Aucun critère explicite est fourni pour mettre fin à la procédure de clustering. le problème avec cette méthode, et sur celles à base d’un seuil, en général, est que le choix de la valeur seuil est une question de conjecture, et la performance du système de classification pourrait être très sensible à ce paramètre.
MMC clustering par mesures d’information théorique
La méthode [Lee, 90], avec une procédure de fusionnement, tente de généraliser des modèles tréphone pour trouver le nombre optimal de classes. Elle débute par un modèle de N clusters, un pour chacun des N contextes tréphone, une procédure d’agglomération de clusters est employée pour former un dendrogramme des classes tréphone par la fusion de la paire la plus similaire de clusters qui est évaluées en fonction d’une mesure d’information théorique. Après la fusion de groupes pair par pair, le processus de redistribution est ré-exécuté. Ce processus continue jusqu’à ce qu’il n’y a plus de mouvement de données entre les clusters, ou un critère de convergence est atteint. La valeur seuil, prédéterminée sur la mesure de distance, est utilisée pour déterminer le moment d’arrêt de la procédure d’agglomération.
Le principe de notre méthodologie de clustering des données temporelles
Notre objectif pour la construction de structures de modèle temporels via des techniques de clustering est d’élaborer des modèles de données qui représentent et expliquent des phénomènes dynamiques dans une forme compacte et facile à interpréter. On notera qu’il existe peu d’information au préalable sur les structures de ces données. Par conséquent, il est essentiel que notre algorithme de clustering emploi des techniques objectives pour partitionner les données en clusters homogènes et élabore des modèles qui décrivent mieux les phénomènes associés à chacun des clusters.
Dans de nombreuses situations, nous sommes confrontés au problème de la différenciation entre les phénomènes, par exemple, la différenciation entre les schémas de réponse de patients à un plan de traitement spécifique. L’objectif de l’analyse est de mieux comprendre les effets d’un traitement spécifique sur les différents patients. Cela peut être obtenu en étudiant combien de modèles de réponse sont observées chez les patients, et comment ils diffèrent les uns des autres.
Par exemple, dans le cas de la maladie de diabète, certains patients s’adaptent rapidement au traitement de cette maladie, dans ce cas, la dynamique de leur réponse peut être modélisée en termes d’états, tels qu’état instable, état stable, état récupérés, et d’autres patients peuvent souffrir des complications. Leurs comportements est mieux modélisée es comme : état instable ou état complication. Il existe encore d’autres patients qui ne peuvent pas supporter du tout le changement de métabolisme et leur comportement peut s’expliquer comme une autre séquence de transitions d’état : état instable, état critique et finalement la mort. Il est clair que les divers phénomènes chez les différents patients sont mieux représentés par un ensemble distinct de représentation d’états avec différentes transitions. Ce qui motive la nécessité pour l’intégration des techniques de sélection de la taille du modèle de chaque composante de notre système de clustering. L’objectif consiste à sélectionner la taille optimale du modèle MMC pour les clusters individuels qui représentent mieux les phénomènes associés à ce jeu de données.
Cela se traduit par deux tâches principales de notre algorithme de clustering :
Trouver le nombre optimal de clusters qui représente la meilleure partition des données basées sur une mesure du critère de fonction objectif prédéterminé ;
Construire le modèle MMC le plus approprié pour chaque cluster. Cela comprend la détermination de la taille optimale du modèle MMC et les paramètres du modèle.
Ces objectifs seront atteints par le développement :
D’une mesure du critère objectif pour choisir la meilleure structure de partition (nombre de clusters) pour les données.
Une procédure explicite de sélection de la taille du modèle MMC qui détermine dynamiquement la meilleure taille MMC pour les clusters individuels au cours du processus de clustering.
|
Table des matières
Introduction générale
I Les données temporelles et les MMCs
1 Introduction
2 Exemple de données temporelles
3 L’intérêt des séries temporelles
4 Modélisation des séquences temporelles
4.1 Représentation d’une séquence temporelle
4.2 Modèle d’analyse des séquences temporelles
5 Modélisation avec les MMCs
5.1 Les chaînes de Markov discrètes
5.2 MMC
5.3 Les paramètres d’un MMC
5.4 Les algorithmes associés au MMC
5.4.1 L’algorithme Forward
5.4.2 L’algorithme de Viterbi
5.5 Apprentissage des MMCs
5.5.1 Maximisation de la vraisemblance
5.5.2 Maximisation de l’information mutuelle
5.5.3 Le critère de segmental k-means
5.5.4 Remarques sur les critères d’apprentissage
6 Concepts d’analyses à base des MMCs
6.1 MMC pour la génération de séquence
6.2 Mesures de similarité
6.2.1 Distance séquence-modèle
6.2.2 Distance de similitude entre deux MMCs
6.3 Classification des séquences à base des MMCs
7 Conclusion
II État de l’art sur l’analyse des données temporelles à base d’un modèle de Markov caché
1 Introduction
2 Analyse de séquences temporelles
3 Approches déterministes d’analyse des séquences temporelles
3.1 Approches d’analyse des données brutes
3.2 Analyses des données brutes par prétraitement
3.3 Approches d’analyse à base des modèles probabilistes
4 La méthodologie et travaux antérieurs de MMC clustering
4.1 MMC clustering avec probabilité
4.2 MMC clustering avec seuil
4.3 MMC clustering par reconnaissance d’erreur (CRE)
4.4 MMC clustering par mesures d’information théorique
4.5 MMC clustering par des modèles de mélanges finis
5 Bilan sur les travaux antérieurs
6 Conclusion
III Une nouvelle approche pour le clustering des données temporelles à base des modèles de Markov cachés
1 Introduction
2 Le principe de notre méthodologie de clustering des données temporelles
3 La fonction de critère objectif
4 La recherche heuristique pour sélectionner la taille du modèle MMC .
5 Initialisation des paramètres du modèle MMC
6 Notre méthodologie du clustering des données temporelle
6.1 Le clustering par mélange fini
6.2 Le clustering par mélange de modèles de Markov cachés
6.3 La recherche de la distribution optimale des données aux clusters
6.4 La recherche de nombre optimal de clusters avec une taille MMC uniforme
6.5 Notre méthodologie MMC clustering avec la sélection de la taille de modèle de composant
7 Conclusion
IV Etude de cas sur le diagnostique médical de la maladie du diabète
1 Introduction
1.1 Description de la problématique dans le cadre de recherche
2 Description et modélisation des données temporelles
2.1 Présentation des données
2.2 Description des données
2.3 La modélisation des séquences de données
3 Application de notre algorithme de clustering MMC
3.1 Détermination de la structure des clusters
3.2 Déterminer le nombre de clusters
3.3 Détermination de la structure des clusters
3.4 Etude comparative de notre approche
4 Conclusion
Conclusion générale et perspectives
5 Bilan de notre contribution
6 Perspectives de recherche
6.1 Le problème de séquence de données de taille inégale
6.2 Le problème de l’apprentissage des MMCs
6.3 Le problème de collection de données
Annexe
1 Démonstration de l’algorithme de Baum-Welch
1.1 Ré-estimation des πi
1.2 Ré-estimation des aij
1.3 Ré-estimation bi(j)
1.4 Synthèse
Références bibliographiques
Télécharger le rapport complet