PRINCIPE DE L’APPRENTISSAGE EN-LIGNE
PRINCIPE DE L’APPRENTISSAGE EN-LIGNE
Les Familles d’algorithmes d’apprentissage Il existe des grandes familles d’algorithmes d’apprentissage selon la disponibilité et la taille des données. Le premier à être apparu est l’apprentissage horsligne ; celui-ci permet de classifier les données après avoir fait l’apprentissage sur une base d’apprentissage collectée auparavant. Les algorithmes d’apprentissage en-ligne sont ensuite apparus pour traiter les données au fur et à mesure de leurs apparitions. 1.2.1 Apprentissage hors-ligne L’apprentissage dit hors-ligne correspond à l’apprentissage sur des données disponibles au moment de cet apprentissage. Il peut s’appliquer aussi sur des données de faible et de moyenne taille. Au-delà d’une certaine taille, le temps d’accès et de lecture des données devient difficile et long. Les données ne peuvent plus être gérées dans la mémoire et arrivent de manière continue. L’apprentissage in- 1.2. LES FAMILLES D’ALGORITHMES D’APPRENTISSAGE 22 crémental devient une solution alternative afin de gérer ce genre de problématique. 1.2.2 Apprentissage incrémental L’apprentissage incrémental est capable de recevoir les nouveaux exemples sans devoir réaliser un apprentissage complet. En d’autre termes, pour n’importe quel exemple f1, …, fn tels que fi+1 ne dépend que de fi et de l’exemple courant xi , c’est-à-dire les derniers exemples vus. Le point fort de l’algorithme d’apprentissage incrémental est le temps d’apprentissage qui est beaucoup plus rapide que les algorithmes d’apprentissage hors-ligne. Cette rapidité est justifiée par le fait que les algorithmes ne lisent souvent qu’une seule fois les exemples, ce qui leur permet de traiter des données volumineuses. 1.2.3 Présentatin de l’apprentissage en-ligne Lorsque l’arrivée des exemples se fait de manière continue pour réaliser l’apprentissage, on appelle celà l’apprentissage « en-ligne » ; l’opposé de l’apprentissage hors-ligne, c’est l’apprentissage par lots. Les exigences en termes de complexité calculatoire sont ici plus fortes que pour l’apprentissage incrémental. l’apprentissage en ligne permet donc d’apprendre et de classifier à une plus grande vitesse de flux de données. L’apprentissage en ligne est effectué dans une séquence d’itérations consécutives, à l’instant t l’apprenant reçoit une donnée ai ,prises à partir d’une base de l’instance A, et il doit prédire la classe désirée ,on la dénote yt . après avoir effectué la prédiction , la bonne classe yt prise à partir d’une base cible Y est révélée ,et l’apprenant subit une erreur,`(pt , yt), qui mesure l’écart entre la vraie classe et 1.3. PRINCIPE DE L’APPRENTISSAGE EN-LIGNE 23 la classe prédite. L’apprentissage en ligne est connu être plus lent à converger vers un minima, par rapport à l’apprentissage par lots. Toutefois, dans les cas où l’ensemble des données ne peuvent pas être gérées ou lorsqu’elles saturent la mémoire, le recours à l’apprentissage en ligne est la solution optimale. En d’autres terme l’apprentissage En-ligne gère les données volumineuse.
Principe de l’apprentissage en-ligne
L’apprentissage en-ligne représente une importante famille d’algorithmes d’apprentissage efficace et évolutif pour les applications à grande échelle. En général , les algorithmes d’apprentissage en-ligne sont rapides , simples , et font souvent quelques hypothèses statistiques, ce qui les rend applicables à une large gamme d’applications. Ces dernières années, une grande variété d’algorithmes d’apprentissage en-ligne a été proposée. L’apprentissage en ligne fonctionne sur une séquence de données d’exemples ; à chaque étape t, l’apprenant reçoit un exemple entrant at ∈ A caractérisé par un vecteur à n-dimension (A = Rd ), il essaie d’abord de prédire l’étiquette de classe de l’instance entrante,pt = sgn(f(xt ;wt)) = sgn(wt , xt) ∈ Y et Y = {−1, +1} pour les tâches de classification binaire. Après avoir effectué la prédiction, l’étiquette désirée (correcte) yt est révélée. Le modèle d’apprentissage calcule alors la l’erreur ` (yt , pt) basée sur des critères pour mesurer la différence entre la classe obtenue par le modèle d’apprentissage, et la vraie classe désirée yt . Finalement, en se basant sur le résultat de l’erreur, l’apprenant décide quand et comment mettre à jour le modèle de classification à la fin de chaque étape d’apprentissage. L’algo- 1.4. APPRENTISSAGE SUR DES SÉPARATEURS LINÉAIRES 24 rithmique suivant donne un aperçu de la plupart des algorithmes d’apprentissage en ligne pour une classification linéaire, sachant que ∆(wt ; (xt , yt)) dénote la mise à jour du modèle de classification. Les différents algorithmes en-ligne sont, en général, distingués dans la définition et la désignation de la fonction l’erreur et leur différente fonction de mise à jour Le but majeur de l’algorithme d’apprentissage est de minimiser l’erreur subie cumulative durant son exécution ,ce qui se traduit par l’apparition de quelques erreurs de prédiction dans le cas de la classification
|
Table des matières
Liste des Symboles
Liste des acronymes
Introduction générale
1 PRINCIPE DE L’APPRENTISSAGE EN-LIGNE
1.1 Introduction
1.2 Les Familles d’algorithmes d’apprentissage
1.2.1 Apprentissage hors-ligne
1.2.2 Apprentissage incrémental .
1.2.3 Présentatin de l’apprentissage en-ligne
1.3 Principe de l’apprentissage en-ligne
1.4 Apprentissage sur des séparateurs linéaires
1.4.1 L’algorithme Perceptron .
1.4.2 L’algorithme Winnow
1.4.3 Séparateurs à Vaste Marge
1.4.4 Classifieur Bayésien naïf .
1.5 L’algorithme Fuzzy ARTMAP .
1.5.1 Définition .
1.5.2 Architecture de Fuzzy ARTMAP . .
1.6 Conclusion
2 L’approche proposée Modified Fuzzy ARTMAP
2.1 Introduction .
2.2 Structure de l’approche Modified Fuzzy ARTMAP .
2.2.1 Phase d’apprentissage .
2.2.2 L’activation des classes
2.2.3 La mise à jour des poids (apprentissage)
2.3 Phase de test .
2.4 Organigramme de l’algorithme Modified fuzzy ARTMAP
2.5 L’optimisation par essaim particulaire
2.6 La sélection de variables pour le diagnostic médical .
2.7 Conclusion
3 Résultats et discussions
3.1 Classification des signaux ECG
3.1.1 Introduction .
3.1.2 Choix des paramètres d’entrée
3.1.3 Base de données utilisées . .
3.1.4 Taux de classification, sensibilité, spécificité
3.1.5 Normalisation de la base de données .
3.1.6 Discussion des Résultats .
3.2 Reconnaissance du diabète de type
3.2.1 Introduction
3.2.2 Base de données utilisée .
3.2.3 Taux de classification, sensibilité, spécificité
3.2.4 Choix des paramètres d’entrée
3.2.5 Expérimentations .
3.2.6 Discussion des Résultats
3.3 Conclusion
Conclusion générale
A La sélection de variables
A.1 Introduction .
A.2 La fonction objectif
A.3 La stratégie de recherche
A.3.1 la sélection de variables séquentielles Naïfs
A.3.2 la sélection de variables séquentielles vers l’avant (SFS)
A.3.3 la sélection de variables séquentielle vers l’arrière (SBS)
A.3.4 la sélection de variables séquentielles flottantes vers l’avant (SFFS)
A.4 Conclusion
Télécharger le rapport complet