Techniques d’apprentissage pour la sélection d’attributs

Radiographie (rayons X ordinaires)

Malgré le développement de technologies les radiographies aux rayons X ordinaire demeurent un outil important pour le diagnostic de nombreux troubles. En radiographie, un faisceau de rayons X, produit par un générateur de rayons X, est transmis à travers un objet, par ex. la partie du corps à scanner. Les rayons X sont absorbés par l’objet qu’ils traversent en quantités différentes selon la densité et la composition de l’objet. Les rayons X qui ne sont pas absorbés traversent l’objet et sont enregistrés sur un film sensible aux rayons X. Alors que l’os absorbe particulièrement bien les rayons X, les tissus mous telles que les fibres musculaires, de densité inférieure à celle de l’os, absorbent moins. Il en résulte le contraste familier vu dans les images radiographiques, avec les os montrés comme zones blanches clairement définies et les zones de tissu plus sombres (Figure 1.1). L’imagerie par rayons X fournit des images rapides de haute résolution et relativement peu coûteuses. Les images radiographiques sont stockées sur une pellicule appelée radiographie. Celles-ci sont interprétées par un médecin spécialement formé appelé radiologue. Le rayonnement ionisant utilisé dans la production des images radiographiques est cancérigène. L’exposition continue à ces rayons au fil du temps peut causer des dommages et augmenter le risque de cancer. Cependant, les experts considèrent que les avantages tirés d’un diagnostic impliquant rayons X l’emportent de loin sur le risque relativement faible lié à leur exposition. Les rayons X de n’importe quelle partie du corps ne sont pas recommandés pour les femmes enceintes. Les risques des rayons X sont plus grands pour les jeunes enfants et les bébés à naître et le médecin en tiendra toujours compte lorsqu’il décidera de la nécessité d’une imagerie médicale.

Les motifs binaires locaux

Les descripteurs de texture basés sur les motifs binaires locaux (Local Binary Pattern (LBP)) ont initialement été proposés par Ojala en 1996 [Ojala 1996]. Ces descripteurs ont le pouvoir de bien caractériser les textures présentes dans des images en niveaux de gris. Ils consistent à attribuer à chaque pixel P d’une image ?(?,?) à analyser, une valeur caractérisant le motif local autour de ce pixel. Ces valeurs sont calculées en comparant le niveau de gris du pixel central P aux valeurs des niveaux de gris des pixels voisins. Les caractéristiques issues de la méthode LBP ont été utilisés dans diverses applications pour la classification des textures. Ils sont largement considérés comme des descripteurs de texture de référence en raison de leur faible complexité de calcul et de leur invariance par rapport aux changements de résolution. En imagerie médicale, les LBPs ont été utilisés pour identifier des cellules mammaires malignes [Ponraj 2017], pour trouver des lésions cérébrales mises en évidence par l’imagerie par résonance magnétique [Unay 2008], pour le diagnostic de la maladie du glaucome [Mohamed 2015], dans le diagnostic du cancer du poumon [Soltaninejad 2014]. Des travaux récents ont également étudié les LBP dans la classification automatisée des images de phénotypes cellulaires [Nanni 2008].

Les moments de Zernike

Les moments de Zernike sont utilisés dans les applications de reconnaissance de formes comme des descripteurs invariants de la forme de l’image. Ce type de moments a été initialement introduit par Teague [Teague 1980]. Le descripteur de moment de Zernike possède des propriétés intéressantes en termes de résistance aux bruits, de l’efficacité informative, du calcul rapide ainsi que leur invariance au changement d’échelle et à la rotation. Ils constituent un espace vectoriel dans lequel l’image de la forme est projetée. Cela permet d’aboutir à une description plus précise des formes. Les moments de Zernike ont été utilisés pour décrire les caractéristiques de forme de la région d’intérêt. Dans le travail de [Sharma 2014] les moments de Zernike de différents ordres sont calculés et stockés en tant que vecteurs de caractéristiques de la masse dans les images mammaires. Un classifieur SVM a été utilisé pour classer la nature de la masse. Dans leur étude expérimentale, Sharma et ses collègues ont montré que l’utilisation des moments de Zernike avec l’ordre 20 et le classifieur SVM génère de meilleurs résultats. Dans l’étude de [Tahmasbi 2011], les moments de Zernike sont utilisés comme des caractéristiques de forme et de densité afin d’améliorer la précision globale du système CADx proposé. Notons que la plupart des études utilisant les moments de Zernike ont été réalisées pour extraire les caractéristiques de forme des masses mammaires [Nugroho 2015 ; Eleyan 2015]. Ces descripteurs ont été utilisé aussi pour le diagnostic d’autres maladies [Kaya 2015 ; Alizadeh 2016].

Stratégie de requêtes par comité

Il y a heureusement des hypothèses supplémentaires dans la stratégie de requêtes par désaccord qui peuvent être assouplies. Tout d’abord, et le plus critique est, l’hypothèse selon laquelle tout h ∈? doit être pris en considération lors de la mesure du désaccord, directement ou indirectement (grâce à des simplifications tels que le QBD basé sur ?? [Cohn 1994]). Dans de nombreux types populaires de modèles, tels que les réseaux de neurones, le maintien de ? devient également impossible. Il semble raisonnable, cependant, de supposer que l’échantillonnage aléatoire de ? pour n hypothèses entre lesquelles le désaccord est mesuré, peut fournir une heuristique utile pour le désaccord entre les hypothèses de ?. Cette idée a été initialement formulée par [Seung 1992] comme un algorithme de requête par vote (Query by Committee (QBC)), où le comité (noté ?) se réfère à l’ensemble des hypothèses échantillonnées. L’idée principale derrière cette approche est de penser aux comités de QBC comme simples ensembles en se basant sur l’apprentissage par ensemble [Dietterich 2002]. Cela permet d’utiliser n’importe quel type de méthodes d’apprentissage d’ensemble, comme le bagging [Breiman 1996] ou le boosting [Schapire 2003] par exemple, pour construire des comités de QBC. Tout comme dans l’apprentissage par ensemble, il est important de s’assurer qu’il existe une certaine diversité parmi les modèles de ?. QBC fait maintenant référence à tous les algorithmes qui sont basés sur la mesure du désaccord entre les membres du comité en tant qu’une heuristique pour choisir les exemples à interroger. L’utilisation du comité formé pour prédire des exemples non étiquetés peut se faire de différentes manières, par exemple par le biais de mécanismes de vote pour la classification ou des résultats moyens pour la régression. La meilleure façon d’y parvenir dépend généralement du type de modèles utilisés. Le lecteur peut se référer à la littérature d’apprentissage d’ensemble pour plus de détails [Dietterich 2002].

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

Introduction Générale
Chapitre 01 Système d’aide à la décision médicale
1. Introduction
2. Imagerie médicale
2.1.La radiographie (rayons X ordinaires)
2.2.La mammographie
2.3.Imagerie par Résonance Magnétique
2.4.Rétinographies mydriatique (RM) et non mydriatique (RNM)
3. Les systèmes d’aide au diagnostic/ détection
3.1.Définition
3.2.Composition d’un système d’aide au diagnostic
3.2.1. Prétraitement
3.2.2. Segmentation
3.2.3. Extraction des caractéristiques
3.2.3.1. Les caractéristiques de couleur
3.2.3.2. Les caractéristiques de texture
3.2.3.2.1.La matrice de co-occurrence à niveau de gris
3.2.3.2.2.La matrice de longueurs de plages à niveau de gris
3.2.3.2.3.Les motifs binaires locaux
3.2.3.3. Les caractéristiques de forme
3.2.3.3.1.Les moments Centraux
3.2.3.3.2.Les moments de Hu
3.2.3.3.3.Les moments de Zernike
3.2.4. Sélection des caractéristiques
3.2.5. Classification
4. Conclusion
Chapitre 02 Techniques de sélection des caractéristiques
1. Introduction
2. Sélection supervisée des caractéristiques
2.1.Définition de la sélection supervisée des caractéristiques
2.2.Procédure de la sélection des caractéristiques
2.2.1. Génération
2.2.2. Evaluation
2.2.2.1. La méthode Filter
2.2.2.2. Les méthodes Wrapper
2.2.2.3. Les méthodes Embedded
2.2.3. Critère d’arrêt
2.2.4. Validation
3. Sélection semi-supervisée des caractéristiques
3.1.Définition de la sélection semi-supervisée des caractéristiques
3.2.Méthodes de la sélection semi-supervisée des caractéristiques
4. Revue sur quelques méthodes de sélection des caractéristiques
4.1.Les méthodes SFS et SBE
4.2.Minimum-Redundancy-Maximum-Relevance
4.3.Métaheuristiques
4.3.1. Algorithmes Evolutionnaires
4.3.1.1. Les Algorithmes Génétiques
4.3.1.2. La Programmation Génétique
4.3.1.3. La Programmation Evolutionnaire
4.3.2. L’intelligence en essaim
4.3.2.1. L’Optimisation par Essaims Particulaires
4.3.2.2. L’Optimisation par Colonie de Fourmis
4.3.2.3. L’Optimisation par Colonie d’Abeilles artificielles
5. Conclusion
Chapitre 03 Apprentissage semi-supervisé pour la classification des données
1. Introduction
2. Apprentissage supervisé
3. Apprentissage non supervisé
4. Apprentissage semi-supervisé
4.1.Définition
4.2.Classification des techniques d’apprentissage semi-supervisé
4.2.1. L’auto-apprentissage
4.2.2. Le co-apprentissage
4.2.3. Méthodes à base de graphe
4.2.4. Séparateur Semi-Supervisé à Vaste Marge
5. Apprentissage actif
5.1.Définition
5.2.Scénarios d’apprentissage actif
5.2.1. Requêtes d’appartenance
5.2.2. Apprentissage actif à partir d’un flux de données
5.2.3. Apprentissage actif à partir d’un réservoir de données
5.3.Stratégies d’apprentissage actif
5.3.1. Stratégies basées sur l’incertitude
5.3.1.1. Faible probabilité de prédiction
5.3.1.2. Marge entre les deux classes les plus probables
5.3.1.3. Entropie de Shannon
5.3.2. Stratégies de requêtes par désaccord
5.3.3. Stratégie de requêtes par comité
6. Conclusion
Chapitre 04 Conception d’un système semi-supervisé d’aide au diagnostic pour la classification des images médicales
1. Introduction
2. Système CADx proposé
2.1.Bases des images médicales
2.1.1. DDSM (Digital Database for Screening Mammography)
2.1.2. RIM-ONE (An Open Retinal Image Database for Optic Nerve Evaluation)
2.2.Prétraitement
2.3.Extraction des caractéristiques
2.4.Sélection des caractéristiques
2.4.1. La fonction objective basée sur le modèle wrapper
2.5.Apprentissage et classification
3. Résultats et discussions
3.1.Mesures de performances utilisées
3.2.Performance du classifieur SVM-Transductive
3.3.Etude comparative du système proposé
4. Conclusion
Chapitre 05 Approche hybride combinant l’apprentissage actif et l’algorithme PSO pour la classification des images médicales
1. Introduction
2. Approche hybride combinant l’apprentissage actif avec PSO (AL-PSO)
2.1.Etapes principales du AL-PSO proposé
2.2.Nouvelle fonction objective PSO basée sur la pondération des instances
2.2.1. Pondération des instances
2.2.2. Description de la fonction objective
3. Résultats et discussions
3.1.Bases de validation
3.2.Paramètres expérimentaux
3.3.Analyse des résultats
4. Conclusion
Conclusion Générale et Perspectives
Bibliographie