L’APPRENTISSAGE AUTOMATIQUE DES CHIFFRES MANUSCRITS
Introduction
Le traitement d’image est une discipline de l’information et des mathématiques appliquées qui étudie les images numériques et leurs transformations, dans le but d’améliorer leur qualité ou d’en extraire de l’information.Dans ce chapitre nous présenterons tout d’abord ce que c’est l’image et sa texture sans oublier le traitement qui regroupe toutes les techniques visant à améliorer la qualité d’une image
Généralités sur l’image
Définition de l’image
Une image est une représentation planaire d’une scène ou d’un objet situé en général dans un espace tridimensionnel. Elle peut être décrite sous la forme d’une fonction I (x, y) tel que : x et y sont des cordonnées spatiales d’un point de l’image et I est une fonction d’intensité lumineuse Les informations d’une image sont [9] : Nombre de lignes Nombre de colonnes Format des pixels (bits, niveaux de gris, niveaux de couleurs) Compression éventuelle.
Structure d’une image
Une image est la représentation d’un être ou d’une chose obtenue par exemple par la photographie, la vidéo ou l’utilisation d’un logiciel spécialisé. Elle est dite numérique lorsque sa sauvegarde est obtenue sous forme binaire. Donc image numérique fait appel à l’informatique. Chaque image numérique est constituée d’un nombre donné de lignes, Chaque ligne comporte un nombre de point donnés. L’ensemble constitue une matrice. Ces points sont dénommés pixel. Chaque « case » de cette matrice contient des nombres caractéristiques à la couleur attribuée au pixel .L’image est sauvegardée sous la forme d’un fichier informatique comportant : Un nom (exemple : fleur). Un suffixe de 3 lettres (exemple : bmp, jpg ) qui précise la nature de la codification employée pour sauvegarder cette imageLa même image d’origine peut avoir une taille différente suivant la nature de la codification utilisée pour sa sauvegarde. Ainsi le fichier « fleur » sauvegardé au format BMP (format de sauvegarde d’une image matricielle), occupe une place de 980 ko alors qu’en JPG sa taille n’est que de 72,4 ko Avec un éditeur de fichiers (exemple : explorateur de Windows), en déplaçant la souris sur le fichier, il est précisé que : La taille de cette image est de 507×676 pixels. La résolution est de 180 ppp (pixels ou points par pixel). La profondeur des couleurs est de 24 bits. Ces informations sont celles qui concernent l’image lorsqu’elle est affichée à l’écran. Il est noté que le fichier de l’image, contient en plus de la valeur de chaque pixel, des informations propres à définir la nature du codage utilisé, et précisant la structure de l’image, dans son entête afin de pouvoir être lu par différents logiciels.
Pixel
Une image est constituée d’un ensemble de points appelés pixels, et Le pixel représente ainsi le plus petit élément constitutif d’une l’image. Un pixel possède une valeur qui peut être un scalaire et représenter un niveau de gris ou un vecteur représentant une couleur, ou tout autre chose. Un pixel possède une valeur qui peut être un scalaire et représenter un niveau de gris, ou un vecteur représentant une couleur, ou tout autre chose. Les images dites en « noir et blanc » sont composées de pixels binaires noirs ou blancs (deux valeurs possibles). Les images en niveaux de gris sont composées de pixels de valeurs scalaires représentant la luminosité. Pour donner un ordre de grandeur, si un pixel est codé sur 8 bits (1 octet), on dispose de 28 = 256 couleurs ou niveaux de gris. En Matlab, le pixel (1,1) est situé en haut à gauche de l’image.
Taille d’une image
Une image de 1 pouce *1 pouce scannée à 100 dpi aura une taille (x, y) de 100 pixels sur 100 pixels, c’est à dire (1*100) *(1*100) = 100 pixels sur 100 pixels = 10.000 pixels .Remarque : 1 pouce = 2,54 cm. 1 pouce = 25,40 mm = 100 pixels. 1 inch = 2,54 cm = 1pouce. 1feet = 12 inch.
Les différents formats d’images
Image matricielle
Une image matricielle (ou bitmap) est formée d’un tableau de points ou pixels, Chaque point porte des informations de position et de couleur. Plus la densité des points est élevée, plus le nombre d’informations est grand et plus la résolution de l’image est élevée . Format d’images bitmap : BMP, PCX, GIF, JPEG, TIFF. Les images vues sur un écran de télévision ou une photographie sont des images matricielles.
Image Vectorielle
Dans une image vectorielle les données sont représentées à l’aide de formules mathématiques. Cela permet alors d’agrandir l’image indéfiniment sans perte de qualité et d’obtenir un faible encombrement Par exemple pour décrire un cercle dans une image il suffit de noter la position de son centre et la valeur de son rayon plutôt que l’ensemble des points de son contour. Ce type est généralement obtenu à partir d’une image de synthèse créée par logiciel (exemple : Autocad) et non pas à partir d’un objet réel, ce type est donc particulièrement adapté pour le travail de redimensionnement d’images, la cartographie ou l’infographie.
Codages des couleurs
Nous l’avons une image apparait comme une matrice où chaque case contient des nombres associés à une couleur. Usuellement on distingue 3 grands types de couleurs pour une image numérique : Le noire et blanc. Les niveaux de gris. La couleur. Ces types sont généralement à choisir lors d’une numérisation par scanner ou lors de la configuration d’un appareil photographique.
Codage d’une image en noir et blanc
Chaque pixel est soit blanc soit noir, Donc Le contenu de chaque case de la matrice est soit un 0 (noir) soit 1 (blanc). Il faut un bit pour coder un pixel, L’image de 10000 pixels codée occupe donc 10000 bits en mémoire.
Codage d’une image en niveaux de gris
Le codage dit en niveaux de gris permet d’obtenir plus de nuances que le simple noir et blanc, Chaque pixel est un niveau de gris, allant de 0 (noir) à 255 (blanc). Cet intervalle de valeur signifie que chaque pixel est codé sur huit bits (un octet). 256 niveaux de gris suffisent pour la reconnaissance de la plupart des objets d’une scène En général on code chaque pixel sur 8 bits = 1 octet. On a alors 256 possibilités (on dit 256 niveaux de gris). L’image de 10 000 pixels codée occupe alors 10 000 octets en mémoire. L’usage de ce codage est utilisé fréquemment pour la presse écrite ou l’envoi par messagerie électronique de fichier d’image de taille réduite avec une perte de lisibilité de l’image moindre.
Codage d’une image Couleur
Une image couleur correspond à la synthèse additive de 3 images, rouge, vert et bleu. Chaque pixel est donc codé sur 3×N bits. La couleur d’un pixel est représentée par 3 composantes couleur et donne naissance à un point dans un espace tridimensionnel. Il existe plusieurs modes de codage de la couleur. Le plus utilisé est le codage Rouge, Vert, Bleu (RVB). Chaque couleur est codée sur 1 octet = 8 bits. Chaque pixel sur 3 octets c’est à dire 24 bits : le rouge de [0 à 255], le vert de [0 à 255], le Bleu de [0 à 255]. L’image de 10000 pixels ainsi codée occupe 10000 x 3 = 30000 octets [11]. Dans le cas d’une image de 10 cm x 10 cm avec une résolution convenable de 100 pixels par cm (un pixel mesure 0,1 mm) [11]. Elle est codée sur 1000 x 1000 = 1 000 000 pixels Elle occupe [11] : En noir et blanc : 1 000 000 bits = 125 000 octets En 256 niveaux de gris : 1 million d’octets En couleurs (24bits) : 3 millions d’octets. C’est codage de la couleur qui est utilisé par la plupart des écrans d’ordinateurs actuellement. On constate qu’il est très gourmand en mémoire. Pour faciliter le stockage des images en mémoire on utilise d’autres formes decodage.
Traitement ou Prétraitement
Le traitement, souvent appelé prétraitement, regroupe toutes les techniques visant à améliorer la qualité d’une image. De ce fait, la donnée de départ est l’image initiale et le résultat est également une image. L’idéal est d’obtenir un résultat sans bruit. Une panoplie de traitements peut être appliquée à l’image numérique, la figure suivante résume l’ensemble de ces traitements.
Acquisition
L’acquisition d’images est une mesure spatiale d’une interaction entre une onde et de la matière [13]. Elle a pour objet de passer de la scène physique à une forme numérique observée. Les deux caractéristiques importantes de la mesure spatiale est la taille du plus petit élément (pixel), mais aussi l’inter corrélation de deux éléments voisins : plus cette intercorrélation est faible, meilleure est l’image. Domaine Du problème Restauration Rehaussement Acquisition Représentation & Description Segmentation Morphologie Compression Ondelettes Base de connaissances Reconnaissance D’objets.
Rehaussement
En générale On applique le rehaussement des images afin de faciliter l’interprétation visuelle et la compréhension des images. Dans une image brute, les informations utiles sont souvent contenues dans un ensemble restreint de valeurs numériques parmi les valeurs possibles (256 dans le cas de données à 8 bits). Le rehaussement des contrastes se fait en changeant les valeurs initiales de façon à utiliser toutes les valeurs possibles, ce qui permet d’augmenter le contraste entre les cibles et leur environnement.
Restauration
La restauration a pour but d’inverser l’effet du phénomène dégradant. Il s’agit donc de produire une image la plus proche de la réalité physique de la scène observée. Le plus souvent, cette étape est la première dans la chaîne de traitements constituant un système de vision La restauration se fait par des techniques comme noir et blanc, négative, rotation, etc. Noir et blanc : L’image noir et blanc, est une image dont les couleurs ont été remplacés par le gris sauf le noir et le blanc de l’image. Négative : est une image dont les couleurs ont été inversées par rapport à l’originale par exemple le noir devient blanc et inversement.
Compression
On classe les techniques de compression par extension du fichier informatique. Il s’agit là de faciliter le traitement et surtout le stockage des images par une réduction adéquate de leur volume d’information. On perd ou on gagne une caractéristique optique. La compression d’image peut être effectuée avec perte de données ou sans perte.
Morphologie
La morphologie mathématique constitue une Technique d’analyse d’images à part entière et peut être utilisée pour résoudre un grand nombre de problèmes de traitement d’images tels que Le filtrage non linéaire d’images : Pour conserver ou supprimer des structures d’une image possédant certaines caractéristiques, notamment de forme (morphologiques). Mesure : Pour obtenir des valeurs numériques caractérisant certaines propriétés des objets de l’image (exemple : granulométrie, analyse de textures, …). Segmentation : Pour obtenir une partition de l’image en ses différentes régions d’intérêt. Généralement, on cherche à séparer les objets de l’image du fond. Le paradigme de segmentation morphologique s’appuie sur l’opérateur de ligne de partage des eaux.
La Segmentation
La segmentation d’images ainsi définie est un domaine vaste où l’on retrouve de très nombreuses approches. La segmentation est un traitement qui consiste à créer une partition de l’image considérée, Il existe deux grandes catégories de segmentations : La segmentation de région et la segmentation de contour. Les pixels présentant une même caractéristique sont décrits par un niveau de gris compris dans un certain intervalle ou dérivée seconde supérieure à un certain seuil Plus la segmentation est meilleur plus l’étape de reconnaissance d’objets est réussite.
Amélioration
L’amélioration a pour but de satisfaire l’œil de l’observateur humain, C’est pour quoi l’image produite peut être différente de la réalité. Cette amélioration peut servir dans un premier temps à faciliter la visualisation de l’image sur un écran d’ordinateur. Dans les deux cas, la qualité (i.e. capacité à interpréter facilement une image) a été accrue.
Représentation et Description
La représentation est l’étape qui vient juste après la segmentation, Le résultat de la segmentation est un ensemble de pixels relatifs à une région. Ces données doivent être converties en une forme traitable par un ordinateur. On peut soit représenter la région ou sa frontière. La description est l’extraction d’attribut permettant de distinguer une classe d’objets d’une autre classe.
Reconnaissance d’objet
La reconnaissance d’objets est une branche de la vision artificielle et un des piliers de la vision industrielle. Elle consiste à identifier des formes pré-décrites dans une image numérique. La reconnaissance d’objet est avant tout la réduction méthodique d’information. A partir d’une donnée très riche, par exemple une image numérisée, on veut obtenir une information pertinente qui tient en quelques bits, par exemple l’indication que l’image contient des chiffres. On considère donc souvent la reconnaissance des objets comme un problème de classification, c’est-à-dire un problème de synthèse d’une fonction qui affecte chaque donnée prévisible à la catégorie pertinente.
Conclusion
Dans ce chapitre, nous avons donnés un aperçu sur l’image et ses caractéristiques, ainsi que nous avons cité les différents traitements que peut subir une image. Dans le chapitre suivant, on présentera une étude expérimentale sur une base d’images des chiffres manuscrits. Cette expérience est en fait une implémentation d’un réseau neuronal artificiel basé sur Back Propagation.
|
Table des matières
TABLE DES FIGURES
LISTE DES TABLEAUX
I N T R O D U C T I O N G E N E R A L E
C H A P I T R E I : I N T E L L I G E N C E A R T I F I C I E L L E
1. INTRODUCTION
2. DEFINITION DE L’IA
3. UNE COURTE HISTOIRE DE L’INTELLIGENCE ARTIFICIELLE
4. RECONNAISSANCE DES FORMES
5. L’APPRENTISSAGE AUTOMATIQUE
5.1. APPRENTISSAGE NON SUPERVISE
5.1.1. CLASSIFICATION ASCENDANTE HIERARCHIQUE (CAH)
5.1.2. METHODE DES K-MEANS
5.2. APPRENTISSAGE SUPERVISE
5.2.1. METHODES BASEES SUR L’APPRENTISSAGE INDUCTIF
A – MACHINE A VECTEURS DE SUPPORT (SVM)
B – LES RESEAUX DE NEURONES
5.2.2. METHODES BASEES SUR L’APPRENTISSAGE DEDUCTIF CONCLUSION
C H A P I T R E II : T R A I T E M E N T D ‘I M A G E
1. INTRODUCTION
2. GENERALITES SUR L’IMAGE
2.1 DEFINITION DE L’IMAGE
2.2 STRUCTURE D’UNE IMAGE
2.3 PIXEL
2.4 TAILLE D’UNE IMAGE
2.5 LES DIFFERENTS FORMATS D’IMAGES
A. IMAGE MATRICIELLE
B. IMAGE VECTORIELLE
3. CODAGES DES COULEURS
3.1 CODAGE D’UNE IMAGE EN NOIR ET BLANC
3.2 CODAGE D’UNE IMAGE EN NIVEAUX DE GRIS
3.3 CODAGE D’UNE IMAGE COULEUR
4. TRAITEMENT OU PRETRAITEMENT
4.1 ACQUISITION
4.2 REHAUSSEMENT
4.3 RESTAURATION
4.4 COMPRESSION
4.5 MORPHOLOGIE
4.6 LA SEGMENTATION
4.7 AMELIORATION
4.8 REPRESENTATION ET DESCRIPTION
4.9 RECONNAISSANCE D’OBJET
CONCLUSION
C H A P I T R E III : I M P L E M E N T A T I O N D E
L ’ A P P L I C A T I O N
1. INTRODUCTION
2. CONCEPTION DE L’APPLICATION
3. BASE D’IMAGES
A- DEFINITION
B- DESCRIPTION
C- PROPRIETES DES IMAGES
4. RESEAUX DE NEURONES
4.1 RESEAUX FEED-FORWARD ET RETRO-PROPAGATION ALGORITHME
4.2 ARCHITECTURE DU RESEAU DE NEURONE
5. EXPERIMENTATION ET RESULTATS
A) PARTIE 01
B) PARTIE 02
5.1 PRECISION ET RAPPEL
6. L’INTERFACE DE L’APPLICATION
6.1 MENU PRINCIPAL
6.2 MENUS DE L’APPLICATION
CONCLUSION
C O N C L U S I O N G E N E R A L E E T P E R S P E C T I V E S
CONCLUSION GENERALE ET PERSPECTIVE
R E F E R E N C E S
Télécharger le rapport complet