Recherche d’images par le contenu

Recherche d’images par le contenu

La recherche d’information est le processus de trouver un objet ( en général un document) de nature non structurée (souvent ) qui satisfait un besoin d’information au sein de collections de données de tailles très importantes stockées sur des supports de stockage. La recherche d’information n’a pas commencé avec le Web mais plutôt avant. En réponse à différents problèmes de fourniture d’accès à l’information, le domaine de la recherche d’information a évolué pour donner de nouveaux principes et de nouvelles approches pour la recherche d’information de nature variée (l’information recherchée peut être un document texte, une image, une vidéo etc.). Chaque jours des millions d’octets sont générés et stockés sur des supports du stockage. La recherche de l’information voulue devient de plus en plus difficile et présente des difficultés majeures, c’est comme trouver une aiguille dans une meule de foin. Nous nous intéressons dans notre travail à la recherche d’images. Les images numériques possèdent une position prédominante parmi les différents types de données multimédia. À la différence de la vidéo et l’audio, qui sont surtout utilisés pour le divertissement et l’industrie des informations (newscasting), les images sont au cœur d’un large éventail de domaines (l’histoire artistique, la médecine, l’astronomie, l’exploration pétrolière, et les prévisions météorologiques…). L’imagerie numérique joue un rôle important dans de nombreuses activités humaines, telles que : l’application de la loi (surtout l’investigation des scènes de crime), l’agriculture et la gestion forestière, les sciences de la terre, la planification urbaine, ainsi que les sports, et le divertissement.

Généralités sur le Traitement d’Images

Le traitement d’images désigne une discipline des mathématiques appliquées qui étudie les images numériques et leurs transformations, dans le but d’améliorer leur qualité ou d’en extraire de l’information. Il s’agit donc d’un sous-ensemble du traitement du signal dédié aux images et aux données dérivées comme la vidéo (par opposition aux parties du traitement du signal consacrées à d’autres types de données : son et autres signaux monodimensionnels notamment), tout en opérant dans le domaine numérique (par opposition aux techniques analogiques de traitement du signal, comme la photographie ou la télévision traditionnelles).

Définition d’image

➤ L’image est définie par le nombre de points qui la composent. En imagerie numérique, cela correspond au nombre de pixels qui compose l’image en hauteur (axe vertical) et en largeur (axe horizontal) : 200 pixels par 450 pixels par exemple, abrégé en « 200×450 ».
➤ Une image est simplement la représentation d’une scène. Elle est issue du contacte des rayons lumineux provenant des objets formants la scène avec un capteur (caméra, scanner, rayons X, …). Il s’agit en réalité que d’une représentation spatiale de la lumière.

Types d’images
On peut classifier les images numériques selon deux critères:

Selon la représentation numérique :
Ils existent deux types:

a) Images matricielles (ou images bitmap)
Elle est composée comme son nom l’indique d’une matrice (tableau) de points à plusieurs dimensions, chaque dimension représentant une dimension spatiale (hauteur, largeur, profondeur), temporelle (durée) ou autre (par exemple, un niveau de résolution).

b) Images vectorielles
Le principe est de représenter les données de l’image par des formules géométriques qui vont pouvoir être décrites d’un point de vue mathématique. Cela signifie qu’au lieu de mémoriser une mosaïque de points élémentaires, on stocke la succession d’opérations conduisant au tracé. Par exemple, un dessin peut être mémorisé par l’ordinateur comme « une droite tracée entre les points (x1, y1) et (x2, y2) », puis « un cercle tracé de centre (x3, y3) et de rayon 30 de couleur rouge ».

L’avantage de ce type d’image est la possibilité de l’agrandir indéfiniment sans perdre la qualité initiale, ainsi qu’un faible encombrement. L’usage de prédilection de ce type d’images concerne les schémas qu’il est possible de générer avec certains logiciels de DAO (Dessin Assisté par Ordinateur). Ce type d’images est aussi utilisé pour les animations Flash, utilisées sur Internet pour la création de bannières publicitaires, l’introduction de sites web, voire des sites web complet.

Selon la représentation des couleurs:
Il existe plusieurs modes de codage informatique des couleurs, le plus utilisé pour le maniement des images est l’espace colorimétrique Rouge, Vert, Bleu (RVB ou RGB – Red green Blue).

LES MODÈLES DE COULEUR
La couleur est l’une des composantes principales pour la description et l’analyse des images couleurs dans le domaine de la recherche d’images par le contenu. Comme nous le savons, les couleurs perceptibles par l’oeil humain représente une petite gamme de l’ensemble du spectre électromagnétique qui représente tous les rayons, depuis les rayons cosmiques et les rayons X jusqu’aux ondes électriques .

Comme le démontre la figure 1 du spectre électromagnétique, les couleurs visibles par l’œil humain s’étendent entre les longueurs d’ondes allant de 4000 à 7000 angströms, représentant respectivement les couleurs : violet et rouge et toutes les couleurs entre les deux. Toutes les autres ondes s’étendant des rayons cosmiques des étoiles jusqu’aux ondes FM de nos radios ne peuvent pas être perçues par l’œil humain. Cette petite gamme du spectre est l’espace de couleur perceptible par l’œil humain.

DÉFINITION DU MODÈLE DE COULEUR
Comme toutes les représentations mathématiques des phénomènes physiques, les couleurs peuvent être exprimées selon différentes manières, chacune ayant ses avantages et ses inconvénients. Un modèle de couleur (modèle chromatique) est un modèle mathématique abstrait décrivant la façon dont les couleurs peuvent être représentées en tant que tuples de nombres, généralement de trois ou quatre valeur ou composantes de couleur. Le but d’un modèle de couleur est de faciliter la spécification des couleurs d’une manière.

Formats d’image

Un format d’image est une représentation informatique de l’image, associée à des informations sur la façon dont l’image est codée et fournissant éventuellement des indications sur la manière de la décoder et de la manipuler. La plupart des formats sont composés d’un en-tête contenant des attributs (dimensions de l’image, type de codage, LUT, etc.), suivi des données (l’image proprement dite). La structuration des attributs et des données diffère pour chaque format d’image. De plus, les formats actuels intègrent souvent une zone de métadonnées (metadata en anglais) servant à préciser les informations concernant l’image comme :
• la date, l’heure et le lieu de la prise de vue.
• les caractéristiques physiques de la photographie (sensibilité ISO, vitesse d’obturation, usage du flash…)
Ces métadonnées sont par exemple largement utilisées dans le format Exif (extension du format JPEG), qui est le format le plus utilisé dans les appareils photo numériques.

Précautions à prendre
Quelques précautions à prendre concernant les formats d’images :
• les formats dits « propriétaires », peuvent différer selon le logiciel qui les manipule. De plus, leur pérennité n’est pas garantie : réaliser de nouveaux programmes pour les lire peut s’avérer difficile (surtout si leurs spécifications n’ont pas été rendues publiques), cela peut même s’avérer illégal si les algorithmes utilisés sont protégés par des brevets ;
• il faut prêter attention aux différentes versions que peut recouvrir un format particulier, notamment pour le format TIFF qui varie selon les versions ; certaines d’entre elles ne sont pas reconnues par certains logiciels .

Caractéristiques d’images

L’image est un ensemble structuré d’informations caractérisé par les paramètres suivants:

Pixel
Le pixel, abrégé px, est une unité de surface permettant de définir la base d’une image numérique. Son nom provient de la locution anglaise picture element, qui signifie, «élément d’image » ou « point élémentaire ».

La texture
Une texture est une région dans une image numérique qui a des caractéristiques homogènes. Ces caractéristiques sont par exemple un motif basique qui se répète, ou des caractéristiques fréquentielles. Une texture est composée de texels, l’équivalent des pixels.

Dimension
C’est la taille de l’image. Cette dernière se présente sous forme de matrice dont les éléments sont des valeurs numériques représentatives des intensités lumineuses (pixels). Le nombre de lignes de cette matrice multiplié par le nombre de colonnes nous donne le nombre total de pixels dans une image.

Résolution
C’est la clarté ou la finesse de détails atteinte par un moniteur ou une imprimante dans la production d’images. Sur les moniteurs d’ordinateurs, la résolution est exprimée en nombre de pixels par unité de mesure (pouce ou centimètre). On utilise aussi le mot résolution pour désigner le nombre total de pixels affichables horizontalement ou verticalement sur un moniteur; plus grand est ce nombre, meilleure est la résolution.

Bruit
Un bruit (parasite) dans une image est considéré comme un phénomène de brusque variation de l’intensité d’un pixel par rapport à ses voisins, il provient de l’éclairage des dispositifs optiques et électroniques du capteur.

Histogramme
L’histogramme des niveaux de gris ou des couleurs d’une image est une fonction qui donne la fréquence d’apparition de chaque niveau de gris (couleur) dans l’image. Pour diminuer l’erreur de quantification, pour comparer deux images obtenues sous des éclairages différents, ou encore pour mesurer certaines propriétés sur une image, on modifie souvent l’histogramme correspondant. Il permet de donner un grand nombre d’information sur la distribution des niveaux de gris (couleur) et de voir entre quelles bornes est repartie la majorité des niveaux de gris (couleur) dans les cas d’une image trop claire ou d’une image trop foncée. Il peut être utilisé pour améliorer la qualité d’une image (Rehaussement d’image) en introduisant quelques modifications, pour pouvoir extraire les informations utiles de celle-ci.

Contours et textures
Les contours représentent la frontière entre les objets de l’image, ou la limite entre deux pixels dont les niveaux de gris représentent une différence significative. Les textures décrivent la structure de ceux-ci. L’extraction de contour consiste à identifier dans l’image les points qui séparent deux textures différentes.

Luminance
C’est le degré de luminosité des points de l’image. Elle est définie aussi comme étant le quotient de l’intensité lumineuse d’une surface par l’aire apparente de cette surface, pour un observateur lointain, le mot luminance est substitué au mot brillance, qui correspond à l’éclat d’un objet.

Contraste
C’est l’opposition marquée entre deux régions d’une image, plus précisément entre les régions sombres et les régions claires de cette image. Le contraste est défini en fonction des luminances de deux zones d’images. Si L1 et L2 sont les degrés de luminosité respectivement de deux zones voisines A1 et A2 d’une image, le contraste C est défini par le rapport : C = L1- L2/L1+ L2

Conclusion générale 

L’indexation et la recherche d’images par le contenu sont des problèmes complexes et incontournables étant donnée la place que l’image numérique occupe à présent dans notre quotidien. Internet en est la meilleure illustration. Dans notre travail nous avons intéressés d’une part à l’indexation des images par le contenu et d’autre part à la recherche par le contenu. Du point de vue de l’indexation, nous avons proposé un traitement automatique pour le calcul des indexes des images. Ce traitement se base sur l’analyse de la couleur, où nous avons porté une attention à l’utilité des histogrammes de couleurs et les moments statistiques. Du point de vue de recherche, nous avons utilisé le principe de la recherche par similarité. Cette dernière prend la forme d’une image exemple. Durant ce travail nous avons constaté deux points essentiels et cruciaux. Le premier, est que la couleur est une caractéristique discriminante d’une image, mais l’utilisation de la couleur tout seul dans un CBIR ne suffit pas, il faut rajouter autre descripteurs de texture et de forme pour la performance d’un CBIR. Le domaine de recherche d’image par le contenu est un domaine très riche et exhibe une variance dans les techniques utilisées. Il n’existe pas une loi qui impose le choix d’une technique particulière pour l’extraction des images en se basant sur le contenu. On espère qu’on a atteint notre but par ce mémoire qui ne représente en réalité qu’une goutte d’eau dans la mer du domaine.

 

 

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

Introduction générale
Contexte générale
1.1. Première génération
1.2. Deuxième génération
1.3. Troisième génération
2. Objectifs de l’étude
3. Organisation du mémoire
CHAPITRE 1 : Généralités sur le Traitement d’Images
1. Introduction
2. Définition d’image
2.1. Types d’images
2.2. Formats d’image
3. Caractéristiques d’images
3.1. Pixel
3.2. La texture
3.3. Dimension
3.4. Résolution
3.5. Bruit
3.6. Histogramme
3.7. Contours et textures
3.8. Luminance
3.9. Contraste
4. Système de traitement d’image
5. Filtrage
5.1. Filtres linéaires
5.2. Filtres non linéaires
6. Segmentation
7. Quelques applications concrètes de traitement d’images
8. Conclusion
CHAPITRE 2 : Systèmes de recherche d’image par contenu (CBIR) 
1. Introduction
2. Composants d’un CBIR.
2.1 La base d’image.
2.2 L’indexation
2.3 La gestion des index
2.4 Les requêtes.
2.5 Analyse de la requête.
2.6 Mise en correspondance requête / base.
2.7 La présentation des résultats.
3. Représentation des images dans un CBIR.
4. Mesures pour évaluer un système
4.1. Rappel et précision (en anglais : Recall and Precision)
4.2. La courbe de rappel et précision
5. Conclusion
CHAPITRE 3 : Descripteurs d’Images &Mesures de Similarité
1. Introduction
2. Descripteurs d’image
2.1. Descripteurs de couleur
2.2. Descripteurs des textures
2.3. Descripteurs de Formes
3. Mesures de similarité
A. Images brutes (pixels)
B. Attributs visuels
3.1. Les méthodes de calcule
4. Conclusion
CHAPITRE 4 : Le travail effectué 
1. Introduction
2. Les caractéristiques visuelles choisies
2.1. Les modèles de couleur utilisés
2.2. Préparation des indexes
2.2.1 Les histogrammes de couleur
2.2.2 Le nombre d’objets d’image
2.2.3 Les moments statistiques
2.3. Mesures de distance utilisées
2.4. Les mesures de performance étudiées
3. Architecture de l’application
3.1L’interface utilisateur
3.2Le moteur de recherche
3.3La base d’attributs
4. Evaluation de l’application
4.1La base d’mage utilisée
4.2Processus suivi
5. Problèmes rencontré
6. perspective
7. conclusion
Conclusion générale.

Rapport PFE, mémoire et thèse PDFTélécharger le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *