Domaine d’application O.C.R

L’écriture manuscrite est un moyen naturel de communication qui présente l’avantage d’être familier à la majorité des gens. De ce fait elle présente un moyen d’interaction facile avec l’ordinateur. L’un des objectifs les plus recherchés est de doter les ordinateurs de capacités de l’être Humain .

Donc le but de la reconnaissance de l’écriture est de transformer un texte écrit en une représentation compréhensible par une machine et facilement reproductible par un traitement de texte. Cette tache n’est pas triviale, car l’écriture possède une infinité de représentations dues au fait que chaque personne possède une écriture qui lui est propre avec de nombreux styles. Ce qui rend la tâche difficile pour la reconnaissance, c’est la variabilité du type de l’écriture (manuscrite, cursive, ou imprimée).

L’O.C.R

La reconnaissance de l’écriture est mieux connue sous le nom d’O.C.R (Optical Character Recognition). Les premières tentatives remontent aux années 1900 par TYURIN, au cours desquelles on inventa le scanner à balayage pour la télévision ; et en l’an 1912 par ALBE et en l’an 1925 par Thomas, qui ont mimé l’interprétation Humaine de l’informatique visuelle , un point de transformation est apparue avec l’invention du premier ordinateur en 1946 par MAUCHLY et ECKERT , quelques années plus tard les premières expériences en reconnaissance de caractères ont pu être réalisées ;pendant les année soixante , et soixante dix, les premiers systèmes de l’écriture automatique du texte imprimé ont vu le jour [AYA 04].

Aussi, en 1975 les japonais utilisaient couramment les lecteurs qui déchiffrent le code postal inscrit à la main ou tapé à la machine. Dans la même période, le Français CONTER construisait un système de lecture automatique de texte imprimé destiné aux non voyants, par la suite la compagnie américaine KURZWELL a amélioré le système précédent en proposant les machines à lire pour aveugle formulant le texte à haute voix par synthèse vocale [MAT 90]. Durant cette phase les chercheurs se sont heurtés à de nombreuses difficultés outre la complexité du problème de la reconnaissance due à la grande variabilité de l’écriture manuscrite, la non disponibilité de mémoire et de puissance de calcul pour la réalisation des systèmes concrets opérant en temps réel, par contre depuis 1980 où les récents progrès électroniques et plus particulièrement l’avènement de calculateurs puissants a faible coût ont permis de résoudre ce type de problème et les recherches en reconnaissance manuscrite se sont multipliées de manière spectaculaire,et de nombreuses nouvelles techniques ont vu le jour.

Domaine d’application O.C.R

L’O.C.R connaît plusieurs applications pratiques dans plusieurs domaines parmi lesquels on cite :

Domaine bancaire : Pour l’authentification des chèques par les banques.

Assistance à l’éducation : Pour la reconnaissance et la traduction de textes en braille et l’apprentissage de l’écriture (lecture, écriture) des photo-senseurs, Et des simulateurs tactiques sont utilisés.

Lecture des adresses postales : la lecture des codes postaux manuscrits associés à la lecture des noms de villes a permis d’atteindre le développement des machines de tri automatique de courrier (lettres et objets plats).

La police et la sécurité : pour la reconnaissance des numéros minéralogiques pour le contrôle routier, l’authentification de manuscrits et l’identité des scripteurs. Enfin on trouve encore des applications pour Bureautique, télécommunication … etc Il n’existe pas un système universel d’O.C.R qui peut traiter tous les cas de l’écriture, mais plutôt des voies d’approche dépendant du type de données traitées et bien évidemment de l’application visée [BEL 92]. On utilise autrefois le terme O.C.R ou reconnaissance de caractère qui appartient au domaine lecture automatique de document qui couvre trois axes :
• Lecture optique des caractères imprimés
• La reconnaissance de caractères manuscrits
• La reconnaissance de l’écriture manuscrite cursive.

RECONNAISSANCE DE CARACTERES

La reconnaissance de caractères signifie le décodage de n’importe quel texte imprimé ou manuscrit ou information symbolique, par exemple les formules mathématiques ….. etc.  une dichotomie des types d’écriture faite selon le média, le support saisi et l’application considérée. La reconnaissance des caractères manuscrits est considérée plus difficile que la reconnaissance de l’imprimé pour lequel des systèmes opérationnels commerciaux existent.

Document imprimé 

L’invention de procédés d’impression par Gutenberg vers le milieu du quinzième siècle a transformé notre vie par une diffusion plus large et plus rapide de connaissance, la majorité de patrimoine culturel et technique de l’humanité n’est encore disponible que sous forme de document papier ; les entreprises et les collectivités sont ainsi confrontées à un besoin de retraitement, c’est-àdire conversion rétrospective pour passer à un format électronique . les différentes étapes de passage de la forme papier vers des formes électroniques codées.

Caractéristiques des caractères imprimés

Le texte imprimé est composé de caractères majuscules, minuscules, signes de ponctuation, chiffres regroupés en ligne, paragraphes en bloc, ils ont une certaine forme et de taille variée ; les unités qui sont les caractères nommés fonte ont leur attribut le nom corps qui correspond à la taille de ces fontes qui est déterminée par la hauteur totale des caractères les plus grands, plus les blancs de séparation avec les zones supérieures et inférieures ;sans oublier le style de l’écriture, et comme il existe plusieurs fontes pour un caractère on est obligé d’aller vers la standardisation des fontes. On donne trois types de fonte standardisés qui ont OCRA, OCR.B, OCR canadienne.

L’écriture manuscrite comme la parole fait partie de nos modes d’expression les plus évolués en tous les cas les deux sont très complexes, c’est un moyen particulier de codage de l’information qui concerne nos idées, pensées, nos sentiments, d’une autre façon la reconnaissance de l’écriture en général possède deux caractéristiques: Un liée au scripteur par exemple vérifier une signature d’un auteur. L’autre liée au sens de ce qui est écrit (contextuelle).

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

INTRODUCTION
CHAPITRE I : Etat de l’art
I- Introduction
II- L’O.C.R.
II-1.Domaine d’application O.C.R
III-Reconnaissance de caractères
III.1.Document imprimé
III.2.Caractéristiques des caractères imprimés
III.3.Document manuscrit
III.3 .1.La nature de l’écriture
a. Variabilité propre au scripteur
b. Variabilité intentionnelle
c. Variabilité émotionnelle
d. Variabilité circonstancielle
e. Variabilité contextuelle
III.3 .2 Réduction de la complexité d’écriture
III.3 .3 Modes d’acquisition
a. Modes en ligne
b. Modes hors ligne
III.3 .4.Taxonomie des méthodes d’extraction des caractéristiques
.III.3 .5.Types de caractéristiques
IV. Méthodes de reconnaissance
IV 1.Reconnaissance avec contraintes
IV .2.Reconnaissance sans contraintes
a_ Méthode structurelle
b_ Méthode de texte
c_ Méthode basée sur prototype
VI. Conclusion
CHAPITRE II : Traitement et analyse
I .Notation empruntée au domaine du traitement de l’image
I .1.Définition d’une Image
II .Numérisation du document
II .1.Système d’acquisition
II .2.Les caméras
II .3.Le scanner
a -Format Bitmap
b- Format vectoriel
III. Binarisation et filtrage
III .1.Binarisation
a -Binarisation globale
b- Binarisation par zone d’intérêt
c- Binarisation locale
III.2 .Normalisation
III.3.Filtrage
a Filtrage linéaire
b- Filtrage non linéaire
c- Filtrage morphologique
IV. Analyse et interprétation
IV.1.Notion de segmentation
IV.2. L’objectif d’une segmentation
a- Segmentation puis reconnaissance
b- Segmentation basée sur la reconnaissance
c- Segmentation implicite
IV.3.Méthode descendante
IV.4.Méthode ascendante
V. Les approches de segmentation pour extraire les caractéristiques
1_Approche région
2_Approche contour
3_Approche mixte
V.1.Extraction de contour
a- Filtres différentiels du premier ordre
b- Filtres différentiels du second ordre
V.2. Les méthodes de squelettisation
a- Extraction du squelette
1- Axe médian
2- Amincissement
b- Algorithme d’Amincissement
1- Illustration des phases de déroulement le l’Algorithme
2- Les avantages de cet algorithme
3- Les inconvénients
c- Propriétés du squelette
VI. Les différentes représentations des régions et des contours
VII .Conclusion
CHAPITRE III : Extraction des paramètres
I. Extraction des caractéristiques
II. Différents niveaux de représentation
II.1. Pouvoir de la représentation
a- Calcul statistique
b- Une description symbolique
c- Description par codage d’un squelette
III. Moments de projections
III.1. Définition d’une projection
III.2. Méthode de calcul de projections
a- Projection verticale
b- Projection horizontale
c- Projection sur la diagonale (45°)
d- Projection sur la diagonale (135°)
III.3. Extraction des paramètres de projection
a- Relation entre les moments de projections et invariants
b- Les démarches d’extraction des paramètres de projection
IV. Représentation d’un squelette
IV.1 Codage de la trace d’un squelette
IV.2.Description exacte d’une courbe par code de Freeman
a. Algorithme de code de Freeman
b. Propriété de code de Freeman
c- Les inconvénients
V. Segmentation du squelette
1-A partir du contour (ou courbe discrète)
2-A partir du signal
V.1.La sélection des points d’intérêt à partir du contour
V.2. Détection des points d’intérêt à partir du signal
a- Notion d’empreinte digitale
b- Principe de construction
c- Interprétation et segmentation dans l’espace de résolution
VI. Procédure d’extraction des primitives structurelles proposée
VI.1. Détermination de la courbure
VI.2. Problème de passage de la courbure continue vers la courbure discrète
VI.3. Calcul de la courbure discrète
a- Calcul de la courbure à l’aide de l’abscisse curviligne
b- La Méthode de calcul
c- Détection des points dominants
d- Vecteur de primitive structurelle
CONCLUSION

Lire le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *