Contribution à la reconnaissance d’écriture arabe

Contribution à la reconnaissance d’écriture arabe

L’amincissement

Les termes érosion ou éclaircissage ont un sens assez semblable à celui d’amincissement employé en morphologie mathématique et qui est contenu dans le terme anglais « thinning ». Cette technique consiste à appliquer un élément structurant d’une transformation dans laquelle le pixel central noir est remplacé par un pixel blanc en fonction de la configuration des pixels voisins. Il existe trois stratégies sur la manière d’appliquer ce masque à l’ensemble des pixels de l’image. Dans la première, un balayage horizontal et vertical de toute l’image est effectué en plusieurs passes jusqu’à ce qu’il ne reste plus de pixels à éroder, ou encore en une seule passe avec une érosion directe des pixels à chaque translation du masque. La troisième stratégie consiste en un suivi de contour appliqué successivement d’une manière analogue à une érosion « naturelle ». A l’intérieur de chacune de ces stratégies, on rencontre de nombreuses variantes qui conduisent à des améliorations portant sur les imperfections classiques du squelette.

Segmentation de texte en lignes

Pour localiser les lignes de texte il est possible de s’appuyer sur un modèle physique de disposition de l’écriture. La complexité de cette étape est très variable. En effet, on peut supposer en général que les lignes d’écriture sont plus ou moins parallèles et horizontales et mettre en oeuvre alors des méthodes de détection relativement simples et satisfaisantes. Toutefois les problèmes ne sont absolument pas résolus dans le cas de documents manuscrits présentant des dispositions variables, des ratures, des inclinaisons ou des chevauchements de lignes. Cependant, quelles que soient les approches envisagées, des problèmes subsistent notamment lorsque les lignes d’écriture se superposent partiellement en présence d’extensions hautes ou basses qui s’étendent jusque sur la ligne d’écriture inférieur ou supérieure. Le choix des points de coupure reste alors un problème difficile à résoudre sans faire appel au module de reconnaissance. La méthode triviale de séparation de lignes fait appel à la projection horizontale qui n’est rien d’autre qu’une simple somme du nombre de points allumés par ligne. On peut dire le début ou la fin d’une ligne de texte sont détectés, si la valeur de projection horizontale (figure 3) est inférieure à un seuil.

Segmentation des lignes en mots

La localisation des mots dans les textes manuscrits est un problème qui relève du paradoxe de Sayre (1973) (Il faut segmenter le tracé pour reconnaître une lettre, mais il faut reconnaître une lettre pour segmenter le tracé). En effet, si théoriquement les règles de disposition de l’écriture imposent de marquer des espaces entre les mots plus importants (le cas d’imprimé), en pratique ces règles ne sont pas toujours vérifiées sur les écritures manuscrites non contraintes. Et on doit admettre que pour résoudre le problème, il est nécessaire de demander l’aide d’un système de reconnaissance. De ce fait la localisation des mots dans une ligne de texte est un problème qui s’apparente à celui de la reconnaissance des caractères dans les mots. On peut classer les approches proposées dans la littérature en deux grandes familles:
 La première concerne les approches qui recourent à une métrique spécifique adaptée au problème afin d’ordonner de la meilleur façon possible les espaces détectés dans les lignes pour qu’une simple technique de seuillage puisse permettre de séparer les espaces inter-mots des espaces inter-caractères.
 La seconde met en oeuvre une étape de pré-connaissance pour attribuer les espaces détectés dans la phrase à l’une des deux classes, espace inter-mots, espace inter-lettres.

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela rapport gratuit propose le téléchargement des modèles gratuits de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

Introduction Générale
Chapitre I : La reconnaissance de l’ecriture
I. Introduction
II. Différents aspects de l’OCR
1. Reconnaissance en ligne et hors-ligne
a. Reconnaissance en ligne
b. Reconnaissance hors-ligne
2. Reconnaissance globale et analytique
a. Approche globale
b. Approche analytique
III. Les étapes d’un système de reconnaissance
1. Acquisition
a. Résolution
b. Niveau d’éclairage
2. Prétraitements
a. Redressement de l’écriture
b. Lissage
c. Normalisation
d. Squelettisation
i. Extraction du squelette
ii. L’amincissement
iii. Les algorithmes à critères topologiques
3. Segmentation (Etat de l’art)
a. Segmentation de la page
b. Segmentation de texte en lignes
c. Segmentation des lignes en mots
d. Segmentation des mots en caractères
i. Organisation des méthodes
ii. Technique de dissection pour segmentation
iii. Segmentation basée reconnaissance
iv. Stratégies mixtes (sur-segmentation)
v. Stratégies holistiques
4. Extraction des caractéristiques
a. Caractéristiques structurelles
b. Les caractéristiques statistiques
c. Les transformations globales
d. Superposition des modèles (template matching) et corrélation:
5. Classification
a. L’apprentissage
b. Reconnaissance et décision
i. Approche statistique
ii. Approche structurelle
iii. Approche stochastique
iv. Approche hybride
6. Post-traitement
Chapitre II : L’OCR et la langue arabe
I. Introduction
II. Caractéristiques de l’alphabet arabe
III. Données graphiques de l’alphabet arabe
IV. Ocr arabe (AOCR)
Chapitre III : Contribution à la reconnaissance d’écriture arabe
I. Corpus
II. Prétraitement de l’image
1. Chargement de l’image
2. Binarisation
3. Segmentation en lignes
4. Segmentation en mots
5. Segmentation en caractères
a. Détermination de la ligne maximale
b. Elimination de la ligne de base
c. Mots qui ne sont pas concernés par l’élimination de la ligne de base
i. Mots constitués d’un seul caractère
ii. Mots constitués uniquement des caractères isolés
d. Détection des vides entre les caractères dans le mot sans ligne de base
e. Problème de chevauchements des caractères arabes
i. Comment détecter le chevauchement de deux caractères ?
ii. Comment résoudre le problème du chevauchement ?
f. Problèmes restants (limites) de l’approche proposée pour la segmentation en caractère
i. Problèmes liés à l’élimination de la ligne de base
ii. Problèmes liés à la forme de quelques caractères arabes
III. Construction de la base de données
1. Méthode classique pour la construction des caractères
2. Méthode proposée pour la construction des caractères
IV. Etape de la reconnaissance
1. Prétraitement sur les images des caractères requêtes
a. Squelettisation
b. Rogner l’image
2. Les points d’intérêts du squelette
3. Comparer un caractère requête avec les modèles de la base de données
4. Reconnaissance du texte
5. Correction des défauts de la segmentation
6. Amélioration de la reconnaissance (Post-OCR)
7. Optimisation de la base de données
Chapitre IV : Application et résultats
1. Outil de développement : Eclipse
2. Segmentation en lignes
a. Résultats de la segmentation en lignes
b. Taux de réussite de la segmentation en lignes
3. Segmentation en mots
a. Résultats de la segmentation en mots
b. Taux de réussite de la segmentation en mots
4. Segmentation en caractères
a. Résultats de la segmentation en caractères
b. Taux de réussite de la segmentation en caractères
5. Reconnaissance des caractères
a. Résultats de la reconnaissance
b. Taux de réussite de la reconnaissance :
6. Comparaison avec d’autres systèmes
a. Comparaison de la segmentation en caractères avec le système [86]
b. Comparaison de la reconnaissance avec le système [86]
c. Comparaison de la reconnaissance avec le système Sakhr
7. Conclusion
Conclusion et perspectives
Références