Lorsquโun utilisateur souhaite composer un document numรฉrique (schรฉma, diagramme ou autres), plusieurs options sโoffrent ร lui. La premiรจre, qui est aujourdโhui la plus courante, consiste ร utiliser des logiciels dรฉdiรฉs basรฉs sur une interaction clavier/sourie. Ces logiciels offrent de nombreuses possibilitรฉs de reprรฉsentation et fournissent de bons rรฉsultats. Mais ils imposent ร lโutilisateur un apprentissage approfondi pour la manipulation du logiciel et une mรฉmorisation des fonctionnalitรฉs offertes. La seconde consiste ร dessiner le document sur une feuille de papier, de la numรฉriser et dโutiliser un logiciel dโinterprรฉtation dโimages dรฉdiรฉ pour reconnaitre le document. Cette mรฉthode ne demande aucun effort ร lโutilisateur, pour la composition du document, mais nรฉcessite un temps de traitement qui peut รชtre รฉlevรฉ avec un rรฉsultat dโinterprรฉtation qui nโest souvent pas trรจs satisfaisant [1-2]. La troisiรจme mรฉthode, celle qui nous intรฉresse dans ce travail, est la composition directe, ร la volรฉe, du document sur surfaces tactiles. Cette mรฉthode consiste ร composer le document ร main levรฉe directement sur le systรจme informatique et ร utiliser un logiciel dโinterprรฉtation en-ligne de tracรฉs manuscrits. Cette technologie vise ร se rapprocher le plus possible dโune utilisation simple et naturelle, non pas en demandant ร lโutilisateur dโapprendre son fonctionnement, mais en adaptant le fonctionnement aux utilisateurs. Ces systรจmes de reconnaissance de formes commencent ร faire leur apparition [3]. Ces interfaces sont dites orientรฉes stylo et nโautorisent souvent quโun seul point de contact pour lโinteraction.
Lโarrivรฉe sur le marchรฉ en 2007 des nouvelles tables et tablettes tactiles multipoints (permettant plusieurs points de contact), ont ouvert un nouveau champ de possibilitรฉs dโusage pour la composition et la manipulation des documents numรฉriques. Jusquโici ces interfaces n’autorisent souvent uniquement que des commandes basiques de manipulation, comme par exemple agrandir une image en utilisant deux doigts ou encore passer dโune page ร lโautre en glissant le doigt sur la surface de lโรฉcran. Nous visons ร travers ce travail lโexploration de ce domaine en approfondissant lโรฉlaboration, la modรฉlisation et la reconnaissance de commandes gestuelles graphiques multipoints plus รฉvoluรฉes.
Composition sur surfaces sensitives ou tactiles
Lโencre รฉlectroniqueย
Le rรฉsultat de lโacquisition des tracรฉs dessinรฉs par un utilisateur, gรฉnรฉralement ร lโaide dโun stylo sur une surface dรฉdiรฉe, est un signal dit en-ligne. Le terme encre รฉlectronique, est aussi souvent utilisรฉ pour dรฉsigner le rendu visuel de ce signal. Le terme tracรฉ dรฉsigne les coordonnรฉes des points, ordonnรฉes dans le temps, reprรฉsentant le parcours du stylo entre un poser et un lever. Les tracรฉs que nous manipulons sont reprรฉsentรฉs comme une sรฉquence de segments reliant ces points.
Interfaces de saisie monopointsย
Les interfaces dโinteraction dites monopoint sont des surfaces tactiles qui ne permettent quโun seul point de contact : un stylo ou un doigt.
Un mot ou un symbole saisi peut รชtre reprรฉsentรฉ par un seul tracรฉ, ou par une combinaison de ces derniers. on parle de geste mono-stroke, alors que le mot IMADOC est reprรฉsentรฉ par la combinaison de six tracรฉs, cette composition est appelรฉ geste multi-stroke. Nous prรฉsentons plus en dรฉtail ces deux typologies de tracรฉs dans la suite de ce document.
Geste mono-stroke
Les premiers systรจmes de reconnaissance de formes en ligne proposรฉs รฉtaient gรฉnรฉralement monostroke . Cette approche consiste ร associer ร chaque symbole du langage visuel considรฉrรฉ, un tracรฉ manuscrit permettant de le dessiner. Cette approche trรจs simple est aujourdโhui encore trรจs souvent utilisรฉe.
Parmi les travaux de reconnaissance de formes basรฉs sur les approches mono-stroke, citons : le systรจme de conception de diagrammes UML [5] ; Le systรจme de reconnaissance de formules mathรฉmatiques [6] ; le systรจme permettant la conception dโinterfaces graphiques SILK [7]. Dans le domaine de la composition musicale, nous pouvons citer le systรจme de Ng et al, appelรฉ Presto [8], et celui dโAnstice et al [9]. Ces systรจmes consistent ร dรฉfinir des formes spรฉcifiques pour chaque symbole reconnus ร partir dโun seul trait. Les approches mono-stroke restent encore loin de lโobjectif initial qui est lโadaptation du systรจme aux habitudes des utilisateurs. Celles-ci demandent une forte implication de la part de lโutilisateur [10], car celui-ci doit souvent apprendre une nouvelle faรงon de dessiner les symboles dโun domaine .
Geste multi-stroke
Lโapproche qui a suivi le mono-stroke et qui est actuellement beaucoup utilisรฉe dans les systรจmes de composition manuscrite sur surface tactile, est celle du multi stroke . Contrairement ร la premiรจre approche oรน un symbole doit รชtre saisi par un seul trait, cette mรฉthode donne la possibilitรฉ de dessiner un symbole en plusieurs traits. Ces traits seront combinรฉs pour former le symbole. Le regroupement des traits est un problรจme complexe.
Plusieurs approches de combinaison ont รฉtรฉ utilisรฉes dans la littรฉrature. La premiรจre mรฉthode demande une forte implication de la part de lโutilisateur, en lui demandant de prรฉciser chaque dรฉbut et fin de symbole en pressant un bouton par exemple : citons les travaux de Kurtoglu et al [11] sur la composition des circuits pour la physique. Une autre approche consiste ร dรฉfinir un dรฉlai minimum entre la saisie consรฉcutive de deux symboles diffรฉrents : la fin de la composition dโun symbole et le dรฉbut de celle dโun autre sont espacรฉs dโune durรฉe dรฉpassant un seuil prรฉdรฉfini [4]. Cette approche est utilisรฉe par Fonseca et al [12] pour leur systรจme de reconnaissance de formes gรฉomรฉtriques. La difficultรฉ de cette mรฉthode rรฉside dans le choix du dรฉlai entre la saisie de deux symboles : trop petit, cela oblige lโutilisateur ร saisir rapidement, ce qui peut gรฉnรฉrer des erreurs, trop long lโutilisateur est contraint dโattendre entre chaque symbole. Bien que ces approches soient moins contraignantes que les approches mono-strokes, elles nรฉcessitent toujours une implication forte de la part de lโutilisateur [4].
Aprรจs avoir regroupรฉ les traits qui forment un symbole, le problรจme est maintenant dโinterprรฉter le symbole composรฉ de ces trais. La troisiรจme mรฉthode de regroupement est une approche automatique qui combine ร la fois regroupement et reconnaissance. Elle consiste ร dรฉcomposer chaque forme saisie en un ensemble de primitives, cette phase nรฉcessite un systรจme de reconnaissance permettant de bien segmenter. Les primitives seront combinรฉes par la suite pour former le symbole. Nous prรฉsentons lโapproche en dรฉtail dans la section ยซ Approches structurelles ร base de grammaire ยป.
Interfaces de saisie multipoints
Les surfaces dโinteraction multipoints autorisent contrairement ร celle monopoints, plusieurs points de contacts simultanรฉs . Cette technologie est actuellement beaucoup utilisรฉe dans les tรฉlรฉphones portables et sur les tablettes numรฉriques. Leurs utilisations rรฉsident principalement dans des dispositifs de navigation et de commandes gestuelles trรจs simples.
Lโexploitation de la technologie dโacquisition multipoint dans le contexte des systรจmes de reconnaissance de formes est au cลur de ce travail. Nous allons donc รฉtudier de plus prรจs la nature des tracรฉs multipoints. Les gestes multipoints sont composรฉs de plusieurs tracรฉs, un pour chaque trajectoire induite par chacun des points de contact (doigt). Un geste multipoint se caractรฉrise donc non seulement par la forme graphique de chacune de ses traces mais aussi par leur positionnement relatif, leur synchronisation ou encore leur dynamique relative.
|
Table des matiรจres
Introduction gรฉnรฉrale
1. Composition sur surfaces sensitives ou tactiles
Introduction
1.1. Lโencre รฉlectronique
1.2. Interfaces de saisie monopoints
1.2.1. Geste mono-stroke
1.2.2. Geste multi-stroke
1.3. Interfaces de saisie multipoints
1.1. Manipulation tactile multipoint : รฉtat de lโart
Conclusion
2. Systรจmes de reconnaissance en ligne
Introduction
2.1. Reconnaissance de gestes multipoints : รฉtat de lโart
2.2. Problรฉmatique
2.3. Systรจmes de reconnaissance en-ligne de formes monopoints : รฉtat de lโart
2.3.1. Approche ยซ statistique ยป de reconnaissance de symboles
2.3.2. Approche ยซ structurelle ยป de reconnaissance de symboles
2.3.3. Reconnaissance de symboles par alignement de sรฉquences
Conclusion
3. Contribution
Introduction
3.1. Architecture du systรจme proposรฉ
3.2. Description des graphes utilisรฉs
3.2.1. Construction des graphes
3.2.2. Etiquetage des graphes
3.3. Projection des graphes
3.4. Phase dโapprentissage
3.5. Phase de reconnaissance
Conclusion
4. Expรฉrimentations
4.1. Objectifs
4.2. Base de gestes
4.3. Protocole
4.3.1. Evaluation de lโimportance de lโinformation topologique
4.3.2. Evaluation de lโimportance de lโinformation liรฉe ร lโรฉtiquetage
4.3.3. Dรฉcoupage de lโensemble des donnรฉes
4.4. Expรฉriences
Conclusion
Conclusion gรฉnรฉrale
Bibliographie