Présentations interactives en multimédia 3D pour les applications en ligne

Différents systèmes de RI textuelle sur le Web

              Il existe de nombreux portails pour accéder aux informations disponibles sur le Web. La plupart proposent un moteur de recherche en texte intégral sur les pages du Web (e.g. Google). Il s’agit de l’approche la plus utilisée actuellement. Ce type de moteur de recherche nécessite que l’utilisateur exprime ses besoins sous la forme d’une requête qui est interprétée et exécutée. Le moteur cherche alors les documents qui sont les plus pertinents aux mots-clés de la requête et les présente à l’utilisateur. Les méthodes utilisées pour calculer la pertinence diffèrent selon les moteurs de recherche mais les facteurs généralement utilisés sont : le nombre d’occurrences du mot clé dans le document, la position du mot-clé dans le document, la présence du mot-clé dans le titre du document, la conformité entre les mots-clés de la requête et ceux fournis par l’auteur du document, l’identification de la phrase. . . Les avantages de cette approche sont le grand nombre de documents indexés dans la base, le mécanisme de ré-indexation, la rapidité de l’interprétation de la requête et de la présentation des résultats. Par contre la pertinence des informations trouvées dépend d’algorithmes intégrés et reste donc en dehors du contrôle des utilisateurs. De plus, des requêtes trop vastes rendent un nombre trop important de documents dont l’analyse est impossible avec les méthodes de visualisation actuellement proposées. Bien que les moteurs par requêtes soient la méthode la plus utilisée, il existe d’autres approches pour rechercher des informations sur le Web. Ainsi, les trois systèmes cités ci-dessous, font partie des exemples qui se distinguent des moteurs par requêtes grâce à certaines propriétés spécifiques. Cependant, leur fonctionnement global ne diffère que très peu des moteurs par requêtes évoqués ci-dessus. Les annuaires (ou directory). Ils sont basés sur une hiérarchie de catégories définie manuellement. Chaque catégorie est constituée de sous-catégories et/ou d’une liste d’URL. Les annuaires permettent alors d’avoir un classement thématique des documents, sachant qu’un document peut appartenir à plusieurs catégories en même temps. Ils se présentent donc comme un inventaire, disciplinaire (spécialisé dans un domaine) ou généraliste, dans lequel les sites référencés sont classés par catégorie. L’ajout de documents dans cette hiérarchie peut se faire manuellement (vérification du choix utilisateur par l’administrateur) ou automatiquement (ajout du document dans la catégorie choisie par l’utilisateur sans vérification). Deux utilisations de ce type d’annuaire sont possibles. La première consiste à naviguer dans l’annuaire afin de trouver les informations recherchées. Dans ce cas, il n’y a pas de requête de l’utilisateur, ce qui correspond à la tâche de RI dite de navigation. La seconde utilisation est similaire à celle des moteurs par requête, à l’exception près que le système connaît, pour chaque résultat, la catégorie à laquelle il appartient. Dans notre contexte, seule la deuxième utilisation qui se rapproche des moteurs par requête est envisageable. La qualité des annuaires est généralement évaluée par le nombre de documents disponibles ainsi que par la structure des catégories. Les inconvénients majeurs de cette approche sont le faible nombre de documents disponibles, l’absence d’un mécanisme d’expiration et la possibilité d’avoir des catégories ambiguës. Les méta-moteurs. Ils peuvent être assimilés à des moteurs par requêtes ayant la particularité d’envoyer la requête à plusieurs moteurs simultanément et de faire une synthèse des résultats ainsi obtenus. Les principaux défis des méta-moteurs sont de trouver une méthode efficace pour fusionner les listes de résultats provenant des différents moteurs interrogés, ainsi que de choisir pertinemment ces moteurs. Les moteurs peer to peer. L’idée du concept peer to peer vient des systèmes de recherche de fichiers musicaux. Un moteur de recherche peer to peer ne requiert pas de serveur central contenant les informations. L’idée est de propager une requête à travers le réseau aux ordinateurs participant à ce système. Les ordinateurs ne possédant aucune information demandée passent la requête. L’ordinateur possédant l’information désirée envoie l’information au demandeur en réalisant le chemin inverse sur le réseau. Le demandeur peut alors accéder aux documents en se connectant directement au fournisseur de l’information. Les avantages de cette technique sont l’absence de serveur central sophistiqué et coûteux, et la présence d’une mise à jour des informations stockées. Par contre cette approche nécessite d’équiper les ordinateurs participant à ce système d’un logiciel spécial. Elle prend également plus de temps et la pertinence des résultats dépend d’algorithmes intégrés et d’une description fournie par le propriétaire de l’information. Bien que cette méthode diffère de par les informations disponibles et leur transfert sur le réseau, du point de vue de l’utilisateur ce système peut être assimilé à un moteur par requête.

Visualisations géométriques

Panel matrices. Cette technique consiste à fournir une configuration de représentations bivariées de l’espace multidimensionnel d’observation dans des matrices. Les matrices de graphes de dispersion (ou Scatterplot matrices) sont les exemples les plus connus [Cleveland 1993] (figure A.1 de l’annexe A). Cependant, ce type de représentation n’est absolument pas adapté à un grand nombre de variables. Un autre inconvénient est le manque d’une représentation unifiée des données. D’autres exemples de Panel Matrices sont Prosection Views [Furnas et Buja 1994] et HyperSlice [van Wijk et van Liere 1993].
Coordonnées parallèles et en étoile. Ces deux méthodes permettent de représenter un espace de N-dimensions sur un plan en 2 dimensions. Les coordonnées parallèles [Inselberg 1998] utilisent des axes parallèles et équidistants (figure A.2 de l’annexe A) alors que les coordonnées en étoile [Kandogan 2000] utilisent des axes en forme d’étoile (figure A.3 de l’annexe A). Ainsi, l’espace nécessaire en coordonnées parallèles augmente linéairement avec le nombre de dimension (du fait de l’espace constant inter-axes), contrairement aux coordonnées en étoile ou cet espace est indépendant du nombre de dimensions. Cela permet donc d’avoir, en coordonnées en étoile, une visualisation moins encombrée dans le cas de grandes dimensions.

Visualisations basées sur la distribution des termes de la requête

                  Les techniques de visualisation présentées dans cette partie sont basées sur l’importance des termes de la requête dans les documents retournés par le système de recherche. L’idée générale consiste à associer un mot-clé de la requête (ou une combinaison de mots-clés) à un axe ou une position de l’espace ; puis de positionner les documents dans cet espace en se basant, le plus généralement, sur la fréquence d’apparition du mot-clé dans le document. Ces techniques permettent donc d’identifier les relations entre les résultats et les mots-clés de la requête. Par contre, elles ne permettent pas réellement de distinguer les relations entre documents. En effet, deux documents peuvent avoir un comportement similaire par rapport aux mots-clés de la requête et pourtant être différents. Nous présentons dans la suite quatre exemples de visualisations basées sur la distribution des termes de la requête. TileBars. Il s’agit d’une représentation qui permet de visualiser la pertinence desdocuments par rapport à la requête (figure 1.7(a)) [Hearst 1995]. Chaque document est représenté par un ensemble de barres carrelées dont la longueur dépend de celle du document. Chaque barre correspond à une composante de la requête (généralement une catégorie demandée). La correspondance entre un segment du document et une catégorie demandée est représentée par une coloration du carreau correspondant dans la barre de la catégorie par une valeur appropriée sur l’échelle des niveaux de gris. Cette méthode permet d’identifier la pertinence par rapport à la requête des différentes parties d’un document. Ce concept a été repris plus récemment dans la métaphore Webdocball qui l’améliore en introduisant l’aspect hiérarchique présent dans la structure des documents [Vegas et al. 2003]. Par contre la requête est désormais considérée dans son ensemble et ne peut plus être décomposée en différentes parties. VR-VIBE. Cette application propose une visualisation, dans un espace virtuel, des résultats issus d’un processus de RI [Benford et al. 1995]. L’objectif est de permettre à l’utilisateur de naviguer dans des représentations tridimensionnelles des documents et de communiquer avec d’autres utilisateurs réalisant la même tâche. L’idée générale de la visualisation proposée consiste à placer trois mots-clés de la requête dans un espace 3D ; puis les documents sont placés dans cet espace en fonction de leur pertinence à chacun des mots-clés. L’utilisation de la couleur permet de différencier les différents degrés de pertinence (figure 1.7(c)). Three-keyword axes display. Cette interface est proposée comme une alternative à l’affichage linéaire du rang des documents [Cugini et al. 1996]. Il s’agit de représenter les documents par des icônes dans un espace 3D où chaque axe représente un ensemble de mots-clés (figure 1.7(d)). L’avantage de cette représentation est de permettre à l’utilisateur de voir, de façon interactive, comment les termes de la requête sont liés aux documents. Easy-DoR. Il s’agit d’une interface intelligente et adaptative d’aide à la RI sur le Web [Chevalier 2002]. Easy-DoR9 repose sur une coopération entre les utilisateurs, à travers notamment leurs navigations sur le Web mais également de leur hiérarchie de signets. L’outil de recommandation pour la connaissance de l’utilisateur permet de faire évoluer la connaissance à long terme de ses centres d’intérêt grâce à de nouveaux documents pertinents. Ces centres d’intérêt sont déduits de sa hiérarchie de signets. Du fait de cette meilleure connaissance, l’utilisateur peut formuler de manière plus précise les requêtes et ainsi obtenir de meilleurs résultats. La recommandation durant la navigation repose sur une représentation des centres d’intérêts des utilisateurs sous la forme d’un multi-arbres afin d’obtenir une représentation unique de tous les centres d’intérêt des utilisateurs. Ce multi-arbres est exploité pour identifier des documents pertinents pour la navigation d’un utilisateur. L’interface de visualisation des résultats de recherche d’information permet d’appréhender les résultats de recherche de façon globale au travers d’une représentation des documents dans un espace 3D en utilisant les couleurs (figure 1.7(b)). La combinaison de deux axes d’interprétation (organisation spatiale et couleurs) permet à l’utilisateur une meilleure appréhension de l’importance des différents critères de recherche au sein des documents. L’outil de gestion de la hiérarchie de signets permet à un usager de s’affranchir du travail fastidieux qu’est le suivi des documents mémorisés ainsi que de la réorganisation des signets. Cet outil offre à l’utilisateur la possibilité de connaître les modifications apportées aux documents mémorisés mais également une aide pour organiser ces documents. Ces approches permettent donc de visualiser les relations entre les différents documents et les termes de la requête. Cependant, aucune information fiable sur les relations entre les documents n’apparaît. En effet, deux documents peuvent réagir de façon similaire aux termes de la requête (et donc être voisins sur ce type de représentation) sans pour autant contenir des informations similaires. Ces techniques permettent uniquement de visualiser la distribution des termes de la requête au sein des différents résultats de la requête. De plus, elles conservent un affichage linéaire restreint (TileBars), ou alors elles proposent une vue d’ensemble qui complique la navigation et l’identification d’un document particulier (ainsi que l’accès à ce document). Une approche similaire est DocCube qui propose une visualisation 3D ne se basant plus sur les termes de la requête mais sur des hiérarchies de concepts [Mothe et al. 2003].

Ergonomie

               La pertinence d’une visualisation passe évidemment par la prise en considération de certains aspects ergonomiques. Cela va de critères relativement simples et courants à une réflexion plus théorique sur notre système de perception. Critères de visualisation. Il est nécessaire d’évaluer a posteriori la pertinence d’une visualisation. Cette évaluation doit passer par la vérification de critères d’ordre ergonomiques tels que : le temps d’exécution, l’utilisabilité des fonctions, les possibilités et la qualité des interactions, la pertinence des visualisations proposées. On peut alors s’intéresser à quatre facteurs principaux qui influencent l’utilité et l’efficacité d’une visualisation [Mann 1999] :
– Le groupe d’utilisateur cible. Il dépend de la manière de penser dans l’espace ou de percevoir l’information.
– Le type de données. Il conditionne le choix de représentation graphique. La présence de hiérarchie entre les documents doit être exploitée dans la visualisation.
Le nombre de documents influence sur le succès de la visualisation.
– La tâche à effectuer. Ce facteur est important pour l’efficacité d’une visualisation. Il y a grand nombre de tentatives pour classer ou évaluer les visualisations pour différentes formes de tâches.
– Les possibilités techniques. Elles sont déterminantes pour l’utilisation et le succès de la visualisation.
Il n’existe pas de meilleure visualisation pour tous les cas d’utilisation. Il existe juste au moins quatre facteurs qui influencent l’efficacité des visualisations. De toutes les façons, il semble extrêmement difficile de trouver une visualisation qui satisfasse les attentes de ces quatre facteurs. Il est donc nécessaire de réaliser un compromis entre ces différents facteurs.
Perception humaine. Le but de ce paragraphe est simplement de rappeler qu’il existe des notions importantes dans ce domaine pour pouvoir traiter efficacement la visualisation de données. En effet, la méthodologie de conception de langages graphiques doit prendre en compte la nature des informations à visualiser mais aussi les capacités de la vision humaine. Ce dernier point fait appel à des théories issues du domaine des sciences cognitives telles que la sémiologie graphique [Bertin 1999] et la théorie de la Gestalt [Paul 1979]. L’objectif est de proposer une méthodologie rigoureuse de conception des langages graphiques [Lamy et al. 2006]. Nous proposons en guise d’exemple quelques éléments sur la perception visuelle et spatiale.
– Perception visuelle. L’étude de notre système de perception visuel peut se révéler utile pour le choix des métaphores de visualisation des données et de leurs propriétés. Certaines erreurs sont à éviter comme le choix de conventions arbitraires dont la signification peut varier selon la zone géographique. Dans la plupart des cas, ces conventions sont adaptées à l’Europe et au nord de l’Amérique. Par exemple, les couleurs rouge (pour signifier « attention ») et vert (pour signifier « OK ») n’ont pas la même signification en Chine. Il faut aussi éviter d’utiliser la couleur pour représenter des données quantitatives continues, étant donné que notre cerveau ne nous permet de détecter qu’un certain nombre de couleurs. Il existe de nombreux autres exemples. Par contre, il peut être utile d’utiliser certaines propriétés de notre système visuel telles que la vision pré-attentive qui permet d’avoir des certitudes à 100% sur certaines valeurs. Toutefois, le nombre de ces valeurs est dépendant de la dimension et des interférences. Par ailleurs, on remarque que bien souvent notre jugement relatif est meilleur (jusqu’à une certaine limite) que notre jugement absolu.
– Perception spatiale. Elle n’est pas toujours évidente et dépend des utilisateurs. Cela est d’autant plus vrai pour les affichages 3D où la profondeur est souvent caractérisée par une diminution des textures et des dimensions. Les occultations, bien qu’elles permettent de situer la profondeur de certains objets, sont un problème récurrent de ces interfaces 3D. L’impact de la perception humaine sur la conception de méthodes de visualisation a été revisité dans de nombreux travaux [Healey et Enns 2002, Kosara et al. 2003].

Catégories hiérarchiques à facettes

             Un système de catégories est un ensemble d’étiquettes significatives (i.e. mots représentatifs) organisées de manière à refléter les concepts pertinents à un domaine. Il s’agit donc en quelques sortes d’un thesaurus. Ces catégories sont créées manuellement, bien qu’il soit possible d’automatiser l’affectation des documents aux catégories avec un certain degré de précision. Un bon système de catégories se doit d’être cohérent et relativement complet. Mais il reste à définir le type de structure de catégories le plus efficace pour l’exploration et la navigation dans les collections d’information. Et il apparaît que l’organisation strictement hiérarchique des catégories est une solution trop « pauvre » pour ce type d’utilisation. Une représentation alternative est alors apparue ces dernières années, sous le terme de catégories hiérarchiques à facettes [Yee et al. 2003]. Cette solution, basée sur une idée très simple, est intermédiaire en termes de complexité mais elle est surtout très riche en termes de flexibilité. Plutôt que de créer une seule grande hiérarchie de catégories, l’idée est de construire un ensemble de hiérarchies de catégories, chacune correspondant à une différente facette (i.e. une dimension ou un type de caractéristique) pertinente par rapport à la collection dans laquelle on doit naviguer. Flamenco [Yee et al. 2003] est un exemple de type d’interface intuitive pour l’exploration et la découverte dans des collections d’information utilisant les HFC.

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

Notations
1 Restitution des résultats de recherche 
1.1 Contexte de la RI textuelle 
1.1.1 Différents systèmes de RI textuelle sur le Web
1.1.2 Différentes étapes d’un moteur de recherche
1.1.3 Interface de restitution
1.1.4 Évaluation de la qualité des résultats
1.2 Visualisation des résultats 
1.2.1 Visualisation des attributs
1.2.1.1 Visualisations géométriques
1.2.1.2 Visualisations symboliques
1.2.1.3 Discussion
1.2.2 Visualisation des résultats sous la forme de classement(s)
1.2.2.1 Classement simple
1.2.2.2 Classement multiple
1.2.2.3 Classement personnalisé
1.2.3 Visualisation des relations entre les résultats
1.2.3.1 Visualisations basées sur la distribution des termes de la requête
1.2.3.2 Approches cartographiques basées sur la notion de graphes
1.2.3.3 Visualisations topographiques respectant la notion de proximité sémantique
1.2.3.4 Organisation basée sur une catégorisation hiérarchique des résultats
1.2.4 Nombre de dimensions
1.2.4.1 Visualisations 3D
1.2.4.2 2D Vs 3D
1.3 Méthodes d’interaction
1.4 Ergonomie 
1.5 Discussion 
2 Organisation des résultats 
2.1 État de l’art sur l’organisation des résultats de recherche
2.1.1 Clustering
2.1.2 Catégories hiérarchiques à facettes
2.1.3 Discussion
2.2 Présentation de la méthode des cartes auto-organisatrices
2.2.1 Principe
2.2.2 Algorithme
2.2.2.1 Algorithme stochastic SOM
2.2.2.2 Algorithme batch SOM
2.2.2.3 Méthode des k-means ou k-moyennes
2.2.2.4 Fonction de voisinage
2.2.2.5 Initialisation
2.2.2.6 Critère de convergence
2.2.2.7 Complexité
2.2.2.8 Choix des distances
2.2.3 Étiquetage d’une carte auto-organisatrice
2.2.4 Extensions
2.2.5 Interprétation
2.3 Organisation des résultats 
2.3.1 Pré-traitement des résultats
2.3.2 Auto-organisation des résultats
2.3.3 Post-traitement des résultats organisés
2.4 Évaluation de l’organisation 
2.5 Discussion 
3 Visualisation 
3.1 Introduction
3.1.1 Définition des éléments à visualiser
3.1.2 Approche proposée
3.2 Métaphore 3D de la ville
3.2.1 Principe
3.2.2 Caractéristiques
3.2.2.1 Première version
3.2.2.2 Évolution
3.2.3 Navigation
3.2.3.1 Première version
3.2.3.2 Évolution
3.2.3.3 Améliorations
3.3 Discussion
3.3.1 Critères spécifiques aux métaphores 3D
3.3.2 Bilan
4 Prototype SmartWeb 
4.1 Présentation générale
4.2 Architecture 
4.2.1 Architecture d’un point de vue conceptuel
4.2.2 Architecture d’un point de vue implémentation
4.2.2.1 Partie serveur
4.2.2.2 Partie client
4.3 Caractéristiques du prototype 
4.3.1 Langage X-VRML
4.3.1.1 Apports du X-VRML
4.3.1.2 Spécifications du X-VRML
4.3.1.3 Comparaison avec X3D et Java 3D
4.3.2 Personnalisation
4.4 Utilisation du prototype
4.4.1 Fonctionnement
4.4.2 Exemple
4.4.2.1 Spécifier sa requête
4.4.2.2 Utilisation de la métaphore de ville
4.4.2.3 Utilisation de la métaphore de la galerie
4.5 Applications 
5 Évaluation 
5.1 Première évaluation 
5.1.1 Contexte
5.1.2 Protocole
5.1.3 Résultats
5.1.3.1 Profil des utilisateurs
5.1.3.2 Évaluation du prototype SmartWeb
5.1.3.3 Analyse globale des résultats
5.1.3.4 Discussion
5.2 Définition d’un nouveau cadre d’évaluation 
5.2.1 Motivations
5.2.2 Évaluation d’une IUI
5.2.3 Critères d’évaluation
5.2.3.1 Critères liés à l’usager
5.2.3.2 Critères liés à la tâche de l’usager
5.2.3.3 Critères liés au système
5.2.4 La phase d’évaluation
5.2.4.1 Données
5.2.4.2 Fonctionnalités des IUI
5.2.4.3 Jeux de requêtes
5.2.4.4 Les évaluateurs
5.2.5 Conclusion
5.3 Discussion 
Glossaire

Télécharger le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *