La donnée : de sa création à la génération de modèles 3D
La géomatique et la découverte de connaissance
L’analyse de données s’inscrit dans un processus de découverte de connaissance. La découverte de connaissance (Knowledge Discovery en anglais) est une extraction complexe à partir de la donnée d’une information implicite, au départ inconnue et potentiellement utile (Frawley et al., 1992). Le processus de découverte de connaissance, explicité en Figure 1-1 est de nature itérative et permet de progresser depuis l’exploration des données jusqu’à la présentation de modèles. Ce processus en quatre phases aide l’usager à construire une connaissance dotée d’une composante spatiale (Gahegan et al., 2001; Brisebois, 2003). La phase d’exploration (phase I) a pour objectif la recherche des patrons, de structures et de relations implicites dans un jeu de données. La phase suivante (II) consiste à proposer des hypothèses. Ces dernières sont par la suite validées ou invalidées au moyen d’analyses statistiques (phase III).
Lorsque les résultats sont concluants (phase IV), ils sont communiqués en prenant soin de délimiter leur portée. La géomatique est une « discipline ayant pour objet la gestion des données géographiques et qui fait appel aux sciences et aux technologies reliées à leur acquisition, leur stockage, leur traitement et leur diffusion » (OQLF, 2006). Pour être compatible avec le processus de découverte de connaissance, la géomatique a dû inclure d’autres aspects : l’aide à la décision caractérisée, entre autres, par la technologie OLAP (On-Line Analytical Processing). Ces outils de découverte de connaissances ou d’analyse en ligne visent à assister l’usager dans son analyse en lui facilitant l’exploration de ses données et en lui donnant la possibilité de le faire rapidement (Bédard, 2005). Les travaux de ces dix dernières années sur l’analyse en ligne ont fait ressortir une perspective d’évolution intéressante. Ainsi, Caron, en 1998, a démontré que l’OLAP possède un potentiel réel pour supporter l’analyse spatio-temporelle (Caron, 1998). Cependant, sans volet cartographique, il est impossible de visualiser la composante géométrique des données spatiales. L’ajout de ce volet cartographique a conduit à l’élaboration de l’outil SOLAP (OLAP spatial) : « une plate-forme visuelle supportant l’exploration et l’analyse spatiotemporelle rapides des données selon une approche multidimensionnelle à plusieurs niveaux d’agrégation » (Rivest, 2000). Par la suite, la potentialité de la tridimensionnalité de la technologie SOLAP a été explorée (Brisebois, 2003). Suite aux constats de Brisebois et aux difficultés à manipuler la tridimensionnalité des données (Zlatanova et al., 2002; Lachance, 2005), l’archéologie est apparue comme un excellent domaine d’application. Elle offre des situations permettant de se pencher sur la manipulation des données tridimensionnelles dans un contexte de découverte de connaissance.
L’opportunité archéologique :
l’analyse spatio-temporelle de données 3D Lors de la fouille d’un site archéologique, l’archéologue/fouilleur prend en compte la localisation sur le terrain (x, y, z) des données qui y sont découvertes. Suivant une pratique courante, elles sont enregistrées en regard d’ « unités de fouille » (UF) qui se trouvent être des volumes (tridimensionnels) de terre archéologique qui sont retirés de différents endroits du site lors des opérations de fouille et qui contiennent des artéfacts, des écofacts, des restes humains ou des vestiges architecturaux. Lors du processus d’analyse, les « unités de fouille », et par conséquent le matériel archéologique qu’elles contiennent, sont mises en relation avec les différentes couches de terre stratigraphiques formant le site. Ces corrélations tiennent une place importante dans le processus de découverte de connaissances archéologiques.
En effet, la compréhension – ou l’interprétation – d’un site archéologique passe, dans un premier temps, par la reconstitution de l’ordre d’accumulation au sol de ces couches stratigraphiques. Puis, dans un second temps, grâce à des jalons chronologiques fournis par le matériel archéologique, la séquence de déposition des couches est datée d’une manière relative – les unes par rapport aux autres – mais aussi absolue : points fixes dans le temps. A noter que les vestiges archéologiques enregistrés sur un chantier de fouilles sont des traces laissées au sol par des humains dans le passé. Le but ultime du fouilleur est de reconstituer la séquence événementielle qui a mené à la formation du site archéologique qu’il a fouillé : « Un site archéologique est un lieu où, dans le passé, des actions humaines et sociales ont été réalisées » (Barceló et al., 2003). Les méthodes les plus répandues à l’heure actuelle parmi les archéologues de terrain pour procéder à la construction (ou reconstruction) des connaissances spatio-temporelles sur un chantier de fouilles sont la combinaison des dessins en plan et en coupe, ainsi que la « Matrice de Harris ». Cependant, ces moyens « traditionnels » agissent dans un environnement 2D et non 3D comme le souhaiteraient les archéologues dans leur optique de reconstruire une réalité 3D (Green et al., 2001; Malinverni et al., 2002; Barceló et al., 2003; Cattani et al., 2004; Day et al., 2004; Losier, 2005).
Problématique Initialement, notre intérêt s’était porté vers une amélioration des fonctionnalités tridimensionnelles des outils SOLAP dans un domaine – l’archéologie de terrain – où l’on connaît l’existence d’une problématique d’analyse tridimensionnelle spatio-temporelle. Même si la pertinence d’un outil SOLAP 3D en la matière a déjà été démontrée (Brisebois, 2003), l’efficacité réelle d’un tel outil pour les utilisateurs n’a pas été testée en profondeur puisqu’il s’agissait d’une première exploration technologique du potentiel d’adapter le SOLAP au 3D ainsi que d’une première tentative d’amener un système de type SOLAP en archéologie (Rageul, 2004). L’amélioration des fonctionnalités tridimensionnelles devait passer par une étude de la gestion des données spatio-temporelles tridimensionnelles dans un contexte SOLAP. La mise en évidence des variables graphiques utiles au système d’analyse de données 3D, l’intégration d’un modèle géométrique volumique aux systèmes SOLAP étaient des exemples d’amélioration. Nous devions nous servir de l’opportunité archéologique afin d’étudier la faisabilité et l’efficacité de tels outils. Plus particulièrement, l’étude de leur efficacité devait permettre aux utilisateurs potentiels d’évaluer l’outil en fonction de sa facilité à extraire l’information des données descriptives, temporelles et spatiales issues du processus d’acquisition des données et de permettre une utilisation et une rapidité d’exécution visuelle compatible avec le processus analytique des archéologues.
Description des chapitres du mémoire
Ce mémoire est divisé en 5 chapitres. Après la présente introduction (chapitre 1), le chapitre 2 expose une synthèse des notions théoriques pertinentes à notre projet de recherche. Cette synthèse caractérise la donnée spatiale tridimensionnelle, en examinant quelles sont les catégories d’analyses effectuées et les technologies disponibles pour gérer, manipuler, analyser et visualiser cette donnée. Nous y avons introduit les concepts du SOLAP et de l’approche multidimensionnelle et plus particulièrement les dernières optimisations (temps réel et 3D) relatives à notre projet. Le chapitre 3 décrit une approche théorique d’optimisations des outils SOLAP. La première optimisation concerne la prise en compte de l’évolution de données pendant la phase d’analyse. La seconde optimisation porte sur les architectures potentielles d’un SOLAP 3D et comprend une discussion sur les difficultés à les mettre en oeuvre. Le chapitre 4 explicite, quant à lui, l’approche expérimentale de la première optimisation dans le contexte archéologique. Nous nous attacherons aussi dans ce chapitre à comprendre le processus de découverte de connaissance archéologique. Enfin, le chapitre 5 conclut ce mémoire en discutant les résultats de nos approches tant théorique qu’expérimentale, et en offrant des pistes de recherche qui pourraient être explorées dans le cadre d’autres projets de recherche qui seraient susceptibles de voir le jour au regard de nos conclusions.
|
Table des matières
Chapitre 1 : Introduction
1.1- Mise en contexte
1.1-1. La géomatique et la découverte de connaissance
1.1-2. L’opportunité archéologique : l’analyse spatio-temporelle de données 3D
1.2- Problématique
1.3- Objectifs
1.4- Méthodologie
1.5- Description des chapitres du mémoire
Chapitre 2 : Revue des concepts
2.1- Introduction
2.2- La donnée : de sa création à la génération de modèles 3D
2.2-1. De la réalité aux différents types de données
2.2-2. L’objet tridimensionnel
2.2-3. La modélisation géométrique 3D
2.3- L’analyse de données – revues de définitions
2.3-1. Les différentes catégories d’analyses
2.3-2. Les opérateurs d’analyse:
2.4- Les outils d’exploitation des données spatiales
2.4-1. Les systèmes transactionnels
2.4-2. Les systèmes d’analyse
2.5- Conclusion du chapitre
Chapitre 3 : L’optimisation des outils d’analyse en ligne
3.1- Introduction
3.2- La révision des données d’interprétation : nouveaux concepts
3.2-1. Principe
3.2-2. Mise à jour vs révision
3.2-3. Les processus de révision et de mise à jour, et les systèmes d’analyse en ligne
3.2-4. Révision de structure vs révision de données
3.3- La révision des données d’interprétation : sélection d’une structure multidimensionnelle
3.3-1. Le choix de l’architecture ROLAP
3.3-2. Le choix du schéma en étoile
3.3-3. Le choix de la structure Parent-enfant d’une dimension
3.3-4. Construction et reconstruction des agrégations
3.4- La révision des données d’interprétation : les règles d’application.
3.4-1. La révision des dimensions
3.4-2. La révision de la table des faits
3.5- Le SOLAP 3D
3.5-1. Le SOLAP 3D : de la théorie à la pratique
3.5-2. La nécessité d’un SOLAP 3D
3.6- Conclusion
Chapitre 4 : Application des concepts du SOLAP 3D à un contexte de fouille archéologique
4.1- La constitution des données archéologiques
4.1-1. Les objets archéologiques
4.1-2. L’interprétation des objets archéologiques
4.1-3. Les données d’observation
4.1-4. Les données d’interprétation
4.1-5. Les modèles 3D archéologiques
4.2- L’analyse des besoins des archéologues
4.2-1. Les besoins généraux sur l’analyse des données
4.2-2. Un besoin spécifique : la compatibilité cognitive
4.3- La révision de la structure multidimensionnelle : de la théorie à la pratique
4.3-1. Présentation du prototype
4.3-2. Analyse des résultats
4.4- Conclusion
Chapitre 5 : Discussion et conclusion
5.1- Présentation des résultats et discussion
5.1-1. L’exploration 3D avec les solutions OLAP et/ou SOLAP
5.1-2. L’élargissement des concepts de mises à jour de données d’une structure multidimensionnelle
5.1-3. L’application archéologique
5.2- Développement et recherches futures
Bibliographie
Annexe A Dimensions d’analyses utilisées en archéologie
Annexe B Dimensions d’analyses non -utilisée en archéologie
Télécharger le rapport complet