Principe général de l’Analyse Factorielle des Correspondances Multiples (AFCM)
Cette méthode est une généralisation de l’Analyse Factorielle des Correspondances, permettant de décrire les relations entre p (p >2) variables qualitatives simultanément observées sur n individus. Elle est aussi souvent utilisée pour la construction de scores comme préalable à une méthode de classification. (nuées dynamiques) nécessitant des données quantitatives. Autrement dit, elle s’applique à un ensemble de variables qualitatives mais aussi quantitatives. Elle décrit la liaison entre les modalités des variables. L’une des étapes primordiale pour cette méthode est l’établissement du tableau disjonctif complet qui a pour but de présenter les données en utilisant la fonction indicatrice.
D’autre part, l’utilisation des éléments supplémentaires en AFCM permet de prendre en compte toute l’information susceptible d’aider à comprendre ou à interpréter la typologie induite par les éléments actifs. Cela est surtout intéressant lorsque les variables se regroupent en groupe homogène.
Remarque :
Les différents calculs et les formules sur les démarches sur l’Analyse Factorielle (ACP, AFC, AFCM) seront détaillés à l’annexe A du présent ouvrage.
Approche par règle d’association
Historique
Dans le domaine du data mining la recherche des Règles d’Association est une méthode populaire étudiée d’une manière approfondie dont le but est de découvrir des relations ayant un intérêt pour le statisticien entre deux ou plusieurs variables stockées dans de très importantes bases de données. Le concept de règle d’association a été popularisé, en particulier, par un article de Rakesh Agrawal de 1993. Mais il est possible que cette notion ait été découverte sous le nom de GUHA en 1966 par Petr Hájek et ses collègues [4].
Définition
✡ Les règles d’association, étant une méthode d’apprentissage non supervisé, permettent de découvrir à partir d’un ensemble de transactions, un ensemble de règles qui exprime une possibilité d’association entre différents items. Une transaction est une succession d’items exprimée selon un ordre donné ; de même, l’ensemble de transactions contient des transactions de longueurs différentes [5].
✡ Une règle d’association peut être définie formellement comme ceci :
Soit I = { i1, i2, . . ., im } un ensemble d’items. Soit T = { t1, t2, . . ., tm } un ensemble de transactions, telles que ti soit un sous-ensemble de I.( c’est-à-dire ti ⊆ I). Une règle d’association s’exprime sous la forme : X → Y où X∈ T et Y∈ T, et X∩Y = ∅ avec X et Y sont les sous-ensembles de I appelé itemset.
✡ On dispose de N données xi , chacune décrites par P attributs ; xij dénote la valeur. de l’attribut aj de la donnée i. Dans de nombreuses applications, chaque attribut correspond à un item et la valeur de cet attribut dans une donnée particulière indique sa quantité dans cette donnée. Un cas particulier est celui où les attributs sont à valeur binaire et indiquent la présence ou l’absence d’un item.
Une règle d’association est de la forme ai = vi , aj = vj , . . ., am = vm ont une certaine valeur, alors l’attribut aα prend généralement une certaine valeur vα, aβ une certaine valeur vβ La difficulté consiste notamment à trouver des règles qui soient significatives et non seulement le résultat du hasard .Les valeurs de N et P sont généralement très grandes. On présente une approche qui s’appuie sur la notion d’ensemble d’items fréquents (EIF), c’est-à-dire, des items qui sont souvent présents ensemble dans une même donnée. Apres avoir détecte ces EIF,on génère ensuite des règles d’association [6]. La force d’une règle d’association est mesurée par son indice de support et son indice de confiance
support
✹ On définit le « support » d’un ensemble d’items comme la fréquence d’apparition simultanée des items figurant dans l’ensemble. C’est un indicateur de « fiabilité » de la règle. On le note sup() .
Un synonyme à « support » est « couverture » Le recouvrement ou la couverture de X dans I noté KT(X) est définie par {K = 1,2,. . .,n /X ⊆ tk }
L’indice de support (« support ») d’une règle X→ Y est définie par le pourcentage de transactions de T qui contiennent X∩Y Elle peut être vue comme une estimation de la probabilité P(X∩Y ) .
✹ On dit qu’un ensemble d’items est un ensemble d’items fréquent si et seulement si le support de cet ensemble d’items est supérieur à un certain seuil(> 1 par exemple).
Propriété
Si S est un ensemble d’items fréquents, alors tout sous-ensemble de S est également un ensemble d’items fréquents
Conséquence
Un ensemble d’items fréquents S est maximal si tout sous ensemble de S n’est pas un EIF.
|
Table des matières
I INTRODUCTION GENERALE
1 Présentation générale
1.1 Présentation de l’établissement d’origine
1.1.1 Historique
1.1.2 Objectif
1.1.3 Organisation de la formation
1.1.4 Débouchés
1.2 Présentation de l’établissement d’accueil : FOFIFA
1.2.1 Historique
1.2.2 Organigramme
1.2.3 Ses missions et ses objectifs
1.2.4 Organisation et démarche de la recherche
2 Problématique, contexte, plan de mémoire
2.1 Présentation du sujet, problématique, objectif et contexte
2.2 Plan de mémoire
II DÉMARCHE ET MÉTHODOLOGIE
1 Domaine d’étude
1.1 Le District d’Ambalavao
1.2 Le District d’Ambohimahasoa
1.3 Le District d’Ikalamavony
1.4 Le District d’Isandra
1.5 Le District de Lalangina
1.6 Le District de Vohibato
2 Démarche théorique des analyses statiques
2.1 Procédé de la collecte des données
2.2 Test d’indépendance de khi-deux
2.3 Principe de l’Analyse en Composantes Principales (ACP)
2.4 Principe de l’Analyse Factorielle de Correspondance (AFC)
2.4.1 Définition
2.4.2 Nuage de profils
2.5 Principe général de l’Analyse Factorielle des Correspondances Multiples (AFCM)
2.6 Approche par règle d’association
2.6.1 Historique
2.6.2 Définition
2.6.3 support
2.6.4 confiance
3 Généralité sur le SIG
3.1 Définition
3.2 Quelques définitions proposées par des chercheurs
3.3 Les objets
3.4 Les avantages d’un SIG
III ANALYSE SPATIALE ET MODELISATION
1 Analyses du système
1.1 Présentations des activités économiques pour chaque District
1.2 Présentations pédoclimatique et démographique pour chaque District
1.2.1 Climat
1.2.2 Pédologie
1.2.3 Présentation démographique
1.3 Analyse de la répartition agricole et élevage
1.3.1 Agriculture
1.3.2 Elevage
2 Proposition de micro zonage
2.1 Pour le District d’Isandra
2.2 Pour le District de Vohibato
2.3 Pour le District de Lalangina
2.4 Pour le District d’Ambohimahasoa
2.5 Pour le District d’Ambalavao
2.6 Pour le District d’Ikalamavony
2.7 Analyse des facteurs naturels sur chaque zone
2.7.1 Représentation graphique de la répartition démographique
2.7.2 Interprétation
2.7.3 Représentation graphique
2.7.4 Interprétation
2.8 Analyse des zones agricoles favorables
2.8.1 Analyse préalable
2.8.2 Interprétation
2.8.3 Représentation graphique des individus
2.8.4 Synthèse de deux graphiques
2.8.5 Interprétation
2.9 Analyse des zones favorables à l’élevage
2.9.1 Interprétation
2.9.2 L’élevage bovin et porcin
2.9.3 Aviculture, pisciculture, apiculture
2.10 Déduction de la vocation agricole
2.10.1 En utilisant l’AFCM
2.10.2 Application de la règle d’association
3 Modélisation du Système d’Information et réalisation
3.1 Introduction
3.2 Mise en place du MCD
3.3 L’élaboration du MLD
3.4 Application sur le logiciel SIG
3.4.1 Application pour le Zonage
3.4.2 Application sur le Microzonage
3.5 Evaluation des résultats et limites
3.6 Suggestions et Perspectives
IV CONCLUSION GENERALE