Echantillonnage et collecte de données
Le premier travail consiste à constituer un fichier qui contient des informations complètes sur des dossiers de prêts. Il se présentera sous la forme d’un tableau rectangulaire individu-variables où les n individus sont partagés en deux groupes d’effectifs n1 et n2 : les bons et les mauvais emprunteurs. Les n individus essentiel constituent en fait un échantillon de l’ensemble des N données disponibles. Il faut donc prélever aléatoirement n individus parmi des N : comme il faut s’assurer d’avoir un nombre suffisant et non aléatoire (ce qui introduit une source de variabilité supplémentaire, donc une moindre précision) d’observations dans chacun des deux groupes, nous procédons à un sondage stratifié avec tirage séparé des n1 et n2 individus. Une idée naturelle consisterait à prélever n1 et n2 en respectant les proportions de bon et mauvais dossiers, d’autant plus que l’on sait que le sondage stratifié à répartition proportionnelle est toujours meilleur que l’échantillonnage simple sans stratification. Notre base de données (échantillon) est construite sur la base des dossiers de crédit et des informations fournies par les agents de crédit de la BNI Madagascar, agence Antsirabe. A partir de ces listes, nous avons sélectionné un échantillon de 100 emprunteurs (entreprises) dont 50 des mauvais emprunteurs et 50 des bons emprunteurs [Voir Annexe A,page 2].
Interprétations des tableaux : ACP
Le travail à été menée à l’aide du logiciel SPSS. Les statistiques descriptives (tableau (4.1)) nous donne la moyenne et l’écart-type de chaque variable et le nombre des observations pour chaque variable. Il permet donc de juger de l’hétérogénéité des variables et de repérer celles qui ont des valeurs manquantes. On peut remarquer que chaque observation n’a pas de valeurs manquantes. La matrice de corrélation (tableau (4.2)) nous permet de déceler rapidement les variables fortement corrélées et/ou de juger de l’existence de corrélations suffisantes entre les variables. À confirmer par le test de Bartlett [Voir Annexe D,page 11]. On peut dire ici que ces six variables sont fortement corrélées et nous permet de remplir la condition de factorisation de l’échantillon. Le KMO (tableau (4.3)), rapport de la somme des corrélations au carré par la somme des corrélations partielles au carré, est un réel compris entre 0 et 1[Voir Annexe D,page 11]. Un KMO assez élevé (> 0.6) assure que les corrélations partielles ne sont pas trop importantes par rapport aux corrélations simples. Indispensable pour obtenir une ACP intéressante. Dans la négative, il peut être nécessaire de supprimer certaines variables. Ici, la valeur du KMO indiquée par ce tableau est de 0.912. Ce qui est donc méritoire. Le test de Barttlett (Tableau (4.3)) indique ici une valeur élevée de 491.614 avec une significativité quasiment nulle. Ce qui nous permet de rejeter la non-corrélation globale des variables, c’est-à-dire, assure que les variables sont suffisamment corrélées entre-elles pour permettre une réduction significative de la dimension. Condition indispensable pour faire une ACP. La communalité (tableau (4.4))nous informe la qualité de représentation des variables. elle indique ici une bonne qualité de représentation car les taux d’extraction sont supérieurs à 80%. Le tableau (4.5) indique la variance totale expliquée. Dans notre cas, nous avons choisi de retenir seulement deux axes car nous voulons avoir plus de 80% de variances (cumulées) expliquée et que le troisième axe ait une valeur propre très faible et l’interprétation devient assez difficile. Le premier axe avec une valeur propre µ1 = 4.396 explique 73.26% de variance. Le second axe avec une valeur propre µ1 = 0.709 explique 11.814% de variance. Nous avons donc que ces deux axes expliquent à plus de 85.424% de variance.
Interprétations des points variables
Le tableau (4.6) et le graphe (4.1)nous permettent d’interpréter les points variables. C’est la phase la plus délicate de l’analyse. Nous avons ici d’après le graphe, tous ces six variables sont proches du cercle de l’unité. C’est-à-dire donc qu’elles ont une bonne contribution à la construction des axes factoriels. On donne un sens à un axe grâce à une recherche lexicale (ou recherche de mots) à partir des coordonnées des variables et des individus. Ce sont les éléments extrêmes qui concourent à l’élaboration des axes. se sont les variables MargOp, CapEnd, LiqImm, tVA et Solv qui concourent le plus à la construction de l’axe 1. La variable ROE pour le second. Les variables CapEnd et Solv présentent une contribution de signe opposée avec les variables MargOp,MargOp, CapEnd, LiqImm, tVA et LiqImm sur le premier axe factoriel. Ce qui indique une opposition. On peut dire donc que le premier axe est un axe de viabilité et de profitabilité de l’investissement à court et à long terme. Plus on monte, plus meilleur est la viabilité et la profitabilité de l’investissement de l’entreprise à court et à long terme. Le second axe est un axe de l’importance des ressources dégager par l’entreprise pour honorer ses échéances et pour rémunérer ses partenaires (personnels, Etat, actionnaires,. . . ). Plus on se déplace vers la droite, plus la capacité de l’entreprise pour honorer ses échéances et pour rémunérer ses partenaires augmente.
Les classes de risques
– La classe 1 : est composée des entreprises qui sont très favorables aux emprunts bancaires (groupe 2). Elles possèdent un bon indicateur de positionnement face à la concurrence, un investissement très profitable. Elles font parti aussi des familles d’entreprises très liquides capables de rembourser ses dettes à court terme. Elles sont aussi très excellentes en matière de génération de ressources (résultats). Ce sont aussi des entreprises qui sont capables de générer des ressources en interne pour honorer ses échéances. Et enfin, des entreprises peu endettées.
– La Classe 2 : est composée des entreprises (groupe 1) favorables aux emprunts bancaires. Elles possèdent une très favorable position face à la concurrence, un investissement profitable. Elles sont aussi aptes à rembourser ses dettes à court terme. Une grande capacité à générer des résultats et à rémunérer ses partenaires. Elles possèdent aussi une large marge de manoeuvre pour honorer ses échéances. Et enfin, c’est une famille d’entreprises très peu endettée.
– La classe 3 : c’est la classe (groupe 4)à partir de laquelle, la banque ne doit plus accorder du crédit sauf mention d’autres contrats (niveau de taux d’intérêt ou la nécessité de garantie). Sa marge opérationnelle est médiocre (mal positionnée sur le marché : concurrence, politique de prix agressive), ses investissements sont profitables, classe des entreprises illiquides, un taux de valeur ajoutée moyen (niveau acceptable), classe des entreprises qui sont en difficultés pour faire face à ses échéances et qui sont aussi très endettées.
– La classe 4 : elles regroupent les entreprises qui présentent toutes sortes de vulnérabilités (groupe 3) : marge opérationnelle faible (concurrencée sur le marché), des investissements peu profitables, entreprises illiquides c’est-à-dire non solvables à court terme, un taux de valeur ajoutée qui ne peut plus rémunérer les partenaires, incapables de dégager des ressources en interne pour honorer ses échéances et enfin, des entreprises les plus endettées
Résumé statistiques univariées
Bien que des mesures multiples impliquent une certaine redondance dans l’information apportée par l’échantillon et se traduisent par des corrélations entre variables quantitatives, il est toujours intéressant dans un but descriptif de disposer de statistiques univariées pour chacun des groupes étudiés sur les variables de l’analyse, ne serait ce que pour en contrôler les paramètres. On observe pour chacune des mesures effectuées des différences notables entre les moyennes des six groupes mais également des valeurs sensiblement distinctes des écarts types (voir Tableau (4.7)). Ces remarques peuvent être confirmées ou invalidées par des tests statistiques. L’usage des statistiques univariées est fortement recommandé dans l’étape de constitution de l’échantillon et de la sélection des descripteurs pour étudier la nature des distributions des valeurs observées au sein des différents groupes.
|
Table des matières
Remerciements
Introduction
1 Echantillonnage et collecte de données
2 Le choix des ratios
3 Méthodologies
4 Construction du modèle
4.1 segmentation de l’échantillon
4.1.1 Interprétations des tableaux : ACP
4.1.2 Interprétations des points variables
4.1.3 Interprétations des individus
4.2 Les classes de risques
4.3 Construction du score
4.3.1 Statistiques descriptives
4.3.2 Approche géométrique
4.4 Validation : validation croisée
Conclusion
Télécharger le rapport complet