Techniques de raffinement dans la sélection des données pour les échantillons
Pour procéder à une analyse statistique d’échantillons avec des données plus homogènes, on identifie, à l’intérieur de l’ensemble de données, une population avec la majorité des observations ayant des comportements similaires et une autre pour les projets qui ont une distribution très différente par rapport aux variables dépendantes et indépendantes, aussi appelés ‘points extrêmes’ ou « outliers » [A bran 1994]. Après élimination des « outliers » selon des critères qu’il faut toujours préciser, il est alors possible de modéliser des échantillons plus homogènes par rapport aux variables étudiées. En vue d’illustrer ces techniques, nous les appliquons sur un exemple de la partition Effort 1 Client2 1 Développement.
Intersection des intervalles de profils fonctionnels
L’utilisation de la technique 1 de l’intersection des intervalles de profils fonctionnels est basée sur une production de modèles par type de fonctions: El, EO, EIF, ILF, EQ (Annexe 9).
Variable El Le graphique de la figure 7 présente, pour la seule variable El, le graphe de distribution des fréquences des valeurs de pourcentages des projets de développement du client 2. On voit que les fréquences ne sont pas normalement distribuées en considérant la totalité des projets. On dit que la distribution est bi-modale (Annexe 11).Pour remédier à cette situation qui est, en fait, une réalité propre à l’ensemble des projets pris en compte, on identifie deux groupes de projets par rapport à la variable El; le groupe des projets dont le pourcentage de la variable El est compris entre 14% et 40% et le groupe des projets dont cette variable est comprise entre 40% et 70%.
Variable EO Le graphique de la figure 10 présente, pour la variable EO, le graphe de distribution des fréquences des valeurs de pourcentages des projets de développement du client 2. Les intervalles identifiés sont 5%-20% et 30%-48% (Annexe 12). Il est à remarquer que la pente de la régression pour l’intervalle 5%-20% est presque dix fois moins que celle pour l’intervalle des 30%-48%, soit de 1.11 par rapport à 1 0.48. Ceci implique que les coûts variables en fonction de la taille sont presque dix foissupérieurs lorsque la proportion des EO est entre 30%-48%. Également pour l’intervalle30%-48%, le R2 est significatif à 0.71, alors qu’il est très faible pour l’autre intervalle de 5%-20%.
Variable EIF Le graphique de la figure 13 présente, pour la variable EIF, le graphe de distribution des fréquences des valeurs de pourcentages des projets de développement du client 2. Les techniques de raffinement sont utilisées pour améliorer les résultats des équations de régression basées sur les points de fonction en vue d’être les plus précises pour répondre à la problématique, à condition qu’elles soient appliquées sur des sous-ensembles convenablement découpés selon les critères du problème d’estimation posé. En effet, on ne peut en aucun cas confondre les types de projets avec les clients puisque l’objectif principal est d’estimer l’effort ou la durée d’un projet de certain type pour un client donné. Parfois, on est obligé de découper à l’intérieur même d’un sous ensemble en observant d’autres variables indépendantes comme la date de démarrage afin de savoir si son influence est effective.
Le tableau suivant montre un exemple de variation des résultats en ajoutant la date de développement des projets du client 2. Il est toutefois important de remarquer qu’il s’agit parfois de très petits échantillons (de 3 à 6 projets) comme le montre le tableau XXV; il ne faut donc pas généraliser de tels résultats à d’autres situations d’estimation. Dans certains cas particuliers, d’autres types de problèmes peuvent nous conduire à confondre les clients en vue d’analyser, par exemple, la productivité d’un client par rapport à un standard. On peut aussi confondre les types de projets pour établir une moyenne pour un client au groupe particulier de clients ayant certains points en commun.
Résumé de l’étude de [Kitchenham 2001]
La banque de données utilisée par [Kitchenham 2001] comprend Les données concernant les estimations a priori de l’ effort de maintenance, de développement et de support aux usagers. Deux types d’estimations ont été considérés par Kitchenham : les estimés a priori sélectionnés par les chefs de projets et les estimés aposteriori basés sur des modèles de régression de points de fonction construits à partir de ce même ensemble de données (Annexe 41). Il est à noter que dans l’ étude de Kitchenham, un estimé sélectionné est défini comme étant un estimé choisi parmi un ensemble d’estimés produits par le processus d’estimation de CSC qui permet d’utiliser huit méthodes différentes: Average, CAestimacs, Comparative, Function point, Delphi, Expert Opinion, Proportion, Widget Co un ting (Annexe 41 ).Les données de base disponibles incluent l’effort réel a posteriori des différents projets ainsi que leur taille fonctionnelle. [Kitchenham 2001] a analysé la qualité des estimés a priori par rapport aux mesures réelles a posteriori de l’effort de chaque projet. Avec la méthode analytique et statistique choisie, [Kitchenham 2001] a documenté que dans ces conditions les estimés sélectionnés sont plus exacts que les estimés basés sur les modèles de régression utilisant les points de fonction.
CONCLUSION
L’échantillon de données que nous avons exploité a été ordonné de manière à faciliter la manipulation de sous échantillons découpés selon différents critères. Ce découpage facilite l’analyse des situations réelles d’estimation.
Notre échantillon a été analysé selon un modèle basé sur les points de fonction non ajustés.Nous avons démontré, par le biais des points de fonction dans le chapitre 4.2, l’importance de considérer des découpages de données par rapport à la réalité industrielle, soit répondre à des questions d’estimation par rapport à un client et pour un type bien précis de projet. Cette approche est différente à celle qui se base uniquement sur une vue statistique. Dans le même contexte, nous avons démontré dans le chapitre 5.8 que chaque client est caractérisé par ses propres équations de régression et que la séparation des types de projets est de mise pour une meilleure qualité des estimations.
Une des techniques de raffinement utilisées dans notre étude pour améliorer la qualité des modèles des échantillons étudiés est principalement la technique de l’élimination des « outliers » visibles sur les courbes de régression. Cette technique, combinée à celle de l’ élimination basée sur les profils fonctionnels, a été illustrée par un exemple appliqué sur l’effort en fonction des points de fonction du client2. Le concept de profil fonctionnel proposé par Abran [ 1994] est un élément important qui caractérise notre étude en l’introduisant comme technique efficace de raffinement d’échantillons. Ce concept est basé sur l’analyse d’un profil fonctionnel déterminé à partir de l’analyse de la distribution moyenne des cinq fonctions types caractérisant unéchantillon de projets convenablement découpé et dont la taille fonctionnelle est mesurée en points de fonction.Une nouvelle technique de raffinement, basée sur ce concept, a été introduite dans cette étude dans le chapitre 4.4.3; nous l’avons utilisée pour explorer de nouveaux découpages des ensembles de données en les définissant dans des intervalles bien précis pour chacune des fonctions types des points de fonction.
Une application des points de fonction à l’analyse de la productivité nous a conduit à comparer les résultats du client 1 versus client 2. Ces informations sont d’une importance primordiale dans un contexte d’ ‘outsourcing’. Les découpages de l’échantillon analysé ont été effectués indépendamment du type de technologie utilisée dans le développement ou de maintenance des projets ainsi que de la qualité et l ‘expertise des ressources utilisées. Dans nos analyses, la technique de regroupement et de découpage, basée sur la notion du profil fonctionnel combinée à la technique d’élimination des « outliers » au niveau des courbes de régression, a produit des modèles de productivité et d’estimation avec de meilleurs coefficients de régression. Ces équations pourront être utilisées pour estimer les nouveaux projets avec des marges d’erreurs connues et plus intéressantes. Les deux tableaux LXVI et LXVII montrent l’efficacité de ces deux techniques dans l’analyse de la relation entre l’ effort et la taille du logiciel en points de fonction.
|
Table des matières
ABSTRACT
REMERCIEMENTS
LISTE DES T ABLEAUX
LISTE DES FIGURES
LISTE DES ABRÉVIATIONS ET DES SIGLES
CHAPITRE 1 ÉTUDE DE [KITCHENHAM 2001]
1.1 Résumé de l’étude de [Kitchenham 2001]
1.2 Ce qui a été discuté dans l’étude de [Kitchenham 2001]
CHAPITRE 2 VUE STATISTIQUE
2.1 Échantillon de Kitchenham
2.2 Échantillon ordonné
2.3 Élimination du projet « outlier »
2.4 Statistiques descriptives
2.4.1 Distribution des points de fonction
2.4.2 Distribution de l’effort
2. 5 Variables statistiques utilisées
CHAPITRE 3 LE CONCEPT DU PROFIL FONCTIONNEL DES PROJETS
3.1 Profil fonctionnel
CHAPITRE 4 DÉCOUPAGE DES PROJETS ET RAFFINEMENT DES MODÈLES DE RÉGRESSION
4.1 Variables indépendantes
4.2 Découpage de l’ensemble de données
4.3 Choix du modèle
4.4 Techniques de raffinement dans la sélection des données pour les échantillons
4.4.1 Élimination des projets « outliers » par analyse graphique
4.4.2 Graphe du radar de profil fonctionnel et élimination des projets
4.4.3 Intersection des intervalles de profils fonctionnels
CHAPITRE 5 EXPLICATION DES RÉSULTATS DE L’EFFORT EN FONCTION DES POINTS DE FONCTION .
5.1 Projets de développement par rapport aux projets de maintenance perfective
5.1.1 Projets de développement
5.1.2 Projets de maintenance perfective
5.1.3 Comparaison des projets de développement par rapport aux projets de maintenance perfective
5.2 Comparaison des projets du Client 1 par rapport aux projets du client 2
5.3 Comparaison des projets de maintenance perfective du Client 1 par rapport aux projets maintenance perfective du client 2
5.4 Comparaison des projets de développement du Client 1 par rapport aux projets développement du client 2
5.5 Comparaison des projets de développement du Client 2 par rapport à la date de début de développement.
5.5.1 Tranche 1994
5.5.2 Tranche 1995
5.5.3 Tranche 1996
5.5.4 Tranche 1997
5.5.5 Tranche 1998
5.6 Comparaison des projets de type inconnu du Client 2 par rapport à tous les projets tous types et tous clients confondus
5.7 Comparaison des projets de maintenance perfective du Client 2 par rapport à la date de début de maintenance
5.8 Intersection des intervalles de profils fonctionnels des projets de
maintenance perfective du client 2 (Effort en fonction de PF)
5.9 L’application de l’équation Effort/Développement à un client particulier n’est pas possible
CHAPITRE 6 EXPLICATION DES RÉSULTATS DE LA DURÉE EN FONCTION DES POINTS DE FONCTION
6.1 Explication de la synthèse et application aux cas réels d’estimation
6.1.1 Comparaison des projets de développement par rapport aux projets de maintenance perfective de la durée en fonction des PF
6.1.2 Comparaison des projets de développement du client 1 par rapport aux projets de développement du client 2 de la durée en fonction des PF
6.1.3 Comparaison des projets de maintenance perfective du client 1 par rapport aux projets de maintenance perfective du client 2 de la durée en fonction des PF
6.1.4 Comparaison des projets du client 1 par rapport aux projets du client 2 de la durée en fonction des PF
6.1.5 Comparaison des projets de développement du Client 2 par rapport à la « date de début » de développement de la durée en fonction des PF
6.1.6 Comparaison des projets de maintenance perfective du Client 2 par rapport à la date de début de maintenance de la durée en fonction des PF
6.1. 7 Intersection des intervalles de profils fonctionnels des projets de maintenance perfective et des projets de développement du client 2 de la durée en fonction des PF
CHAPITRE 7 EXPLICATION DES RÉSULTATS DE LA DURÉE EN FONCTION DE L’EFFORT
CHAPITRE 8 ANALYSE DE PRODUCTIVITÉ
8.1 Productivité du client 1
8.1.1 Productivité du client 1 : projets de développement
8.1.2 Productivité du client 1, projets de maintenance perfective
8.2 Productivité du client 2
8.2.1 Productivité du client 2 : projets de développement
8.2.2 Productivité du client 2 : projets de maintenance perfective
CONCLUSION
ANNEXES SUR CD-ROM
Bibliographie
Télécharger le rapport complet