Prise en compte de la sinistralité passée dans la tarification de la fréquence de sinistres AA 

Calcul de la cotisation technique annuelle

Comme pour l’assurance automobile des particuliers, l’évaluation du risque automobile agricole passe par sa segmentation, en fonction de plusieurs critères tarifaires. Ces derniers définissent des facteurs explicatifs de la sinistralité. L’évaluation statistique de ces facteurs permet de déterminer le coût du sinistre moyen le plus probable. Les critères tarifaires dépendent logiquement des caractéristiques sur :
 Le souscripteur d’assurance : son âge, son activité, son expérience,…etc.
 L’automoteur : la famille d’engin, la puissance de l’engin, l’âge de l’engin,…etc.
 Le contrat : le package des garanties, durée du contrat,…etc.
L’inventaire de ces critères tarifaires permet d’obtenir une équation tarifaire qui est une modélisation du risque couvert. Le tarif proposé au souscripteur d’un contrat AA est donc basé sur des informations provenant de sa personne, de l’automoteur assuré et des spécificités du contrat. L’encadré suivant, présente la structure de l’équation tarifaire du produit AA.

Critique de la méthode actuellement appliquée

Maturité tarifaire non atteinte

Peu de compagnies proposent des couvertures du risque automoteur agricole. Les principales compagnies, dont fait partie PACIFICA, proposant des produits d’assurance Automoteur Agricole représentent 80 % du marché national. Le marché de l’assurance Automoteur Agricole est donc peu concurrentiel. Or la concurrence est un moteur d’innovation. Cette faible concurrence explique en partie le peu d’études actuarielles existantes dans le cadre de la tarification d’un contrat automoteur agricole.

Une tarification a posteriori perfectible chez PACIFICA

L’assurance Automoteur Agricole fait partie du marché de l’assurance des biens agricoles [1]. Toutefois, elle présente des caractéristiques tarifaires proches de celles de l’assurance automobile (pour particulier ou professionnel). En effet, la section 1.1.2 a présenté des garanties telles que la responsabilité civile (RC), le bris de glace (BDG) que l’on retrouve également dans un contrat classique d’automobile. Il est donc légitime d’appliquer les mêmes méthodes de tarification.
Cependant, il n’existe pas en assurance Automoteur Agricole un organisme central tel que l’AGIRA , qui dispose d’informations (nombre de sinistres, charge de sinistres) sur les clients potentiels (prospects). La présence d’un tel organisme permettrait de mieux connaître le passif de sinistralité d’un souscripteur au produit AA. Le passif d’un client n’est connu qu’à travers son ancienneté dans le portefeuille.
Il n’existe pas non plus, un système réglementaire de bonus-malus. Un tel système permet de réduire le risque d’aléa moral et d’anti-sélection assez important en assurance IARD. Il permet aussi de réduire l’hétérogénéité résiduelle des modèles de tarification [2].

Proposition de méthodes de tarifications actuarielles

La ressemblance constatée entre l’assurance Automoteur Agricole et l’assurance automobile, permet d’appliquer les méthodes statistiques utilisées pour cette dernière.
L’objet du Chapitre 2 sera de modéliser la sinistralité AA en intégrant les variables tarifaires incluses dans l’équation tarifaire et d’étudier in fine l’opportunité d’ajouter la sinistralité individuelle antérieure. Il s’agira de modéliser d’une part la fréquence des sinistres et d ’autre part le coût moyen des sinistres via des modèles de régression sur la base d’un historique de sinistralité AA de 9 exercices successifs.
Sur la question de la prise en compte tarifaire de la sinistralité individuelle, le service actuariat a mis en place un processus de majoration de la prime pure depuis 2009. Ce processus est basé sur l’expérience de sinistralité et la responsabilisation du contrat. Pour des raisons de confidentialité, nous nous permettons de ne pas rentrer plus en détail dans la définition de ces coefficients de majoration. Du fait de la problématique de ce mémoire cependant, nous pouvons affirmer que ces coefficients sont encore perfectibles. L’objet du chapitre 3 sera donc d’étudier l’apport potentiel de la crédibilité pour exploit er la sinistralité individuelle.

Optimisation tarifaire à l’aide des GLMs

Le chapitre 1 a présenté l’équation tarifaire du produit AA. Cette équation est définie par un montant de base qui est ajusté en fonction de différents critères tarifaires. L’objet du chapitre 2 est de vérifier la pertinence des principaux critères tarifaires qui définissent cette équation à l’aide d’un outil statistique rigoureux que sont les modèles linéaires généralisés.
Il s’agira ensuite de déterminer la pertinence de la sinistralité individuelle dans la prédiction de la prime pure.
Mais avant, il est essentiel d’effectuer une étude « à plat » des caractéristiques du risque AA, sur la base d’un jeu de données d’étude. Ceci constitue l’objet de la section suivante.

Construction de la base de données et Etudes à «plat»

Toute modélisation est précédée par la construction d’une base de données appropriée. C’est un processus long qui a été effectué via le logiciel SAS . Nous nous intéressons à l’observation des contrats AA assurés au moins 1 jour entre le 01/01/2004 et le 31/12/2012.

La procédure de construction de la base de données d’étude

Au sein du service Actuariat Produit de PACIFICA, les actuaires disposent d’une base de données infocentre. Dans cette bibliothèque, plusieurs types de tables sont stockés et sont utilisés pour réaliser diverses études notamment de tarification. C’est à l’aide de ces tables que la base de données d’étude va être constituée.

Les informations sur le contrat

La table base_contrat contient les informations relatives aux contrats en portefeuille. C’es tà-dire qu’on retrouve toutes les variables qui déterminent le profil de risque d’un contrat. Le Tableau ci-dessous présente les variables qui ont un intérêt dans la suite du mémoire.

Le montant des sinistres

Le montant des sinistres est l’autre élément principal de la sinistralité d’un contrat. Cette section présente de façon succincte la différence faite en pratique entre les sinistres ordinaires (ou attritional claims en Anglais) et les sinistres graves (atypical claims). Cela amènera ensuite, sur la détermination d’un seuil de distinction entre sinistres ordinaires et sinistres graves pour le portefeuille étudié. Enfin, une analyse descriptive du coût moyen du portefeuille est examinée dans un troisième paragraphe.

Sinistres ordinaires vs sinistres graves

L’analyse mathématique de la sévérité d’un sinistre conduit à distinguer les sinistres ordinaires des sinistres graves. Les sinistres ordinaires sont ceux qui surviennent le plus souvent dans le portefeuille avec un montant de charge ne dépassant pas un certain seuil. Tandis que les sinistres graves surviennent avec une faible fréquence, mais ont une sévérité très importante. Suivant le type de sinistralité étudiée, les outils statistiques sont différents.
L’évaluation des sinistres graves fait notamment appel à la Théorie des Valeurs Extrêmes [3]. Le présent mémoire porte sur la sinistralité « ordinaire » du produit AA, il ne sera donc pas question de modéliser la sinistralité au-delà d’un seuil. En effet, l’objectif final étant d’étudier l’impact de la sinistralité individuelle, un postulat de départ consiste à considérer qu’un individu est responsable en fréquence mais pas en coût. Nous ne chercherons donc pas à identifier l’impact des sinistres graves sur la sinistralité future. Toutefois, la modélisation des sinistres ordinaires nécessite la détermination d’un seuil de sinistres graves.

La puissance de l’automoteur

C’est un indicateur de la taille de l’engin agricole. La puissance est mesurée en cheval vapeur (CV). Elle est représentée dans la base de données par la variable puissance de l’automoteur dont les modalités correspondent à des classes de puissance. La Figure suivante présente comment la sinistralité du portefeuille est répartie en fonction de la variable puissance de l’automoteur.
Le portefeuille AA contient peu d’automoteurs de plus de 181 CV. On observe en effet une décroissance du nombre d’années assurance en fonction de la puissance. Le coût moyen des sinistres augmente avec la taille de l’automoteur agricole car ce sont les matériels plus pluschers et les plus sophistiqués. La fréquence des sinistres croît également avec la puissance de l’automoteur, puis décroît pour les automoteurs de plus de 120 CV. Les automoteurs de grande taille sont généralement utilisés pour des tâches plus ponctuelles que les autres automoteurs. De ce fait, on explique l’évolution de la fréquence des sinistres pour les automoteurs de grande taille par le fait de « l’usage ».

Synthèse

L’analyse descriptive des variables du portefeuille nous a permis d’avoir une première idée des profils de risque AA. Suivant les composantes de la sinistralité (fréquence et coût moyen) les variables telles que l’activité et la formule sont discriminantes pour l’une et pas nécessairement pour l’autre. Ce constat nous conforte dans le choix de modéliser séparément la fréquence des sinistres et le coût moyen des sinistres AA.

Modélisation de la sinistralité : théorie des GLMs

Présentation de la théorie

Origines et définition formelle

Histoire des modèles linéaires généralisés

Les modèles linéaires généralisés (generalized linear models en anglais) ont été introduits par John NELDER et Robert WEDDERBURN en 1972. L’objectif était d’unifier des méthodes statistiques comprenant la régression linéaire, la régression logistique et la régression de Poisson. Les GLMs fournissent un cadre théorique de modèles de régression pour une grande variété de distributions, allant bien au-delà de la seule loi Normale des modèles linéaires.
Les techniques GLM constituent un outil de choix par les actuaires pour l’élaboration d’une tarification en assurance automobile. Elles permettent d’analyser un grand nombre de phénomènes, voir [4] et [5].

Limites des méthodes classiques

Les modèles GLM permettent de lever certains obstacles rencontrés dans l’application d’analyse descriptive univariée. En effet, l’analyse à un facteur ne permet pas de prendre en compte l’effet d’autres facteurs sur le phénomène étudié. Par exemple, l’analyse à un facteur de la fréquence des sinistres d’un véhicule en fonction de sa vétusté ne prend pas en compte le fait que les jeunes conducteurs possèdent en majorité des véhicules anciens. Or les jeunes conducteurs sont les assurés les plus risqués selon la classe d’âge. Ainsi le fait que les jeunes conducteurs possèdent majoritairement des véhicules anciens contribuent à accroître la fréquence des sinistres attendue de ces véhicules. De ce fait, l’approche univariée sépare mal les effets marginaux des variables tarifaires lorsqu’elles sont corrélées entre elles.
D’autre part, les hypothèses de base des modèles linéaires gaussiens sont difficilement tenables dans le cadre d’une application en assurance. Pour un phénomène tel que le montant des sinistres, la distribution est à valeur dans et non tout entier. De plus, la loi est généralement asymétrique, ce qui n’est pas le cas de la loi Normale. Les modèles GLM permettent de lever ces nombreuses limites en reposant sur des hypothèses plus réalistes.

Application des GLMs pour la modélisation de la sinistralité AA

La section précédente a présenté les bases d’un modèle GLM. Celui-ci se décrit comme un groupement d’outils statistiques qui permettent de modéliser et d’expliquer une palette de phénomènes notamment en assurance. Dans cette section, nous appliquons ces méthodes pour modéliser la sinistralité AA en recherchant des facteurs de risque pertinents. La modélisation sera réalisée ici toutes garanties confondues. Cette approche permet en effet de tenir compte de l’hétérogénéité de comportements (ou de l’aversion au risque) des individus selon leur profil et des corrélations entre garanties qui en découlent. Par exemple, le risque RC des individus souscrivant une formule Tous Risques pourrait être différent du risque RC des individus en formule au Tiers. Plutôt que de modéliser chaque garantie et rechercher ensuite les corrélations entre elles, nous prenons le parti de modéliser ici directement la prime pure totale.
Pour déterminer des critères tarifaires, le service actuariat PACIFICA a l’habitude d’effectuer des analyses directes sur la charge de sinistres du produit. Pour étudier la pertinence des critères introduits dans l’équation tarifaire, nous proposons une approche alternative. Cette approche consiste à modéliser séparément la fréquence de sinistres et le coût moyen des sinistres. Ceci dans le but d’obtenir une meilleure compréhension des facteurs de risque qui influencent la sinistralité AA [9]. De plus, nous pourrons en déduire la « composante risque » (la fréquence ou le coût moyen) sur laquelle porte principalement l’anti-sélection.
La modélisation « fréquence x coût moyen » est une approche traditionnellement utilisée pour la tarification d’une police en assurance non vie. Nous donnons ci-dessous le principe mathématique qui lui est sous-jacent.

Modélisation de la fréquence des sinistres

Choix du modèle

Distribution du nombre de sinistres

Pour modéliser le nombre de sinistres, les lois théoriques les plus fréquemment utilisées sont la loi de Poisson et la loi Binomiale Négative. La loi de Poisson appartient à la famille exponentielle. Elle suppose que la variance est égale à la moyenne, ce qui n’est pas toujours vrai en pratique. Cette hypothèse peut avoir des conséquences importantes sur la qualité de l’ajustement. Si la variance est supérieure à la moyenne des observations, il y a sur dispersion de la variable d’intérêt. Cela conduit à rejeter trop souvent l’hypothèse nulle de non significativité des variables explicatives du modèle. Cette sur-dispersion est prise en compte par la loi Binomiale Négative. Nous utilisons donc cette loi pour la modélisation du nombre de sinistres.

Sélection des variables explicatives significatives

Après avoir choisi la loi de l’aléa et la fonction lien, il est primordial d’analyser les variables explicatives. Un modèle de régression est d’autant meilleur que les variables explicatives considérées sont significatives. Cela signifie qu’elles expliquent le phénomène étudié (la variable à expliquer) de façon pertinente. Dans un ensemble de variables explicatives considérées en amont, nous omettrons donc les variables qui ne sont pas significatives. De telles variables ont un impact aléatoire sur la variable à expliquer.
Dans ce mémoire, les variables significatives seront sélectionnées parmi un ensemble de variables considérées par les OAT (Outil d’Analyse Tarifaire). Ces derniers sont des suivis Excel construits pour analyser l’ensemble des critères tarifaires impactant les résultats techniques d’un produit. Ces suivis Excel contiennent donc des critères qui sont déjà inclus dans l’équation tarifaire AA, mais également d’autres qui peuvent potentiellement l’être.
Concrètement, la sélection des variables s’effectue via une procédure Stepwise Regression dont le principe est rappelé dans le paragraphe suivant. Puis nous présentons l’ensemble des variables retenues pour la modélisation de la fréquence des sinistres.

Stepwise Regression

L’objectif de la régression Stepwise est de choisir un sous-ensemble des variables tarifaires étape par étape dans un modèle qui est simple, significatif et donne une bonne prédiction. Il existe trois types de procédure Stepwise Regression.

Backward selection

Contrairement à la méthode forward selection, nous considérons initialement un modèle avec toutes les variables. A chacune des étapes suivantes, la variable la moins significative est retirée du modèle selon le test considéré (ici ). Le processus s’arrête lorsque toutes les variables explicatives restantes sont significatives.

Bidirectional elimination

Elle est semblable à la procédure forward selection sauf que l’on peut éliminer des variables déjà introduites. En effet, il peut arriver que des variables introduites en début ne soient plus significatives après introduction de nouvelles variables.

Etude de la corrélation entre variables explicatives

Nous complétons la sélection automatique des critères tarifaires en observant parallèlement les corrélations existant entre les différents variables. La corrélation entre deux critères tarifaires signifie que l’information apportée par l’une d’entre elles peut se déduire de celle apportée par l’autre. Par souci de simplicité, il est préférable de ne garder qu’un critère tarifaire parmi ceux qui sont fortement corrélés. L’étude des corrélations entre les différents critères tarifaires se fait à l’aide du V de Cramer présenté en annexe B. C’est un indicateur qui permet de mesurer la corrélation entre les différents critères sous forme de tableau de contingence. Nous choisissons un seuil de 65 % pour définir les corrélations fortes dans l’étude. Différents niveaux de seuils de corrélations sont présentés ci-dessous.

Traitement des modalités des variables tarifaires significatives

Certaines variables significatives peuvent présenter des modalités qui ne le sont pas. Cela s’explique par le fait que ces modalités sont peu représentées dans la base de données d’étude. En conséquence, l’estimation des coefficients associés à ces modalités peut ne pas être très fiable.
D’autres part, la proximité des modalités en termes de comportement de sinistralité (cas de l’âge de l’automoteur) amène à recoder les modalités d’une variable. Autrement dit, nous regroupons les modalités qui présentent une similitude en termes d’impact sur la fréquence des sinistres, tout en conservant la cohérence commerciale du tarif.

Cas de l’activité

Dans le graphique suivant, nous présentons une illustration de l’estimation de la fréquence des sinistres AA selon les modalités de la variable activit.

Validation du modèle

Nous jugeons enfin la qualité du modèle en effectuant une analyse des résidus. En pratique, nous nous intéressons aux résidus de déviance standardisés. La base «Crunched 2500 » est appropriée pour l’étude de la fréquence de sinistres. Il y a deux groupes distincts de polices : ceux qui ont des sinistres et ceux qui n’en ont pas. Si nous ne regroupons pas les polices en groupes, il y aura des «grappes» de résidus.
La Figure ci-dessous présente sur un plan, un nuage de points correspondant à un regroupement de résidus de déviance.

Résultat de la modélisation de la fréquence des sinistres

Ci-dessous, nous présentons le résultat de la modélisation de la fréquence des sinistres après avoir effectué des retraitements sur les modalités pour chaque variable significative retenue. L’explication de chaque champ est donnée après la représentation suivante.

Descriptif de la table des paramètres estimés

La première colonne, à partir de la gauche, liste les variables et modalités retenues dans le modèle final. La colonne donne la valeur des paramètres en base 1. Les lignes non renseignées correspondent aux modalités de référence. Cela signifie que la valeur du paramètre  est nulle. Le « » exprimé en pourcentage est un indicateur du résultat du test de Wald (test de nullité du paramètre associé à chaque modalité). Le fait que les valeurs du champ « » soit inférieure à 50 % signifie que la modalité en question est statistiquement discriminante. Nous rappelons que les coefficients multiplicateurs qui établissent l’équation tarifaire pour la fréquence des sinistres AA sont déduits de l’estimation des coefficientŝ par la relation suivante.

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières
Résumé 
Summary
Remerciements
Liste des abréviations
Introduction 
Chapitre 1. L’assurance automoteur et sa tarification 
1.1 L’assurance automobile agricole
1.1.1 Définition d’un automoteur agricole
1.1.2 Les garanties chez PACIFICA
1.1.3 Les spécificités du risque automobile agricole
1.2 La tarification actuelle de l’assurance automobile agricole chez PACIFICA
1.2.1 Calcul de la cotisation technique annuelle
1.2.2 Critique de la méthode actuellement appliquée
Chapitre 2. Optimisation tarifaire à l’aide des GLMs
2.1 Construction de la base de données et Etudes à «plat»
2.1.1 La procédure de construction de la base de données d’étude
2.1.2 Analyses descriptives des données
2.2 Modélisation de la sinistralité : théorie des GLMs
2.2.1 Présentation de la théorie
2.2.2 Outils statistiques
2.3 Application des GLMs pour la modélisation de la sinistralité AA
2.3.1 Modélisation de la fréquence des sinistres
2.3.2 Modélisation du coût moyen
2.3.3 Modélisation de la prime pure et étude de la prédictibilité de la sinistralité antérieure
Chapitre 3. Prise en compte de la sinistralité passée dans la tarification de la fréquence
de sinistres AA 
3.1 Principes théoriques de la crédibilité
3.1.1 Histoire et principe fondamental
3.1.2 Exemple introductif
3.1.3 Estimateur de crédibilité
3.1.4 Les modèles de crédibilité
3.2 Application des modèles de crédibilité au produit AA
3.2.1 Application du modèle de Bühlmann – Straub
3.2.2 Application du modèle de crédibilité hiérarchique
3.2.3 Comparaison du modèle de crédibilité hiérarchique au modèle GLM
3.2.4 Analyse de la sinistralité individuelle
Conclusion 
Tables des figures 
Liste des Tableaux 
Bibliographie 
Annexes
A. CODE DES ASSURANCES
B. V DE CRAMER
C. REPRESENTATION DU COUT MOYEN EN FONCTION DE QUELQUES VARIABLES SIGNIFICATIVES
D. MODÈLE DE CRÉDIBILITÉ DE JEWELL
E. ADEQUATION DE LA LOI EMPIRIQUE A UNE LOI THEORIQUE

Lire le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *