L’assurance est indispensable dans la vie quotidienne. Pour définir un tarif pertinent, les assureurs posent aux futurs assurés de nombreuses questions. Mais l’utilisation des datas peut permettre de réduire la taille des questionnaires.
Un sujet qui fait l’objet du mémoire « Réduction du nombre de questions posées à la souscription d’un contrat d’assurance habitation par l’apport de données externes » rédigé en septembre 2021 par Laurine Babut en vue de l’obtention du diplôme d’actuaire EURIA.
« Ce mémoire s’inscrit dans une volonté d’obtenir un tarif concurrentiel, précis et personnalisé tout en allégeant le nombre de questions posées lors de la souscription de l’assuré. Ainsi, l’assureur pourra proposer à son assuré un tarif adapté à son profil de risque de façon simple et rapide. Dans cet objectif, les assureurs tendent à introduire dans leur modélisation des données externes qui sont des facteurs non demandés à la souscription (par opposition aux données internes) » explique Laurine Babut en introduction.
Evaluer l’environnement
L’objectif de l’assureur est de segmenter au mieux sa tarification afin de s’adapter aux différents profils de risques des assurés. Ainsi, l’assureur pose plusieurs questions à l’assuré lors de la souscription du contrat afin de pouvoir lui attribuer une prime reflétant au mieux son profil de risque.
Ces nombreuses questions peuvent s’avérer contraignantes pour l’assuré qui peut y voir une perte de temps. Afin de réduire ce nombre de questions posées à la souscription, les assureurs tendent à introduire des données externes, ce sont des facteurs qui ne sont pas demandés à la souscription (par opposition aux données internes). Il peut ainsi s’agir de la zone géographique qui constitue l’un des critères de segmentation les plus couramment employés par les assureurs.
En effet, l’estimation de la sinistralité en assurance habitation est souvent influencée par l’environnement géographique, météorologique, sociodémographique du risque. Ces facteurs externes, disponibles en Open Data, permettent d’apporter une meilleure connaissance du risque assuré et peuvent même aller jusqu’à remplacer cette donnée.
Données de coût et données géographiques
Le mémoire repose sur différentes données : des données internes à Allianz France et externes. Ce large panel de facteurs externes est collecté en Open Data ainsi qu’auprès de différents services internes chez Allianz.
Ces données sont divisées en deux types de données : des données de coûts, comme le coût de la main d’œuvre du plombier, le cours du cuivre, utilisées uniquement pour les modèles de coût moyen et sont intégrées via la date de survenance du sinistre ; des données géographiques, comme des données démographiques, socio-économiques, météorologiques.
Ces informations sont intégrées aux données internes via l’adresse du logement assuré. Certaines données sont directement obtenues à partir de la latitude et de la longitude de l’adresse de l’assuré, d’autres seront récupérées à d’autres mailles telles que le quartier (l’IRIS), la commune (l’INSEE) ou encore le département.
Machine Learning et facteurs externes
L’allègement du questionnaire de souscription s’effectue selon deux approches : la prédiction de questions posées à la souscription via des méthodes de Machine Learning, et l’ajout de facteurs externes dans les modèles de fréquence et coût moyen afin d’optimiser les modèles tarifaires et remplacer (partiellement ou complètement) les données internes classiquement utilisées par les données externes.
Les résultats obtenus pour ces deux méthodes sont satisfaisants. En effet, chacune des méthodes permet de retirer des variables internes grâce à l’apport de données externes tout en conservant la performance des modèles de tarification. De plus, cette étude a permis de montrer que malgré un grand nombre de données externes variées collectées, ces dernières ne suffisent pas pour calculer un tarif sans question.
Supprimer de deux à cinq variables
La première méthode permet de retirer deux variables du questionnaire de souscription puisque cette méthode s’applique à l’ensemble du produit assurance habitation d’Allianz pour les maisons, chalets en bois et châteaux manoirs.
La deuxième méthode, quant à elle, permet de retirer cinq variables internes des modèles pour la garantie dégâts des eaux. La prochaine étape serait de réaliser la deuxième méthode sur les autres garanties du produit habitation d’Allianz France afin de vérifier que les données externes permettent de remplacer les mêmes données internes tout en conservant la performance des modèles.
Ainsi, les questions posées à la souscription pour récupérer les variables internes pourraient être retirées du questionnaire. Un travail intéressant pour les assureurs soucieux d’optimiser leurs questionnaires assurés.
Source : mémoire de Laurine Babut Réduction du nombre de questions posées à la souscription d’un contrat d’assurance habitation par l’apport de données externes, septembre 2021