# Data Mining : Étude des Déterminants des Annulations de Réservation pour l’hôtellerie.
## Introduction
## INTRODUCTION
Dans le cadre de notre cours sur l'extraction de données (Data Mining), nous avons exploré le domaine de la fouille de données. La fouille de données implique l'analyse de bases de données pour en obtenir une compréhension approfondie et en extraire des connaissances. En appliquant diverses techniques, nous avons collecté des données brutes, les avons contextualisées et leur avons attribué une signification. Cette démarche a abouti à une analyse approfondie des informations, permettant ainsi de répondre de manière optimale à une ques1on de recherche.
...
...
@@ -14,13 +14,13 @@ Pour réaliser au mieux nos analyses, nous avons décidé d’utiliser une base
Dans le dossier SAMPLE vous trouverez :
un dossier all_sets contenant la séparation de la base de données en différents dataset :
Un dossier `all_sets` contenant la séparation de la base de données en différents dataset :
-`test_set.xlsx` reprend toutes les données utilisées pour le test de l'entrainement des modèles supervisés.
-`training_set.xlsx` reprend toutes les données utilisées pour entrainer les modèles supervisés et non supervisés.
-`validation_set.xlsx` reprend toutes les données permettant de valider l'entrainements des modèles supervisés.
le dossier sample contient aussi :
Mais aussi :
-`booking.xlsx` reprenant dans différentes feuilles excel, les données brutes, les données de 2017 (main_data_2017), les données de 2018. Pour nos analyses, nous nous sommes basés sur les données de 2017