@@ -84,7 +84,35 @@ Ceux-ci se trouvent dans le même dossier que chacun des jupyter notebook (.ipyn
...
@@ -84,7 +84,35 @@ Ceux-ci se trouvent dans le même dossier que chacun des jupyter notebook (.ipyn
En complément des analyses mentionnées, une distribution des 'ratings' par films a été effectuée. Cette distribution offre un aperçu détaillé de la manière dont les différentes notes sont réparties entre les films, mettant en lumière les tendances de notation et les variations de popularité parmi les films. De plus, une matrice de sparsité a été calculée pour évaluer la densité des données. Cette matrice montre la proportion de cases vides ou non renseignées dans la matrice des notes, ce qui est crucial pour comprendre la disponibilité des données et leur potentiel pour l'analyse et la modélisation.
En complément des analyses mentionnées, une distribution des 'ratings' par films a été effectuée. Cette distribution offre un aperçu détaillé de la manière dont les différentes notes sont réparties entre les films, mettant en lumière les tendances de notation et les variations de popularité parmi les films. De plus, une matrice de sparsité a été calculée pour évaluer la densité des données. Cette matrice montre la proportion de cases vides ou non renseignées dans la matrice des notes, ce qui est crucial pour comprendre la disponibilité des données et leur potentiel pour l'analyse et la modélisation.
2.**Evaluator_block** (à compléter)
2.**Evaluator_block**
- evaluator.ipynb
Importation des Packages et des Modules :
Les packages model_selection et accuracy de Surprise ont été importés pour effectuer une validation croisée et utiliser des métriques prédéfinies pour l'évaluation des modèles.
Adaptation des Chargeurs (Loaders) :
Une fonction load_ratings() a été modifiée pour permettre le chargement de données dans un format compatible avec Surprise. Un argument surprise_format a été ajouté pour conditionner le chargement en un objet Dataset compatible Surprise à partir d'un DataFrame Pandas.
Validation Croisée (Crossvalidation) :
Trois méthodes d'évaluation ont été mises en œuvre :
generate_split_predictions(): Cette fonction divise l'ensemble de données en un ensemble d'entraînement et un ensemble de test en utilisant train_test_split de Surprise.
generate_loo_top_n(): Ici, un processus "leave-one-out" (Laisser un élément de côté) est utilisé pour générer des recommandations top-N et évaluer les performances du modèle.
generate_full_top_n(): Cette fonction utilise l'ensemble complet de données pour générer des recommandations top-N sans division.
Nouvelles Métriques d'Évaluation :
Trois nouvelles métriques ont été ajoutées pour évaluer les modèles de recommandation :
rmse (split type): Racine carrée de l'erreur quadratique moyenne pour évaluer les prédictions.
hit rate (loo type): Taux de succès mesurant le pourcentage d'utilisateurs pour lesquels l'un des films recommandés est celui qu'ils ont noté dans l'ensemble de test.
novelty (full type): Mesure de la nouveauté des recommandations en fonction de la popularité des films recommandés.
Exportation du Rapport d'Évaluation :
Une fonction export_evaluation_report() a été mise en œuvre pour exporter le rapport d'évaluation vers un fichier CSV dans un répertoire spécifié.
3.**User_based** (à compléter)
3.**User_based** (à compléter)
...
@@ -124,7 +152,16 @@ Nous tenons à exprimer notre gratitude envers plusieurs parties qui ont jouées
...
@@ -124,7 +152,16 @@ Nous tenons à exprimer notre gratitude envers plusieurs parties qui ont jouées