🚀 Répartition détaillée des tâches :
📌 Binôme 1 : Chargement, Exploration et Nettoyage des Données
💡 Objectif : Préparer les données pour l’analyse en vérifiant leur qualité.
1. Chargement des données
o Lire le fichier CSV etudiants.csv dans un dataframe etudiants en
utilisant read.csv().
o Vérifier le séparateur utilisé (sep=";" ou sep=",").
2. Exploration des données
o Afficher les 10 premières lignes avec head(etudiants, 10).
o Examiner la structure avec str(etudiants).
o Générer un résumé statistique avec summary(etudiants).
3. Vérification et nettoyage des données
o Identifier les valeurs manquantes avec any(is.na(etudiants)) et
afficher leur emplacement si nécessaire.
o Vérifier la cohérence des notes (ex. : valeurs négatives ou
supérieures à 20).
o Proposer des solutions (ex. : remplacer les valeurs aberrantes,
supprimer les lignes problématiques).
o Justifier les choix faits dans un court paragraphe.
✍ Livrables : Code bien structuré + résumé expliquant les problèmes détectés
et solutions appliquées.
📌 Binôme 2 : Analyses Statistiques
💡 Objectif : Étudier les performances des étudiants et des matières.
1. Statistiques par étudiant
o Calculer la moyenne des notes de chaque étudiant et l’ajouter à une
nouvelle colonne Moyenne.
o Calculer l’écart-type des notes et l’ajouter à une nouvelle colonne
Std.
o Identifier les étudiants ayant la plus grande variabilité dans leurs
notes.
2. Statistiques par matière
o Créer un dataframe stats_par_matiere contenant pour chaque
matière :
Moyenne
Écart-type
Variance
Médiane
Minimum
Maximum
o Identifier :
La matière avec la moyenne la plus élevée et celle avec la
plus faible.
La matière avec la plus grande dispersion des notes.
✍ Livrables : Code bien structuré + tableau des statistiques + résumé des
observations.
📌 Binôme 3 : Visualisation et Rédaction du Rapport
💡 Objectif : Mettre en évidence les tendances et rédiger un rapport
structuré.
1. Visualisation des résultats
o Choisir des visualisations pertinentes avec ggplot2, par exemple :
Histogrammes des moyennes des étudiants.
Boxplots des notes par matière pour voir la dispersion.
Graphiques de densité ou scatter plots si nécessaire.
o Interpréter les tendances observées.
2. Rédaction du rapport
o Page de garde avec le titre, les noms des membres et les
informations du projet.
o Introduction expliquant les objectifs du projet et la méthodologie.
o Analyses et résultats (résumé des travaux des binômes 1 et 2).
o Visualisations et interprétation (expliquer chaque graphique).
o Conclusion résumant les résultats et recommandations.
✍ Livrables : Graphiques avec interprétations + rapport final bien structuré.
📌 Méthodologie de Travail
Chaque binôme code et rédige un résumé de sa partie.
Une mise en commun sera faite à la fin pour harmoniser le rapport.
Vérification finale du code et du rapport avant soumission.