Cas d'étude : Application de CRISP-DM
à la Prévision des Stocks
Contexte
Une chaîne de supermarchés souhaite optimiser la gestion de ses stocks en prévoyant la
demande de chaque produit. L'objectif principal est de réduire les pertes dues aux
invendus tout en évitant les ruptures de stock, ce qui améliorera la satisfaction client et
l'efficacité opérationnelle.
Étape 1 : Compréhension du Problème
1.1 Identification de l'équipe et des parties prenantes
• Direction de l'entreprise (prise de décisions stratégiques)
• Responsables des stocks et de la logistique
• Équipe data science / analytique
• Fournisseurs et partenaires
1.2 Objectifs du projet
• Réduction des pertes financières liées aux invendus
• Minimisation des ruptures de stock
• Amélioration de la satisfaction client
• Optimisation des coûts de gestion des stocks
1.3 Problématiques abordées
• Variabilité de la demande des produits
• Prédiction précise des ventes
• Gestion efficace des stocks en fonction des tendances de consommation
1.4 Obstacles potentiels
• Qualité et disponibilité des données
• Contraintes logistiques et organisationnelles
• Résistance au changement des acteurs internes
1.5 Critères de succès et KPIs
• Taux de prévision correcte des ventes
• Taux de rupture de stock
• Taux de rotation des stocks
• Réduction des pertes financières
1.6 Variables cibles et explicatives
• Variable cible : Prévision des ventes pour chaque produit
• Variables explicatives : Historique des ventes, saisonnalité, promotions, jours
fériés, tendances de consommation, conditions météorologiques, etc.
Étape 2 : Compréhension des Données
2.1 Sources de données disponibles
• Historique des ventes (transactions passées)
• Données des fournisseurs
• Calendrier des promotions
• Données exogènes (météo, événements locaux)
2.2 Identification des problèmes dans les données
• Valeurs manquantes ou incohérentes
• Données aberrantes (pics anormaux, erreurs de saisie)
• Format non standardisé
• Données redondantes ou non exploitables
Étape 3 : Préparation des Données
3.1 Nettoyage des données
• Gestion des valeurs manquantes (imputation, suppression)
• Correction ou suppression des valeurs aberrantes
• Harmonisation des formats (dates, unités de mesure, etc.)
3.2 Transformation et standardisation
• Normalisation ou standardisation des variables quantitatives
• Conversion des variables qualitatives en catégories exploitables
• Extraction de nouvelles caractéristiques temporelles (jours de la semaine, saisons,
etc.)
3.3 Ingénierie des variables
• Création d'indicateurs supplémentaires pour enrichir l'analyse (par exemple,
tendance de ventes moyennes par période)
3.4 Sélection des données pour l'analyse
• Filtrage des variables pertinentes pour la modélisation
• Validation de la qualité et de la préparation des données avant la phase de
modélisation
Conclusion
Avec ces premières étapes, l'entreprise dispose d'une base solide pour construire un
modèle prédictif efficace. L'étape suivante consistera à choisir la meilleure approche de
modélisation et à l'implémenter dans un cadre opérationnel.