DATA SCIENCE, MACHINE LEARNING & MARKETING
PREDICTIF
1. Faire des demontrations mathématiques:
Systèmes experts: « si tu as X et X, alors tu as X »
De 197x-199x : traduire compétences des experts sous forme de règle
Echec pour en faire des systèmes intelligents
Machine Learning : années 80
Comprendre modèles, représentation de phénomènes à partir de données
1. ML classique : construire des règles de ce qui se apsse dans la vraie
vie à partir de représentation mathématique
Approche symbolique
2. Deep Learning : on ne va pas essayer de représenter l’intelligence sous
forme de calcul mathématique mais on va essayer de copier le
cerveau, si modélise fonctionnement du neurone,
Réseaux complexes et importants, beaucoup de paramètres
Transformers
165 milliards de paramètres
Vecteur (imaginer une régression)
Faire du big data : collecter le max de données dans l’entreprise,
30 novembre 2022 : taux adoption le plus rapide
Deepseek
Intelligence artificielle :
Apprentissage/learning : capacité d’apprendre à partir de données sans que
celles-ci ne soient explicitement programmées pour exécuter des tâches
spécifiques
- Supervized learning : à partir de variables labels
On veut prédire variable y (label) avec des caractéristiques (features)
Entrée : un jeu de données annotées pour entrainer le modèle
Sortie : une étiquette pour un point de données inconnu par le modèle
o La classification : prédire une catégorie ou une classe (sentiment
associé à un texte, centre d’intérêt d’un client à partir de ses
commentaires)
o La régression : prédire une valeur continue (un nombre réel
comme prix appartement)
- Non-supervized learning : modèle d’apprentissage automatique
pour identifier des patterns « qui se ressemblent », des structures dans
des données non étiquetées
o Clustering : regroupement de points de données similaires
ensemble (segmentation de marché, regroupement social)
o Réduction de dimensionnalité : techniques pour réduire
dimension des données tout en préservant structure
(visualisation de données en grande dimension)
o Détection d’anomalies : détecter observations dont les
caractéristiques sont inhabituelles par rapport à la majorité
(point aberrants)
- Semi-supervisé : petite quantité données étiquetés et grande
quantité données non étiquetés
- Apprentissage par renforcement :
Au début programme qui ne sait rien faire mais qui a plusieurs actions
possibles
Un « agent » (un programme) apprendre à prendre des décisions en
interagissant avec un environnement.
Objectif : maximiser une récompense cumulative en fonction des actions
qu’il peut réaliser
Pas dans la vraie vie mais simulateur
Principes clés de l’apprentissage par renforcement :
o Exploration vs exploitation : découvrir les actions en maximisant
récompense
o Politique : action à partir d’un état donné
o Récompense
o Valeur : estimation de la récompense future attendue
Utilisé en robotique, jeux vidéos, enchères, recommandation
Scikit learn : package standard ML, en Python
En haut : supervisé / en bas : non-supervisé
SUPERVISÉ NON-SUPERVISÉ
Savoir si un prospect va devenir Identifier des comportements clients
client (je sais associer visite sur le différents (clustering : exemple
site et client, j’ai des données x et visiteurs sur le site de Disney, que
un y) viennent-ils faire sur le site : pour
l’améliorer)
Prédire en combien d’exemplaires Hiérarchiser des produits selon leurs
des produits vont se vendre ( caractéristiques
Prédire une courbe de demande en Regrouper des commentaire
électricité d’un foyer similaires
Détecter des transactions frauduleuses (
Reconnaissance de caractères
manuscrits (Yann Lecun)
Apprentissage d’une fonction
MLOPS :
Apprentissage supervisé :
Risque de surrapprentissage
Classification :
Random forests