Module : Machine Learning
Licence : RIOT
Enseignante : Dr. Rym Besrour
TD1
« Chapitres 1 & 2 »
QCM
1. Quels éléments essentiels caractérisent un problème de machine learning ?
Une tache précise à accomplir
Des données relatives au phénomène évoqué
Une mesure de la qualité des données
Une mesure de performance du modèle
2. Complétez la phrase suivante :
"Le machine learning est un ensemble de méthodes qui permettent aux ordinateurs d'apprendre à traiter
des tâches de manière automatique…
Supervisée par des humains
Non supervisée par des humains
3. Un problème d’apprentissage supervisé, signifie que...
Les données d’entrainement sont totalement annotées de la sortie désirée
Les données d’entrainement doivent être au moins en partie annotées
Les données d’entrainement ne sont pas annotées du tout
4. Vous devez implémenter un algorithme de détection de transactions frauduleuses.
Les transactions frauduleuses que votre algorithme ne détectera pas couteront plus cher à la banque
que le cout de traitement d’une transaction non frauduleuse prédite comme fraude. Dans la mesure du
raisonnable, vous devez donc minimiser le taux de :
Vrai négatif
Faux négatif
Faux positif
Vrai positif
5. Une entreprise veut prédire le prix d’un plein de carburant, connaissant les caractéristiques d'une
voiture. Est-ce un problème de régression ou de classification ?
C'est un problème de régression.
C'est un problème de classification.
Module : Machine Learning
Licence : RIOT
Enseignante : Dr. Rym Besrour
6. Un modèle prédictif qui se généralise bien signifie que
Le modèle est sur dimensionné (overfitting)
Le modèle s'adapte bien au bruit des données.
Le modèle fonctionne bien sur les données test
Le modèle fonctionne bien sur les données utilisées pour ajuster ses paramètres
7. La ligne de séparation n'est pas idéale pour classer les '+' des 'o'. Pourquoi ?
Le modèle semble légèrement en underfitting.
Je ne vois pas de problème avec cette ligne de séparation.
Le modèle semble légèrement en overfitting.
Questions de réflexion
Q1 : comment définiriez-vous le Machine Learning ?
Pouvez-vous nommer 4 types de problèmes où il se distingue ?
Le machine learning ou apprentissage automatique est l’art de construire des systèmes pouvant
apprendre à partir de données. Apprendre signifie s’améliorer sur certaines tâches, compte tenu d’une
mesure de performance.
Module : Machine Learning
Licence : RIOT
Enseignante : Dr. Rym Besrour
Cette technique est excellente pour les problèmes complexes pour lesquels il n’existe pas de solution
algorithmique, ou pour remplacer de longues listes de règles qu’il faut faire évoluer à la main, ainsi que
pour construire des systèmes qi s’adaptent à des environnements fluctuants, et enfin pour aider es
humains à apprendre par exemple à en leurs aidant à explorer des données.
Q2. Quel type d’algorithme utilisiez-vous pour segmenter vos clients en plusieurs groupes ?
Si vous ne savez pas comment définir les groupes, alors vous pouvez utiliser un algorithme de
partitionnement (apprentissage non supervisé), pour segmenter vos clients en groupes de clients
similaires. Par contre, si vous savez quels groupes vous souhaiteriez obtenir, vous pouvez entrainer un
algorithme de classification en lui fournissant de nombreux exemples de chaque groupe (en
apprentissage supervisé), après quoi il classera tous vos clients dans ces groupes.
Q3. Quelle est la différence entre un paramètre de modèle et un hyperparamètre d’un algorithme
d’apprentissage ?
Un modèle possède un ou plusieurs paramètres qui déterminent ce qu’il prédit lorsqu’on lui donne une
nouvelle observation. Un algorithme d’apprentissage essaie de trouver les valeurs optimales de ces
paramètres afin que ce modèle se généralise bien à de nouvelles observations. Un hyperparamètre est
un paramètre de l’algorithme d’apprentissage lui-même, et non du modèle.