ML Exam Final

L'examen de deuxième semestre en apprentissage automatique pour les étudiants de 4e année en statistiques et science des données couvre des aspects théoriques et pratiques. La première partie aborde des questions sur les défis en apprentissage automatique, les techniques de validation, l'apprentissage non supervisé, et les problèmes de déséquilibre des données. La seconde partie se concentre sur l'application de l'apprentissage automatique pour détecter la popularité des chansons à partir des données de Spotify, en demandant aux étudiants de détailler les étapes de l'étude et d'analyser les résultats.

Transféré par

Aymen Dehimi

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

332 vues4 pages

ML Exam Final

Transféré par

Aymen Dehimi

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Higher National School of Statistics and Applied Economy

(ENSSEA)
Second semester Exam : Introduction to Machine Learning
4th year Statistics and Data Science
duration : 1h30

Ayoub Asri

26 May 2024

English version

Part 1 : Theoretical aspects

Answer all the following questions.

Q1. Discuss three major issues in machine learning that need to be addressed. Provide examples and
potential solutions for each issue.
Q2. what is the difference between cross-validation and boostrapping ? and when can we use each one ?
Q3. what are the subfields studied in unsupervised learning ? precise at least 2 techniques of each subfield.
Q4. Explain briefly the concepts of UMAP and t-SNE, precise what is the context of using each technique
and finally what is the main difference between them and PCA ?
Q5. Is using imbalanced data sets for modeling really an issue ? Justify ! What are the implications of using
this type of dataset ?
Q6. Precise the most common ideas to solve the imbalanced data sets issues ? with details.
Q7. What is stacking ? explain its concept ! is it really beneficial in ML ?

Part 2 : Application

In this part we will focus on an application of ML to detect the popularity of a song (categorical variable)
using data for Spotify. Answer all the following questions using your knowledge.
Q1. cite all the steps used in this study, and explain the reason for each step.
Q2. Precise (and why) the size of the data set after the pre-processing step.
Q4. Analyze every step of this study.
Q4. Comment on the results presented
Q5. For each part of this study, propose an improvement.
Q6. Summarize your final thought process about the steps you would use (that you will use in the practical
part of the exam)

1
French version

Partie 1 : Aspects théoriques

Répondez à toutes les questions suivantes.

Q1. Discutez les trois problèmes de Machine Learning qui doivent être traités.
Q2. Quelle est la différence entre la validation croisée et le bootstrapping ? Et quand peut-on utiliser chacun
?
Q3. Quels sont les sous-domaines étudiés dans l’apprentissage non supervisé ? Précisez au moins deux
techniques pour chaque sous-domaine.
Q4. Expliquez brièvement les concepts de l’UMAP et du t-SNE, précisez dans quel contexte chaque technique
est utilisée et enfin quelle est la principale différence entre elles et la PCA ?
Q5. L’utilisation de base de données déséquilibrés pour la modélisation est-elle vraiment un problème ?
Justifiez ! Quelles sont les implications de l’utilisation de ce type de jeu de données ?
Q6. Précisez les idées les plus courantes pour résoudre les problèmes des bases de données déséquilibrés ?
Avec quelques détails.
Q7. Qu’est-ce que le stacking ? Expliquez son concept ! Est-ce vraiment bénéfique dans la Machine Learning?

Partie 2 : Application

Dans cette partie, nous nous concentrerons sur une application de la Machine learning pour détecter la
popularité d’une chanson (variable catégorielle) en utilisant les données de Spotify. Répondez à toutes les
questions suivantes en utilisant vos connaissances.
Q1. Citez toutes les étapes utilisées dans cette étude et expliquez la raison de chaque étape.
Q2. Précisez (et pourquoi) la taille du jeu de données après l’étape de prétraitement.
Q3. Analysez chaque étape de cette étude.
Q4. Commentez les résultats présentés.
Q5. Pour chaque partie de cette étude, proposez une amélioration.
Q6. Résumez votre processus de réflexion final sur les étapes que vous pourriez utiliser (que vous pourriez
utiliser dans la partie pratique de l’examen).

2
1. Step 1 :Data

2.Step 2 :

3.Step 3 :

4.Step 4 : right = xgboost

3
5.Step 5 : down = xgboost

6.Step 6 :

7.Step 7 :

8.Step 8 :

9.Step 9 :

Vous aimerez peut-être aussi

Examen ML: Classification et Préparation
Pas encore d'évaluation
Examen ML: Classification et Préparation
6 pages
Introduction au Machine Learning et Régression
Pas encore d'évaluation
Introduction au Machine Learning et Régression
290 pages
Ensemble Learning - Forêt Aléatoire, Boosting, Stacking
Pas encore d'évaluation
Ensemble Learning - Forêt Aléatoire, Boosting, Stacking
26 pages
Régression Linéaire et Descente de Gradient
Pas encore d'évaluation
Régression Linéaire et Descente de Gradient
6 pages
Rapport Stage Lamme ABRAICH AYOUB
Pas encore d'évaluation
Rapport Stage Lamme ABRAICH AYOUB
97 pages
TP 2 Data Science
Pas encore d'évaluation
TP 2 Data Science
1 page
Optimisation des Hyperparamètres en ML
Pas encore d'évaluation
Optimisation des Hyperparamètres en ML
39 pages
Examen
Pas encore d'évaluation
Examen
4 pages
Algorithmes d'IA et Machine Learning
Pas encore d'évaluation
Algorithmes d'IA et Machine Learning
10 pages
Techniques de Datamining en Cours
Pas encore d'évaluation
Techniques de Datamining en Cours
19 pages
Evaluation Et Séléction Du Modèle 2
Pas encore d'évaluation
Evaluation Et Séléction Du Modèle 2
36 pages
INF8111 - Exercices + Solutions
Pas encore d'évaluation
INF8111 - Exercices + Solutions
32 pages
Introduction à Crisp-DM et Clustering
Pas encore d'évaluation
Introduction à Crisp-DM et Clustering
23 pages
TP2 Prétraitement Des Données Ipynb - Colab
Pas encore d'évaluation
TP2 Prétraitement Des Données Ipynb - Colab
10 pages
Machine Learning - Partie 2 - Régression Logistique Et KNN
Pas encore d'évaluation
Machine Learning - Partie 2 - Régression Logistique Et KNN
37 pages
Examen Apprentissage - Profond
Pas encore d'évaluation
Examen Apprentissage - Profond
3 pages
File D Attente
Pas encore d'évaluation
File D Attente
43 pages
Cours 5-6 Perceptron-SVM
100% (1)
Cours 5-6 Perceptron-SVM
76 pages
TD Et TP Acp
Pas encore d'évaluation
TD Et TP Acp
6 pages
Machine Learning : Descente de Gradient et Régressions
Pas encore d'évaluation
Machine Learning : Descente de Gradient et Régressions
3 pages
Cours - Apprentissage Statistique
100% (1)
Cours - Apprentissage Statistique
24 pages
Cours DL - Part5 (Prof)
Pas encore d'évaluation
Cours DL - Part5 (Prof)
78 pages
Classification par K-Medoids
Pas encore d'évaluation
Classification par K-Medoids
30 pages
Régression logistique et diabète : étude des facteurs
Pas encore d'évaluation
Régression logistique et diabète : étude des facteurs
58 pages
Introduction à l'apprentissage automatique
Pas encore d'évaluation
Introduction à l'apprentissage automatique
5 pages
Data Mining CAH
Pas encore d'évaluation
Data Mining CAH
18 pages
Python pour la Statistique Exploratoire
Pas encore d'évaluation
Python pour la Statistique Exploratoire
3 pages
Intervalles de confiance en statistique
100% (1)
Intervalles de confiance en statistique
7 pages
Azizi Cour FD
Pas encore d'évaluation
Azizi Cour FD
48 pages
TP Sur Regression Logistique
Pas encore d'évaluation
TP Sur Regression Logistique
4 pages
Master Big Data et Systèmes Intelligents
100% (1)
Master Big Data et Systèmes Intelligents
1 page
TP3 - SVM-23-24
Pas encore d'évaluation
TP3 - SVM-23-24
3 pages
Cours Op Tim Multi
Pas encore d'évaluation
Cours Op Tim Multi
59 pages
Machine Learning-Partie 3-2021
Pas encore d'évaluation
Machine Learning-Partie 3-2021
8 pages
Cours IA - Chapitre 2 - R-Seaux de Neurones
Pas encore d'évaluation
Cours IA - Chapitre 2 - R-Seaux de Neurones
24 pages
Machine Learning
Pas encore d'évaluation
Machine Learning
10 pages
Modèle de Datamining pour Poids Bébé
100% (1)
Modèle de Datamining pour Poids Bébé
3 pages
Régression Linéaire: Algorithme et Optimisation
Pas encore d'évaluation
Régression Linéaire: Algorithme et Optimisation
34 pages
Méthodologie du Data Mining expliquée
Pas encore d'évaluation
Méthodologie du Data Mining expliquée
46 pages
Master Data Sciences & Big Data: Faculté Des Sciences Ben M'Sik, Université Hassan II-Casablanca
Pas encore d'évaluation
Master Data Sciences & Big Data: Faculté Des Sciences Ben M'Sik, Université Hassan II-Casablanca
21 pages
Apprentissage Supervise
Pas encore d'évaluation
Apprentissage Supervise
16 pages
Les Méthodes de Régression en Datamining
Pas encore d'évaluation
Les Méthodes de Régression en Datamining
30 pages
Text Mining et Désinformation Médicale
Pas encore d'évaluation
Text Mining et Désinformation Médicale
3 pages
Classification Clients en Microfinance
Pas encore d'évaluation
Classification Clients en Microfinance
63 pages
Examen Systèmes de Recommandation M1 INSI
Pas encore d'évaluation
Examen Systèmes de Recommandation M1 INSI
3 pages
Correction TD 2
Pas encore d'évaluation
Correction TD 2
4 pages
Quiz 02-K Nearest Neighbors
100% (1)
Quiz 02-K Nearest Neighbors
1 page
NLP
100% (1)
NLP
4 pages
Chapitre2 DecisionTrees CART
Pas encore d'évaluation
Chapitre2 DecisionTrees CART
53 pages
Chapitre 6 Clustering Hi-Rarchique
Pas encore d'évaluation
Chapitre 6 Clustering Hi-Rarchique
62 pages
Examen Deep Learning - Ing-5-SSIR
Pas encore d'évaluation
Examen Deep Learning - Ing-5-SSIR
3 pages
Ydeep Learning Course Part 1
Pas encore d'évaluation
Ydeep Learning Course Part 1
31 pages
Algorithmes de régression linéaire et régularisation
Pas encore d'évaluation
Algorithmes de régression linéaire et régularisation
3 pages
Cours
Pas encore d'évaluation
Cours
54 pages
Examen M1 : Apprentissage automatique en Python
100% (1)
Examen M1 : Apprentissage automatique en Python
3 pages
EX ML Corrigé CII-3-SSIR A B
83% (6)
EX ML Corrigé CII-3-SSIR A B
4 pages
TD1 Chapitres 1 & 2 : Module: Machine Learning Licence: RIOT Enseignante: Dr. Rym Besrour
Pas encore d'évaluation
TD1 Chapitres 1 & 2 : Module: Machine Learning Licence: RIOT Enseignante: Dr. Rym Besrour
3 pages
Resumé de Cours Et Questionnaires
Pas encore d'évaluation
Resumé de Cours Et Questionnaires
14 pages
TD 1
Pas encore d'évaluation
TD 1
3 pages
Questionnaire Machine Learning
50% (2)
Questionnaire Machine Learning
21 pages
Transfert d'argent Airtel Congo expliqué
Pas encore d'évaluation
Transfert d'argent Airtel Congo expliqué
1 page
TH1 3 Eval
Pas encore d'évaluation
TH1 3 Eval
6 pages
Examen - Réseaux de Terrain - M2 - RT - Fei - Usthb - 2019 - 1
Pas encore d'évaluation
Examen - Réseaux de Terrain - M2 - RT - Fei - Usthb - 2019 - 1
3 pages
Tableau Sorbet Sicoly
Pas encore d'évaluation
Tableau Sorbet Sicoly
2 pages
Réalité Augmentée pour l'Industrie
Pas encore d'évaluation
Réalité Augmentée pour l'Industrie
19 pages
FR CFSDFSDFSD WCWXWCWX
Pas encore d'évaluation
FR CFSDFSDFSD WCWXWCWX
14 pages
Procédure d'Installation de Grue
Pas encore d'évaluation
Procédure d'Installation de Grue
2 pages
Examen D'informatique 1 Semestre
Pas encore d'évaluation
Examen D'informatique 1 Semestre
5 pages
Statuts de Vitalis Assurance Qualité SARL
Pas encore d'évaluation
Statuts de Vitalis Assurance Qualité SARL
14 pages
Session Et Cookies
Pas encore d'évaluation
Session Et Cookies
38 pages
Calcul Des Charges Mortes Et Vives
Pas encore d'évaluation
Calcul Des Charges Mortes Et Vives
30 pages
Exercice de comptabilité générale 2023
Pas encore d'évaluation
Exercice de comptabilité générale 2023
2 pages
Périmètres, Aires Et Volume
Pas encore d'évaluation
Périmètres, Aires Et Volume
3 pages
Utilisation et types de câble coaxial
Pas encore d'évaluation
Utilisation et types de câble coaxial
8 pages
Comprendre l'école de la contingence
Pas encore d'évaluation
Comprendre l'école de la contingence
20 pages
Attestation de Paiement Caf Janvier 2024
Pas encore d'évaluation
Attestation de Paiement Caf Janvier 2024
3 pages
Conception 1 Cours1
Pas encore d'évaluation
Conception 1 Cours1
5 pages
Matériaux céramiques pour moteurs thermiques
Pas encore d'évaluation
Matériaux céramiques pour moteurs thermiques
5 pages
Guide de culture de la courgette
Pas encore d'évaluation
Guide de culture de la courgette
2 pages
Attestation Des Salariés Déclarés
Pas encore d'évaluation
Attestation Des Salariés Déclarés
7 pages
Matrice de Collaboration v4
Pas encore d'évaluation
Matrice de Collaboration v4
2 pages
Introduction au Multi-threading Linux
Pas encore d'évaluation
Introduction au Multi-threading Linux
13 pages
Notre Catalogue: Poste À Souder
Pas encore d'évaluation
Notre Catalogue: Poste À Souder
37 pages
Apprendre L'informatique de A À Z - 10 Étapes Clés !
100% (5)
Apprendre L'informatique de A À Z - 10 Étapes Clés !
45 pages
Mini-Tfc Intro Generale
Pas encore d'évaluation
Mini-Tfc Intro Generale
4 pages
Techniques et applications de l'immunohistochimie
Pas encore d'évaluation
Techniques et applications de l'immunohistochimie
17 pages
Caractéristiques du Sedidrill 1500w
100% (1)
Caractéristiques du Sedidrill 1500w
5 pages
Tout - Savoir - Sur - L'iso Ok
Pas encore d'évaluation
Tout - Savoir - Sur - L'iso Ok
13 pages
Chapitre 1 Cours de OSE 2024-2025 - 241030 - 090650
Pas encore d'évaluation
Chapitre 1 Cours de OSE 2024-2025 - 241030 - 090650
84 pages
CV MVONDO Italien
Pas encore d'évaluation
CV MVONDO Italien
2 pages