0% ont trouvé ce document utile (0 vote)

53 vues3 pages

M1-DATA Mining - Exam M1-DATA Mining - Exam

Le document présente un examen de Data Mining pour l'Université Djillali Liabès, incluant des exercices sur le traitement des valeurs manquantes, les méthodes ensemblistes, la sélection d'attributs, la détection de valeurs aberrantes et l'évaluation de modèles de régression. Chaque exercice demande des explications et des comparaisons entre différentes techniques, ainsi que des calculs spécifiques. Les réponses doivent être basées sur le cours et incluent des méthodes et des performances des algorithmes discutés.

Transféré par

sellamabdelillah3

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

53 vues3 pages

M1-DATA Mining - Exam M1-DATA Mining - Exam

Transféré par

sellamabdelillah3

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

M1-DATA Mining - exam

Data Mining (Université Djillali Liabès de Sidi Bel Abbès)

Scan to open on Studocu

Studocu is not sponsored or endorsed by any college or university

Downloaded by ABdelatif Boukabrine ([email protected])
MINISTERE DE L’ENSEI GNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQ UE
UNIVERSITE DJILLALI LIABES SIDI BEL ABBES

F AC U LTE DE S CIE NCE S E X AC TE S

DE P AR TE M E N T D ’IN FOR M ATI QUE
M AS TE R IS I R S S I WI C 1 E R AN NE E
▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬
DATA MINING JUIN 2021 DURÉE 1H30

Corrigé Type : Voir le cours pour les réponses completes. CECI EST UN RESUME

Exercice 1 : Traiter le problème des valeurs manquantes ?1, ?2, ?3, ?4 en proposant à chaque fois
2 techniques différentes.
Traiter est le mot clé.
Exemple : Je remplace la valeur manquante par la moyenne des valeurs connues de l’attribut,
donc ?1 devient 31.5
8 méthodes différentes. Pas de répétition. 0.5 Point par méthode. Voir cours.

Exercice 2 :
Donner le pourquoi et le principe des méthodes ensemblistes.
Plusieurs avis valent mieux qu’un.
Combiner plusieurs modèles. Voir cours
Comparer les algorithmes boosting et stacking (vus au cours) étape par étape (apprentissage
et classification), donner les similarités et les différences.
Voir cours
Expliquez les paramètres de chacun.
Boosting : nombre de modèles + Algorithme à booster
Stacking : Algorithmes du premier niveau + Algorithme de deuxième niveau
Donner sous la forme d’un schéma l’approche de chaque algorithme.
Voir cours
Quel est le meilleur et pourquoi ?
Chaque algorithme fonctionnera bien dans certaines conditions

Exercice 3 : Pourquoi sélectionner les attributs. Expliquez les deux types de sélections.
Tous les attributs ne sont pas important pour la tâche qu’on souhaite effectuer.
Pour la majorité des algorithmes, les attributs non importants vont influencer négativement sur
les performances du modèle crée. Donc, il est important dans la phase de prétraitement de
sélectionner seulement les attributs important pour la tache considérée.
Les deux types Filter et Wrapper Voir le cours

Donner les attributs sélectionnés pour cet algorithme par la recherche ascendante, puis la
recherche descendante de l’heuristique vue au cours.
Descendante :
1. Perf(A,B,C,D) = 0.72
2. Perf(A,B,C) =0.75 ; Perf(A,C,D) = 0.70 ; Perf(B,C,D) = 0.80 * ; Perf(A,B,D) = 0.63
3. Perf(B,C) = 0.55 ; Perf(B,D) = 0.65 ; Perf(C,D) = 0.45
4. STOP : Les attributs sélectionnés sont B, C, D
Ascendante :
1. Perf(A) = 0.35 ; Perf(B) = 0.25 ; Perf(C) = 0.40 * ; Perf(D) = 0.30
2. Perf(C,A) = 0.60 * ; Perf(C,B) = 0.55 ; Perf(C,D)= 0.45
3. Perf(C,A,B) = 0.75 * ; Perf(C,A,D) = 0.70
4. Perf(C,A,B,D) = 0.72
5. STOP : Les attributs selectionnés sont A, B, C
RIEN DE PLUS OU DE MOINS, SINON C’EST FAUX.

Downloaded by ABdelatif Boukabrine ([email protected])

MINISTERE DE L’ENSEI GNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQ UE
UNIVERSITE DJILLALI LIABES SIDI BEL ABBES

F AC U LTE DE S CIE NCE S E X AC TE S

DE P AR TE M E N T D ’IN FOR M ATI QUE
M AS TE R IS I R S S I WI C 1 E R AN NE E
▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬
DATA MINING JUIN 2021 DURÉE 1H30

Quelle conclusion en tirez-vous ?

Les méthodes (Ascendante, descendante) Wrapper sont des solutions approchées, non
Exhaustives. Chacune fournit une solution acceptable, pas nécessairement la meilleure,
généralement non identique. 6 points

Exercice 4 : Considérer les valeurs de l’attribut M du tableau de l’exercice 1, en utilisant la

méthode interquartile range (IQR) vue au cours, détecter les valeurs aberrantes. (3 points)
1 2 6 7 8 9 10 10 11 12 14 15 16 25
Q2 = 10
Q1 = 6.5
Q3 = 14.5
Q3 – Q1 = 8
8 x 1.5 = 12
Q1 – 12 = -5.5
Q3 + 12 = 26.5
Pas de valeurs aberrantes.
J’ai pris en considération les solutions avec Q1 = 7 ; Q2 = 14 ; et 25 valeur aberrante

Exercice n°5 : Pour une régression, en utilisant le MAE (Mean Absolut Error ) lequel des deux
modèles est meilleur. (3 points)
MAE(M1) = 7/9 = 0.77
MAE(M2) = 10.5/9 = 1.16
MAE(M1) < MAE(M2)  M1 est un meilleur modele.

Downloaded by ABdelatif Boukabrine ([email protected])

Vous aimerez peut-être aussi

Corrigé Examen Data Mining 2019
Pas encore d'évaluation
Corrigé Examen Data Mining 2019
3 pages
Techniques de Data Mining avec SAS
Pas encore d'évaluation
Techniques de Data Mining avec SAS
48 pages
Datamining : Théorie, Pratique et Exercices
100% (2)
Datamining : Théorie, Pratique et Exercices
8 pages
Rapport TP03 Data Mining: Facult e Des Sciences Exactes D Epartement D'informatique
Pas encore d'évaluation
Rapport TP03 Data Mining: Facult e Des Sciences Exactes D Epartement D'informatique
47 pages
Examen Ia
Pas encore d'évaluation
Examen Ia
11 pages
Exam Ratt2021
Pas encore d'évaluation
Exam Ratt2021
3 pages
Optimisation et Analyse de Données en Régression et Classification
Pas encore d'évaluation
Optimisation et Analyse de Données en Régression et Classification
12 pages
Corrigé D'un Examen de Machine Learning S4 Génie MIS
100% (1)
Corrigé D'un Examen de Machine Learning S4 Génie MIS
25 pages
Exam SN2021
Pas encore d'évaluation
Exam SN2021
4 pages
0 - OUTILS STATISTIQUES DU DATA MINING - Pour Debutant
Pas encore d'évaluation
0 - OUTILS STATISTIQUES DU DATA MINING - Pour Debutant
16 pages
Exam DM 2223
Pas encore d'évaluation
Exam DM 2223
2 pages
Partie 2
Pas encore d'évaluation
Partie 2
69 pages
Notes D'étude Pour Réussir Votre Entretien en Science Des Données
Pas encore d'évaluation
Notes D'étude Pour Réussir Votre Entretien en Science Des Données
7 pages
DATA MINING Examen 2020 Corrigé 1
83% (6)
DATA MINING Examen 2020 Corrigé 1
6 pages
EX ML Corrigé CII-3-SSIR A B
83% (6)
EX ML Corrigé CII-3-SSIR A B
4 pages
ML Partie Finale
Pas encore d'évaluation
ML Partie Finale
6 pages
Chapitre 2
Pas encore d'évaluation
Chapitre 2
16 pages
DM2 - 22 10 2024
100% (1)
DM2 - 22 10 2024
117 pages
ExamenDataminingbio2003 2004
Pas encore d'évaluation
ExamenDataminingbio2003 2004
2 pages
Cours - Apprentissage Statistique
100% (1)
Cours - Apprentissage Statistique
24 pages
Cours Apprentissage
Pas encore d'évaluation
Cours Apprentissage
24 pages
Examen de Gestion d'Infocentre
Pas encore d'évaluation
Examen de Gestion d'Infocentre
2 pages
3 Examenfda2013 PDF
100% (1)
3 Examenfda2013 PDF
2 pages
Chapitre2 Classification (Suite)
Pas encore d'évaluation
Chapitre2 Classification (Suite)
9 pages
Méthodes Neuronales : RCP208 et RCP209
Pas encore d'évaluation
Méthodes Neuronales : RCP208 et RCP209
6 pages
Tuffery - Master Rennes 2011-2012 - Data Mining - Presentation
Pas encore d'évaluation
Tuffery - Master Rennes 2011-2012 - Data Mining - Presentation
171 pages
Cours ML
Pas encore d'évaluation
Cours ML
40 pages
12 Examenrattfda2018
Pas encore d'évaluation
12 Examenrattfda2018
4 pages
Expo Fin
Pas encore d'évaluation
Expo Fin
41 pages
Introduction à la Fouille de Données
Pas encore d'évaluation
Introduction à la Fouille de Données
254 pages
Questions D'examen Sur L'exploration de Données
Pas encore d'évaluation
Questions D'examen Sur L'exploration de Données
25 pages
DM2 - 14 10 2024
Pas encore d'évaluation
DM2 - 14 10 2024
110 pages
Datamining : Théorie et Pratique EFS S1
Pas encore d'évaluation
Datamining : Théorie et Pratique EFS S1
6 pages
Cours LEDMI Makhlouf
Pas encore d'évaluation
Cours LEDMI Makhlouf
75 pages
ML Modèle
Pas encore d'évaluation
ML Modèle
9 pages
Data Mining
Pas encore d'évaluation
Data Mining
31 pages
Chap3-Recherche Par Le Contenu
Pas encore d'évaluation
Chap3-Recherche Par Le Contenu
117 pages
0 Intro - New
Pas encore d'évaluation
0 Intro - New
16 pages
Introduction à la fouille de données
Pas encore d'évaluation
Introduction à la fouille de données
83 pages
CTRL DMRI 2020-2021
Pas encore d'évaluation
CTRL DMRI 2020-2021
3 pages
TP 01 Data Preprosessing
Pas encore d'évaluation
TP 01 Data Preprosessing
19 pages
CC INF422 IA M1 Info 22-23
Pas encore d'évaluation
CC INF422 IA M1 Info 22-23
1 page
Cours DM-v14 09 2023
Pas encore d'évaluation
Cours DM-v14 09 2023
30 pages
Les Machines Á Vecteurs de Support (SVM)
Pas encore d'évaluation
Les Machines Á Vecteurs de Support (SVM)
17 pages
Data Science 1.docx 1
Pas encore d'évaluation
Data Science 1.docx 1
15 pages
FD Questions
Pas encore d'évaluation
FD Questions
9 pages
Serie N2
Pas encore d'évaluation
Serie N2
2 pages
Polycopefda
Pas encore d'évaluation
Polycopefda
96 pages
Exam Modeles Pour Le Datamining 2016 2017
Pas encore d'évaluation
Exam Modeles Pour Le Datamining 2016 2017
2 pages
Examen Machine Leraning Doctorat
Pas encore d'évaluation
Examen Machine Leraning Doctorat
11 pages
Cours de Fouille de Données: Concepts et Applications
Pas encore d'évaluation
Cours de Fouille de Données: Concepts et Applications
27 pages
Cours Fouille de Données Partie2
Pas encore d'évaluation
Cours Fouille de Données Partie2
83 pages
Cours IA3 - 5A GE
Pas encore d'évaluation
Cours IA3 - 5A GE
40 pages
Résumé
Pas encore d'évaluation
Résumé
25 pages
Examen4GL I Correction
Pas encore d'évaluation
Examen4GL I Correction
1 page
Méthodes Dapprentissage Non Supervisées
Pas encore d'évaluation
Méthodes Dapprentissage Non Supervisées
65 pages
SVM Support Vector Machine: Ricco Rakotomalala
Pas encore d'évaluation
SVM Support Vector Machine: Ricco Rakotomalala
52 pages
Techniques ensemblistes en analyse prédictive
Pas encore d'évaluation
Techniques ensemblistes en analyse prédictive
44 pages
Modele Contrat de Vente de Marchandises
67% (6)
Modele Contrat de Vente de Marchandises
3 pages
Cancers Colo-Rectaux: 4 Année Médecine
Pas encore d'évaluation
Cancers Colo-Rectaux: 4 Année Médecine
60 pages
Corrigé Examen NOISE Janvier 2012
Pas encore d'évaluation
Corrigé Examen NOISE Janvier 2012
17 pages
Attestation de travail de SOB TALLA Cédric
Pas encore d'évaluation
Attestation de travail de SOB TALLA Cédric
1 page
Effets Du Commerce International Sur L'environnement - Wikipédia
Pas encore d'évaluation
Effets Du Commerce International Sur L'environnement - Wikipédia
12 pages
Certificats de formation de Mamadou Faye
Pas encore d'évaluation
Certificats de formation de Mamadou Faye
19 pages
Correction DS
Pas encore d'évaluation
Correction DS
9 pages
Introduction aux réseaux informatiques
Pas encore d'évaluation
Introduction aux réseaux informatiques
93 pages
Aide Soignant Et Auxiliaire de Puériculture
Pas encore d'évaluation
Aide Soignant Et Auxiliaire de Puériculture
6 pages
Sequenceur Bac
Pas encore d'évaluation
Sequenceur Bac
14 pages
Épopée Comique : Bataille Grenouilles-Rats
Pas encore d'évaluation
Épopée Comique : Bataille Grenouilles-Rats
7 pages
Chapitre F MUTTIN Transport Urbain e
Pas encore d'évaluation
Chapitre F MUTTIN Transport Urbain e
31 pages
Note2 P.W Khoufi 3 Esc
Pas encore d'évaluation
Note2 P.W Khoufi 3 Esc
5 pages
Introduction Aux Techniques Islamiques de Financement Bid1
Pas encore d'évaluation
Introduction Aux Techniques Islamiques de Financement Bid1
206 pages
Révision Ingénieur Environnement Climat Kada Harchaoui
100% (1)
Révision Ingénieur Environnement Climat Kada Harchaoui
3 pages
Fonctions Régaliennes
Pas encore d'évaluation
Fonctions Régaliennes
3 pages
FICHE DE Poste DU CHEF SERVICE DES TRAVAUX ET DE L'environnement
Pas encore d'évaluation
FICHE DE Poste DU CHEF SERVICE DES TRAVAUX ET DE L'environnement
3 pages
EL GHAFIRI Yassine 5 GC FCD-Demande Validation PFE
Pas encore d'évaluation
EL GHAFIRI Yassine 5 GC FCD-Demande Validation PFE
3 pages
Dimens. Dalot 2.2
100% (2)
Dimens. Dalot 2.2
29 pages
Gestionnaire Comptable au Mali : Profil et Compétences
Pas encore d'évaluation
Gestionnaire Comptable au Mali : Profil et Compétences
3 pages
Président de La République Démocratique Du Congo - Wikipédia
Pas encore d'évaluation
Président de La République Démocratique Du Congo - Wikipédia
8 pages
Guide des Réseaux Sanitaires
100% (1)
Guide des Réseaux Sanitaires
28 pages
Impact Du Système de Management Environnemental ISO 14001.
Pas encore d'évaluation
Impact Du Système de Management Environnemental ISO 14001.
24 pages
Cours Robot I Quem I Sea Jour 2015
Pas encore d'évaluation
Cours Robot I Quem I Sea Jour 2015
68 pages
Data Analysis Guide Apprenant Sept 2023
Pas encore d'évaluation
Data Analysis Guide Apprenant Sept 2023
7 pages
Grenoble-Nice Ville 11-02-23 Rault Milica Rdfaso Lfokkneyg3sdsip5a03l
Pas encore d'évaluation
Grenoble-Nice Ville 11-02-23 Rault Milica Rdfaso Lfokkneyg3sdsip5a03l
2 pages
Sanctions AMF: Financière Henry IV et Tony Csordas
Pas encore d'évaluation
Sanctions AMF: Financière Henry IV et Tony Csordas
11 pages
Gestion financière des chantiers BTP
Pas encore d'évaluation
Gestion financière des chantiers BTP
6 pages
Cours de Sociologie Urbaine
Pas encore d'évaluation
Cours de Sociologie Urbaine
26 pages
IR 2018 2019 2020 Hani Fakhfakh
Pas encore d'évaluation
IR 2018 2019 2020 Hani Fakhfakh
3 pages