Corrigé Examen Fouille de Données Avancée

Ce document contient les corrigés d'un examen sur la fouille de données avancées. Il présente les réponses à des questions de cours et à deux exercices, le premier sur les motifs fréquents et le second sur la classification.

Transféré par

slim yaich

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

206 vues2 pages

Corrigé Examen Fouille de Données Avancée

Transféré par

slim yaich

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Université Mohamed Khider-Biskra

Faculté des sciences exactes et des sciences de la nature et de la vie

Département d’informatique

Master IDM Fouille de Données Avancée

28 Jan 2013 10:00-11:30, Salle 5

Corrigé type de l’examen

Questions de cours (4 pts)

1. En apprentissage supervisé, la différence fondamentale entre classification et régression
est que la classification est utilisée pour prédire les classes discrètes (catégorielles) tandis
que la régression est utilisée pour prédire les classes continues (numériques).
2. Le phénomène de sur-apprentissage apparait lorsqu’on obtient des modèles qui recon-
naissent parfaitement les exemples utilisés lors de l’apprentissage et échouent face aux
nouveaux exemples.
3. La stratégie utilisée pour éviter le sur-apprentissage lors de l’apprentissage d’arbres de
décision est l’élagage.
4. Les méthode d’évaluation des techniques d’apprentissage sont diverses telles que la vali-
dation croisée, le bootstrap, leave one out, ...etc. (voir le cours pour les principes)

Exercice 1 Motifs fréquents (10.5 pts : 4 + 2.5 + 2.5 + 1.5)

1. Les motifs fréquents :

F1={ Lait,Couches,Pain,,Beurre,Jus,Sucre }
F2= { Lait Couches,Lait Pain, Lait Beurre,Couches Pain,Couches Beurre,Couches Jus,
Couches Sucre, Pain Beurre,Jus Sucre }
F3= {Lait Couches Pain, Lait Couches Beurre, Lait Pain Beurre,Couches Pain Beurre }
F4= { Lait Couches Pain Beurre }
Motifs fréquents = { F1 ∪ F2 ∪ F3 ∪ F4 }
2. Motifs fréquents fermés = { Lait,Couches, Jus, Sucre, Lait Couches, Couches Jus, Couches
Sucre, Pain Beurre, Jus Sucre , Lait Pain Beurre, Couches Pain Beurre, Lait Couches Pain
Beure }
3. Motifs fréquents maximaux = { Couches Jus, Couches Sucre, Jus Sucre, Lait Couches
Pain Beure }
4. Les règles solides d’association de type A, B ⇒ C sont :
Lait Beurre ⇒ Pain
Lait Pain ⇒ Beurre
Couches Beurre ⇒ Pain
Couches Pain ⇒ Beurre

Exercice 2 Classification (5.5 pts : 4 + 0.5 + 1)

1. L’arbre souhaité en utilisant l’algorithme ID3 :

1
2. Le risque du patient ayant les attributs (Jeune,V,F) selon l’arbre construit est E.
3. Le risque du même patient en utilisant la classification bayésienne naı̈ve :
X = (Jeune,V,F)
P(X/Risque=F) = P(Age=Jeune/Risque=F)xP(S1=V/Risque=F)xP(S2=F/Risque=F)
x P(P(Risque=F)
= 0.5 x 0 x ... = 0
P(X/Risque=E) = P(Age=Jeune/Risque=E)xP(S1=V/Risque=E)xP(S2=F/Risque=E)
x P(P(Risque=E)
= 1/3 x 3/3 x 1/3 x 3/10 = 9/90 = 0.1
P(X/Risque=M) = P(Age=Jeune/Risque=M)xP(S1=V/Risque=M)xP(S2=F/Risque=M)
x P(P(Risque=M)
= 0 x ... = 0

Le risque est celui de la classe de probabilité max c-à-d E.

Dr A.Djeffal

Vous aimerez peut-être aussi

Output 4
Pas encore d'évaluation
Output 4
3 pages
3 Examenfda2013 PDF
100% (1)
3 Examenfda2013 PDF
2 pages
Examen Ia
Pas encore d'évaluation
Examen Ia
11 pages
TD1 Apriori
100% (1)
TD1 Apriori
2 pages
TP SVM
Pas encore d'évaluation
TP SVM
6 pages
TP: Arbres de Décision en ML
Pas encore d'évaluation
TP: Arbres de Décision en ML
6 pages
TD N°1 Apprentissage M1-IA 2022-2023 CORR
Pas encore d'évaluation
TD N°1 Apprentissage M1-IA 2022-2023 CORR
7 pages
Algorithmes de Recherche pour Résolution de Problèmes
Pas encore d'évaluation
Algorithmes de Recherche pour Résolution de Problèmes
15 pages
Arbres - Decision 18 19
Pas encore d'évaluation
Arbres - Decision 18 19
76 pages
Chapitre7 TAS
Pas encore d'évaluation
Chapitre7 TAS
29 pages
Cours BDRENSI
100% (1)
Cours BDRENSI
214 pages
Cours 81
100% (1)
Cours 81
28 pages
Corrige 02 Sujets Des Concours D'accès Au Doctorat en Systèmes Intelligents Et Apprentissage Automatique Ghardaïa 2022
Pas encore d'évaluation
Corrige 02 Sujets Des Concours D'accès Au Doctorat en Systèmes Intelligents Et Apprentissage Automatique Ghardaïa 2022
17 pages
Introduction au Machine Learning
Pas encore d'évaluation
Introduction au Machine Learning
10 pages
TP-K-Means Clustering: Exemple de Resultat Trouve Pour K 2
Pas encore d'évaluation
TP-K-Means Clustering: Exemple de Resultat Trouve Pour K 2
1 page
Examia 083 C
Pas encore d'évaluation
Examia 083 C
9 pages
Correction Epreuve de Architecture - Et - Maintenance - SN
Pas encore d'évaluation
Correction Epreuve de Architecture - Et - Maintenance - SN
3 pages
TD4-Clustering1 (Corrigé)
100% (1)
TD4-Clustering1 (Corrigé)
3 pages
Modèles ML: Diagnostic et Prévision
Pas encore d'évaluation
Modèles ML: Diagnostic et Prévision
2 pages
Introduction aux Réseaux Bayésiens
Pas encore d'évaluation
Introduction aux Réseaux Bayésiens
19 pages
Rapport of Machine Learning
Pas encore d'évaluation
Rapport of Machine Learning
63 pages
Cours-Dm Licence 3 - Fevrier 2022 Partie 03
Pas encore d'évaluation
Cours-Dm Licence 3 - Fevrier 2022 Partie 03
30 pages
Examen de Fouille de Données Avancée
0% (1)
Examen de Fouille de Données Avancée
1 page
TP 02
Pas encore d'évaluation
TP 02
2 pages
Algorithme de Strassen et Complexité
Pas encore d'évaluation
Algorithme de Strassen et Complexité
18 pages
Serie 1
Pas encore d'évaluation
Serie 1
5 pages
Chap 4
Pas encore d'évaluation
Chap 4
19 pages
Les Fondamentaux de L'apprentissage Automatique
Pas encore d'évaluation
Les Fondamentaux de L'apprentissage Automatique
10 pages
Syllabus m1 Gadm Azizi Module Datamining2021 2022
Pas encore d'évaluation
Syllabus m1 Gadm Azizi Module Datamining2021 2022
6 pages
TP4 ML
Pas encore d'évaluation
TP4 ML
3 pages
Epreuve DM Concours de Doctorat Univ Annaba 2019-2020 (Tchi Drive)
100% (1)
Epreuve DM Concours de Doctorat Univ Annaba 2019-2020 (Tchi Drive)
3 pages
Chap - Analyse D'associations - Partie 01-18-19
Pas encore d'évaluation
Chap - Analyse D'associations - Partie 01-18-19
12 pages
Tutoriel Protégé 5.2: Création d'Ontologie
Pas encore d'évaluation
Tutoriel Protégé 5.2: Création d'Ontologie
1 page
Partie A - Probalilité - Cours
Pas encore d'évaluation
Partie A - Probalilité - Cours
39 pages
Examen OCclass 2008 Corrigé
Pas encore d'évaluation
Examen OCclass 2008 Corrigé
6 pages
TD - Kmeans CAH
Pas encore d'évaluation
TD - Kmeans CAH
3 pages
Algorithmes Gloutons
Pas encore d'évaluation
Algorithmes Gloutons
12 pages
Introduction à la Data Science
Pas encore d'évaluation
Introduction à la Data Science
23 pages
Performances des Processeurs MIPS
Pas encore d'évaluation
Performances des Processeurs MIPS
1 page
TD 1 PLF
Pas encore d'évaluation
TD 1 PLF
2 pages
Exercices Corrigés D'algorithmique
Pas encore d'évaluation
Exercices Corrigés D'algorithmique
16 pages
Mu4in511 TD Algo
Pas encore d'évaluation
Mu4in511 TD Algo
14 pages
Chapitre 1
Pas encore d'évaluation
Chapitre 1
6 pages
Programmation Entière et Stratégies
Pas encore d'évaluation
Programmation Entière et Stratégies
33 pages
Préparation Des Données-Chapitre2
Pas encore d'évaluation
Préparation Des Données-Chapitre2
27 pages
Heuristiques
Pas encore d'évaluation
Heuristiques
13 pages
Chapitre 2. Regression Linéaire V1
100% (1)
Chapitre 2. Regression Linéaire V1
15 pages
TP 2 Clustering
Pas encore d'évaluation
TP 2 Clustering
2 pages
Introduction aux KNN en Machine Learning
Pas encore d'évaluation
Introduction aux KNN en Machine Learning
8 pages
Apprentissage Supervisé Avec Python: Objectifs
Pas encore d'évaluation
Apprentissage Supervisé Avec Python: Objectifs
4 pages
Introduction au Data Mining et Machine Learning
Pas encore d'évaluation
Introduction au Data Mining et Machine Learning
42 pages
Méthodes Formelles vs Usuelles en Développement
Pas encore d'évaluation
Méthodes Formelles vs Usuelles en Développement
22 pages
TD2 Reg Multiple 23-24
100% (1)
TD2 Reg Multiple 23-24
3 pages
Optimisation des Algorithmes
Pas encore d'évaluation
Optimisation des Algorithmes
38 pages
Sondages électoraux au Maroc : Base de données
Pas encore d'évaluation
Sondages électoraux au Maroc : Base de données
2 pages
Exercices d'Optimisation Combinatoire
0% (1)
Exercices d'Optimisation Combinatoire
2 pages
TP Zoo : Programmation Orientée Objet
Pas encore d'évaluation
TP Zoo : Programmation Orientée Objet
3 pages
4 Examenfda2014
Pas encore d'évaluation
4 Examenfda2014
4 pages
Fouille de Données et Classification
Pas encore d'évaluation
Fouille de Données et Classification
99 pages
Exam DM 2223
Pas encore d'évaluation
Exam DM 2223
2 pages
Installation de Microstack sur Ubuntu
0% (1)
Installation de Microstack sur Ubuntu
5 pages
Commutation de contexte en systèmes d'exploitation
Pas encore d'évaluation
Commutation de contexte en systèmes d'exploitation
1 page
Sujet
Pas encore d'évaluation
Sujet
6 pages
Virtualisation avec VMware vSphere ESXi
Pas encore d'évaluation
Virtualisation avec VMware vSphere ESXi
3 pages
Introduction à la virtualisation informatique
Pas encore d'évaluation
Introduction à la virtualisation informatique
88 pages
Programmation en Langage C
Pas encore d'évaluation
Programmation en Langage C
5 pages
Corr TP Révision
Pas encore d'évaluation
Corr TP Révision
6 pages
Valeurs et Qualités Entrepreneuriales
Pas encore d'évaluation
Valeurs et Qualités Entrepreneuriales
37 pages
Ordonnancement des processus en informatique
Pas encore d'évaluation
Ordonnancement des processus en informatique
26 pages
SQL Server Integration Services: Versions 2019 À 2012
Pas encore d'évaluation
SQL Server Integration Services: Versions 2019 À 2012
2 pages
Atelier SSIS : Extraction et Transformation
Pas encore d'évaluation
Atelier SSIS : Extraction et Transformation
41 pages
Formation SQL Server BI en 5 jours
Pas encore d'évaluation
Formation SQL Server BI en 5 jours
3 pages
Formation SQL Server : Datawarehouse et SSIS
Pas encore d'évaluation
Formation SQL Server : Datawarehouse et SSIS
2 pages
Datamining : Théorie et Pratique EFS S1
Pas encore d'évaluation
Datamining : Théorie et Pratique EFS S1
6 pages
Entrepôt de Données
Pas encore d'évaluation
Entrepôt de Données
24 pages
Output 14
50% (2)
Output 14
5 pages
CTRL DM m2 2011
Pas encore d'évaluation
CTRL DM m2 2011
5 pages
Output 12
100% (1)
Output 12
3 pages
Datamining : Théorie, Pratique et Exercices
100% (1)
Datamining : Théorie, Pratique et Exercices
8 pages
Ex Amen FDA Ratt 2016
Pas encore d'évaluation
Ex Amen FDA Ratt 2016
6 pages
Cours Fonctions Sequentielles
Pas encore d'évaluation
Cours Fonctions Sequentielles
6 pages
Les Postes HTA/BT: Les Différents Types de Postes de Livraison
100% (1)
Les Postes HTA/BT: Les Différents Types de Postes de Livraison
10 pages
Cours Vibration Chap1-2-2022
Pas encore d'évaluation
Cours Vibration Chap1-2-2022
26 pages
V2 Trasmettitori FRA 20180108
Pas encore d'évaluation
V2 Trasmettitori FRA 20180108
20 pages
Exam 2022
Pas encore d'évaluation
Exam 2022
6 pages
Regulation de Temperatur Pid
Pas encore d'évaluation
Regulation de Temperatur Pid
8 pages
Généralités sur le pétrole brut et ses produits
100% (10)
Généralités sur le pétrole brut et ses produits
278 pages
Epreuve PTI Prog
Pas encore d'évaluation
Epreuve PTI Prog
3 pages
ComboBox et VBA : Guide Pratique
Pas encore d'évaluation
ComboBox et VBA : Guide Pratique
3 pages
Ensl1:: Electronique Numérique Et Synthèse Logique
Pas encore d'évaluation
Ensl1:: Electronique Numérique Et Synthèse Logique
19 pages
Fatigue Polycyclique: Calcul et Analyse
Pas encore d'évaluation
Fatigue Polycyclique: Calcul et Analyse
28 pages
Prezentare
Pas encore d'évaluation
Prezentare
11 pages
Mathématiques CG: Rapports & Proportions
Pas encore d'évaluation
Mathématiques CG: Rapports & Proportions
4 pages
Exercice de Logique
100% (4)
Exercice de Logique
2 pages
CGEN2017 COLL CR AcaClermont
Pas encore d'évaluation
CGEN2017 COLL CR AcaClermont
15 pages
3 Catalog Secop
Pas encore d'évaluation
3 Catalog Secop
8 pages
Compte Rendu 2polymere
Pas encore d'évaluation
Compte Rendu 2polymere
8 pages
Calcul Des Potelets Et Portique
Pas encore d'évaluation
Calcul Des Potelets Et Portique
22 pages
Estimation de La Resistance Rotorique de
Pas encore d'évaluation
Estimation de La Resistance Rotorique de
7 pages
Fonctionnement des Timers en Microcontrôleurs
Pas encore d'évaluation
Fonctionnement des Timers en Microcontrôleurs
5 pages
Exercices sur les Nombres Complexes en 4ème
Pas encore d'évaluation
Exercices sur les Nombres Complexes en 4ème
4 pages
CH 22 Composites TD
Pas encore d'évaluation
CH 22 Composites TD
13 pages
Devoir 4 2BAC SC X Modèle 1
Pas encore d'évaluation
Devoir 4 2BAC SC X Modèle 1
10 pages
Fonctions Absolument Monotones
Pas encore d'évaluation
Fonctions Absolument Monotones
2 pages
Travail Et Energie Potentielle de Pesanteur Energie Mecanique Cours 3 2
Pas encore d'évaluation
Travail Et Energie Potentielle de Pesanteur Energie Mecanique Cours 3 2
3 pages
Accumulateur
Pas encore d'évaluation
Accumulateur
18 pages
Étude des Piles de Ponts
100% (1)
Étude des Piles de Ponts
12 pages
Diapos-Cours Chapitre 1
Pas encore d'évaluation
Diapos-Cours Chapitre 1
34 pages
Oscillations Libres: Étude Théorique et Expérimentale
Pas encore d'évaluation
Oscillations Libres: Étude Théorique et Expérimentale
7 pages
SSP455 - F-Les Moteurs 2.0 L TDI Du T5 2010
Pas encore d'évaluation
SSP455 - F-Les Moteurs 2.0 L TDI Du T5 2010
48 pages