0% ont trouvé ce document utile (0 vote)

137 vues3 pages

Analyse de la qualité du raisin et faillite

Le document décrit un travail pratique sur l'analyse de données qui consiste à construire des arbres de décision sur deux jeux de données caractérisant des entreprises et la qualité du raisin, et à comparer les résultats aux méthodes de régression logistique et analyse discriminante.

Transféré par

cyrine khbou

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats DOC, PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

137 vues3 pages

Analyse de la qualité du raisin et faillite

Transféré par

cyrine khbou

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats DOC, PDF, TXT ou lisez en ligne sur Scribd

2019/2020 Data Mining TP n°5 ENIT

Enseignant : Walid Ayadi Génie Industriel

Les données :

1. Le fichier Faillite_entrep.txt est composé de variables caractérisant des entreprises qui ont
fait faillite et d’autre en bonne santé financière. Les variables des entreprises sont :
FD : flux de trésorerie / dette totale, RA : résultat net / actif,
AD : actif à court terme / dette à court terme, AV : actif à court terme / ventes,
ET : F si faillite et NF sinon. Variable cible : ET

2. On propose d’étudier la qualité du raisin en fonction de variables observées sur 34 années.

Les variables du fichier Cultures_raisin.txt sont TEMPERATURE : Somme des températures
moyennes journalières, SOLEIL : Durée d’insolation, CHALEUR : Nombre de jours de
grande chaleur, PLUIE : Hauteur des pluies, QUALITE DU RAISIN : Bon, Mauvais.
Variable cible : QUALITE DU RAISIN

Objectifs :

1. Construire les arbres de décision des deux fichiers de données via la commande rpart.
2. Comparer les résultats de l’arbre de décision aux résultats de la régression logistique et
l’analyse linéaire discriminante.

Fichier Faillite_entrep.txt

1. Lire les données

2. Construire un arbre de décision afin d’expliquer la variable cible en fixant le nombre

minimal d'exemples nécessaires à la création d'un nœud est 1. Interpréter les résultats obtenus.
#Arbre de décision

Travaux pratiques Data Mining Walid Ayadi

Travaux pratiques Data Mining Walid Ayadi
3. Prédire la variable cible en se basant sur le modèle construit.
#prediction on the training set
[Link]= predict(……………,newdata= ……………) ;
[Link]=ifelse(………,…….,…..) ;

4. Calculer les taux de bon classement du modèle en se basant sur la matrice de confusion
………………………………
5. Comparer les résultats de l’arbre de décision aux résultats de la régression logistique et
l’analyse discriminante.
…………………………

Fichier Cultures_raisin.txt

Refaire le même travail pour le fichier Culture_raisin.txt

Travaux pratiques Data Mining Walid Ayadi

Vous aimerez peut-être aussi

DL Chapitre 2 SAD Part II Arbre de Décision
Pas encore d'évaluation
DL Chapitre 2 SAD Part II Arbre de Décision
5 pages
Data Mining Prediction
Pas encore d'évaluation
Data Mining Prediction
151 pages
Machine Learning - Partie 2 - Régression Logistique Et KNN
Pas encore d'évaluation
Machine Learning - Partie 2 - Régression Logistique Et KNN
37 pages
TD4-Clustering1 (Corrigé)
100% (1)
TD4-Clustering1 (Corrigé)
3 pages
Analyse des Données Simplifiée
Pas encore d'évaluation
Analyse des Données Simplifiée
31 pages
Shami Khalil
Pas encore d'évaluation
Shami Khalil
4 pages
Introduction à l'analyse de données avec R
Pas encore d'évaluation
Introduction à l'analyse de données avec R
30 pages
Resume Afc
Pas encore d'évaluation
Resume Afc
4 pages
Introduction à Crisp-DM et Clustering
Pas encore d'évaluation
Introduction à Crisp-DM et Clustering
23 pages
Cours AFC
Pas encore d'évaluation
Cours AFC
7 pages
Classification K-NN et Régression Linéaire
Pas encore d'évaluation
Classification K-NN et Régression Linéaire
12 pages
Chap4 Diagrammedesquence 170502095352
Pas encore d'évaluation
Chap4 Diagrammedesquence 170502095352
20 pages
Introduction à l'apprentissage non supervisé
Pas encore d'évaluation
Introduction à l'apprentissage non supervisé
43 pages
Prédictions Tennis et Achat Ordinateur
Pas encore d'évaluation
Prédictions Tennis et Achat Ordinateur
2 pages
Algorithme k-NN : Concepts et Applications
Pas encore d'évaluation
Algorithme k-NN : Concepts et Applications
32 pages
DataMining Part3 Classification PDF
Pas encore d'évaluation
DataMining Part3 Classification PDF
64 pages
TD2 Reg Multiple 23-24
100% (1)
TD2 Reg Multiple 23-24
3 pages
TP Sur Regression Logistique
Pas encore d'évaluation
TP Sur Regression Logistique
4 pages
Exemple K Means Et HCA PDF
Pas encore d'évaluation
Exemple K Means Et HCA PDF
4 pages
Introduction à la régression linéaire
Pas encore d'évaluation
Introduction à la régression linéaire
71 pages
Introduction Aux Bibliothèques NumPy Et Pandas
Pas encore d'évaluation
Introduction Aux Bibliothèques NumPy Et Pandas
13 pages
Arbres de Décision et SQL
Pas encore d'évaluation
Arbres de Décision et SQL
36 pages
TP K-Means
Pas encore d'évaluation
TP K-Means
13 pages
Chapitre 5 - Les Arbres de D-Cision
Pas encore d'évaluation
Chapitre 5 - Les Arbres de D-Cision
33 pages
TD 1
Pas encore d'évaluation
TD 1
1 page
Examen Classification Dec2018
Pas encore d'évaluation
Examen Classification Dec2018
3 pages
Forets
Pas encore d'évaluation
Forets
19 pages
TP-K-Means Clustering: Exemple de Resultat Trouve Pour K 2
Pas encore d'évaluation
TP-K-Means Clustering: Exemple de Resultat Trouve Pour K 2
1 page
Modèles ML: Diagnostic et Prévision
Pas encore d'évaluation
Modèles ML: Diagnostic et Prévision
2 pages
NLP
100% (1)
NLP
4 pages
AD Examen 0405
Pas encore d'évaluation
AD Examen 0405
4 pages
TD Et TP Acp
Pas encore d'évaluation
TD Et TP Acp
6 pages
TD5 Se
Pas encore d'évaluation
TD5 Se
6 pages
Chapitre2 - Atelier UML Vers Java Avec Correction
Pas encore d'évaluation
Chapitre2 - Atelier UML Vers Java Avec Correction
7 pages
Examen Ia
Pas encore d'évaluation
Examen Ia
11 pages
Exercices Avec Solution
Pas encore d'évaluation
Exercices Avec Solution
42 pages
TD 1 PLF
Pas encore d'évaluation
TD 1 PLF
2 pages
Data Mining CAH
Pas encore d'évaluation
Data Mining CAH
18 pages
Output 4
Pas encore d'évaluation
Output 4
3 pages
Statistiques descriptives avec R
Pas encore d'évaluation
Statistiques descriptives avec R
4 pages
Examen Statistiques ENIT 2017
Pas encore d'évaluation
Examen Statistiques ENIT 2017
2 pages
Examen Analyse de Données - Master 1 SIR/SIA/IAD
Pas encore d'évaluation
Examen Analyse de Données - Master 1 SIR/SIA/IAD
5 pages
Exam Fouille Extraction Datamining Donnees 2018 2019cor
100% (1)
Exam Fouille Extraction Datamining Donnees 2018 2019cor
6 pages
Chapitre 6 Clustering Hi-Rarchique
Pas encore d'évaluation
Chapitre 6 Clustering Hi-Rarchique
62 pages
Chapitre1 DM Rebbah
Pas encore d'évaluation
Chapitre1 DM Rebbah
19 pages
TP RF Correction
Pas encore d'évaluation
TP RF Correction
12 pages
Chap4-Ingénierie Des Donnéesnov2023
Pas encore d'évaluation
Chap4-Ingénierie Des Donnéesnov2023
53 pages
Compte Rendu: Mini Projet Compression & Stockage
Pas encore d'évaluation
Compte Rendu: Mini Projet Compression & Stockage
14 pages
TP: Manipulation des Piles en C
Pas encore d'évaluation
TP: Manipulation des Piles en C
3 pages
Exos2011 New01
Pas encore d'évaluation
Exos2011 New01
23 pages
Algorithme de Détection Et Suivi
Pas encore d'évaluation
Algorithme de Détection Et Suivi
47 pages
Examen de Reconnaissance de Motifs
Pas encore d'évaluation
Examen de Reconnaissance de Motifs
4 pages
Atelier sur MCD, MLD et MPD
Pas encore d'évaluation
Atelier sur MCD, MLD et MPD
1 page
Introduction à Python et Scikit-learn
Pas encore d'évaluation
Introduction à Python et Scikit-learn
6 pages
Optimisation des Hyperparamètres en ML
Pas encore d'évaluation
Optimisation des Hyperparamètres en ML
39 pages
TP Python : Manipulation de Données en Statistiques Exploratoires
Pas encore d'évaluation
TP Python : Manipulation de Données en Statistiques Exploratoires
3 pages
Polycopie SEP 2021-Converti
Pas encore d'évaluation
Polycopie SEP 2021-Converti
46 pages
QCM
Pas encore d'évaluation
QCM
7 pages
DataMining Part2 ECD
100% (1)
DataMining Part2 ECD
38 pages
22222222222
Pas encore d'évaluation
22222222222
2 pages
Cet C
Pas encore d'évaluation
Cet C
8 pages
Optimisation Logistique de Produlact
Pas encore d'évaluation
Optimisation Logistique de Produlact
3 pages
Plan d'approvisionnement optimal ENG
Pas encore d'évaluation
Plan d'approvisionnement optimal ENG
1 page
Davis FR
100% (1)
Davis FR
2 pages
Lidor
Pas encore d'évaluation
Lidor
2 pages
Optimisation des Coûts de Production
Pas encore d'évaluation
Optimisation des Coûts de Production
10 pages
Fiabilité des structures en maintenance
Pas encore d'évaluation
Fiabilité des structures en maintenance
18 pages
Simulation Bon de Trésor
Pas encore d'évaluation
Simulation Bon de Trésor
2 pages
Cas Supp Decision
Pas encore d'évaluation
Cas Supp Decision
2 pages
TD Rattrapage 2015-2016 : Questions et Problèmes de Production
Pas encore d'évaluation
TD Rattrapage 2015-2016 : Questions et Problèmes de Production
5 pages
Chapitre I
Pas encore d'évaluation
Chapitre I
11 pages
Les Secrets Des Entreprises Qui Durent
Pas encore d'évaluation
Les Secrets Des Entreprises Qui Durent
17 pages
Problème 4 PDF
100% (1)
Problème 4 PDF
2 pages
Problème 6 PDF
100% (1)
Problème 6 PDF
2 pages
Probleme CPM GP
Pas encore d'évaluation
Probleme CPM GP
1 page
G3GI1
Pas encore d'évaluation
G3GI1
3 pages