Menu de navigation ouvert

Scribd

0% ont trouvé ce document utile (0 vote)

134 vues2 pages

22222222222

Le document présente deux jeux de données à analyser avec la régression logistique multiple. Le premier concerne des entreprises en faillite ou en bonne santé financière, le second concerne la qualité du raisin en fonction de variables météorologiques. Le document décrit les étapes à suivre pour appliquer la régression logistique aux deux jeux de données.

Transféré par

Copyright

© © All Rights Reserved

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats DOC, PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

134 vues2 pages

22222222222

Le document présente deux jeux de données à analyser avec la régression logistique multiple. Le premier concerne des entreprises en faillite ou en bonne santé financière, le second concerne la qualité du raisin en fonction de variables météorologiques. Le document décrit les étapes à suivre pour appliquer la régression logistique aux deux jeux de données.

Transféré par

Copyright

© © All Rights Reserved

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats DOC, PDF, TXT ou lisez en ligne sur Scribd

2019/2020 Data Mining TP n°3 ENIT

Enseignant : Walid Ayadi Génie Industriel

Les données :

1. Le fichier Faillite_entrep.txt est composé de variables caractérisant des entreprises qui ont
fait faillite et d’autre en bonne santé financière. Les variables des entreprises sont :
FD : flux de trésorerie / dette totale, RA : résultat net / actif,
AD : actif à court terme / dette à court terme, AV : actif à court terme / ventes,
ET : F si faillite et NF sinon. Variable cible : ET

2. On propose d’étudier la qualité du raisin en fonction de variables observées sur 34 années.

Les variables du fichier Cultures_raisin.txt sont TEMPERATURE : Somme des températures
moyennes journalières, SOLEIL : Durée d’insolation, CHALEUR : Nombre de jours de
grande chaleur, PLUIE : Hauteur des pluies, QUALITE DU RAISIN : Bon, Mauvais.
Variable cible : QUALITE DU RAISIN

Modélisation des variables cibles des deux fichiers de données via la régression logistique
multiple :

Fichier Faillite_entrep.txt

1. Lire les données

don=[Link](‘…..’) ;

2. Utiliser la commande glm(…,family = binomial,…) afin de modéliser la variable cible en

fonction des autres variables disponibles.
[Link]= glm(…,family = binomial,…)

3. Générer les probabilités de prédiction via la commande

[Link]=predict(…., newdata=….., type=…..)

4. Transformer les probabilités trouvées en variable binaire avec la commande

[Link]<- factor(ifelse(….., “……”, “……”))

5. Utiliser la commande table() afin de générer le tableau de confusion et calculer le taux de

bon classement total et les taux de bon classement de chaque classe.
………………………..

6. Evaluer la qualité du modèle et la pertinence des variables explicatives en se basant sur les
résultats obtenus.
…………………….

Travaux pratiques Data Mining Walid Ayadi

Fichier Cultures_raisin.txt

1. Lire les données

don=[Link](‘…..’) ;

2. Utiliser la commande glm(…,family = binomial,…) afin de modéliser la variable cible en

fonction des autres variables disponibles.
[Link]= glm(…,family = binomial,…)

3. Générer les probabilités de prédiction via la commande

[Link]= predict(…., newdata=….., type=…..)

4. Transformer les probabilités trouvées en variable binaire avec la commande

[Link]<- factor(ifelse(….., “……”, “……”))

5. Utiliser la commande table() afin de générer le tableau de confusion et calculer le taux de

bon classement total et les taux de bon classement de chaque classe.
………………………..

6. Evaluer la qualité du modèle et la pertinence des variables explicatives en se basant sur les
résultats obtenus.
…………………….

Travaux pratiques Data Mining Walid Ayadi

Vous aimerez peut-être aussi

Analyse de la qualité du raisin et faillite
Pas encore d'évaluation
Analyse de la qualité du raisin et faillite
3 pages
Analyse discriminante en Data Mining
Pas encore d'évaluation
Analyse discriminante en Data Mining
7 pages
Prédiction Performance Entreprises UK
Pas encore d'évaluation
Prédiction Performance Entreprises UK
2 pages
Modèle de Prédiction de Performance d'Entreprises
Pas encore d'évaluation
Modèle de Prédiction de Performance d'Entreprises
2 pages
ML-Cours CodesR ValidationCroisee French
Pas encore d'évaluation
ML-Cours CodesR ValidationCroisee French
12 pages
TD Data Mining
Pas encore d'évaluation
TD Data Mining
8 pages
Introduction à la statistique appliquée
Pas encore d'évaluation
Introduction à la statistique appliquée
40 pages
TP Regression
Pas encore d'évaluation
TP Regression
5 pages
Vijaya Liinéaire
Pas encore d'évaluation
Vijaya Liinéaire
16 pages
Binome Mootez Ghozzi Et Achraf Challakhi TP1
100% (1)
Binome Mootez Ghozzi Et Achraf Challakhi TP1
5 pages
Exemple 1 AFD
Pas encore d'évaluation
Exemple 1 AFD
4 pages
Classification des iris avec KNN en Python
Pas encore d'évaluation
Classification des iris avec KNN en Python
6 pages
Leçon 1 WB
Pas encore d'évaluation
Leçon 1 WB
12 pages
Révision Contrôle Statistique
Pas encore d'évaluation
Révision Contrôle Statistique
4 pages
Data Mining
Pas encore d'évaluation
Data Mining
31 pages
K-Means Clustering pour Clients et Revenus
Pas encore d'évaluation
K-Means Clustering pour Clients et Revenus
4 pages
Devoir de Data Mining - Université Carthage
Pas encore d'évaluation
Devoir de Data Mining - Université Carthage
2 pages
Datamining : Théorie, Pratique et Exercices
100% (2)
Datamining : Théorie, Pratique et Exercices
8 pages
TP2 AD MINDS Rihab Benhassen
Pas encore d'évaluation
TP2 AD MINDS Rihab Benhassen
8 pages
Output 4
Pas encore d'évaluation
Output 4
3 pages
TPinit R
Pas encore d'évaluation
TPinit R
4 pages
Correction Révision
Pas encore d'évaluation
Correction Révision
15 pages
TD 3 Classification: Exercice 1
Pas encore d'évaluation
TD 3 Classification: Exercice 1
12 pages
Cours Prévision - Master ML 2023
Pas encore d'évaluation
Cours Prévision - Master ML 2023
14 pages
TP3-Aprentissage Supervisé - KNN - Linear Regression
Pas encore d'évaluation
TP3-Aprentissage Supervisé - KNN - Linear Regression
6 pages
Pré-traitement des données d'attaques de requins
Pas encore d'évaluation
Pré-traitement des données d'attaques de requins
29 pages
Analyse Et Prédiction Des Crises Cardiaques
Pas encore d'évaluation
Analyse Et Prédiction Des Crises Cardiaques
30 pages
TD Data Mining
Pas encore d'évaluation
TD Data Mining
3 pages
Rapport sur le Data Mining et Segmentation
Pas encore d'évaluation
Rapport sur le Data Mining et Segmentation
38 pages
Série3 DT
Pas encore d'évaluation
Série3 DT
3 pages
R Master F&DS Séances 4-5
Pas encore d'évaluation
R Master F&DS Séances 4-5
71 pages
Logiciel R
Pas encore d'évaluation
Logiciel R
2 pages
TD Econométrie 2
Pas encore d'évaluation
TD Econométrie 2
4 pages
x3 Ws Statistique Etudiants
Pas encore d'évaluation
x3 Ws Statistique Etudiants
2 pages
Modèles À Effets Mixtes en Pratique Dans R
Pas encore d'évaluation
Modèles À Effets Mixtes en Pratique Dans R
28 pages
Cours - Apprentissage Statistique
100% (1)
Cours - Apprentissage Statistique
24 pages
Exercices de Datamining et Analyse des Données
Pas encore d'évaluation
Exercices de Datamining et Analyse des Données
2 pages
Apprentissage Statistique en Ingénierie Mathématique
Pas encore d'évaluation
Apprentissage Statistique en Ingénierie Mathématique
24 pages
Travaux Dirigés en Informatique Appliquée
Pas encore d'évaluation
Travaux Dirigés en Informatique Appliquée
2 pages
Analyse Prédictive avec Python et Pandas
Pas encore d'évaluation
Analyse Prédictive avec Python et Pandas
5 pages
Analyse discriminante linéaire sur iris
Pas encore d'évaluation
Analyse discriminante linéaire sur iris
8 pages
Réseaux neuronaux et faillites d'entreprises
Pas encore d'évaluation
Réseaux neuronaux et faillites d'entreprises
11 pages
Analyse Statistique de Divers Datasets
Pas encore d'évaluation
Analyse Statistique de Divers Datasets
5 pages
Prétraitement des données sur R
Pas encore d'évaluation
Prétraitement des données sur R
12 pages
Modélisation de Scoring Financier
Pas encore d'évaluation
Modélisation de Scoring Financier
2 pages
Data Science-2
Pas encore d'évaluation
Data Science-2
6 pages
Projet Analyse de Donnees
Pas encore d'évaluation
Projet Analyse de Donnees
18 pages
Projet Stat Logiciel R
Pas encore d'évaluation
Projet Stat Logiciel R
13 pages
TP02
Pas encore d'évaluation
TP02
7 pages
Modélisation des sinistres en finance
Pas encore d'évaluation
Modélisation des sinistres en finance
13 pages
Data Mining tp.5 Régression Linéaire Multiple
Pas encore d'évaluation
Data Mining tp.5 Régression Linéaire Multiple
13 pages
K plus proches voisins : TP et exercices R
Pas encore d'évaluation
K plus proches voisins : TP et exercices R
10 pages
La Régression Logistique
Pas encore d'évaluation
La Régression Logistique
43 pages
Datamining : Exercices et Méthodes
50% (2)
Datamining : Exercices et Méthodes
5 pages
Analyse Discriminante Linéaire en R
Pas encore d'évaluation
Analyse Discriminante Linéaire en R
9 pages
TP2 An Discr
Pas encore d'évaluation
TP2 An Discr
6 pages
ACP, ACF, ACM Et Clustering de Clientèle
Pas encore d'évaluation
ACP, ACF, ACM Et Clustering de Clientèle
31 pages
Davis FR
100% (1)
Davis FR
2 pages
Analyse des Plans de Production Mensuelle
Pas encore d'évaluation
Analyse des Plans de Production Mensuelle
8 pages
Optimisation de la distribution chez Lidor
Pas encore d'évaluation
Optimisation de la distribution chez Lidor
2 pages
Optimisation Logistique de Produlact
Pas encore d'évaluation
Optimisation Logistique de Produlact
3 pages
Davis
50% (4)
Davis
9 pages
Plan d'approvisionnement optimal ENG
Pas encore d'évaluation
Plan d'approvisionnement optimal ENG
1 page
Coûts et Optimisation de Production PFSA
Pas encore d'évaluation
Coûts et Optimisation de Production PFSA
10 pages
Analyse de production et coûts Lebreton
Pas encore d'évaluation
Analyse de production et coûts Lebreton
2 pages
TD Rattrapage 2015-2016 : Questions et Problèmes de Production
Pas encore d'évaluation
TD Rattrapage 2015-2016 : Questions et Problèmes de Production
5 pages
Examen de Théorie de la Décision 2015
Pas encore d'évaluation
Examen de Théorie de la Décision 2015
2 pages
Fiabilité des structures en maintenance
Pas encore d'évaluation
Fiabilité des structures en maintenance
18 pages
Les Secrets Des Entreprises Qui Durent
Pas encore d'évaluation
Les Secrets Des Entreprises Qui Durent
17 pages
Simulation Bon de Trésor
Pas encore d'évaluation
Simulation Bon de Trésor
2 pages
Fondements de la Gestion des Ressources Humaines
Pas encore d'évaluation
Fondements de la Gestion des Ressources Humaines
11 pages
Examen de Management de Projets 4EM
100% (1)
Examen de Management de Projets 4EM
2 pages
Introduction aux Automates Programmables Industriels
100% (1)
Introduction aux Automates Programmables Industriels
65 pages
Examen de Management de Projets GE
100% (1)
Examen de Management de Projets GE
2 pages
Optimisation d'un projet de déménagement
Pas encore d'évaluation
Optimisation d'un projet de déménagement
2 pages
Probleme CPM GP
Pas encore d'évaluation
Probleme CPM GP
1 page
Cartes de contrôle par attributs : Guide complet
Pas encore d'évaluation
Cartes de contrôle par attributs : Guide complet
3 pages
Marketing Au Service Des IMF
Pas encore d'évaluation
Marketing Au Service Des IMF
5 pages
Analyse d'un circuit RL en régime transitoire
Pas encore d'évaluation
Analyse d'un circuit RL en régime transitoire
7 pages
Document de Conception Logicielle
Pas encore d'évaluation
Document de Conception Logicielle
7 pages
Analyse thématique en sciences sociales
Pas encore d'évaluation
Analyse thématique en sciences sociales
11 pages
Plan monumental de Trouville et Deauville
Pas encore d'évaluation
Plan monumental de Trouville et Deauville
3 pages
Cinématique des systèmes de mobilité
Pas encore d'évaluation
Cinématique des systèmes de mobilité
6 pages
Modélisation mathématique de la Joconde
Pas encore d'évaluation
Modélisation mathématique de la Joconde
6 pages
Bac Français. 1989 - Corrigés Des Sujets de 1988 - Dumeste, Marie-Hélène. Auteur Halpern, Anne-Élisabeth - 1988 - Paris - Hatier - 9782218017995 - Anna's Archive
Pas encore d'évaluation
Bac Français. 1989 - Corrigés Des Sujets de 1988 - Dumeste, Marie-Hélène. Auteur Halpern, Anne-Élisabeth - 1988 - Paris - Hatier - 9782218017995 - Anna's Archive
172 pages
Planification Travaux
Pas encore d'évaluation
Planification Travaux
65 pages
Fathi Touati CV f2
Pas encore d'évaluation
Fathi Touati CV f2
2 pages
Description de l'espace en littérature
Pas encore d'évaluation
Description de l'espace en littérature
15 pages
Manuel-De-Pose Blocs SOIB
Pas encore d'évaluation
Manuel-De-Pose Blocs SOIB
46 pages
CDC Fonctionnel - Site de Gouvernance Des Données
Pas encore d'évaluation
CDC Fonctionnel - Site de Gouvernance Des Données
3 pages
Optique géométrique : Microscope et lentilles
Pas encore d'évaluation
Optique géométrique : Microscope et lentilles
17 pages
Commentaire Composé
100% (5)
Commentaire Composé
21 pages
Guide D'utilisation - Téléphone Cisco 8851 MPP Webex
Pas encore d'évaluation
Guide D'utilisation - Téléphone Cisco 8851 MPP Webex
8 pages
Modèle Cahier de Charges Pour Projet Logiciel de Reconnaissance de Caractére Optique
Pas encore d'évaluation
Modèle Cahier de Charges Pour Projet Logiciel de Reconnaissance de Caractére Optique
3 pages
Actions Mecaniques Forces
Pas encore d'évaluation
Actions Mecaniques Forces
2 pages
Guide PDF: Utiliser Wireshark Efficacement
Pas encore d'évaluation
Guide PDF: Utiliser Wireshark Efficacement
2 pages
Debit Max Dans Conduites Pehd
100% (1)
Debit Max Dans Conduites Pehd
1 page
Inclusion Finale
Pas encore d'évaluation
Inclusion Finale
31 pages
Fiche de Cours Synthetique 7 - Les Tableaux Croises Dynamiques
Pas encore d'évaluation
Fiche de Cours Synthetique 7 - Les Tableaux Croises Dynamiques
4 pages
Q 09 Normes de Certification Des Systemes de Management de La Qualite
100% (1)
Q 09 Normes de Certification Des Systemes de Management de La Qualite
53 pages
Création de sites web réactifs avec CSS
Pas encore d'évaluation
Création de sites web réactifs avec CSS
7 pages
Le Projet Humains Cosmiques de La Terre
100% (1)
Le Projet Humains Cosmiques de La Terre
235 pages
Banda El Recodo La Fea PDF
Pas encore d'évaluation
Banda El Recodo La Fea PDF
14 pages
Pitch longVF
Pas encore d'évaluation
Pitch longVF
52 pages
Ebook Caraka Samhita - Traite Fondamental de La Medecine Ayurvedique 1. Les Principes
Pas encore d'évaluation
Ebook Caraka Samhita - Traite Fondamental de La Medecine Ayurvedique 1. Les Principes
612 pages
Instrument D 'Urbanisme en Algérie
Pas encore d'évaluation
Instrument D 'Urbanisme en Algérie
31 pages
TP1 RosalieBerthelot IngaBasanze
Pas encore d'évaluation
TP1 RosalieBerthelot IngaBasanze
13 pages