0% ont trouvé ce document utile (0 vote)
21 vues2 pages

TD 02 - Introduction À La Classification Supervisée.R

Le document décrit le processus de chargement et de traitement de données pour construire un modèle d'arbre de décision afin de prédire des classes de produits. Il inclut des étapes pour la création d'ensembles d'apprentissage et de test, l'entraînement de l'arbre avec le package 'rpart', et l'évaluation des performances du modèle sur un ensemble de test. Enfin, il applique le modèle à de nouveaux prospects pour générer des prédictions et les classifie en deux catégories : 'Oui' et 'Non'.

Transféré par

oklaik
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats TXT, PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
21 vues2 pages

TD 02 - Introduction À La Classification Supervisée.R

Le document décrit le processus de chargement et de traitement de données pour construire un modèle d'arbre de décision afin de prédire des classes de produits. Il inclut des étapes pour la création d'ensembles d'apprentissage et de test, l'entraînement de l'arbre avec le package 'rpart', et l'évaluation des performances du modèle sur un ensemble de test. Enfin, il applique le modèle à de nouveaux prospects pour générer des prédictions et les classifie en deux catégories : 'Oui' et 'Non'.

Transféré par

oklaik
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats TXT, PDF, TXT ou lisez en ligne sur Scribd

#------------------------------------#

# DONNEES DE TEST ET D'APPRENTISSAGE #


#------------------------------------#

# Chargement des donnees


produit <- [Link]("Data [Link]", header = TRUE, sep = ",", dec = ".",
stringsAsFactors = TRUE)
str(produit)
View(produit)
table(produit$Produit)

# Construction des ensembles d'apprentissage et de test


produit_EA <- produit[1:400,]
produit_ET <- produit[401:600,]

# Suppression variable ID
produit_EA <- subset(produit_EA, select = -ID)

# Autre solution par reference au numero de colonne : produit_EA <- produit_EA[,-1]

# Affichages
View(produit_EA)
View(produit_ET)
summary(produit_EA)
summary(produit_ET)

#--------------------------------#
# APPRENTISSAGE DE L'ARBRE RPART #
#--------------------------------#

# Installation des packages requis


[Link]("rpart")
library(rpart)

# Construction de l'arbre de decision


tree1 <- rpart(Produit~., produit_EA)

# Affichage de l'arbre par les fonctions de base de R


plot(tree1)
text(tree1, pretty=0)

#-----------------------#
# TEST DE L'ARBRE RPART #
#-----------------------#

# Application de l'arbre de decision a l'ensemble de test 'produit_ET'


test_tree1 <- predict(tree1, produit_ET, type="class")

# Affichage du vecteur de predictions de la classe des exemples de test


test_tree1

# Affichage du nombre de predictions pour chacune des classes


table(test_tree1)

# Ajout des predictions comme une nouvelle colonne 'Prediction' dans le data frame
'produit_ET'
produit_ET$Prediction <- test_tree1
View(produit_ET)
# Affichage de liste des exemples de test correctement predits
View(produit_ET[produit_ET$Produit==produit_ET$Prediction, ])

# Calcul du nombre de succes : nombre d'exemples avec classe reelle et prediction


identiques
nbr_succes <- nrow(produit_ET[produit_ET$Produit==produit_ET$Prediction,])
nbr_succes

# Calcul du taux de succes : nombre de succes sur nombre d'exemples de test


taux_succes <- nbr_succes/nrow(produit_ET)
taux_succes

# Calcul du nombre d'echecs : nombre d'exemples avec classe reelle et prediction


differentes
nbr_echecs <- nrow(produit_ET[produit_ET$Produit!=produit_ET$Prediction,])
nbr_echecs

# Calcul du taux d'echecs : nombre d'echecs sur nombre d'exemples de test


taux_echecs <- nbr_echecs/nrow(produit_ET)
taux_echecs

#-------------------------------#
# PREDICTIONS PAR L'ARBRE RPART #
#-------------------------------#

# Chargement des exemples prospects dans un data frame 'produit_pro'


produit_pro <- [Link]("Data Produit [Link]", header = TRUE, sep = ",", dec
= ".", stringsAsFactors = TRUE)

# Application de l'arbre de decision aux prospects dans 'produit_pro' : classe


predite
pred_tree1 <- predict(tree1, produit_pro, type="class")

# Affichage des résultats (predictions)


pred_tree1

# Affichage du nombre de predictions pour chaque classe


table(pred_tree1)

# Ajout dans le data frame produit_pro d'une colonne Predition contenant la classe
predite
produit_pro$Prediction <- pred_tree1

# Creation d'un data frame contenant les predictions 'Oui'


produit_pro_oui <- produit_pro[produit_pro$Prediction=="Oui",]
produit_pro_oui

# Creation d'un data frame contenant les predictions 'Non'


produit_pro_non <- produit_pro[produit_pro$Prediction=="Non",]
produit_pro_non

Vous aimerez peut-être aussi