0% ont trouvé ce document utile (0 vote)

152 vues3 pages

TP1 Data Mining

Ce document décrit diverses fonctionnalités de base de R pour l'analyse de données, notamment l'importation et l'exportation de données dans des fichiers CSV et Excel, la structure des dataframes, l'exploration de variables quantitatives et qualitatives, et les graphiques.

Transféré par

SARA STAMBOULI

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

152 vues3 pages

TP1 Data Mining

Transféré par

SARA STAMBOULI

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Ministère de l'Enseignement Supérieur et de la Recherche Scientifique

Université Abderrahmane Mira de Bejaïa

Faculté des Sciences Exactes
Département d’informatique
Année Universitaire: 2021-2022

Enseignante: Dr. BERMAD TP 1: Introduction à R

(Suite) A l’intention de: M1-RN-SIA
Durée: 1h

1. Importer et exporter dans des fichiers

a) CSV
> var1 <- 1:5
> var2 <- (1:5) / 10
> var3 <- c("R", "et", "Data Mining", "Exemples", "Cas d’etudes ")
> df <- [Link] (var1, var2, var3) # Créer un [Link] df
> names (df) <- c("VariableInt", "VariableReal", "VariableChar") # Renommer les
attributs du df
> [Link] (df, "csv_path", row. names = FALSE) # Enregistrer df dans un fichier csv
# csv_path est le chemin d'accès au fichier csv
> df1 <- [Link] ("csv_path ") # Importer un fichier csv dans un [Link] df1
> print (df1)

b) Excel
> [Link]("readxl")# Installer le package «readxl» pour importer les données
> library("readxl") # Charger la bibliothèque «readxl»
> df1<- read_excel("xls_path) # Lire un fichier xls
> df2<- read_excel("xlsx_path") # Lire un fichier xlsx
> df3<-read_excel("xlsx_path", sheet = 2) # Lire deux feuilles de calcul Excel
> sort <- read_xlsx("xlsx_path") # Le même rôle que la fonction read_excel()
> [Link]("writexl") # Installer le package «writexl» pour exporter les données
> library("writexl") # Charger la bibliothèque «writexl»
> write_xlsx(df, "xlsx_path") # exporter un [Link] dans un fichier xlsx

2. Comprendre la structure d’un data frame (ensemble de données)

> dim(iris) # Afficher le nombre du tuples et le nombre des attributs du [Link] iris
> names(iris) # Afficher les noms des attributs
> attributes (iris) # Retourner les attributs
> iris[1:5,] # Accès par indice-plage de valeurs
> head(iris) # Examiner les premières lignes de données
> tail(iris) # Examiner les dernières lignes de données

1
> iris[1:10, "[Link]"]
# Récupérer les 10 premières valeurs d’une colonne
> iris$[Link][1:10]

> length(iris$[Link]) # Récupérer la longueur d’un attribut=nombre

d’observations
> iris$[Link][c(2,5,8)] # Accès par indice-quelques valeurs dispersées

3. Explorer les variables individuelles

a. Variable quantitative
> class(iris$[Link]) # Afficher le type d’un attribut(colonne)
> summary(iris) # Statistiques descriptives sur l’ensemble des variables
> mean (iris$[Link]) # La moyenne des valeurs d’un attribut
> sd(iris$[Link],[Link]=TRUE) # Calculer l’écart type sans données
manquantes
> median(iris$[Link]) # La valeur médiane d’un attribut
> quantile (iris$[Link])
# Statistiques descriptive-quantiles
> quantile(iris$[Link], c(.1,.3,.65))

> var(iris$[Link]) # Calculer la variance

> with(iris, tapply([Link],Species,mean)) # Caractériser une variable
numérique (quantitative)
> hist(iris$[Link],color=green) # Afficher la distribution avec histogramme
> plot(density(iris$[Link])) # Afficher la densité d’un attribut

b. Variable qualitative
> class(iris$Species)
> levels(iris$Species) # Décrire les modalités d’une variable qualitative
> table(iris$Species) # Afficher la fréquence des modalités
> pie(table(iris$Species)) # Tracer un camembert
> barplot(table(iris$Species)) # Tracer un diagramme en bâtons

4. Explorer plusieurs variables

> cov(iris$[Link], iris$[Link]) # Calculer la covariance entre deux variables
> cov(iris[,1:4]) # Calculer la covariance d’une plage de valeurs
> cor(iris$[Link], iris$[Link],use="[Link]" ) # Calculer la
corrélation entre deux variables
> cor(iris[,1:4]) # Calculer la corrélation d’une plage de valeurs
> aggregate([Link] ~Species,mean, data=iris) # Calculer la moyenne d’un
attribut pour chaque modalité

2
> boxplot([Link]~Species, data=iris) # Tracer une boite à moustache pour
montrer la médiane, les premier et troisième
quartiles d'une distribution (c'est-à-dire les
50 %, 25 %, et 75 % de points dans la
distribution cumulée) et les valeurs
aberrantes. La barre au milieu est le médian.
L’encadré montre l'intervalle interquartile
(IQR), qui est l'intervalle entre le 75 % et 25
% d'observation.
> with(iris, plot([Link], [Link], col=Species, pch=[Link](Species))) #
Tracer un diagramme cartésien pour deux variables. Les couleurs (col)
et les symboles (pch) des points sont définis sur l’attribut
«Species».
> plot(jitter(iris$[Link]), jitter(iris$[Link])) # Tracer un diagramme
cartésien sans
chevauchement des
points.
> pairs(iris) # Tracer une matrice du nuages de points avec la fonction
pairs ()

5. Enregistrer les graphiques dans des fichiers

a. Format pdf
> pdf(“[Link]”) # Enregistrer en tant que fichier pdf
> x <- 1:50
> plot(x, log(x))
> [Link]() # Fermer la page du graphique
b. Format ps
> postscript("[Link]") # Enregistrer en tant que fichier postscript
> x <-20:20
> plot(x, x^2)
> [Link]()
c. Format image
> dt <- c(1,2,3) # Enregistrer un graphique au format .jpg
> jpeg("[Link]")
> plot(data)
> [Link]() # Permet d'ouvrir le fichier .jpg sans fermer R

Vous aimerez peut-être aussi

Fiche 3
Pas encore d'évaluation
Fiche 3
10 pages
Introduction à R pour débutants
Pas encore d'évaluation
Introduction à R pour débutants
19 pages
Guide des fonctions essentielles R
Pas encore d'évaluation
Guide des fonctions essentielles R
2 pages
Manipulation des données avec dplyr
Pas encore d'évaluation
Manipulation des données avec dplyr
9 pages
TP2 Stats Desc R PDF
Pas encore d'évaluation
TP2 Stats Desc R PDF
9 pages
Mod Elisation Et M Ethodes Num Eriques Pour Les Sciences Du Vivant. TP1 - Initiation
Pas encore d'évaluation
Mod Elisation Et M Ethodes Num Eriques Pour Les Sciences Du Vivant. TP1 - Initiation
11 pages
Fiches R
Pas encore d'évaluation
Fiches R
11 pages
Introduction au langage R et graphiques
Pas encore d'évaluation
Introduction au langage R et graphiques
5 pages
Chapitre - 1 AS
Pas encore d'évaluation
Chapitre - 1 AS
43 pages
Text Mining avec R et RStudio
Pas encore d'évaluation
Text Mining avec R et RStudio
56 pages
Statistiques descriptives avec R
Pas encore d'évaluation
Statistiques descriptives avec R
8 pages
Statistiques descriptives avec R
Pas encore d'évaluation
Statistiques descriptives avec R
8 pages
Cours4 RIntro TP
Pas encore d'évaluation
Cours4 RIntro TP
30 pages
Lab4 Transcription
Pas encore d'évaluation
Lab4 Transcription
15 pages
Mini-Projet en R: Master en Finance, Actuariat & Data Science
Pas encore d'évaluation
Mini-Projet en R: Master en Finance, Actuariat & Data Science
14 pages
StatDonnees Fiches 1516
Pas encore d'évaluation
StatDonnees Fiches 1516
12 pages
Introduction au logiciel R 2018-2019
Pas encore d'évaluation
Introduction au logiciel R 2018-2019
36 pages
Analyse de données R : statistiques et graphiques
Pas encore d'évaluation
Analyse de données R : statistiques et graphiques
9 pages
Manipulation des données avec R
Pas encore d'évaluation
Manipulation des données avec R
5 pages
Data Frame Avec R
Pas encore d'évaluation
Data Frame Avec R
25 pages
Fiche 2
Pas encore d'évaluation
Fiche 2
11 pages
TP - Data-Mining
Pas encore d'évaluation
TP - Data-Mining
5 pages
Course V1projet Theme187075session01 Module1 Partie2 Use Case Le Logiciel R
Pas encore d'évaluation
Course V1projet Theme187075session01 Module1 Partie2 Use Case Le Logiciel R
7 pages
Guide R : Vecteurs, Matrices et Graphiques
Pas encore d'évaluation
Guide R : Vecteurs, Matrices et Graphiques
2 pages
TD4 Biostatistique
Pas encore d'évaluation
TD4 Biostatistique
22 pages
Statistique Descriptive
Pas encore d'évaluation
Statistique Descriptive
19 pages
Introduction aux objets R : vecteurs, matrices, listes
Pas encore d'évaluation
Introduction aux objets R : vecteurs, matrices, listes
33 pages
TP Pretraitement
Pas encore d'évaluation
TP Pretraitement
17 pages
D1 Lady
Pas encore d'évaluation
D1 Lady
7 pages
Exercice 1
Pas encore d'évaluation
Exercice 1
4 pages
Cours R Fast
Pas encore d'évaluation
Cours R Fast
55 pages
Stat Desc
Pas encore d'évaluation
Stat Desc
19 pages
TD-R Eea
Pas encore d'évaluation
TD-R Eea
5 pages
Cours2 - ELEMENTS DE STATISTIQUES (2) - Statistique Descriptive Univariée - Tri À Plat
Pas encore d'évaluation
Cours2 - ELEMENTS DE STATISTIQUES (2) - Statistique Descriptive Univariée - Tri À Plat
23 pages
Pres R1 Fihri
Pas encore d'évaluation
Pres R1 Fihri
22 pages
TP2 MLP Classification
Pas encore d'évaluation
TP2 MLP Classification
9 pages
Formation Au Logiciel
Pas encore d'évaluation
Formation Au Logiciel
65 pages
TP Initiation R
Pas encore d'évaluation
TP Initiation R
7 pages
LBIRA2110
Pas encore d'évaluation
LBIRA2110
74 pages
8 fonctions R essentielles pour l'analyse
Pas encore d'évaluation
8 fonctions R essentielles pour l'analyse
14 pages
Cours3 - ELEMENTS de STATISTIQUES (3) - Statistique Descriptive Univariée - Mesures
Pas encore d'évaluation
Cours3 - ELEMENTS de STATISTIQUES (3) - Statistique Descriptive Univariée - Mesures
17 pages
7399
Pas encore d'évaluation
7399
12 pages
Datavisualisation: Une Image Vaut Mille Mots
Pas encore d'évaluation
Datavisualisation: Une Image Vaut Mille Mots
16 pages
Initiation À R
Pas encore d'évaluation
Initiation À R
33 pages
Analyser Des Données Avec R
Pas encore d'évaluation
Analyser Des Données Avec R
172 pages
Atelier 2
Pas encore d'évaluation
Atelier 2
10 pages
Module: Analyse Et Fouille de Données
Pas encore d'évaluation
Module: Analyse Et Fouille de Données
3 pages
Fascicule TP
Pas encore d'évaluation
Fascicule TP
12 pages
Manuel R pour Étudiants MASTER IMEA
Pas encore d'évaluation
Manuel R pour Étudiants MASTER IMEA
19 pages
TD-correction TD1
Pas encore d'évaluation
TD-correction TD1
10 pages
Cours R Master1 Partie I
Pas encore d'évaluation
Cours R Master1 Partie I
36 pages
Introduction à l'analyse de données
Pas encore d'évaluation
Introduction à l'analyse de données
159 pages
1 Initiation R PRINT
Pas encore d'évaluation
1 Initiation R PRINT
28 pages
Compte Rendu Du TP
Pas encore d'évaluation
Compte Rendu Du TP
20 pages
Jupyter Notebook sur Fedora : Guide SEO
Pas encore d'évaluation
Jupyter Notebook sur Fedora : Guide SEO
22 pages
Initiation au logiciel R en 2 jours
Pas encore d'évaluation
Initiation au logiciel R en 2 jours
82 pages
Analyse de données d'enquêtes avec R
Pas encore d'évaluation
Analyse de données d'enquêtes avec R
797 pages
EX ML Corrigé CII-3-SSIR A B
83% (6)
EX ML Corrigé CII-3-SSIR A B
4 pages
Eugene Charniak - Introduction Au Deep Learning (2021) FR
100% (2)
Eugene Charniak - Introduction Au Deep Learning (2021) FR
173 pages
DATA MINING - Chap0. Introduction
Pas encore d'évaluation
DATA MINING - Chap0. Introduction
112 pages
Big Data Et Machine Learning Manuel Du Data Scientist by Pirmin Lemberger, Marc Batty, Médéric Morel, Jean-Luc Raffaëlli
100% (4)
Big Data Et Machine Learning Manuel Du Data Scientist by Pirmin Lemberger, Marc Batty, Médéric Morel, Jean-Luc Raffaëlli
237 pages
Exercices Et Corrigés BD - Chapitre 0
89% (9)
Exercices Et Corrigés BD - Chapitre 0
11 pages
TD Machine Learning
100% (5)
TD Machine Learning
4 pages
Excercices Corrigés Réseau de Neurones
82% (11)
Excercices Corrigés Réseau de Neurones
5 pages
Deep Learning Avec Keras Et TensorFlow - 3e Édition - Aurélien Géron (2024)
100% (10)
Deep Learning Avec Keras Et TensorFlow - 3e Édition - Aurélien Géron (2024)
626 pages
Examen Deep Learning VF Avec Correction
100% (12)
Examen Deep Learning VF Avec Correction
8 pages
Cours Fouille de Données
100% (1)
Cours Fouille de Données
59 pages
Machine Learning Avec Scikit-Learn
100% (3)
Machine Learning Avec Scikit-Learn
314 pages
TD de Révision ML
100% (1)
TD de Révision ML
7 pages
Guide ML Python: Algorithmes et Installation
100% (3)
Guide ML Python: Algorithmes et Installation
181 pages
Chap.01 Intro 18-19 1
Pas encore d'évaluation
Chap.01 Intro 18-19 1
17 pages
Statistique Et Data Science Avec R by François Husson
100% (6)
Statistique Et Data Science Avec R by François Husson
429 pages
Machine Learning
100% (1)
Machine Learning
53 pages
Deep Learning Avec Keras Et TensorFlow Mise en Oeuvre Et Cas Concrets by Aurélien Géron, Hervé Soulard
100% (6)
Deep Learning Avec Keras Et TensorFlow Mise en Oeuvre Et Cas Concrets by Aurélien Géron, Hervé Soulard
567 pages
CM1 Intro
Pas encore d'évaluation
CM1 Intro
42 pages
Big Data Et Machine Learning (3e Éd) (Pirmin Lemberger Marc Batty (Lemberger Etc.)
100% (1)
Big Data Et Machine Learning (3e Éd) (Pirmin Lemberger Marc Batty (Lemberger Etc.)
378 pages
Exam Final-Big Data
100% (9)
Exam Final-Big Data
3 pages
Cours L'IA Python 2022
100% (1)
Cours L'IA Python 2022
133 pages
QCM Introduction Machine Learning
100% (9)
QCM Introduction Machine Learning
3 pages
Apprendre Le ML en Une Semaine PDF
94% (17)
Apprendre Le ML en Une Semaine PDF
100 pages
Analyse de Donnees Partie1 2021
Pas encore d'évaluation
Analyse de Donnees Partie1 2021
98 pages
Apprentissage Supervisé par Ricco Rakotomalala
Pas encore d'évaluation
Apprentissage Supervisé par Ricco Rakotomalala
13 pages
Kmeans
100% (2)
Kmeans
23 pages
TP: Arbres de Décision en ML
Pas encore d'évaluation
TP: Arbres de Décision en ML
6 pages
Emmanuel Jakobowicz - Python Pour Le Data Scientist
100% (13)
Emmanuel Jakobowicz - Python Pour Le Data Scientist
300 pages
Chapitre 3-Apprentissage Non Supervisé
Pas encore d'évaluation
Chapitre 3-Apprentissage Non Supervisé
85 pages
FDD Cours PDF
Pas encore d'évaluation
FDD Cours PDF
94 pages
Cours 1MSI
Pas encore d'évaluation
Cours 1MSI
41 pages
Chapitre 1
Pas encore d'évaluation
Chapitre 1
6 pages
Chapitre2 Classification (Suite)
Pas encore d'évaluation
Chapitre2 Classification (Suite)
9 pages
Projets AGILE pour Étudiants en Master
Pas encore d'évaluation
Projets AGILE pour Étudiants en Master
2 pages
Chapitre 2
Pas encore d'évaluation
Chapitre 2
16 pages
Méthode Agile RAD : Développement Rapide
Pas encore d'évaluation
Méthode Agile RAD : Développement Rapide
3 pages
La Rédaction de La Proposition D'enquête
Pas encore d'évaluation
La Rédaction de La Proposition D'enquête
12 pages
C5 Parametres Dispersion
Pas encore d'évaluation
C5 Parametres Dispersion
21 pages
Lambert Toviedo
Pas encore d'évaluation
Lambert Toviedo
9 pages
TD2 Sondage
Pas encore d'évaluation
TD2 Sondage
3 pages
Chapitrei 2024
Pas encore d'évaluation
Chapitrei 2024
64 pages
TD1-Stat Des
100% (1)
TD1-Stat Des
4 pages
Protocole d'expérimentation agricole
50% (2)
Protocole d'expérimentation agricole
2 pages
Ecole Superieure Des Sciences Agronomiques
Pas encore d'évaluation
Ecole Superieure Des Sciences Agronomiques
46 pages
Calculer la taille d'échantillon en recherche
Pas encore d'évaluation
Calculer la taille d'échantillon en recherche
7 pages
Corrigé TP N°2
Pas encore d'évaluation
Corrigé TP N°2
5 pages
Contribution Des Produits Forestiers Non Ligneux
Pas encore d'évaluation
Contribution Des Produits Forestiers Non Ligneux
33 pages
Méthodologie Qualitative Partie I
100% (1)
Méthodologie Qualitative Partie I
5 pages
Cours ProbaStat F.PDF Version 1kkkkkkkkkk
100% (1)
Cours ProbaStat F.PDF Version 1kkkkkkkkkk
115 pages
Statistiques et Gestion de Portefeuille
Pas encore d'évaluation
Statistiques et Gestion de Portefeuille
31 pages
Comprendre le Marché du Chocolat
Pas encore d'évaluation
Comprendre le Marché du Chocolat
104 pages
Concepts de base en statistiques et probabilités
Pas encore d'évaluation
Concepts de base en statistiques et probabilités
45 pages
01 DQA Guidelines For Implementation-Fr
Pas encore d'évaluation
01 DQA Guidelines For Implementation-Fr
131 pages
Calculer la Variance avec R
Pas encore d'évaluation
Calculer la Variance avec R
14 pages
LVRFG 41253 P 251
Pas encore d'évaluation
LVRFG 41253 P 251
16 pages
Guide de Méta-Analyse pour Étudiants
Pas encore d'évaluation
Guide de Méta-Analyse pour Étudiants
25 pages
Recherche en marketing : enjeux et méthodes
Pas encore d'évaluation
Recherche en marketing : enjeux et méthodes
24 pages
Cours de Mathématiques et Statistiques
Pas encore d'évaluation
Cours de Mathématiques et Statistiques
665 pages
Techniques des études quantitatives
Pas encore d'évaluation
Techniques des études quantitatives
31 pages
Notions de Statistique et Exercices
Pas encore d'évaluation
Notions de Statistique et Exercices
6 pages
Étude de marché par Dominique Roux
Pas encore d'évaluation
Étude de marché par Dominique Roux
27 pages
Introduction et Concepts Clés du Marketing
Pas encore d'évaluation
Introduction et Concepts Clés du Marketing
34 pages
Statistiques
Pas encore d'évaluation
Statistiques
50 pages
Biostatistique 4 - Introduction Aux Tests Statistiques
Pas encore d'évaluation
Biostatistique 4 - Introduction Aux Tests Statistiques
89 pages
7.inférence - Intervalle de Confiance
Pas encore d'évaluation
7.inférence - Intervalle de Confiance
58 pages
Methodologie de Redaction D'un Memoire Master Essec 2024-2025 c3-5
Pas encore d'évaluation
Methodologie de Redaction D'un Memoire Master Essec 2024-2025 c3-5
78 pages