Cours R Master1 Partie I

Ce document présente une introduction au langage R et ses applications statistiques, en abordant des concepts tels que les données intégrées, les vecteurs, les matrices, et l'importation de données. Il inclut également des exemples pratiques d'analyse statistique, de visualisation graphique, et de simulation de variables aléatoires. Enfin, il traite de l'efficacité des herbicides sur différentes plantes à travers des analyses descriptives et des tests statistiques.

Transféré par

amellounisamel

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

72 vues36 pages

Cours R Master1 Partie I

Transféré par

amellounisamel

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Introduction au langage R

et applications
statistiques
partie I
Pr Hocine Fellag

Master1
Probabilités/Statistique
2016/2017
Le R est interactif
>4+7
[1] 11
> log(2)
[1] 0.6931472
> exp(0.6931472)
[1] 2
> log(-1)
[1] NaN
Warning message:
NaNs produced in: log(x)
Le R est interactif
> 30:6
[1] 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16
15 14 13 12 11 10 9 8 7 6
> a <- 89
> b <- 45
> result <- (a + b)^2
> result
[1] 17956
Données du R
• Il y’a des données incorporées dans R
• Pour les connaître taper
data()
• Exemple : fichier faithful
• Tapez : help(faithful)
• Réponse : Waiting time between eruptions and the
duration of the eruption for the Old Faithful geyser in
Yellowstone National Park, Wyoming, USA.
• Donc, les données dans le fichier faithful représentent
les délais entre éruptions et les durées des éruptions
d’un geyser dans le parc Yellowstone aux USA.
Un geyser est un type particulier de source
d'eau chaude qui jaillit par intermittence
en projetant à haute température et à
haute pression de l'eau et de la vapeur.
Données du R
• data frame avec 272 observations sur 2 variables.
• [,1] eruptions en minutes
• [,2] temps d’attente jusqu’à l’éruption suivante en
minutes
• data(faithful) : charger les données
• attach(faithful) : adopter le fichier dans R
• summary() : donne les différentes
caractéristiques numériques
Minimum, quartiles, moyenne et maximum.
Caractéristiques statistiques
• summary(faithful)
• Réponse:
eruptions waiting
Min. :1.600 Min. :43.0
1st Qu.:2.163 1st Qu.:58.0
Median :4.000 Median :76.0
Mean :3.488 Mean :70.9
3rd Qu.:4.454 3rd Qu.:82.0
Max. :5.100 Max. :96.0
Caractéristiques statistiques
• On peut aussi taper
• mean(eruptions)  moyenne
• median(eruptions)  médiane
• sd(eruptions)  ecart-type
• var(eruptions)  Variance
• quantile(eruptions)  Quantiles
Caractéristiques statistiques
> mean(eruptions)
[1] 3.487783
> median(eruptions)
[1] 4
> sd(eruptions)
[1] 1.141371
> var(eruptions)
[1] 1.302728
> quantile(eruptions)
0% 25% 50% 75% 100%
1.60000 2.16275 4.00000 4.45425 5.10000
Vecteurs
• La fonction c() permet de créer un vecteur
• Exemple:
• Taper
• ages = c(28, 25, 23, 24, 26, 23, 21, 22, 24, 29, 24,
26, 31, 28, 27, 24, 23, 25, 27, 25,24, 21, 24, 23,
25, 31, 28, 27, 24, 23)
Ensuite, taper : ages
• [1] 28 25 23 24 26 23 21 22 24 29 24 26 31 28 27
24 23 25 27 25 24 21 24 23 25 31 28 27 24 23
Vecteurs
• La fonction c() permet aussi de concaténer des vecteurs :
• Exemple :
G1 = c(75.0, 69.2, 75.4, 87.3)
G2 = c(70.5, 64.2, 76.4, 81.6)
G = c(G1,G2)
G
• [1] 75.0 69.2 75.4 87.3 70.5 64.2 76.4 81.6
• Il est possible d’acc éder à un élément du vecteur avec des
crochets. Par exemple pour accéder au troisème élément
du vecteur, on écrit : G[3]
• Réponse : 75.4
Vecteurs
• Il est aussi possible d’accéder à l’ensemble des poids répondant à
une condition,
• Par exemple l’ensemble des valeurs supérieurs
à 70.0
Taper : G[G > 70.0]
[1] 75.0 75.4 87.3 70.5 76.4 81.6
• Il est possible de créer un vecteur contenant une suite de nombres
entiers avec la fonction seq :
> seq(1, 10)
• [1] 1 2 3 4 5 6 7 8 9 10
> seq(1, 10, by = 0.5)
[1] 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 6.5 7.0 7.5
8.0 8.5 9.0 9.5 10.0
Matrices
• Une matrice est créee à partir d’un vecteur contenant
les valeurs, et d’un nombre de lignes (nr, pour Number
of Row) et de colonne (nc, pour Number of Column) :
> ma_matrice = matrix(c(1.5, 2.1, 3.2, 1.6, 1.4, 1.5),nr=3,
nc=2)
> ma_matrice
[,1] [,2]
[1,] 1.5 1.6
[2,] 2.1 1.4
[3,] 3.2 1.5
Matrices
Les éléments de la matrice peuvent être obtenus en
donnant entre crochets le numéro de la ligne puis celui
de la colonne :
> ma_matrice[1, 1]
• [1] 1.5
• Il est aussi possible de récupérer une ligne ou une
collone entière, en mettant le numéro correspondant :
> ma_matrice[1,]
[1] 1.5 1.6
> ma_matrice[,1]
[1] 1.5 2.1 3.2
Importer des données
• Exemple : Une étude a été réalisée sur 100 patients
d’un service hospitalier afin de vérifier la relation entre
le tabac et les problèmes pulmonaires. Pour cela, il a
été demandé à chaque personne
• son âge,
• son sexe,
• sa situation (célibataire, mariée,...),
• sa consommation de tabac (nombre de cigarettes par
jour),
• la présence de tabagisme passif,
• la présence de problème pulmonaire (cancer du
poumon, BPCO,...) chez cette personne.
> t = read.table("tabac.txt“, header=TRUE)
> attach(t)
> names(t)
[1] "ID" "age" "sexe"
[4] "situation" "tabac" "tabagisme_passif"
[7] "probleme_pulmonaire"
> age
[1] 37 23 21 55 61 37 56 29 63 46 46 34 27 41 30 40 21
35 22 32 58 27 34 36 47 41 53 58 59 51 44 62 64 29 25
41 46 47 25 56 27 43 29 50 58 20 53 48 31 36 61 50 30
20 43 58 57 25 60 62 38 49 30 26 34 41 47 52 32 28 50
29 38 20 30 63 28 44 23 51 42 56 32 42 22 60 26 38 58
27 44 41 51 57 34 52 62 60 26 35
Analyse statistique
• Ajouter une colonne “fumeur” de type
booléenne.
> t["fumeur"] = tabac > 0
> attach(t)
> names(t)
• [1] "ID" "age" "sexe"
• [4] "situation" "tabac"
"tabagisme_passif"
• [7] "probleme_pulmonaire" "fumeur"
Statistique descriptive
> table(sexe)
sexe
femme homme
46 54
> table(sexe)/length(sexe)
sexe
femme homme
0.46 0.54
> 100*table(sexe)/length(sexe)
sexe
femme homme
46 54
Graphiques
• barplot(table(sexe))
• pie(table(sexe))
> summary(age)
Min. 1st Qu. Median Mean 3rd Qu. Max.
20.00 29.75 41.00 41.38 52.25 64.00
> hist(age)
Deux variables numériques
> cor(age,tabac)
[1] -0.04700102
> plot(tabac,age)
Efficacité des herbicides
• Une étude a porté sur sur l’efficacité de trois herbicides
sur trois plantes : blé, chiendent et liseron.
• Pour cela, des cultures de ces plantes ont été mises en
présence de l’un des trois herbicides, ou d’aucun
d’entre eux.
• Le nombre de plants vivants dans la culture a été
compté avant l’expérience, et 10 jours après.
• Chaque combinaison plante - herbicide a fait l’objet de
20 expérimentations, plus un témoin sans herbicide
(soit 240 expérimentation en tout).
• Le tableau de données est disponible dans le fichier
herbicide.txt
> x = read.table("herbicide.txt",header=TRUE)
> attach(x)
> names(x)
[1] "ID" "herbicide" "plante"
[4] "nb_plants" "nb_plants_survivants" «
survivants"
• plante : qualitative non-ordonnée
• herbicide : qualitative non-ordonnée
• survivants : numérique
chiendent Liseron

Blé
Quelle espèce résiste le mieux aux trois herbicides ?
On trace un boxplot (boite à moustaches)
> boxplot(survivants ~ plante)

Le blé résiste le mieux

Quel herbicide semble le plus efficace ?
> boxplot(survivants ~ herbicide)

L’herbicide 3 est le plus efficace

Ex: sur une route où on souhaite qu’aucune plante ne pousse
Quel herbicide est le plus approprié pour appliquer
sur un champ de blé, où l’on souhaite que le blé
pousse, mais
pas le chiendent ni le liseron ?

> boxplot(survivants ~ plante * herbicide)

L’herbicide 1 (surtout efficace contre le chiendent) ou le 2 (surtout efficace contre
le liseron).
Conclusion : Tester l’association des herbicides 1 et 2 peut améliorer l’efficacité du
traitement de ce champ de blé ?
Simulation de variables aléatoires
• Le recours à la simulation de données est très
fréquent en statistique, aussi R dispose-t-il
d’une bibliothèque de fonctions de densité de
probabilités qui permettent de simuler des
échantillons d’observations provenant d’une
loi de probabilités donnée.
• Le tableau ci-dessous donne la liste et les
commandes correspondantes des lois de
probabilités usuelles :
• Exemples :
1. Normale rnorm(n, mean=’’,sd=’’)
2. rexp(n,lambda)
3. Student rt (n, df)
4. Khi-deux rchisq(n, df)
5. Fisher rf(n, df1, df2)
6. Uniforme runif(n, min=’’, max=’’)
7. Poisson rpois(n, lambda)
8. Binomiale rbinom(n, size, prob)
• Toutes les fonctions peuvent être adaptées en
changeant la première lettre de la fonction :
• rfonction() pour générer des observations,
• dfonction() pour calculer la densité de
probabilités ,
• pfonction() pour calculer la densité de
probabilités cumulées et
• qfonction() pour calculer le quantile
correspondant à une probabilité donnée.
• Tracer la densité de la loi normale N(0,1)
plot(density(rnorm(100000,0,1)),xlim=c(-5,5))
• Tracer la densité de la loi exponentielle Ex(1)
plot(density(rexp(100000,1)),xlim=c(0,5))
Soit X:N(0,1). Alors P(X<=1.96)=0.975
> pnorm(1.96,mean=0,sd=1)
[1] 0.9750021
Ou encore
> qnorm(0.975,mean=0,sd=1)
[1] 1.959964
1.96 est un quantile de X
Générer 10 observations de N(0,1)
> rnorm(10,0,1)
[1] 0.16029481 -0.66069659 0.09132995 -1.67771550 -
0.69734199 0.94267966
[7] -0.49974828 0.57179816 1.65362975 -0.52278948
Loi des grands nombres
• Loi Bernouilli B(0.5)=Binomiale(1,0.5)
# Mille lancers de la pièce de monnaie
>z=rbinom(1000,1,0.5)
> mean(z)
[1] 0.503
• Exercice : Essayez avec la loi normale

Vous aimerez peut-être aussi

Cours Logiciel R
Pas encore d'évaluation
Cours Logiciel R
42 pages
Statistiques et R pour étudiants
Pas encore d'évaluation
Statistiques et R pour étudiants
27 pages
TP-simulation Aléatoire
Pas encore d'évaluation
TP-simulation Aléatoire
10 pages
Mémento R : Statistiques et MSP
Pas encore d'évaluation
Mémento R : Statistiques et MSP
9 pages
Republique Du Benin: Matière: Simulation Aléatoire II
Pas encore d'évaluation
Republique Du Benin: Matière: Simulation Aléatoire II
16 pages
Introduction à R pour débutants
Pas encore d'évaluation
Introduction à R pour débutants
19 pages
Cours 1
Pas encore d'évaluation
Cours 1
26 pages
Analyse des données discrètes avec R
Pas encore d'évaluation
Analyse des données discrètes avec R
6 pages
Statistiques Univariées avec R
Pas encore d'évaluation
Statistiques Univariées avec R
59 pages
TD 1 - Stats1a - ENSAIA - 2022-2023
Pas encore d'évaluation
TD 1 - Stats1a - ENSAIA - 2022-2023
37 pages
TPinit R
Pas encore d'évaluation
TPinit R
4 pages
Stat Desc
Pas encore d'évaluation
Stat Desc
19 pages
Lab4 Transcription
Pas encore d'évaluation
Lab4 Transcription
15 pages
TD 1 - Statistiques Descriptives Univariées Et Bivariées: Démarrage de
Pas encore d'évaluation
TD 1 - Statistiques Descriptives Univariées Et Bivariées: Démarrage de
11 pages
Analyse de données R : statistiques et graphiques
Pas encore d'évaluation
Analyse de données R : statistiques et graphiques
9 pages
Régression linéaire avec R et données de naissance
Pas encore d'évaluation
Régression linéaire avec R et données de naissance
63 pages
Fiche 2
Pas encore d'évaluation
Fiche 2
11 pages
WWW - Cours Gratuit - Com CoursAir Id5364
Pas encore d'évaluation
WWW - Cours Gratuit - Com CoursAir Id5364
124 pages
TP Statistique Descriptive Univarié
Pas encore d'évaluation
TP Statistique Descriptive Univarié
10 pages
Statistique Descriptive
Pas encore d'évaluation
Statistique Descriptive
19 pages
TPstat
Pas encore d'évaluation
TPstat
9 pages
Guide TP
Pas encore d'évaluation
Guide TP
76 pages
Introduction aux objets R : vecteurs, matrices, listes
Pas encore d'évaluation
Introduction aux objets R : vecteurs, matrices, listes
33 pages
Don R
Pas encore d'évaluation
Don R
3 pages
TD3 Janvier09
Pas encore d'évaluation
TD3 Janvier09
9 pages
Introduction à R pour débutants
100% (1)
Introduction à R pour débutants
18 pages
Cours R Fast
Pas encore d'évaluation
Cours R Fast
55 pages
Guide R : Vecteurs, Matrices et Graphiques
Pas encore d'évaluation
Guide R : Vecteurs, Matrices et Graphiques
2 pages
Statistiques et R pour Environnement
Pas encore d'évaluation
Statistiques et R pour Environnement
6 pages
Statistiques descriptives avec R
Pas encore d'évaluation
Statistiques descriptives avec R
8 pages
StatDonnees Fiches 1516
Pas encore d'évaluation
StatDonnees Fiches 1516
12 pages
Statistiques descriptives avec R
Pas encore d'évaluation
Statistiques descriptives avec R
8 pages
Biostatistiques 2e Année : Cours et Exercices
Pas encore d'évaluation
Biostatistiques 2e Année : Cours et Exercices
94 pages
Gestion Des Donees
Pas encore d'évaluation
Gestion Des Donees
12 pages
20-Ellipses Statistiques Appliquees Avec R
100% (2)
20-Ellipses Statistiques Appliquees Avec R
254 pages
BiostatL2 StatR P2016
Pas encore d'évaluation
BiostatL2 StatR P2016
4 pages
Cours3 - ELEMENTS de STATISTIQUES (3) - Statistique Descriptive Univariée - Mesures
Pas encore d'évaluation
Cours3 - ELEMENTS de STATISTIQUES (3) - Statistique Descriptive Univariée - Mesures
17 pages
Introduction au langage R et graphiques
Pas encore d'évaluation
Introduction au langage R et graphiques
5 pages
TD-correction TD2
Pas encore d'évaluation
TD-correction TD2
9 pages
Atelier Sur Le Logiciel R
Pas encore d'évaluation
Atelier Sur Le Logiciel R
6 pages
TD-R Eea
Pas encore d'évaluation
TD-R Eea
5 pages
Introduction à SciPy pour Statistiques
100% (1)
Introduction à SciPy pour Statistiques
25 pages
Fiche 3
Pas encore d'évaluation
Fiche 3
10 pages
119 Biostatistique Et Analyse Informatique Des Donnees de R TDM
100% (1)
119 Biostatistique Et Analyse Informatique Des Donnees de R TDM
4 pages
Analyse de Données avec R : Guide Pratique
Pas encore d'évaluation
Analyse de Données avec R : Guide Pratique
38 pages
Corrigé TD Statistique M1-GEO Rennes 2
Pas encore d'évaluation
Corrigé TD Statistique M1-GEO Rennes 2
21 pages
TP1 Data Mining
Pas encore d'évaluation
TP1 Data Mining
3 pages
Modélisation et Régression Avancées
Pas encore d'évaluation
Modélisation et Régression Avancées
43 pages
Cours M2 IGAPAS
Pas encore d'évaluation
Cours M2 IGAPAS
207 pages
Guide d'utilisation de R pour Monte-Carlo
Pas encore d'évaluation
Guide d'utilisation de R pour Monte-Carlo
2 pages
L Analyse de Données Écologiques Avec R
Pas encore d'évaluation
L Analyse de Données Écologiques Avec R
710 pages
Statistiques et Probabilités IUT Lille
Pas encore d'évaluation
Statistiques et Probabilités IUT Lille
25 pages
Pres R1 Fihri
Pas encore d'évaluation
Pres R1 Fihri
22 pages
R3.22 Probabilités Et Statistiques: Quelques Commandes R Utiles
Pas encore d'évaluation
R3.22 Probabilités Et Statistiques: Quelques Commandes R Utiles
5 pages
Formules et Tests Statistiques en R
Pas encore d'évaluation
Formules et Tests Statistiques en R
4 pages
Introduction aux statistiques avec R
Pas encore d'évaluation
Introduction aux statistiques avec R
26 pages
Complement de Cours Sur L'estimation
Pas encore d'évaluation
Complement de Cours Sur L'estimation
64 pages
Contrat de Service BETA STORE
Pas encore d'évaluation
Contrat de Service BETA STORE
2 pages
Quizz Microscope - Quiz Sciences
Pas encore d'évaluation
Quizz Microscope - Quiz Sciences
8 pages
Accord D'étape APE
Pas encore d'évaluation
Accord D'étape APE
528 pages
I Give You Praise SATB
Pas encore d'évaluation
I Give You Praise SATB
10 pages
1 BACSEF - Unité 3 Complète - Cours Du Prof - Elalami LAKHAL.24.25
Pas encore d'évaluation
1 BACSEF - Unité 3 Complète - Cours Du Prof - Elalami LAKHAL.24.25
27 pages
Travaux Dirigés sur Nombres Complexes
Pas encore d'évaluation
Travaux Dirigés sur Nombres Complexes
2 pages
Défis et Solutions pour le Cacao
Pas encore d'évaluation
Défis et Solutions pour le Cacao
84 pages
Iso 9001-A1-2024
Pas encore d'évaluation
Iso 9001-A1-2024
8 pages
HLP Présentation
Pas encore d'évaluation
HLP Présentation
3 pages
Chapitre 1
Pas encore d'évaluation
Chapitre 1
7 pages
Fusions-Absorptions au Maroc
100% (2)
Fusions-Absorptions au Maroc
443 pages
Culture G N Rale Pour La P Raparation Du TAFEM
Pas encore d'évaluation
Culture G N Rale Pour La P Raparation Du TAFEM
19 pages
2zzge Jeu de Soupapes PDF
Pas encore d'évaluation
2zzge Jeu de Soupapes PDF
6 pages
(SOMMAIRE 1 Sur 3) Les Clés D'un Progiciel SaaS Durable 01-31-2024
Pas encore d'évaluation
(SOMMAIRE 1 Sur 3) Les Clés D'un Progiciel SaaS Durable 01-31-2024
5 pages
TP1 Exercice 2
Pas encore d'évaluation
TP1 Exercice 2
4 pages
F-05-01 Fiche de Non Conformité Action Préventives Et Correctives
100% (10)
F-05-01 Fiche de Non Conformité Action Préventives Et Correctives
2 pages
Skoda
100% (1)
Skoda
2 pages
Guide des Potions Alchimiques
Pas encore d'évaluation
Guide des Potions Alchimiques
9 pages
Gestion de Carrière
100% (1)
Gestion de Carrière
15 pages
Méthodes de Résolution des Systèmes Linéaires
Pas encore d'évaluation
Méthodes de Résolution des Systèmes Linéaires
64 pages
Billet OUIGO : Infos et conseils voyage
Pas encore d'évaluation
Billet OUIGO : Infos et conseils voyage
1 page
Chimieysiques Eau PDF
Pas encore d'évaluation
Chimieysiques Eau PDF
2 pages
Plan de Travail Kalla Hamza
Pas encore d'évaluation
Plan de Travail Kalla Hamza
6 pages
Evaluation Somative
Pas encore d'évaluation
Evaluation Somative
2 pages
Devoir GME3
Pas encore d'évaluation
Devoir GME3
3 pages
Définition du Courrier Électronique
100% (1)
Définition du Courrier Électronique
19 pages
Projet Decret 2.14.592 FR
Pas encore d'évaluation
Projet Decret 2.14.592 FR
2 pages
Le Nuage
Pas encore d'évaluation
Le Nuage
11 pages
RAPPORT D ACTIVITE (Enregistré Automatiquement)
Pas encore d'évaluation
RAPPORT D ACTIVITE (Enregistré Automatiquement)
7 pages
Conditions D'accès A L'ofppt 1
Pas encore d'évaluation
Conditions D'accès A L'ofppt 1
2 pages