0% ont trouvé ce document utile (0 vote)
46 vues43 pages

Semin R

Transféré par

Hervé MUKADI
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
46 vues43 pages

Semin R

Transféré par

Hervé MUKADI
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Notions de base Fonctions graphiques Programmation Un peu de statistique

Présentation du logiciel R

Sébastien Déjean
math.univ-toulouse.fr/˜sdejean

Institut de Mathématiques de Toulouse UMR 5219


Université Paul-Sabatier (Toulouse III)

S. Déjean Sémin’R
Présentation du logiciel R
Notions de base Fonctions graphiques Programmation Un peu de statistique

Documents complémentaires et
mises à jour :
math.univ-toulouse.fr/˜sdejean

S. Déjean Sémin’R
Présentation du logiciel R
Notions de base Fonctions graphiques Programmation Un peu de statistique

Généralités

R????

R is ‘GNU S’, a freely available language and environment for


statistical computing and graphics which provides a wide va-
riety of statistical and graphical techniques : linear and nonli-
near modelling, statistical tests, time series analysis, classifi-
cation, clustering, etc. Please consult the R project homepage
(www.r-project.org) for further information.
CRAN is a network of ftp and web servers around the world
that store identical, up-to-date, versions of code and docu-
mentation for R. Please use the CRAN mirror nearest to you
(cran.cict.fr) to minimize network load.

S. Déjean Sémin’R
Présentation du logiciel R
Notions de base Fonctions graphiques Programmation Un peu de statistique

Généralités

Ressources
Fichiers d’installation, mises à jour, packages, FAQ, newsletter,
documentation...

www.r-project.org cran.cict.fr

Statistics with R (V. Zoonekynd) : zoonek2.free.fr/UNIX/48_R/all.html


S. Déjean Sémin’R
Présentation du logiciel R
Notions de base Fonctions graphiques Programmation Un peu de statistique

Généralités

Ligne de commande

R> Prompt en attente de commande


Pas de " clic-bouton " (on évite l’impression de facilité et
donc des bêtises)
Appel à une fonction avec ses paramètres entre
parenthèses
L’absence de parenthèses provoque l’affichage du code de
la fonction
Le caractère # permet d’insérer un commentaire

S. Déjean Sémin’R
Présentation du logiciel R
Notions de base Fonctions graphiques Programmation Un peu de statistique

Généralités

Aide en ligne
Rubriques :
Description
Usage
R > help(plot)
Arguments
R > ?plot
Details
R > help.search("plot")
Value
R > ? ?plot
Note
R > help(help.search)
Authors
R > help(help)
Reference(s)
See also
Examples

S. Déjean Sémin’R
Présentation du logiciel R
Notions de base Fonctions graphiques Programmation Un peu de statistique

Généralités

Aide en ligne
Rubriques :
Description
Usage
R > help(plot)
Arguments
R > ?plot
Details
R > help.search("plot")
Value
R > ? ?plot
Note
R > help(help.search)
Authors
R > help(help)
Reference(s)
See also
Examples

S. Déjean Sémin’R
Présentation du logiciel R
Notions de base Fonctions graphiques Programmation Un peu de statistique

Généralités

Aides pratiques

Editeur Tinn-R(1) : éditeur gratuit permettant notamment


une coloration syntaxique et l’interaction avec la console R
Package Rcmdr(2) : interface graphique avec menus
déroulants et zones "script" et "sortie"

(1) Tinn Is Not Notepad, www.sciviews.org/Tinn-R

(2) J. Fox (2005) - The R Commander : A Basic-Statistics Graphical User Interface to R, Journal of Statistical

Software, 14(9) - (socserv.mcmaster.ca/jfox/Misc/Rcmdr)

S. Déjean Sémin’R
Présentation du logiciel R
Notions de base Fonctions graphiques Programmation Un peu de statistique

Structures de données

R > 2+2
Scalaire R > exp(10)
entier, réel, logique, R > a = log(2)
chaîne de caractères R > b <- cos(10)
affectation < − ou = R > a+b
R>a
ls() liste les variables
R > 2==3
de l’environnement de
R > b = 2<3
travail
R > ls()
rm() efface une ou R > rm(a)
plusieurs variables R>a
R > a="toto"

S. Déjean Sémin’R
Présentation du logiciel R
Notions de base Fonctions graphiques Programmation Un peu de statistique

Structures de données

R > d = c(2,3,5,8,4,6) ;d
Vecteur R > is.vector(d)
tous les éléments sont R > 1 :10
de même nature (tout R > seq(from=1,to=20,by=2)
numérique ou tout R > rep(5,times=10)
caractère ou ...) R > d[2] ;d[2 :3] ;d[-3]
construction de vecteurs R > f = c(a=12,b=26,c=32,d=41) ;f
R > names(f) ;f["a"]
séquence, répétition
R > names(f)=c("a1","a2","a3","a4")
extraction R > f>30 ;f[f>30]
nommer les éléments R > which(f>30)
d’un vecteur R > f[2] = 22 ;f+100 ;f+d
R > cos(f) ;length(f) ;sort(d)

S. Déjean Sémin’R
Présentation du logiciel R
Notions de base Fonctions graphiques Programmation Un peu de statistique

Structures de données

R > A = matrix(1 :15,ncol=5) ;A


R > B = matrix(1 :15,nc=5,byrow=T)
Matrice R > cbind(A,B) ;rbind(A,B)
tous les éléments sont R > A[1,3] ;A[,2] ;A[1 :3,2 :4]
de même nature R > g = seq(0,1,length=20)
R > C = matrix(g,nrow=4)
Construction, extraction
de parties R > C[C[,1]>0.1,]
R > A+B ;A*B
Produit matriciel (%*%)
R > cos(A) ; cos(A[1 :2,1 :2])
et terme à terme (*).
R > solve(A) ;solve(A[1 :2,1 :2])
Inversion d’une matrice R > A %*% B
(fonction solve()) R > A[1 :2,1 :2] %*% B[1 :2,1 :3]
R > apply(A,2,sum)
R > apply(D,1,max)

S. Déjean Sémin’R
Présentation du logiciel R
Notions de base Fonctions graphiques Programmation Un peu de statistique

Structures de données

R > A = matrix(1 :15,ncol=5) ;A


R > B = matrix(1 :15,nc=5,byrow=T)
Matrice R > cbind(A,B) ;rbind(A,B)
tous les éléments sont R > A[1,3] ;A[,2] ;A[1 :3,2 :4]
de même nature R > g = seq(0,1,length=20)
R > C = matrix(g,nrow=4)
Construction, extraction
de parties R > C[C[,1]>0.1,] V
R > A+B ;A*B
Produit matriciel (%*%)
R > cos(A) ; cos(A[1 :2,1 :2])
et terme à terme (*).
R > solve(A) ;solve(A[1 :2,1 :2])
Inversion d’une matrice R > A %*% B
(fonction solve()) R > A[1 :2,1 :2] %*% B[1 :2,1 :3]
R > apply(A,2,sum) V
R > apply(D,1,max)

S. Déjean Sémin’R
Présentation du logiciel R
Notions de base Fonctions graphiques Programmation Un peu de statistique

Structures de données

R > C[C[,1]>0.1,] V

R>C
C[,1] : 1ère colonne de C [,1] [,2] [,3] [,4] [,5]
C[,1]>0.1 : vecteur logique
[1,] 0.000 0.211 0.421 0.632 0.842
de longueur le nombre de [2,] 0.053 0.263 0.474 0.684 0.895
lignes de C contenant TRUE si [3,] 0.105 0.316 0.526 0.737 0.947
la valeur est supérieure à 0.1 [4,] 0.158 0.368 0.579 0.789 1.000
et FALSE sinon.
R > C[,1]>0.1
C[C[,1]>0.1,] extrait de la
[1] FALSE FALSE TRUE TRUE
matrice C les lignes où les
R > C[C[,1]>0.1,]
éléments sur la première co-
[,1] [,2] [,3] [,4] [,5]
lonne sont supérieurs à 0.1 et
[1,] 0.105 0.316 0.526 0.737 0.947
toutes les colonnes.
[2,] 0.158 0.368 0.579 0.789 1.000

S. Déjean Sémin’R
Présentation du logiciel R
Notions de base Fonctions graphiques Programmation Un peu de statistique

Structures de données

R > apply(A,2,sum) V

Arguments de la fonction
apply() :
A : matrice de travail R>C
2 : on s’intéresse aux co- [,1] [,2] [,3] [,4] [,5]

lonnes (1 pour les lignes) [1,] 1 4 7 10 13

sum : fonction à appliquer sur [2,] 2 5 8 11 14

les colonnes de la matrice de [3,] 3 6 9 12 15

travail R > apply(A,2,sum)


apply(A,2,sum) : calcule la [1] 6 15 24 33 42

somme en colonne de la ma-


trice A

S. Déjean Sémin’R
Présentation du logiciel R
Notions de base Fonctions graphiques Programmation Un peu de statistique

Structures de données

Tableau - array
Généralisation du type matrix à plus de 2 dimensions
La fonction apply() reste utilisable

R>H
,,1
R > H=array(1 :12,c(2,3,2)) [,1] [,2] [,3]

R > H[„1] ;H[,1,1],H[1„1] [1,] 1 3 5

R > apply(H,1,sum) V [2,] 2 4 6

R > apply(H,2,sum) V ,,2

R > apply(H,3,sum) V [,1] [,2] [,3]

[1,] 7 9 11

[2,] 8 10 12

V =⇒ 36 42
V =⇒ 18 26 34
V =⇒ 21 57
S. Déjean Sémin’R
Présentation du logiciel R
Notions de base Fonctions graphiques Programmation Un peu de statistique

Structures de données

Liste - list
Objet "fourre-tout" : R > x = list("bidon",1 :8) ;x
scalaire, vecteur, chaînes
R > x[[1]] ;x[[1]]+1 ;x[[2]]+10
de caractères, listes...
R > y = list(matrice=D,vecteur=f,
Accès aux composants
d’un objet de type list + texte="bidon",scalaire=8)
soit par le nom (ou un R > names(y) ;y[[1]]
raccourci non ambigü) soit R > y$matrice ;y$vec
par le numéro entre
R > y[c("texte","scal")]
double-crochets [[ ]]
R > y[c("texte","scalaire")]
La longueur d’un objet de
type list est le nombre R > length(y)
de ces composants R > length(y$vecteur)
Utile pour renvoyer les R > cos(y$scal)+y[[2]][1]
résultats d’une fonction

S. Déjean Sémin’R
Présentation du logiciel R
Notions de base Fonctions graphiques Programmation Un peu de statistique

Structures de données

Data frame
Structure spéciale pour
les jeux de données de
type Individus ×
Variables R > taille = runif(12,150,180)
R > masse = runif(12,50,90)
Analogies avec les
R > sexe = rep(c("M","F","F","M"),3)
matrices et les listes
pour l’accès aux R > H = data.frame(taille,masse,sexe)
colonnes (composants) R > H ;summary(H)
R > H[1,] ;H$taille
Les colonnes peuvent
être de natures R > H$sexe
différentes (variables
quantitatives et
qualitatives)

S. Déjean Sémin’R
Présentation du logiciel R
Notions de base Fonctions graphiques Programmation Un peu de statistique

Entrées/sorties

Importation de données

fic1.csv
5,2.5,3.8
R > fic1=read.table("fic1.csv",
8,3.2,3.4
+ sep=",")
12,4.6,5
R > fic1b=read.csv("fic1.csv")
fic2.txt R > fic2=read.table("fic1.csv",
X1 ;X2 ;X3 + sep=" ;",dec=",",header=TRUE)
5 ;2,5 ;3,8 R > help(read.table)
8 ;3,2 ;3,4
12 ;4,6 ;5

S. Déjean Sémin’R
Présentation du logiciel R
Notions de base Fonctions graphiques Programmation Un peu de statistique

Entrées/sorties

Exportation d’objets R

write.table() (fonction
réciproque de
read.table()) R > A=seq(1,10,l=50)

sink() : redirection du R > write.table(A,"A.txt")


résultat des commandes vers R > sink("A2.txt")
un fichier (pas d’affichage à R > A ;summary(A)
l’écran). R > sink()
+ Ne pas oublier de fermer le R > summary(A)
fichier en rappelant sink() sans
argument.

S. Déjean Sémin’R
Présentation du logiciel R
Notions de base Fonctions graphiques Programmation Un peu de statistique

Entrées/sorties

Liens avec d’autres logiciels

La passerelle liant R à un autre logiciel scientifique (ou


tableur) est le format texte (ASCII). R peut importer et ex-
porter du format texte. Et c’est également le cas de la
plupart des logiciels permettant de traiter des données.
Le package foreign permet de simplifier la communica-
tion avec les logiciels statistiques Minitab, S, SAS, SPSS,
Stata, Systat, Octave.

S. Déjean Sémin’R
Présentation du logiciel R
Notions de base Fonctions graphiques Programmation Un peu de statistique

Extensions (packages)

Où trouver des extensions (packages) ?


Rubrique Packages sur cran.cict.fr

S. Déjean Sémin’R
Présentation du logiciel R
Notions de base Fonctions graphiques Programmation Un peu de statistique

Extensions (packages)

Utiliser un package

Installation (en ligne) : Menu Packages (sous Windows),


choix d’un site miroir puis choix du package
Installation (en local) : Menu Packages (sous Windows), à
partir d’un fichier Zip
Pour gérer les packages en ligne de commande, utiliser
l’ensemble des fonctions install.packages(),
update.packages()...
Chargement soit par menu soit par
R > library(foreign)

S. Déjean Sémin’R
Présentation du logiciel R
Notions de base Fonctions graphiques Programmation Un peu de statistique

0.5
O O α

0.4
β

0.3
Densité

0.2
0.1
0.0
46 48 50 52

R > help.search("plot")

16SR

1
SPI1.1
apoE

apoA.I

FAS ●

THIOL

0


S14



● ●

● ● ●
● ●





● ● ●
● ●

● ●


● ●

−1
● ●

● ●

● ● ●
● ● ● ●


● ●

● ● ●
● ●
● ●

−2
i.BAT

ACAT1 AM2R Bcl.3 CBS CYP26 CYP8b1 GK i.BABP Lpin LXRb MS PAL PPARd S14 Tpbeta

S. Déjean Sémin’R
Présentation du logiciel R
Notions de base Fonctions graphiques Programmation Un peu de statistique

Construction de graphiques

Une variable qualitative (Effectif)


Ex : R > data=c(12,10,7,13,26,16,4,12)
A B C D E F G H
R > pie(data)
12 10 7 13 26 16 4 12
R > barplot(data)

S. Déjean Sémin’R
Présentation du logiciel R
Notions de base Fonctions graphiques Programmation Un peu de statistique

Construction de graphiques

Une variable quantitative

Ex : Tirage aléatoire d’un R > x=runif(100)


échantillon de taille 100 R > hist(x)
issu d’une loi uniforme sur R > boxplot(x)
l’intervalle [0,1] R > stripchart(x)

S. Déjean Sémin’R
Présentation du logiciel R
Notions de base Fonctions graphiques Programmation Un peu de statistique

Construction de graphiques

Deux variables quantitatives


Ex : R > x=seq(-10,10,l=100)
Représentation R > plot(x,sin(x)) V
de la fonction R > plot(x,sin(x),type="l",col="blue") V
sinus sur R > abline(h=0,v=0,lty=2) V
l’intervalle R > points(0,0,pch="+",cex=3,col="red") V
[-10,10] R > lines(x,cos(x),col="green") V

V V V V

S. Déjean Sémin’R
Présentation du logiciel R
Notions de base Fonctions graphiques Programmation Un peu de statistique

Construction de graphiques

Trois variables
R > # Construction de x, y, et z
Ex : Représentation R > image(x,y,z) V
de la fonction sinus R > persp(x,y,z) V
cardinal sur R > contour(x,y,z) V
[-10,10]2 R > filled.contour(x,y,z) V
R > # Multiples options...

V V V V
S. Déjean Sémin’R
Présentation du logiciel R
Notions de base Fonctions graphiques Programmation Un peu de statistique

Construction de graphiques

Créer un graphique :
plot(),image()...
Ajouter à un graphique existant :
lines(), abline(), points(), text(), rect()...
Récupérer les coordonnées d’un point en cliquant :
locator(1), text(locator(1),"ici")
Ouvrir une nouvelle fenêtre graphique :
windows(), X11()
Découper une fenêtre graphique :
par(mfrow=c(lig,col)), layout()

S. Déjean Sémin’R
Présentation du logiciel R
Notions de base Fonctions graphiques Programmation Un peu de statistique

Sauvegarde et/ou exportation

copier-coller : menu Fichier > Copier vers le


presse-papier puis coller dans le logiciel de son choix V
sauvegarder : menu Fichier, rubrique Sauver sous.
Formats : emf, ps, pdf, png, bmp, jpeg ... V
utiliser les fonctions associées à la sauvegarde de fichiers
graphiques : bmp(), jpeg(), pdf() ...

1 Redirection de la sortie graphique vers un fichier


R > jpeg("fichier.jpg")
2 Tracé du graphique
R > plot(1 :100) ;text(20,80,"abcdef")
3 Fermer le fichier. + Ne pas oublier cette étape !
R > dev.off()

V Windows uniquement

S. Déjean Sémin’R
Présentation du logiciel R
Notions de base Fonctions graphiques Programmation Un peu de statistique

Développements

Développements
3D (rgl), interactivité (iplots), facilité de création de
graphiques complexes (ggplot2) ...
mpg cyl disp
● ●
● ●
● ● ●
30
● ●
● ●
25 ● ●
● ● ●

mpg
● ●
● ● ● ●
20 ●
● ● ● ● ●
● ●

● ● ●
● ●
● ●

● ●
15 ●
● ●●
● ● ●
● ●
● ●

● ●●
10

8 ● ● ●●●
●●●● ● ●● ● ●
●● ●● ● ● ●●

cyl
6 ●● ●● ●● ● ●● ● ●

y
4 ●
● ● ● ● ● ● ● ● ●●
● ● ● ● ●●

2
● ●
● ●
● ●

400 ● ●

●● ● ● ●

● ●
300 ●
● ●
● ●● ●
● ●
● ●

disp
200
● ● ● ●

● ● ● ●
● ●

● ● ●
● ●
100 ●

● ●


● ●

15 20 25 30 4 5 6 7 8 100 200 300 400


x

S. Déjean Sémin’R
Présentation du logiciel R
Notions de base Fonctions graphiques Programmation Un peu de statistique

Structures de contrôle

Répétition
Formes classiques de la
répétition : R > for (i in 1 :10) print(i)
Nombre de répétitions R > som=0
pré-défini : for R > for (j in -5 :5){
Répétition jusqu’à + som=som+j
obtention d’un critère :
+ print(som)}
while
R > for (i in c(2,4,5,8)) print(i)
repeat, break, next
R > i=0
R > help("for")
renvoie une aide en ligne R > while (i<10){
commune pour les + print(i)
structures de contrôle + i=i+1}
(répétition et condition)

S. Déjean Sémin’R
Présentation du logiciel R
Notions de base Fonctions graphiques Programmation Un peu de statistique

Structures de contrôle

Condition

R > y=z=0 ;
Structure classique : R > for (i in 1 :10) {
if ... else + x=runif(1)
Structure particulière + if (x>0.5) y=y+1
ifelse(test, oui, + else z=z+1 }
non). Renvoie un objet R > y ;z
de la même forme que R > x = rnorm(10) V
test. R > y = ifelse(x>0, 1, -1) V
Ex (V) :
x = 0.6 -0.4 -1.8 -0.5 -0.7 -0.2 0.3 -1.3 0.1 -0.4
y = 1 -1 -1 -1 -1 -1 1 -1 1 -1

S. Déjean Sémin’R
Présentation du logiciel R
Notions de base Fonctions graphiques Programmation Un peu de statistique

Fonctions

R > f1=function(x){x+2}
Création de fonctions : R > f1(3)
function(arg1,...){corps}
R > x = f1(4)
Affectation de valeurs par
R > f2 = function(a,b=a){a+b} V
défaut à des arguments V
R > f2(a=2,b=3)
Utilité du type list pour
R > f2(5)
renvoyer plusieurs
informations de natures R > calc.rayon=function(r){
différentes V + p=2*pi*r ;s=pi*r*r ;
Reconnaissance du + list(ray=r,perim=p,surf=s) V
paramètre si raccourci non R > resultat=calc.rayon(3)
ambigü V
R > resultat$r V

S. Déjean Sémin’R
Présentation du logiciel R
Notions de base Fonctions graphiques Programmation Un peu de statistique

Fonctions

Créer un package

Documentation : Writing R extensions


Structure d’un package :
R > help(package.skeleton)
+ Création des fichiers et des répertoires (R, man,
data, src...) requis pour la construction du package à
partir des éléments R (fonctions, données) passés en
paramètre.

Vérification : R CMD check


Construction : R CMD build
Soumission à CRAN (ftp, mail)

S. Déjean Sémin’R
Présentation du logiciel R
Notions de base Fonctions graphiques Programmation Un peu de statistique

Fonctions

Interface avec C et FORTRAN


Référence : Writing R extensions (très technique !)
1 Fichier convolve.c
void convolve(double *a, int *na, double *b, int *nb, double *ab){
int i, j, nab = *na + *nb - 1;
for(i = 0; i < nab; i++) ab[i] = 0.0;
for(i = 0; i < *na; i++) for(j = 0; j < *nb; j++) ab[i + j] += a[i] * b[j];}

2 Création d’une librairie dynamique (Unix, .o et .so) : R CMD SHLIB convolve.c

3 Création d’une fonction R qui fait appel à la librairie (pas obligatoire, mais plus clair)

conv = function(a, b)
.C("convolve", as.double(a), as.integer(length(a)), as.double(b),
as.integer(length(b)), ab = double(length(a) + length(b) - 1))$ab

4 Chargement de la librairie dynamique dans R :

R > dyn.load("convolve.so")
5 Utilisation :

R > res = conv(1 :10,seq(0,1,l=10))

S. Déjean Sémin’R
Présentation du logiciel R
Notions de base Fonctions graphiques Programmation Un peu de statistique

Simulation

Les distributions courantes sont programmées : Beta,


Binomiale, Cauchy, Normale, Uniforme, Weibull...
Plusieurs fonctions pour chaque distribution. Par exemple,
pour la loi normale :
dnorm() : fonction densité (density)
pnorm() : fonction de répartition (probability)
qnorm() : fonction quantile (quantile)
rnorm() : générateur aléatoire (random)

R > help.search("Distribution")
S. Déjean Sémin’R
Présentation du logiciel R
Notions de base Fonctions graphiques Programmation Un peu de statistique

Tests statistiques

La plupart des tests R > x=rnorm(100)


statistiques courants (et bien R > y=rnorm(100,mean=1)
d’autres) sont programmés
dans R. R > t.test(x,y)
Test de Student pour la R > var.test(x,y)
comparaison de moyennes. R > t.test(x,y,var.equal=T)
Test de Fisher pour la R > cor.test(x,y)
comparaison de variances. R > ks.test(x,y)
Test de nullité du coefficient R > ks.test(x,"pnorm")
de corrélation.
R > ks.test(y,"pnorm")
Test de Kolmogorov-Smirnov
R > ks.test(y,"pnorm",1)
...

R > help.search("test",package="stats")

S. Déjean Sémin’R
Présentation du logiciel R
Notions de base Fonctions graphiques Programmation Un peu de statistique

Statistique descriptive unidimensionnelle

Les fonctions boxplot() et hist() R > x=runif(100)


peuvent ne pas produire de R > y=runif(100)
graphique (option plot=FALSE).
R > mean(x) ;var(x) ;sd(x)
La fonction stem() produit une
R > min(x) ;max(x)
diagramme stem-and-leaf (tige et
feuille) qui donne un aperçu de la R > quantile(x) ;median(x)
répartition des données de façon R > quantile(x,0.9)
plus « rustique » qu’un histogramme
R > boxplot(x,plot=FALSE)
La fonction summary() est une
R > cov(x,y)
fonction générique (comme plot()
par exemple) qui s’adapte à la classe R > summary(x) V
(fonction class()) de l’objet passé R > stem(x) ;stem(y)
en paramètre (vecteur, matrice, data
R > hist(x,plot=F)
frame, résultat d’une fonction...) V

S. Déjean Sémin’R
Présentation du logiciel R
Notions de base Fonctions graphiques Programmation Un peu de statistique

Régression

Liste les jeux de données


disponibles dans le package
datasets attaché par défaut au R > search()
lancement de R. V R > ls(pos=7) V
Le résultat de la fonction R > help(cars)
lm() est un objet de classe R > res1 = lm(dist ˜ speed,
"lm", ce dont tient compte la + data=cars) ;res1
fonction summary(). V
R > class(res1) V
R > plot(cars) V
R > abline(res1) V
R > names(res1)
R > summary(res1) V
R > anova(res1)

V
S. Déjean Sémin’R
Présentation du logiciel R
Notions de base Fonctions graphiques Programmation Un peu de statistique

Statistique descriptive multidimensionnelle

Jeu de données : USArrests


Criminalité aux Etats-Unis : 50 états, 4 variables
R > summary(USArrests)
Murder Assault UrbanPop Rape
Min. : 0.800 Min. : 45.0 Min. :32.00 Min. : 7.30
1st Qu.: 4.075 1st Qu.:109.0 1st Qu.:54.50 1st Qu.:15.07
Median : 7.250 Median :159.0 Median :66.00 Median :20.10
Mean : 7.788 Mean :170.8 Mean :65.54 Mean :21.23
3rd Qu.:11.250 3rd Qu.:249.0 3rd Qu.:77.75 3rd Qu.:26.18
Max. :17.400 Max. :337.0 Max. :91.00 Max. :46.00

R > boxplot(USArrests)

S. Déjean Sémin’R
Présentation du logiciel R
Notions de base Fonctions graphiques Programmation Un peu de statistique

Statistique descriptive multidimensionnelle

Analyse en composantes principales (ACP)


R > res.acp=prcomp(USArrests,scale=T)
R > plot(res.acp) V
R > summary(res.acp) V
R > biplot(res.acp) V

V
V PC1 PC2 PC3 PC4

Standard deviation 1.57 0.99 0.60 0.42

Proportion of Variance 0.62 0.25 0.09 0.04


V
Cumulative Proportion 0.62 0.87 0.96 1.00

S. Déjean Sémin’R
Présentation du logiciel R
Notions de base Fonctions graphiques Programmation Un peu de statistique

Statistique descriptive multidimensionnelle

Classification hiérarchique

R > d=dist(USArrests) V
R > clas=hclust(d,meth="ward") V
R > plot(clas) V

R > rect.hclust(clas,k=3)
R > rect.hclust(clas,k=6,bord="blue")

R > plot(hclust(dist(USArrests),method="ward")) V

S. Déjean Sémin’R
Présentation du logiciel R
Notions de base Fonctions graphiques Programmation Un peu de statistique

Présentation du logiciel R

Sébastien Déjean
math.univ-toulouse.fr/˜sdejean

Institut de Mathématiques de Toulouse UMR 5219


Université Paul-Sabatier (Toulouse III)

S. Déjean Sémin’R
Présentation du logiciel R

Vous aimerez peut-être aussi