Éléments de traitement statistiques avec le logiciel R
Séance de TP Nº 1
Initiation au logiciel R
1. Premiers pas
1.1. Utilisation du logiciel R comme une simple calculatrice
1.1.1. Calculs simples
10*9*8*7*6*5*4*3*2*1
70 / 1.84^2
monPoids <- 70
maTaille <- 1.84
monPoids / maTaille^2
log(2)/log(10)
1.2. Commentaires
Le caractère ‘#’ sert à ajouter des commentaires dans le programme : R néglige tous ce qui est
après le caractère ‘#’ et passe automatiquement à la ligne suivante.
1.3. Vecteurs et matrices
1.3.1. Création de vecteurs
- Vecteurs
vec <- 10 # dans R nous n´avons pas besoin de déclarer une
variable
vec <- c(10,3,4,5,6,10,100,100,10,20, 30,40)
vec <- 1:10
vec <- (1:10)*10
vec <- seq (10,100)
vec <- seq (10,100, by = 10)
vec <- seq(1,9,2)
vec <- rep(c(0,6),3)
vec <- rep(1:3,4)
vec <- (1:3,each=4)
vec <- rep(1:3,1:3)
vec <- rep(1:3,3:1)
vec <- c(10,3:6,10,rep(100,2), seq(10,40,by=10))
- Vecteur avec composantes manquantes
vec1 <- c(10,3,4,NA,6,10,100,NA,10,20, NA,40)
- Matrices
vec <- (1:12)
matrix(vec, 3)
matrix(vec, 2)
matrix(vec, ,2)
matrix(vec, ,2, byrow=T)
mat<-matrix(1:15,ncol=5,byrow=T)
mat<-matrix(1:15,5,byrow=T)
mat<-matrix(1:15,ncol=5,byrow=F)
mat<-matrix(1:15,nrow=5,byrow=T)
mat<-matrix(c(1:3),ncol=2,nrow=3)
mat<-matrix(c(1:3),ncol=6,nrow=5)
diag(mat) # renvoie la diagonale d’une matrice
1.3.2. Manipulation de vecteurs / matrices
- Extraire d´un vecteur
vec <- c(10,3:6,10,rep(100,2), seq(10,40,by=10))
- a <- vec[2]
- B <- vec[2:4]
- x=c(1,4,5)
C <- vec[x]
mat<-matrix(c(1:3),ncol=6,nrow=5)mat[1,2]
- a <- mat[1,2]
- B <- mat[1,]
- B <- mat[,2]
- mat[,]
- mat[1:3,]
- mat[1:3,2]
- mat[1:3,2:4] # sous matrice d’une matrice
- Modifier un vecteur
vec[2] <- 123
vec[2:3] <- c(111,222)
- Supprimer une partie d´un vecteur
vec[-2]
vec[-2:-4]
- Opération sur les vecteurs
# Les opérations + * - / entre 2 vecteurs ou matrices de
même dimension sont des opérations terme à terme
vec2 <- vec + 1
vec[1:4]+1
(vec+1)[1:4]
x <- 1:4
y <- x * vec[1:4]
vec[2:3] <- -y
D <- vec[vec>0]
1.4. Certaines fonctions de base
Fonction somme : sum
sum (2,4)
sum(vec)
Longueur d’un vecteur
length(vec)
length(vec[vec ==0])
1.5. Data frame
1.5.1. Définition
C’est une matrice dont toutes les colonnes ne sont pas nécessairement du même type : scalaire,
booléen, caractère. Par exemple
c("F","M")
c("F",2)
data1= [Link](x1=1,x2=1:10,a=letters [1:10])
data2= [Link](x1=1,x2=1:10,sexe=c("F","M"))
names( data1 ) # Pour visualiser le nom
des colonnes
names(data1)<2- c("c1","c2","c3") # Pour modifier le nom
des colonnes
head(data1) #Pour visualiser les premières lignes
[Link](data1) #Pour visualiser le nom des lignes
[Link](data1)<-
c("l1","l2","l3","l4","l5","l6","l7","l8","l9","l10")
#Pour définir le nom des lignes
dim(data1) #renvoie a dimension de [Link]
1.6. Opération sur les data frame
A = [Link](x=1:3,y=2:4)
B = [Link](xx=1,yy=1:3)
C= [Link](x=1:3,y=rep("a" ,3))
A+B # somme élément par élément
A+C # rencontre un problème au niveau de la deuxième colonne
[Link] (A,B) # concat ner des dataframes a ant e m me nom re
de lignes
Certaines fonctions
Fonction somme et sommes cumulées: sum(), cumsum(),
Autre fonction somme : colSums(), rowSums(), sum(vect, [Link] = TRUE)
Fonction produit et produit cumulées : prod(), cumprod()
Fonction moyenne arithmétique : mean()
Fonction max(), min()
length()
dim(), ncol(), nrow
fft transform de ourier
sort (tri), order, unique # remarque : sort(x) = x[order(x)]
[Link]()
[Link]()
[Link](T)
[Link] (F)
[Link]()
[Link]()
sqrt() , abs()
sin() , cos() , tan()
exp() , log() , log10()
which(x== 25)