0% ont trouvé ce document utile (0 vote)

301 vues24 pages

Exercices R pour Statistique & Économétrie

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

301 vues24 pages

Exercices R pour Statistique & Économétrie

Transféré par

maxime ndoumbe

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

M1 Statistique & Économétrie

Ewen Gallic 1
[Link] 2015

Logiciel R et programmation
Exercices

Partie 1 : Données
Exercice 1 (manipulation de vecteurs)

Considérons le vecteur suivant : x = 1 2 3 4 5 .

1. Créer ce vecteur dans R et le stocker dans un objet que l’on appellera x ;

# Une première solution

x <- c(1, 2, 3, 4, 5)
# Une seconde
x <- seq(1, 5)
# Une troisième
x <- seq_len(5)

2. Afficher le mode de x, puis sa longueur ;

mode(x)
## [1] "numeric"
length(x)
## [1] 5

3. Extraire le premier élément, puis le dernier ;

1. [Link][at][Link]
Exercice 1

"["(x,1) ; "["(x,5)
## [1] 1
## [1] 5
x[1] ; x[5]
## [1] 1
## [1] 5
# Pour le dernier, on peut également faire comme suit :
x[length(x)]
## [1] 5

4. Extraire les trois premier éléments et les stocker dans un vecteur que l’on nommera a ;

a <- x[c(1,2,3)]
(a <- x[1:3])
## [1] 1 2 3

5. Extraire les éléments en position 1, 3, 5 ; les stocker dans un vecteur que l’on nommera b ;

b <- x[c(1,3,5)]

6. Additionner le nombre 10 au vecteur x, puis multipliser le résultat par 2 ;

(x + 10)*2
## [1] 22 24 26 28 30

7. Effectuer l’addition de a et b, commenter le résultat ;

a + b
## [1] 2 5 8

Les éléments de a et b sont ajoutés un par un, le ie élément de b est additionné au ie

élément de a.

8. Effectuer l’addition suivante : x+a, commenter le résultat, puis regarder le résultat de a+x ;

Le ie élément de a est additionné au ie élément de x, mais comme la longueur de a est

inférieure à celle de b, R procède à ce que l’on appelle le recyclage, c’est-à-dire que le vecteur
de plus courte taille est répété jusqu’à obtenir une taille égale à celle du plus long, puis est
tronqué si la taille de lélément répété dépasse celle du vecteur initialement plus long.
x + a
## Warning in x + a: la taille d’un objet plus long n’est pas multiple de
la taille d’un objet plus court
## [1] 2 4 6 5 7

2
Exercice

Pour ce qui est de l’opération a+x, le résultat est identique (ouf !).

9. Multiplier le vecteur par le scalaire c que l’on fixera à 2 ;

c <- 2
x*c
## [1] 2 4 6 8 10

10. Effectuer la multiplication de a et b, commenter le résultat ;

a * b
## [1] 1 6 15

Les éléments de a et b sont multipliés un par un, le ie élément de b est multiplié au ie

élément de a.

11. Effectuer la multiplication suivante : x*a, commenter le résultat ;

Comme pour l’addition, R procède au recyclage.

x
## [1] 1 2 3 4 5
a
## [1] 1 2 3
x * a
## Warning in x * a: la taille d’un objet plus long n’est pas multiple de
la taille d’un objet plus court
## [1] 1 4 9 4 10

12. Récupérer les positions des multiples de 2 et les stocker dans un vecteur que l’on nommera ind,
puis conserver uniquement les multiples de 2 de x dans un vecteur que l’on nommera mult_2 ;

ind <- which(x %% 2 == 0)

(mult_2 <- x[ind])
## [1] 2 4

13. Afficher les éléments de x qui sont multiples de 3 et multiples de 2 ;

x[which(x %% 2 == 0 & x %% 3 == 0)]

## integer(0)

14. Afficher les éléments de x qui sont multiples de 3 ou multiples de 2 ;

3
Exercice 1

x[which(x %% 2 == 0 | x %% 3 == 0)]
## [1] 2 3 4

15. Calculer la somme des éléments de x ;

sum(x)
## [1] 15

16. Remplacer le premier élément de x par un 4 ;

x[1] <- 4
x
## [1] 4 2 3 4 5

17. Remplacer le premier élément de x par la valeur NA, puis calculer la somme des éléments de x ;

x[1] <- NA
sum(x)
## [1] NA
sum(x, [Link]=TRUE)
## [1] 14

18. Lister les objets en mémoire dans la session R ;

ls()
## [1] "a" "b" "c" "ind" "mult_2" "x"

19. Supprimer le vecteur ;

rm(x)

20. Supprimer la totalité des objets de la session.

rm(list=ls())

Lorsqu’on désire une session fraîche, il est préférable de redémarrer la session plutôt que
de détruire les objets présents dans celle-ci. Le fait de redémarrer la session R décharge
également les packages éventuellement chargés dans la session courante.

4
Exercice

Exercice 2 (manipulation de listes)

1. Évaluer le code suivant : TRUE+FALSE+TRUE*4 et le commenter ;

TRUE + FALSE + TRUE * 4

## [1] 5

Dans R, TRUE et FALSE sont des booléens, et répondent à une condition logique. Lorsqu’on
additionne des booléens, R les convertit en integer : TRUE prend la valeur 1 et FALSE 0.

2. Évaluer les expressions suivantes : c(1, 4, TRUE), et c(1, 4, TRUE, "bonjour"), commenter ;

c(1, 4, TRUE)
## [1] 1 4 1
c(1, 4, TRUE, "bonjour")
## [1] "1" "4" "TRUE" "bonjour"

Les éléments d’un vecteur doivent tous être de même type. Dans les deux cas, R convertit
les données dans le type le plus général. Ainsi, dans le premier exemple, TRUE est converti
en numeric, dans le second, la présence d’une chaîne de caractères force R à convertir tous
les autres éléments du vecteur en character.

3. Créer une liste que l’on appellera l et qui contient les éléments 1, 4 et TRUE en première, seconde
et troisième positions respectivement ;

l <- list(1, 4, TRUE)

4. Extraire le premier élément de la liste l, et afficher son mode. En faire de même avec le troisième
élément, et commenter ;

# Extraction du premier élément de l

l[[1]]
## [1] 1
"[["(l, 1)
## [1] 1
# Mode du premier élément de l
mode(l[[1]])
## [1] "numeric"
# Idem pour le troisième élément
mode(l[[3]])
## [1] "logical"

Contrairement aux vecteurs, les listes peuvent contenir des éléments de classe différente.
Cela fait de la liste un objet très polyvalent.

5. Ajouter un quatrième élément à la liste l : "bonjour", puis afficher la structure de l ;

5
Exercice 2

l <- c(l, "bonjour")

str(l)
## List of 4
## $ : num 1
## $ : num 4
## $ : logi TRUE
## $ : chr "bonjour"

6. Retirer le troisième élément de la liste l ;

l[[3]] <- NULL

unlist(l)
## [1] "1" "4" "bonjour"

7. Créer une liste de trois éléments : votre nom, votre prénom, et votre année de naissance. Ces
trois éléments de la liste devront être nommés respectivement "nom", ""prenom" et année de
naissance. Stocker la liste ainsi créée dans un objet nommé moi ;

moi <- list(nom = "Vader", prenom = "Darth",

`année de naissance` = 41.9)
moi
## $nom
## [1] "Vader"
##
## $prenom
## [1] "Darth"
##
## $`année de naissance`
## [1] 41.9

8. Extraire le prénom de la liste moi de deux manières : en utilisant l’indice, et en utilisant le nommage ;

moi[[2]]
## [1] "Darth"
moi$prenom
## [1] "Darth"
# Remarque : on peut effectuer la recherche de l'indice
which(names(moi) == "prenom")
## [1] 2

9. Créer une liste avec la même structure que celle de moi, en la remplissant avec les informations
d’une autre personne et la nommer toi. Puis, créer la liste personnes, qui contiendra les listes toi
et moi ;

6
Exercice

toi <- list(nom = "Skywalker", prenom = "Luke",

`année de naissance` = 19)
personnes <- list(toi, moi)

10. Extraire la liste toi de personnes (en première position) ;

personnes[[1]]
## $nom
## [1] "Skywalker"
##
## $prenom
## [1] "Luke"
##
## $`année de naissance`
## [1] 19

Attention, si on fait personnes[1], on garde uniquement le premier élément de la liste

personnes, mais on conserve la structure de liste ; dans ce cas précis, cela revient à retirer
tous les éléments de la liste sauf le premier.

11. Extraire directement depuis personne le prénom de l’élément en première position.

personnes[[1]]$prenom
## [1] "Luke"

Exercice 3 (manipulation de matrices)

 
−3 5 6
1. Créer la matrice suivante : A = −1 2 2 ;
1 −1 −1

A <- matrix(c(3,5,6, -1,2,2, 1,-1,-1), ncol=3, byrow=TRUE)

Si on ne précise pas byrow=TRUE, R remplit la matrice colonne par colonne.

2. Afficher la dimension de A, son nombre de colonnes, son nombre de lignes et sa longueur ;

7
Exercice 3

dim(A)
## [1] 3 3
ncol(A)
## [1] 3
nrow(A)
## [1] 3
length(A)
## [1] 9

3. Extraire la seconde colonne de A, puis la première ligne ;

A[,2]
## [1] 5 2 -1
A[1,]
## [1] 3 5 6

4. Extraire l’élément en troisième position à la première ligne ;

A[1, 3]
## [1] 6

2 2
5. Extraire la sous-matrice de dimension 2 × 2 du coin inférieur de A, c’est-à-dire ;
−1 −1

A[2:3, 2:3]
## [,1] [,2]
## [1,] 2 2
## [2,] -1 -1

6. Calculer la somme des colonnes puis des lignes de A ;

colSums(A)
## [1] 3 6 7
rowSums(A)
## [1] 14 3 -1

7. Afficher la diagonale de A ;

8
Exercice

diag(A)
## [1] 3 2 -1

>
3 à droite de la matrice A et stocker le résultat dans un objet appelé

8. Rajouter le vecteur 1 2
B;

B <- cbind(A, c(1,2,3))

B
## [,1] [,2] [,3] [,4]
## [1,] 3 5 6 1
## [2,] -1 2 2 2
## [3,] 1 -1 -1 3

9. Retirer le quatrième vecteur de B ;

B <- B[,-4]
B
## [,1] [,2] [,3]
## [1,] 3 5 6
## [2,] -1 2 2
## [3,] 1 -1 -1

10. Retirer la première et la troisième ligne de B ;

B[-c(1,3),]
## [1] -1 2 2

11. Ajouter le scalaire 10 à A ;

A + 10
## [,1] [,2] [,3]
## [1,] 13 15 16
## [2,] 9 12 12
## [3,] 11 9 9

>
12. Ajouter le vecteur 1 2 3 à A;

A + c(1,2,3)
## [,1] [,2] [,3]
## [1,] 4 6 7
## [2,] 1 4 4
## [3,] 4 2 2

9
Exercice 3

13. Ajouter la matrice identité I3 à A ;

diag(3)
## [,1] [,2] [,3]
## [1,] 1 0 0
## [2,] 0 1 0
## [3,] 0 0 1
A + diag(3)
## [,1] [,2] [,3]
## [1,] 4 5 6
## [2,] -1 3 2
## [3,] 1 -1 0

14. Diviser tous les éléments de la matrice A par 2 ;

A / 2
## [,1] [,2] [,3]
## [1,] 1.5 2.5 3.0
## [2,] -0.5 1.0 1.0
## [3,] 0.5 -0.5 -0.5

>
15. Multiplier la matrice A par le vecteur 1

2 3 ;

A %*% c(1,2,3)
## [,1]
## [1,] 31
## [2,] 9
## [3,] -4

À ne pas confondre avec A * c(1,2,3), qui effectue la multiplication terme à terme.

16. Afficher la transposée de A ;

t(A)
## [,1] [,2] [,3]
## [1,] 3 -1 1
## [2,] 5 2 -1
## [3,] 6 2 -1

17. Effectuer le produit avec transposition A> A.

10
Exercice

t(A) %*% B
## [,1] [,2] [,3]
## [1,] 11 12 15
## [2,] 12 30 35
## [3,] 15 35 41
crossprod(A,A)
## [,1] [,2] [,3]
## [1,] 11 12 15
## [2,] 12 30 35
## [3,] 15 35 41

11
Exercice 4

Exercice 4 (importation et exportation)

1. Télécharger le fichier csv à l’adresse suivante : [Link]/Enseignement/R/Exercices/donnees/
[Link] et le placer dans le répertoire courant du projet. Importer son contenu dans R ;

On peut soit utiliser la fonction [Link]() du package utils, soit la fonction read_csv()
du package readr (plus rapide sur des gros volumes). Avec la première solution, le contenu
est stocké sous forme de data frame, avec la seconde sous forme de local data frame.
# Téléchargement du fichier
lien <- "[Link]
[Link](lien, destfile = "./[Link]")
df <- [Link]("[Link]")
library(readr)
df <- read_csv("[Link]")

2. Importer à nouveau les données dans R, mais en utilisant fournissant cette fois le l’url directement
à la fonction d’importation ;

lien <- "[Link]

df <- read_csv(lien)

3. À présent, importer le contenu du fichier [Link]/Enseignement/R/Exercices/donnees/notes_

[Link]. Le séparateur de champs est un point virgule et le séparateur décimal est une virgule ;

Au lieu d’utiliser la fonction read_csv(), on fait appel à read_csv2(), qui fait en réalité
appel l̀a fonction read_delim(), en précisant le caractère de séparation via le paramètre
delim.
lien <- "[Link]
df <- read_csv2(lien)
# Ou de manière équivalente
df <- read_delim(lien, delim=";")

4. Importer le contenu du fichier [Link]/Enseignement/R/Exercices/donnees/notes_h.csv.

Le nom des colonnes n’est pas présent ;

Avec la fonction [Link], il faut indiquer que l’en-tête est absente via le paramètre
header. En utilisant la fonction read_csv(), il suffit de préciser que le nom des colonnes
est absent via le paramètre col_names.
lien <- "[Link]
df <- read_csv(lien, col_names=FALSE)

5. Importer le contenu du fichier [Link]/Enseignement/R/Exercices/donnees/notes_h_s.

csv. La première ligne n’est pas à importer ;

On préciser à la fonction utilisée de sauter un certain nombre de lignes avec le paramètre

skip.
lien <- "[Link]
df <- read_csv(lien, skip=1)

6. Importer le contenu de la première feuille du fichier Excel [Link]/Enseignement/R/Exercices/

donnees/[Link] ;

12
Exercice

Pour importer le contenu d’un classeur Excel dans R, le plus pratique est d’utiliser la
fonction read_excel() du package read_xl. La version de ce package disponible sur le
CRAN à la date d’écriture de cet exercice (0.1.0) ne permet pas encore d’importer un
fichier en ligne. La version courante sur GitHub le permet, donc cette fonctionnalité devrait
apparaître sur le CRAN dans les versions futures du package. Pour l’heure, nous allons
d’abord télécharger le fichier dans le répertoire courant de la session R, puis le charger.
lien <- "[Link]
[Link](lien, destfile = "./[Link]", mode = "wb")
library(readxl)
df <- read_excel("[Link]")

7. Importer le contenu de la seconde feuille (notes_h_s) du fichier Excel [Link]/Enseignement/

R/Exercices/donnees/[Link]. La première ligne est un commentaire à ne pas considérer
durant l’importaiton ;

df <- read_excel("[Link]", sheet = "notes_h_s", skip=1)

8. Importer le fichier [Link]/Enseignement/R/Exercices/donnees/[Link] dans R ;

Pour charger un fichier de données au format rda ou RData, on utilise la fonciton load().
Dans cet exemple, le fichier source est sur l’Internet, donc il faut d’abord appliquer la
méthode url() à notre chaîne de caractères indiquant l’emplacement du fichier.
lien <- "[Link]
load(url(lien))
head(notes)

9. Exporter le contenu de l’objet notes de la question précédente au format csv (virgule en séparateur
de champs, point en séparateur décimal, ne pas conserver le numéro des lignes).

Avec la fonction [Link]() du package utils, il est nécessaire de préciser que l’on ne
souhaite pas inclure le nom des lignes via le paramètre [Link], ce qui est fait par défaut
avec la fonction write_csv() du package readr.
[Link](notes, file = "notes_2.csv", [Link] = FALSE)
write_csv(notes, path = "notes_3.csv")

10. Importer le contenu du fichier notes_2012.csv contenu dans l’archive disponible à l’adresse sui-
vante : [Link]

Dans un prmeier temps, il s’agit de télécharger le fichier dans un répertoire temporaire.

lien <- "[Link]
# Chemin vers dossier temporaire
td <- tempdir()
# Creation du fichier temporaire qui contiendra l'archive
tf <- tempfile(tmpdir=td, fileext=".zip")
# Telechargement dans cette archive
[Link](lien, tf)

Puis, on regarde le contenu du fichier :

13
Exercice 5

# Le nom des fichiers

unzip(tf, list=TRUE)$Name

On repère (à la main dans cet exercice) la position du fichier qui nous intéresse, puis à
l’aide de la fonction unz(), on ouvre une connexion vers l’archive.
# Le nom du premier fichier
nom_fichier <- unzip(tf, list=TRUE)$Name[1]

# Charger les données dans R

df <-
unz(description = tf, filename = nom_fichier) %>%
read_csv2()

Exercice 5 (manipulation de tableaux de données)

1. À l’aide de la fonction read_excel() du package readr, importer le contenu de la feuille intitulée
notes_2012 du fichier Excel disponible à l’adresse suivante : [Link]
R/Exercices/donnees/notes_etudiants.xlsx et le stocker dans une variable que l’on nommera
notes_2012 ;

library(readxl)
lien <- "[Link]
notes_2012 <- read_excel(lien, sheet = "notes_2012")

2. Afficher les 6 premières lignes du jeu de données, puis les dimensions du tableau ;

head(notes_2012)
dim(notes_2012)
ncol(notes_2012)
nrow(notes_2012)

3. Conserver uniquement la colonne note_stat du tableau de données notes_2012 dans un objet que
l’on appellera tmp ;

notes_2012$note_stat
notes_2012[, "note_stat"]
select(notes_2012, note_stat)

4. Conserver uniquement les colonnes num_etudiant, note_stat et note_macro dans l’objet tmp ;

notes_2012[, c("num_etudiant", "note_stat", "note_macro")]

notes_2012 %>% select(num_etudiant, note_stat, note_macro)
notes_2012 %>% select(num_etudiant:note_macro)

5. Remplacer le contenu de tmp par les observations de notes_2012 pour lesquelles l’individu a obtenu
une note de stat supérieure (strictement) à 10 ;

14
Exercice

notes_2012 %>%
filter(note_stat > 10)

6. Remplacer le contenu de tmp par les observations de notes_2012 pour lesquelles l’individu a obtenu
une note comprise dans l’intervalle (10, 15) ;

notes_2012 %>%
filter(note_stat > 10, note_stat < 15)

7. Regarder s’il y a des doublons dans le tableau de données notees_2012 ; le cas échéant, les retirer
du tableau ;

any(duplicated(notes_2012))
# Ou encore
notes_2012 <-
notes_2012 %>%
distinct()

8. Afficher le type des données de la colonne num_etudiant, puis afficher le type de toutes les colonnes
de notes_2012 ;

class(notes_2012$num_etudiant)
lapply(notes_2012, class)
str(notes_2012)

9. Ajouter au tableau notes_2012 les colonnes suivantes :

(a) note_stat_maj : la note de stat (note_stat) majorée d’un point,
(b) note_macro_maj : la note de macro (note_macro) majorée de trois points (le faire en deux
étapes : d’abord deux points en plus, puis un point) ;

notes_2012 %>%
mutate(note_stat_maj = note_stat + 1)
notes_2012 %>%
mutate(note_stat_maj = note_stat + 1,
note_macro_maj = note_macro + 2,
note_macro_maj = note_macro_maj + 1)

10. Renommer la colonne year en annee ;

notes_2012 <-
notes_2012 %>%
rename(annee = year)

15
Exercice 5

11. Depuis le fichier notes_etudiants.xlsx (c.f. question 1), importer le contenu des feuilles notes_2013,
notes_2014 et prenoms et le stocker dans les objets notes_2013, notes_2014 et prenoms respec-
tivement ;

notes_2013 <- read_excel(lien,

sheet = "notes_2013", na = "NA")
notes_2014 <- read_excel(lien,
sheet = "notes_2014", na = "NA")
prenoms <- read_excel(lien,
sheet = "prenoms")

12. Empiler le contenu des tableaux de données notes_2012, notes_2013 et notes_2014 dans un objet
que l’on nommera notes ;

notes <- rbind(notes_2012, notes_2013, notes_2014)

13. Fusionner les tableaux notes et prenoms à l’aide d’une jointure gauche, de manière à rajouter les
informations contenues dans le tableau prenoms aux observations de notes. La jointure doit se
faire par le numéro détudiant et l’année, l’objet final viendra remplacer le contenu de notes ;

notes <-
notes %>%
left_join(prenoms, by = c("num_etudiant", "annee"))

14. Trier le tableau notes par années croissantes et notes de macro décroissantes ;

notes <- arrange(notes, annee, desc(note_macro))

15. Changer le type des colonnes annee et sexe en facteur ;

notes <- note %>%

mutate(annee = factor(annee),
sexe = factor(sexe, levels = c("F", "H"),
labels = c("Femme", "Homme")))

16. Créer une colonne apres_2012 qui prend la valeur TRUE si l’observation concerne une note attribuée
après 2012 ;

notes <- note %>%

mutate(apres_2012 = ifelse(annee > 2012, yes = TRUE, no = FALSE))

17. À l’aide de la fonction summarize() du package dplyr, calculer :

(a) la moyenne et l’écart-type annuels des notes pour chacune des deux matières,

16
Exercice

infos_notes <-
notes %>%
group_by(annee) %>%
summarize(moyenne_stat = mean(note_stat, [Link]=TRUE),
sd_stat = sd(note_stat, [Link]=TRUE),
moyenne_macro = mean(note_macro, [Link] = TRUE),
sd_macro = sd(note_macro, [Link]=TRUE))

(b) la moyenne et l’écart-type annuels et par sexe des notes pour chacune des deux matières ;

infos_notes_2 <-
notes %>%
group_by(annee, sexe) %>%
summarize(moyenne_stat = mean(note_stat, [Link]=TRUE),
sd_stat = sd(note_stat, [Link]=TRUE),
moyenne_macro = mean(note_macro, [Link] = TRUE),
sd_macro = sd(note_macro, [Link]=TRUE))

18. En utilisant la fonction gather() du package tidyr, créer un tableau dans lequel chaque ligne
renseigne le numéro d’étudiant, l’année, le prénom, le sexe, l’enseignement (macro ou stat) et la
note ;

library(tidyr)
notes_l <-
notes %>%
gather(key = note, value = enseignement, note_stat, note_macro)

19. En repartant de l’objet obtenu à la question précédente, utiliser la fonction spread() du package
tidyr pour retomber sur le même tableau que notes.

notes_l %>%
spread(note, enseignement)

D’autres manières de répondre à chaque question de cet exercice :

17
Exercice 6

notes_2012_df <- [Link](notes_2012)

head(notes_2012_df)
dim(notes_2012_df)
ncol(notes_2012_df)
nrow(notes_2012_df)
notes_2012_df$note
notes_2012_df[, "note"]
notes_2012_df[, c("num_etudiant", "note_stat", "note_macro")]
notes_2012_df[notes_2012_df$note_stat>10,]
notes_2012_df[notes_2012_df$note_stat>10 & notes_2012_df$note_stat<15,]
any(duplicated(notes_2012_df))
notes_2012_df <- notes_2012_df[!duplicated(notes_2012_df),]
class(notes_2012_df$num_etudiant)
lapply(notes_2012_df, class)
str(notes_2012_df)
within(notes_2012_df,{note_stat_maj = note_stat + 1}) %>%
head()
within(notes_2012_df,{
note_stat_maj <- note_stat + 1
note_macro_maj <- note_macro + 2
note_macro_maj <- note_macro_maj + 1}) %>%
head()
ind <- which(colnames(notes_2012_df) == "year")
colnames(notes_2012_df)[ind] <- "annee"
notes_2013_df <- read_excel("donnees/notes_etudiants.xlsx",
sheet = "notes_2013", na = "NA") %>%
[Link]()
notes_2014_df <- read_excel("donnees/notes_etudiants.xlsx",
sheet = "notes_2014", na = "NA") %>%
[Link]()
notes_df <- rbind(notes_2012_df, notes_2013_df, notes_2014_df)
prenoms_df <- read_excel("donnees/notes_etudiants.xlsx",
sheet = "prenoms") %>%
[Link]()
notes_df <-
merge(notes_df, prenoms_df, by = c("num_etudiant", "annee"))
notes_df <-
notes_df[with(notes_df, order(annee, desc(note_macro))),]
aggregate(notes_df[, c("note_stat", "note_macro")],
by = list(annee = notes_df$annee),
FUN = function(x) cbind(moy = mean(x, [Link]=T),
sd = sd(x, [Link]=T)))

aggregate(notes_df[, c("note_stat", "note_macro")],

by = list(annee = notes_df$annee, sexe = notes_df$sexe),
FUN = function(x) cbind(moy = mean(x, [Link]=T),
sd = sd(x, [Link]=T)))

Exercice 6 (manipulation de chaînes de caractères)

1. Créer les objets a et b afin qu’il contiennent respectivement les chaînes de caractères suivantes : 23
à 0 et C’est la piquette, Jack ! ;

18
Exercice

a <- "23 à 0"

b <- "C'est la piquette, Jack !"

2. Créer le vecteur phrases de longueur 2, dont les deux éléments sont a et b ;

phrases <- c(a, b)

3. À l’aide de la fonction appropriée dans le package stringr, afficher le nombre de caractètres de a,

de b, puis appliquer la même fonction à l’objet phrases ;

library(stringr)
str_length(a)
str_length(b)
str_length(phrases)

4. En utilisant la fonction str_c(), concaténer a et b dans une seule chaîne de caractères, en choisis-
sant la virgule comme caractère de séparation ;

str_c(a, b, sep = ",")

5. Concaténer les deux éléments du vecteur phrases en une seule chaîne de caractères, en les séparant
par le caractère de retour à la ligne, puis utiliser la fonction cat() pour afficher le résultat dans la
console ;

library(stringr)
str_c(phrases, collapse = "\n")
cat(str_c(phrases, collapse = "\n"))
# Différent de :
str_c(phrases, sep = "\n")

6. Appliquer la même fonction que dans la question précédente à l’objet suivant : c(NA, phrases)
et commenter ;

str_c(c(phrases, NA), collapse = "\n")

cat(str_c(c(phrases, NA), collapse = "\n"))

Il y a l’objet NA dans le vecteur pour lequel on souhaite effectuer une concaténation. Cette
dernière échoue donc, et le résultat dans la console, suite à l’appel de la fonction cat()
sera également NA.

7. Mettre en majuscules, puis en minuscules les chaînes du vecteur phrases (afficher le résultat, ne
pas modifier phrases) ;

str_to_upper(phrases)
str_to_lower(phrases)

19
Exercice 6

8. À l’aide de la fonction word() du package stringr, extraire le mot la, puis Jack de la chaîne b ;

word(b, 2)
word(b, -2)

9. Même question que la précédente, en utilisant la fonction str_sub() ;

str_sub(b, 20, 23)

str_sub(b, -6, -3)
# Ne pas spécifier le paramètre end :
str_sub(b, 20)

10. À l’aide de la fonction str_detect(), rechercher si le motif piqu puis mauvais sont présents dans
b;

str_detect(b, "piqu")
str_detect(b, "mauvais")

11. À l’aide de la fonction str_detect(), rechercher si le motif piqu est présent dans les éléments du
vecteur phrases ;

str_detect(phrases, "piqu")

12. À l’aide de la fonction str_detect(), rechercher si le motif piqu ou le motif à sont présents dans
les éléments du vecteur phrases ;

str_detect(phrases, "piqu|à")

13. En utilisant la fonction str_locate(), retourner les positions de la première occurence du caractère
a dans la chaîne b, puis essayer avec le caractère w pour observer le résultat retourné ;

str_locate(b, "a")
str_locate(b, "w")

14. Retourner toutes les positions du motif a dans la chaîne b ;

str_locate_all(b, "a")

15. En utilisant la fonction str_replace(), remplacer la première occurence du motif a, par le motif
Z (afficher le résultat, ne pas modifier phrases) ;

str_replace(b, "a", "Z")

20
Exercice

16. Remplacer toutes les occurences de a par Z dans la chaîne b (afficher le résultat, ne pas modifier
phrases) ;

str_replace_all(b, "a", "Z")

17. Utiliser la fonction str_split() pour séparer la chaîne b en utilisant la virgule comme séparateur
de sous-chaînes ;

str_split(b, ",")

18. Retirer tous les caractères de ponctuation de la chaîne b, puis utiliser la fonction str_trim() sur
le résultat pour retirer les caractères blancs du début et de la fin de la chaîne.

str_replace_all(b, "[:punct:]", "") %>%

str_trim()

Exercice 7 (manipulation de dates)

1. En utilisant la fonction [Link](), stocker la date du 29 août 2015 dans un objet que l’on appellera
d puis afficher la classe de l’objet ;

d <- [Link]("2015-08-29")
class(d)
unclass(d)

2. À l’aide de la fonction appropriée, afficher la date du jour ;

[Link]([Link]())

3. À l’aide de la fonction [Link](), stocker sous forme de date la chaîne de caractères suivante :
29-08-2015 ;

d <- [Link]("29-08-2015", format = "%d-%m-%Y")

4. Utiliser les fonctions [Link]() et [Link] pour stocker la chaîne de caractères 2015-08-29
[Link] sous forme de dates dans des objets nommés d_ct et d_lt respectivement ; utiliser ensuite
la fonction unclass() sur les deux objets pour comparer la façon dont R a stocké l’information :

d_ct <- [Link]("2015-08-29 [Link]")

d_lt <- [Link]("2015-08-29 [Link]")

Les objets POSIXct sont stockés en secondes écoulées depuis le premier janvier 1970, les
objets POSIXlt sont une liste dont les élḿeents correspondent aux comosantes de la date.

21
Exercice 7

unclass(d_ct)
unlist(unclass(d_lt))

Attention, R utilise les paramètres locaux de la machine pour stocker la date :

unclass([Link]("1970-01-01 [Link]"))
unclass([Link]("1970-01-01 [Link]", tz = "UTC"))

5. Utiliser la fonction appropriée du package lubridate pour stocker la chaîne de caractères 2015-08-29
sous forme de date ;

library(lubridate)
d_l <- ymd("2015-08-29")
class(d_l)

6. Même question avec la chaîne 2015-08-29 [Link] ;

ymd_hms("2015-08-29 [Link]")

7. Utiliser la fonction ymd_hms() pour stocker la date et l’heure actuelle, en précisant le fuseau horaire,
puis afficher la date et l’heure correspondantes à New York City ;

date_paris <- ymd_hms([Link](), tz = "Europe/Paris")

with_tz(date_paris, "America/New_York")

8. Considérons le vecteur x :

x <- c(ymd_hms("2015-08-29 [Link]", tz = "Europe/Paris"),

ymd_hms("2015-09-15 [Link]", tz = "Europe/Paris"))

Extraire l’année, le mois, le jour, les heures, les minutes et les secondes du premier élément de x à
l’aide des fonctions appropriées du package lubridate ;

year(x[1])
month(x[1])
day(x[1])
hour(x[1])
minute(x[1])
second(x[1])

9. Appliquer les mêmes fonctions au vecteur x ;

Les fonctions de la question précd́ente sont vectorisées.

22
Exercice

year(x)
month(x)
day(x)
hour(x)
minute(x)
second(x)

10. Au premier élément de x, ajouter :

— une seconde,

Les questions qui suivent permettent de voir la différence entre l’ajout de durées ou
d’époques. Les époques ne prennent pas en compte les années bissextiles. Pour ajouter
une durée, il suffit d’utiliser la fonction appropriée du package lubridate, dont le nom
correspond à la durée au pluriel, et fournir en paramètre la valeur souhaitée. Pour les
époques, il suffit de rajouter le préfixe d au nom de la fonction.
x[1] + 1
x[1] + seconds(1)

— un jour,

x[1] + days(1)

— un mois

x[1] + months(1)

— deux années ;

x[1] + years(2)
x[1] + dyears(2)
On voit bien la différence entre une durée et une époque ici, puisque l’année 2016 est
bissextile :
leap_year(2016)

11. Tester si la date du premier élément de x vient avant celle du second élément ;

x[1] < x[2]

12. En utilisant la fonction new_interval() du package lubridate, créer un intervalle de dates entre
les deux éléments de x, puis afficher le nombre de jours, puis le nombre d’heures, puis le nombre
d’années séparant les deux dates ;

new_interval(x[1], x[2]) / ddays(1)

new_interval(x[1], x[2]) / dhours(1)
new_interval(x[1], x[2]) / dyears(1)

13. En utilisant la fonction seq(), créer une séquence de dates avec un intervalle de 5 jours entre
chaque date, commençant à la date du premier élément de x et se terminant à la date du second
élément de x (la séquence sera tronquée avant) ;

23
Exercice 7

seq(x[1], x[2], by = "5 days")

14. Convertir en date les deux chaînes de caracères suivantes : Sam 29 Août 2015 et Sat 29 Aug
2015 ;

parse_date_time("Sam 29 Août 2015", orders = "dmy", locale="fr_fr")

parse_date_time("Sat 29 Aug 2015", orders = "dmy", locale="en_gb")

Sous Windows, le paramètre locale doit prendre une valeur différente :

parse_date_time("Sam 29 Août 2015", orders = "dmy", locale="french_fr")
parse_date_time("Sat 29 Aug 2015", orders = "dmy", locale="english_gb")

Vous aimerez peut-être aussi

Série de TD N°2: Comptabilité Générale II (Semestre 2)
Pas encore d'évaluation
Série de TD N°2: Comptabilité Générale II (Semestre 2)
5 pages
Wa0004
Pas encore d'évaluation
Wa0004
4 pages
Taux d'escompte et placements financiers
Pas encore d'évaluation
Taux d'escompte et placements financiers
8 pages
Balance des paiements : structure et analyse
Pas encore d'évaluation
Balance des paiements : structure et analyse
7 pages
Exercices de Probabilités et Statistiques S3
Pas encore d'évaluation
Exercices de Probabilités et Statistiques S3
2 pages
Analyse des Investissements : VAN et TIR
Pas encore d'évaluation
Analyse des Investissements : VAN et TIR
15 pages
Examen Final Maths Financières
Pas encore d'évaluation
Examen Final Maths Financières
2 pages
GOP Exercice PDF
Pas encore d'évaluation
GOP Exercice PDF
6 pages
2021 Examen Final MF
Pas encore d'évaluation
2021 Examen Final MF
2 pages
Taux de Croissance et Indices de Production
Pas encore d'évaluation
Taux de Croissance et Indices de Production
16 pages
Concepts Statistiques et Corrélation
Pas encore d'évaluation
Concepts Statistiques et Corrélation
3 pages
Analyse des Soldes Intermédiaires de Gestion
Pas encore d'évaluation
Analyse des Soldes Intermédiaires de Gestion
27 pages
Chapter2 PDF
Pas encore d'évaluation
Chapter2 PDF
66 pages
Avances à 7 jours et politique monétaire
Pas encore d'évaluation
Avances à 7 jours et politique monétaire
5 pages
Cas IR
Pas encore d'évaluation
Cas IR
5 pages
Coût de maintenance des véhicules utilitaires
100% (1)
Coût de maintenance des véhicules utilitaires
2 pages
Examen Spss Le s5 2018
Pas encore d'évaluation
Examen Spss Le s5 2018
3 pages
Analyse des Composantes Principales 2022
Pas encore d'évaluation
Analyse des Composantes Principales 2022
2 pages
Comptabilité analytique pour ELECJEUX SARL
100% (2)
Comptabilité analytique pour ELECJEUX SARL
2 pages
Controle Continu 1 MATH FIN 1er MGT
Pas encore d'évaluation
Controle Continu 1 MATH FIN 1er MGT
1 page
Analyse financière : exercices pratiques 2023
Pas encore d'évaluation
Analyse financière : exercices pratiques 2023
8 pages
Modèle de régression linéaire simple
Pas encore d'évaluation
Modèle de régression linéaire simple
24 pages
Analyse des Contrôles et Intérêts Financiers
100% (1)
Analyse des Contrôles et Intérêts Financiers
2 pages
TD 1 Marche de Capitaux
Pas encore d'évaluation
TD 1 Marche de Capitaux
3 pages
Exercice corrigé de gestion de patrimoine
100% (1)
Exercice corrigé de gestion de patrimoine
1 page
Répartition des Bénéfices en SA
100% (3)
Répartition des Bénéfices en SA
2 pages
Optimisation du Budget de Production
Pas encore d'évaluation
Optimisation du Budget de Production
3 pages
Activités Corrigées Du Chapitre Imputation Rationnelle
Pas encore d'évaluation
Activités Corrigées Du Chapitre Imputation Rationnelle
7 pages
Changement Organisationnel: Enjeux et Facteurs
Pas encore d'évaluation
Changement Organisationnel: Enjeux et Facteurs
8 pages
Analyse des impacts du Covid-19 sur l'économie
Pas encore d'évaluation
Analyse des impacts du Covid-19 sur l'économie
25 pages
TD-Budget de Trésorerie
Pas encore d'évaluation
TD-Budget de Trésorerie
2 pages
Exercices sur Dépréciation et Actifs
Pas encore d'évaluation
Exercices sur Dépréciation et Actifs
4 pages
Exercice 1.: A. Ezziani M. Laaraj
100% (1)
Exercice 1.: A. Ezziani M. Laaraj
2 pages
TD 7 Emprunt Indivis
100% (1)
TD 7 Emprunt Indivis
2 pages
Pr. AIT CHEIKH - Cours - S2 - Mathématiques Financières - FSJES - Casablanca Ain Chock - Chap - 4
Pas encore d'évaluation
Pr. AIT CHEIKH - Cours - S2 - Mathématiques Financières - FSJES - Casablanca Ain Chock - Chap - 4
33 pages
Exercices 2023-2024 Pig
Pas encore d'évaluation
Exercices 2023-2024 Pig
5 pages
TD Math Fin S2 Solution
Pas encore d'évaluation
TD Math Fin S2 Solution
4 pages
Comprendre le Bilan Fonctionnel
Pas encore d'évaluation
Comprendre le Bilan Fonctionnel
12 pages
Intérêts Simples et Composés en Finance
Pas encore d'évaluation
Intérêts Simples et Composés en Finance
2 pages
Cours 6 Emprunts Obligataires
Pas encore d'évaluation
Cours 6 Emprunts Obligataires
14 pages
Note de Synthèse Economie PDF
Pas encore d'évaluation
Note de Synthèse Economie PDF
8 pages
TD1e2 05 PDF
Pas encore d'évaluation
TD1e2 05 PDF
3 pages
Examen Statistique Descriptive 2018
Pas encore d'évaluation
Examen Statistique Descriptive 2018
2 pages
Analyse des Écarts de Coût de Production
Pas encore d'évaluation
Analyse des Écarts de Coût de Production
3 pages
Formulaire de Macroéconomie Complet 1
100% (1)
Formulaire de Macroéconomie Complet 1
4 pages
ANNEXES ESG Avec Retraitements
Pas encore d'évaluation
ANNEXES ESG Avec Retraitements
2 pages
Exercice Régression Multiple PDF
Pas encore d'évaluation
Exercice Régression Multiple PDF
10 pages
Emprunt
Pas encore d'évaluation
Emprunt
3 pages
TD: Série N°1: Exercice 1
Pas encore d'évaluation
TD: Série N°1: Exercice 1
1 page
Série D'exercice Provisions
Pas encore d'évaluation
Série D'exercice Provisions
4 pages
Reporting et Modélisation des Taux au Maroc
Pas encore d'évaluation
Reporting et Modélisation des Taux au Maroc
108 pages
Gestion des Grands Livres Auxiliaires
Pas encore d'évaluation
Gestion des Grands Livres Auxiliaires
33 pages
Exercice Sur Le Management Des Couts
100% (1)
Exercice Sur Le Management Des Couts
3 pages
Analyse des charges en comptabilité
Pas encore d'évaluation
Analyse des charges en comptabilité
9 pages
Manipulation de données avec R : TP1 ETL
100% (1)
Manipulation de données avec R : TP1 ETL
11 pages
Exercices Donnees
Pas encore d'évaluation
Exercices Donnees
5 pages
Cours Introductif À R IMSP 2024
Pas encore d'évaluation
Cours Introductif À R IMSP 2024
52 pages
Exercices R pour débutants en programmation
Pas encore d'évaluation
Exercices R pour débutants en programmation
4 pages
Serveur NAS
100% (1)
Serveur NAS
11 pages
Statistique 2020 L1 S1 El Ment 1 E
Pas encore d'évaluation
Statistique 2020 L1 S1 El Ment 1 E
17 pages
Exemples de manipulations de tableaux en C
Pas encore d'évaluation
Exemples de manipulations de tableaux en C
8 pages
الامتحان الوطني في المواد المهنية 1 2023 مسلك الصيانة المعلوماتية والشبكات الدورة العادية
Pas encore d'évaluation
الامتحان الوطني في المواد المهنية 1 2023 مسلك الصيانة المعلوماتية والشبكات الدورة العادية
22 pages
Chaînes de caractères en Python
Pas encore d'évaluation
Chaînes de caractères en Python
22 pages
PSB PGE Guide Metiers Data Management
Pas encore d'évaluation
PSB PGE Guide Metiers Data Management
7 pages
Pfe
Pas encore d'évaluation
Pfe
22 pages
Expert en Vision par Ordinateur et Deep Learning
Pas encore d'évaluation
Expert en Vision par Ordinateur et Deep Learning
1 page
EAD - 5éme-Act 1
Pas encore d'évaluation
EAD - 5éme-Act 1
2 pages
Tableau Suivi Budget
Pas encore d'évaluation
Tableau Suivi Budget
12 pages
Resumé Automate Programmable Industriel
Pas encore d'évaluation
Resumé Automate Programmable Industriel
2 pages
Programme de Formation BTS Cybersecurite Informatique Et Reseaux Electronique
Pas encore d'évaluation
Programme de Formation BTS Cybersecurite Informatique Et Reseaux Electronique
20 pages
Correction Etude de Cas CAISSE Demarche-UP-XP-caisse-1
80% (10)
Correction Etude de Cas CAISSE Demarche-UP-XP-caisse-1
50 pages
Cybersécurité: Sécurité Informatique Et Réseaux
100% (2)
Cybersécurité: Sécurité Informatique Et Réseaux
30 pages
5 Nb-Nbval-Nb Vide-Nb Si-Nb Si - Ens
Pas encore d'évaluation
5 Nb-Nbval-Nb Vide-Nb Si-Nb Si - Ens
18 pages
Tableaux en C++ : Statique et Dynamique
Pas encore d'évaluation
Tableaux en C++ : Statique et Dynamique
10 pages
Hardware et Software : Définitions et Rôles
Pas encore d'évaluation
Hardware et Software : Définitions et Rôles
2 pages
Architecture Java en Couches Logicielles
100% (1)
Architecture Java en Couches Logicielles
5 pages
Rapport de Stagee
Pas encore d'évaluation
Rapport de Stagee
109 pages
Exporter et importer un agenda Webmail
Pas encore d'évaluation
Exporter et importer un agenda Webmail
8 pages
Affectaion Ensias
Pas encore d'évaluation
Affectaion Ensias
42 pages
Exercices Circuits Logiques 3 Bits
100% (1)
Exercices Circuits Logiques 3 Bits
9 pages
Introduction au codage de l'information
Pas encore d'évaluation
Introduction au codage de l'information
98 pages
Script de désynchronisation pour Roblox
Pas encore d'évaluation
Script de désynchronisation pour Roblox
1 page
Sécurité et gestion des employés TSI
Pas encore d'évaluation
Sécurité et gestion des employés TSI
11 pages
TP Automates et Commandes Discrètes
100% (1)
TP Automates et Commandes Discrètes
24 pages
Introduction à l'informatique et ses composants
Pas encore d'évaluation
Introduction à l'informatique et ses composants
27 pages
Communication interprocessus en C
Pas encore d'évaluation
Communication interprocessus en C
6 pages
Niveaux de Support Informatique Clairement Expliqués L1, L2, L3 Et Plus.
Pas encore d'évaluation
Niveaux de Support Informatique Clairement Expliqués L1, L2, L3 Et Plus.
8 pages
Documentation des Solutions Informatiques
Pas encore d'évaluation
Documentation des Solutions Informatiques
2 pages