TD4 – FILTRES
1 Objectifs
Comprendre comment sélectionner les variables utiles.
Comprendre comment sélectionner les observations utiles.
2 Organisation du travail
2.1 Téléchargement des fichiers
Télécharger dans l’espace de cours sur Moodle les fichiers suivants :
1. TD4 – [Link]
À enregistrer dans le répertoire « R\Documents ».
2. TD4 – Filtres – Démonstration.R
À enregistrer dans le répertoire « R\Programmes ».
2.2 Cours
Les explications correspondant à cette séance sont dans le support de cours pages 31 à 37.
2.3 Packages nécessaires
Les packages à utiliser dans cette séance sont :
• tidyverse
3 Démonstration
3.1 Sélection des variables
1. Créer le data frame suivant :
id nom_etudiant parcours_etudiant note_etudiant_stat_1 note_etudiant_stat_2
ID1 Emma EMS 18 14
ID2 Romain VCOD 15 17
ID3 Maxime EMS 17 15
ID4 Inès VCOD 16 16
2. Créer des data frames conservant :
a. La variable « id ».
b. Les variables « id », « nom_etudiant » et « note_etudiant_stat_1 ».
c. Toutes les variables contenant « etudiant ».
d. Toutes les variables ne contenant pas « etudiant ».
e. La variable « id » et toutes les variables commençant par « note ».
f. Toutes les variables se terminant par « etudiant ».
g. Toutes les variables positionnées de « nom_etudiant » à « note_etudiant_stat_1 ».
3. Créer des data frames supprimant :
a. La variable « nom_etudiant ».
b. Les variables « nom_etudiant » et « parcours_etudiant ».
c. Toutes les variables contenant « etudiant ».
JEAN-PHILIPPE KIENNER LANGAGE R 2
3.2 Filtres sur les observations
3.2.1 Filtres simples
1. Créer le data frame suivant :
id salaire ville date_naissance
ID1 30000 Paris 20/03/2000
ID2 25000 Bordeaux 08/06/2001
ID3 50000 Toulouse 29/10/2003
ID4 40000 Amiens 01/04/2001
ID5 35000 Nouméa 25/07/2002
2. Filtres sur une variable numérique – Créer des data frames conservant :
a. Les individus gagnant plus de 30000 €.
b. Les individus gagnant 30000 € ou moins.
c. Les individus gagnant 30000 €.
d. Les individus ne gagnant pas 30000 €.
3. Filtres sur une variable caractère – Créer des data frames conservant :
a. Les individus habitant Paris.
b. Les individus n’habitant pas Paris.
c. Les individus habitant Paris ou Amiens.
d. Les individus n’habitant pas Paris ni Amiens.
e. Les individus habitant dans une ville dont le nom contient « a ».
f. Les individus habitant dans une ville dont le nom commence par « a ».
g. Les individus habitant dans une ville dont le nom commence par « A ».
h. Les individus habitant dans une ville dont le nom se termine par « a ».
4. Filtres sur une variable date – Créer des data frames conservant :
a. Les individus nés le 08/06/2001.
b. Les individus nés à partir du 08/06/2001.
3.2.2 Filtres combinés
1. Créer un data frame conservant les individus gagnant plus de 30000 € et n’habitant pas à
Nouméa.
2. Créer un data frame conservant les individus gagnant au moins 40000 € ou habitant à Paris.
JEAN-PHILIPPE KIENNER LANGAGE R 3
4 Exercices
4.1 Introduction
Après avoir importé les données des locations de logements dans 3 data frames (cf. TD3) l’objectif
de cet exercice est de mettre en œuvre des filtres qui permettront de ne conserver que les
données utiles à l’étude.
4.2 Chargement des tables
Les tables avaient bien été importées lors du TD3, il faut les recharger dans l’environnement R.
load(file = "Sauvegardes/Etude_Locations_TD3.Rdata")
4.3 Filtres
1. À partir du data frame « logements_entiers », créer les data frames suivants :
a. Logements du quartier Vaugirard.
b. Logements pouvant accueillir au moins 4 personnes.
c. Logements du 16ème arrondissement coûtant moins de 50€.
d. Logements avec une seule chambre
i. Situés dans le quartier Vaugirard coûtant moins de 40€ ;
ii. Ou situés dans le quartier Louvre coûtant plus de 60€.
e. Logements équipés d’un ascenseur, en conservant uniquement les variables
« id_logement », « quartier », « prix », « liste_equipements » et les variables dont le nom
commence par « nb ».
2. À partir du data frame « proprietaires », créer les data frames suivants :
a. Logements dont le propriétaire a un « w » ou un « W » dans son nom.
b. Logements dont le nom du propriétaire commence par un « c » ou un « C ».
c. Logements dont le propriétaire s’est inscrit entre le 09/10/2010 et le 24/02/2014.
JEAN-PHILIPPE KIENNER LANGAGE R 4