0% ont trouvé ce document utile (0 vote)
33 vues4 pages

TD4 - Filtres

Le document présente un TD sur les filtres en langage R, visant à sélectionner des variables et des observations utiles. Il inclut des instructions pour le téléchargement de fichiers, des démonstrations de création de data frames, ainsi que des exercices pratiques sur l'application de filtres. Les participants doivent utiliser le package 'tidyverse' et se référer aux pages 31 à 37 du support de cours pour les explications.
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
33 vues4 pages

TD4 - Filtres

Le document présente un TD sur les filtres en langage R, visant à sélectionner des variables et des observations utiles. Il inclut des instructions pour le téléchargement de fichiers, des démonstrations de création de data frames, ainsi que des exercices pratiques sur l'application de filtres. Les participants doivent utiliser le package 'tidyverse' et se référer aux pages 31 à 37 du support de cours pour les explications.
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

TD4 – FILTRES

1 Objectifs
Comprendre comment sélectionner les variables utiles.
Comprendre comment sélectionner les observations utiles.

2 Organisation du travail
2.1 Téléchargement des fichiers
Télécharger dans l’espace de cours sur Moodle les fichiers suivants :

1. TD4 – [Link]
 À enregistrer dans le répertoire « R\Documents ».

2. TD4 – Filtres – Démonstration.R


 À enregistrer dans le répertoire « R\Programmes ».

2.2 Cours
Les explications correspondant à cette séance sont dans le support de cours pages 31 à 37.

2.3 Packages nécessaires


Les packages à utiliser dans cette séance sont :
• tidyverse
3 Démonstration
3.1 Sélection des variables
1. Créer le data frame suivant :
id nom_etudiant parcours_etudiant note_etudiant_stat_1 note_etudiant_stat_2
ID1 Emma EMS 18 14
ID2 Romain VCOD 15 17
ID3 Maxime EMS 17 15
ID4 Inès VCOD 16 16

2. Créer des data frames conservant :


a. La variable « id ».
b. Les variables « id », « nom_etudiant » et « note_etudiant_stat_1 ».
c. Toutes les variables contenant « etudiant ».
d. Toutes les variables ne contenant pas « etudiant ».
e. La variable « id » et toutes les variables commençant par « note ».
f. Toutes les variables se terminant par « etudiant ».
g. Toutes les variables positionnées de « nom_etudiant » à « note_etudiant_stat_1 ».

3. Créer des data frames supprimant :


a. La variable « nom_etudiant ».
b. Les variables « nom_etudiant » et « parcours_etudiant ».
c. Toutes les variables contenant « etudiant ».

JEAN-PHILIPPE KIENNER LANGAGE R 2


3.2 Filtres sur les observations
3.2.1 Filtres simples

1. Créer le data frame suivant :


id salaire ville date_naissance
ID1 30000 Paris 20/03/2000
ID2 25000 Bordeaux 08/06/2001
ID3 50000 Toulouse 29/10/2003
ID4 40000 Amiens 01/04/2001
ID5 35000 Nouméa 25/07/2002

2. Filtres sur une variable numérique – Créer des data frames conservant :
a. Les individus gagnant plus de 30000 €.
b. Les individus gagnant 30000 € ou moins.
c. Les individus gagnant 30000 €.
d. Les individus ne gagnant pas 30000 €.

3. Filtres sur une variable caractère – Créer des data frames conservant :
a. Les individus habitant Paris.
b. Les individus n’habitant pas Paris.
c. Les individus habitant Paris ou Amiens.
d. Les individus n’habitant pas Paris ni Amiens.
e. Les individus habitant dans une ville dont le nom contient « a ».
f. Les individus habitant dans une ville dont le nom commence par « a ».
g. Les individus habitant dans une ville dont le nom commence par « A ».
h. Les individus habitant dans une ville dont le nom se termine par « a ».

4. Filtres sur une variable date – Créer des data frames conservant :
a. Les individus nés le 08/06/2001.
b. Les individus nés à partir du 08/06/2001.

3.2.2 Filtres combinés

1. Créer un data frame conservant les individus gagnant plus de 30000 € et n’habitant pas à
Nouméa.

2. Créer un data frame conservant les individus gagnant au moins 40000 € ou habitant à Paris.

JEAN-PHILIPPE KIENNER LANGAGE R 3


4 Exercices
4.1 Introduction
Après avoir importé les données des locations de logements dans 3 data frames (cf. TD3) l’objectif
de cet exercice est de mettre en œuvre des filtres qui permettront de ne conserver que les
données utiles à l’étude.

4.2 Chargement des tables


Les tables avaient bien été importées lors du TD3, il faut les recharger dans l’environnement R.

load(file = "Sauvegardes/Etude_Locations_TD3.Rdata")

4.3 Filtres
1. À partir du data frame « logements_entiers », créer les data frames suivants :
a. Logements du quartier Vaugirard.
b. Logements pouvant accueillir au moins 4 personnes.
c. Logements du 16ème arrondissement coûtant moins de 50€.
d. Logements avec une seule chambre
i. Situés dans le quartier Vaugirard coûtant moins de 40€ ;
ii. Ou situés dans le quartier Louvre coûtant plus de 60€.
e. Logements équipés d’un ascenseur, en conservant uniquement les variables
« id_logement », « quartier », « prix », « liste_equipements » et les variables dont le nom
commence par « nb ».

2. À partir du data frame « proprietaires », créer les data frames suivants :


a. Logements dont le propriétaire a un « w » ou un « W » dans son nom.
b. Logements dont le nom du propriétaire commence par un « c » ou un « C ».
c. Logements dont le propriétaire s’est inscrit entre le 09/10/2010 et le 24/02/2014.

JEAN-PHILIPPE KIENNER LANGAGE R 4

Vous aimerez peut-être aussi