0% ont trouvé ce document utile (0 vote)
116 vues4 pages

Introduction à R et Big Data

Transféré par

Abdramane Cissé
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
116 vues4 pages

Introduction à R et Big Data

Transféré par

Abdramane Cissé
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd

Par Cisse Abdramane

L3 DGL IPSmart

Evaluation
Introduction au Big Data, R, RStudio

1. Quel est le rôle principal de R ?

a) Traitement de texte

b) Cálcul statistique et graphique

c) Conception de sites web

) Gestion de base de données relationnelles

2. Quelle extension de fichier est généralement utilisée pour enregistrer les scripts R ?

a) .txt

b) .R

c) .py

d) .csv

3. A quoi sert RStudio ?

a) Un navigateur web

b) Un environnement de développement intégré (IDE) pour R

c) Un logiciel de traitement de données volumineuses

d) Un service de cloud computing

4. Qu'est-ce que le Big Data ?


Par Cisse Abdramane
L3 DGL IPSmart

a) Un type de fromage

b) Des données stockées dans un cloud

c) Des ensembles de données volumineuses, complexes et à croissance rapide

d) Un synonyme de "base de données"

5. Lequel de ces éléments NE fait PAS partie du tidyverse ?

a) ggplot2 (pour la visualisation)

b) dplyr (pour la manipulation de données)

c) tidyr (pour la transformation de données)

d) readxl (pour la lecture de données Excel)

Correction: d) readxl (pour la lecture de données Excel) - readxl est un package séparé du
tidyverse, bien qu'il soit fréquemment utilisé avec.

6. Quelle commande de base permet d'afficher les premières lignes d'un data frame dans
R?

a) show(data) b) head(data) c) print(data) d) view(data)

Correction: b) head(data)

7. Quelle fonction permet de calculer la moyenne d'une variable numérique dans un data
frame R ?

a) sum(data$variable)

b) count(data$variable)

c) mean(data$variable)

d) median(data$variable)

8. Comment filtrer un data frame R pour ne garder que les lignes répondant à une
certaine condition ?
Par Cisse Abdramane
L3 DGL IPSmart

a) select(data, condition)

b) filter(data, condition)

c) mutate(data, condition)

d) arrange(data, condition)

9. R est un logiciel:

a) Propriétaire et payant

b) Open source et gratuit

10. Le langage utilisé dans RStudio est:

a) Python

b) Java

c) R

11. Parmi les propositions suivantes, laquelle n'est PAS un avantage d'utiliser RStudio
par rapport à R ?

a) Interface utilisateur graphique (GUI)

b) Coloration syntaxique du code

c) Gestionnaire d'historique des commandes

d) RStudio est plus rapide qu'R

Correction: d) RStudio est plus rapide que R (RStudio est un IDE qui facilite l'utilisation de R,
mais le langage R lui-même est exécuté à la même vitesse)

12. Le package ggplot2 est utilisé pour:

a) La manipulation de données

b) La création de graphiques
Par Cisse Abdramane
L3 DGL IPSmart

c) Le calcul statistique

d) La lecture/écriture de fichiers

13. Le package dplyr est utilisé pour:

a) La manipulation de données

b) La création de graphiques

c) Le calcul statistique

d) La lecture/écriture de fichiers

14. Le terme "Cloud Computing" désigne:

a) Un type de logiciel

b) Une façon de stocker des données sur internet

c) Un langage de programmation

d) Un processeur très puissant

Vous aimerez peut-être aussi