2023/2024 Examen Universite Sultan Moulay Slimane
Filière: IDS Statistique et Analyse de Données EST de Fkih Ben Salah
Nom : .................................
Prénom : ...................................
Exercice 1:
Entourer la bonne réponse (un seul choix est possible)
1 Quel est l’objectif principal de l’Analyse en Composante Principale (ACP) dans l’analyse des
données multivariées ?
a) Réduire la dimensionnalité b) Augmenter la complexité des données c) Accélérer les calculs
statistiques d) Identifier des valeurs aberrantes
2 Comment sont calculées les composantes principales dans l’ACP?
a) En utilisant la méthode des moindres carrés
b) En diagonalisant la matrice de covariance
c) En utilisant la régression logistique
d) En normalisant les données brutes
3 Quelle est l’interprétation la plus appropriée d’une composante principale avec une charge élevée
pour une variable donnée?
a) La variable est peu importante dans la composante principale
b) La variable contribue fortement à la composante principale
c) La variable est négativement corrélée à la composante principale
d) La variable est exclue de la composante principale
4 Comment peut-on déterminer le nombre optimal de composantes principales à retenir lors de l’ACP?
a) En choisissant le nombre de variables dans les données
b) En utilisant la méthode de la somme des carrés des erreurs
c) En se basant sur la variance cumulative expliquée
d) En demandant l’avis d’experts en statistiques
5 Quelle fonction R est utilisée pour installer un package depuis le dépôt CRAN?
a) load()
b) install.packages()
c) library()
d) require()
6 Pour importer un fichier CSV dans R, quelle fonction est généralement utilisée?
a) ’ read.table()’
b) ’import.csv()’
c) ’read.csv()’
d) ’load.csv()’
Prof: Y.FADIL 1/4
7 Quelle fonction R est utilisée pour créer une nouvelle variable basée sur une condition spécifique?
a) ’add variable()’
b) ’modify()’
c) ’mutate()’
d) ’new var()’
8 Quelle fonction R est utilisée pour créer un diagramme en barres?
a) plot()
b) barplot()
c) hist()
d) lineplot()
9 Pour effectuer une régression linéaire simple dans R, quelle fonction est généralement utilisée?
a) lm()
b) regress()
c) linear model()
d) ols()
10 Qu’est-ce qu’une variable aléatoire discrète ?
a) Une variable aléatoire avec une distribution continue
b) Une variable aléatoire prenant des valeurs distinctes avec des probabilités associées
c) Une variable aléatoire constante
d) Une variable aléatoire sans probabilités définies
11 Comment la probabilité conditionnelle est-elle définie?
a) La probabilité qu’un événement se produise indépendamment de tout autre événement
b) La probabilité qu’un événement se produise sachant qu’un autre événement s’est déjà produit
c) La probabilité qu’au moins un événement se produise
d) La probabilité qu’aucun événement ne se produise
12 Quel symbole est utilisé pour assigner une valeur à une variable en R?
a) =
b) < −
c) − >
d) :
13 Comment définissez-vous une fonction en R?
a) function nom fonction(parametres) { }
b) def nom fonction(parametres):
c) function(parametres) => { }
d) func nom fonction(parametres) { }
Prof: Y.FADIL 2/4
14 Quelle fonction du package dplyr est utilisée pour filtrer les observations d’un ensemble de données
en fonction d’une condition?
a) select()
b) mutate()
c) filter()
d) summarise()
15 Quelle fonction de ggplot2 est utilisée pour créer un diagramme à barres?
a) geom point()
b) geom line()
c) geom bar()
d) geom histogram()
16 Qu’est-ce qu’un tableau croisé dans le contexte de la statistique descriptive bivariée ?
a) Un graphique en barres pour deux variables qualitatives
b) Un résumé numérique des tendances entre deux variables continue
c) Un tableau récapitulatif des fréquences conjointes de deux variables qualitatives
d) Une représentation graphique des corrélations entre deux variables quantitatives
17 Comment déterminez-vous s’il y a une association entre deux variables qualitatives à partir d’un
tableau croisé?
a) En calculant la moyenne des fréquences relatives
b) En regardant la somme des fréquences
c) En observant les différences entre les fréquences observées et attendues
d) En vérifiant les corrélations dans le tableau croisé
18 Quel test statistique est généralement utilisé pour évaluer l’indépendance entre deux variables quali-
tatives?
a) Test t de Student
b) Test ANOVA
c) Test du Chi-carré
d) Test de corrélation de Pearson
19 Quel type de graphique est souvent utilisé pour visualiser les relations entre deux variables qualita-
tives?
a) Histogramme
b) Diagramme en barres
c) Nuage de points
d) Box plot
20 Il est utile en statistique de pouvoir générer des données aléatoires, et R peut le faire pour un grand
nombre de fonctions de densité de probabilité. C’est quoi la forme de la fonction pour indique la loi
de Poisson ?
Prof: Y.FADIL 3/4
a) poisson(lambda, n)
b) pois(n, lambda)
c) rpois(n, lambda)
d) pois(lambda, n)
Exercice 2:
On s’intéresse à la variable ‘état-civil’ notée X et à la série statistique des valeurs prises par X sur 20
personnes. La codification est :
C : célibataire,
M : marié(e),
V : veuf(ve),
D : divorcée.
Le domaine de la variable X est {C, M,V, D}. Considérons la série statistique suivante :
M M D C C M C C C M
C M V M V D C C C M
Ici, n = 20,
x1 = M; x2 = M; x3 = D; x4 = C; x5 = C; ....; x20 = M.
⋇ Écrivez en langage R le tableau statistique de la série ci-dessus, puis affichez le diagramme en
secteurs des fréquences et le diagramme en barres des effectifs.
Prof: Y.FADIL 4/4