U2 PGE – Cours : Statistiques
PARTIEL BLANC
Documents interdits
Calculatrices non programmables autorisées
PARTIE 1 : Exercices de calculs (10 points)
Exercice 1 (3 points)
Afin d’évaluer l’avis des étudiants vis-à-vis du cours de statistiques, une étude auprès de 146 étudiants
de 2ère année en 2021-2022 a été réalisée. Les étudiants, sélectionnés de façon aléatoire, ont été
interrogés afin de savoir si ce cours était utile à leur carrière. Le tableau suivant représente la note
donnée (1 = pas du tout d’accord et 10 = entièrement d’accord) et l’effectif correspondant.
Note 1 2 3 4 5 6 7 8 9 10
Nombre
10 12 15 22 25 20 17 12 8 5
d’étudiants
Questions :
1. Déterminer la note moyenne et la note médiane. Interpréter. (1 point)
2. Calculer l’écart-type (d’échantillon) de la note. Interpréter (Astuce : Vous pouvez comparer cet
écart-type à la note moyenne). (1,5 points)
3. Quel est le pourcentage d’étudiants donnant une note < 5 ? (0,5 point)
Exercice 2 (3,5 points)
Après avoir appliqué différentes politiques de promotion durant le mois de février, la direction d’une
entreprise commercialisant des produits cosmétiques souhaite connaitre le score de satisfaction des
clients (mesuré par une note sur 10). Une étude sur un échantillon de 400 clients a été réalisée par le
département Marketing. D’après cette étude, le score moyen donné par les clients est de 8,5 avec une
variance empirique de 36.
Questions :
1. Au niveau de risque de 5%, est-ce qu’on peut conclure que le score moyen du mois de février est
différent de celui du mois précédent, qui était de 7,9 ? Justifiez votre réponse en détaillant les
différentes étapes du test appliqué. (2 points)
2. Votre conclusion à la question 1 change-t-elle avec un seuil de risque de 1% ? (0,5 point)
3. Est-ce qu’il est pertinent de penser qu’au seuil de risque de 1%, le score moyen du mois de février
est plus élevé que celui du mois précédent ? (1 point)
Exercice 3 (3,5 points)
1
Durant la crise du Covid 19, de nombreux salariés ont été licenciés ou mis au chômage partiel. Afin
d’évaluer si l’impact de cette crise sur le nombre de licenciements est identique entre les trois secteurs
primaire, secondaire et tertiaire, une étude auprès de 600 entreprises d’un pays a été réalisée. Le
tableau ci-dessous fournit quelques statistiques principales :
Primaire Secondaire Tertiaire
Nombre moyen de licenciements (par entreprise) 15 17 27
2
Somme des carrés (∑(𝑥𝑖𝑗 − 𝑥̅𝑖 ) ) 36 30 39
Nombre d'entreprises 200 200 200
Questions :
1. A votre avis, quelle méthode devrait-on utiliser pour répondre au problème posé ? (0,5 point)
2. Formulez l’hypothèse nulle et l’hypothèse alternative. (1 point)
3. Au seuil de risque de 5%, quelle est votre conclusion ? Détaillez votre réponse en précisant les
différentes étapes du test utilisé. (1,5 points)
4. Votre conclusion est-elle identique pour un seuil de risque de 10% ? (0,5 point)
PARTIE 2 : Commentaires et interprétations d’analyses sur bases de données (10
points)
Exercice 1 (1,5 points)
Le tableau ci-après fournit des indicateurs statistiques relatifs au taux de croissance annuel (en %) du
chiffre d'affaires d'un échantillon d'entreprises américaines entre 2019 et 2020.
Question : Rédiger de manière précise et synthétique un commentaire statistique pour les 3 indicateurs
suivants du tableau : médiane, 1er décile, 3ième quartile. (0,5 point par indicateur)
Tableau : Indicateurs statistiques relatifs au taux de croissance annuel (en %) du chiffre d'affaires
d'entreprises américaines entre 2019 et 2020
2
Exercice 2 (1,5 points)
Les trois graphiques ci-après décrivent les distributions de l'espérance de vie (en années) des habitants
des pays développés d'une part et des pays en voie de développement d'autre part. Les données ont été
recueillies entre 2000 et 2015.
Question : Analyser et comparer les distributions des espérances de vie entre les deux catégories de
pays en soulignant les similitudes ou différences notables. Il conviendra d’appuyer l’analyse à l’aide
d’informations et de chiffres appropriés.
Graphique : Distribution de l'espérance de vie dans les pays développés
Graphique : Distribution de l'espérance de vie dans les pays en développement
3
Graphique : Distribution de l'espérance de vie dans les pays développés et les pays en développement
Exercice 3 (1 point)
Une entreprise de télécommunications réalise une étude sur l’ensemble du mois de mars 2022 au sujet
du phénomène de perte de clients, dit « churn » en anglais. L’échantillon considéré porte sur 7043
individus qui étaient clients de l’entreprise début mars, et dont on relève le statut fin mars (toujours
clients ou pas).
Le tableau croisé ci-après répartit les 7043 clients en fonction des deux variables suivantes :
• Churn : variable indicatrice binaire prenant la valeur "Yes" si un individu a cessé d’être client de
l’entreprise pendant le mois de mars, "No" s’il est toujours client à fin mars.
• Contract : variable qualitative à 3 modalités désignant le type de contrat qui lie un client à
l’entreprise. Month-to-month désigne un contrat à libre renouvellement mensuel, One year désigne
un abonnement d’un an, Two year désigne un abonnement de deux ans.
Question : Rédiger de manière synthétique et précise un commentaire statistique pour chacune des 4
valeurs repérées par le marquage couleur dans le tableau. (0,25 point par valeur)
Tableau : Tableau croisé entre « Churn » et « Contract »
4
Exercice 4 (2 points)
Une banque a réalisé une action commerciale par téléphone auprès de 31647 prospects consistant à
proposer d’investir dans un nouveau produit financier dit « durable ». Les résultats de l’action
commerciale sont ensuite analysés en croisant les deux variables ci-après.
Variables étudiées :
• Subscribed : variable indicatrice binaire prenant la valeur "yes" si un prospect a accepté la
proposition commerciale, "no" s’il l'a refusée
• Job : variable qualitative désignant le type d’emploi occupé par le prospect
Remarques sur les jobs :
• « blue-collar » = ouvrier
• « housemaid » = femme de ménage
• « retired »= retraité
• « unemployed » = chômeur
• « unknown » = emploi non communiqué
Questions :
• Evaluer s’il existe une association entre les types d’emplois des prospects et la réponse donnée à la
proposition commerciale en retenant un seuil de risque de 5%. (1 point)
• Indiquer les 2 types d’emplois les plus favorables et les 2 types d’emplois les plus défavorables à
l’acceptation de l’offre commerciale. (1 point)
Il conviendra de justifier les réponses à l’aide d’informations et de chiffres appropriés.
Tableau : Tableau croisé entre « job » et « subscribed »
5
Tableau : Test du Khi-2 d’association entre « job » et « subscribed »
6
Exercice 5 (2 points)
A partir d'un échantillon de courses de passagers réalisées par Uber sur plusieurs mois dans une ville
européenne, une analyse de corrélation est menée entre le prix d'une course (en euros) et la distance
parcourue (en km) par course. Les résultats sont fournis ci-après.
Questions :
• Rédiger de manière précise une interprétation statistique du coefficient de corrélation et de la
significativité associée entre les deux variables. Le seuil de risque est de 5%. (1 point)
• Est-ce que ce résultat vous parait cohérent ou surprenant d'un point de vue pratique ? Expliquer
brièvement. (0,5 point)
• Est-ce que la forme du nuage de points parait cohérente avec le résultat de l’analyse de corrélation
? Expliquer brièvement. (0,5 point)
Tableau : Corrélation entre le prix d'une course et la distance parcourue
Graphique : Nuage de points entre le prix d'une course et la distance parcourue
Exercice 6 (2 points)
La gérante de 5 restaurants d’une chaîne de fast-food se demande si le chiffre d’affaires par jour (CA
total) de ses restaurants est lié aux jours de la semaine. Une ANOVA a été menée en prenant les
données quotidiennes de 2021 et les résultats (tableaux et graphiques) sont présentés ci-après.
Les jours de la semaine sont catégorisés en 7 modalités : lundi, mardi, mercredi, jeudi, vendredi,
samedi, dimanche.
Questions :
7
• Evaluer s'il existe une différence de CA quotidien moyen entre les jours de semaine au seuil de
risque de 5%. (0,75 point)
• A quoi correspondent dans ce contexte précis la variance inter-groupes et la variance intra-
groupes ? (0,5 point)
• Commenter la nature et l'ampleur des différences de moyennes. (0,75 point)
Justifiez vos réponses avec les informations et chiffres appropriés.
Tableau : Valeur moyenne du CA quotidien selon le jour de la semaine
Table : Table ANOVA entre le CA quotidien et le jour de la semaine
Graphique : Valeur moyenne du CA quotidien selon le jour de la semaine