Cours Statistiques
Cours Statistiques
DONNEES
But : analyser des données numériques à l’aide des méthodes et des outils
statistiques
1
La statistique est l’ensemble d’outils et de méthodes scientifiques qui permettent de
faire la collecte et le traitement d’un grand nombre de données numériques. Elle
consiste à organiser des données chiffrées sur de grands ensembles, puis à les
commenter. La statistique permet de synthétiser et de résumer de grands volumes de
données, des grandes matrices d’informations.
Dans sa composante traitement de données, la méthode statistique présente deux
aspects :
Remarque: La statistique traite des propriétés des populations plus que des
individus particuliers de ces populations.
Recensement
C’est l’étude de tous les individus d’une population. Difficile en pratique lorsque
les populations sont grandes pour des questions de coût et de temps.
Sondage.
C’est le recueil d’une partie de la population c’est-à-dire l’échantillon. Le recueil
d’un échantillon à partir de la population initiale se fait par des techniques
statistiques, appelées méthodes d’échantillonnage.
L’estimation
L’inférence
statistique
A une variable
Pour déduire (ou plus précisément inférer) Ils permettent, par une prédiction, si
les caractéristiques d’une population, ou une supposition faite au sujet d’un
Les tests d’hypothèses
confirmer des suppositions à son sujet, à paramètre est contredite par les
partir de l’étude d’un échantillon statistiques mesurées sur un
échantillon choisi au hasard
Exemple :
4
En période électorale, on interroge 1 000 personnes sur leur intention de vote. A partir
des résultats obtenus sur cet échantillon, on prévoit, avec une certaine précision, le
comportement de l’ensemble des électeurs (population mère) et par la même, le résultat
des élections. C’est ce qu’on appelle l’inférence statistique et c’est le principe même du
sondage d’opinion par exemple.
5
Une variable est la propriété ou la caractéristique que l’on veut étudier et pour
laquelle on cherche des données au sein de la population. Ainsi, l’âge, le
niveau de scolarité, la note obtenue à un examen, le revenu annuel d’un
ménage sont autant de variables.
les données seraient les valeurs particulières que prennent ces variables pour
chaque individu.
Une variable est dite qualitative lorsque les données qui s’y rapportent sont
des qualités ou des attributs non mesurées par des nombres. Elle est dite non
numérique. Une variable qualitative est dite nominale si aucun lien de
hiérarchie ne peut être établi entre ses modalités ; dans le cas contraire elle
est dite ordinale.
Une variable est dite quantitative lorsque les données qui s’y rapportent sont
le résultat d’un décompte ou d’une mesure numérique, faisant appel aux
propriétés arithmétiques des nombres.
Une variable quantitative est dite discrète (ou discontinue) si elle ne
peut prendre aucune autre valeur entre deux valeurs consécutives.
Généralement, ses valeurs sont le résultat d’un décompte, elles sont
donc connues avec exactitude et sont souvent des entiers.
Une variable quantitative est dite continue si elle peut prendre une
infinité de valeurs entre deux valeurs proches. Ses valeurs sont
souvent le résultat d’une mesure relative à un étalon, sa valeur n’est
donc pas connue avec exactitude, c’est un nombre réel (entier ou
décimal)
Remarque :
Les différents états possibles dans lesquels peuvent se trouver une variable
qualitative sont appelés ses modalités. Par exemple la variable niveau d’étude
a pour modalités niveau primaire, niveau secondaire, niveau supérieur. Dans
le cas d’une variable quantitative on parle plutôt des valeurs de la variable.
6
La variable dépendante est celle qui est étudiée ; c’est celle qui est à
expliquer.
La variable indépendante est un facteur explicatif possible de la variable
étudiée.
.
7
La notion d’échelle de mesure
8
Ce sont des _établir des *le quotient
grandeurs catégories intellectuel
numériques composées *les dates
Les associées à chaque d’éléments qui ont le *la
échelles élément avec les même rang ; température
d’intervalle propriétés suivantes : _ On peut compter le *les horaires
Ces échelles nombre d’individus
supposent le choix dans chaque
d’une unité de catégorie, puis
mesure qui est calculer les rapports,
répartie des proportions et
uniformément sur des pourcentages
l’échelle et à l’aide de _trouver les
laquelle les distances distances entre les
entre les diverses données, puis faire
valeurs sur l’échelle des rapports entre
peuvent être ces distances (mais
évaluées ; le point pas entre les
zéro sur cette données elles-
échelle est mêmes)
arbitraire.
Ce sont des _établir des *la durée
grandeurs catégories d’une
numériques composées émission de
associées à chaque d’éléments qui ont le télévision
Les élément avec les même rang ; *le volume de
échelles propriétés suivantes : _ On peut compter le vente d’un
de rapport Ces échelles nombre d’individus produit
supposent le choix dans chaque *le rapport
d’une unité de catégorie, puis qualité-prix
mesure qui est calculer les rapports, d’un produit.
répartie des proportions et
uniformément sur des pourcentages
l’échelle et à l’aide de _trouver les
laquelle les distances distances entre les
entre les diverses données, puis faire
valeurs sur l’échelle des rapports entre
peuvent être ces distances ;
évaluées ; le point _faire des rapports
zéro sur cette entre les mesures
échelle est absolu. des individus
_on peut utiliser
toutes les
techniques
statistiques.
9
Exercices 1
Parmi les exemples suivants, identifier les variables et dire si elles constituent
dans le contexte une variable dépendante ou indépendante :
a- Dans une étude, on recherche des données sur la nature des articles volés
selon l’emplacement du magasin.
b- Un chercheur en marketing veut vérifier si le groupe culturel a une influence
sur le moment où des enfants atteignent les différents stades de
développement selon la théorie de Piaget. Il fait passer quatre épreuves de
Piaget à trois groupes d’enfants de 10 ans, d’ethnies différentes.
c- On veut mesurer l’effet d’une nouvelle méthode de publicité sur les habitudes
vestimentaires des enfants.
10
Chapitre 2 : Organisation des données
Supposons, par exemple, qu’on vous confie un projet d’ouverture d’un centre
d’exposition d’articles de sport « aux perles grises ». Pour évaluer l’opportunité d’un
tel centre, vous réalisez une enquête auprès d’un échantillon aléatoire de 170
ménages du quartier. Le questionnaire contient des questions comme :
Age………………………………
Sexe M………………………….F………………………….
Niveau d’étude : primaire……secondaire…………supérieur…………
Statut matrimonial : marié…célibataire…veuf…..divorcé….vivant maritalement.
Nombre d’enfant par ménage :…..
Revenu annuel par ménage…..
Type de sport pratiqué…..
Chacune de ces questions est une variable. Le résultat immédiat de cette enquête est
une pile de 170 fiches, chaque fiche renfermant par exemple 20 questions. On aura
donc au total 20*170 = 3400 données recueillies.
Comment traiter ces données pour les rendre plus intelligibles en vue d’une analyse ?
a- La saisie des données :
Elle consiste à transcrire les données dans un tableau. On construit ainsi un
immense tableau où chaque ligne représente un individu et chaque colonne une
variable. Chaque case du tableau représente la réponse d’un individu à une question.
Ce tableau est dit tableau complet.
La présentation complète ou brute des données peut ainsi être la forme première de
saisie et de stockage des données (issues par exemple d'une enquête ou d'un travail
de terrain ou les résultats d'une étude statistique), soit sous forme papier soit sous
forme informatique. Elle constitue la matrice des données brutes.
11
b- Analyse uni-variée
Dans ce cas, le traitement statistique porte sur l’étude systématique des données
relatives à chaque variable, indépendamment des autres. C’est l’analyse
unidimensionnelle ou analyse uni-variée. Pour chaque variable du tableau complet, on
réalise un tri à plat simple. Cette opération consiste à associer à chaque modalité Xi
de la variable X choisie le nombre ni d’individus ayant cette valeur ; ni est l’effectif ou
la fréquence absolue de cette modalité. L’ensemble des couples (Xi ; ni) forme une
distribution statistique. Cette série peut être présentée sous forme de tableau appelée
tableau de répartition ou tableau de fréquences de la variable X.
c- Analyse bivariée
C’est l’étude des données relatives à deux variables à la fois. Il s’agit par
exemple de rechercher une éventuelle association entre les variables prises
deux à deux : c’est une analyse bi-dimensionnelle ou bi-variée. Pour chaque
couple de variable (X ; Y) on réalise un tri-croisé. Les résultats de cette
opération se présentent sous forme de tableau appelé tableau croisé ou tableau
de contingence.
d- Analyse multivariée
C’est l’étude des données relatives à plus de deux variables à la fois. Sur la
recherche de relations entre un grand nombre de variables prises simultanément :
c’est l’analyse multidimensionnelle ou multivariée. Ces traitements sont longs et
complexes et supposent le recours aux outils informatiques.
12
Exemple de matrice de données brute.
Matrice de données brutes issues d’une enquête auprès d’un échantillon aléatoire de
60 téléspectateurs d’une télévision privée de la place.
01 1 1 3 21 3 4 5 41 2 2 4
02 2 2 4 22 3 3 4 42 3 2 4
03 3 1 5 23 2 1 5 43 1 2 5
04 2 2 4 24 3 2 4 44 2 3 4
05 2 3 4 25 3 1 3 45 3 1 5
06 2 1 5 26 3 2 5 46 1 2 2
07 3 3 5 27 2 1 2 47 3 1 4
08 2 2 3 28 1 3 3 48 2 2 3
09 1 4 4 29 1 3 4 49 1 1 3
10 2 2 5 30 2 2 4 50 2 2 4
11 2 3 3 31 1 2 4 51 1 4 5
12 3 1 5 32 2 2 5 52 2 1 5
13 3 2 5 33 1 3 5 53 1 2 4
14 3 1 4 34 3 1 2 54 3 2 4
15 2 4 4 35 2 2 3 55 1 3 5
16 3 1 4 36 1 1 3 56 2 3 3
17 3 1 1 37 2 2 5 57 2 2 4
18 2 3 1 38 1 1 2 58 1 4 4
19 3 2 5 39 2 3 4 59 3 1 4
13
20 2 2 5 40 1 1 4 60 3 1 3
I- ANALYSE UNIVARIEE
N = Σ ni
14
1- Un titre : dans le titre du tableau on doit indiquer :
1- ce qui est étudié
2- La population totale ou l’échantillon
Fréquences relatives
15
Quelques autres définitions
Les taux
Les ratios
Le ratio exprime un poids relatif des effectifs d’une catégorie par rapport aux effectifs
d’une autre catégorie.
Exercice : Que signifie l’expression suivante : le ratio des filles au primaire en Côte
d’Ivoire est de 45% ?
Exemple 1 :
3 12 0.2 20 30 90
4 24 0.4 40 69,999 70
5 18 0.3 30 99,999 30
Total 60 1 99,999
Exercice 1:
16
Tableau de répartition du niveau d’étude d’un échantillon aléatoire de 60
téléspectateurs d’une chaine de télévision privée de la place lors d’une enquête.
Total 60 1 100
Légende :
Exercice 2
0 4
1 15
2 29
3 18
4 10
5 3
6 1
Total 80
17
i- Compléter le tableau
ii- Déterminer les pourcentages suivants :
Ceux qui ont 2 enfants ; au plus 3 enfants ; au
moins 4 enfants
Lorsque les différentes valeurs prises par le caractère (quantitatif) étudié sont en
grand nombre, on répartit les données en classes soit de mêmes amplitudes soit
d’amplitudes différentes.
Définition :
Classe [x1 ; x2 [
Amplitude de classe a = x2 – x1
Centre de classe C = (x1 + x2) /2
Densité de fréquence d’une classe di = ni / ai
NOMBRE DE NOMBRE DE
DONNEES (N) CLASSES (k)
10 4
]10; 22] 5
]22 ; 44] 6
]44 ;90] 7
]90 ;180] 8
]180 ;360] 9
]360 ;720] 10
]720 ;1000] 11
18
importantes avec l’ensemble des données. Généralement la borne inférieure de
la première classe coïncide avec la plus petite valeur du caractère observée.
Choisir des bornes qui permettent des calculs simples.
Choisir des bornes qui ont une signification particulière dans l’analyse de ces
données.
On peut construire des classes de même amplitude ou d’amplitude différente
selon l’analyse que veut réaliser.
Une entreprise possède 200 points de vente de ses produits répartis sur le
territoire ivoirien. Chaque point de vente a fait connaître son chiffre d’affaires,
exprimé en million de francs, pour le mois de Septembre 2018. Un traitement
préliminaire des données fournit les résultats suivants.
Chiffre ci ni*ci
d’affaires en Fcc%
ni fi% Fcd% ai di
million de
francs
[02-30[ 20 10% 10% 100% 28 0,71 16 320
[30-50[ 35 17,50% 27,5% 90% 20 1,75 40 1400
[50-70[ 40 20,00% 47,5% 72,5% 20 2 60 2400
[70-90[ 46 23,00% 70,5% 52,5% 20 2,3 80 3680
[90-100[ 30 15% 85,5% 29,5% 10 3 95 2850
[100-110[ 15 7,50% 93% 14,5% 10 1,5 105 1575
[110-120[ 7 3,50% 96,5% 7% 10 0,7 115 805
[120-130[ 2 1,00% 97,5% 3,5% 10 0,2 125 250
[130-150[ 4 2,00% 99,5% 2,50% 20 0,2 140 560
[150-200[ 1 0,50% 100,00% 0,50% 50 0,02 175 175
Total :
Total 200
14015
19
ANALYSE STATISTIQUE DE DONNEES
Fiche de td n°1
Une enquête effectuée dans un centre de réinsertion de jeunes délinquants auprès d’un
échantillon aléatoire de 80 pensionnaires du centre a révélé leurs notes de conduite.
53 68 84 75 82 68 90 62 88
76 65 73 69 88 73 60 93 61
54 85 72 61 65 75 87 74 62
95 78 63 60 66 82 78 65 54
77 69 74 68 71 96 68 89 61
75 55 60 79 83 65 79 62 67
68 78 85 76 61 71 74 65 80
73 57 88 78 62 53 67 86 67
73 81 62 63 76 65 85 56
20
B- Représentations graphiques des données
Caractères quantitatifs
Variable discrète
• Diagramme en bâton (fréquences simples)
• Courbe escalier (fréquences cumulées)
Variable continue
• Histogramme (fréquences simples)
21
• Polygone des fréquences (fréquences simples)
• Courbe cumulative (fréquences cumulées)
Digramme circulaire
22
appréciation de la qualité du service
Effectif Pourcenta Pourcentag Pourcentag
s ge e valide e cumulé
1 2 3,3 3,3 3,3
2 4 6,7 6,7 10,0
Valid 3 12 20,0 20,0 30,0
e 4 24 40,0 40,0 70,0
5 18 30,0 30,0 100,0
Total 60 100,0 100,0
23
DEUXIEME PARTIE : MESURES DESCRIPTIVES
Nous examinons dans cette partie les principales mesures utilisées pour décrire un
ensemble de données. Il s’agit de caractériser la distribution des valeurs observées
d’une variable statistique par certains nombres représentatifs qui pourraient résumer
de façon suffisamment complète l’ensemble de ces valeurs. On exposera les
mesures de tendance centrale (le mode, la médiane et la moyenne), les mesures de
position (les quantiles) ainsi que les mesures de dispersion (l’écart type) les mesures
de forme.
Détermination :
Dans une distribution (xi,ni) le mode correspond à la valeur de xi qui a la plus grande
valeur de ni.
Donner des exemples à partir des distributions vues dans les chapitres précédents.
Dans ce cas on détermine d’abord la classe modale ou la classe dominante notée [x1,
x2[. C’est la classe qui a l’effectif le plus élevé (données reparties en classes de même
amplitude) ou la densité d’effectif la plus élevée.
24
Le mode estimé par interpolation linéaire :
𝛥1
Mo = x1+ 𝛥1+𝛥2 ∗ 𝑎𝑖
Centre de densité
Effectifs Pourcentage
Salaire horaire classe Ci d’effectif Pourcentage fi%
cumulé croissant
Ni di *100
[4750-5250[ 10 5000 2 4% 4%
𝛥1
Pour les données groupé 𝛥1 = 24 – 20 = 4 et 𝛥2 = 24 – 10 = 14 /Mo = x1+𝛥1+𝛥2 ∗ 𝑎𝑖
4
D’où Mo = 6050+ 4+14 ∗ 300 = 6117 frs/heure
25
2- La médiane (symbole Mé).
Les données étant rangées par ordre croissant ou décroissant, la médiane est la valeur
observée ou estimée de la variable qui partage l’ensemble des données en deux
parties de même effectif :
Détermination de la médiane
Note 8 10 12 13 14 16 17 17
Rang 1 2 3 4 5 6 7 8
n/2 = 8/2 = 4. C’est un entier, donc la médiane est la moyenne des notes de rang 4
soit 13 et de rang 5 soit 14. La médiane vaut donc (13 + 14)/2 = 13,5.
Note 8 10 12 13 14 16 17 17 18
Rang 1 2 3 4 5 6 7 8 9
n/2 = 9/2=4,5 on arrondit à l’entier supérieur soit 5. Donc la médiane est égale
à 14.
26
ii- Cas de données groupées par classe
𝟓𝟎−𝐅𝐜𝐮𝐦 %
Mé = x1+( ) ∗ 𝒂𝒊
𝒇% 𝒎é
50−40
Mé= 6050+ ( ) ∗ 300
28,8
Soit une série numérique x1,x2…xn. La moyenne de cette série est donnée par :
𝑥1+𝑥2+⋯.+𝑥𝑛
X= 𝑛
x= [∑𝑘
𝑖=1 𝑛𝑖∗𝑥𝑖 ]
𝑛
Tapez une équation ici.
)=
avec k le nombre de différentes valeurs du caractère
27
iii- Position relative du mode, de la médiane et de la moyenne et recherche
de symétrie dans une distribution
- Par contre Mo < Mé < X alors on a une distribution asymétrique avec étalement
à droite
- Si le Mo > Mé > X alors on a une distribution asymétrique avec étalement à
gauche
Ils peuvent être utilisés pour les données ordinales et quantitatives. Les données
étant rangées par ordre croissant, les quartiles notés (Q1, Q2, Q3) divisent
l’ensemble des données en quatre parties de même effectif.
- Le 1er quartile Q1 est tel que 25% des données lui sont inférieures ou
égales et 75% lui sont supérieures ou égales.
- Le 2ème quartile Q2 est la médiane
- Le 3ème quartile Q3 est tel que 75% des données lui sont inférieures ou
égales et 25% lui sontMédiane
supérieures ou égales
X min X max
Q1 Q2 Q3
28
Pour les données non groupées, il faut les ranger par ordre croissant et calculer le rang de
Q1
Note 7 8 10 12 14 15 16 16 17
Rang 1er 2e 3e 4e 5e 6e 7e 8e 9e
Rang de Q1= n/4 = 9/4=2,25 arrondir à 3 est la position de Q1 don la note équivaut à 10
Rang de Q2= n/2= 9/2=4,5 arrondir à 5e position dont la note équivaut à 14
Rang de Q3= 3n/4 = 3*9/4=6,7 arrondir à 7e position dont la note équivaut à 16
29
Note 7 8 10 12 14 15 16 16 17 18
Rang 1er 2e 3e 4e 5e 6e 7e 8e 9e 10
Calculons Q1 :
Rang de Q1 : 10/4 = 2,5 soit 3 donc Q1 = 10
Calculons Q2
Rang de Q2 : 10/2 =5 donc Q2 = (14 +15)/2 = 14.5
Calculons Q3
Rang de Q3 : 3*10/4 =7.5 donc Q3 =16
Calcul du Q1
On détermine d’abord la classe de Q1 ; elle correspond à la classe qui a pour
pourcentage cumulé croissant 25% ou immédiatement supérieur à 25%.
𝟐𝟓−𝐅𝐜𝐮𝐦 %
Q1 = x1+( ) ∗ 𝒂𝒊
𝒇% 𝑸𝟏
Calcul du Q3
On détermine d’abord la classe de Q3 ; elle correspond à la classe qui a pour
pourcentage cumulé croissant 75% ou immédiatement supérieur à 75%.
𝟕𝟓−𝐅𝐜𝐮𝐦 %
Q3 = x1+( ) ∗ 𝒂𝒊
𝒇% 𝑸𝟑
30
Recherche de données aberrantes :
Définition : dans une série statistique, une donnée est dite aberrante si elle
s’écarte anormalement de l’ensemble des données observées.
Détermination par la règle de Tukey : cas des chiffres d’affaire.
Iq = Q3 – Q1 exemple Iq = 45.86
W = 1.5*Iq exple W = 68.79
W1 = Q1 – W exple W1 = - 21.65
W2 = Q3 + W exple W2 = 161.79
Règle : toutes les données observées qui sont
Hors de l’intervalle [W1 ; W2] sont considérées comme aberrantes.
exple [-21.65 ; 161.79] soit [ 2 ; 161.79].
31
CHAPITRE IV : LES MESURES DE DISPERSION
R = Xmax – Xmin
L’étendue étant une grandeur absolue (non relative) elle ne permet pas
d’apprécier des dispersions autour des valeurs centrales.
- Etendue interquartile Iq :
Iq = Q3 – Q1
x x
1
s 2 2
n i
soit
1
s 2
x x
2
i
2
n i
Exemple du tableau des chiffres d’affaire: Σni xi2 =1168495 et m 70.075. Calculez la
variance. L’unité de la variance est le carré de l’unité du caractère étudié.
32
2- Ecart type :
1
x
k
= n x 2 2
s i i
N i 1
Ainsi :
3- Coefficient de variation :
C’est le rapport entre l’écart type et la moyenne.
x
C.V 100
x
Exemple : Cv = (30.52/ 70.075)*100 = 43.55% soit 44%. Cela signifie que l’écart-type
représente (et donc les dispersions autour de la moyenne) 44% de la moyenne de la
distribution.
Règle de l’homogénéité d’une distribution.
Plus le coefficient de variation est petit, plus la série est homogène. D’une manière générale,
la population étudiée est considérée homogène lorsque le CV < 15%. Dans ce cas la moyenne
est un résumé pertinent des observations.
Remarque : le coefficient de variation permet de comparer le taux de dispersion entre plusieurs
distributions, car il est sans unité.
33
4- Note standard ou la côte z ou note centrée réduite
Exercice à rendre : paramètres caractérisant trois entreprises par rapport aux revenus (en $)
des employés. Faites une analyse comparée de ces trois entreprises.
Exerces de TD
Consigne : écrire les réponses dans les espaces indiqués sur la feuille du sujet.
Exercice 1
Dans une enquête d’opinion auprès des jeunes sur l’utilisation des portables pendant
le cours, Djèdjè a construit un questionnaire dans lequel les questions se présentent sous la
forme d’affirmations suivies d’une échelle sur laquelle les sujets doivent entourer un
nombre pour indiquer leur opinion ; par exemple : « même si le professeur fait le cours,
l’étudiant a le droit de répondre aux appels ».
-2 -1 0 1 2
Pas du tout En désaccord sans opinion D’accord Tout à fait
d’accord d’accord
34
Opinion Effectif pourcentage Pourcentage Pourcentage
cumulé croissant cumulé
décroissant
-2 11 14.28 14.28 99.98
-1 6 7.79 22.07 85.7
0 18 23.37 45.44 77.91
1 27 35.06 80.5 54.54
2 15 19.48 99.98 19.48
Total 77 99.98
Compléter le tableau.
Avec quels graphiques peut-on représenter la variation des pourcentages selon le type
d’opinion ?
………………………………………………………………………………………………………………………………………………
……………
………………………………………………………………………………………………………………………………………………
………….
………………………………………………………………………………………………………………………………………………
………..
c) indiquer le pourcentage de :
ceux qui sont en désaccord……………………………………………………………………………………..
ceux qui sont au moins
d’accord…………………………………………………………………………………………..
ceux qui sont au plus « sans opinion » ………………………………………………………………
Exercice 2
Vous êtes le responsable d’un cyber, vous voulez réaliser une étude sur la durée de visite en
minutes sur un site internet qui vient d’être installé. Voici les données obtenues
24 24 24 25 25 26 26 26
28 28 28 28 28 29 30 31
33 34 34 35 35 36 37 39
35
43 43 46 48 52 53 57 60
a / identifier la variable statistique sur laquelle porte l’étude ; quelle est sa nature ?
………………………………………………………………………………………………………………………………………….
……………………………………………………………………………………………………………………………………………
b/ quelle est l’unité statistique ?............................................................................................
c/ les données du tableau ci-dessus sont rangées par ordre croissant suivant les lignes.
Déterminer la durée modale et les trois quartiles Q1, Q2, Q3.
………………………………………………………………………………………………………………………………………………
……
………………………………………………………………………………………………………………………………………………..
....
………………………………………………………………………………………………………………………………………………
……….....
………………………………………………………………………………………………………………………………………………
………
………………………………………………………………………………………………………………………………………………
……………
………………………………………………………………………………………………………………………………………………
…………
………………………………………………………………………………………………………………………………………………
……..
d/ Déterminer la durée de visite moyenne X. on donne ∑nixi= 1115 minutes.
………………………………………………………………………………………………………………………………………………
………......
e/ ce site sera jugé intéressant si les conditions suivantes sont vérifiés :
36
………………………………………………………………………………………………………………………………………………
………….
Exercice 3 :
Complétez le tableau ci-dessous indiquant la répartition en pourcentage des revenus
annuels en 2000 des familles dans un pays donné.
37
……………………………………………………………………………………………………………………………………
……..
4) Estimez par interpolation linéaire :
Le revenu modal
……………………………………………………………………………………………………………
……………………………………………………………………………………………………………………………………
………
……………………………………………………………………………………………………………………………………
….
Le revenu
médian……………………………………………………………………………………………………………
……………………………………………………………………………………………………………………………………
….
……………………………………………………………………………………………………………………………………
…………..
Le revenu correspondant au premier quartile
Q1…………………………………………………………………
……………………………………………………………………………………………………………………………………
……………………………………………………………………………………………………………………………………
……………………………………………………………………………………………………………………………………
……………………………
Le revenu correspondant au troisième quartile Q3………………………………………………………
……………………………………………………………………………………………………………………………………
……………………………………………………………………………………………………………………………………
……………………………………………………………………………………………………………………………………
……………………….
……………………………………………………………………………………………………………………………………
…………
Faites un résumé en cinq chiffres de la distribution.
……………………………………………………………………………………………………………………………………
……………………………………………………………………………………………………………………………………
……………………
5) La distribution admet-elle des valeurs aberrantes ? si oui, lesquelles ?
……………………………………………………………………………………………………………………………………
……………………………………………………………………………………………………………………………………
……………………………………………………………………………………………………………………………………
……………………………………………………………………………………………………………………………………
……………………………………………………………………………………………………………………………………
……………………………………………………………………………………………………………………………………
……………………………………………………………..
38
……………………………………………………………………………………………………………………………………
……………………………………………………………………………………………………………………………………
……………………………………………………………………………………………………………………………………
…………………………….
7) Quelle conclusion peut-on tirer de cette étude ?
………………………………………………………………………………………………………………………………………………
………………………………………………………………………………………………………………………………………………
………………………………………………………………………………………………………………………………………………
………………………………………………………………………………………………………………………………………………
………………………………………………………………………………………………………………………………………………
………………………………………………………………………………………………………………………………………………
……………………………………………………………………………….
39
40