0% ont trouvé ce document utile (0 vote)
26 vues5 pages

Statistique

Le document traite de la statistique descriptive à une variable, en expliquant les concepts de population, échantillon, et les types de variables (quantitatives et qualitatives). Il aborde également les méthodes d'échantillonnage, les caractéristiques d'une série statistique, ainsi que les mesures de tendance centrale comme la moyenne, la médiane et les quantiles. Enfin, il mentionne l'importance des représentations graphiques pour visualiser les données.

Transféré par

r7t2p9sn9z
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
26 vues5 pages

Statistique

Le document traite de la statistique descriptive à une variable, en expliquant les concepts de population, échantillon, et les types de variables (quantitatives et qualitatives). Il aborde également les méthodes d'échantillonnage, les caractéristiques d'une série statistique, ainsi que les mesures de tendance centrale comme la moyenne, la médiane et les quantiles. Enfin, il mentionne l'importance des représentations graphiques pour visualiser les données.

Transféré par

r7t2p9sn9z
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

UAM/FSS/EM1

Statistique Descriptive à une variable


I) Introduction léennes ou variable de Bernoulli, elles sont dites Binaires .
Exemple : variable genre (sexe) : homme, femme.
On appelle statistique l'ensemble de méthodes scienti- Exemple : Parmi les variables suivantes, donner la qualité
du caractère (qualitatif, quantitatif) et sa variable statistique
ques permettant de collecter, décrire et analyser des données
observées. Ces observations consistent généralement en la me- (discrète, continue, ordinale ou nominale) :
sure d'une ou plusieurs caractéristiques communes sur un 1- Température;
ensemble de personnes ou d'objets équivalents. La statistique 2- La race ovine;
descriptive est la partie de la statistique qui sert à décrire de 3- Taux de cholestérol;
façon synthétique et parlante un phénomène (mesurer, classer 4- Nombre d'élèves par salle;
les mesures et présenter ces mesures par quelques indicateurs). 5- Répartition par catégories-socio-professionnelles;

M1
La statistique descriptive traite des propriétés des populations 6- Nombre de vaches à traiter.
plus que des individus particuliers. La population correspond
à l'ensemble des individus ou d'objets de même nature sur le-
quel porte l'étude. Vu sa taille très grande, il est généralement
Solution
dicile, voire impossible, d'observer toutes les données. Au 1- La température est un caractère mesurable (quantiable)
lieu d'examiner la population, on examine une petite partie et elle peut prendre une valeur de l'ensemble des nombres
qu'on appelle échantillon. Une population peut être réelle ou réels. Donc le caractère est quantitatif d'une variable statis-
ctive.
II) Vocabulaire de la statistique FSS/E
En statistique, l'élément statistique est le caractère retenu
pour étudier un ensemble donné, on l'appelle variable. Une
variable est un facteur susceptible de prendre une valeur dié-
tique continue.
2- La race est une qualité qui identie de quellle race ap-
partient notre ovin ce qui implique le caractère qualitatif, et
la variable statistique ne peut être que nominale.
rente selon les unités statistiques étudiées (la taille, la couleur 3- Taux de cholestérol d'abord est une mesure donnée par
des yeux, ...). Selon les valeurs (appélées modalités) que peut analyse sanguine, alors c'est un caractère quantitatif.
prendre une variable, on les diérencie en deux catégories :
quantitatives et qualitatives. 4- Nombre d'élèves par salle est un dénombrement ce qui
implique directement qu'il s'agit d'une quantité (caractère
Les Variables quantitatives : Ce sont les variables qu'on quantitatif), et la variable statistique est discrète, le fait que
peut mesurer. Elles sont caractérisées par des valeurs numé- le nombre d'élèves ne peut prendre que des valeurs entières.
riques. Elles peuvent être :
5- La répartition par catégorie Socio-Professionnelles est
UAM/

[Link] : Ce sont les variables qui peuvent prendre une qualité que l'on peut exprimer au rangement des postes
toutes les valeurs d'un ensemble ou d'un intervalle d'obser- (professions) dans la hiérarchie de la société. Donc il s'agit
vations. Ces valeurs appartiennent à l'ensemble des nombres d'un caractère qualitatif ordinale.
réels R (une innité de valeurs possibles). Ce genre de variable
est particulièrement utilisé en médecine et en biologie médicale. 6- Nombre de vaches à traiter : c'est un caractère quanti-
tatif discrèt.
[Link]ètes : Ce sont des variables numériques discon-
tinues qui ne peuvent prendre que quelques valeurs dans un
intervalle de nombres entiers donné.
III) Échantillonnage
Variables qualitatives : Ce sont des variables qui ne sont 1) Échantillonnage aléatoire
pas mesurables (n'ont pas de valeurs numériques). Leurs va- L'échantillonage représente les opérations de prélévement
leurs sont des qualités qui peuvent être réalisées dans deux d'un certain nombre d'individus (échantillon) dans une popu-
échelles de mesure : échelle ordinale (rangement) et l'échelle lation.
nominale.
1. Ordinales : Elles s'expriment en classes qui peuvent L'échantillonage aléatoire assure le tirage d'un échantillon
être ordonnées selon une échelle de valeurs. représentatif. Un échantillon est dit aléatoire si chaque indi-
Exemple : variable : complication d'une maladie; vidu de la population a une probabilité connue d'appartenir
classes : modérée, moyenne, sévère. à cet échantillon. Le cas particulier celui où chaque individu
2. Nominales : Ce sont des variables dont les classes ne a les même chances c'est à dire la même probabilité que les
sont pas ordonnées. autres.
Exemple : variable : groupe sanguin;
classes : A, B, O, AB. La méthode consiste à prélever "au hasard" et de façon
Lorsqu'en particulier des variables qualitatives nominales indépendante un échantillon de n individus dans une popula-
ne prennent que deux valeurs possibles, dichotomiques, boo- tion de N individus. Dans ce cas, chaque individu a la même
1
UAM/FSS/EM1
probabilité d'appartenir à l'échantillon. à valeur dans un sous-ensemble ni de R. O utilise la même
dénition de la distribution que dans le cas discret.
2) Échantionnage stratié
A.2) Seconde approche : Pour obtenir une représen-
Pour obtenir un échantillon (de taille n), cette méthode tation synthétique des données, on a besoin d'eectuer un
consiste à subdiviser d'abord la population (de taille N) en regroupement en classes.
sous population P ou groupe homogène (ou strates; de taille
N ), pour ensuite tirer un échantillon aléatoire (de taille n )
i
a) Regroupement en classe
dans chaque strate proportionnellement à son importance.
i i

Dans le cas où la variable (caractère) est quantitative conti-


Sous-Population P P P ... P nue, les valeurs du caractère (modalités) peuvent être regrou-
échantillon de P l l ... l pées dans des intervalles appelés classes.
i 1 2 q

M1
On construit l'échantillon l de la population principale • Les classes sont généralement de la forme [a , a [.
i 1 2 q

en additionnant les sous échantillons obtenus c'est à dire • L'eectif n d'une classe [a , a [ est le nombre de mo-
i−1 i

l = l + l + ... + l . dalités appartenant à [a , a [.


i i−1 i

• La fréquence f d'une classe [a , a [ est le quotient de


1 2 q i−1 i

Avec NN = nn ; N = N + N + ... + N et n = son eectif n par l'eectif total : f = nN .


i i−1 i
i i i

n + n + ... + n .
1 2 q

• le centre c d'une classe [a , a [ est donné par


i i
1 2 q i i−1 i

FSS/E
Exemple : Population : 500 étudiants de la section EM1. a +a
Strate ou sous population : P = garçons (N =300) et P =lles
i−1 i
c = i
2
(N =200).
1 1 2

• L'amplitude d'une classe [a , a [ est la diérence a −


On veut un échantillon de taille n=75.
2

a .
i−1 i i

La répartition par sous échantillon est obtenue comme suit : La densité d d'une classe [a , a [ est le quotient
i−1
de
On a : NN = nn ⇒ n = n NN d'où n = 75 300

son aectif par l'amplitude de la classe d = a − a .
i i−1 i
i i i n
i = 45 1 i
500 i

garçons et n = 75 500 = 30 lles.


200
2
2) Caractéristique d'une série statistique à une va-
i i−1

3) Échantionnage par groupe riable


La méthode consiste à preveler un échantillon dans une 2.1) Caractéristiques de positions
population dont les unités sont des sous-ensembles (grappe) a) Classe modaleMode : Pour une série statistique à
de cette population. une variable,
Exemple : Population : étudiants de l'Université Abdou ∗ Si Discrete ou qualitative :
UAM/

Moumouni. On appelle mode (ou valeur modale), la modalité ayant le


grappe P = les étudiants par faculté.
i
plus grand eectif.
IV) Étude d'une Série statistique à une variable ∗ Si continue (ou groupée en classe) : On appelle,
1) Distribution statistique associée à un échantillon • Classe modale : toute classe ayant l'eectif maximale.
• Mode : le centre de toute classe de densité maximale.
1.1) Variables qualitatives ou quantitatives dis-
crètes Remarque : S'il existe un seul mode, on dit que la dis-
Une distribution statistique d'un échantillon de n obser- tribution
parle de
statistique est unimodale. Dans le cas contraire, on
distribution multimodale (bimodale, trimodale,...).
vations d'une variable qualitative ou quantitative discrète X
(ou bien d'un caractère qualitatif ou quantitatif discret) est b) Moyenne arithmétique :
constituée par la donnée d'un regroupement :
Modalité x x ... x On appelle moyenne arithmétique d'une série statistique à
eectif n n ... n
1 2 p
une variable,
1 2 p
∗Si Discrete : la quantité x̄ dénie par :

1.2) Variables quantitatives continues x̄ =


1 X
p
ni .xi =
n1 .x1 + n2 .x2 + ... + np .xp
.
Dans ce cas, on a deux approches possibles. N i=1 N

∗ Si continue (ou groupée en classe) : la moyenne


A.1) Première approche : On peut considérer un échan- associée à la série des centres des classes, dans ce cas elle est
tillon d'un caractère continu comme celui d'un caractère discret appelée moyenne approchée. Elle est dénie par :
2
UAM/FSS/EM1
p
série pour ce caractère et la plus petite.
Remarque : Cette quantité est très sensible aux valeurs
n1 .c1 + n2 .c2 + ... + np .cp 1 X
x̄ = = ni .ci .
aberrantes ou extrêmes.
N N i=1
où p est le nombre de classes. b) L'écart inter-quartiles :
c) La médiane et les quantiles On appelle écart inter-quartiles d'une série statistique d'un
caractère X la diérence entre le troisième quartile de la sé-
c.1) La médiane rie pour ce caractère et le premier quartile, autrement dit le
La médiane M e correspond à la modalité qui est à la fois nombre noté q donné par q = Q − Q . 3 1

supérieure et inférieure à 50% (la moitié) des modalités. Remarque : Cette quantité est peu sensible aux valeurs
aberrantes ou extrêmes.

M1
Si Discrete : Soit n le nombre de modalité dans le tableau
de répartition de la variable. c) Variance-Ecart type :
On commence par ordonner toutes les valeurs x ; i = 1...n (groupée en classe) : On appelle variance
de l'échantillon en les répétant autant de fois qu'elles sont ob- d'uneSi continue
i

servées. Alors : série statistique groupée, la variance de la série des


* si n est pair, alors la médiane est donnée par : centres des classes :
X( n2 ) + X( n2 +1 )

FSS/E
Me = . n1 .(c1 − X̄)2 + n2 .(c2 − X̄)2 + ... + np .(cp − X̄)2
2 V ar =
** si n est impair, alors la médiane est donnée par : p
N
1 X
M e = X n+1 . V ar = ni .(ci − X̄)2
On cherche
2
N i=1
Si continue (ou groupée en classe) :
d'abord la classe médiane : c'est la classe à partir de laquelle L'écart type est donné par : . σ

σ = V ar
l'eectif cumulé (ou la fréquence cumulée) est supéieur(e) à
0,5. La médiane appartient à cette classe médiane. Si la classe Remarque : 1) Pour le cas d'une variable discrète, il sut
médiane est ]a − a ] , d' eectif cumulé f , et la classe de considérer les modalités x à la place des c .
qui la precede est d'eectif cumulé f alors on a
i−1 i i;cum i i

N
i−1;cum
Propriété :(formule de Koenig)
M e − ai−1 − fi−1;cum
= 2 .
ai − ai−1 fi,cum − fi−1;cum
La détermination de la médiane peut se faire graphique- V ar(X) = (X¯ ) − (X̄) = N1 X n .(c ) − N1 X n .c
p   p 2

ment lorsque la série est groupée en classes. Pour cela; on


2 2 2
UAM/

i i i i

trace d'abord les polygones des eectifs cumulés (croissants i=1 i=1

et décroissants) sur le même graphique, l'abscisse du point 3) Représentation graphique


d'intersection de ces deux polygones est alors la médiane de la Elles représentent :
série. ˆ les eectifs, les fréquences (tout type de variables),
ˆ les eectifs cumulés, les fréquences cumulées (variables quan-
c.2) Généralisation : Les quantiles titatives ou ordinales),
ˆ les valeurs d'un caractère statistique pour chaque individu.
Dénition : On appelle quantile d'ordre α ∈]0; 1[ de la
distribution la modalité a = q telle que α∗100% de modalités 3.1) Diagramme en bâtons
(brutes ordonnées) sont inférieures à a = q et (1 − α) ∗ 100%
i α

sont supérieures à a = q . Sur l'axe des abscisses, on reporte les modalités x ; sur
i α

l'axe des ordonnées on reporte les eectifs ou les fréquences.


i α i

 Lorsque α = 0, 25 ou 0, 5 ou 0, 75, on parle de quartiles Au-dessus de chaque modalité, on trace un segment vertical
(au lieu de quantile). On a spéciquement : dont la hauteur est égale (ou proportionnelle) à la fréquence
le 1 quartile Q = q ; le 2 quartile Q = q ; et (à l'eectif) associé.
er me

le 3 quartile Q = q .
1 0,25 2 0,5

3.2) Diagramme circulairesemi circulaire (à sec-


me

 Lorsque α = 0, 1 ou 0,2 ou...ou 0,9, on parle de déciles


3 0,75

(au lieu de quantiles). On a spéciquement : le 1 dé- teurs) er

cile D = q ; le 2 décile D = q ; et... le 9


me
Cette représentation graphique est à réserver aux variables
me

décile D = q . (purement) qualitatives. On divise le disque en p secteurs re-


1 0,1 2 0,2

présentant les modalités (x ; x ;...; x ) et proportionnels aux


9 0,9

2.2) Caractéristiques de dispersion eectifs correpondants (n ; n ; ...; n ). L'angle (en degrés)


1 2 p

du secteur représentant la modalité x sera égal à :


1 2 p

a) L'étendue : On appelle étendue d'une série statistique i

d'un caractère X la diérence entre la plus grande valeur de la α =


n
n
× 360. i
i

3
UAM/FSS/EM1
3.3) Histogramme (exemple 1 et 2).
Exemple 1 : Groupe sanguin de 100 personnes.
Une série statistique groupée peut être représentée par Groupe sanguin A O B AB
un diagramme appelé histogramme des eectifs (ou des fré- Eectif 40 33 14 13
quences). C'est un daigramme constitué par des rectangles jux-
taposés dont Exemple 2 :Nombre d'enfants dans 80 familles.

les largeurs sont proportionnelles aux amplitudes des
√ classes; Nombre d'enfants 0 1 2 3 4 5 6
les hauteurs sont proportionnelles aux densités des Eectif 6 20 27 17 6 3 1
classes.
La hauteur du rectangle représente la densité d'ef- Exemple 3 :

M1
fectif (ou la densité de fréquence) d'une classe.
Si a représente l'amplitude de référence, alors la hau-
teur h du rectangle correspondant à la classe C = Classe ]45 ; 55] ]55 ; 65] ]65 ; 70] ]70 ; 75] ]75 ; 85] ]85 ; 105]
[a ; a [ vaut
i i
i−1 i Eectif 12 20 19 21 18 9
1. établir le tableau des eectif et de fréquences de chacune
des classes.
n .a

FSS/E
i
ih = .
a −a
2. Déterminer la série de centres des classes associée. En
i i−1

Pour une classe d'amplitude k fois plus grande (resp. déduire la densité de chaque classe; la (les) classe(s)
k fois plus petite), on divise (resp. on multiplie) l'eectif modale(s); le(s) mode(s); la moyenne; la variance et
ou la fréquence par un facteur k pour obtenir la hauteur l'écart-type.
du rectangle. 3. Déterminer les eectif cumulés et les fréquences cumu-
L'histogramme des fréquences se dénit de manière ana-
logue. lées.
4. Construire les polygones des eectifs cumulés. En dé-
IV) Exemples duire la médiane.
Déterminer les éléments caractéristiques (possibles) des séries 5. Construire l'histogramme associé à cette série.
Solution de l'exemple 3
1); 2) et 3)
UAM/

Classe ]45; 55] ]55; 65] ]65; 70] ]70; 75] ]75; 85] ]85; 105]
Eectif n i 12 20 19 21 18 9
Fréquence f i
12
99
= 0, 121
20
99
= 0, 202
19
99
= 0, 191
21
99
= 0, 212
18
99
= 0, 181
9
99
= 0, 090

Eectif ↗ 12 12+20=32 32+ 19=51 51+21=72 90 99


Eectif ↘ 99 99-12=87 87-20=67 48 26 9
Fréquence cum ↗ 0,121 0,121+0,202=0,323 0,323+0,191=0,514 0,726 0,907 0,997≃1
Fréquence cum ↘ 1 1-0,121=0,879 0,879-0,202= 0,677 0,486 0,274 0,093
Centre C i
55 + 45
2
= 50
65 + 55
2
= 60
70 + 65
2
= 67, 5
75 + 70
2
= 72, 5
85 + 75
2
= 80
105 + 85
2
= 95

Amplitude A 55 − 45 = 10 65 − 55 = 10
i 70 − 65 = 5 75 − 70 = 5 85 − 75 = 10 105 − 85 = 20

Densité d i
12
10
= 1, 2
20
10
=2
19
5
= 3, 8
21
5
= 4, 2
18
10
= 1, 8
9
20
= 0, 45

la classe modale est : ]70; 75] ; le mode est 72, 5.


4
UAM/FSS/EM1
La moyenne : x̄ = 12 ∗ 50 + 20 ∗ 60 + 19 ∗ 67, 599+ 21 ∗ 72, 5 + 18 ∗ 80 + 9 ∗ 95 = 6900 99
= 69, 69.

La 12(50
variance : 2 2 2 2 2
− 69, 69) + 20(60 − 69, 69) + 19(67, 5 − 69, 69) + 21(72, 5 − 69, 69) + 18(80 − 69, 69) + 9(95 − 69, 69)2 14465, 9139
V ar = = = 146, 120

E. cum
99 99

abs : 1cm → 5
99 ×
ord : 1cm → 10 ×

9087 ×

M1
72 ×
67 ×

5148
FSS/E
×
×

32 ×
26 ×

129 ×
×

0 45 55 65 75 85 105 classe
densité
4,2 abs : 1cm → 5
UAM/

3,8 ord : 1cm → 0,5

2
1,8
1,2

0,45
0 45 55 65 70 75 85 105 classe

Vous aimerez peut-être aussi