STATISTIQUES.
I) Série statistique à deux variables:
Activité
Soit la série statistique suivante:
| x | 2 | 4 | 8 | 12 | 13 | 14 |
|---|---|---|---|---|---|---|
|y|3|5|7|8|1|1|
* Quel est l'effectif total?
* Donner les lois marginales de x et y.
* Calculer le point moyen G(x, y).
* Calculer la variance V(x) et V(y).
* Calculer les écarts types σ(x) et σ(y).
Solution.
* Effectif total
N=5
* Donnons les lois marginales de x et y
* Pour y:
| y | 3 | 5 | 7 | 8 | 1 | N=5 |
|---|---|---|---|---|---|---|
| ni | 1 | 1 | 1 | 1 | 1 | |
* Pour x:
| x | 2 | 4 | 8 | 12 | 13 | 14 | N=5 |
|---|---|---|---|---|---|---|---|
| ni | 1 | 1 | 1 | 1 | 1 | 1 | |
* Calcul du point moyen G(x; y)
Trouvons x et y
x = (Somme des x) / N => x = (2 + 4 + 8 + 12 + 13 + 14) / 5
x = 10,2
[\overline{y}=\frac{\sum_{i=1}^{n} y}{N}]
[\overline{y}=\frac{3+5+7+8+1}{5}]
[\overline{y}=4,8]
D'où G(10,2; 4,8)
* Calcul de la variance.
[V(x)=\frac{\sum x_{i}^{2}}{N}-(\overline{x})^{2}]
AN: [V(x)=\frac{(4)^{2}+(8)^{2}+(12)^{2}+(13)^{2}+(10)^{2}}{5}-(10,2)^{2}]
[V(x)=\frac{589}{5}-104,04=117,8-104,04]
[V(x)=13,76]
Pour y:
[V(y) = \frac{\sum y_i^2}{N} - (\overline{y})^2]
AN: [V(y) = \frac{(3)^2 + (5)^2 + (7)^2 + (8)^2 + (1)^2}{5} - (4.8)^2]
[V(y) = \frac{9 + 25 + 49 + 64 + 1}{5} - 23.04]
[V(y) = \frac{148}{5} - 23.04 = 29.6 - 23.04]
[V(y) = 6.56]
II Série statistique à double entrée.
* Activité
Soit la série statistique suivante:
| x\y | 1 | 0 | 1 | 3 |
|---|---|---|---|---|
|1|1|2|0|1|
|2|2|3|1|2|
| 3 | 5 | 1 | 3 | N=9 |
* Donner les séries marginales de x et y.
* Calculer l'effectif total.
* Calculer les moyennes x et y.
* Calculer V(x) et V(y).
Solution
* Donnons les séries marginales de x et y.
* Pour x:
|x|1|2|3|
|---|---|---|---|
| ni | 4 | 8 | 1 |
* Pour y:
|y|1|2|3|
|---|---|---|---|
| ni | 3 | 6 | 2 |
* Effectif total.
N=9
* Calculons les moyennes x et y.
[\overline{x} = \frac{\sum x_i \cdot n_i}{N}]
AN: [\overline{x} = \frac{(1 \times 4) + (2 \times 5) + (3 \times 1)}{9}]
[\Rightarrow \overline{x} = \frac{17}{9}]
[\Rightarrow \overline{x} = 1,89]
[\overline{y} = \frac{\sum y_i \cdot n_i}{N}]
AN: [\overline{y} = \frac{(1 \times 3) + (2 \times 6)}{9}]
[\overline{y} = \frac{15}{9}]
[\overline{y} = 1,67]
* Calcul de V(x) et V(y).
[V(x) = \frac{\sum x_i n_i}{N} - (\overline{x})^2]
AN: [V(x) = \frac{5(1)^2 + 1(0)^2 + 3(1)^2}{9} - (1,89)^2]
[V(x) = \frac{8}{9} - 3.5721]
[V(x) = 0.8888 - 3.5721]
[V(x) = -2.6833]
[V(y) = \frac{\sum y_i n_i}{N} - (\overline{y})^2]
AN: [V(y) = \frac{3(1)^2 + 6(2)^2}{9} - (1.67)^2]
[V(y) = \frac{27}{9} - 2.7889]
[V(y) = 3 - 2.7889]
[V(y) = 0.2111]
III. Transformation des séries statistiques
* Transformation d'une série statistique de deux variables à une série double.
Activité: Soit
|x|1|1|0|2|0|2|1|0|4|
|---|---|---|---|---|---|---|---|---|---|
|y|2|1|1|1|2|1|1|1|2|
Transformer ce tableau en un tableau double.
Solution
| x\y | 1 | 2 |
|---|---|---|
|1|3|0|
|2|0|4|
|0|2|2|
* Transformation d'une série statistique à double entrée à une série statistique linéaire.
Activité
Soit série statistique double.
| x\y | 1 | 2 | 3 | 4 |
|---|---|---|---|---|
|2|1|0|2|3|
|3|0|2|1|1|
* Donner l'effectif total?
* Transformer le tableau en un tableau linéaire.
Solution
* Effectif total
N = 10
* Transformation.
|x|2|2|2|2|2|3|3|3|3|3|
|---|---|---|---|---|---|---|---|---|---|---|
|y|1|3|3|4|2|1|2|2|3|3|
Exercice:
On donne:
| x\y | -1 | 1 | 2 |
|---|---|---|---|
| -1 | 2 | α | 1 |
|2|3|0|2|
| 5 | α | 3 | 8+α-N |
* Déterminer α tel que G(1/2; 2)
* Quel est l'effectif total?
* Transformer le tableau en un tableau linéaire.
Solution:
* Déterminons α tel que G(1/2; 2)
*Donnons les lois marginales:
Pour x:
| x | -1 | 2 | 5 |
|---|---|---|---|
| ni | 2+α | 3 | α |
| N = 8+α | | | |
Pour y:
|y|1|2|
|---|---|---|
| ni | 3+α | 5 |
| N = 8+α | | |
[\overline{x} = \frac{\sum x_i \cdot n_i}{N}]
[\overline{x} = \frac{(5)(-1) + (4)(1) + (3)(2)}{8 + \alpha}]
[\overline{x} = \frac{-5 + 4 + 6}{8 + \alpha}]
[\overline{x} = \frac{5}{8 + \alpha}]
[\overline{x} = \frac{1 + \alpha}{8 + \alpha}]
[\frac{1}{2} = \frac{1 + \alpha}{8 + \alpha}]
[\Rightarrow 8 + \alpha = 2(1 + \alpha)]
[\Rightarrow 8 + \alpha = 2 + 2\alpha]
[\Rightarrow \alpha - 2\alpha = 2 - 8]
[\Rightarrow -\alpha = -6]
[\Rightarrow \alpha = 6]
D'où α = 6
* Donnons l'effectif total
N=8+α
N = 8 + 6 = 14
N = 14
* Transform
IV - Inertie d'une nuage des points.
* Inertie minimale
a) Définition
On appelle inertie minimale, inertie par rapport au point moyen G définie par:
[I_G = N[V(x) + V(y)]]
* Inertie par rapport à un point
a) Définition
On appelle inertie par rapport à un point A, le nombre réel positif noté [I_A] définie par:
[I_A = I_G + NAG^2] (Théorème de Huyguens)
ou
[I_A = \sum_{i=1}^{p} \sum_{j=1}^{q} n_{ij} ||\overrightarrow{B_i B_j}||^2]
Propriétés:
* L'inertie du nuage par rapport à un point A est minimale ssi A = G
* L'inertie du nuage par rapport à un point A est maximale ssi A ≠ G
* Ajustement linéaire: Méthode de moindres carrés
a) La covariance:
On appelle covariance du couple (x, y), le nombre réel noté cov(x, y) tel que:
[cov(x, y) = \frac{1}{N} \sum_{i=1}^{n} \sum_{j=1}^{n} n_{ij} x_i y_j - \overline{x} \overline{y}]
Théorème de Kouenig:
[cov(x, y) = \frac{1}{N} \sum_{i=1}^{n} (x_i - \overline{x})(y_i - \overline{y})]
b) Droite de régression de y en x
(D): y = ax + b
avec: a = cov(x, y) / V(x)
b = ȳ - ax
c) Droite de régression de x en y
Cette droite peut s'écrire sous la forme (D)
x = a'y + b' => a' = cov(x, y) / V(y)
b' = x̄ - a'ȳ
* Coefficient de corrélation
r = cov(x, y) / √(V(x) V(y)) = cov(x, y) / σ(x) · σ(y)
a) Propriétés:
r = aa' => |r| = √aa'
-1 ≤ r ≤ 1
* Si 0,87 ≤ |r| ≤ 1 alors la corrélation est forte
* Si |r| < 0,87 alors la corrélation est faible
* Si |r| = 1 alors l'ajustement est parfait
Exercice.
On considère une série statistique double suivante
| xi | 2 | α | 5 | 10 | 12 |
|---|---|---|---|---|---|
| yi | 83 | 70 | 54 | 49 | ? |
* Déterminer en fonction de α les coordonnées du point G.
* Déterminer l'entier α sachant que x̄ = 7
* On donne α = 2 et on admet que la droite de régression linéaire de y en x est donnée par la
relation suivante :
y = -3,4x + 89
a) Calculer la covariance du couple (x, y)
b) Calculer la variance de x
* On suppose que le coefficient de corrélation linéaire entre x et y est r = -0,009
a) Apprécier cette corrélation linéaire
b) En utilisant cette corrélation linéaire calculer la variance de y.
Exercice.
Le tableau à double entrée ci-dessous présente les résultats d'une étude faite sur un échantillon
des ménages d'une ville, où x et y sont respectivement les revenus et épargnes mensuels de
ces ménages. x et y sont en milliers de francs CFA.
| y\x | 45 | 75 | 125 |
|---|---|---|---|
| 14 | 4 | 1 | 2 |
| 25 | 4 | 36 | 0 |
| 40 | 0 | 12 | 18 |
* Donner les deux séries marginales associées à ce tableau.
* Calculer le revenu moyen et l'épargne moyenne.
* Calculer les variances x et y puis déduire l'inertie maximale
* a) Déterminer l'équation de la droite (D) de régression qui permet d'estimer le revenu mensuel
à partir de l'épargne mensuelle.
b) En déduire une estimation du revenu mensuel d'un ménage ayant réalisé une épargne
mensuelle de 50.000 FCFA.
* Calculer le coefficient de corrélation linéaire n, puis interpréter le résultat.
Solution
* Déterminons en fonction de α les coordonnées du point G.
[\overline{x} = \frac{\sum x_i}{N}]
[\Rightarrow \overline{x} = \frac{2 + \alpha + 5 + 10 + 12}{5} = \frac{33 + \alpha}{5}]
AN: [\overline{y} = \frac{83 + 70 + 54 + 49}{5} = 65.2]
[\overline{y} = \frac{\sum y_i}{N}]
D'où G([\frac{33 + \alpha}{5}]; 65.2)
* Déterminons α sachant que x̄ = 7
[\overline{x} = \frac{33 + \alpha}{5} \Rightarrow 7 = \frac{33 + \alpha}{5} \Rightarrow 33 + \alpha
= 35]
α = 35 - 33
α=2
* a - Calculons la covariance de (x, y)
[cov(x, y) = \frac{1}{N} \sum_{i=1}^{n} \sum_{j=1}^{n} n_{ij} x_i y_j - \overline{x} \overline{y}]
[cov(x, y) = \frac{166 + 350 + 420 + 540 + 588}{5} - (7 \times 65.2)]
[cov(x, y) = 412.8 - 456.4]
[cov(x, y) = -43.6]
[cov(x, y) = -43.6]
b) Calculons la variance de x.
[y = -3.4x + b]
[\Rightarrow -3.4 = \frac{-43.6}{V(x)}]
car: [y = ax + b \Rightarrow a = \frac{cov(x, y)}{V(x)}]
[\Rightarrow V(x) = \frac{-43.6}{-3.4} \Rightarrow V(x) = 12.82]
* a - Corrélation
-0.009 < 0.87 donc la corrélation est faible.
b - Calculons V(y).
[n = \frac{cov(x, y)}{\sqrt{V(x) \cdot V(y)}} \Rightarrow \sqrt{V(x) \cdot V(y)} = \frac{cov(x, y)}{n}]
[\Rightarrow V(x) \cdot V(y) = \left(\frac{cov(x, y)}{n}\right)^2 = \frac{(-43.6)^2}{(-0.009)^2}]
[V(x) \cdot V(y) = 23468.641.98]
[V(y) = \frac{23468.641.98}{12.82}]
[V(y) = 1830627.3]