0% ont trouvé ce document utile (0 vote)
68 vues141 pages

Analyse des séries statistiques bivariées

Ce chapitre présente les concepts de base des séries statistiques bivariées, notamment la covariance et le coefficient de corrélation pour mesurer l'intensité et le sens de la relation entre deux variables, ainsi que l'ajustement linéaire simple. Il introduit également le tableau de contingence pour organiser de grandes quantités de données.

Transféré par

looproor
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
68 vues141 pages

Analyse des séries statistiques bivariées

Ce chapitre présente les concepts de base des séries statistiques bivariées, notamment la covariance et le coefficient de corrélation pour mesurer l'intensité et le sens de la relation entre deux variables, ainsi que l'ajustement linéaire simple. Il introduit également le tableau de contingence pour organiser de grandes quantités de données.

Transféré par

looproor
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Chapitre 2: Série statistique à deux variables

Said, El Melhaoui

Faculté des Sciences Juridiques, Économiques et Sociales Oujda

[Link]

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 1 / 41


Outline

1 Introduction
2 Covariance
Définition
Propriétés
3 Coefficient de corrélation
Définition
Propriétés
4 Ajustement linéaire simple
Ajustement par la méthode des moindres carrés
Qualité de l’ajustement
5 Tableau de contingence
Définition
Distributions marginales
Distributions conditionnelles
S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 2 / 41
Introduction

Introduction

Souvent on s’intéresse à l’étude d’un phénomène à travers


plusieurs variables qui l’influencent simultanément

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 3 / 41


Introduction

Introduction

Souvent on s’intéresse à l’étude d’un phénomène à travers


plusieurs variables qui l’influencent simultanément
En particulier soient deux variables statistiques x et y . Pour
chaque unité i on observe des valeurs : xi et yi ; la série bivariée
est :
{(xi , yi ), i = 1, . . . , n}

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 3 / 41


Introduction

Introduction

Souvent on s’intéresse à l’étude d’un phénomène à travers


plusieurs variables qui l’influencent simultanément
En particulier soient deux variables statistiques x et y . Pour
chaque unité i on observe des valeurs : xi et yi ; la série bivariée
est :
{(xi , yi ), i = 1, . . . , n}

Existe t’il une relation entre les deux variables x et y ?

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 3 / 41


Introduction

Introduction

Souvent on s’intéresse à l’étude d’un phénomène à travers


plusieurs variables qui l’influencent simultanément
En particulier soient deux variables statistiques x et y . Pour
chaque unité i on observe des valeurs : xi et yi ; la série bivariée
est :
{(xi , yi ), i = 1, . . . , n}

Existe t’il une relation entre les deux variables x et y ?


Si oui, comment peut on mesurer son intensité? son sens?

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 3 / 41


Introduction

Introduction

Souvent on s’intéresse à l’étude d’un phénomène à travers


plusieurs variables qui l’influencent simultanément
En particulier soient deux variables statistiques x et y . Pour
chaque unité i on observe des valeurs : xi et yi ; la série bivariée
est :
{(xi , yi ), i = 1, . . . , n}

Existe t’il une relation entre les deux variables x et y ?


Si oui, comment peut on mesurer son intensité? son sens?
Peut on la formuler sous forme d’une relation explicite (fonction,
modèle)?

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 3 / 41


Introduction

Introduction

Souvent on s’intéresse à l’étude d’un phénomène à travers


plusieurs variables qui l’influencent simultanément
En particulier soient deux variables statistiques x et y . Pour
chaque unité i on observe des valeurs : xi et yi ; la série bivariée
est :
{(xi , yi ), i = 1, . . . , n}

Existe t’il une relation entre les deux variables x et y ?


Si oui, comment peut on mesurer son intensité? son sens?
Peut on la formuler sous forme d’une relation explicite (fonction,
modèle)?
Comment organiser les données d’une grande taille dans un
tableau?

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 3 / 41


Introduction

Introduction

Souvent on s’intéresse à l’étude d’un phénomène à travers


plusieurs variables qui l’influencent simultanément
En particulier soient deux variables statistiques x et y . Pour
chaque unité i on observe des valeurs : xi et yi ; la série bivariée
est :
{(xi , yi ), i = 1, . . . , n}

Existe t’il une relation entre les deux variables x et y ?


Si oui, comment peut on mesurer son intensité? son sens?
Peut on la formuler sous forme d’une relation explicite (fonction,
modèle)?
Comment organiser les données d’une grande taille dans un
tableau?

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 3 / 41


Introduction

Exemple 1

Le manager d’un magasin s’intéresse à la relation qui pourrait exister


entre le nombre des spots publicitaires diffusés au cours du week-end
et les ventes effectuées la semaine suivante. Il observe les données
de dix semaines

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 4 / 41


Introduction

Exemple 1

Le manager d’un magasin s’intéresse à la relation qui pourrait exister


entre le nombre des spots publicitaires diffusés au cours du week-end
et les ventes effectuées la semaine suivante. Il observe les données
de dix semaines
Numéro de la semaine Nombre de spots Volumes de ventes en 100 $
1 2 50
2 5 57
3 1 41
4 3 54
5 4 54
6 1 38
7 5 63
8 4 48
9 4 59
10 2 46

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 4 / 41


Introduction

Exemple 1 (suite)

Pour schématiser cette relation on représente les points P1 = (2, 50),


P2 = (5, 57), . . . , P10 = (2, 46), le graphe ainsi obtenu est dit nuage de
points

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 5 / 41


Introduction

Exemple 1 (suite)

Pour schématiser cette relation on représente les points P1 = (2, 50),


P2 = (5, 57), . . . , P10 = (2, 46), le graphe ainsi obtenu est dit nuage de
points

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 5 / 41


Covariance Définition

Définition de la covariance

Afin de mesurer l’intensité de la dépendance (liaison) entre deux


variables x et y ainsi que son sens (positive ou négative), on définit la
covariance de x et y

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 6 / 41


Covariance Définition

Définition de la covariance

Afin de mesurer l’intensité de la dépendance (liaison) entre deux


variables x et y ainsi que son sens (positive ou négative), on définit la
covariance de x et y
Définition
Pour une série bivariée {(xi , yi ), i = 1, . . . , n} . la covariance est définie
par
n
1X
Sxy = cov (x, y ) = (xi − x)(yi − y )
n
i=1

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 6 / 41


Covariance Définition

Définition de la covariance (suite)

La covariance Sxy sera positive si x %⇔ y %. En effet, dans ce


cas les points qui ont la plus grande influence sur la valeur Sxy
sont les points Pi (xi , yi ) qui vérifient (xi − x) ∗ (yi − y ) > 0: les
points appartenant au cadrans II et IV

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 7 / 41


Covariance Définition

Définition de la covariance (suite)

La covariance Sxy sera positive si x %⇔ y %. En effet, dans ce


cas les points qui ont la plus grande influence sur la valeur Sxy
sont les points Pi (xi , yi ) qui vérifient (xi − x) ∗ (yi − y ) > 0: les
points appartenant au cadrans II et IV
La covariance Sxy sera négative si x %⇔ y &. Dans ce cas les
points qui ont la plus grande influence sur la valeur Sxy sont les
points Pi (xi , yi ) qui vérifient (xi − x) ∗ (yi − y ) < 0: les points
appartenant au cadrans I et III

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 7 / 41


Covariance Définition

Définition de la covariance (suite)

La covariance Sxy sera positive si x %⇔ y %. En effet, dans ce


cas les points qui ont la plus grande influence sur la valeur Sxy
sont les points Pi (xi , yi ) qui vérifient (xi − x) ∗ (yi − y ) > 0: les
points appartenant au cadrans II et IV
La covariance Sxy sera négative si x %⇔ y &. Dans ce cas les
points qui ont la plus grande influence sur la valeur Sxy sont les
points Pi (xi , yi ) qui vérifient (xi − x) ∗ (yi − y ) < 0: les points
appartenant au cadrans I et III
La covariance Sxy sera presque nulle, s’il n’existe aucune relation
entre les deux variables. En effet, dans ce cas les points Pi (xi , yi )
appartenant au cadrans II et IV ont presque la même influence
que ceux se trouvant aux cadrans I et III

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 7 / 41


Covariance Propriétés

Propriétés

1 La covariance est influencée par les changements d’unités et


se conserve par les changements des origines.
Soit x0 et y0 deux réels et dx et dy deux réels non nuls. u et v sont
les variables issues de x et y respectivement par le changement
d’origine et d’unité suivant:
x − x0 y − y0
u= et v =
dx dy
Alors
cov (x, y )
cov (u, v ) = .
dxdy

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 8 / 41


Covariance Propriétés

Propriétés

1 La covariance est influencée par les changements d’unités et


se conserve par les changements des origines.
Soit x0 et y0 deux réels et dx et dy deux réels non nuls. u et v sont
les variables issues de x et y respectivement par le changement
d’origine et d’unité suivant:
x − x0 y − y0
u= et v =
dx dy
Alors
cov (x, y )
cov (u, v ) = .
dxdy
2 Formule de Konig Huyghens.
La covariance peut être écrite sous la forme suivante:
n
1X
Sxy = cov (x, y ) = (xi ∗ yi ) − (x ∗ y ).
n
i=1
S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 8 / 41
Covariance Propriétés

Exemple 1 (suite)

La formule de Konig Huyghens :


cov (x, y ) = (1677/10) − (31/10) ∗ (510/10) = 9.6 >> 0

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 9 / 41


Covariance Propriétés

Exemple 1 (suite)

La formule de Konig Huyghens :


cov (x, y ) = (1677/10) − (31/10) ∗ (510/10) = 9.6 >> 0
=⇒ Il y’a une forte relation positive entre le volume des ventes et
le nombre des spots publicitaires
xi yi xi ∗ yi
2 50 100
5 57 285
1 41 41
3 54 162
4 54 216
1 38 38
5 63 315
4 48 192
4 59 236
2 46 92
31 510 1677
S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 9 / 41
Coefficient de corrélation Définition

Définition du coefficient de corrélation

La covariance est influencée par les changements d’unités donc


elle dépend des unités des deux variables ce qui relativise son
interprétation

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 10 / 41


Coefficient de corrélation Définition

Définition du coefficient de corrélation

La covariance est influencée par les changements d’unités donc


elle dépend des unités des deux variables ce qui relativise son
interprétation
on définit un coefficient dit le coefficient de corrélation de
Bravais-Pearson ; ce coefficient mesure l’intensité de la
«dépendance linéaire» entre deux variables

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 10 / 41


Coefficient de corrélation Définition

Définition du coefficient de corrélation

La covariance est influencée par les changements d’unités donc


elle dépend des unités des deux variables ce qui relativise son
interprétation
on définit un coefficient dit le coefficient de corrélation de
Bravais-Pearson ; ce coefficient mesure l’intensité de la
«dépendance linéaire» entre deux variables

Définition
Pour une série bivariée {(xi , yi ), i = 1, . . . , n} telle que Sx 6= 0, Sy 6= 0,
le coefficient de corrélation est le nombre
Sxy cov(x, y )
r= =p p .
Sx Sy var(x) var(y )

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 10 / 41


Coefficient de corrélation Définition

Définition coefficient de corrélation (suite)

r ≈ 1 quand tous les points observées sont situées à proximité


d’une même droite de pente positive : on parle d’une forte
corrélation positive

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 11 / 41


Coefficient de corrélation Définition

Définition coefficient de corrélation (suite)

r ≈ 1 quand tous les points observées sont situées à proximité


d’une même droite de pente positive : on parle d’une forte
corrélation positive
r ≈ −1 quand tous les points observés sont situés à proximité
d’une même droite de pente négative : forte corrélation négative

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 11 / 41


Coefficient de corrélation Définition

Définition coefficient de corrélation (suite)

r ≈ 1 quand tous les points observées sont situées à proximité


d’une même droite de pente positive : on parle d’une forte
corrélation positive
r ≈ −1 quand tous les points observés sont situés à proximité
d’une même droite de pente négative : forte corrélation négative
r ≈ 0 quand le nuage de points est allongé parallèlement à l’un
des axes de coordonnées ; les points forment un nuage arrondie :
faible corrélation

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 11 / 41


Coefficient de corrélation Définition

Définition coefficient de corrélation (suite)

r ≈ 1 quand tous les points observées sont situées à proximité


d’une même droite de pente positive : on parle d’une forte
corrélation positive
r ≈ −1 quand tous les points observés sont situés à proximité
d’une même droite de pente négative : forte corrélation négative
r ≈ 0 quand le nuage de points est allongé parallèlement à l’un
des axes de coordonnées ; les points forment un nuage arrondie :
faible corrélation
Remarque
Une forte corrélation (liaison, dépendance) n’indique pas
nécessairement une relation de causalité (cause → effet)

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 11 / 41


Coefficient de corrélation Définition

Définition coefficient de corrélation (suite)

r ≈ 1 quand tous les points observées sont situées à proximité


d’une même droite de pente positive : on parle d’une forte
corrélation positive
r ≈ −1 quand tous les points observés sont situés à proximité
d’une même droite de pente négative : forte corrélation négative
r ≈ 0 quand le nuage de points est allongé parallèlement à l’un
des axes de coordonnées ; les points forment un nuage arrondie :
faible corrélation
Remarque
Une forte corrélation (liaison, dépendance) n’indique pas
nécessairement une relation de causalité (cause → effet)
Par exemple la variable ventes des glaces est corrélée positivement à
la variable ventes des lunettes solaires, mais évidement aucune des
deux variables ne cause l’autre
S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 11 / 41
Coefficient de corrélation Définition

Forte corrélation positive r ≈ 0.88

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 12 / 41


Coefficient de corrélation Définition

Forte corrélation négative: r ≈ −0.72

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 13 / 41


Coefficient de corrélation Définition

Faible corrélation : r ≈ 0.2

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 14 / 41


Coefficient de corrélation Propriétés

Propriétés

1 signe(r ) = signe(cov (x, y ))

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 15 / 41


Coefficient de corrélation Propriétés

Propriétés

1 signe(r ) = signe(cov (x, y ))


2 −1 ≤ r ≤ 1

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 15 / 41


Coefficient de corrélation Propriétés

Propriétés

1 signe(r ) = signe(cov (x, y ))


2 −1 ≤ r ≤ 1
3 Formule de calcul:
X X X
( xi yi ) − ( xi yi )/n
i i i
r = sX X sX X
xi2 −( xi )2 /n yi2 − ( yi )2 /n
i i i i

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 15 / 41


Coefficient de corrélation Propriétés

Propriétés

1 signe(r ) = signe(cov (x, y ))


2 −1 ≤ r ≤ 1
3 Formule de calcul:
X X X
( xi yi ) − ( xi yi )/n
i i i
r = sX X sX X
xi2 −( xi )2 /n yi2 − ( yi )2 /n
i i i i

4 Le coefficient r est indépendant des unités des échelles de


mesure. Ainsi, on a
rxy = ruv
quand u = (x − x0 )/dx et v = (y − y0 )/dy avec x0 et y0 ∈ R, dx et
dy ∈]0, +∞[
S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 15 / 41
Coefficient de corrélation Propriétés

Exemple 1 (suite)

Le tableau permettant le calcul du coefficient de corrélation:

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 16 / 41


Coefficient de corrélation Propriétés

Exemple 1 (suite)

Le tableau permettant le calcul du coefficient de corrélation:

Le coefficient de corrélation est :


1677 − 31 ∗ 510/10
r=p p ≈ 0.88
117 − 312 /10 ∗ 26576 − 5102 /10

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 16 / 41


Coefficient de corrélation Propriétés

Exemple 1 (suite)

Le tableau permettant le calcul du coefficient de corrélation:

Le coefficient de corrélation est :


1677 − 31 ∗ 510/10
r=p p ≈ 0.88
117 − 312 /10 ∗ 26576 − 5102 /10
=⇒ Forte corrélation positive entre le nombre des spots
publicitaires et les ventes
S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 16 / 41
Ajustement linéaire simple

Ajustement linéaire simple

L’objectif c’est de formuler la relation de dépendance statistique


entre deux variables x et y

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 17 / 41


Ajustement linéaire simple

Ajustement linéaire simple

L’objectif c’est de formuler la relation de dépendance statistique


entre deux variables x et y
La variable à expliquer sera notée y (variable réponse, variable
dépendante)

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 17 / 41


Ajustement linéaire simple

Ajustement linéaire simple

L’objectif c’est de formuler la relation de dépendance statistique


entre deux variables x et y
La variable à expliquer sera notée y (variable réponse, variable
dépendante)
La variable explicative (indépendante) sera notée x

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 17 / 41


Ajustement linéaire simple

Ajustement linéaire simple

L’objectif c’est de formuler la relation de dépendance statistique


entre deux variables x et y
La variable à expliquer sera notée y (variable réponse, variable
dépendante)
La variable explicative (indépendante) sera notée x
La plus simple dépendance est celle d’une relation linéaire de la
forme
y = a + bx
où a et b sont deux réels appelés coefficients de régression

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 17 / 41


Ajustement linéaire simple

Ajustement linéaire simple

L’objectif c’est de formuler la relation de dépendance statistique


entre deux variables x et y
La variable à expliquer sera notée y (variable réponse, variable
dépendante)
La variable explicative (indépendante) sera notée x
La plus simple dépendance est celle d’une relation linéaire de la
forme
y = a + bx
où a et b sont deux réels appelés coefficients de régression
Les points étant non alignées, cherchons la droite la plus proche
du nuage des points; c’est la droite qui ajuste le mieux l’ensemble
des données: elle est dite la droite de régression (ou
d’ajustement)

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 17 / 41


Ajustement linéaire simple Ajustement par la méthode des moindres carrés

Ajustement linéaire simple: Exemple

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 18 / 41


Ajustement linéaire simple Ajustement par la méthode des moindres carrés

Ajustement par la Méthode des Moindres Carrés

Soit {(xi , yi ); i = 1, . . . , n} une série statistique bivariée. Notons


par
ŷi = a + bxi , i = 1, . . . , n
les valeurs ajustés de la variable y par la variable x

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 19 / 41


Ajustement linéaire simple Ajustement par la méthode des moindres carrés

Ajustement par la Méthode des Moindres Carrés

Soit {(xi , yi ); i = 1, . . . , n} une série statistique bivariée. Notons


par
ŷi = a + bxi , i = 1, . . . , n
les valeurs ajustés de la variable y par la variable x
Alors, il est possible de calculer les résidus :

ei = yi − ŷi = yi − a − bxi

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 19 / 41


Ajustement linéaire simple Ajustement par la méthode des moindres carrés

Ajustement par la Méthode des Moindres Carrés

Soit {(xi , yi ); i = 1, . . . , n} une série statistique bivariée. Notons


par
ŷi = a + bxi , i = 1, . . . , n
les valeurs ajustés de la variable y par la variable x
Alors, il est possible de calculer les résidus :

ei = yi − ŷi = yi − a − bxi

L’idée de l’ajustement est la minimisation des écarts (résidus)


entre la valeur de l’observation yi et la valeur ajustée ŷi

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 19 / 41


Ajustement linéaire simple Ajustement par la méthode des moindres carrés

Ajustement par la Méthode des Moindres Carrés

Soit {(xi , yi ); i = 1, . . . , n} une série statistique bivariée. Notons


par
ŷi = a + bxi , i = 1, . . . , n
les valeurs ajustés de la variable y par la variable x
Alors, il est possible de calculer les résidus :

ei = yi − ŷi = yi − a − bxi

L’idée de l’ajustement est la minimisation des écarts (résidus)


entre la valeur de l’observation yi et la valeur ajustée ŷi
Il existes différentes méthodes : Minimiser ni=1 ei2 ou ni=1 |ei |
P P
ou médiane(ei ) ou ...

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 19 / 41


Ajustement linéaire simple Ajustement par la méthode des moindres carrés

Ajustement par la Méthode des Moindres Carrés

Soit {(xi , yi ); i = 1, . . . , n} une série statistique bivariée. Notons


par
ŷi = a + bxi , i = 1, . . . , n
les valeurs ajustés de la variable y par la variable x
Alors, il est possible de calculer les résidus :

ei = yi − ŷi = yi − a − bxi

L’idée de l’ajustement est la minimisation des écarts (résidus)


entre la valeur de l’observation yi et la valeur ajustée ŷi
Il existes différentes méthodes : Minimiser ni=1 ei2 ou ni=1 |ei |
P P
ou médiane(ei ) ou ...

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 19 / 41


Ajustement linéaire simple Ajustement par la méthode des moindres carrés

Ajustement par la méthode des moindres carrés (suite)

La méthode la plus simple est la Méthode des Moindres Carrés


(MMC) qui consiste à la minimisation de la somme des carrés des
résidus :
Xn Xn
2
Q(a, b) = ei = (yi − a − bxi )2
i=1 i=1

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 20 / 41


Ajustement linéaire simple Ajustement par la méthode des moindres carrés

Ajustement par la méthode des moindres carrés (suite)

La méthode la plus simple est la Méthode des Moindres Carrés


(MMC) qui consiste à la minimisation de la somme des carrés des
résidus :
Xn Xn
2
Q(a, b) = ei = (yi − a − bxi )2
i=1 i=1

Les paramètres a et b qui minimise la quantité Q(a, b) vérifient


nécessairement :

 (i) ∂Q(a, b) = 0 ;

∂a
∂Q(a, b)
 (ii) = 0.

∂b

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 20 / 41


Ajustement linéaire simple Ajustement par la méthode des moindres carrés

Ajustement par la méthode des moindres carrés (suite)

La méthode la plus simple est la Méthode des Moindres Carrés


(MMC) qui consiste à la minimisation de la somme des carrés des
résidus :
Xn Xn
2
Q(a, b) = ei = (yi − a − bxi )2
i=1 i=1

Les paramètres a et b qui minimise la quantité Q(a, b) vérifient


nécessairement :

 (i) ∂Q(a, b) = 0 ;

∂a
∂Q(a, b)
 (ii) = 0.

∂b

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 20 / 41


Ajustement linéaire simple Ajustement par la méthode des moindres carrés

Ajustement par la méthode des moindres carrés (suite)

La solution du système ci dessus est:


Sxy
b =
Sx2
a = y − bx

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 21 / 41


Ajustement linéaire simple Ajustement par la méthode des moindres carrés

Ajustement par la méthode des moindres carrés (suite)

La solution du système ci dessus est:


Sxy
b =
Sx2
a = y − bx
En calculant les dérivées secondes, on peut montrer que la
solution est bien un minimum (exercice!)

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 21 / 41


Ajustement linéaire simple Ajustement par la méthode des moindres carrés

Ajustement par la méthode des moindres carrés (suite)

La solution du système ci dessus est:


Sxy
b =
Sx2
a = y − bx
En calculant les dérivées secondes, on peut montrer que la
solution est bien un minimum (exercice!)
Formule de calcul:
X X X
( xi yi ) − ( xi yi )/n
i i i
b= X X
xi2 −( xi )2 /n
i i

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 21 / 41


Ajustement linéaire simple Ajustement par la méthode des moindres carrés

Ajustement par la méthode des moindres carrés (suite)

La solution du système ci dessus est:


Sxy
b =
Sx2
a = y − bx
En calculant les dérivées secondes, on peut montrer que la
solution est bien un minimum (exercice!)
Formule de calcul:
X X X
( xi yi ) − ( xi yi )/n
i i i
b= X X
xi2 −( xi )2 /n
i i

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 21 / 41


Ajustement linéaire simple Ajustement par la méthode des moindres carrés

Ajustement par la méthode des moindres carrés (suite)

Le point (x, y ) centre de gravité du nuage appartient à la droite de


régression :
y = a + bx

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 22 / 41


Ajustement linéaire simple Ajustement par la méthode des moindres carrés

Ajustement par la méthode des moindres carrés (suite)

Le point (x, y ) centre de gravité du nuage appartient à la droite de


régression :
y = a + bx
=⇒ la moyenne ajustée est égale à la moyenne réelle :
ŷ = a + bx = a + bx = y

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 22 / 41


Ajustement linéaire simple Ajustement par la méthode des moindres carrés

Ajustement par la méthode des moindres carrés (suite)

Le point (x, y ) centre de gravité du nuage appartient à la droite de


régression :
y = a + bx
=⇒ la moyenne ajustée est égale à la moyenne réelle :
ŷ = a + bx = a + bx = y
=⇒ En moyenne l’erreur d’ajustement est nulle :
e = y − ŷ = y − ŷ = 0

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 22 / 41


Ajustement linéaire simple Ajustement par la méthode des moindres carrés

Ajustement par la méthode des moindres carrés (suite)

Le point (x, y ) centre de gravité du nuage appartient à la droite de


régression :
y = a + bx
=⇒ la moyenne ajustée est égale à la moyenne réelle :
ŷ = a + bx = a + bx = y
=⇒ En moyenne l’erreur d’ajustement est nulle :
e = y − ŷ = y − ŷ = 0

Si x = 0 alors y = a c’est la valeur de y à l’origine

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 22 / 41


Ajustement linéaire simple Ajustement par la méthode des moindres carrés

Ajustement par la méthode des moindres carrés (suite)

Le point (x, y ) centre de gravité du nuage appartient à la droite de


régression :
y = a + bx
=⇒ la moyenne ajustée est égale à la moyenne réelle :
ŷ = a + bx = a + bx = y
=⇒ En moyenne l’erreur d’ajustement est nulle :
e = y − ŷ = y − ŷ = 0

Si x = 0 alors y = a c’est la valeur de y à l’origine


En général
y = a + bx ⇔ ∆y = a ∗ ∆x

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 22 / 41


Ajustement linéaire simple Ajustement par la méthode des moindres carrés

Ajustement par la méthode des moindres carrés (suite)

Le point (x, y ) centre de gravité du nuage appartient à la droite de


régression :
y = a + bx
=⇒ la moyenne ajustée est égale à la moyenne réelle :
ŷ = a + bx = a + bx = y
=⇒ En moyenne l’erreur d’ajustement est nulle :
e = y − ŷ = y − ŷ = 0

Si x = 0 alors y = a c’est la valeur de y à l’origine


En général
y = a + bx ⇔ ∆y = a ∗ ∆x
ainsi une augmentation de la variable x d’une unité (∆x = 1)
produit une variation de y par ∆y = a unité
S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 22 / 41
Ajustement linéaire simple Ajustement par la méthode des moindres carrés

Ajustement par la méthode des moindres carrés (suite)

Le point (x, y ) centre de gravité du nuage appartient à la droite de


régression :
y = a + bx
=⇒ la moyenne ajustée est égale à la moyenne réelle :
ŷ = a + bx = a + bx = y
=⇒ En moyenne l’erreur d’ajustement est nulle :
e = y − ŷ = y − ŷ = 0

Si x = 0 alors y = a c’est la valeur de y à l’origine


En général
y = a + bx ⇔ ∆y = a ∗ ∆x
ainsi une augmentation de la variable x d’une unité (∆x = 1)
produit une variation de y par ∆y = a unité
S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 22 / 41
Ajustement linéaire simple Ajustement par la méthode des moindres carrés

Exemple (suite)

Le tableau permettant le calcul des coefficients de régression:

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 23 / 41


Ajustement linéaire simple Ajustement par la méthode des moindres carrés

Exemple (suite)

Le tableau permettant le calcul des coefficients de régression:

Les coefficients de la droite sont :


1677 − 31 ∗ 510/10
b= ≈ 4.59
117 − 312 /10

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 23 / 41


Ajustement linéaire simple Ajustement par la méthode des moindres carrés

Exemple (suite)

Le tableau permettant le calcul des coefficients de régression:

Les coefficients de la droite sont :


1677 − 31 ∗ 510/10
b= ≈ 4.59
117 − 312 /10
X X
a=( yi )/n − b( xi )/n = (510/10) − 4.59 ∗ (31/10) ≈ 36.76
i i
S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 23 / 41
Ajustement linéaire simple Ajustement par la méthode des moindres carrés

Exemple (suite)

Le tableau permettant le calcul des coefficients de régression:

Les coefficients de la droite sont :


1677 − 31 ∗ 510/10
b= ≈ 4.59
117 − 312 /10
X X
a=( yi )/n − b( xi )/n = (510/10) − 4.59 ∗ (31/10) ≈ 36.76
i i
S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 23 / 41
Ajustement linéaire simple Ajustement par la méthode des moindres carrés

MMC: Exemple

Ainsi, l’équation de la droite d’ajustement est :

y = 36.76 + 4.59 ∗ x

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 24 / 41


Ajustement linéaire simple Ajustement par la méthode des moindres carrés

MMC: Exemple

Ainsi, l’équation de la droite d’ajustement est :

y = 36.76 + 4.59 ∗ x

N. B. Via la formule de la définition :


Sxy 9.6
b= 2
= ≈ 4.59
Sx 117/10 − (31/10)2

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 24 / 41


Ajustement linéaire simple Ajustement par la méthode des moindres carrés

MMC: Exemple

Ainsi, l’équation de la droite d’ajustement est :

y = 36.76 + 4.59 ∗ x

N. B. Via la formule de la définition :


Sxy 9.6
b= 2
= ≈ 4.59
Sx 117/10 − (31/10)2

∆y = 4.59 ∗ ∆x, une augmentation du nombre de spots par un


produit une augmentation de Y par ∆y = 459 $

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 24 / 41


Ajustement linéaire simple Ajustement par la méthode des moindres carrés

MMC: Exemple

Ainsi, l’équation de la droite d’ajustement est :

y = 36.76 + 4.59 ∗ x

N. B. Via la formule de la définition :


Sxy 9.6
b= 2
= ≈ 4.59
Sx 117/10 − (31/10)2

∆y = 4.59 ∗ ∆x, une augmentation du nombre de spots par un


produit une augmentation de Y par ∆y = 459 $
x = 0 implique ŷ = a = 3676 $ c’est le montant incompressible
des ventes

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 24 / 41


Ajustement linéaire simple Qualité de l’ajustement

Analyse de la variance (ANOVA)

La variance de la variable à expliquer y se compose de deux


parties:
d’une part la partie expliquée par la droite de régression dite la
variance de régression

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 25 / 41


Ajustement linéaire simple Qualité de l’ajustement

Analyse de la variance (ANOVA)

La variance de la variable à expliquer y se compose de deux


parties:
d’une part la partie expliquée par la droite de régression dite la
variance de régression
d’autre part la partie non expliquée par la régression dite la
variance résiduelle

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 25 / 41


Ajustement linéaire simple Qualité de l’ajustement

Analyse de la variance (ANOVA)

La variance de la variable à expliquer y se compose de deux


parties:
d’une part la partie expliquée par la droite de régression dite la
variance de régression
d’autre part la partie non expliquée par la régression dite la
variance résiduelle
On montre l’equation de l’ANOVA
n
X n
X
Sy2 = (yi − ŷi )2 + (ŷi − y )2
i=1 i=1

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 25 / 41


Ajustement linéaire simple Qualité de l’ajustement

Analyse de la variance (ANOVA)

La variance de la variable à expliquer y se compose de deux


parties:
d’une part la partie expliquée par la droite de régression dite la
variance de régression
d’autre part la partie non expliquée par la régression dite la
variance résiduelle
On montre l’equation de l’ANOVA
n
X n
X
Sy2 = (yi − ŷi )2 + (ŷi − y )2
i=1 i=1
2 2
= Sres + Sreg

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 25 / 41


Ajustement linéaire simple Qualité de l’ajustement

Le R-deux

On peut prouver que


Sy
b=r
Sx

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 26 / 41


Ajustement linéaire simple Qualité de l’ajustement

Le R-deux

On peut prouver que


Sy
b=r
Sx
⇒ b la pente de la droite et r sont de même signe, ainsi r > 0 ⇔
droite d’ajustement ascendante (%)

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 26 / 41


Ajustement linéaire simple Qualité de l’ajustement

Le R-deux

On peut prouver que


Sy
b=r
Sx
⇒ b la pente de la droite et r sont de même signe, ainsi r > 0 ⇔
droite d’ajustement ascendante (%)
On montre que :
2
Sreg
2
Sreg = Sy2 r 2 ⇔ r 2 =
Sy2
Le R-deux mesure le pourcentage de la variance de la variable
réponse y expliqué linéairement par la variable explicative x

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 26 / 41


Ajustement linéaire simple Qualité de l’ajustement

Le R-deux

On peut prouver que


Sy
b=r
Sx
⇒ b la pente de la droite et r sont de même signe, ainsi r > 0 ⇔
droite d’ajustement ascendante (%)
On montre que :
2
Sreg
2
Sreg = Sy2 r 2 ⇔ r 2 =
Sy2
Le R-deux mesure le pourcentage de la variance de la variable
réponse y expliqué linéairement par la variable explicative x
Exemple: Le R-deux est r 2 = 0.8832 = 0.779

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 26 / 41


Ajustement linéaire simple Qualité de l’ajustement

Le R-deux

On peut prouver que


Sy
b=r
Sx
⇒ b la pente de la droite et r sont de même signe, ainsi r > 0 ⇔
droite d’ajustement ascendante (%)
On montre que :
2
Sreg
2
Sreg = Sy2 r 2 ⇔ r 2 =
Sy2
Le R-deux mesure le pourcentage de la variance de la variable
réponse y expliqué linéairement par la variable explicative x
Exemple: Le R-deux est r 2 = 0.8832 = 0.779
=⇒ Environ 77.9% de la variabilité des ventes hebdomadaires est
expliquée d’une façon linéaire par la variabilité des nombres des
spots publicitaires diffusés les week-end
S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 26 / 41
Tableau de contingence Définition

Tableau de contingence

Si la taille n de la population est assez grande le couple (xi , yj )


peut être observé plusieurs fois

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 27 / 41


Tableau de contingence Définition

Tableau de contingence

Si la taille n de la population est assez grande le couple (xi , yj )


peut être observé plusieurs fois
Soit nij le nombre des unités dont les variables x et y ont pris
respectivement les valeurs xi et yj : nij est dit l’effectif du couple
(xi , yj )

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 27 / 41


Tableau de contingence Définition

Tableau de contingence

Si la taille n de la population est assez grande le couple (xi , yj )


peut être observé plusieurs fois
Soit nij le nombre des unités dont les variables x et y ont pris
respectivement les valeurs xi et yj : nij est dit l’effectif du couple
(xi , yj )
On organise les données dans un tableau de contingence ou
tableau double:

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 27 / 41


Tableau de contingence Définition

Tableau de contingence

Si la taille n de la population est assez grande le couple (xi , yj )


peut être observé plusieurs fois
Soit nij le nombre des unités dont les variables x et y ont pris
respectivement les valeurs xi et yj : nij est dit l’effectif du couple
(xi , yj )
On organise les données dans un tableau de contingence ou
tableau double:

(xi , yj , nij ), i = 1, . . . , p, j = 1, . . . , q

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 27 / 41


Tableau de contingence Définition

Tableau de contingence

Si la taille n de la population est assez grande le couple (xi , yj )


peut être observé plusieurs fois
Soit nij le nombre des unités dont les variables x et y ont pris
respectivement les valeurs xi et yj : nij est dit l’effectif du couple
(xi , yj )
On organise les données dans un tableau de contingence ou
tableau double:

(xi , yj , nij ), i = 1, . . . , p, j = 1, . . . , q

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 27 / 41


Tableau de contingence Définition

Tableau de contingence

x ↓ \y → y1 y2 ... yj ... yq ni.


x1 n11 n12 ... n1j ... n1q n1.
x2 n21 n22 ... n2j ... n2q n2.
.. .. .. .. .. .. .. ..
. . . . . . . .
xi ni1 ni2 ... nij ... niq ni.
.. .. .. .. .. .. .. ..
. . . . . . . .
xp np1 np2 ... npj ... npq np.
n.j n.1 n.2 ... n.j ... n.q n..

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 28 / 41


Tableau de contingence Définition

Exemple

Pour un échantillon composé de 20 licenciés à la FSJESO, on


s’intéresse au nombre x des 2ième sessions présentées dans le 1ière
cycle et au nombre y des 2ième sessions présentées dans le second
cycle

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 29 / 41


Tableau de contingence Définition

Exemple

Pour un échantillon composé de 20 licenciés à la FSJESO, on


s’intéresse au nombre x des 2ième sessions présentées dans le 1ière
cycle et au nombre y des 2ième sessions présentées dans le second
cycle

i 1 2 3 4 5 6 7 8 9 10
x 0 0 0 0 0 0 0 0 0 0
y 0 0 1 1 1 2 2 2 2 3
i 11 12 13 14 15 16 17 18 19 20
x 0 1 1 1 1 2 2 2 2 3
y 3 3 3 4 4 0 1 3 4 5

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 29 / 41


Tableau de contingence Définition

Exemple

Pour un échantillon composé de 20 licenciés à la FSJESO, on


s’intéresse au nombre x des 2ième sessions présentées dans le 1ière
cycle et au nombre y des 2ième sessions présentées dans le second
cycle

i 1 2 3 4 5 6 7 8 9 10
x 0 0 0 0 0 0 0 0 0 0
y 0 0 1 1 1 2 2 2 2 3
i 11 12 13 14 15 16 17 18 19 20
x 0 1 1 1 1 2 2 2 2 3
y 3 3 3 4 4 0 1 3 4 5

Les étudiants sans 2ième session dans le premier cycle ont-ils


plus de chances de réussite en 1ière session que les autres ?

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 29 / 41


Tableau de contingence Définition

Exemple

Pour un échantillon composé de 20 licenciés à la FSJESO, on


s’intéresse au nombre x des 2ième sessions présentées dans le 1ière
cycle et au nombre y des 2ième sessions présentées dans le second
cycle

i 1 2 3 4 5 6 7 8 9 10
x 0 0 0 0 0 0 0 0 0 0
y 0 0 1 1 1 2 2 2 2 3
i 11 12 13 14 15 16 17 18 19 20
x 0 1 1 1 1 2 2 2 2 3
y 3 3 3 4 4 0 1 3 4 5

Les étudiants sans 2ième session dans le premier cycle ont-ils


plus de chances de réussite en 1ière session que les autres ?

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 29 / 41


Tableau de contingence Définition

Exemple (suite)

Réorganisons ces données dans un tableau à double entrées:


x ↓ \y → y =0 y =1 y =2 y =3 y =4 y =5 ni.
x =0 2 3 4 2 0 0 11
x =1 0 0 0 2 2 0 4
x =2 1 1 0 1 1 0 4
x =3 0 0 0 0 0 1 1
n.j 3 4 4 5 3 1 20

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 30 / 41


Tableau de contingence Définition

Exemple (suite)

Réorganisons ces données dans un tableau à double entrées:


x ↓ \y → y =0 y =1 y =2 y =3 y =4 y =5 ni.
x =0 2 3 4 2 0 0 11
x =1 0 0 0 2 2 0 4
x =2 1 1 0 1 1 0 4
x =3 0 0 0 0 0 1 1
n.j 3 4 4 5 3 1 20
La variable x a pris 4 valeurs ainsi p = 4, La variable y a pris 6
valeurs ainsi q = 6 et l’effectif total est n = 20

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 30 / 41


Tableau de contingence Définition

Exemple (suite)

Réorganisons ces données dans un tableau à double entrées:


x ↓ \y → y =0 y =1 y =2 y =3 y =4 y =5 ni.
x =0 2 3 4 2 0 0 11
x =1 0 0 0 2 2 0 4
x =2 1 1 0 1 1 0 4
x =3 0 0 0 0 0 1 1
n.j 3 4 4 5 3 1 20
La variable x a pris 4 valeurs ainsi p = 4, La variable y a pris 6
valeurs ainsi q = 6 et l’effectif total est n = 20
L’effectif n11 = 2 indique que deux étudiants de l’échantillon n’ont
jamais eu de 2ième session (x = 0 et y = 0)

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 30 / 41


Tableau de contingence Définition

Exemple (suite)

Réorganisons ces données dans un tableau à double entrées:


x ↓ \y → y =0 y =1 y =2 y =3 y =4 y =5 ni.
x =0 2 3 4 2 0 0 11
x =1 0 0 0 2 2 0 4
x =2 1 1 0 1 1 0 4
x =3 0 0 0 0 0 1 1
n.j 3 4 4 5 3 1 20
La variable x a pris 4 valeurs ainsi p = 4, La variable y a pris 6
valeurs ainsi q = 6 et l’effectif total est n = 20
L’effectif n11 = 2 indique que deux étudiants de l’échantillon n’ont
jamais eu de 2ième session (x = 0 et y = 0)
L’effectif n34 = 1 indique qu’un seul étudiant a eu deux 2ième
sessions en premier cycle et trois 2ième sessions au second
cycle (x = 2 et y = 3)
S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 30 / 41
Tableau de contingence Définition

Exemple (suite)

Réorganisons ces données dans un tableau à double entrées:


x ↓ \y → y =0 y =1 y =2 y =3 y =4 y =5 ni.
x =0 2 3 4 2 0 0 11
x =1 0 0 0 2 2 0 4
x =2 1 1 0 1 1 0 4
x =3 0 0 0 0 0 1 1
n.j 3 4 4 5 3 1 20
La variable x a pris 4 valeurs ainsi p = 4, La variable y a pris 6
valeurs ainsi q = 6 et l’effectif total est n = 20
L’effectif n11 = 2 indique que deux étudiants de l’échantillon n’ont
jamais eu de 2ième session (x = 0 et y = 0)
L’effectif n34 = 1 indique qu’un seul étudiant a eu deux 2ième
sessions en premier cycle et trois 2ième sessions au second
cycle (x = 2 et y = 3)
S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 30 / 41
Tableau de contingence Définition

Exemple (suite)

x ↓ \y → y =0 y =1 y =2 y =3 y =4 y =5 ni.
x =0 2 3 4 2 0 0 11
x =1 0 0 0 2 2 0 4
x =2 1 1 0 1 1 0 4
x =3 0 0 0 0 0 1 1
n.j 3 4 4 5 3 1 20

n1. = 11 indique que l’effectif des étudiants n’ayant jamais eu de


2ième session en premier cycle est 11

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 31 / 41


Tableau de contingence Définition

Exemple (suite)

x ↓ \y → y =0 y =1 y =2 y =3 y =4 y =5 ni.
x =0 2 3 4 2 0 0 11
x =1 0 0 0 2 2 0 4
x =2 1 1 0 1 1 0 4
x =3 0 0 0 0 0 1 1
n.j 3 4 4 5 3 1 20

n1. = 11 indique que l’effectif des étudiants n’ayant jamais eu de


2ième session en premier cycle est 11
n = 5 indique que l’effectif des étudiants ayant trois 2ième
.4
session en second cycle est 5

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 31 / 41


Tableau de contingence Définition

Exemple (suite)

x ↓ \y → y =0 y =1 y =2 y =3 y =4 y =5 ni.
x =0 2 3 4 2 0 0 11
x =1 0 0 0 2 2 0 4
x =2 1 1 0 1 1 0 4
x =3 0 0 0 0 0 1 1
n.j 3 4 4 5 3 1 20

n1. = 11 indique que l’effectif des étudiants n’ayant jamais eu de


2ième session en premier cycle est 11
n = 5 indique que l’effectif des étudiants ayant trois 2ième
.4
session en second cycle est 5

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 31 / 41


Tableau de contingence Distributions marginales

Distributions marginales

L’étude marginale de la série double est l’étude d’une seule série


observée abstraction faite de l’autre série

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 32 / 41


Tableau de contingence Distributions marginales

Distributions marginales

L’étude marginale de la série double est l’étude d’une seule série


observée abstraction faite de l’autre série
La série marginale est donc une série univariée

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 32 / 41


Tableau de contingence Distributions marginales

Distributions marginales

L’étude marginale de la série double est l’étude d’une seule série


observée abstraction faite de l’autre série
La série marginale est donc une série univariée
Ainsi on peut définir deux séries marginales
La série marginale une en x

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 32 / 41


Tableau de contingence Distributions marginales

Distributions marginales

L’étude marginale de la série double est l’étude d’une seule série


observée abstraction faite de l’autre série
La série marginale est donc une série univariée
Ainsi on peut définir deux séries marginales
La série marginale une en x
La série marginale une en y

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 32 / 41


Tableau de contingence Distributions marginales

Distributions marginales

L’étude marginale de la série double est l’étude d’une seule série


observée abstraction faite de l’autre série
La série marginale est donc une série univariée
Ainsi on peut définir deux séries marginales
La série marginale une en x
La série marginale une en y

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 32 / 41


Tableau de contingence Distributions marginales

Distribution marginale en x

La série marginale en x est la série {xi ; i = 1, . . . , n} ou encore


{(xi , ni. ); i = 1, . . . , p}
q
X
où ni. = nij sont les effectifs marginaux
j=1

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 33 / 41


Tableau de contingence Distributions marginales

Distribution marginale en x

La série marginale en x est la série {xi ; i = 1, . . . , n} ou encore


{(xi , ni. ); i = 1, . . . , p}
q
X
où ni. = nij sont les effectifs marginaux
j=1
ni.
Les fréquences marginales en x sont fi. = i = 1, . . . , p
n

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 33 / 41


Tableau de contingence Distributions marginales

Distribution marginale en x

La série marginale en x est la série {xi ; i = 1, . . . , n} ou encore


{(xi , ni. ); i = 1, . . . , p}
q
X
où ni. = nij sont les effectifs marginaux
j=1
ni.
Les fréquences marginales en x sont fi. = i = 1, . . . , p
n
La moyenne marginale de x est
n p
1X 1X
x= xi = ni. xi
n n
i=1 i=1

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 33 / 41


Tableau de contingence Distributions marginales

Distribution marginale en x

La série marginale en x est la série {xi ; i = 1, . . . , n} ou encore


{(xi , ni. ); i = 1, . . . , p}
q
X
où ni. = nij sont les effectifs marginaux
j=1
ni.
Les fréquences marginales en x sont fi. = i = 1, . . . , p
n
La moyenne marginale de x est
n p
1X 1X
x= xi = ni. xi
n n
i=1 i=1

La variance marginale de x est


n p
1X 1X
Sx2 = (xi − x)2 = ni. (xi − x)2
n n
i=1 i=1
S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 33 / 41
Tableau de contingence Distributions marginales

Distribution marginale en x

La série marginale en x est la série {xi ; i = 1, . . . , n} ou encore


{(xi , ni. ); i = 1, . . . , p}
q
X
où ni. = nij sont les effectifs marginaux
j=1
ni.
Les fréquences marginales en x sont fi. = i = 1, . . . , p
n
La moyenne marginale de x est
n p
1X 1X
x= xi = ni. xi
n n
i=1 i=1

La variance marginale de x est


n p
1X 1X
Sx2 = (xi − x)2 = ni. (xi − x)2
n n
i=1 i=1
S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 33 / 41
Tableau de contingence Distributions marginales

Distribution marginale en y

La série marginale en y est la série yj ; j = 1, 2, . . . , n ou
encore 
(yj , n.j ); j = 1, 2, . . . , q
Pp
où n.j = i=1 nij sont les effectifs marginaux

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 34 / 41


Tableau de contingence Distributions marginales

Distribution marginale en y

La série marginale en y est la série yj ; j = 1, 2, . . . , n ou
encore 
(yj , n.j ); j = 1, 2, . . . , q
Pp
où n.j = i=1 nij sont les effectifs marginaux
n.j
Les fréquences marginales en y sont f.j = j = 1, 2, . . . , q
n

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 34 / 41


Tableau de contingence Distributions marginales

Distribution marginale en y

La série marginale en y est la série yj ; j = 1, 2, . . . , n ou
encore 
(yj , n.j ); j = 1, 2, . . . , q
Pp
où n.j = i=1 nij sont les effectifs marginaux
n.j
Les fréquences marginales en y sont f.j = j = 1, 2, . . . , q
n
La moyenne marginale de y est
n q
1X 1X
y= yi = n.j yj
n n
i=1 j=1

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 34 / 41


Tableau de contingence Distributions marginales

Distribution marginale en y

La série marginale en y est la série yj ; j = 1, 2, . . . , n ou
encore 
(yj , n.j ); j = 1, 2, . . . , q
Pp
où n.j = i=1 nij sont les effectifs marginaux
n.j
Les fréquences marginales en y sont f.j = j = 1, 2, . . . , q
n
La moyenne marginale de y est
n q
1X 1X
y= yi = n.j yj
n n
i=1 j=1

La variance marginale de y est


n q
1X 1X
Sy2 = (yi − y )2 = n.j (yj − y )2
n n
i=1 j=1

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 34 / 41


Tableau de contingence Distributions marginales

Distribution marginale en y

La série marginale en y est la série yj ; j = 1, 2, . . . , n ou
encore 
(yj , n.j ); j = 1, 2, . . . , q
Pp
où n.j = i=1 nij sont les effectifs marginaux
n.j
Les fréquences marginales en y sont f.j = j = 1, 2, . . . , q
n
La moyenne marginale de y est
n q
1X 1X
y= yi = n.j yj
n n
i=1 j=1

La variance marginale de y est


n q
1X 1X
Sy2 = (yi − y )2 = n.j (yj − y )2
n n
i=1 j=1

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 34 / 41


Tableau de contingence Distributions marginales

Exemple: la distribution marginale en x

P
xi 0 1 2 3
ni. 11 4 4 1 20
fi. 0.55 0.2 0.2 0.05 1

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 35 / 41


Tableau de contingence Distributions marginales

Exemple: la distribution marginale en x

P
xi 0 1 2 3
ni. 11 4 4 1 20
fi. 0.55 0.2 0.2 0.05 1

La moyenne de x est

x = (11 ∗ 0 + 4 ∗ 1 + 4 ∗ 2 + 1 ∗ 3)/20 = 0.75

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 35 / 41


Tableau de contingence Distributions marginales

Exemple: la distribution marginale en x

P
xi 0 1 2 3
ni. 11 4 4 1 20
fi. 0.55 0.2 0.2 0.05 1

La moyenne de x est

x = (11 ∗ 0 + 4 ∗ 1 + 4 ∗ 2 + 1 ∗ 3)/20 = 0.75

la variance de x est

Sx2 = (11 ∗ 02 + 4 ∗ 12 + 4 ∗ 22 + 1 ∗ 32 )/20 − (0.75)2 = 0.8875

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 35 / 41


Tableau de contingence Distributions marginales

Exemple: la distribution marginale en x

P
xi 0 1 2 3
ni. 11 4 4 1 20
fi. 0.55 0.2 0.2 0.05 1

La moyenne de x est

x = (11 ∗ 0 + 4 ∗ 1 + 4 ∗ 2 + 1 ∗ 3)/20 = 0.75

la variance de x est

Sx2 = (11 ∗ 02 + 4 ∗ 12 + 4 ∗ 22 + 1 ∗ 32 )/20 − (0.75)2 = 0.8875

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 35 / 41


Tableau de contingence Distributions marginales

Exemple: la distribution marginale en y

P
yj 0 1 2 3 4 5
n.j 3 4 4 5 3 1 20
f.j 0.15 0.2 0.2 0.25 0.15 0.05 1

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 36 / 41


Tableau de contingence Distributions marginales

Exemple: la distribution marginale en y

P
yj 0 1 2 3 4 5
n.j 3 4 4 5 3 1 20
f.j 0.15 0.2 0.2 0.25 0.15 0.05 1
La moyenne de y est
y = (3 ∗ 0 + 4 ∗ 1 + 4 ∗ 2 + 5 ∗ 3 + 3 ∗ 4 + 1 ∗ 5)/20 = 2.2

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 36 / 41


Tableau de contingence Distributions marginales

Exemple: la distribution marginale en y

P
yj 0 1 2 3 4 5
n.j 3 4 4 5 3 1 20
f.j 0.15 0.2 0.2 0.25 0.15 0.05 1
La moyenne de y est
y = (3 ∗ 0 + 4 ∗ 1 + 4 ∗ 2 + 5 ∗ 3 + 3 ∗ 4 + 1 ∗ 5)/20 = 2.2

La variance de y est
Sy2 = (3∗02 +4∗12 +4∗22 +5∗32 +3∗42 +1∗52 )/20−(2.2)2 = 2.06

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 36 / 41


Tableau de contingence Distributions marginales

Exemple: la distribution marginale en y

P
yj 0 1 2 3 4 5
n.j 3 4 4 5 3 1 20
f.j 0.15 0.2 0.2 0.25 0.15 0.05 1
La moyenne de y est
y = (3 ∗ 0 + 4 ∗ 1 + 4 ∗ 2 + 5 ∗ 3 + 3 ∗ 4 + 1 ∗ 5)/20 = 2.2

La variance de y est
Sy2 = (3∗02 +4∗12 +4∗22 +5∗32 +3∗42 +1∗52 )/20−(2.2)2 = 2.06

N. B. Notons que
p
X p X
X q q
X
ni. = nij = n.j = n
i=1 i=1 j=1 j=1

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 36 / 41


Tableau de contingence Distributions marginales

Exemple: la distribution marginale en y

P
yj 0 1 2 3 4 5
n.j 3 4 4 5 3 1 20
f.j 0.15 0.2 0.2 0.25 0.15 0.05 1
La moyenne de y est
y = (3 ∗ 0 + 4 ∗ 1 + 4 ∗ 2 + 5 ∗ 3 + 3 ∗ 4 + 1 ∗ 5)/20 = 2.2

La variance de y est
Sy2 = (3∗02 +4∗12 +4∗22 +5∗32 +3∗42 +1∗52 )/20−(2.2)2 = 2.06

N. B. Notons que
p
X p X
X q q
X
ni. = nij = n.j = n
i=1 i=1 j=1 j=1

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 36 / 41


Tableau de contingence Distributions marginales

Réécriture de la covariance et le coefficient de Corrélation

Remarques
La covariance et le coefficient de corrélation de x et y sont :
  !  q 
p X q p
1 X 1 X 1 X
Sxy = cov (x, y ) =  (nij xi yj ) − ni. xi ∗  n.j yj 
n n n
i=1 j=1 i=1 j=1

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 37 / 41


Tableau de contingence Distributions marginales

Réécriture de la covariance et le coefficient de Corrélation

Remarques
La covariance et le coefficient de corrélation de x et y sont :
  !  q 
p X q p
1 X 1 X 1 X
Sxy = cov (x, y ) =  (nij xi yj ) − ni. xi ∗  n.j yj 
n n n
i=1 j=1 i=1 j=1

Xp X
q Xp q
X
( nij xi yj ) − ( ni. xi n.j yj )/n
i=1 j=1 i=1 j=1
r=v v
u p p uXq q
uX 2
X
2 2
X
n.j yj )2 /n
u
t ni. x − ( ni. xi ) /n
i
t nj. y − ( j
i=1 i=1 j=1 j=1

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 37 / 41


Tableau de contingence Distributions conditionnelles

Distributions conditionnelles

Parmi les étudiants n’ayant jamais eu de 2ème session dans le


premier cycle (x = 0), quel est le pourcentage des étudiants
réussissant avec une seule 2ème session au second cycle
(y = 1)?

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 38 / 41


Tableau de contingence Distributions conditionnelles

Distributions conditionnelles

Parmi les étudiants n’ayant jamais eu de 2ème session dans le


premier cycle (x = 0), quel est le pourcentage des étudiants
réussissant avec une seule 2ème session au second cycle
(y = 1)?
La réponse à cette question revient à calculer la fréquence des
unités ayant y = 1 parmi ceux ayant x fixé à la valeur x = 0

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 38 / 41


Tableau de contingence Distributions conditionnelles

Distributions conditionnelles

Parmi les étudiants n’ayant jamais eu de 2ème session dans le


premier cycle (x = 0), quel est le pourcentage des étudiants
réussissant avec une seule 2ème session au second cycle
(y = 1)?
La réponse à cette question revient à calculer la fréquence des
unités ayant y = 1 parmi ceux ayant x fixé à la valeur x = 0
L’étude conditionnelle d’une série observée est l’étude de cette
série en fixant la valeur de l’autre série. On fixe x = xi , et on
étudie la distribution des valeurs de y associées à x = xi

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 38 / 41


Tableau de contingence Distributions conditionnelles

Distributions conditionnelles

Parmi les étudiants n’ayant jamais eu de 2ème session dans le


premier cycle (x = 0), quel est le pourcentage des étudiants
réussissant avec une seule 2ème session au second cycle
(y = 1)?
La réponse à cette question revient à calculer la fréquence des
unités ayant y = 1 parmi ceux ayant x fixé à la valeur x = 0
L’étude conditionnelle d’une série observée est l’étude de cette
série en fixant la valeur de l’autre série. On fixe x = xi , et on
étudie la distribution des valeurs de y associées à x = xi

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 38 / 41


Tableau de contingence Distributions conditionnelles

Distributions conditionnelles de y en x

Fixons x = xi , la série conditionnelle de y en x = xi est la série


univariée définie par

y |xi = (yj , nij ), j = 1, . . . , q

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 39 / 41


Tableau de contingence Distributions conditionnelles

Distributions conditionnelles de y en x

Fixons x = xi , la série conditionnelle de y en x = xi est la série


univariée définie par

y |xi = (yj , nij ), j = 1, . . . , q

Les fréquences de cette série sont dites fréquences


conditionnelles (profil-lignes) et elles sont définies par
nij
fyj |xi = fj|i = ; j = 1, . . . , q
ni.

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 39 / 41


Tableau de contingence Distributions conditionnelles

Distributions conditionnelles de y en x

Fixons x = xi , la série conditionnelle de y en x = xi est la série


univariée définie par

y |xi = (yj , nij ), j = 1, . . . , q

Les fréquences de cette série sont dites fréquences


conditionnelles (profil-lignes) et elles sont définies par
nij
fyj |xi = fj|i = ; j = 1, . . . , q
ni.

On peut calculer aussi la moyenne, la variance,. . . conditionnelles:


q q
1 X 2 1 X
y |xi = nij yj ; Sy |x = nij (yj − y |xi )2
ni. i ni.
j=1 j=1

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 39 / 41


Tableau de contingence Distributions conditionnelles

Distributions conditionnelles de y en x

Fixons x = xi , la série conditionnelle de y en x = xi est la série


univariée définie par

y |xi = (yj , nij ), j = 1, . . . , q

Les fréquences de cette série sont dites fréquences


conditionnelles (profil-lignes) et elles sont définies par
nij
fyj |xi = fj|i = ; j = 1, . . . , q
ni.

On peut calculer aussi la moyenne, la variance,. . . conditionnelles:


q q
1 X 2 1 X
y |xi = nij yj ; Sy |x = nij (yj − y |xi )2
ni. i ni.
j=1 j=1

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 39 / 41


Tableau de contingence Distributions conditionnelles

Distribution conditionnelle de x en y

Fixons y = yj , la série conditionnelle de x en y = yj est la série


univariée définie par

x|yj = (xi , nij ), i = 1, . . . , p

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 40 / 41


Tableau de contingence Distributions conditionnelles

Distribution conditionnelle de x en y

Fixons y = yj , la série conditionnelle de x en y = yj est la série


univariée définie par

x|yj = (xi , nij ), i = 1, . . . , p

Les fréquences de cette série sont dites fréquences


conditionnelles (profil-colonnes) et elles sont définies par
nij
fxi |yj = fi|j = ; i = 1, . . . , p
n.j

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 40 / 41


Tableau de contingence Distributions conditionnelles

Distribution conditionnelle de x en y

Fixons y = yj , la série conditionnelle de x en y = yj est la série


univariée définie par

x|yj = (xi , nij ), i = 1, . . . , p

Les fréquences de cette série sont dites fréquences


conditionnelles (profil-colonnes) et elles sont définies par
nij
fxi |yj = fi|j = ; i = 1, . . . , p
n.j

On peut calculer aussi la moyenne, la variance,. . . conditionnelles:


p p
1 X 2 1 X
x|yj = nij xi ; Sx|y = nij (xi − x|yj )2
n.j j n.j
i=1 i=1

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 40 / 41


Tableau de contingence Distributions conditionnelles

Distribution conditionnelle de x en y

Fixons y = yj , la série conditionnelle de x en y = yj est la série


univariée définie par

x|yj = (xi , nij ), i = 1, . . . , p

Les fréquences de cette série sont dites fréquences


conditionnelles (profil-colonnes) et elles sont définies par
nij
fxi |yj = fi|j = ; i = 1, . . . , p
n.j

On peut calculer aussi la moyenne, la variance,. . . conditionnelles:


p p
1 X 2 1 X
x|yj = nij xi ; Sx|y = nij (xi − x|yj )2
n.j j n.j
i=1 i=1

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 40 / 41


Tableau de contingence Distributions conditionnelles

Combien il y’a de distributions conditionnelles?

Comme x prend p valeurs différentes, alors il existe p séries


conditionnelles de y en x

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 41 / 41


Tableau de contingence Distributions conditionnelles

Combien il y’a de distributions conditionnelles?

Comme x prend p valeurs différentes, alors il existe p séries


conditionnelles de y en x
Comme y prend q valeurs différentes, alors il existe q séries
conditionnelles de x en y

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 41 / 41


Tableau de contingence Distributions conditionnelles

Combien il y’a de distributions conditionnelles?

Comme x prend p valeurs différentes, alors il existe p séries


conditionnelles de y en x
Comme y prend q valeurs différentes, alors il existe q séries
conditionnelles de x en y
Exemple: Nombre moyen de secondes sessions au second cycle
sachant le nombre de secondes sessions dans le premier cycle :
xj y |xi
0 1.5455
1 3.5
2 2

S., El Melhaoui (FSJESO) Série statistique Bivariée 11/2021 41 / 41

Vous aimerez peut-être aussi