EXERCICES CORRIGES : tests de χ²
Exercice 1 : BTSA - Productions animales - Session 1993
(Troisième exercice sur 8 points)
Un étalon gris hétérozygote accouplé à des juments non grises produira des poulains gris
avec une probabilité de 0,25 d'après les lois de Mendel. Des juments non grises accouplées à cet
étalon et ayant produit 5 poulains ont donné les résultats suivants :
Nombre de poulains
gris sur les 5 0 1 2 3 et plus
produits
Nombre de juments
10 18 16 6
1. Soit X la variable aléatoire prenant pour valeur le nombre de poulains gris par jument.
Définir la loi de probabilité de X, sous l'hypothèse de Mendel.
2. A l'aide d'un test de χ² (au seuil de 5%), dire si les résultats observés permettent
d'accepter l'hypothèse de Mendel.
Proposition de corrigé :
1. Nous sommes dans le cas d'un schéma de Bernoulli (On suppose qu'il n'y a qu'un
poulain par portée):
- Pour chaque poulain il y a deux éventualités contraires :
soit il est gris (avec une probabilité p = 0,25)
soit il est non gris (avec une probabilité de 1 - p = 0,75)
- Les couleurs des 5 poulains d'une jument sont indépendantes et ont été
obtenues dans les mêmes conditions.
Ces deux conditions nous permettent de dire que, sous l'hypothèse de Mendel, X est de loi
binomiale B(5; 0,25).
2. Il s'agit ici d'un test d'ajustement :
Posons l'hypothèse nulle H0 : Les résultats sont conformes à la théorie.
C'est-à-dire : H0 : La variable aléatoire X suit la loi binomiale B(5; 0,25).
ENFA - Bulletin du GRES n°6 – mars 1998 page 37
Contact : Conf PY-MATH@[Link]
A l'aide de la formule P( X = k ) = C 5 × 0,25 × 0,75
5− k
pour 0 ≤ k ≤ 5 , nous
k k
allons calculer les probabilités puis les effectifs théoriques correspondant aux diverses valeurs
de X :
Nombre de
poulains gris 0 1 2 3 ou plus Totaux
sur les 5
produits
effectifs
observés (ni) 10 18 16 6 50
Probabilités 0,2373 0,3955 0,2637 0,1035 * 1
(pi)
effectifs
théoriques 11,87 19,78 13,18 5,17 * 50
(npi)
ni - npi -1,87 -1,78 2,82 0,83 0
*valeurs calculées par différence
La taille de l'échantillon est n = 50, c'est-à-dire l'effectif total.
Variable de décision :
Tous les effectifs théoriques étant supérieurs à 5, on peut dire que, sous l'hypothèse H0, la
( N i − np i ) 2
variable K 0 = ∑ suit approximativement la loi de χ² à 4 − 1 = 3 degrés de
np i
liberté (ddl).
Remarque : le N i en majuscule signifie qu'il s'agit ici d'une variable aléatoire mais une
minuscule est tolérée.
Calcul de la valeur de K 0 pour l’échantillon prélevé :
( n i − np i ) 2 ( n obs − n th ) 2
k0 = ∑ =∑
np i n th
1,87 2 1,78 2 2,82 2 0,832
k0 ≈ + + + soit k 0 ≈ 119
, .
11,87 19,78 13,18 5,17
Décision : α = 5%
Pour 3 ddl on lit dans la table : χ 0.95 = 7,81 (ce type de test est unilatéral).
2
k 0 est inférieur à cette valeur donc on ne rejette pas H0.
Nous pouvons donc en conclure, au seuil de 5 %, que les résultats observés ne
contredisent pas la théorie.
ENFA - Bulletin du GRES n°6 – mars 1998 page 38
Contact : Conf PY-MATH@[Link]
Exercice 2 : BTSA - Industries agro-alimentaires - Remplacement 1994
( Quatrième exercice sur 5 points)
Afin de comparer l'action de deux levures sur une pâte à gâteaux, on prélève, pour
chacune des levures, un échantillon aléatoire de gâteaux. L'aptitude des pâtes à lever est définie
par les critères suivants : moyenne, bonne, très bonne.
Les résultats constatés sont rassemblés dans le tableau suivant :
aptitude à lever
moyenne bonne très bonne
levure
A 41 16 63
B 22 27 51
2
A l'aide d'un test de χ , au risque de 5%, peut-on conclure à une différence d'activité des
deux levures ?
Proposition de corrigé : (Il y a de nombreuses notations possibles, celles choisies ci-dessous
ne sont qu'un exemple.)
Il s'agit ici d'un test de comparaison de deux distributions qui se ramène à un test
d'indépendance.
H0 : Il n'y a pas de différence d'activité entre ces deux levures.
qui se traduit par :
H0 : L'aptitude à lever de cette pâte à gâteau est indépendante du choix qui est fait entre
les deux levures A et B.
Nous allons donc établir le tableau de contingences :
L'effectif théorique de la classe située à l'intersection de la i ième ligne et de la j ième
n i. × n . j
colonne est donné par np ij = (où n i. est l'effectif total de la i ième ligne, n. j
n
celui de la j ième colonne et n l'effectif total soit 220).
Les effectifs théoriques notés sont en italiques :
aptitude moyenne bonne très bonne total
levure
A 41 16 63 120
34.36 23.45 62.18
B 22 27 51 100
28.64 19.55 51.82
total 63 43 114 220
Variable de décision :
Tous les effectifs théoriques sont supérieurs ou égaux à 5 donc, sous l’hypothèse H0, la
variable aléatoire
ENFA - Bulletin du GRES n°6 – mars 1998 page 39
Contact : Conf PY-MATH@[Link]
( N ij − np ij )²
K0 = ∑ ∑ suit (approximativement) la loi de χ² à (3-
i j np ij
1)(2-1)=2 degrés de liberté.
Calcul de la valeur de K 0 pour l'échantillon prélevé :
(41 − 34.36)² (16 − 23.45)² (63 − 62.18)² (22 − 28.64)² (27 − 19.55)² (51 − 5182
. )²
k0 = + + + + +
34.36 23.45 62.18 28.64 19.55 .
5182
k 0 ≈ 8.05
ou
41² 16² 63² 22² 27² 51²
k0 = + + + + + − 220 ≈ 8.05
34.36 23.45 62.18 28.64 19.55 5132
.
Décision :
Pour α=5% et pour 2 ddl on lit dans la table de χ² : χ 0.95 = 5.99 .
2
k 0 est supérieur à cette valeur donc on rejette H0 au risque de 5%.
En conclusion on peut dire, au risque de 5% et au vu de ces observations, qu'il y a une
différence d'activité entre les deux levures A et B sur cette pâte à gâteaux.
Remarque : la notation np ij vient du fait que, sous l'hypothèse d'indépendance des deux
n n. j
caractères, p ij = i. × est une estimation du pourcentage d'individus de la population
n n
appartenant à la iième modalité du caractère "ligne" et à la jième modalité du caractère
"colonne".
ENFA - Bulletin du GRES n°6 – mars 1998 page 40
Contact : Conf PY-MATH@[Link]