TD N° 2
Exercice N° 1
On veut savoir si la stratégie de comptage utilisée par les élèves dépend du sexe
Nous allons utiliser le teste de Khi 2. On ouvre la base de données additions_codees.sav et on suit les étapes
suivantes :
On fait passer la variable stratégie en ligne et la variable sexe en colonne (ceci n’a pas d’importance au niveau
résultats seulement votre tableau de contingence sera différent), puis on clique sur statistique et on coche la case
Chi-deux et Phi et V de Cramer puis sur poursuivre.
Remarque : Phi et V de Cramer mesure le degré d’association entre les deux variables, il est entre 0 et 1 plus on
s’approche de 1 plus il y’ dépendance.
Cocher Afficher les diagrammes en bâtons juxtaposés si vous voulez les affichés, puis cliquez sur OK.
On obtient les résultats suivants :
1
Tableau croisé Stratégie d'addition * Sexe de l'enfant
Effectif
Sexe de l'enfant
Fille Garçon Total
Stratégie d'addition Comptage sur les doigts 9 8 17
Comptage verbal 8 8 16
Décomposition 3 4 7
Total 20 20 40
Tests du Khi-deux
Signification
asymptotique
Valeur ddl (bilatérale)
Khi-deux de Pearson ,202a 2 ,904
Rapport de vraisemblance ,202 2 ,904
Association linéaire par ,181 1 ,670
linéaire
Nombre d'observations 40
valides
a. 2 cellules (33,3%) ont un effectif théorique inférieur à 5. L'effectif
théorique minimum est de 3,50.
Mesures symétriques
Signification
Valeur approximée
Nominal par Nominal Phi ,071 ,904
V de Cramer ,071 ,904
Nombre d'observations valides 40
On remarque que p = 0,904 donc supérieur à 5% alors on accepte Ho qui stipule que les effectifs des deux sexes ne
sont pas différents. On remarque aussi que le Phi et le V de Cramer est très proche de zéro (0,071) ce qui prouve
qu’il n’y a pas de relation entre les deux variables.
2
Exercice N° 2 : Test sur une proportion et test d’ajustement Khi-deux
Test sur une proportion : Si on veut savoir si la proportion d’observation dans les différentes catégories ou groupe
d’une variable qualitative correspond à une proportion donnée que ce soit les proportions retrouvées dans les
populations, dans une autre étude ou encore dans une population théorique fictive
Pour réaliser un test sur une proportion, vous avez deux possibilités : test Binomiale ou test de Khi-deux.
Question 1 : Nous voulons savoir si notre échantillon est constitué d’un nombre équivalent de fille et de garçon.
Nous allons comparer nos effectifs avec une situation dans laquelle nous avons 50% F et 50% G.
1ière méthode : Test Binomial
On fait passer la variable sexe dans la case Liste des variables à tester, dans la case proportion à tester on laisse 0,50
(si on veut faire une comparaison avec une population de 80% de F et 20% de G, on saisit 0,8 car nous avons codé 1
pour F et 2 pour G), on OK et on obtient les résultats suivants :
3
Test binomial
Signification
Proportion Test de exacte
Modalité N observée. proportion (bilatérale)
Sexe de l'enfant Groupe 1 Fille 20 ,50 ,50 1,000
Groupe 2 Garçon 20 ,50
Total 40 1,00
p>0,05 (p=1,000) on accepte Ho il n’a pas de différence entre les proportions observées et les proportions de
comparaisons.
2ième méthode : Test de Chi-deux
Dans l’encadré Effectifs théoriques on laisse coché Egaux pour toutes les modalités, puis on clique sur OK
On obtient les résultats suivants :
4
Sexe de l'enfant
Effectif
Effectif observé théorique Résidu
Fille 20 20,0 ,0
Garçon 20 20,0 ,0
Total 40
Test
Sexe de l'enfant
Khi-deux ,000a
ddl 1
Signification asymptotique 1,000
a. 0 cellules (,0%) ont des fréquences
théoriques inférieures à 5. La fréquence
théorique minimum d'une cellule est 20,0.
p>0,05 (p=1,000) on accepte Ho donc pas de différence entre l’effectif observé et l’effectif théorique.
Question 2 : Nous voulons savoir si les stratégies utilisées correspondent à ce qu’il a été observé dans la littérature.
Imaginons que dans une étude fictive, il a été démontré que la stratégie 1 a été la plus utilisée avec un taux de 45%,
pour la stratégie 3 30% et la stratégie 2 avec 25%.
Nous allons demander à SPSS de comparer notre échantillon aux proportions que nous allons lui indiquer.
On fait passer la variable Stratégies dans la liste et dans l’encadré Effectifs théoriques on coche la case Valeurs et on
saisit dans l’ordre 45 (pour 1), 25 (pour 2) et 30 (pour 3) et à chaque fois on clique sur Ajouter ; puis on clique sur OK.
5
On obtient les résultats suivants :
Stratégie d'addition
Effectif
Effectif observé théorique Résidu
Comptage sur les doigts 17 18,0 -1,0
Comptage verbal 16 10,0 6,0
Décomposition 7 12,0 -5,0
Total 40
Test
Stratégie
d'addition
Khi-deux 5,739a
ddl 2
Signification asymptotique ,057
a. 0 cellules (,0%) ont des fréquences
théoriques inférieures à 5. La fréquence
théorique minimum d'une cellule est 10,0.
p>0,05 (p=0,057), on accepte Ho donc pas de différence entre l’effectif observé et l’effectif trouvé dans la
littérature.
6
Exercice N° 3 : Nous voulons savoir si les deux groupes ont la même moyenne.
On fait passer la variable Résultats à Noël dans la case Variable (s) à tester et la variable sexe dans la case
Critère de groupement qualificatif numérique et on clique sur définir des groupe. Dans la fenêtre Définir
groupes on saisit 1 dans Groupe 1 (Fille) et 2 dans Groupe 2 (Garçon) ; puis on clique sur Poursuivre et sur
OK.
On obtient les résultats suivants :
Statistiques de groupe
Erreur standard
Sexe de l'enfant N Moyenne Ecart-type moyenne
Résultats à Noël Fille 20 74,350 11,7665 2,6311
Garçon 20 78,800 5,6624 1,2662
7
Test d'échantillons indépendants
Test de
Levene sur
l'égalité des
variances Test-t pour égalité des moyennes
Intervalle de confiance
Sig. 95% de la différence
(bilatéral Différence Différence Supérieur
F Sig. t ddl e) moyenne écart-type Inférieure e
Résultats à Noël Hypothèse de 4,955 ,032 -1,524 38 ,136 -4,4500 2,9199 -10,3610 1,4610
variances égales
Hypothèse de -1,524 27,352 ,139 -4,4500 2,9199 -10,4375 1,5375
variances inégales
Le Test de Levene sur l’égalité des variances le p=0,032 donc >0,05 donc on accepte l’hypothèse de
variances égales c’est une hypothèse sous adjacente, nous allons lire la 1ière ligne où le p= 0,136 qui est
>0,05, on peut conclure qu’il n’y a pas de différence significative de moyenne au niveau des deux groupes
malgré que la différence moyenne = -4,45
8
Exercice N° 4 : Test paramétrique sur un échantillon
Nous voulons savoir si la moyenne obtenue au test addition (cotetest) est significativement différente de 12
Ho n’est pas différente de 12
H1 est significativement différente de 12
On fait passer la variable cotetest dans la case Variable(s) à tester et dans la case Valeur de test on saisit 12
puis on clique sur OK.
On obtient les résultats suivants :
Statistiques sur échantillon unique
Erreur standard
N Moyenne Ecart-type moyenne
Résultat au test 40 13,388 3,2865 ,5196
9
Test sur échantillon unique
Valeur du test = 12
Intervalle de confiance 95% de la
Différence différence
t ddl Sig. (bilatérale) moyenne Inférieure Supérieure
Résultat au test 2,670 39 ,011 1,3875 ,336 2,439
P=0,011 donc <0,05 on rejette Ho et on accepte H1. On constate aussi que la moyenne est supérieur à 12 car elle est
égale à 13,388.
Exercice N° 5 : Test sur deux échantillons appariés
Nous voulons savoir si les résultats obtenus à Noël sont significativement différents du test addition (cotetest)
Les résultats à Noël sont sur 100 et cotetest/20. Il faut avoir le même coefficient pour pouvoir comparer les deux
moyennes.
Nous allons créer une nouvelle variable à partir de la variable Résultats de Noël appelée cotenoel20
On clique sur le menu Transformer puis sur Calculer une variable. On nomme la nouvelle variable au niveau de la
case Valeur cible et dans la case Expression numérique on entre la formule cotenoel/5 pour avoir un coefficient sur
20.
Nous avons maintenant une nouvelle variable cotenoel20 dans notre base de données
Nous allons maintenant comparer les moyennes de nos deux variable.
10
On fait passer nos deux variables dans la case Variables appariées et on clique sur OK.
On obtient les résultats suivants :
Statistiques pour échantillons appariés
Erreur standard
Moyenne N Ecart-type moyenne
Paire 1 Résultat au test 13,388 40 3,2865 ,5196
cotenoel20 15,3150 40 1,87774 ,29690
Corrélations pour échantillons appariés
N Corrélation Sig.
Paire 1 Résultat au test & 40 ,674 ,000
cotenoel20
11
Test échantillons appariés
Différences appariées
Erreur Intervalle de confiance
Ecart- standard 95% de la différence Sig.
Moyenne type moyenne Inférieure Supérieure t ddl (bilatérale)
Paire 1 Résultat au -1,92750 2,45221 ,38773 -2,71175 -1,14325 -4,971 39 ,000
test -
cotenoel20
Au niveau du tableau corrélation nous avons une corrélation positive qui est de 0,674 elle est significative cela veut
dire que lorsque la moyenne de cotenoel20 augmente la note de la variable cotetest augmente.
P<0,05 elle est égale à 0,000 donc il y ‘a une différence entre les moyenne.
Exercice N° 6 : test non paramétrique sur deux échantillons indépendants
Test de U de Mann-Whitner ou W de Wilcoxon
On utilise ces Tests lorsque les conditions d’application d’un test T ne sont pas justifiées (distribution des données
n’est pas normale, échantillon faible)
Nous nous demandons si les tendances centrales des notes au testecote des filles et des garçons sont
significativement différentes ou pas.
12
On définit les groupes puis on clique sur Poursuivre. On laisse cocher le Type de test U de Mann-Whitney, puis sur
OK et on obtient les résultats suivants :
Rangs
Somme des
Sexe de l'enfant N Rang moyen rangs
Résultat au test Fille 20 19,77 395,50
Garçon 20 21,23 424,50
Total 40
Testb
Résultat au test
U de Mann-Whitney 185,500
W de Wilcoxon 395,500
Z -,394
Signification asymptotique ,694
(bilatérale)
Signification exacte ,698a
[2*(signification unilatérale)]
a. Non corrigé pour les ex aequo.
b. Critère de regroupement : Sexe de l'enfant
Ce type de test nous donne la moyenne des rangs. Le p est supérieur à 5% (p=0,694) donc on accepte Ho et on
conclue qu’il n’y a pas de différences significatives entre les tendances centrales des notes des F et G.
13
Exercice N° 7 : Test non paramétrique sur échantillons appariés
Les conditions ne sont pas favorables pour effectuer un test paramétrique
Nous voulons savoir si les résultats obtenus à Noël sont significativement différentes des résultats du cotetest.
Avant de lancer le test il faut créer une variable cotenoel20 pour avoir le même coefficient sur 20.
On fait passer les variables cotenoel20 puis cotetest dans l’encadré Paires à tester ; on laisse cocher le type de test
Wicoxon puis on clique sur OK.
14
On obtient les résultats suivants :
Rangs
Somme des
N Rang moyen rangs
Résultat au test - cotenoel20 Rangs négatifs 29a
24,52 711,00
Rangs positifs 11b 9,91 109,00
Ex aequo 0 c
Total 40
a. Résultat au test < cotenoel20
b. Résultat au test > cotenoel20
c. Résultat au test = cotenoel20
Testb
Résultat au test
- cotenoel20
Z -4,047a
Signification asymptotique ,000
(bilatérale)
a. Basée sur les rangs positifs.
b. Test de Wilcoxon
Nous avons un p< à 5% (p=0,000) ; on rejette Ho et on accepte H1 qui stipule qu’il y a une différence significative
entre les résultats obtenus à noël et les résultats d’additions.
15
Exercice N° 8 : ANOVA
Est-ce que les résultats en Français dépendent du type d’enseignement suivi ?
H1 au moins une des moyennes diffère des autres c.à.d. au moins un type d’enseignement donne en
moyenne dans la population de meilleures ou moins bon résultats que les autres.
Ho aucune des moyennes ne diffèrent des autres
Conditions d’application de l’ANOVA
- Indépendance des données
- Distribution normale au sein de chacun des niveaux de la variable quantitative pour chaque type
d’enseignement
- Homogénéité des variances (égalité des variances)
Avant e réaliser une analyse inférentielle il est toujours utile de réaliser certaine analyse descriptive pour
détecter des donner aberrantes et de vérifier certaine condition d’application du Test
Analyse descriptive
N’oublier pas de cocher Graphes de répartition gaussiens avec test
16
Récapitulatif du traitement des observations
Observations
Type d’enseignement suivi Valide Manquante Total
par l’enfant N Pourcent N Pourcent N Pourcent
Résultats en français à 10 Immersion en Anglais 100 100,0% 0 ,0% 100 100,0%
ans Immersion en Néerlandais 120 100,0% 0 ,0% 120 100,0%
Enseignement Traditionnel 120 100,0% 0 ,0% 120 100,0%
Nous pouvons ainsi vérifier une des conditions d’application du test ANOVA autrement dit une hypothèse
sous adjacente distribution normale des données ? Nous avons des histogrammes qui montrent globalement
une courbe qui se rapproche d’une distribution normale pour chacun des types d’enseignement. Nous avons
utilisé l’histogramme car il y’a plus de 50 observations par niveau si non on utilise le Q-Q plot.
Les diagrammes boites à moustaches montrent qu’il y a une différence entre l’enseignement traditionnel et les
autres.
Pour réaliser un test ANOVA suivez les étapes suivantes :
17
Passer la variable Résultats en français pour les moins de 10 ans dans la case Liste variables dépendantes et la case
critère la variable Type d’enseignement.
Cocher Test d’homogénéité de variance pour vérifier la 3 ième condition d’application du test. Cocher aussi
Caractéristique pour avoir le tableau Descriptives. Cliquer sur Poursuivre puis sur OK.
Descriptives
Résultats en français à 10 ans
Intervalle de confiance à
95% pour la moyenne
Erreur Borne Borne
N Moyenne Ecart-type standard inférieure supérieure Min Max
Immersion en Anglais 100 70,24 9,032 ,903 68,45 72,03 51 97
Immersion en Néerlandais 120 72,13 9,719 ,887 70,37 73,88 52 94
Enseignement Traditionnel 120 77,73 8,651 ,790 76,17 79,30 56 93
Total 340 73,55 9,664 ,524 72,52 74,58 51 97
Test d'homogénéité des variances
Résultats en français à 10 ans
Statistique de
Levene ddl1 ddl2 Signification
1,910 2 337 ,150
Ce tableau nous permet de vérifier l’homogénéité des variances. Nous avons p=0,15 il est supérieur à 5%,
donc on accepte Ho qui stipule qu’il y a une égalité de variance
18
ANOVA
Résultats en français à 10 ans
Somme des Moyenne des
carrés ddl carrés F Signification
Inter-groupes 3439,318 2 1719,659 20,534 ,000
Intra-groupes 28222,832 337 83,747
Total 31662,150 339
P=0,000 donc inférieur à %, on accepte alors H1
Il faut faire maintenant des comparaisons multiples, on revient au test ANOVA en cliquant maintenant sur le
bouton Post Hoc… et dans la fenêtre qui apparait on coche Bonferonni puis Poursuivre et OK.
Comparaisons multiples
Résultats en français à 10 ans
Bonferroni
Intervalle de confiance à 95%
(I) Type d’enseignement (J) Type d’enseignement Différence de Erreur Significati Borne
suivi par l’enfant suivi par l’enfant moyennes (I-J) standard on inférieure Borne supérieure
Immersion en Anglais Immersion en Néerlandais -1,885 1,239 ,387 -4,87 1,10
Enseignement Traditionnel -7,493* 1,239 ,000 -10,47 -4,51
Immersion en Néerlandais Immersion en Anglais 1,885 1,239 ,387 -1,10 4,87
Enseignement Traditionnel -5,608* 1,181 ,000 -8,45 -2,77
Enseignement Traditionnel Immersion en Anglais 7,493* 1,239 ,000 4,51 10,47
Immersion en Néerlandais 5,608 *
1,181 ,000 2,77 8,45
*. La différence moyenne est significative au niveau 0.05.
Le tableau dans son ensemble indique que les résultats en français des enfants à 10 ans sont
significativement différents pour les enfants en enseignement traditionnel par rapport aux deux types
d’immersion Anglait ou Néerlandais) obtenus avec l’enseignement traditionnel donne de meilleurs résultats.
Afin de mieux interpréter les résultats un graphique peut être utile, qui montre les moyennes par niveau,
19
ainsi qu’un intervalle de confiance autour de ces moyennes. Pour cela il faut suivre ces étapes.
Il faut choisir simple
Passer la variable Résultats en français dans la case Variable et le type dans la case Axe des modalités
20
21