0% ont trouvé ce document utile (0 vote)
356 vues7 pages

ANOVA à un facteur : Analyse statistique

Transféré par

sayariferjani
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
356 vues7 pages

ANOVA à un facteur : Analyse statistique

Transféré par

sayariferjani
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

TP4 : Analyse de la variance à un facteur

Module : Statistiques Classes : 4ème année IA & DS

Correction

Partie 1 :
L’objectif d’un laboratoire de biologique est d’évaluer si la résistance à un pathogène donné
varie pour des plantes de 4 lignées différentes de l’espèce modèle Medicago truncatula. Avant
de comparer les scores moyens de résistance, il effectue une ANOVA à un facteur pour
évaluer s’il y a un effet ”lignée” sur le score de résistance. Si c’est le cas, il comparera
ensuite les lignées 2 à 2 afin de déterminer la(les)quelle(s) se différencie(nt) des autres.
1. Importer le fichier Résistance, extraire les noms et les types des variables.
> data=read.table(file=file.choose(),header=TRUE)
En consultant le fichier .txt on remarque que la première ligne est consacrée pour
les noms des variable.
> attach(data)
Pour ajouter les données dans la liste de recherche de R
> str(data)
Un résumé contenant le nombre d’observations, nombre des variables ainsi que
leurs types.

> summary(data)
Un résumé statistique plus détaillé contenant les valeurs de référence statistiques
de chaque variable(valuer minimale, premier quartile, médiane,moyenne, troisième
quartile et la valeur maximale).

1
2. Afficher les effectifs des différents groupes (niveaux du facteur) avec la fonction
table().
> table(lignee)
La fonction table() affiche l’effectif de chaque modalité de la variable lignee.

3. Afficher du score moyen par groupe avec la fonction tapply().


> tapply(score,lignee,mean)
La fonction tapply (score,lignee,mean) affiche le score moyen de chaque modalité
de la variable lignee.

4. Donner un résumé des données par groupe.


> tapply(score,lignee,summary)

La fonction tapply (score,lignee,summary) affiche un résumé statistique (valuer


minimale, premier quartile, médiane,moyenne, troisième quartile et la valeur maxi-
male) de chaque modalité de la variable lignee.

2
Avant de procéder à l’ANOVA, il faut vérifier la normalité des données de chaque groupe,
et l’homogénéité des variances des groupes :
5. Tester la normalité des données de chaque groupe.
> tapply (score,lignee,shapiro.test)
La fonction shapiro.test () affiche le résultat du test de normalité. C’est un test
d’adéquation à la loi normale (H0 = ”les données suivent la loi Normale”)

Toutes les valeurs p∗ obtenues sont > α = 0.05, alors on accepte H0 ce qui implique
que les groupes sont normalement distribués.
6. Tester l’homogénéité des variances intra-groupes.
> bartlett.test(score∼lignee)

p∗ = 0.69 > 0.05, alors on accepte H0 = ”les variances sont égales”.

3
7. Tester si les moyennes des différents groupes sont égales.
> ANOVA=aov(score∼lignee)
> summary(ANOVA)

p∗ = 1.18e − 05 < 0.001, alors on accepte H1 : les moyennes ne sont pas égales.
8. Construire le tableau de l’ANOVA.
> summary(ANOVA)

Partie 2 :
L’ensemble de données ”ToothGrowth” inclus dans R décrit l’effet de la vitamine C sur
la croissance des dents chez les cobayes. Des statistiques inférentielles sont utilisées pour
déterminer si la longueur des dents est influencée par les niveaux des doses de vitamine C
(0.5 , 1 et 2 mg/jour). Par ailleurs, l’impact des deux modes d’alimentation (jus d’orange
(JO) ou acide ascorbique (VC)) sur la longueur des dents est étudié.
Le fichier contient 3 variables :
• len : Longueur des dents
• dose : Dose en milligrammes (0.5, 1, 2)
• supp : Type de supplément (VC ou OJ)

1. Charger la base de données ”ToothGrowth”.


> data(ToothGrowth)
2. Décrire le jeu des données : noms et natures des variables.
> str(ToothGrowth)
3. Donner les différentes modalités de la variable ”supp”.
> attach(ToothGrowth)
> table(supp)

4
4. Vérifier la normalité de la variable “len” des deux groupes (OJ, VC) avec un test
adequat au seuil 1%.

On a pour les trois groupes une valeur pvalue > 0.01, on peut confirmer la normalité
des différents groupes.
5. Vérifier l’homogénité des variances de la variable “len” des différents groupes avec le
test adequat au seuil 1%.

Interprétation : Au seuil de 1%, l’hypothèse de l’homogénité des variances de la


variable “len” des difféerents groupes est vérifiée.
6. Tester si les moyennes des différents groupes sont égales.
Il s’agit d’un test d’ANOVA à 1 facteur (le facteur est la variable ”supp”) => H0 :”les
moyennes des différents groupes sont égales”

5
Interprétation : La pvalue < 0.1 alors on accepte H1 : les moyennes des différents
groupes ne sont pas égales.
7. Le type du supplément influence-t-il la croissance des dents ?
On conclut que le mode d’alimentation a une influence sur la croissance des dents.

Partie 3 :
Le jeu de données intégré à R nommé ”PlantGrowth” contient le poids des plantes obtenues
sous trois conditions de traitement différentes.
1. Charger la base de données ”PlantGrowth”.
> data(PlantGrowth)
2. Décrire le jeu des données : noms et natures des variables.
> str(PlantGrowth)
3. Donner les différentes modalités de la variable ”group”.
> attach(PlantGrowth)
> table(group)
4. Vérifier la normalité de la variable “weight” pour les différentes modalités de la va-
riable ”group”.

6
Interprétation : les pvalue > 0.05, donc la variable “weight” pour les 3 groupes est
normale.
5. Vérifier l’homogénité des variances de la variable “weight” des différentes modalités.

Interprétation : Au seuil de 5%, l’hypothèse de l’homogénité des variances de la


variable “weight” des difféerents groupes est vérifiée.
6. Tester si le type du traitement influence la croissance des plantes.
Il s’agit d’un test d’ANOVA à 1 facteur (le facteur est la variable ”group”) => H0 :”les
moyennes des différents groupes sont égales”.

Interprétation : La pvalue < 0.05 alors on accepte H1 : les moyennes des différents
groupes ne sont pas égales.On conclut que le type du traitement a une influence sur
la croissance des plantes.

Vous aimerez peut-être aussi