0% ont trouvé ce document utile (0 vote)

344 vues42 pages

Cours Logiciel R

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

344 vues42 pages

Cours Logiciel R

Transféré par

Djondandi WANGBARA

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Cours 7

Les régressions linéaires

Les analyses statistiques
avec R
Modèles linéaires ,lm()
modèles linéaires généralisés,glm()
analyse de variance, aov()
Généralités
• L ’argument principal est une formule du
type:
réponse ~ prédicteur

exemples: data(I=InsectSprays)
aov(sqrt(count) ~ spray,data=I)
équivalent à :
aov(sqrt(I$count) ~ I$spray)

ou à aov(sqrt(I[,1]) ~ I[,2])
Les formules

• y~model ou y est la réponse analysée et model

est un ensemble de termes pour lesquels les
paramètres sont estimés
• attention: les symboles arithmétiques ont ici
une signification particulière
• exemples:
y~x1+x2 désigne le modèle y=ax1+bx2+c
y~I(x1+x2) désigne le modèle y=a(x1+x2)+c
y~poly(x,2) désigne le modèle y=ax^2+bx+c
y~x1+x2 désigne le modèle y=ax1+bx2+c
y~x1-1 désigne le modèle y=ax1
Les fonctions génériques

• Les objets qui contiennent les résultats

d ’une analyse, ont un attribut particulier,
la classe.
• Certaines fonctions, dites génériques,
permettent d ’extraire des informations d ’un
objet résultat
• exemples: summary()qui a une action différente
sur un objet de classe lm() , aov(),...
apropos("^summary")

• plot()
• print() résumé succint
• summary() résumé détaillé
• [Link] nbre de ddl résiduels
• coef coefficients estimés
• residuals résidus
• deviance déviance
• fitted valeurs ajustées par le modèle
• logLik logarithme de la vraisemblance...
Un objet-résultat, produit par
aov(), lm()….
est généralement une liste,bien qu ’il ne soit
pas affiché comme tel,
dont les éléments peuvent être affiché par la
fonction names()
ex names([Link])pour une régréssion linéaire
"coefficients" "residuals" "effects"
"rank" "[Link]" "assign"
"qr" "[Link]" "xlevels" "call"
"terms" "model"
Analyses supplémentaires
à partir d ’un objet

add1():teste successivement tous les termes qui

peuvent être ajoutés à un modèle
drop1():teste successivement tous les termes qui
peuvent être enlevés à un modèle
anova(): calcule une table d ’analyse de
variance ou de deviance pour un ou plusieurs
modèles
predict(): calcule les valeurs prédites pour des
nouvelles données
update(): réajuste un modèle ...
Régréssion linéaire simple
• Sur des données fictives:
x=1:100
x=sample(x,30,replace=TRUE)
x
[1] 62 18 9 67 43 38 57 12 41 29 69 76 77 46 42 75 32 74 6 40 51 88 61 3 38
[26] 71 81 76 94 34

y=3+7*x+rnorm(30,0,100)
Y
[1] 340.61710 254.86969 54.52298 463.78335 379.30676 177.27873 555.98297
[8] -13.48922 273.11081 187.46739 439.59869 380.92303 537.40362 414.12641
[15] 299.09269 494.05965 415.9
plot(x,y)
[Link]=lm(y~x);
Call:
• lm(formula = y ~ x)

Coefficients:
(Intercept) x
13.22 6.71
Droite de régression:
y=6,71 *x +13.22
plot(x,y);
abline([Link])
summary([Link])

• Residuals:
Min 1Q Median 3Q Max
-142.29 -58.64 -17.17 63.33 187.99

• Coefficients:
• Estimate Std. Error t value Pr(>|t|)
(Intercept) 13.2213 37.0548 0.357 0.724
x 6.7105 0.6587 10.188 6.37e-11
• Residual standard error: 90.65 on 28 degrees of
freedom
• Multiple R-Squared: 0.7875, Adjusted R-squared:
0.78
Plus sophistiquée...

• La croissance d ’une bactérie (par jour),

modélisé par N=N0 e^kt
t=2:12;
N=c(55,90,135,245,403,665,1100,1810,3000,4450,
7350);
Le modèle est le suivant;
• t=c(2:12);N=c(55,90,135,245,403,665,1100
,1810,3000,4450,7350)
• T=[Link](t,N,y=log(N));T;
> T
t N y
1 2 55 4.007333
2 3 90 4.499810
3 4 135 4.905275
4 5 245 5.501258…..
Calcul de moyenne et
écart-type
• apply(T,2,mean);
t N y
7.000000 1754.818182 6.475094
• apply(T,2,sd);

t N y
3.316625 2326.625317 1.640357
plot(T$t,T$N)
plot(T$t,T$y)
droite de regression
• ll=lm(y~t,data=T);ll;
Call:
lm(formula = y ~ t, data = T)

Coefficients:
(Intercept) t
3.0142 0.4944
abline(ll);
summary(ll)
• Call:
lm(formula = y ~ t, data = T)
• Residuals:
Min 1Q Median 3Q Max
-0.08656 -0.02117 0.01500 0.02912 0.04802
• Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 3.014162 0.032947 91.49 1.13e-14 ***
t 0.494419 0.004289 115.27 1.41e-15 ***
---
Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1
summary(ll) suite

Residual standard error: 0.04499 on 9 degrees of freedom

Multiple R-Squared: 0.9993, Adjusted R-squared: 0.9992
F-statistic: 1.329e+04 on 1 and 9 DF, p-value: 1.413e-15
Régression linéaire
multiple
• Exemples:
Les tests statistiques
les test du chi-deux
La fonction
[Link](x,y,logical,p)

• Premier exemple:
on lance un dé 300 fois et on obtient le résultat suivant:
1 2 3 4 5 6
43 49 56 45 66 41

x=c(43, 49, 56, 45, 66, 41)

prob=rep(1/6,6)
[Link](x,p=prob)
● Chi-squared test for given probabilities
• data: x
• X-squared = 8.96, df = 5, p-value = 0.1107
Second exemple sur un tableau de
contingence
Exemple d ’un tableau donnant la cécité en fonction
du sexe:
tab=matrix(c(442,514,38,6),nrow=2,byrow=TRUE)
colnames(tab)=c("homme","femme")
rownames(tab)=c("voyant","aveugle")

homme femme
voyant 442 514
aveugle 38 6
X2=[Link](tab,correct=FALSE)

On teste s ’il y a une relation entre

sexe et cécité (l ’hypothèse par défaut
est celle d ’indépendance)
Pearson's Chi-squared test

data: tab
X-squared = 27.1387, df = 1, p-value = 1.894e-07
attributes(x2)

$names
[1] "statistic" "parameter" "[Link]"
"method" "[Link]" "observed"
[7] "expected" "residuals"

$class
[1] "htest »
par exemple:
x2$expected
homme femme
voyant 458.88 497.12
aveugle 21.12 22.88
valeurs attendues sous hypothèse d ’indépendance
x2$residuals
homme femme
voyant -0.787994 0.7570801
aveugle 3.673039 -3.5289413
sum(x2$residuals^2)
27.13874 la somme des carrés des résidus est la
valeur du chi-deux
• Soit le tableau de contingence suivant:
• roux blond brun
• bleu 13 20 7
• marron 24 10 18

• le test du chi-deux d ’indépendance

s ’effectue ainsi:
• [Link](m)
• Pearson's Chi-squared test

• data: m
• X-squared = 10.0494, df = 2, p-value =
0.006574

on teste l ’hypothèse nulle suivante

« H0:il y a indépendance entre la couleur des
yeux et celle des cheveux »
Test sur une moyenne:
[Link]()

• Pour comparer deux ou plusieurs

proportions sur des échantillons de
grande taille:
[Link](x, n, p = NULL,alternative =
c("[Link]", "less", "greater"),
[Link] = 0.95, correct = TRUE)
Classification
La fonction kmeans()

Méthodes de type « nuées dynamiques »:

on suppose que les individus sont des points de R^n
muni de la distance euclidienne
On recherche un partitionnement des individus en classes
• Variance des classes minimale (classes homogènes)
• Variance entre classes maximale
• Rappel : théorème de Huygens: la somme de l ’inertie
interclasse et de l ’inertie intraclasse est constante
(inertie = moyenne des carrés des distances au centre de
gravité)
suite
• Exemple en dimension 2 sur le dataframe D
PROB LECT CARR OPER SYNO PFB SUITE ANAL D70 T M s
1 4.52 1.92 0.93 1.94 1.20 0.08 2.05 1.99 1.37 16.01 1.78 1.21
2 1.50 0.77 0.43 -0.32 1.20 1.26 2.05 1.99 2.30 11.19 1.24 0.85
3 1.77 0.19 1.94 1.19 1.20 0.59 2.05 1.50 1.37 11.80 1.31 0.61
4 1.22 0.19 2.19 0.43 1.20 0.92 2.05 0.51 0.75 9.10 1.01 0.76
5 1.22 1.92 -0.83 1.56 0.64 0.08 1.76 1.01 0.44 7.82 0.87 0.88
6 0.68 0.39 -0.83 -0.32 1.20 -1.77 1.76 0.76 0.18 1.70 0.19 1.08
7 2.05 0.77 0.68 0.43 0.36 1.60 1.76 0.51 1.06 9.23 1.03 0.63
8 0.42 0.39 -0.57 1.56 0.36 -0.93 1.76 0.26 0.44 2.86 0.32 0.90
9 -0.15 -0.19 1.44 -0.32 0.64 0.76 1.76 0.02 1.37 5.34 0.59 0.79

10 -0.42 -0.19 -0.57 1.19 0.64

E=D[,c(1,2)]
cl <- kmeans(E, 4, 20) (donne 4 sous-nuages)
plot(E, col = cl$cluster) (tracé pour un objet de type résultat
de la fct kmeans)
points(cl$centers, col = 1:4, pch = 8)
Autre exemple

• data(airquality); a=airquality [,3:4]

• cl=kmeans(a,3,20)
• plot(a, col = cl$cluster) ;points(cl$centers, col = 1:4, pch
= 8)
le résultat de la fct kmeans est une liste
contenant :les composants suivants:

• cluster: un vecteur d’entiers indiquant la

partition ( le sous-nuage) à laquelle est
affecté chaque point

• centers: la matrice des centres des sous-

nuages

• withinss: The within-cluster sum of squares

for each cluster.

• size: le nombre de points dans chaque sous-

nuage
La fonction hclust()
●
La fonction cutree()
●

Vous aimerez peut-être aussi

Introduction à R et Tests Statistiques
Pas encore d'évaluation
Introduction à R et Tests Statistiques
10 pages
Tests de Normalité Statistique
Pas encore d'évaluation
Tests de Normalité Statistique
59 pages
Econometrie Appliquee Avec R Part03 - Compress
Pas encore d'évaluation
Econometrie Appliquee Avec R Part03 - Compress
22 pages
SAS v9.0: Logiciel Statistique Complet
50% (2)
SAS v9.0: Logiciel Statistique Complet
4 pages
Analyse Factorielle Discriminante en Statistique
Pas encore d'évaluation
Analyse Factorielle Discriminante en Statistique
22 pages
Exposé Logit Probit Multivarié
100% (1)
Exposé Logit Probit Multivarié
11 pages
TP Série Temporelle
100% (1)
TP Série Temporelle
7 pages
Analyse statistique des concentrations au Lake d’Everglades
Pas encore d'évaluation
Analyse statistique des concentrations au Lake d’Everglades
22 pages
1MVT Analyse de Donnes Avec R Par Franois Husson Sbastien L Jrme Pags 2753548692
0% (2)
1MVT Analyse de Donnes Avec R Par Franois Husson Sbastien L Jrme Pags 2753548692
4 pages
Introduction à Stata pour débutants
100% (1)
Introduction à Stata pour débutants
42 pages
Examen d'économétrie - Université de Toliara
100% (1)
Examen d'économétrie - Université de Toliara
2 pages
Exemple de régression linéaire
100% (2)
Exemple de régression linéaire
3 pages
Statistique et Régression Linéaire
Pas encore d'évaluation
Statistique et Régression Linéaire
2 pages
Examen Blanc N°1 Econometrie S6 E1-2021
Pas encore d'évaluation
Examen Blanc N°1 Econometrie S6 E1-2021
1 page
Régression Multiple
Pas encore d'évaluation
Régression Multiple
28 pages
Probit Et Logit
Pas encore d'évaluation
Probit Et Logit
13 pages
Poly Son Dage
Pas encore d'évaluation
Poly Son Dage
82 pages
Exostat2 INSA
100% (1)
Exostat2 INSA
4 pages
Optimisation MCO et Analyse Statistique
Pas encore d'évaluation
Optimisation MCO et Analyse Statistique
6 pages
Data Mining tp.5 Régression Linéaire Multiple
Pas encore d'évaluation
Data Mining tp.5 Régression Linéaire Multiple
13 pages
Les Commandes de Stata
Pas encore d'évaluation
Les Commandes de Stata
1 page
Analyse Régression Linéaire avec R
Pas encore d'évaluation
Analyse Régression Linéaire avec R
2 pages
Theorie Et Application - Du - PROBIT
Pas encore d'évaluation
Theorie Et Application - Du - PROBIT
16 pages
Régression Multiple
100% (1)
Régression Multiple
28 pages
Chapitre - 3 Statistique Descriptive Bivariée
Pas encore d'évaluation
Chapitre - 3 Statistique Descriptive Bivariée
16 pages
TD 2
Pas encore d'évaluation
TD 2
5 pages
Statistiques Appliquées PDF
100% (2)
Statistiques Appliquées PDF
90 pages
Théorème de Gauss-Markov en régression
Pas encore d'évaluation
Théorème de Gauss-Markov en régression
3 pages
TP5 Correction
100% (1)
TP5 Correction
15 pages
Regression Lineaire Multiple
Pas encore d'évaluation
Regression Lineaire Multiple
35 pages
Modèles À Effets Mixtes en Pratique Dans R
Pas encore d'évaluation
Modèles À Effets Mixtes en Pratique Dans R
28 pages
Sequence2 Decala Temporels UVS Master2
Pas encore d'évaluation
Sequence2 Decala Temporels UVS Master2
14 pages
Echantillonage
100% (2)
Echantillonage
2 pages
Introduction aux Techniques d'Enquête
Pas encore d'évaluation
Introduction aux Techniques d'Enquête
80 pages
S5Exam 06 13 - TOUIJAR
Pas encore d'évaluation
S5Exam 06 13 - TOUIJAR
23 pages
ACP Sous Python Avec Scientisttools
Pas encore d'évaluation
ACP Sous Python Avec Scientisttools
22 pages
Régression Logistique Appliquée
100% (9)
Régression Logistique Appliquée
64 pages
!!!!!!!!!!!!!!!!!!!!!!!!! 1 A Voir Econometrie Des Serie Temporelle !!!!!!!!!!!!!
100% (2)
!!!!!!!!!!!!!!!!!!!!!!!!! 1 A Voir Econometrie Des Serie Temporelle !!!!!!!!!!!!!
70 pages
Qualitatif Chapitre1
Pas encore d'évaluation
Qualitatif Chapitre1
57 pages
Introduction au logiciel Stata
Pas encore d'évaluation
Introduction au logiciel Stata
40 pages
Logiciel SAS 9.2 Windows Vol1 André Wielki
Pas encore d'évaluation
Logiciel SAS 9.2 Windows Vol1 André Wielki
215 pages
Resum Cours Series Temporelles
Pas encore d'évaluation
Resum Cours Series Temporelles
44 pages
TD2 - Statistiques Non Paramétriques Et Robustesse
100% (1)
TD2 - Statistiques Non Paramétriques Et Robustesse
2 pages
TD 1 2019-2020
100% (1)
TD 1 2019-2020
2 pages
Paramétrique Et Non Paramétrique
100% (2)
Paramétrique Et Non Paramétrique
4 pages
Exercices Analyse de Données
Pas encore d'évaluation
Exercices Analyse de Données
13 pages
Regression Lineaire
100% (2)
Regression Lineaire
16 pages
Économétrie des Variables Qualitatives
Pas encore d'évaluation
Économétrie des Variables Qualitatives
22 pages
Cours Initiation Au Logiciel STATA
Pas encore d'évaluation
Cours Initiation Au Logiciel STATA
34 pages
Corrigé TD Statistique M1-GEO Rennes 2
Pas encore d'évaluation
Corrigé TD Statistique M1-GEO Rennes 2
21 pages
Cours R Master1 Partie I
Pas encore d'évaluation
Cours R Master1 Partie I
36 pages
Régression Linéaire avec R: Guide Complet
Pas encore d'évaluation
Régression Linéaire avec R: Guide Complet
27 pages
Regression Lineaire Ols
Pas encore d'évaluation
Regression Lineaire Ols
63 pages
Mémento R : Statistiques et MSP
Pas encore d'évaluation
Mémento R : Statistiques et MSP
9 pages
Modèle linéaire en actuariat 2022-2023
Pas encore d'évaluation
Modèle linéaire en actuariat 2022-2023
49 pages
Régression linéaire avec R
Pas encore d'évaluation
Régression linéaire avec R
22 pages
TPstat
Pas encore d'évaluation
TPstat
9 pages
01 Exemple
Pas encore d'évaluation
01 Exemple
6 pages
MOOC Cours 15 RegLin3 V2 Impression
Pas encore d'évaluation
MOOC Cours 15 RegLin3 V2 Impression
14 pages
TPinit R
Pas encore d'évaluation
TPinit R
4 pages
Exercices Traités Dans Le Cours Avec Corrigé
Pas encore d'évaluation
Exercices Traités Dans Le Cours Avec Corrigé
8 pages
Constante de Planck
100% (1)
Constante de Planck
4 pages
Apprentissage inductif et arbres de décision
Pas encore d'évaluation
Apprentissage inductif et arbres de décision
11 pages
Cours MQ2 Chap2 Partie1
Pas encore d'évaluation
Cours MQ2 Chap2 Partie1
31 pages
TD 3 STAT3 Distribution Déchantillonnage CORRECTION
Pas encore d'évaluation
TD 3 STAT3 Distribution Déchantillonnage CORRECTION
13 pages
Examen 2008 Textes Et Corriges
Pas encore d'évaluation
Examen 2008 Textes Et Corriges
19 pages
Chim432 RMN 2 Operateurs A Un Spin
Pas encore d'évaluation
Chim432 RMN 2 Operateurs A Un Spin
4 pages
Statistiques et Modèles Mathématiques
100% (1)
Statistiques et Modèles Mathématiques
6 pages
Introduction au Spin des Particules
Pas encore d'évaluation
Introduction au Spin des Particules
30 pages
Introduction à la régression linéaire simple
Pas encore d'évaluation
Introduction à la régression linéaire simple
8 pages
Introduction aux lois de probabilité
Pas encore d'évaluation
Introduction aux lois de probabilité
2 pages
Leadership & Leaders
Pas encore d'évaluation
Leadership & Leaders
51 pages
Tpee
Pas encore d'évaluation
Tpee
10 pages
Fonctions d'onde et puits quantiques
Pas encore d'évaluation
Fonctions d'onde et puits quantiques
13 pages
CC 2011 2012
Pas encore d'évaluation
CC 2011 2012
9 pages
TD Atomistique SV1&STE1
Pas encore d'évaluation
TD Atomistique SV1&STE1
2 pages
Modèle ondulatoire de l'atome expliqué
Pas encore d'évaluation
Modèle ondulatoire de l'atome expliqué
8 pages
Interpréter la Mécanique Quantique
Pas encore d'évaluation
Interpréter la Mécanique Quantique
273 pages
Physique Statistique: Concepts et Applications
100% (2)
Physique Statistique: Concepts et Applications
85 pages
Chat de Schrödinger
Pas encore d'évaluation
Chat de Schrödinger
4 pages
Corrigé TD #03 Mécanique Quantique
100% (1)
Corrigé TD #03 Mécanique Quantique
18 pages
Solution TD 4
100% (3)
Solution TD 4
9 pages
Explication-M Bitbol
Pas encore d'évaluation
Explication-M Bitbol
2 pages
Introduction à la physique quantique
Pas encore d'évaluation
Introduction à la physique quantique
2 pages
Exercices sur la Loi Normale
Pas encore d'évaluation
Exercices sur la Loi Normale
2 pages
Liaison Chimique en Mécanique Quantique
Pas encore d'évaluation
Liaison Chimique en Mécanique Quantique
23 pages
TD2 MQ SMP4 2020
Pas encore d'évaluation
TD2 MQ SMP4 2020
11 pages
États Stationnaires de Particules en Boîte Quantique
Pas encore d'évaluation
États Stationnaires de Particules en Boîte Quantique
12 pages
Theme3V3 Version Planche
Pas encore d'évaluation
Theme3V3 Version Planche
14 pages
TD1 Econometrie S1
Pas encore d'évaluation
TD1 Econometrie S1
19 pages