FORMULARIO STATISTICA – CLEI – I MODULO
Caratteri e distribuzioni
unità statistica i, per i=1,…,n dove n=numero di unità statistiche
modalità xj, con j=1,…,K, del carattere X
Matrice di dati Distribuzioni di frequenza
Unità X Y Z X Freq. Freq. Freq.
assoluta relativa percentuale
1 x1 y1 z1
x1 n1 f1 p1
2 x2 y2 z2
x2 n2 f2 p2
. . . . . . . .
. . . . xj nj fj pj
i xi yi zi . . . .
. . . . xK nK fK pK
. . . . Totale n 1 100
n xn yn zn
K j
Frequenze
assolute n j = n1 + n2 + ... + nK = n Frequenze assolute
cumulate
N j = nh
j =1 h =1
nj K j
Frequenze
relative fj = f
j =1
j =1 Frequenze relative
cumulate
Fj = f h
n h =1
K Frequenze j
Frequenze
percentuali p j = f j 100 p j = 100 percentuali Pj = ph
j =1
cumulate h =1
Valori medi
Ampiezza di una classe: aj = xj+1 - xj
Densità di frequenza: 𝑑𝑗 = 𝑛𝑗 /𝑎𝑗
Mediana
x1 x2 ... xi ... xn −1 xn Formula per una distribuzione di frequenza con
classi:
Se n è dispari, posto centrale (n+1)/2
0,5 − Fm −1
Se n è pari, posti centrali (n/2) e (n/2)+1
xMe I m + am
1
Se X quantitativo, n pari: 𝑥𝑀𝑒 = 2 (𝑥𝑛 + 𝑥𝑛+1 ) m
F − Fm −1
2 2
Im estremo inferiore della classe mediana
n Fm-1 frequenza relativa cumulata della classe
x −x
i =1
i Me = min precedente a quella mediana
Fm frequenza relativa cumulata della classe
mediana
am ampiezza della classe mediana
1
Media aritmetica
Protocollo elementare Distribuzione di frequenza
𝑛 K
1 1 x j + x j +1 1 K
𝑥̅ = ∑ 𝑥𝑖
𝑛
x= x jnj
n j =1
xc j = x= xc n j
n j =1 j
𝑖=1 2
K
x = xj f j
j =1
Proprietà della media aritmetica
n n n
( xi − x )2 = minimo
L
1 L y = ax + b
xi = nx ( xi − x ) = 0
i =1 i =1
nh = n x = xh nh
n h=1
i =1 h =1
Media aritmetica ponderata
n
x p + x p + ... + xn pn
xi pi
x= 1 1 2 2 = i =1n
p1 + p2 + ... + pn
p
i =1
i
Media geometrica
Protocollo elementare Distribuzione di frequenza
n K
x xg = x1 x2 xK =n x
n1 n2 nK nj
xg = n x1 x2 xn = n i
n
j
i =1 j =1
n
xg = xi
n
K
x g = x1 x2 xK = xj
f1 f2 fK fj
i =1
j =1
Variabilità
Campo di variazione o range Differenza interquartile
I v = R = xmax − xmin W = Q3 − Q1
Devianza – Varianza – Scarto quadratico medio o deviazione standard
Protocollo elementare FORMULA FORMULA
DEFINITORIA CALCOLATORIA
𝑛
Devianza n
Dev( X ) = (xi − x )
2
𝐷𝑒𝑣(𝑋) = ∑ 𝑥𝑖2 − 𝑛𝑥̅ 2
i =1
𝑖=1
𝑛 𝑛
Varianza 1 1
𝑉𝑎𝑟(𝑋) = ∑(𝑥𝑖 − 𝑥̅ )2 𝑉𝑎𝑟(𝑋) = ∑ 𝑥𝑖2 − 𝑥̅ 2
𝑛 𝑛
𝑖=1 𝑖=1
Scarto quadratico medio 𝑛 𝑛
1 1
𝑆(𝑋) = √ ∑(𝑥𝑖 − 𝑥̅ )2 𝑆(𝑋) = √ ∑ 𝑥𝑖2 − 𝑥̅ 2
𝑛 𝑛
𝑖=1 𝑖=1
2
Distribuzione di frequenza FORMULA FORMULA
DEFINITORIA CALCOLATORIA
Dev( X ) = (x j − x ) n j
Devianza K K
2
Dev( X ) = x 2j n j − nx 2
j =1 j =1
Var ( X ) = (x j − x ) n j
Varianza 1 K 1 K 2
n j =1
2
Var ( X ) =
n j =1
xj nj − x2
Scarto quadratico medio
S(X ) =
1 K
(x j − x )2 n j S(X ) =
1 K 2
xjnj − x2
n j =1 n j =1
Coefficiente di variazione o variabilità Scostamento semplice medio dalla mediana
S(X ) 1 n
CV ( X ) = S Me = xi − xMe
x n i =1
Standardizzazione
xi − x
zi =
S(X )
Concentrazione
x1 x2 ... xi ... xn
Unità 1 2 …i … n
Valori del carattere x1 x2 … xi … xn
i n Ai
i
Fi = Ai = x1 + x2 + ... + xi = xh An = xi Qi =
n h =1 i =1 An
n −1
C = (Fi − Qi )
i =1
Rapporto di concentrazione di Gini
n −1 n −1
(Fi − Qi ) Qi
R= i =1
n −1
= 1− i =1
n −1
Fi Fi
i =1 i =1
Rapporti statistici e numeri indici
Numeri indici semplici serie storica y1, y2,…,yt,…,yT
yt yt − yb y
b It =
100 = t − 1 100
yb yb yb
Serie a base fissa
3
y1 y y y
1 I1 = = 1, 1I 2 = 2 ,..., 1I t = t ,...., 1IT = T
y1 y1 y1 y1
Serie a base mobile
y2 y yt yT
I =
1 2 , 2 I 3 = 3 ,..., I =
t −1 t ,...., T −1 T I =
y1 y2 yt −1 yT −1
Proprietà degli indici semplici
b Ib =1 b It ∙ tIb = 1 ossia b It = 1/ tIb rIt ∙ tIb ∙ bIr =1 rIt =b I t / b I r
Numeri indici complessi
Indice dei prezzi di Laspeyres Indice dei prezzi di Paasche Indice dei prezzi di Fisher
n n
p q pit qit I = I I
F L P
it ib b t b t b t
I =
b t
L i =1
n
100 I =
b t
P i =1
100
p
n
i =1
ib ib q p
i =1
q
ib it
Distribuzioni doppie
K H H K H K
ni• = nij n• j = nij n = nij = ni• = n• j
j =1 i =1 i =1 j =1 i =1 j =1
Frequenza relativa nella distribuzione congiunta XY: fij = nij/n
Frequenza relativa nella distribuzione marginale di X: fi∙ = ni∙ /n
Frequenza relativa nella distribuzione marginale di Y: f∙j = n∙j /n
Frequenza relativa nelle distribuzioni condizionate di X|Y: fi|j = nij / n∙j
Frequenza relativa nelle distribuzioni condizionate di Y|X: fj|i = nij / ni∙
4
Frequenze in caso di indipendenza:
ni• n• j
n*ij = i = 1,..., H e j = 1,..., K
n
Indice Chi-quadrato Indice V di Cramer
2 =
H K (n ij − n )
* 2
ij V=
2
n min[( H − 1), ( K − 1)]
*
i =1 j =1 nij
max
2
= n [min( H − 1), ( K − 1)]
Concordanza – correlazione – regressione
Covarianza
n n
1 1
Cov(X, Y) = σ XY = ∑(xi − x̅)(yi − y̅) = ∑ xi yi − x̅y̅
n n
i=1 i=1
Correlazione
- S(X)S(Y) ≤ Cov(X,Y) ≤ S(X)S(Y)
1 𝑛
∑ (𝑥 )(𝑦
𝜌𝑋𝑌 =𝑟=
Cov(𝑋, 𝑌)
= 𝑛 𝑖=1 𝑖 − 𝑥̅ 𝑖 − 𝑦̅)
𝑆(𝑋)𝑆(𝑌)
√1 ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 √1 ∑𝑛𝑖=1(𝑦𝑖 − 𝑦̅)2
𝑛 𝑛
Cod(𝑋, 𝑌) ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅)
𝜌𝑋𝑌 = =
√𝐷 (𝑋)𝐷(𝑌) √∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 ∑𝑛𝑖=1(𝑦𝑖 − 𝑦̅)2
Regressione
Retta di regressione Y* = β0 + β1 X con β0 = intercetta, β1 = coefficiente angolare
Modello di regressione lineare semplice Y = β0 + β1 X+ε dove ε è il termine d’errore
2
Metodo dei minimi quadrati: ∑𝑛𝑖=1(𝑦𝑖 − 𝑦𝑖 ∗ ) = ∑𝑛𝑖=1(𝑦𝑖 − 𝛽0 − 𝛽1 𝑥𝑖 )2 = MIN
Cod(𝑋,𝑌) ∑𝑛 ̅)
𝑖=1(𝑥𝑖 −𝑥̅ )(𝑦𝑖 −𝑦
𝛽1 = = ∑𝑛 2
𝛽0 = 𝑦̅ − 𝛽1 𝑥̅
Dev(𝑋) 𝑖=1(𝑥𝑖 −𝑥̅ )
DevTOT (Y ) = DevREGR (Y ) + DevDISP (Y )
SST = SSR + SSE
( ) (y − y )
n n n
(y − y) =
2 * 2
−y +
2
i yi* i i
i =1 i =1 i =1
R2 =
DevREGR (Y )
=1−
DevDISP (Y )
0 R2 1 R 2 = r2
DevTOT (Y ) DevTOT (Y )