Repaso Segundo Parcial
EZEQUIEL ADRIAN DURANTINI
ESTADÍSTICA II
FACULTAD DE CIENCIAS ECONÓMICAS
CONTENIDO
Ejercicio Test de Hipótesis
Ejercicio Test de Hipótesis 2
ANOVA
Modelo Lineal
Bondad de Ajuste
Independencia de Atributos
Independencia de Atributos 2
Ezequiel Durantini 2 Práctica Estimadores
Ejercicio Test de Hipótesis
Un inspector de pesos y medidas quiere analizar si cierta maquina que envasa
paquetes de harina de 1 kg funciona correctamente. Para ello tomará una muestra
aleatoria de 37 paquetes y , suponiendo que los resultados provienen de una normal,
se decidirá multar al fabricante si la media muestral es mayor o igual a 1,1032kg o
menor o igual a 0,8968.
a. ¿Cuál deberá ser la varianza muestral (sesgada) si la probabilidad de multar
erróneamente al fabricante es 0,01?
b. Si la varianza muestral del punto anterior fuese la varianza poblacional ¿Cuál es
la probabilidad de no multar al fabricante si el verdadero valor esperado del
peso de cada paquete está un 2% por encima del correcto?
c. Indique claramente cuáles son los errores de tipo 1 y 2 en este ejercicio, en
términos del problema.
Ezequiel Durantini 3 Práctica Estimadores
Ejercicio Test de Hipótesis
? Multar si
n 37
X 1,1032
X ~ Normal
X 0,8968
X 0
~ N(0,1) Con Conocida
n
X 0
~ t n -1 Con Desconocida S
(x x)
i
2
S n
n 1
Ezequiel Durantini 4 Práctica Estimadores
Ejercicio Test de Hipótesis a
H0 1
HA 1
X 0
~ t n -1 Si H 0 es V
S
n 1
P R H 0 / H 0 V Multar erroneamente 0,01
Ezequiel Durantini 5 Práctica Estimadores
Ejercicio Test de Hipótesis a
(1)
tc t36
c
, 0 , 005 2,719485 X c 0,8968
n 1,
2
tc t36
c
, 0 , 995 2,719485 X c 1,1032 (2)
n 1,1
2
X c 0 0,8968 1
t c
2,719485 (3)
n 1, S S
n 1
2
36
(4)
S n 0,22769
Ezequiel Durantini 6 Práctica Estimadores
Ejercicio Test de Hipótesis b
2 S 2 (0,22769) 2
1,02
X 0
~ N(0,1) Con Conocida
n
P A H 0 / H 0 F
Ezequiel Durantini 7 Práctica Estimadores
Ejercicio Test de Hipótesis b
PAH 0 / H 0 F (1)
P0,8968 X 1,1032 / 1,02 (2)
0,8968 1,02 X 1,02 1,1032 1,02
P (3)
0,22769 0,22769 0,22769
37
37 37
P 3,291301 Z 2,222669
(4)
PZ 2,222669 PZ 3,291301 (5)
0,986882 0,000499 0,986383 (6)
Ezequiel Durantini 8 Práctica Estimadores
Ejercicio Test de Hipótesis c
α= Multar cuando la maquina funciona correctamente
(dentro del margen aceptado)
β= No Multar cuando la maquina no funciona
correctamente
Ezequiel Durantini 9 Práctica Estimadores
Ejercicio Test de Hipótesis 2
Un periodista esta preocupado por la cantidad de edificios que no aceptan niños.
Antes de escribir un articulo se quiere asegurar de escribir si P poblacional es mayor
a 0,75. Analiza 125 edificios.
a. Si 102 excluyen niños. Decidir si se escribe el articulo. La probabilidad de
escribir erróneamente el articulo es 0,10.
b. Considerando la misma zona de rechazo de la hipótesis nula ¿Cuántos edificios
debería hacerse el muestreo para que cuando el porcentaje de edificios que
excluyen niños es del 80%, la probabilidad de escribir el articulo es 0,90?
n 125
102
p 0,816
125
P P0
p0 q0
N(0,1)
n
n
Ezequiel Durantini 10 Práctica Estimadores
Ejercicio Test de Hipótesis 2 a
H 0 P 0,75
H A P > 0,75
P P0
p0 q0
N(0,1)
n
Si H 0 es V y n > 30
n
P R H 0 / H 0 V escribir el articulo erroneamente 0,10
Ezequiel Durantini 11 Práctica Estimadores
Ejercicio Test de Hipótesis 2 a
Z1c Z 0c,90 1,281552
p c p0 p c 0,75
Z 0c,90 1,281552 p c 0,7996
p 0 q0 0,75.0,25
n 125
p > p c Re chazo H 0 Escribe el articulo
Ezequiel Durantini 12 Práctica Estimadores
Ejercicio Test de Hipótesis 2 b
PR H 0 / H 0 F 1 n? (1)
P Z Z c / p 0,80 0,90 /
P p p c / p 0,80 0,90 (2)
No, el nuevo n cambia pc
p p0 (3)
P 1,281552 / p 0,80 0,90
p0 q0
n
P p 1,281552 0,75.0,25 0,75 / p 0,80 0,90 (4)
n
Nuevo pc
Ezequiel Durantini 13 Práctica Estimadores
Ejercicio Test de Hipótesis 2 b
0, 75.0, 25 (5)
1,281552 0,75 0,80
n
P Z
0,90
0,80.0,20
n
0,75.0,25 0,75 0,80
1, 281552
n
Z 0,10 1,281552 (6)
0,80.0,20
n
n 455,86 n 456
Ezequiel Durantini 14 Práctica Estimadores
Ejercicio ANOVA
Una revista de marketing se asegura que los gastos medios mensuales en publicidad
de cuatro importantes empresas A, B, C y D no difieran significativamente. Para
ello se analizó una muestra de gastos en cada empresa, obteniéndose los siguientes
datos;
2
Empresa Muestra de gastos de publiidad mensuales (en miles) n media muestral S i n i
A 57,81,181,165,106 5 118 11412
B 110,160,93,206,171,165,153,150 8 151 8752
C 88,66,112,47,52,79 6 74 2942
D 72,38,45,108,42 5 61 3476
a. Se desea saber si existe diferencia significativa entre las medias de gastos en
publicidad de las cuatro empresas. Detalle los supuestos que realice. (α=0.05)
b. Explique la lógica del estadístico F empleado en el análisis de la varianza.
Ezequiel Durantini 15 Práctica Estimadores
Ejercicio ANOVA a
Suponemos que los gastos en publicidad se distribuyen normalmente, son
independientes y que la varianza de las cuatro poblaciones son desconocidas pero
iguales.
A ~ N( a , )
B ~ N( b , )
C ~ N( c , )
D ~ N( d , )
H0 a b c d
HA No todas iguales
Ezequiel Durantini 16 Práctica Estimadores
Ejercicio ANOVA a
N na nb nc nd
N 5865
N 24
d ni d
x
i a j 1
ij n x i i
X i a
N N
118.5 151.8 74.6 61.5
X
24
X 106,125
Ezequiel Durantini 17 Práctica Estimadores
Ejercicio ANOVA a
d ni d
SCD ( xij xi ) 2 ni S i2
i a j 1 ia
SCD 11412 8752 2942 3476
SCD 26582
d ni d
SCE ( xi x ) 2 ni ( xi x ) 2
i a j 1 i a
SCE 5.(118 106,125) 2 8.(151 106,125) 2 6.(74 106,125) 2
5.(61 106,125) 2
SCE 33188,625
Ezequiel Durantini 18 Práctica Estimadores
Ejercicio ANOVA a
SCD 26582
CMD
N K 24 4
CMD 1329,1
SCE 33188,625
CME
K 1 4 1
CME 11062,875
Ezequiel Durantini 19 Práctica Estimadores
Ejercicio ANOVA a
Si H 0 es V
CME
~ FK -1, N -K
CMD
F1C , K 1, N K F0C.95,3, 20 3,0983
CME 11062,875
F e
443,033
CMD 1329,1
F e > FC Re chazo H 0
Ezequiel Durantini 20 Práctica Estimadores
Ejercicio ANOVA a
Pvalor P F F e PF 443,033 0
La probabilidad de cometer error tipo 1 es muy baja. Rechazo la hipótesis nula
Los gastos medios mensuales en publicidad de las cuatro empresas son
significativamente diferentes.
Ezequiel Durantini 21 Práctica Estimadores
Ejercicio ANOVA b
Supuestos
• Las poblaciones tienen distribución normal y son independientes
•Los desvíos poblacionales son desconocidos pero iguales
H0 1 2 ... k
HA No todas iguales
Si H 0 es V
SCD
~ N2 K
2 SCE
~ N2 K
E (CMD) 2 2
E (CME ) 2
CMD estimador insesgado de la
CME estimador insesgado de la
varianza poblacional
varianza poblacional, si H0 es V.
Ezequiel Durantini 22 Práctica Estimadores
Ejercicio ANOVA b
H
n1
Fn1 ,n2 H ~ n21 , L ~ n22
L
n2
Si H 0 es V
SCE
K 1 SCE
2
K 1
CME
FK 1, N K
SCD SCD CMD
N K N K
2
Ezequiel Durantini 23 Práctica Estimadores
Ejercicio ANOVA b
Si H 0 es V
E (CME ) 2
2 1
E (CMD)
Re chazo H 0 si
F e F1 , K 1, N K
Ezequiel Durantini 24 Práctica Estimadores
Ejercicio Modelo Lineal
Se desea analizar el consumo de cierto bien en función de las fluctuaciones en el
precio X1 y en el ingreso X2. para efectuar el estudio se tomaron los datos en pesos
de los últimos 14 meses que se detallan a continuación;
22,6545 0,4296 0,1151 14
( xx) 1 0,0126 0,0019 (Y Y )
t 1
t
2
840,85714
0,0007 R 2 0,8897
14 14 14
Y
t 1
t 592 X
t 1
Y 5497
1t t X
t 1
Y 95528
2t t
a. Ajuste con un modelo lineal. Interprete detalladamente cada coeficiente de la
regresión en términos del problema.
b. ¿Puede considerarse que un aumento de un peso en el precio provoca una
disminución significativa en el consumo?
c. ¿Considera que el modelo elegido es adecuado para explicar el consumo? (tomar
α=0.05)
Ezequiel Durantini 25 Práctica Estimadores
Ejercicio Modelo Lineal a
Consumo ~ Precio Ingreso
x1 x2
Modelo
yt b0 b1 x1t b2 x2t t
yˆ t bˆ0 bˆ1 x1t bˆ2 x2t
14
Aplico Mínimos Cuadrados para hallar los b0 , b1 , b2 que minimizan t
2
t 1
14 14
t t SCNE
t 1
( y
t
2
ˆ
y ) 2
t 1
Ezequiel Durantini 26 Práctica Estimadores
Ejercicio Modelo Lineal a
14 14
14
T x1t x2 t
ˆ yt
t 1 t 1
b t 1
ˆ
14 14 0 14
x 2
1t x 1t 2 t 1
x
. b
y x
t 1t
bˆ2 14
t 1 t 1 t 1
14
t 1
x 2t
2
yt x 2 t
t 1
( xx) . bˆ ( xy )
Si ( xx) es invertible
bˆ ( xx) 1 ( xy )
Ezequiel Durantini 27 Práctica Estimadores
Ejercicio Modelo Lineal a
bˆ ( xx) 1 ( xy )
bˆ0 22,6545 0,4296 0,1151 592
ˆ
b1 0,0126 0,0019 . 5497
bˆ 0,0007 95528
2
54,5024 22,6545 0,4296 0,1151 592
3,5578 0,0126
0,0019 . 5497
9,1747 0,0007 95528
yˆ t bˆ0 bˆ1 x1t bˆ2 x2t
yˆ t 54,5024 3,5578.x1t 9,1747.x2t
Ezequiel Durantini 28 Práctica Estimadores
Ejercicio Modelo Lineal SCT SCE SCNE R
T SCT SCE SCNE
SCT ( yt y ) yy Ty
2 2
SCNE
t 1 1 R 2
T SCT
SCT yt2 Ty 2 SCE SCNE
t 1 R2 1
SCT SCT
T T
SCE ( yˆ t y ) bˆxy Ty
2 2
SCNE ( yt yˆ t ) 2 yy bˆxy
t 1 t 1
T T
t y yt
Tt 1 Tt 1
T
SCE bˆ0 bˆ1 bˆ2 yt x1t Ty SCNE yt2 bˆ0
2
bˆ1 bˆ2 yt x1t
t 1 t 1
t 1
T T
yt x 2 t yt x 2 t
t 1 t 1
Ezequiel Durantini 29 Práctica Estimadores
Ejercicio Modelo Lineal SCT SCE SCNE R
R 2 0,8897
SCT 840,85714
SCE
0,8897 SCE 748,1105
840,85714
840,85714 SCNE 748,1105 SCNE 92,7465
Ezequiel Durantini 30 Práctica Estimadores
Ejercicio Modelo Lineal VAR/COV b
T T
( t 0) 2
t t
( y ˆ
y ) 2
SCNE
ˆ t
2 t 1
t 1
T ( K 1) T ( K 1) T ( K 1)
Matriz de VAR y COV
VAˆ R (bˆ0 ) COˆ V (bˆ0 , bˆ1 ) COˆ V (bˆ0 , bˆ2 )
ˆ ˆ ˆ ˆ ˆ
2
ˆ t ( x x)
1
VAR (b1 ) COV (b1 , b2 )
VAˆ R (bˆ2 )
Ezequiel Durantini 31 Práctica Estimadores
Ejercicio Modelo Lineal VAR/COV b
SCNE 92,7465
ˆ t
2
8,4315
T ( K 1) 14 (2 1)
22,6545 0,4296 0,1151
ˆ 2t ( xx) 1 8,4315 0,0126 0,0019
0,0007
191,011 3,6221 0,9704
ˆ 2t ( xx) 1 0,1062 0,0160
0,0059
Ezequiel Durantini 32 Práctica Estimadores
Ejercicio Modelo Lineal b
H0 b1 0 Si H 0 es V
HA b1 < 0 bˆ1 b1
~ t T -(K 1)
VAˆ R (bˆ )
1
3,5578 0
t
e
10,9158
0,1062
pvalor Pt 10,9158
0 Re chazo H 0
En base a la información suministrada podemos decir que el aumento de un peso en
el precio (X1) provoca una disminución significativa en el consumo (Y).
Ezequiel Durantini 33 Práctica Estimadores
Ejercicio Modelo Lineal c
Si H 0 es V
H0 b1 b2 0
SCE
HA a lg un bi 0 i 1,2 K ~ FK, T -(K 1)
SCNE
T ( K 1)
748,1105
Fe 2 44,3640
92,7465
14 (2 1)
F c F1 , K ,T ( K 1) F0.95, 2,11 3,9822
F e > Fc Re chazo H 0
pvalor PF 44,3640 0,000005 Re chazo H 0
Ezequiel Durantini 34 Práctica Estimadores
Ejercicio Bondad de Ajuste
Usted es actuario y desea modelar los montos de los siniestros de una compañía de
seguros que opera en el ramo de inmuebles con un limite a la póliza de 400.000
pesos, mediante test chi cuadrado. Sospecha que los montos de los siniestros
podrían modelarse mediante una distribución exponencial o normal. Toma una
muestra de montos y los agrupa en 14 intervalos de igual amplitud.
a. ¿Qué parámetros estimaría y cómo?
b. Sabiendo que el valor del estadifico muestral para el ajuste exponencial es
6,304 y para el ajuste normal el estadístico resultó 17,275 ¿Cuál de las dos
distribuciones elegiría para modelar los montos de los siniestros de la
compañía? ¿ Los dos ajustes son adecuados? Justifique claramente con el p
valor
Ezequiel Durantini 35 Práctica Estimadores
Ejercicio Bondad de Ajuste a
Exponencial Normal
x ( x )2
1 1
f ( x) f ( x) e 2
2
e
2
ˆ EMV ˆ MOM X ˆ EMV ˆ MOM X
n
( xi x ) 2
ˆ 2 EMV
ˆ 2 MOM
i 1 n
K=Parámetros a estimar
N=14=Numero de intervalos en que se agrupa la muestra
n= Tamaño de la muestra
Condición n≥5.14
Ezequiel Durantini 36 Práctica Estimadores
Ejercicio Bondad de Ajuste b
Estadistico
Si H o V
( nN
n e 2
i )
2 i
e
~ 2
N - K -1
i 1 n i
2 Exponencial
~ 2
14-1-1 2 Normal
~ 142 -2-1
2 Exponencial
e 6,304 2 Normal
e 17,275
Exponencial
Pvalor 1 F (6,304) Normal
Pvalor 1 F (17,275)
Exponencial
Pvalor 0,899 Normal
Pvalor 0,10
Ezequiel Durantini 37 Práctica Estimadores
Ejercicio Independencia de Atributos 1
Una empresa dedicada a la venta de gaseosas, desea establecer si existe relación
entre el tipo de gaseosa y la cantidad de unidades vendidas, utilizando la
información que a continuación se detalla:
1000-2000 2000-3000 3000-4000 >4000
Normal 230 580 20 20
Dietética 400 800 120 30
Descafeinada 40 160 550 50
1000-2000 2000-3000 3000-4000 >4000
Normal 8,499 47,304 157,546 x
Dietética 32,180 16,521 116,877 y
Descafeinada 107,622 153,004 728,022 20,417
El primer cuadro presenta las frecuencias, que son el numero de establecimientos
que vendió el tipo de gaseosa i en la cantidad mensual j.
El segundo muestra los valores de: (nij nije ) 2
nije
a. Halle X e Y
b. Halle el P valor de la prueba y decida a su criterio.
Ezequiel Durantini 38 Práctica Estimadores
Ejercicio Independencia de Atributos 1
H0 P( Ai B j ) P( Ai ).P( B j ) para todo i, j
(i 1,.., r j 1,.., s )
HA P( Ai B j ) P( Ai ).P ( B j )
Si H 0 V
r s (nij nije ) 2
i 1 j 1 nije
~ (r2 -1).(s-1)
r Número de categorias del factor A
s Número de categorias del factor B
Ezequiel Durantini 39 Práctica Estimadores
Ejercicio Independencia de Atributos 1
1000-2000 2000-3000 3000-4000 >4000 Freq. Marginal
Normal 230 580 20 20 850
Dietética 400 800 120 30 1350
Descafeinada 40 160 550 50 800
Freq. Marginal 670 1540 690 100 3000
nij ˆ ni ˆ nj
P( Ai
ˆ Bj ) P( Ai ) P( B j )
n n n
Si H 0 V
ˆ ˆ ni n j ni .n j
n n.P( Ai
e
ij
ˆ B j ) n.P( Ai ).P( B j ) n. .
n n n
Ezequiel Durantini 40 Práctica Estimadores
Ejercicio Independencia de Atributos 1
n n
e 2
Y
n 2, 4 n
e 2
2, 4
X 1, 4 1, 4
e
n
1, 4
n2e, 4
n1 .n4 n2 .n4
n e
1, 4 ne
2, 4
n n
2
850.100
2
1350.100
20 3000 30 3000
X Y
850.100 1350.100
3000 3000
X 2,450 Y 5
Ezequiel Durantini 41 Práctica Estimadores
Ejercicio Independencia de Atributos 1
r s (nij nije ) 2
i 1 j 1 nije
~ (231).(41) 62
r s (nij nije ) 2
e2 e
1395,442
i 1 j 1 n ij
Pvalor 1 F (1461,325)
Pvalor
0 Re chazo H 0
Los atributos tipo de gaseosa y cantidad de unidades vendidas no son independientes
Ezequiel Durantini 42 Práctica Estimadores
Ejercicio Independencia de Atributos 2
En un test para decidir se las ganas de ver partidos de un mundial de futbol es
independiente del sexo, se tomo una muestra de empleados, hombres y mujeres, y
se registro si modificaron o no sus horarios laborales para ver los partidos. Como el
estadístico de prueba resulto 5,024 ¿Se debería concluir que son independientes?
Calcule el p valor del test y decida en función de p.
Ezequiel Durantini 43 Práctica Estimadores
Ejercicio Independencia de Atributos 2
Estadistico
Si H o V
r s (nij nije ) 2
i 1 j 1 nije
~ (r2 -1).(s-1) (22 -1).(2-1)
r Número de categorias del factor A
s Número de categorias del factor B
e2 5,024
Pvalor 1 F (5,024)
Pvalor 0,024 Re chazo H 0
Los atributos, sexo y ganas de mirar partidos del mundial (medido por el cambio o
no del horario laboral) no son independientes.
Ezequiel Durantini 44 Práctica Estimadores