0% encontró este documento útil (0 votos)
26 vistas44 páginas

Repaso Segundo Parcial

El documento es un repaso de Estadística II que incluye ejercicios sobre pruebas de hipótesis, ANOVA y modelos lineales. Se presentan problemas prácticos relacionados con la evaluación de la media de peso de paquetes y el análisis de gastos publicitarios de varias empresas. Además, se discuten conceptos como errores tipo 1 y 2, así como la lógica detrás del análisis de varianza.

Cargado por

tequeobur
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
26 vistas44 páginas

Repaso Segundo Parcial

El documento es un repaso de Estadística II que incluye ejercicios sobre pruebas de hipótesis, ANOVA y modelos lineales. Se presentan problemas prácticos relacionados con la evaluación de la media de peso de paquetes y el análisis de gastos publicitarios de varias empresas. Además, se discuten conceptos como errores tipo 1 y 2, así como la lógica detrás del análisis de varianza.

Cargado por

tequeobur
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Repaso Segundo Parcial

EZEQUIEL ADRIAN DURANTINI

ESTADÍSTICA II

FACULTAD DE CIENCIAS ECONÓMICAS


CONTENIDO
Ejercicio Test de Hipótesis

Ejercicio Test de Hipótesis 2

 ANOVA

 Modelo Lineal

Bondad de Ajuste

Independencia de Atributos

Independencia de Atributos 2
Ezequiel Durantini 2 Práctica Estimadores
Ejercicio Test de Hipótesis
Un inspector de pesos y medidas quiere analizar si cierta maquina que envasa
paquetes de harina de 1 kg funciona correctamente. Para ello tomará una muestra
aleatoria de 37 paquetes y , suponiendo que los resultados provienen de una normal,
se decidirá multar al fabricante si la media muestral es mayor o igual a 1,1032kg o
menor o igual a 0,8968.
a. ¿Cuál deberá ser la varianza muestral (sesgada) si la probabilidad de multar
erróneamente al fabricante es 0,01?
b. Si la varianza muestral del punto anterior fuese la varianza poblacional ¿Cuál es
la probabilidad de no multar al fabricante si el verdadero valor esperado del
peso de cada paquete está un 2% por encima del correcto?
c. Indique claramente cuáles son los errores de tipo 1 y 2 en este ejercicio, en
términos del problema.

Ezequiel Durantini 3 Práctica Estimadores


Ejercicio Test de Hipótesis

 ? Multar si
n  37
X  1,1032
X ~ Normal
X  0,8968

X  0
 ~ N(0,1) Con  Conocida

n


X  0
~ t n -1 Con  Desconocida S
 (x  x)
i
2

S n
n 1

Ezequiel Durantini 4 Práctica Estimadores


Ejercicio Test de Hipótesis a

H0   1

HA  1

X  0
 ~ t n -1 Si H 0 es V
S
n 1

 
P  R H 0 / H 0 V     Multar erroneamente  0,01
 

Ezequiel Durantini 5 Práctica Estimadores


Ejercicio Test de Hipótesis a

(1)
tc   t36
c
, 0 , 005  2,719485 X c  0,8968
n 1,
2

tc   t36
c
, 0 , 995  2,719485 X c  1,1032 (2)
n 1,1
2

X c  0 0,8968  1
t c
    2,719485  (3)
n 1, S S
n 1
2
36

(4)
 S n  0,22769

Ezequiel Durantini 6 Práctica Estimadores


Ejercicio Test de Hipótesis b

 2  S 2  (0,22769) 2
  1,02

X  0
 ~ N(0,1) Con  Conocida

n

 
P A H 0 / H 0 F   
 

Ezequiel Durantini 7 Práctica Estimadores


Ejercicio Test de Hipótesis b
PAH 0 / H 0 F    (1)

P0,8968  X  1,1032 /   1,02   (2)

 
 0,8968  1,02 X  1,02 1,1032  1,02 
  
P (3)
0,22769 0,22769 0,22769
 37 
 37 37

P 3,291301  Z  2,222669  


(4)

PZ  2,222669  PZ  3,291301   (5)

0,986882  0,000499  0,986383   (6)


Ezequiel Durantini 8 Práctica Estimadores
Ejercicio Test de Hipótesis c

α= Multar cuando la maquina funciona correctamente


(dentro del margen aceptado)

β= No Multar cuando la maquina no funciona


correctamente

Ezequiel Durantini 9 Práctica Estimadores


Ejercicio Test de Hipótesis 2
Un periodista esta preocupado por la cantidad de edificios que no aceptan niños.
Antes de escribir un articulo se quiere asegurar de escribir si P poblacional es mayor
a 0,75. Analiza 125 edificios.
a. Si 102 excluyen niños. Decidir si se escribe el articulo. La probabilidad de
escribir erróneamente el articulo es 0,10.
b. Considerando la misma zona de rechazo de la hipótesis nula ¿Cuántos edificios
debería hacerse el muestreo para que cuando el porcentaje de edificios que
excluyen niños es del 80%, la probabilidad de escribir el articulo es 0,90?

n  125
102
p  0,816
125

P  P0

p0 q0
 N(0,1)
n 
n

Ezequiel Durantini 10 Práctica Estimadores


Ejercicio Test de Hipótesis 2 a
H 0 P  0,75

H A P > 0,75

P  P0

p0 q0
 N(0,1)
n 
Si H 0 es V y n > 30
n

 
P  R H 0 / H 0 V     escribir el articulo erroneamente  0,10
 

Ezequiel Durantini 11 Práctica Estimadores


Ejercicio Test de Hipótesis 2 a

Z1c  Z 0c,90  1,281552

p c  p0 p c  0,75
Z 0c,90    1,281552  p c  0,7996
p 0 q0 0,75.0,25
n 125

p > p c  Re chazo H 0  Escribe el articulo

Ezequiel Durantini 12 Práctica Estimadores


Ejercicio Test de Hipótesis 2 b
 
PR H 0 / H 0 F   1   n? (1)
 

 
P Z  Z c / p  0,80  0,90 /  
P p  p c / p  0,80  0,90 (2)

No, el nuevo n cambia pc

 
 p  p0  (3)
P  1,281552 / p  0,80  0,90
 p0 q0 
 n 

   
P  p  1,281552 0,75.0,25  0,75  / p  0,80  0,90 (4)
  n  
Nuevo pc

Ezequiel Durantini 13 Práctica Estimadores


Ejercicio Test de Hipótesis 2 b

  0, 75.0, 25   (5)
  1,281552  0,75   0,80 
n 
P Z    
  0,90
  0,80.0,20 
  n  
  

 0,75.0,25  0,75   0,80 


  1, 281552
n  
 
   Z 0,10  1,281552 (6)
 0,80.0,20 
 n 

 n  455,86  n  456

Ezequiel Durantini 14 Práctica Estimadores


Ejercicio ANOVA
Una revista de marketing se asegura que los gastos medios mensuales en publicidad
de cuatro importantes empresas A, B, C y D no difieran significativamente. Para
ello se analizó una muestra de gastos en cada empresa, obteniéndose los siguientes
datos;

2
Empresa Muestra de gastos de publiidad mensuales (en miles) n media muestral S i n i

A 57,81,181,165,106 5 118 11412


B 110,160,93,206,171,165,153,150 8 151 8752
C 88,66,112,47,52,79 6 74 2942
D 72,38,45,108,42 5 61 3476

a. Se desea saber si existe diferencia significativa entre las medias de gastos en


publicidad de las cuatro empresas. Detalle los supuestos que realice. (α=0.05)
b. Explique la lógica del estadístico F empleado en el análisis de la varianza.

Ezequiel Durantini 15 Práctica Estimadores


Ejercicio ANOVA a
Suponemos que los gastos en publicidad se distribuyen normalmente, son
independientes y que la varianza de las cuatro poblaciones son desconocidas pero
iguales.

A ~ N(  a ,  )
B ~ N(  b ,  )
C ~ N(  c ,  )
D ~ N(  d ,  )

H0  a  b   c   d

HA No todas iguales

Ezequiel Durantini 16 Práctica Estimadores


Ejercicio ANOVA a

N  na  nb  nc  nd
N  5865
N  24

d ni d
 x
i  a j 1
ij n x i i
X    i a

N N
118.5  151.8  74.6  61.5
X  
24
X   106,125

Ezequiel Durantini 17 Práctica Estimadores


Ejercicio ANOVA a
d ni d
SCD   ( xij  xi ) 2   ni S i2
i  a j 1 ia

SCD  11412  8752  2942  3476


SCD  26582

d ni d
SCE   ( xi  x ) 2   ni ( xi  x ) 2
i  a j 1 i a

SCE  5.(118  106,125) 2  8.(151  106,125) 2  6.(74  106,125) 2


 5.(61  106,125) 2

SCE  33188,625

Ezequiel Durantini 18 Práctica Estimadores


Ejercicio ANOVA a

SCD 26582
CMD  
N  K 24  4
CMD  1329,1

SCE 33188,625
CME  
K 1 4 1
CME  11062,875

Ezequiel Durantini 19 Práctica Estimadores


Ejercicio ANOVA a
Si H 0 es V

CME
~ FK -1, N -K
CMD

F1C , K 1, N  K  F0C.95,3, 20  3,0983

CME 11062,875
F e
  443,033
CMD 1329,1

F e > FC  Re chazo H 0

Ezequiel Durantini 20 Práctica Estimadores


Ejercicio ANOVA a

 
Pvalor  P F  F e  PF  443,033   0

La probabilidad de cometer error tipo 1 es muy baja. Rechazo la hipótesis nula

Los gastos medios mensuales en publicidad de las cuatro empresas son


significativamente diferentes.

Ezequiel Durantini 21 Práctica Estimadores


Ejercicio ANOVA b
Supuestos
• Las poblaciones tienen distribución normal y son independientes
•Los desvíos poblacionales son desconocidos pero iguales

H0 1   2  ...   k

HA No todas iguales
Si H 0 es V
SCD
~  N2  K
 2 SCE
~  N2  K
E (CMD)   2 2
E (CME )   2
CMD estimador insesgado de la
CME estimador insesgado de la
varianza poblacional
varianza poblacional, si H0 es V.

Ezequiel Durantini 22 Práctica Estimadores


Ejercicio ANOVA b

H
n1
Fn1 ,n2  H ~  n21 , L ~  n22
L
n2

Si H 0 es V

SCE
K 1 SCE
 2
 K  1 
CME
 FK 1, N  K
SCD SCD CMD
N  K N K
2

Ezequiel Durantini 23 Práctica Estimadores


Ejercicio ANOVA b

Si H 0 es V

E (CME )  2
 2 1
E (CMD) 

Re chazo H 0 si

F e  F1 , K 1, N  K

Ezequiel Durantini 24 Práctica Estimadores


Ejercicio Modelo Lineal
Se desea analizar el consumo de cierto bien en función de las fluctuaciones en el
precio X1 y en el ingreso X2. para efectuar el estudio se tomaron los datos en pesos
de los últimos 14 meses que se detallan a continuación;

22,6545  0,4296  0,1151 14

( xx) 1   0,0126 0,0019   (Y  Y )


t 1
t
2
 840,85714

 0,0007  R 2  0,8897
14 14 14

Y
t 1
t  592 X
t 1
Y  5497
1t t X
t 1
Y  95528
2t t

a. Ajuste con un modelo lineal. Interprete detalladamente cada coeficiente de la


regresión en términos del problema.
b. ¿Puede considerarse que un aumento de un peso en el precio provoca una
disminución significativa en el consumo?
c. ¿Considera que el modelo elegido es adecuado para explicar el consumo? (tomar
α=0.05)

Ezequiel Durantini 25 Práctica Estimadores


Ejercicio Modelo Lineal a
Consumo ~ Precio  Ingreso
x1 x2

Modelo
yt  b0  b1 x1t  b2 x2t  t

yˆ t  bˆ0  bˆ1 x1t  bˆ2 x2t


   14

Aplico Mínimos Cuadrados para hallar los b0 , b1 , b2 que minimizan  t


 2

t 1

14 14

  t t  SCNE
 
t 1
( y
t
2
 ˆ
y ) 2

t 1

Ezequiel Durantini 26 Práctica Estimadores


Ejercicio Modelo Lineal a

 14 14
  14 
T  x1t  x2 t 
 ˆ   yt 
 t 1 t 1
 b  t 1

ˆ  
14 14 0 14
  
  x 2
1t  x 1t 2 t  1 
x

. b 
  y x
t 1t

 bˆ2   14
t 1 t 1 t 1
 14 


t 1
x 2t 
2


  yt x 2 t 
 t 1 
( xx) . bˆ  ( xy )

Si ( xx) es invertible

bˆ  ( xx) 1 ( xy )

Ezequiel Durantini 27 Práctica Estimadores


Ejercicio Modelo Lineal a
bˆ  ( xx) 1 ( xy )
bˆ0  22,6545  0,4296  0,1151  592 
ˆ     
 b1    0,0126 0,0019 . 5497 
bˆ   0,0007  95528
 2 
 54,5024  22,6545  0,4296  0,1151  592 
 3,5578   0,0126  
0,0019 . 5497 
  
 9,1747   0,0007  95528

yˆ t  bˆ0  bˆ1 x1t  bˆ2 x2t


yˆ t  54,5024  3,5578.x1t  9,1747.x2t
Ezequiel Durantini 28 Práctica Estimadores
Ejercicio Modelo Lineal SCT SCE SCNE R
T SCT  SCE  SCNE
SCT   ( yt  y )  yy  Ty
2 2
SCNE
t 1 1 R  2

T SCT
SCT   yt2  Ty 2 SCE SCNE
t 1 R2   1
SCT SCT
T T
SCE   ( yˆ t  y )  bˆxy  Ty
2 2
SCNE   ( yt  yˆ t ) 2  yy  bˆxy
t 1 t 1

 T   T 
  t  y   yt 
 Tt 1   Tt 1 
   
T
SCE  bˆ0 bˆ1 bˆ2   yt x1t   Ty SCNE   yt2  bˆ0
2
bˆ1 bˆ2   yt x1t 
 t 1  t 1
 t 1 
T  T 
  yt x 2 t    yt x 2 t 
 t 1   t 1 
Ezequiel Durantini 29 Práctica Estimadores
Ejercicio Modelo Lineal SCT SCE SCNE R

R 2  0,8897
SCT  840,85714

SCE
 0,8897  SCE  748,1105
840,85714

840,85714  SCNE  748,1105  SCNE  92,7465

Ezequiel Durantini 30 Práctica Estimadores


Ejercicio Modelo Lineal VAR/COV b

T T

 (  t  0) 2
 t t
( y  ˆ
y ) 2
SCNE
ˆ t 
2 t 1
 t 1

T  ( K  1) T  ( K  1) T  ( K  1)

Matriz de VAR y COV

VAˆ R (bˆ0 ) COˆ V (bˆ0 , bˆ1 ) COˆ V (bˆ0 , bˆ2 )


 ˆ ˆ ˆ ˆ ˆ 
2

ˆ t ( x x)  
1
VAR (b1 ) COV (b1 , b2 ) 
 VAˆ R (bˆ2 ) 
 

Ezequiel Durantini 31 Práctica Estimadores


Ejercicio Modelo Lineal VAR/COV b

SCNE 92,7465
ˆ t 
2
  8,4315
T  ( K  1) 14  (2  1)

22,6545  0,4296  0,1151


ˆ 2t ( xx) 1  8,4315 0,0126 0,0019 
 0,0007 
191,011  3,6221  0,9704
ˆ 2t ( xx) 1   0,1062 0,0160 
 0,0059 

Ezequiel Durantini 32 Práctica Estimadores


Ejercicio Modelo Lineal b

H0 b1  0 Si H 0 es V

HA b1 < 0 bˆ1  b1
~ t T -(K 1)
VAˆ R (bˆ )
1

 3,5578  0
t 
e
 10,9158
0,1062

pvalor  Pt  10,9158 


 0 Re chazo H 0
En base a la información suministrada podemos decir que el aumento de un peso en
el precio (X1) provoca una disminución significativa en el consumo (Y).

Ezequiel Durantini 33 Práctica Estimadores


Ejercicio Modelo Lineal c
Si H 0 es V
H0 b1  b2  0
SCE
HA a lg un bi  0 i  1,2 K ~ FK, T -(K 1)
SCNE
T  ( K  1)

748,1105
Fe  2  44,3640
92,7465
14  (2  1)
F c  F1 , K ,T ( K 1)  F0.95, 2,11  3,9822
F e > Fc Re chazo H 0

pvalor  PF  44,3640  0,000005 Re chazo H 0

Ezequiel Durantini 34 Práctica Estimadores


Ejercicio Bondad de Ajuste
Usted es actuario y desea modelar los montos de los siniestros de una compañía de
seguros que opera en el ramo de inmuebles con un limite a la póliza de 400.000
pesos, mediante test chi cuadrado. Sospecha que los montos de los siniestros
podrían modelarse mediante una distribución exponencial o normal. Toma una
muestra de montos y los agrupa en 14 intervalos de igual amplitud.

a. ¿Qué parámetros estimaría y cómo?


b. Sabiendo que el valor del estadifico muestral para el ajuste exponencial es
6,304 y para el ajuste normal el estadístico resultó 17,275 ¿Cuál de las dos
distribuciones elegiría para modelar los montos de los siniestros de la
compañía? ¿ Los dos ajustes son adecuados? Justifique claramente con el p
valor

Ezequiel Durantini 35 Práctica Estimadores


Ejercicio Bondad de Ajuste a

Exponencial Normal

x ( x )2
1 1 

f ( x)  f ( x)  e 2
2
e
  2
ˆ EMV  ˆ MOM  X ˆ EMV  ˆ MOM  X
n
( xi  x ) 2
ˆ 2 EMV
 ˆ 2 MOM

i 1 n
K=Parámetros a estimar
N=14=Numero de intervalos en que se agrupa la muestra
n= Tamaño de la muestra
Condición n≥5.14

Ezequiel Durantini 36 Práctica Estimadores


Ejercicio Bondad de Ajuste b
Estadistico
Si H o V

( nN
 n e 2
i )
 
2 i
e
~  2
N - K -1
i 1 n i

 2 Exponencial
~ 2
14-1-1  2 Normal
~ 142 -2-1

 2 Exponencial
e  6,304  2 Normal
e  17,275

Exponencial
Pvalor  1  F (6,304) Normal
Pvalor  1  F (17,275)

Exponencial
Pvalor  0,899 Normal
Pvalor  0,10

Ezequiel Durantini 37 Práctica Estimadores


Ejercicio Independencia de Atributos 1
Una empresa dedicada a la venta de gaseosas, desea establecer si existe relación
entre el tipo de gaseosa y la cantidad de unidades vendidas, utilizando la
información que a continuación se detalla:
1000-2000 2000-3000 3000-4000 >4000
Normal 230 580 20 20
Dietética 400 800 120 30
Descafeinada 40 160 550 50

1000-2000 2000-3000 3000-4000 >4000


Normal 8,499 47,304 157,546 x
Dietética 32,180 16,521 116,877 y
Descafeinada 107,622 153,004 728,022 20,417
El primer cuadro presenta las frecuencias, que son el numero de establecimientos
que vendió el tipo de gaseosa i en la cantidad mensual j.
El segundo muestra los valores de: (nij  nije ) 2
nije
a. Halle X e Y
b. Halle el P valor de la prueba y decida a su criterio.

Ezequiel Durantini 38 Práctica Estimadores


Ejercicio Independencia de Atributos 1
H0 P( Ai  B j )  P( Ai ).P( B j ) para todo i, j
(i  1,.., r j  1,.., s )
HA P( Ai  B j )  P( Ai ).P ( B j )

Si H 0 V

r s (nij  nije ) 2

i 1 j 1 nije
~  (r2 -1).(s-1)

r  Número de categorias del factor A


s  Número de categorias del factor B

Ezequiel Durantini 39 Práctica Estimadores


Ejercicio Independencia de Atributos 1
1000-2000 2000-3000 3000-4000 >4000 Freq. Marginal
Normal 230 580 20 20 850
Dietética 400 800 120 30 1350
Descafeinada 40 160 550 50 800
Freq. Marginal 670 1540 690 100 3000

nij ˆ ni ˆ nj
P( Ai 
ˆ Bj )  P( Ai )  P( B j ) 
n n n

Si H 0 V
ˆ ˆ ni n j ni .n j
n  n.P( Ai 
e
ij
ˆ B j )  n.P( Ai ).P( B j )  n. . 
n n n

Ezequiel Durantini 40 Práctica Estimadores


Ejercicio Independencia de Atributos 1

n n 
e 2
Y
n 2, 4 n 
e 2
2, 4
X 1, 4 1, 4
e
n
1, 4
n2e, 4
n1 .n4 n2 .n4
n e
1, 4  ne
2, 4 
n n
2
  850.100 
2
  1350.100 
20   3000  30   3000 
    
X Y
 850.100   1350.100 
   
 3000   3000 
X  2,450 Y 5

Ezequiel Durantini 41 Práctica Estimadores


Ejercicio Independencia de Atributos 1
r s (nij  nije ) 2

i 1 j 1 nije
~  (231).(41)   62

r s (nij  nije ) 2
 e2   e
 1395,442
i 1 j 1 n ij

Pvalor  1  F (1461,325)
Pvalor 
 0 Re chazo H 0

Los atributos tipo de gaseosa y cantidad de unidades vendidas no son independientes

Ezequiel Durantini 42 Práctica Estimadores


Ejercicio Independencia de Atributos 2
En un test para decidir se las ganas de ver partidos de un mundial de futbol es
independiente del sexo, se tomo una muestra de empleados, hombres y mujeres, y
se registro si modificaron o no sus horarios laborales para ver los partidos. Como el
estadístico de prueba resulto 5,024 ¿Se debería concluir que son independientes?
Calcule el p valor del test y decida en función de p.

Ezequiel Durantini 43 Práctica Estimadores


Ejercicio Independencia de Atributos 2
Estadistico
Si H o V

r s (nij  nije ) 2

i 1 j 1 nije
~  (r2 -1).(s-1)   (22 -1).(2-1)

r  Número de categorias del factor A


s  Número de categorias del factor B

 e2  5,024
Pvalor  1  F (5,024)
Pvalor  0,024  Re chazo H 0
Los atributos, sexo y ganas de mirar partidos del mundial (medido por el cambio o
no del horario laboral) no son independientes.
Ezequiel Durantini 44 Práctica Estimadores

También podría gustarte