Estadı́stica Inferencial
CM2H2
Jose UGARTE
Facultad de Ciencias - UNI
31 de marzo de 2023
Introducción
▶ Prueba de hipótesis
Test de Hipótesis
Nos enfocamos en dar hipótesis sobre el valor de un parámetro
desconocido de nuestra población y propondremos métodos para
aceptar o rechazar dichas hipótesis.
Observamos la naturaleza, formulamos una teorı́a y confrontamos
dicha teorı́a con los datos observados.
Hipótesis µ = 1, tomamos una muestra Y1 , . . . Yn , finalmente
comparamos y decidimos si aceptar o rechazar la hipótesis.
Ejemplo
a. Decidir que medicamento es mas eficaz ⇒ para esto tomamos
una muestra de personas enfermas las dividimos en grupos
iguales A y B, y luego observamos el numero de pacientes que
se recuperan tanto en A como en B.
b. Un nuevo método de ensamble da solamente 5 % de
productos defectuoso.
c. Verificar si un método de enseñanza es mejor que otro.
d. Afirmar si un candidato tiene mayorı́a.
Prueba de hipótesis
Problemas
a. ¿Qué pasa si una muestra no esta de acuerdo a la teorı́a?
b. ¿Cuál es la probabilidad de equivocarnos ?
c. ¿Qué debemos de tener en cuenta para tomar una buena
decisión ?
Elementos de una prueba estadı́stica
Ejemplo
Candidato A dice que ganará las elecciones del 2021 con mas del
50 % de votos. En nuestro caso, no creemos en lo dicho por
Candidato A, entonces apoyamos al hecho de que Candidato A no
esta favorecido por mas del 50 % de votos.
Elementos
Hipótesis Nula H0 : Candidato A ganará con mas del 50 % de votos.
Hipótesis alternativa Ha : Candidato A no alcanzará mas del 50 %
de votos.
Mostrar que la hipótesis nula H0 es falsa apoyara la hipótesis
alternativa Ha .
Elementos de una prueba estadı́stica
Elementos
p : la probabilidad de que un votante este a favor de Candidato A.
H0 : p = 0,5
Ha : p < 0,5
Elementos
Mostrar que una muestra apoya el rechazo de H0 entonces estamos
a favor de Ha .
Elementos de una prueba estadı́stica
Elementos
p : la probabilidad de que un votante este a favor de Candidato A.
H0 : p = 0,5
Ha : p < 0,5
Tomando una muestra
n = 15 número de votantes seleccionados
Y : Cantidad de personas a favor de Candidato A.
Motivación
a. Que pasarı́a si: Y = 0 y Candidato A esta favorecida por mas
del 50 %.
b. Esto puede pasar pero es altamente improbable.
c. Que pasarı́a si: Y = 0 y Candidato A esta favorecida por
menos 50 %.
d. Esto puede pasar y es mas probable que el caso anterior.
Elementos de una prueba estadı́stica
1. Hipótesis nula: H0 .
2. Hipótesis alternativa : Ha .
3. Estadı́stico de prueba.
4. Región de rechazo.
Los elementos que nos ayudan a decidir entre las hipótesis son :
a. El estadı́stico de prueba f (Y1 , . . . Yn ).
b. Región de rechazo RR.
How does it work ?
Si Estadı́stico de prueba ∈ RR ⇒ H0 se rechaza y se acepta Ha .
Si Estadı́stico de prueba ∈
/ RR ⇒ H0 se acepta.
Elementos de una prueba estadı́stica
Ejemplo:
1. H0 : p = 0,5.
2. Ha : p < 0,5.
3. Y : Numero de votantes a favor de Candidato A.
4. RR= {y : y ≤ k}
Motivación
¿Qué valor para k elegir ?
a. Si k muy pequeño ⇒ se favorece H0 .
b. Si k muy grande ⇒ se favorece Ha .
Errores en la toma de decisiones
a. Dado k ⇒ Aceptamos o rechazamos H0 ⇒ Tomamos una
decisión.
b. Tomar una mala decisión ⇒ perdida de dinero, tiempo o
prestigio ⇒ Hay una perdida.
c. ¿ Podremos medir la probabilidad de cometer una mala
decisión ?
Para eso usamos las herramientas estadı́sticas.
Errores en la toma de decisiones
Definición
▶ Error tipo I: H0 es rechazada cuando H0 es verdadera.
P(Error tipo I) se denota por α.
▶ Error tipo II: H0 es aceptada cuando Ha es verdadera.
P(Error tipo II) se denota por β.
Ejemplo
a. Error tipo I: Rechazar que Candidato A va ganar cuando en
realidad va ganar.
b. Error tipo II: Aceptar que Candidato A va ganar cuando en
realidad no va ganar.
c. Es necesario medir estos riesgos con α y β.
Errores tipo I
Si en nuestro caso ponemos k = 2, podemos calcular α y β.
Ejemplo:
1. H0 : p = 0,5.
2. Ha : p < 0,5.
3. Y : Numero de votantes a favor de Candidato A.
4. RR= {y : y ≤ 2}
α = P( error tipo I ) = P( rechazar H0 cuando H0 es verdadera)
= P(Y ∈ RR ∧ H0 es verdadera.)
= P(Y ≤ 2 ∧ p = 0,5)
15 15 15 15 15
= (0,5) + (0,5) + (0,5)15
0 1 2
α = 0,004.
Errores tipo II
Ejemplo: Decidir que Candidato A ganara cuando en realidad va
perder.
Si decidimos que ganara cuando en realidad p = 0,3, obtiene
(30 %) de votos.
1. H0 : p = 0,5.
2. Ha : p < 0,5.
3. Y : Numero de votantes a favor de Candidato A.
4. RR= {y : y ≤ 2}
β = P( error tipo II ) = P( aceptamos H0 cuando Ha es verdadera)
= P(Y ∈
/ RR ∧ Ha es verdadera.)
= P(Y ≥ 3 ∧ p = 0,3)
15
X 15
= (0,3)y (0,7)15−y
y
y =3
β = 0,873.
Errores tipo II
Ejemplo: Decidir que Candidato A ganara cuando en realidad va
perder.
Si decidimos que ganará cuando en realidad p = 0,1, obtiene
(10 %) de votos.
1. H0 : p = 0,5.
2. Ha : p < 0,5.
3. Y : Número de votantes a favor de Candidato A.
4. RR= {y : y ≤ 2}
β = P( error tipo II ) = P( aceptamos H0 cuando Ha es verdadera)
= P(Y ∈
/ RR ∧ Ha es verdadera.)
= P(Y ≥ 3 ∧ p = 0,1)
15
X 15
= (0,1)y (0,9)15−y
y
y =3
β = 0,184.
Error tipo I y tipo II
▶ Tenemos que si en realidad p = 0,1 entonces β = 0,184.
▶ α = máx
P RR 15 15
y =0 y (0,5) .
Más grande RR ⇒ α crece ⇒ error tipo I es mas probable.
▶ β = 15 15
P y 15−y
y =máx RR y (p) (1 − p)
Más grande RR ⇒ β decrece ⇒ error tipo II es menos
probable.
Motivación
No debemos de cometer errores entonces α y β deben de ser
ambos muy pequeños.
Error tipo I y tipo II
Cambiando la región de rechazo RR = {y : y ≤ 5} con p = 0,3.
Ejemplo
▶ α = 0,151
▶ β = 0,278
Resumen
Pruebas comunes en MUESTRAS GRANDES
▶ Nuestro estadı́stico θ̂ ∼ N (θ, σ 2 ).
θ̂
▶ Por ejemplo tenemos Ȳ , p̄, µ1 − µ2 , p1 − p2 .
Pruebas comunes en MUESTRAS GRANDES
▶ Nuestro estadı́stico θ̂ ∼ N (θ, σ 2 ).
θ̂
▶ Por ejemplo tenemos Ȳ , p̄, µ1 − µ2 , p1 − p2 .
Problema modelo:
▶ H0 : θ = θ 0
▶ H1 : θ > θ 0
▶ Estadı́stico de prueba :θ̂
▶ Región de rechazo: RR= {θ̂ > k} para algún k seleccionado.
Para α fijado, podemos obtener k:
⇒ RR= {θ̂ : θ̂ > θ0 + zα σθ̂ }
Pruebas comunes en MUESTRAS GRANDES
Problema modelo:
▶ H0 : θ = θ 0
▶ H1 : θ > θ 0
▶ Estadı́stico de prueba :Z = θ̂−θ0
σθ̂
▶ Región de rechazo: RR= {Z > k} para algún α seleccionado.
Para α fijado, en este caso normalizado podemos encontrar k:
⇒ RR= {Z : Z > zα }
Cálculo de la RR teniendo α
Para determina RR = {θ̂ > k}, debemos de encontrar k.
▶ Esta región de rechazo nos asegura que tengamos un error de
tipo I igual a α.
▶ Veamos, por definición α es el error de tipo I :
θ̂ − θ0 k − θ0
α = P( Error tipo I) = P(θ̂ > k) = P( > )
σθ̂ σθ̂
k − θ0
α = P(Z > )
σθ̂
▶ Recordamos que zα es solución de la ecuacion en x de:
Dado Z ∼ N (0, 1), P(Z > x) = α
▶ Por lo tanto tenemos k−θ0
σθ̂ = zα , con lo cual k = θ̂ + zα σθ̂ .
Hipótesis de prueba en muestras grandes
Ejemplo
10.33
Un politólogo cree que la fracción p1 de republicanos es mayor
que la fracción p2 de demócratas que están a favor de la pena de
muerte. Él adquirió muestras aleatorias independientes de 200
republicanos y 200 demócratas y encontró 46 republicanos y 34
demócratas a favor de la pena de muerte. ¿Esta evidencia
proporciona apoyo estadı́stico para la creencia del investigador?
Use α = .05.
▶ H0 : p1 − p2 = 0, con Ha : p1 − p2 > 0.
▶ Muestra pequeña o muestra grande.
▶ Estimador que se usa diferencia de proporciones.
p̂1 −p̂2 −0 p̂1 −p̂2 −0
▶ Estadı́stico de prueba : z = σθ̂ =√ .
p1 q1 /n1 +p2 q2 /n2
▶ Región de rechazo : RR = {z > z0,05 }.
Programación en R
Construir una función que resuelva los test de hipótesis en muestra
grande.
Hipótesis de prueba en muestras grandes
Ejemplo
El voltaje de salida para un circuito eléctrico es de 130. Una
muestra de 40 lecturas independientes del voltaje para este circuito
dio una media muestral de 128.6 y desviación estándar de 2.1.
Pruebe la hipótesis de que el promedio de voltaje de salida es 130
contra la alternativa de que es menor a 130. Use una prueba con
nivel .05
Solución:
▶ H0 : µ = 130 contra Ha : µ < 130.
▶ Z= θ̂−θ0 128,6−130
σθ̂ = √
2,1/ 40
= −4,22
▶ RR = {z < −zα = −1,65}
▶ La hipótesis nula es rechazada dado que hay evidencia
suficiente para afirmar que l voltaje es menor a 130.
Cálculo de error tipo II en muestras grandes
▶ Problema modelo :
H0 : θ = θ 0
Ha : θ > θ 0 .
▶ Si Ha es en realidad verdadera entonces debemos de tener
un valor predefinido para θ en esta región denotada por θa
con θa > θ0 .
▶ Z = θ̂−θ
σ
a
∼ N (0, 1)
θ̂
β = P(Error Tipo II)
= P(H0 se acepta cuando en realidad Ha es verdadera )
= P(θ̂ ∈
/ RR ∧ θ = θa )
= P(θ̂ ≤ k ∧ θ = θa )
θ̂ − θa k − θa k − θa
= P( ≤ ) = P(Z ≤ )
σθ̂ σθ̂ σθ̂
Cálculo de error tipo II en muestras grandes
Ejemplo
Si el voltaje baja hasta 128 pueden aparecer consecuencias graves.
Para probar H0 : µ = 130 contra Ha : µ = 128, encuentre la
probabilidad de un error tipo II, β, para la región de rechazo
empleada en el ejemplo anterior.
Solución:
▶ RR = {z < −zα = −1,65} = {µ < µ0 − σµ̂ (1,65) = k}
▶
β = P(Error Tipo II)
= P(H0 se acepta cuando en realidad Ha es verdadera )
= P(µ̂ ∈/ RR ∧ θ = θa ) = P(µ̂ ≥ k ∧ µ = µa )
µ̂ − µa k − µa k − µa
= P( ≥ ) = P(Z ≥ )
σµ̂ σµ̂ σµ̂
= P(Z ≥ 4,37) = 0,00000611 = 6,11e − 6
Cálculo de error tipo II en muestras grandes
Ejemplo:
El vicepresidente de ventas de una gran empresa afirma que los
vendedores están promediando no más de 15 contactos de venta
por semana. (Le gustarı́a aumentar esta cantidad.) Como prueba
de su afirmación, aleatoriamente se seleccionan n = 36 vendedores
y se registra el número de contactos hechos por cada uno para una
sola semana seleccionada al azar. La media y varianza de las 36
mediciones fueron 17 y 9, respectivamente. ¿La evidencia
contradice lo dicho por el vicepresidente? Use una prueba con nivel
α = ,05.
Solución:
▶ H0 : µ = θ0 = 15
Ha : µ = θa > 15
▶ RR = {Z > zα }.
Cálculo de error tipo II en muestras grandes
Ejemplo:
Vicepresidente afirma µ no mayor a 15, n = 36, µ̂ = 17, σ = 3 y
α = 0,05.
Solución:
▶ H0 : µ = θ0 = 15
Ha : µ = θa > 15
RR = {Z > zα } = {µ > θ0 + zα σθ̂ = k}
▶ Z= θ̂−θ0 17−15
σθ̂ = √
3/ 36
= 4 = z.
▶ zα = 1,65 usamos tabla o sino la función qnorm.
▶ z ∈RR = {Z > zα }.
▶ Entonces existe evidencia suficiente para rechazar la hipótesis
nula.
Cálculo de error tipo II en muestras grandes
Ejemplo:
Del ejemplo anterior, n = 36, µ̂ = 17, s = 3, α = 0,05. Deseamos
calcular β si se tiene que en realidad θa = µ = 16 y se compara
con θ0 = µ = 15.
▶ H0 : µ = θ0 = 15
Ha : µ = θa = 16
RR = {Z > zα } = {µ > θ0 + zα σθ̂ = k}
▶ β = P(Z ≤ k−θ k−θa
σ ) = P(Z ≤ σ ) = P(Z ≤
a k−θ
√a ) = 0,3594
θ̂ θ̂ s/ n
Tamaño muestral para muestras grandes
Idea: Teniendo α y β determinar n, el tamaño de la muestra.
▶ Problema modelo:
H0 : µ = µ 0
Ha : µ > µ0 .
▶ El valor k = µ0 + zα σθ̂ es conocido.
α = P(Ȳ > k ∧ µ = µa )
Ȳ − µ0 k − µ0
= P( > ) = P(Z > zα )
σθ̂ σθ̂
β = P(Ȳ ≤ k ∧ µ = µa )
Ȳ − µa k − µa
= P( ≤ ) = P(Z ≤ −zβ )
σθ̂ σθ̂
Despejando k tenemos µ0 + zα σθ̂ = µa − zβ σθ̂ ⇒ n conocida .