0% encontró este documento útil (0 votos)
24 vistas30 páginas

Sesion 10 P-Valor

El documento aborda la estadística inferencial, centrándose en el concepto de p-valor y su aplicación en pruebas de hipótesis, especialmente en muestras pequeñas. Se discuten los errores tipo I y la importancia de la elección del nivel de significancia α en la toma de decisiones sobre la hipótesis nula. Además, se presentan ejemplos prácticos y ejercicios para ilustrar la aplicación de estos conceptos en el software R.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
24 vistas30 páginas

Sesion 10 P-Valor

El documento aborda la estadística inferencial, centrándose en el concepto de p-valor y su aplicación en pruebas de hipótesis, especialmente en muestras pequeñas. Se discuten los errores tipo I y la importancia de la elección del nivel de significancia α en la toma de decisiones sobre la hipótesis nula. Además, se presentan ejemplos prácticos y ejercicios para ilustrar la aplicación de estos conceptos en el software R.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Estadı́stica Inferencial

CM2H2

Jose UGARTE - Fernando ZAMUDIO

Facultad de Ciencias - UNI

23 de junio de 2022
Introducción

I p-valor.
I Algunos comentarios con respecto a las pruebas de hipótesis.
I Pruebas de hipótesis en muestras pequeñas para µ y µ1 − µ2 .
I Pruebas de hipótesis con respecto a la varianza.
I Programación en R: Identificación de los parámetros en mues-
tras pequeñas y en el análisis de la varianza.
Motivación
I El rechazar o no la hipótesis nula depende fuertemente de α
con lo cual con dos valores distintos de α se pueden llegar a
dos resultados distintos.
I Por lo tanto necesitamos un parámetro un poco mas general
para saber cuando la hipótesis nula es rechazada o no.
I En nuestro caso, analizamos todos los α y lo separamos en
dos conjuntos disjuntos, los α para los cuales vamos a
rechazar la hipótesis nula y el otro el conjunto para los cuales
no lo rechazamos.
I Claramente, hay un valor lı́mite entre ambos conjuntos, un
valor lı́mite que para α mayores se rechaza la hipótesis nula y
para α menores se acepta la hipótesis nula.
I Dicho valor limite se llama el valor p o p-valor.
I Dicho noción es ampliamente usada en estadı́stica, y
prácticamente en todo software de test de hipótesis se
encuentra como parámetro. Este es el caso de R.
p-Valor

Definición:
Dado un estadı́stico de prueba W . El p-valor o nivel de
significancia alcanzado es el mı́nimo valor de α para el cual la
hipótesis nula debe de ser rechazada.

p = argminα∈R {z ∈ RR}

Importante:
Si α > p-Valor entonces se rechaza H0 .
Si α < p-Valor entonces se acepta H0 .

Observación
La región de rechazo depende del modelo elegido, por lo tanto
nuestro p varia de una prueba a otra. Tanto en valor numérico
como en forma de determinarlo.
p-Valor

Nos situamos en el marco de una muestra grande definido


previamente.
Ejemplo
Para el modelo H0 : µ = µ0 , Ha : µ 6= µ0 el estadı́stico z es fijo.
Determinar el p-valor.
Solución:
I p = argminα∈R {z ∈ RR}.
I p = argminα∈R {|z| > zα/2 }
I ⇒ el menor α/2 se alcanza cuando |z| = zα/2
I ⇒ α/2 = P(Z > |z|) ⇒ α = 2P(Z > |z|).
p-Valor

Nos situamos en el marco de una muestra grande definido


previamente.
Ejercicio
Para el modelo H0 : µ = µ0 , Ha : µ > µ0 el estadı́stico z es fijo.
Determinar el p-valor.

Ejercicio
Para el modelo H0 : µ = µ0 , Ha : µ < µ0 el estadı́stico z es fijo.
Determinar el p-valor.
p-Valor

Ejemplo
Los altos porcentajes de ocupación en vuelos regulares de lı́neas
aéreas son esenciales para tener rentabilidad. Suponga que un
vuelo regular debe promediar al menos 60 % de ocupación para ser
rentable y que un examen de los porcentajes de ocupación para
120 vuelos de las 10:00 de la mañana de Atlanta a Dallas
mostraron un porcentaje medio de ocupación por vuelo de 58 % y
desviación estándar de 11 %. Verifique si existe suficiente evidencia
para apoyar la afirmación de que el vuelo no es rentable. Encuentre
el valor p relacionado con la prueba. ¿Qué concluirı́a si desea poner
en práctica la prueba en el nivel α = ,10?
Solución:
I H0 : p = 0,6, Ha : p < 0,6.
√ 0,58−0,6
I p̂ = 0,58, σp̂ = σ/ n ⇒ z = σp̂
I p = argminα∈R {z < −zα }
p-Valor

Ejemplo

H0 : p = 0,6, Ha : p < 0,6, con p̂ = 0,58 y σp̂ = 0,1/ 120

Solución:
I p = argminα∈R {z < −zα } ⇒ p = argminα∈R {−z > zα }
I z = −1,99 entonces p = argminα∈R {1,99 > zα }
I De forma gráfica podemos ver que
1,99 = zα ⇒ α = P(Z > 1,99) = 0,023.
p-Valor

Determinar el p-valor en R para una prueba de hipótesis en


muestra grande para distintos modelos.
p-Valor

Interpretar de forma fácil y sencilla los diferentes test en:


https://rpubs.com/Joaquin_AR/218465
y en
http://sistemas.fciencias.unam.mx/~misraim/r.pdf
utilizando el p-valor.
Algunos comentarios con respecto a las pruebas de
hipótesis
I Sobre la hipótesis nula y la región de rechazo, estos están
ı́ntimamente ligados desde su definición.
I La construcción de la región de rechazo esta relacionada, en
muestra grande, con α
I α es nuestra probabilidad de cometer el error de tipo I.
I Error tipo I : H0 es rechazada cuando en realidad es verdadera
H0 .
I α : P(Error tipo I ) esta probabilidad es la tolerancia dada al
comienzo.
I Es un parámetro sobre el cual tenemos control, por lo cual
aseguramos que el error de tipo I, sea poco probable.
I Con lo cual el riesgo de cometer un error del tipo: Aceptar Ha
incluso si H0 es verdadera. Es baja, esto es útil por ejemplo:
I Si una fábrica nos dice que los productos con defectos son
menos del 5 %. Si sospechamos que no es ası́ cual es H0 y Ha ,
interpretar en cada caso.
Prueba de hipótesis para µ en muestras pequeñas

Cuando estamos en muestra pequeña debemos de realizar ciertas


consideraciones:
I La población debe de ser normal.
I Si tenemos dos poblaciones, debemos de considerar que son
independientes y normales.
Recordar que:
Teorema
Ȳ −µ
Si Y1 , . . . Yn ∼ N (µ, σ 2 ) . Entonces: σ ∼ N (0, 1).

Teorema
2
Si Y1 , . . . Yn ∼ N (µ, σ 2 ) . Entonces: (n − 1) Sσ2 ∼ χ2n−1 con n-1 g.l..
Prueba de hipótesis para µ en muestras pequeñas
Definición
Sean X ∼ N (0, 1) y Y ∼ χ2 con n−g.l. independientes. Entonces:

X
T =p
Y /n

es una v.a. t−Student o v.a. cuya distribución es t con n−g.l..

Observación
Sea W1 , . . . , Wn es una muestra normal con media µ y varianza
σ 2 . Considerando

X = n(W − µ)/σ y Y = (n − 1)S 2 /σ 2

Entonces tenemos que:



n(W − µ)/σ √ W −µ
T =p = n( ) ∼ tn−1
2 2
(n − 1)S /σ /(n − 1) S
Prueba de hipótesis para µ en muestras pequeñas

Para la construcción de nuestra prueba de hipótesis consideramos:


I Población: normal.
I Modelo: H0 : µ = µ0 y Ha : µ 6= µ0 .

I Estadı́stico de prueba: T = n( Y −µ
S ).
0

I RR por determinar.
Para la región de rechazo:
I Si no rechazamos H0 entonces µ = µ0 .

I T = n( Y −µ S ) ∼ tn−1 .
0

I Con lo cual para rechazar H0 es suficiente con que nuestro


estadı́stico T se encuentre en alguna de las colas de la
distribución tn−1 .
I Por lo tanto, RR = {|t| > tα/2 } con el cuantil de una tn−1 .
Prueba de hipótesis para µ en muestras pequeñas
Prueba de hipótesis para µ1 − µ2 en muestras
pequeñas
En este caso estamos frente a dos poblaciones normales
independientes con la misma varianza σ 2 :
I Tamaño de la muestra 1 es n1 y de la muestra 2 es n2 relativo
a las poblaciones indicadas.
I S12 es independiente de S22
2 2
I (n1 − 1) Sσ12 ∼ χ2n1 −1 y (n2 − 1) Sσ22 ∼ χ2n2 −1 .
2 2
I ⇒ (n1 − 1) Sσ12 + (n2 − 1) Sσ22 ∼ χ2n1 +n2 −2 .
I Ȳ1 y Ȳ2 medias muestrales de las poblaciones 1 y 2
respectivamente.
I ⇒ Ȳ1 −
√Ȳ2 −(µ1 −µ2 ) ∼ N (0, 1).
σ 1/n1 +1/n2
(n1 −1)S12 +(n2 −1)S22
I Considerando: Sp2 = n1 +n2 −2

Ȳ1 − Ȳ2 − (µ1 − µ2 )


⇒ p ∼ tn1 +n2 −2
Sp 1/n1 + 1/n2
Prueba de hipótesis para µ1 − µ2 en muestras
pequeñas
Para la construcción de nuestra prueba de hipótesis consideramos:
I Población: normal.
I Modelo: H0 : µ1 − µ2 = D0 y Ha : µ1 − µ2 6= D0 .
Ȳ1 −Ȳ2 −(µ1 −µ2 )
I Estadı́stico de prueba: T = √ .
Sp 1/n1 +1/n2
I RR por determinar.
Para la región de rechazo:
I Si no rechazamos H0 entonces µ1 − µ2 = D0 .

I T = n( Y√1 −Ȳ2 −D0 ) ∼ tn1 +n2 −2 .
Sp 1/n1 +1/n2
I Con lo cual para rechazar H0 es suficiente con que nuestro
estadı́stico T se encuentre en alguna de las colas de la
distribución tn1 +n2 −2 .
I Por lo tanto, RR = {|t| > tα/2 } con tn1 +n2 −1 .
Prueba de hipótesis para µ1 − µ2 en muestras
pequeñas
Ejercicios:

10.67
La información nutrimental dada por Kentucky Fried Chicken
(KFC) dice que cada bolsa pequeña de papas contiene 4.8 onzas
de alimento y 280 calorı́as. Una muestra de diez pedidos de
restaurantes KFC en New York y New Jersey promedió 358
calorı́asa . Si la desviación estándar muestral fue s = 54, ¿hay
suficiente evidencia para indicar que el número promedio de
calorı́as en bolsas pequeñas de papas de KFC es mayor que el
anunciado? Pruebe al nivel de significancia de 1 %.
a
Fuente: “KFC: Too Finger-Lickin’ Good?”, Good Housekeeping Saavy
Consumer Product Tests., 11 de marzo de 2004

I H0 , con Ha .
I Muestra pequeña o muestra grande.
I Estimador que se usa media.
Ejercicios:

10.67
Anunciada µ = 280, en una muestra de 10 pedidos Ȳ = 358. Si
s = 54.
I H0 : µ = 280 y Ha : µ > 280.
I Muestra pequeña o muestra grande.
I Estimador que se usa media.
I Estadı́stico de prueba : t = 358−280

54/ 10
=.
I Región de rechazo : RR = {t > t0,01 }.
Ejercicios

10.70
Tenemos muestra de pelı́canos jóvenes n1 = 10 con ȳ1 = 0,041 y
s1 = 0,017. En muestra de pelı́canos polluelos n2 = 13 con
ȳ2 = 0,026 y s2 = 0,006. Probar la hipótesis de que las medias no
difieren frente a la alternativa de que la media de los jóvenes es
mayor.

I H0 : µ1 = µ2 y Ha : µ1 > µ2 .
I Muestra pequeña o muestra grande.
I Estimador que se usa diferencia de las medias.
I Estadı́stico de prueba : t = Ȳ√1 −Ȳ2 −D0 =.
Sp 1/n1 +1/n2
I Región de rechazo : RR = {|t| > tα/2 }.
Prueba de hipótesis en R

x<−c ( 3 2 , 3 7 , 3 5 , 2 8 , 4 1 , 4 4 , 3 5 , 3 1 , 3 4 )
y<−c ( 3 5 , 3 1 , 2 9 , 2 5 , 3 4 , 4 0 , 2 7 , 3 2 , 3 1 )

t . test (x , y ,
a l t e r n a t i v e = ” two . s i d e d ” ,
mu = 0 , p a i r e d = FALSE , v a r . equal = TRUE,
conf . l e v e l = 0.95)
Prueba de hipótesis : Una varianza poblacional

El alumno debe de verificar las RR como anteriormente.


Prueba de hipótesis : Una varianza poblacional

Ejemplo
Un experimentador está convencido de que la variabilidad en su
equipo de medición resulta en una desviación estándar de 2.
Dieciséis mediciones dieron como resultado s 2 = 6.1. ¿Los datos
contradicen su afirmación? Determine el valor p para la prueba.
¿Qué concluirı́a usted si elige α = ,05?
Solución:
a. H0 : σ 2 = 4 y Ha : σ 2 6= 4,
(n−1)S 2
b. χ2 = σ02
= 22,875,
c. Determinamos el
p−valor= 2P(χ2 > 22,8750) = 2(0,0868) = 0,1736.
d. Entonces no se puede rechazar lo dicho por los
experimentadores.
Prueba de hipótesis : Una varianza poblacional

Ejemplo
Determine el valor p para la prueba.
Solución:
a. Para esto primero determinamos χ20,5 = 14,3388.
b. Si χ20,5 > χ2 entonces estamos en la cola izquierda.
c. Si χ20,5 < χ2 entonces estamos en la cola derecha.

d. p − valor = 2P(χ2 > 22, 8750) = 2(0,0868) = 0,1736


Prueba de hipótesis : Una varianza poblacional

Ejemplo
Una compañı́a produce piezas maquinadas para motor que se
supone tienen una varianza en diámetro no mayor que .0002
(diámetros medidos en pulgadas). Una muestra aleatoria de diez
piezas dio una varianza muestral de .0003. Pruebe, en el nivel de
5 %, H0 : σ 2 = ,0002 contra Ha : σ 2 > ,0002.
Solución:
(n−1)S 2
a. χ2 = σ02
= 13,5,
b. RR = {x ≥ χ20,05 = 16,919}
c. Finalmente, H0 no es rechazada.
Prueba de hipótesis : dos varianzas poblacionales

El alumno debe de verificar las RR como anteriormente.


Prueba de hipótesis : dos varianzas poblacionales
Aplicación:
I Precisión de instrumentos de medición,
I variación de las caracterı́sticas de calidad de dos productos
manufacturados
Prueba de hipótesis : dos varianzas poblacionales
Ejemplo
Suponga que deseamos comparar la variación en los diámetros de
las piezas producidas por la empresa del ejemplo anterior, con la
variación en los diámetros de las piezas producidas por un
competidor. Recuerde que la varianza muestral para nuestra
compañı́a, basada en n = 10 diámetros, fue σ 2 = .0003. En
contraste, la varianza muestral de las mediciones de diámetro para
20 de las piezas del competidor fue σ 2 = .0001. ¿Los datos
proporcionan suficiente información para indicar una variación más
pequeña en diámetros para el competidor? Pruebe usando α = 0,05
Solución:
a. H0 : σ12 = σ22 contra Ha : σ12 > σ22 ,
S12
b. Estadı́stico de prueba F = S22
= 3,
c. Región de rechazo RR = {F > F0,05 = 2,42} con 9 gl en el
numerador y 19 en el denominador.
d. Por lo tanto rechazamos H0 .
Prueba de hipótesis : dos varianzas poblacionales

x <− rnorm ( 2 0 , mean = 0 , sd = 1 )


y <− rnorm ( 3 0 , mean = 0 , sd = 2 )
v a r . t e s t ( x , y , a l t e r n a t i v e = ” two . s i d e d ” )

También podría gustarte