Tema
2
Prueba de hipótesis de una
media y bondad de ajuste
y tablas de contingencia
Clase 1
Carlos A. Berrocal Gutarra
1. Contraste de hipótesis de una media con σ conocida
2. Contraste de hipótesis de una media con σ conocida
❷El nivel de significancia (α)
❶Planteo de Hipótesis
pnorm(Z,[Link]=T) Z=function(m,d,n,Ho){ Z=(m-Ho)/(d/sqrt(n))
return(EST_PRUEBA_Z=Z)}
Ho Ha
❹ P-valor ❸Estadístico de prueba
-Z
pnorm(Z,[Link]=F)
P-valor
P-valor: Suma de las dos colas
-Z Z
❺Regla de decisión y decisión (Si P-valor ≤ α ⇨ RHo) ❻Conclusión
3. Contraste de Hipótesis de una media con σ desconocida
4. Contraste de hipótesis de una media con σ desconocida
#CONSEGUIR P-VALOR DATOS PROCESADOS
❷El nivel de significancia (α) pt(t,GL,[Link]=T)#COLA IZQUIERDA =T, COLA DERECHA=F
❶Planteo de Hipótesis
[Link](datos,mu=Ho,alternative=”less”)
Ho Ha
❹ P-valor ❸Estadístico de prueba
-t
[Link](datos,mu=Ho,alternative”greater”)
P-valor
t
P-valor: Suma de las dos colas
[Link](datos,mu=Ho,alternative=”[Link]”)
-t t
❺Regla de decisión y decisión (Si P-valor ≤ α ⇨ RHo) ❻Conclusión
4. Contraste de hipótesis de una media con σ desconocida
#CONSEGUIR P-VALOR DATOS PROCESADOS
❷El nivel de significancia (α) pt(t,GL,[Link]=T)#COLA IZQUIERDA =T, COLA DERECHA=F
❶Planteo de Hipótesis
[Link](datos,mu=Ho,alternative=”less”)
Ho Ha
❹ P-valor ❸Estadístico de prueba
-t
[Link](datos,mu=Ho,alternative”greater”)
P-valor
t
P-valor: Suma de las dos colas
[Link](datos,mu=Ho,alternative=”[Link]”)
-t t
❺Regla de decisión y decisión (Si P-valor ≤ α ⇨ RHo) ❻Conclusión
2. Prueba de bondad de ajuste
Definición
La prueba de bondad de ajuste se utiliza para probar la hipótesis de que una distribución de frecuencias se ajusta a (o coincide
con) alguna distribución aseverada.
Requisitos
1. Los datos se seleccionaron al azar.
2. Los datos muéstrales consisten en conteos de frecuencias para cada una de las diferentes categorías.
3. Para cada categoría, la frecuencia esperada es de al menos 5. (La frecuencia esperada para una categoría es la frecuencia
que ocurriría si los datos realmente tuvieran la distribución que se afirma, una frecuencia esperada menor a 5 puede llevar a
una inferencia incorrecta en la prueba de hipótesis ji-cuadrada. No se requiere que la frecuencia observada para cada
categoría sea al menos de 5).
Estadístico de prueba para pruebas de bondad de ajuste en experimentos multinomiales
O : Representa la frecuencia observada de un resultado.
E : Representa la frecuencia esperada de un resultado. E = np
k : Representa el número de categorías diferentes o resultados.
n : Representa el número total de ensayos.
Valores críticos
1. Los valores críticos se encuentran en la tabla chicuadrada, utilizando k — 1 grados de libertad
2. Las pruebas de hipótesis por bondad de ajuste siempre son de cola derecha.
Bondad de ajuste
#PRUEBA DE BONDADE AJUSTE UNIFORME
#INGRESAMOS DATOS
frecuencias
OB=c(......)
[Link](OB)
uniformes
#PARA LAS F ESPERADAS
[Link](OB)$expected
Durante mucho tiempo, los criminólogos han debatido sobre si hay
una relación entre las condiciones climáticas y la incidencia de
delitos violentos. El autor del artículo “Is There a Season for
Homicide?” (Criminology, 1988: 287-296) clasificó 1361 homicidios
según la estación del año y resultaron los datos siguientes. El
número de homicidios depende de la estación del año? = 0.01.
Invierno Primavera Verano Otoño
328 334 372 327
#PRUEBA DE BONDADE AJUSTE a otras formas
no uniformes
Bondad de
OB=c(....)
PE=c(....)
ajuste [Link](OB,p=PE,rescale.p=T)
Frecuencias #PARA EL ESPERADO
[Link](OB,p=PE,rescale.p=T)$expected
no Uniformes
• El BCP, Trata de seguir la política de extender un 70% de sus créditos
a empresas comerciales, un 10% a personas naturales y un 20% a
prestatarios extranjeros.
• Para determinar si la política se estaba siguiendo, Jay Hoover
vicepresidente de mercadeo, selecciona aleatoriamente 85 créditos
aprobados recientemente. Encuentra que 62 de tales créditos e
otorgaron a negocios, 10 a personas naturales y 13 a prestatarios
extranjeros.
• Al nivel del 10% ¿Parece que el patrón de cartera deseado se
preserva?
#AJUSTE PARA LA BINOMIAL
OB=c(...)
Bonda de ajuste Distr. #AJUSTE A LA BINOMIAL
#GENERAMOS LAS PROPORCIONES
Binomial
PE=dbinom(categ,Nro_muestra,p=__,log=F)
#PRUEBA CHI CUADARDO
[Link](OB,p=PE,rescale.p=T)
#PARA EL ESPERADO
Luis Dávila Marca, vendedor de CAP S. A., debe visitar cinco clientes [Link](OB,p=PE,rescale.p=T)$expected
diariamente. Se sugiere que la variable “ventas del señor Dávila” puede
describirse mediante la distribución binomial y con una probabilidad de venta
para cada cuenta de 0.4. Dada la siguiente distribución de frecuencias del
número de ventas por día del señor Dávila, ¿podemos concluir que los datos
de hecho siguen la distribución sugerida? Haga los cálculos para un nivel de
significancia de 0.05.
Ventas por día 0 1 2 3 4 5
Frecuencia del número
40 82 90 40 24 19
de ventas
#AJUSTE A LA POISSON
Bondad de ajuste: Distr. De OB=c(...)
#GENERAMOS LAS PROPORCIONES
Poisson
PE=dpois(categ,lambda=__)
#PRUEBA
[Link](OB,p=PE,rescale.p=T)
• En un esfuerzo por mejorar la programación de los turnos para #PARA EL ESPERADO
los cajeros en un supermercado se hace un estudio que plante [Link](OB,p=PE,rescale.p=T)$expected
como hipótesis de que la distribución de la llegada de clientes
a las cajas se ajusta a una distribución de Poisson. El
promedio actual de clientes que llegan a las cajas es de 5 por
minuto. Se recoge información
N° de
0 1 2 3 4 5 6 7
clientes/minuto
Frecuencia 8 31 75 122 152 152 127 206
2. Tablas de contingencia: Test de independencia
Definición
Una prueba de independencia pone a prueba la hipótesis nula de que no existe asociación entre la variable de
renglón y la variable de columna en una tabla de contingencia. (Para la hipótesis nula, utilizaremos la afirmación
de que “las variables de renglón y de columna son independientes”).
Requisitos
1. Los datos muéstrales son seleccionados al azar y se representan como conteos de frecuencias en una tabla
de dos factores.
2. La hipótesis nula es la afirmación de que las variables de renglón y de columna son independientes, la
hipótesis alternativa es la afirmación de que las variables de renglón y de columna son dependientes.
3. Para cada celda de la tabla de contingencia, la frecuencia esperada E es al menos de 5.
Estadístico de prueba para pruebas de bondad de ajuste en experimentos multinomiales
Valores críticos
1. Los valores críticos se encuentran en la tabla chicuadrada, utilizando (r-1)(k — 1) grados de libertad
2. Las pruebas de hipótesis por bondad de ajuste siempre son de cola derecha.
Prueba de #TEST INDEPENDENCIA
tabla_ob<-[Link](rbind(c(),c(),c()))
Independenci
colnames(tabla_ob)<-c("A favor","En contra","Indecisos")
rownames(tabla_ob)<-c("<20","200-1000",">1000")
[Link](tabla_ob)
a
#PARA EL ESPERADO
[Link](tabla_ob)$expected
• Una socióloga quiere determinar si hay
alguna relación entre el tamaño de la
familia y el nivel de educación del padre.
Para esto, escogió una muestra de 100
hogares y los clasificó de acuerdo con
dos criterios: por el tamaño de la familia
y por el nivel de educación. Las
frecuencias observadas están
registradas en tabla ¿Se puede concluir
al nivel de significación de 0.01 que el
tamaño de la familia es independiente del
nivel de educación del padre?
Prueba de Independencia
¿Los perros pueden detectar el cáncer? Se llevó a cabo un experimento para poner a prueba la
habilidad de los perros para detectar cáncer de vejiga. Los perros fueron entrenados con muestras
de orina de pacientes con cáncer de vejiga y de personas en un grupo de control que no tenían
cáncer de vejiga. Los resultados se presentan en la siguiente tabla (según datos del New York
Times). Utilice un nivel de significancia de 0.01 para probar la aseveración de que la fuente de la
muestra (sujeto saludable o sujeto con cáncer de vejiga) es independiente de las selecciones del
perro. ¿Qué sugieren los resultados acerca de la habilidad de los perros para detectar el cáncer de
vejiga? Si los perros tuvieron más aciertos que lo esperado por el azar, ¿su desempeño fue lo
suficiente bueno para justificar su uso en diagnósticos exactos?
4. Prueba de Homogeneidad
Definición
En una prueba de homogeneidad probamos la aseveración de que poblaciones diferentes tienen las
mismas proporciones de algunas características.
Al hacer una prueba de homogeneidad, podemos utilizar los mismos requisitos, estadístico de prueba,
valor crítico y procedimientos descritos en esta sección, con una excepción: en vez de probar la hipótesis
nula de independencia entre las variables de renglón y de columna, probamos la hipótesis nula de que las
poblaciones diferentes tienen las mismas proporciones de algunas características.
Prueba de Homogeneidad
¿Tiene efecto el género del encuestador en las respuestas de encuesta de varones? Se afirma que “en
temas sensibles, las personas tienden a dar respuestas ‘aceptables’. Para sustentar esta aseveración,
el INEI proporcionó los datos de una encuesta en la cual se preguntó a hombres si estaban de acuerdo
con esta afirmación: “El aborto es un asunto privado que la mujer debe decidir sin intervención
gubernamental”. Analizaremos el efecto del género sólo en los hombres encuestados. Suponga que la
encuesta se diseñó de manera que los entrevistadores varones recibieron instrucciones para obtener
800 respuestas de sujetos varones, y las entrevistadoras mujeres recibieron instrucciones para obtener
400 respuestas de sujetos varones. Pruebe la aseveración de que las proporciones de las respuestas
de acuerdo/en desacuerdo son las mismas para los sujetos entrevistados por hombres y los sujetos
entrevistados por mujeres.