Estadística inferencial – hipótesis.
PRUEBA DE HIPÓTESIS Y LIMITES DE CONFIANZA.
La prueba de hipótesis, denominada también prueba de significación, tiene como objeto principal
evaluar suposiciones o afirmaciones acerca de los valores estadísticos de la población,
denominados parámetros., los cuales pueden ser: μ (media poblacional), σ (desviación estándar
poblacional), P (proporción poblacional).
La suposición puede ser cierta o falsa. Estas suposiciones se llaman HIPÓTEISIS ESTADÍSTICAS.
Hipótesis Estadística. También puede considerarse, como la afirmación a cerca de una
característica ideal de una población sobre la cual hay inseguridad en el momento de formularla y
que, a la vez, es expresada de tal forma que puede ser rechazada.
CLASES DE HIPÓTESIS.
La hipótesis puede ser formulada con el fin de rechazarla de acuerdo con el análisis estadístico.
Por lo tanto se manejan dos tipos de hipótesis:
1. Hipótesis Nula Ho: es considerada como la hipótesis que hace referencia al valor
parámetro que se quiere probar como verdadero.
2. Hipótesis Alternativa Ha: es considerada como la hipótesis alternativa o falsa,
estableciendo que el parámetro puede ser mayor, menor o diferente de acuerdo con la
propuesta hecha en la hipótesis nula.
Ejemplo:
Tipo de Error.
En el momento de aceptar o rechazar la Ho se puede conducir a error. Se consideran dos tipos de
error:
1. Error tipo II. – Aceptar la hipótesis cuando se ha debido rechazar.
2. Error tipo I. – Rechazar la hipótesis nula cuando se ha debido aceptar.
Existen por lo tanto, dos posibles decisiones: aceptar o rechazar la Ho, la que a la vez puede ser
cierta o falsa.
Decisiones en cuanto a los tipos de error.
Si se acepta una hipótesis verdadera la decisión es correcta.
Si se acepta una hipótesis falsa, cometeremos un error de tipo II.
Si rechazamos una hipótesis verdadera, cometeremos un error de tipo I.
Si rechazamos una hipótesis falsa, la decisión es correcta.
Ejemplo. Supongamos que el decano de la facultad de ingenierías desea contratar los servicios
del profesor Pedro Pérez, para ello es sometido a una entrevista, bajo las siguientes hipótesis:
a. El profesor Pérez es competente para desarrollar la labor.
b. El profesos Pérez no es competente para la labor ¿en qué condiciones el decano cometerá
errores de tipo I y de tipo II, en cada caso?
Solución.
a. Error tipo I. decidir que el docente no es competente si realmente lo es.
Error tipo II. Decidir que el docente es competente si realmente no lo es.
b. Error tipo I. decidir que el docente es competente cuando no lo es.
Error tipo II. Decidir que el docente no es competente cuando realmente lo es.
Nivel de significación y punto Crítico.
Se entiende por nivel de significación, la máxima de que se especifique con el fin de hacer mínimo
el primer tipo de error. Generalmente, esta probabilidad se fija antes de escoger la muestra.
El nivel de significación se simboliza por alfa , siendo generalmente: 1% , 5%, 10%, pero se
puede usar cualquier nivel dependiendo del tipo de investigación que se adelante. Este nivel de
significación corresponde a un área bajo la curva de probabilidad o normal, denominada región
Crítica o zona de Rechazo. Por lo general se trabaja con el 5% en caso de no especificar este nivel
dentro del enunciado.
De acuerdo al nivel de significación que se maneje se interpreta de la siguiente manera:
1% indica que el resultado es altamente significativo
5% indica que el resultado es significativo
10% indica que el resultado es poco significativo.
Este nivel significación está situado a la derecha o izquierda de la gráfica y en algunos casos en los
dos extremos, dependiendo de la dócima o prueba que se esté investigando, por lo que podemos
tener dócimas unilaterales (cuando solo se toma un extremo) o dócimas bilaterales (cuando se
toman los dos extremos de la gráfica).
Zona de aceptación. Corresponde a la región no sombreada por el nivel de significación. Si el valor
de la variante cae sobre la zona de aceptación se indica que se acepta la hipótesis nula y se
rechaza la hipótesis altermativa. Pero si el valor de la variante cae sobre la zona de rechazo o
región crítica, se rechaza la hipótesis nula y se acepta la hipótesis alternativa.
Gráfico de regiones críticas:
En las dócimas unilaterales se
tomará el valor total de ; para las
dócimas bilaterales alfa se dividirá
por dos.
Procedimiento a seguir en las pruebas de hipótesis.
1. Formular hipótesis nula y alternativa
2. Seleccionar el nivel de significancia
3. Conocer o estimar la varianza
4. Determinar la técnica y la prueba estadística
5. Determinar los valores críticos y sus regiones de rechazo
6. Calcular los datos muestrales, utilizando las fórmulas correspondientes
7. Tomar la decisión estadística de aceptar o rechazar.
Ejemplo. Establecer las hipótesis Ho y Ha
a. En el caso de la moneda (normal) y en medias muestrales se podrían presentar las
hipótesis de las siguientes formas:
Ho: μ=50 Ho: μ=50 Ho: μ=50
Ha: μ50 Ha: μ<50 Ha: μ<50
(dócima bilateral) (dócima unilateral a la (dócima unilateral a la derecha)
Izquierda)
𝑋−𝜇
Formula de variante estadística. 𝑍 = 𝜎
b. En el caso de una distribución de diferencias entre dos medias muestrales puede
plantearse:
Ho: μx=50 Ho: μx=50 Ho: μx=50
Ha: μx50 Ha: μx<50 Ha: μx<50
(dócima bilateral) (dócima unilateral a la (dócima unilateral a la derecha)
Izquierda)
𝑋−𝜇
Formula de variante estadística: 𝑍= 𝜎
√𝑛
c. En el caso de una distribución de diferencias entre dos medias muestrales puede
plantearse:
Ho: μp=0,50 Ho: μp=0,50 Ho: μp=0,50
Ha: μp0,50 Ha: μp<0,50 Ha: μp<0,50
(dócima bilateral) (dócima unilateral a la (dócima unilateral a la derecha)
Izquierda)
𝑝−𝑃
Formula estadística. 𝑍= 𝑝𝑞
√
𝑛
Ejemplo.
Un inspector de calidad investiga las acusaciones contra una embotelladora por su deficiente
llenado que debe ser, en promedio, 32,5 onzas. Para ello toma una muestra de 60 botellas,
encontrando que el contenido medio es de 31,9 onzas de líquido. Se sabe que la máquina
embotelladora debe producir un llenado con una desviación típica de 3.6 onzas. ¿puede el
inspector llegar a la conclusión, a un nivel de significación del 5%, que se están llenando las
botellas por debajo de su especificación.
Solución.
𝑋−𝜇
μ=32,5 σ = 3,6 n=60 x(media) = 31,9 𝑍= 𝜎
√𝑛
a. Ho: μx=32,5
31,9−32,5
Ha: μx<32,5 𝑍= 3,6 = -1,29
b. = 0,05 luego Z1 = 1,64 √60
c. σ = 3,6
Como -1,29 se sitúa en la zona de
aceptación, es válida la hipótesis
nula, lo cual significa que el
inspector no debe llegar a la
conclusión que se esta vendiendo
un producto por debajo de su
especificación al nivel del 5%
3. un proceso está programado para empacar la cantidad media, de una libra (16 onzas) de
café. Se toma una muestra aleatoria de 36 paquetes, resultando una media de 14,6 onzas
y una desviación típica de 5,3 onzas. Al nivel del 5% ¿se podrá afirmar que no se está
cumpliendo con lo indicado en el paquete?.