Matemáticas
3er semestre
Estadística I
Unidad 3. Prueba de hipótesis
Clave:
05142318/06142318
Universidad Abierta y a Distancia de México
Estadística I
Unidad 3. Prueba de hipótesis
Índice
Presentación .................................................................................................................... 3
Competencia específica .................................................................................................. 3
Logros .............................................................................................................................. 3
3. Prueba de Hipótesis .................................................................................................... 4
3.1. Elementos de la prueba ............................................................................................ 4
3.1.1. El problema de las pruebas de hipótesis ............................................................. 8
3.1.2. Hipótesis simple y compuesta ............................................................................ 10
3.1.3. Región Crítica....................................................................................................... 17
3.1.4. Errores tipo I y tipo II ........................................................................................... 18
3.2. Pruebas para las medias (muestras grandes) ...................................................... 21
3.2.1. Para la media de una población .......................................................................... 22
3.2.2. Para la comparación de Medias .......................................................................... 35
3.3. Pruebas para las varianzas (muestras grandes) .................................................. 42
3.3.1. Para la Varianza de una población ..................................................................... 43
3.2.2. Para la comparación de Varianzas ..................................................................... 49
3.4. Potencia de la Prueba ............................................................................................. 54
3.4.1. Lema de Neyman Pearson................................................................................... 55
3.4.2. Función Potencia ................................................................................................. 56
3.4.3. Prueba uniformemente más potente .................................................................. 59
Cierre de la unidad......................................................................................................... 60
Fuentes de consulta ...................................................................................................... 60
UnADM | DCEIT | MT | MEST1 2
Estadística I
Unidad 3. Prueba de hipótesis
Presentación
En la unidad anterior se estudió la distribución normal, la binomial y el teorema central del
límite, que sentaron las bases sobre la forma en que se distribuyen los datos.
En la tercera unidad, se estudiarán temas relacionados con la prueba de Hipótesis y
tomando en cuenta que uno de los principales objetivos en la Estadística inferencial es la
posibilidad de hacer generalizaciones es posible sacar conclusiones basadas en la
probabilidad acerca de una población determinada.
Para ello es fundamental abordar el tema de la Prueba de hipótesis, ya que permitirá
tomar decisiones con base en la información que puede proporcionar una muestra dada
de esa población.
Para los fines de esta unidad se estudiarán las Pruebas de hipótesis, sus principales
elementos y tipos y se elaborarán ejemplos y ejercicios con la finalidad de clarificar los
conceptos desarrollados.
Competencia específica
• Utilizar evidencias muéstrales para aceptar o rechazar una hipótesis mediante las
pruebas de las medias, varianzas y potencia de la prueba.
Logros
• Utilizar resultados muéstrales a través del análisis de pruebas estadísticas como
varianza y potencia de prueba para aceptar o rechazar hipótesis
UnADM | DCEIT | MT | MEST1 3
Estadística I
Unidad 3. Prueba de hipótesis
3. Prueba de Hipótesis
La Prueba de hipótesis forma parte de la teoría de hipótesis también conocida como
Teoría estadística de las decisiones, que se caracteriza por hacer posible la toma de
decisión respecto a un par de hipótesis, las cuales son planteadas en torno a un
parámetro o característica de la población.
La Prueba de hipótesis es un procedimiento estándar que consiste en aceptar o
rechazar una aseveración en torno a un parámetro poblacional, es decir, aceptar o
rechazar una hipótesis originalmente planteada, denominada hipótesis nula, contra una
hipótesis alterna.
En esta unidad únicamente se abordarán Pruebas paramétricas.
3.1. Elementos de la prueba
Cuando se realiza una prueba de hipótesis, por ejemplo, sobre la media poblacional se
realiza un procedimiento como el siguiente donde están involucrados varios elementos:
Dado un problema determinado:
• Primer paso plantear las hipótesis (H0 y Ha).
• Segundo paso: se procede a establecer un nivel de significación obteniendo una
estadística de prueba.
• Tercer paso: con base a los resultados obtenidos se debe tomar una decisión en
torno a la hipótesis planteada.
• Cuarto paso: por último, se han de sacar conclusiones.
Como se puede apreciar la prueba está conformada por varios elementos, entre los
cuales se pueden mencionar la hipótesis nula y alternativa, el nivel de significación, la
región crítica y la estadística de prueba.
Las hipótesis nula y alternativa, se detallarán más adelante al igual que la región crítica
UnADM | DCEIT | MT | MEST1 4
Estadística I
Unidad 3. Prueba de hipótesis
o de rechazo. En cuanto al estadístico de prueba, éste se basa en el hecho de que la
hipótesis nula es cierta. Es un valor que se calcula con base en la información de la
muestra. Ese elemento, que sirve para hacer el contraste, permite la decisión de rechazar
o no rechazar la hipótesis nula.
La elección del estadístico adecuado dependerá de las características propias del
problema o del estudio que se desea realizar (si la población se distribuye normalmente,
si el tamaño de la muestra es lo suficientemente grande para considerarla normal, etc.).
La elección del estadístico también está relacionada con el parámetro poblacional de
interés. Es decir, sí el parámetro de interés es la media, el estadístico será uno, pero si se
trata de la varianza, será otro.
Cabe señalar, que la región crítica (que se verá más adelante), a su vez está ligada al
concepto de valor crítico y nivel de significación. Antes de tratar de definirlos o
explicarlos es conveniente revisar el siguiente esquema en donde se observa con
claridad cada uno de los elementos señalados.
El valor crítico es un estadístico que se ha de tomar en función de la puntuación “Z”, de t
de x2, de F y se utiliza para dividir las regiones de la distribución en dos. Por un lado, está
la región de aceptación y por el otro, la región de rechazo; es decir, establece una
UnADM | DCEIT | MT | MEST1 5
Estadística I
Unidad 3. Prueba de hipótesis
región de rechazo de la hipótesis nula y una región de aceptación (o de no rechazo) de la
hipótesis nula
Esto se puede ver en la siguiente gráfica:
Ahora bien, a las zonas de rechazo se les llama “colas” y se presentan en los siguientes
casos:
UnADM | DCEIT | MT | MEST1 6
Estadística I
Unidad 3. Prueba de hipótesis
El nivel de significación es representado por la letra griega “α” (riesgo o probabilidad), o
bien, en qué porcentaje se está dispuesto a cometer el error. De tal manera que se desea
tener valores muy bajos de α, para que el riesgo o la probabilidad de error sea la más
pequeña posible.
Generalmente los valores asignados a α son: 0.01, 0.05, 0.1. dependiendo si se desea el
99%, el 95% o el 90% de confianza respectivamente.
Dependerá si se trata de una prueba direccional o no direccional.
Por ejemplo:
Si la α= 0.01 (el 10%) se tienen tres casos:
UnADM | DCEIT | MT | MEST1 7
Estadística I
Unidad 3. Prueba de hipótesis
Cuando se realiza una prueba de hipótesis se sigue un procedimiento en donde están
involucrados estos elementos.
3.1.1. El problema de las pruebas de hipótesis
En esta primera parte se abordarán una serie de hechos conceptuales para enmarcar lo
que es una prueba de hipótesis. Tomemos como ejemplo a dos alumnos (alumno “x”,
alumno “z”) y que están peleando a mitad del patio de una escuela. Llega un profesor a la
escena y puede hacer la conjetura sobre quién empezó la agresión; es decir, el profesor
hará una afirmación a través de un enunciado que deberá probarse si es cierto o es falso.
Esta sería una manera muy sencilla de lo que puede ser una prueba de hipótesis, claro
UnADM | DCEIT | MT | MEST1 8
Estadística I
Unidad 3. Prueba de hipótesis
está, que en estadística lo que importa es poner a prueba la hipótesis referida a los
parámetros o características de la población.
Si se realiza un estudio estadístico sobre una población se puede evaluar un parámetro
de la misma, por ejemplo, la media o la varianza.
Como se ha mencionado a lo largo del curso, es difícil, incluso, imposible evaluar a toda la
población, por lo que se recurre a la toma de muestras representativas.
Trabajar con una muestra es relativamente sencillo y se puede evaluar cualquier
característica o estadístico de interés, obteniéndose valores que sean próximos al valor
del parámetro de la población. El problema radica en formular hipótesis en torno a esos
valores estadísticos; es decir, en probar esas hipótesis, para tomar una decisión sobre si
deberán ser aceptadas o rechazadas.
El aceptar o rechazar una hipótesis implica la posibilidad de haber tomado una decisión
correcta o incorrecta (haber cometido un error). Este aspecto se verá a detalle en el punto
3.1.4) Obviamente que se desea tomar decisiones correctas, pero esto no es posible dado
que se parte de una información muestral.
La teoría de hipótesis tendrá como propósito fundamental hacer elecciones adecuadas
entre dos hipótesis, ambas referidas a un mismo valor de un parámetro de la población.
Se puede resumir el problema de contraste de hipótesis como una toma de decisión,
en la cual, se ha de elegir entre dos distribuciones posibles.
¿Cuál de estas dos será más factible de ser propuesta como generadora de una muestra?
En el siguiente punto se hará la explicación de las principales características de estas
hipótesis y ejemplos para su mejor comprensión.
UnADM | DCEIT | MT | MEST1 9
Estadística I
Unidad 3. Prueba de hipótesis
3.1.2. Hipótesis simple y compuesta
La palabra hipótesis es de hecho de uso cotidiano. A todo mundo, en la escuela, se le ha
enseñado que uno de los pasos del método científico es la formulación de hipótesis.
Así mismo, este vocablo es muy recurrente en los medios de comunicación; sobre todo,
en los noticieros donde se emplean expresiones como: una posible hipótesis, existe la
hipótesis… etc.
En general, se podría entender el término hipótesis como una conjetura, como una
suposición, o como una proposición no demostrada y cual tienen elementos que apuntan
en esa dirección.
Una posible definición de lo que es una hipótesis desde el punto de vista estadístico,
podría ser: que es una conjetura, una proposición, que se realiza sobre un parámetro (o
característica) de la población que es objeto de estudio.
En esta unidad se va a trabajar con dos tipos de hipótesis: la hipótesis nula (H0) y la
hipótesis alternativa (Ha), aunque también, será muy común en algunos textos encontrar
la notación H1.
Entonces se tiene:
Hipótesis - hipótesis nula H0
Estadísticas - hipótesis alternativa Ha o (H1).
Veamos en seguida en qué consiste cada una de ellas:
Hipótesis nula H0.-
UnADM | DCEIT | MT | MEST1 10
Estadística I
Unidad 3. Prueba de hipótesis
La hipótesis nula es también conocida como hipótesis de trabajo, donde la afirmación
hecha en la hipótesis nula será contrastada y de ahí tendrá que ser rechazada o no
rechazada.
Hipótesis nula: aseveración sobre un valor especifico respecto a un parámetro
poblacional. Siempre será la negación a la hipótesis alterna.
Un claro ejemplo de lo que en la práctica es una hipótesis nula, se encuentra en los
juzgados de la mayoría de los países:
El principio establece que todo acusado es inocente hasta que se le
demuestre lo contrario.
Para que sea una hipótesis nula la formulación es la siguiente:
El acusado es inocente.
En términos matemáticos quedaría como:
H0: acusado = inocente
Una vez formulada la hipótesis, se tiene por hecho, que es cierta. El contraste, es reunir
las pruebas suficientes para demostrar que, en efecto, el acusado no es inocente, o bien,
que no existen suficientes pruebas para declararlo culpable.
Una característica importante de la hipótesis nula es, que no supone ninguna diferencia
entre el valor del estadístico y el valor del parámetro poblacional. Por lo que a la hora de
formularla siempre se utilizará el signo igual “=”. Veámoslo con un ejemplo estadístico.
Ejemplo 1:
Se desea realizar un estudio sobre la edad promedio en años cumplidos que tienen los
estudiantes al egresar como graduados de la universidad.
Un investigador puede formular las hipótesis siguientes: µ<24, µ=24, µ>24.
UnADM | DCEIT | MT | MEST1 11
Estadística I
Unidad 3. Prueba de hipótesis
¿Cuál sería una hipótesis nula?
Para que sea una hipótesis nula la formulación es la siguiente:
La edad promedio de egreso (en años cumplidos) de los estudiantes es de 24 años.
En términos estadísticos quedaría como:
H0: µ=24
Cabe mencionar, que la hipótesis nula, hacía referencia a un valor, que el científico, el
investigador (o quién realizaba el estudio estadístico), no se correspondía al verdadero
valor del parámetro poblacional. Por ello, se le llamaba hipótesis nula (no válida).
Algo muy importante para tener presente, es que, la hipótesis nula siempre es la que se
va a confirmar en una prueba de hipótesis.
Hipótesis alternativa Ha (H1).
La hipótesis alternativa es una aseveración sobre el mismo parámetro poblacional al
que hizo referencia la hipótesis nula.
Una hipótesis alternativa es aquella, que es, contraria a la hipótesis nula.
Otra manera de definirla puede ser por complementos. Se formula una hipótesis nula y la
hipótesis alternativa, sería una especie de complemento de la hipótesis nula.
A la hora de formular la hipótesis alternativa, ésta, no deberá contener el símbolo igual “=”
aunque pueden usarse los siguientes símbolos:
UnADM | DCEIT | MT | MEST1 12
Estadística I
Unidad 3. Prueba de hipótesis
<,>, ≠. Menor que, mayor que, diferente. Así, se tienen las siguientes posibilidades
para la hipótesis alternativa (se usará la media para ejemplificar y puede ser
cualquier estadístico):
Ha: µ≠24 en este caso se tiene una hipótesis alternativa de dos “colas”
Ha: µ<24 en este caso se tiene una hipótesis alternativa de cola inferior
Ha: µ>24 en este caso se tiene una hipótesis alternativa de cola superior.
Contrario a la hipótesis nula, la alternativa, no se va aprobar con la prueba de hipótesis.
La hipótesis alternativa va a especificar valores válidos desde el punto de vista del
científico (del investigador), por ello, suele llamarse hipótesis de investigación.
La afirmación realizada en la hipótesis alternativa es lo que al investigador le interesa que
sea probado. Esta hipótesis, se tomará como verdadera, una vez que se haya rechazado
la hipótesis nula.
Ejemplo 2:
Se desea realizar un estudio sobre la edad promedio de los estudiantes al egresar como
graduados de la universidad.
Un investigador puede formular las hipótesis siguientes: µ<24, µ=24, µ>24.
¿Cuál sería una hipótesis alternativa?
Dado que la hipótesis nula fue:
H0: µ=24
Se presentan varías posibilidades:
Ha: µ≠24
Ha: µ<24
Ha: µ>24
UnADM | DCEIT | MT | MEST1 13
Estadística I
Unidad 3. Prueba de hipótesis
Como la hipótesis nula está referida a que el valor es “igual”, la hipótesis alternativa se va
a formular como “no igual” o diferente. Pero también, puede ser la opción mayor que, o
menor que.
Una manera de formular la hipótesis alternativa sería:
• La edad promedio de egreso (en años cumplidos) de los estudiantes no es de 24
años. O con otras palabras
• La edad promedio de egreso (en años cumplidos) de los estudiantes es diferente
de 24 años.
En términos estadísticos quedaría como:
Ha: µ≠24
Siempre se va a trabajar solamente con una hipótesis alternativa.
Ahora bien, se va a definir una hipótesis simple como aquella que especifica un único
valor para el parámetro en cuestión.
Por ejemplo: H0: µ=24.
Y la hipótesis compuesta es aquella en la que se especifica un intervalo de valores.
Por ejemplo: Ha: µ<24.
En conclusión:
La prueba o contraste de hipótesis se realiza siempre sobre la hipótesis nula.
Sería mucho más complicado tratar de probar la hipótesis alternativa.
UnADM | DCEIT | MT | MEST1 14
Estadística I
Unidad 3. Prueba de hipótesis
La hipótesis nula siempre asevera la igualdad entre el parámetro poblacional y el
estadístico. La hipótesis alternativa asevera lo opuesto.
La hipótesis nula se formula en términos del parámetro poblacional, así sea que
únicamente se tenga información sobre la muestra.
La hipótesis nula no podrá ser cierta aunque no sea rechazada y esto se debe a que se
basa en información aportada por la muestra y no de toda la población.
De ser rechazada la hipótesis nula, se acepta la hipótesis alternativa.
Ya se señaló, que la hipótesis nula, siempre se va a formular en términos de una
igualdad. En tanto que la hipótesis alternativa, puede presentarse de tres maneras:
Ha: µ≠ cierto valor. Prueba de dos colas
Ha: µ< cierto valor. Prueba de cola inferior
Hipótesis
UnADM | DCEIT | MT | MEST1 15
Estadística I
Unidad 3. Prueba de hipótesis
alternativa Ha: µ> cierto valor. Prueba de cola superior
Ejemplo 3:
Se realiza una aseveración sobre la edad promedio en años cumplidos que tienen los
estudiantes al egresar como graduados de la universidad, asegurándose que es superior
a 24 años cumplidos. Un investigador no está de acuerdo y desea contrastarla.
Establezca la hipótesis nula y alternativa.
Solución:
Primero se expresa la afirmación que se va a probar, para este caso es µ>24.
Para hacer el contraste, se parte del hecho de que µ>24 es falso, por lo tanto, se plantea
como verdadero que µ<=24.
Para finalizar, de las dos afirmaciones anteriores, se elige como hipótesis nula aquella
que contenga el signo igual que. Así se tiene:
UnADM | DCEIT | MT | MEST1 16
Estadística I
Unidad 3. Prueba de hipótesis
H0: µ=24 (<=)
Ha: µ>24
Y como se puede observar en este ejemplo, se tiene un caso de cola superior.
3.1.3. Región Crítica
La región crítica, se puede definir, como el conjunto de valores de la prueba de hipótesis
que causan el rechazo de la hipótesis nula. También se le puede llamar región de
rechazo.
Gráficamente, la región crítica, es el área comprendida a la izquierda del primer valor
crítico y el área comprendida a la derecha del segundo valor crítico. Es el área total que
se denomina región de rechazo de la hipótesis nula. Es decir, en las colas de la curva
normal. Las colas son los extremos de la curva a partir del valor crítico.
Contrario a la región de rechazo (región crítica), se tiene la región de no rechazo o región
de aceptación.
Las dos regiones son complementarias y mutuamente excluyentes.
La región de aceptación o de no rechazo, es el conjunto de valores de la prueba de
hipótesis, que hacen posible no rechazar la hipótesis nula. La región de no rechazo (o de
aceptación), está comprendida hacia el centro de la distribución.
Cuando se está trabajando con una población que se distribuye normalmente se pueden
presentar tres posibilidades para la región crítica o de rechazo:
UnADM | DCEIT | MT | MEST1 17
Estadística I
Unidad 3. Prueba de hipótesis
La región crítica es de hecho, la parte referente de la prueba de hipótesis, la que da pauta
a la toma de la decisión, de rechazar o no rechazar la hipótesis planteada.
Cuando se realiza la prueba y se llega a un resultado que cae dentro de la región crítica,
la hipótesis nula deberá ser rechazada. Si cae fuera, no podrá ser rechazada, o al menos,
se dirá que no existe la suficiente evidencia para que se rechace.
3.1.4. Errores tipo I y tipo II
En este tema vamos a ver los dos tipos de errores que se pueden cometer al realizar la
Prueba de hipótesis.
Ya se mencionó, que toda prueba se realiza sobre la hipótesis nula. Con base en los
resultados arrojados por la prueba, se debe decidir sí se rechaza, o no, la hipótesis nula.
UnADM | DCEIT | MT | MEST1 18
Estadística I
Unidad 3. Prueba de hipótesis
Supón que se desaprueba la hipótesis nula cuando no se debe rechazar, naturalmente se
estaría cometiendo un error que en Estadística se le llama error tipo I.
Ahora, considera el caso de que no se rechaza esa hipótesis, pero debía de rechazarse.
Nuevamente, se estaría cometiendo un error que llamaríamos error tipo II.
Por el contrario, cuando se rechaza la hipótesis y ésta debía ser rechazada, se dice que
se ha decidido correctamente. Lo mismo ocurre cuando no se rechaza la hipótesis y
efectivamente no debía ser rechazada.
Esto se puede resumir de la siguiente manera en un arreglo llamado tabla de
contingencia:
Esto se puede comprender mejor con un ejemplo:
Ejemplo 4:
Se realiza un estudio sobre la edad promedio en años cumplidos que tienen los
estudiantes al egresar como graduados de la universidad, asegurándose que es de 24
años cumplidos.
Si la hipótesis nula es H0: µ=24.
UnADM | DCEIT | MT | MEST1 19
Estadística I
Unidad 3. Prueba de hipótesis
Establezca un enunciado para los errores tipo I y II.
Solución.
El error tipo I consiste en rechazar la hipótesis nula cuando ésta no debe de ser
rechazada. Por lo tanto, se cometería un error tipo I si se rechaza la hipótesis nula,
cuando en realidad, la edad promedio de los graduados fuera de 24 años cumplidos.
El error tipo II consiste en no rechazar la hipótesis nula, cuando ésta, sí debe de ser
rechazada.
Por lo tanto, se cometería un error tipo II si no se rechaza la hipótesis nula, cuando en
realidad la edad promedio de los graduados es diferente a 24 años cumplidos.
Ahora bien, tanto el error tipo I como el error tipo II se pueden analizar en términos de sus
probabilidades. Así, a la probabilidad de que ocurra el error de tipo I, se le llama α y a la
probabilidad de que ocurra el error de tipo II, se le denomina β.
P (error tipo I) = α
P (error tipo II) =β
El valor de α es fijado por el investigador al inicio de la prueba, en tanto que, el valor de β
se puede calcular.
El valor de β es el área obtenida a partir del valor del estadístico de prueba.
UnADM | DCEIT | MT | MEST1 20
Estadística I
Unidad 3. Prueba de hipótesis
3.2. Pruebas para las medias (muestras grandes)
Cuando se realiza un estudio estadístico se puede tomar cualquier parámetro poblacional
para realizar una prueba. El parámetro que se elija dependerá de cada situación y de las
características del estudio, así como, de las necesidades del investigador.
Quizá el parámetro más usado sea la Media, pues en todo estudio, resulta de mucha
utilidad saber el promedio de los datos, es decir, sobre qué valor se concentra la mayoría
de los datos.
En una prueba de hipótesis, sobre las Medias, puede interesarnos saber qué tanto se
aproxima la Media de la muestra a la Media poblacional, o bien, qué tanto difiere la Media
de una Muestra con respecto a la Media de otra.
Se analizarán ejemplos para situaciones en donde se tenga una Media, es decir, se
trabaje solamente con una muestra y también para situaciones en donde se cuente con
dos Medias, en cuyo caso se estará trabajando con dos muestras de una misma
población o de dos diferentes poblaciones.
Por otra parte, en la unidad anterior se mencionaron las muestras grandes. Algunos
autores consideran que 30 o 25 datos de la muestra es suficiente. También hay que
recordar el Teorema del Límite Central en donde se observó que conforme aumente el
tamaño de la muestra la distribución tiende a la normal.
De igual forma, es importante recordar que cuando el tamaño de la muestra es menor a
estos valores, pero la población original sigue una distribución normal, entonces, la
muestra también sigue la tendencia normal. Pero si el tamaño de la muestra es menor a
estos valores y la distribución de la población no sigue a la normal, entonces, no se puede
considerar la muestra como normal y será necesario por lo tanto utilizar otros métodos.
UnADM | DCEIT | MT | MEST1 21
Estadística I
Unidad 3. Prueba de hipótesis
3.2.1. Para la media de una población
La prueba de hipótesis sobre las Medias ya se ha venido ejemplificando. Ya se mencionó
que en la prueba se tiene una hipótesis nula y una hipótesis alterna a ésta y que en
general la hipótesis nula siempre será aquella en la que se iguale el estadístico al
parámetro de interés. Por lo tanto, en una prueba de hipótesis para las Medias, la
hipótesis nula siempre será planteada como:
H0: µ= cierto valor
Por ejemplo:
H0: µ= 24
Y la hipótesis alterna como lo diferente. Puede ser no direccional, es decir no se indica si
es mayor o menor, simplemente se establece que es diferente
Ha: µ ≠cierto valor prueba de dos colas
Por ejemplo:
Ha: µ ≠ 24
O puede ser direccional, es decir se establece si es mayor o menor:
Ha: µ<cierto valor prueba de cola inferior o a la izquierda
Ha: µ>cierto valor prueba de cola superior o a la derecha
Por ejemplo:
Ha: µ<24
Ha: µ>24
Ejemplos:
UnADM | DCEIT | MT | MEST1 22
Estadística I
Unidad 3. Prueba de hipótesis
Para facilitar el entendimiento de la prueba de hipótesis es conveniente formular un
procedimiento, es decir una serie de pasos, pero a medida que se avance y se tenga
mayor dominio del tema, se puede omitir y realizar la prueba de una manera menos
rígida.
1) Dado un problema el primer paso sería plantear las hipótesis (H0 y Ha) de
acuerdo al texto.
2) En seguida se procede a establecer un nivel de significación,
(generalmente va de 0.01, 0.05 a 0.10, pero habrá estudios y disciplinas
que se salgan de este rango). Como ya se estudió esto permite establecer
el valor crítico que separa la zona de rechazo y la de no rechazo.
3) Se debe obtener una estadística de prueba.
Éste es un valor que se calcula con base en la información de la muestra. Se trata del
elemento que sirve para hacer el contraste y permite la decisión de rechazar o no la
hipótesis nula.
UnADM | DCEIT | MT | MEST1 23
Estadística I
Unidad 3. Prueba de hipótesis
La elección del estadístico adecuado, dependerá de las características propias del
problema o del estudio que se desea realizar y está relacionado con el parámetro
poblacional de interés; si éste es la Media, el estadístico será uno, pero si se trata de la
Varianza, el resultado será otro.
Para el caso concreto de la media poblacional se deben tomar en cuenta varias
consideraciones:
• La desviación estándar es o no conocida
• El tamaño de la muestra es mayor o no a 30 (25 para algunos autores)
• La población se distribuye normalmente o no
SI se conoce la desviación estándar de la población y además se tiene una muestra
superior a 30, entonces se utiliza el estadístico z. Si no se conoce la desviación estándar
de la población, pero se tiene una muestra de tamaño mayor a 30, también se va a utilizar
la tabla z. Cuando el tamaño de la muestra es menor a 30 pero se tiene que la población
se distribuye normalmente y además se conoce la desviación estándar de la población, se
utilizara la tabla z y por último, si el tamaño de la muestra es menor a 30 pero se tiene que
la población se distribuye normalmente y además no se conoce la desviación estándar de
la población, se utilizara la tabla t.
Esto se resume en la siguiente tabla.
Muestra Desviación estándar poblacional
conocida desconocida
n>30 Distribución normal, usar Distribución normal, usar
tabla z tabla z
n<=30. Pero la población se Distribución normal, usar Distribución t, usar tabla t
distribuye normalmente tabla z
Para la prueba de hipótesis de una Media se utiliza el siguiente estadístico de prueba:
UnADM | DCEIT | MT | MEST1 24
Estadística I
Unidad 3. Prueba de hipótesis
𝑋̅ − 𝜇 𝑋̅ − 𝜇
𝑍𝐶𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = = 𝑠
𝑆𝑋̅
√𝑛
Siendo H0:µ=µ0
Se tienen los siguientes casos:
Posibilidades de Ha Se va a rechazar H0 si…
Ha: µ<µ0 Zcalc< Zα (tablas )
Ha: µ>µ0 Zcalc> Zα (tablas )
Ha: µ µ0 |𝑍calc |> Zα/2(tablas )
La prueba de hipótesis para una Media también se trabaja con el método del valor P,
que se verá al final de este apartado.
4) Con base en los resultados obtenidos se debe tomar una decisión en
cuanto a la hipótesis planteada.
El valor del estadístico obtenido en las tablas es el que se va a comparar con el valor del
estadístico de prueba (obtenido por medio de la fórmula).
Al graficar se ve claramente si el valor calculado cae o no dentro de la zona de rechazo.
Como ejemplo se presenta la siguiente figura en donde el estadístico de prueba cae
dentro de la zona de rechazo.
UnADM | DCEIT | MT | MEST1 25
Estadística I
Unidad 3. Prueba de hipótesis
Si la prueba es de cola superior y el valor del estadístico de prueba es mayor al valor del
estadístico de tablas, entonces se está en la zona de rechazo y por lo tanto se rechaza la
hipótesis nula y se acepta la hipótesis alterna.
En la siguiente figura se ilustra cuando el estadístico de prueba cae fuera de la zona de
rechazo:
Esto se resume en la siguiente tabla:
Tipo de prueba Valor calculado Cae en la zona de Se rechaza Ho
v.s. valor de tablas rechazo
UnADM | DCEIT | MT | MEST1 26
Estadística I
Unidad 3. Prueba de hipótesis
Cola inferior Mayor No No
menor si si
Cola superior Mayor Si Si
menor No no
Dos colas Mayor en valor Si Si
absoluto
Menor en valor no no
absoluto
5) Por último se obtienen las conclusiones.
Ejemplo 5:
Una clínica de tratamiento de la obesidad promete a sus clientes una reducción de peso
de 5 kilogramos por mes. Se realiza un estudio estadístico para saber si efectivamente los
pacientes bajan en promedio 5 kilogramos por mes. Para lo cual, se tomó una muestra de
49 pacientes y se obtuvieron los siguientes resultados:
Una reducción de peso promedio de 4 kg con una desviación típica de 1.8 kilogramos.
La pregunta es ¿se debe aceptar como válida la promesa de la clínica?
Solución:
Los datos que se pueden extraer del ejemplo son los siguientes:
µ=5kg, n=49, s=1.8kg, 𝑥̅ =4 kg
Con estos datos se procede a formular la Prueba de hipótesis.
UnADM | DCEIT | MT | MEST1 27
Estadística I
Unidad 3. Prueba de hipótesis
El primer paso es plantear la hipótesis nula y la alterna:
H0: en efecto la media prometida por la clínica es igual a la media poblacional
Ha: la media prometida por la clínica es diferente. En este caso, por tratarse de reducción
de peso, a los clientes obviamente les interesa saber si es verdad o por el contrario es
menor (si fuese mayor a la prometida no habría inconveniente). De tal forma, que
expresadas en forma matemática se tiene:
H0:µ=5
Ha: µ<5 prueba de cola inferior o a la izquierda. Si fuese mayor se tendría una prueba de
cola superior y si fuera diferente, se tendría una prueba de dos colas.
Ahora, se debe de definir el nivel de significancia α.
Para este ejemplo, se tomará un nivel de significación del 0.01. α=0.01.
Por lo que se tiene un nivel de confianza del 0.99 ó sea el 99%.
En este problema, se tiene el caso, donde no se conoce la desviación estándar (y la
varianza) de la población; sin embargo, el tamaño de la muestra permite asumir la
distribución como normal y, por tanto, utilizar el estadístico z. los datos se pueden
acomodar en un gráfico de la distribución normal para que se visualice mejor el problema.
Se tiene entonces:
UnADM | DCEIT | MT | MEST1 28
Estadística I
Unidad 3. Prueba de hipótesis
Con este valor de α=0.01 (α=1%), se observa un área del 49% ó sea 0.49 y con este valor
se busca en las tablas el valor de z (valor teórico)
Se encuentra que: z= 2.33. Lo que corresponde para –z=-2.33.
En el tercer paso, se va a calcular el estadístico z, para verificar si éste cae a la derecha
del valor crítico z obtenido en tablas, o bien, cae a la izquierda.
Se representa en un diagrama:
El estadístico de prueba utilizado para la Media considerando la distribución normal es:
UnADM | DCEIT | MT | MEST1 29
Estadística I
Unidad 3. Prueba de hipótesis
𝑋̅ − 𝜇 𝑋̅ − 𝜇
𝑍𝐶𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = = 𝑠
𝑆𝑋̅
√𝑛
La ecuación para z relaciona la diferencia de las Medias (de la muestra y la población)
entre el error estándar.
Sustituyendo los valores en la ecuación se tiene:
µ=5 kg, n=49, s=1.8 kg, =4 kg
𝑋̅ − 𝜇 𝑋̅ − 𝜇
𝑍𝐶𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = = 𝑠
𝑆𝑋̅
√𝑛
4−5
𝑍𝐶𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 1.8
√49
−1
𝑍𝐶𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 1.8 = −3.88
7
El siguiente paso es tomar la decisión estadística.
Si ZcalculadoZtabulado Entonces el estadístico cae en la zona de no rechazo por tanto no se
rechaza la hipótesis nula.
Si por el contrario el Si Zcalculado<Ztabulado se rechaza la H0 y se acepta la Ha.
Se tiene:
-3.88 < -2.33
Por lo tanto el estadístico cae en la región de rechazo. Así que se rechaza la H0 y se
UnADM | DCEIT | MT | MEST1 30
Estadística I
Unidad 3. Prueba de hipótesis
acepta la Ha.
Por último, se realiza la conclusión:
Los resultados de la prueba muestran que no se debe tomar como válida la promesa de la
clínica sobre la reducción de peso de los pacientes.
Ahora se explicará otro método para resolver el mismo tipo de prueba.
Método del valor P.
El método que se acaba de utilizar en la resolución del ejemplo se conoce como:
Método del estadístico z (o método del valor crítico); sin embargo, existe otro método
que actualmente es muy usado por los investigadores, se conoce como el Método del
valor P y es uno de los conceptos más importantes actualmente en las pruebas de
hipótesis.
El valor P va de 0 a 1.
Es una probabilidad que nos va a permitir observar qué tanta evidencia existe en la
muestra que apoya a rechazar la hipótesis nula. Es decir, con el valor P, se determina si
es adecuado rechazar la hipótesis nula en una prueba de hipótesis.
Una posible definición sería que es el valor mínimo que puede tomar α para que la H0 sea
rechazada. En términos probabilísticos, se diría que el valor P, es la probabilidad de
encontrar en una muestra evidencia suficiente a favor de la hipótesis alternativa.
En una prueba de hipótesis, la conclusión, resulta de comparar el valor P con α.
Se pueden tener los siguientes casos:
UnADM | DCEIT | MT | MEST1 31
Estadística I
Unidad 3. Prueba de hipótesis
• Valor P > α no rechazar H0 para ese valor de α específico
• Valor P α se rechaza H0 para ese valor de α específico.
Ahora bien, entre más pequeño sea el valor P, mayor será la evidencia que apoye la
hipótesis alternativa Ha, de hecho, se pueden tomar como regla las siguientes
aseveraciones:
• Valor P < 0.01 es evidencia convincente para rechazar H0
• Valor P entre 0.01 y 0.05 es evidencia fuerte para rechazar H0
• Valor P entre 0.05 y 0.10 es evidencia moderada para rechazar H0
• Valor P >0.10 no hay evidencia para rechazar H0
Cabe mencionar que el uso del valor P, es cada vez mayor comparado con el uso del
nivel de significancia o el método de la región de rechazo.
Hoy en día los investigadores se auxilian del software adecuado para el cálculo del valor
P, incluso, se realiza la prueba de hipótesis completamente en el programa (hay varios en
el mercado, el estudiante decidirá cual se adecua a sus necesidades).
Únicamente es necesario introducir los datos del problema para que en segundos el
programa arroje los resultados solicitados, incluyendo las gráficas.
En seguida se ejemplificara el cálculo del valor P, mediante el uso de software estadístico:
Ejemplo 6:
El secretario de transporte de la Ciudad de México desea saber el tiempo promedio en el
cual circulan los trenes del Sistema de Transporte colectivo Metro. Sus asesores le
aseguran que pasan 4 trenes (en promedio) cada 10 minutos. Se realiza un muestreo
estadístico anotando la cantidad de trenes que pasan efectivamente cada 10 minutos.
Los datos se muestran en la siguiente tabla.
UnADM | DCEIT | MT | MEST1 32
Estadística I
Unidad 3. Prueba de hipótesis
Nùm. de corrida (cada 10min) N de trenes que pasaron
1 9
2 4
3 3
4 5
5 3
6 2
7 1
8 7
9 3
10 9
11 5
12 0
13 2
14 4
15 3
16 4
17 2
18 0
19 7
20 4
21 2
22 5
23 0
24 9
25 11
26 5
27 15
28 5
UnADM | DCEIT | MT | MEST1 33
Estadística I
Unidad 3. Prueba de hipótesis
29 3
30 2
Se desea saber si se acepta o rechaza la opinión de sus asesores.
Solución:
Los datos que se pueden extraer del texto son los siguientes:
µ=4 trenes, n=30, s=?, =?
Lo primero que se puede hacer es calcular los dos datos que nos faltan utilizando para
ello la muestra reportada, se hará mediante el uso de software estadístico (el alumno
podrá usar el de su preferencia).
Se obtienen los valores:
s=3.48131, =4.46667
El primer paso es plantear la hipótesis nula y la alterna:
H0: en efecto lo que aseguran los asesores es cierto, pasan 4 trenes cada diez minutos,
en promedio.
Ha: la media que aseguran los asesores es diferente.
De tal forma que expresadas en forma matemática se tiene:
H0:µ=4
Ha: µ 4 prueba de dos colas.
Ahora se debe de definir el nivel de significancia α.
Para este ejemplo se tomará un nivel de significación del 0.05. α=0.05.
UnADM | DCEIT | MT | MEST1 34
Estadística I
Unidad 3. Prueba de hipótesis
Con ellos ya se tienen los datos para ser ingresados en el programa y realizar la prueba
de hipótesis.
El programa arroja los siguientes resultados:
Error estándar de la Variable N Media Desv. Est. media IC de 95% Z P
carros 30 4.467 3.481 0.636 (3.221; 5.712) 0.73 0.463
El siguiente paso es tomar la decisión estadística.
Dado que el P valor es mayor al valor de α.
0.463 > 0.05
La prueba señala que no hay suficiente evidencia para rechazar la hipótesis H0,
Finalmente se concluye que como el P valor es mayor al valor de α y no se rechaza la H0
el secretario de transporte debe tomar como cierto lo que le aseguran sus asesores.
Resumiendo, se puede decir que la prueba de hipótesis para la Media, usando el método
del valor P, se realiza igual sólo que ahora en lugar de comparar el valor del estadístico
obtenido en tablas (usando α) con el valor del estadístico calculado, simplemente se va a
comparar α con el valor P.
En el siguiente apartado se aborda la prueba para dos Medias.
3.2.2. Para la comparación de Medias
Ahora se ampliará la prueba para dos Medias. Así que se tomarán dos muestras
aleatorias. Generalmente el tamaño de las muestras es distinto. Sigue aplicándose el
criterio del Teorema Central de Límite, es decir, muestras mayores a 30 tienden a la
distribución normal. Se tiene entonces que las dos muestras siguen o se aproximan a la
distribución normal.
UnADM | DCEIT | MT | MEST1 35
Estadística I
Unidad 3. Prueba de hipótesis
La Prueba de Hipótesis para la diferencia entre dos medias poblacionales es muy usada
ya que es común encontrarse con situaciones o problemas que requieran la comparación
de sus Medias. Por ejemplo, si se desea evaluar la eficiencia de dos tipos diferentes de
gasolinas, se pueden probar en una muestra de automóviles idénticos y que operen bajo
las mismas condiciones, para saber cuál de ellas presenta una mayor eficiencia
energética.
Los pasos sugeridos para realizar la prueba son muy semejantes a los vistos para el caso
anterior y de igual forma se tienen los Métodos del estadístico o Valor Critico de z, y el
método del valor P.
Veamos en qué consisten:
1) Dado un problema, el primer paso sería plantear la hipótesis nula H0 de
acuerdo al texto.
Se acostumbra plantearla de la siguiente manera:
H0: (μ1 – μ2) = D0
Dónde:
D0= es la diferencia especifica que se desea probar, generalmente tiene un
valor de cero: D0=0
2) El segundo paso sería plantear la hipótesis alterna Ha de acuerdo al texto.
Como se ha visto la Ha puede tener tres posibilidades
Ha: (μ1 – μ2) > D0
Ha: (μ1 – μ2) < D0
Ha: (μ1 – μ2) D0
3) se debe definir el nivel de significancia α.
4) Se debe obtener una estadística de prueba.
UnADM | DCEIT | MT | MEST1 36
Estadística I
Unidad 3. Prueba de hipótesis
Para este caso se trabajará con el estadístico:
Éste es un valor que se calcula con base en la información de la muestra que es el
elemento que sirve para hacer el contraste pues permite la decisión de rechazar o no la
hipótesis nula.
Para el caso concreto de la diferencia de las Medias poblacionales se deben tomar en
cuenta varias consideraciones:
• Las muestras son seleccionadas al azar
• El tamaño de las muestra es mayor a 30 (25 para algunos autores)
• Las muestras son seleccionadas de manera independiente
5) Con base a los resultados obtenidos se debe tomar una decisión en torno a
la hipótesis planteada.
La hipótesis H0 se debe rechazar cuando:
El valor de este estadístico obtenido en tablas es el que se va a comparar con el valor del
estadístico de prueba (obtenido por medio de la fórmula).
Si la prueba es de cola superior y el valor del estadístico de prueba es mayor al valor del
estadístico de tablas, entonces se está en la zona de rechazo y por tanto se rechaza la
hipótesis nula y se acepta la hipótesis alterna.
Si la prueba es de cola inferior entonces el valor del estadístico de prueba deberá ser
menor al valor del estadístico de tablas, para rechazar la hipótesis nula y se acepta la
UnADM | DCEIT | MT | MEST1 37
Estadística I
Unidad 3. Prueba de hipótesis
hipótesis alterna. Si se tiene una prueba de dos colas se aplican las dos consideraciones
anteriores para rechazar la hipótesis H0.
Para el caso de usar el Método del valor P, la hipótesis H0 se va a rechazar cuando p<α.
Por último se han de sacar conclusiones.
Ejemplo 7:
En una preparatoria se aplicó el examen ENLACE. Para saber los resultados de sus
alumnos el Director del plantel desea realizar un estudio estadístico, por lo cual se
contrata al personal capacitado para que tome dos muestras aleatorias de estudiantes.
La primera muestra de 40 alumnos arrojó un promedio de 55 con una desviación Estándar
de 10. La segunda muestra fue de 30 alumnos con un promedio de 51 puntos y una
Desviación Estándar de 9. Se desea saber si existe alguna diferencia entre las dos
muestras. El estudio se desea probar con un nivel de confianza del 95%.
Solución:
Se va a resolver utilizando el Método del Estadístico de Prueba.
Los datos que se obtienen del ejemplo son los siguientes:
Muestra1:
n1=40, σ1=10,
𝑥1 = 55
Muestra 2:
n2=30, σ2=9,
UnADM | DCEIT | MT | MEST1 38
Estadística I
Unidad 3. Prueba de hipótesis
𝑥2 = 51
Nivel de confianza (1-α)= 95%
Con estos datos se procede a formular la Prueba de Hipótesis.
El primer paso es plantear la hipótesis nula y la alterna:
H0: no hay una diferencia considerable entre las Medias de las dos muestras.
En tanto que la hipótesis alternativa establece que las Medias de las dos muestras son
diferentes.
Ha: las medias son diferentes
De tal forma que expresadas en forma matemática se tiene:
H0:µ1= µ2
Ha: µ1µ2 es una prueba de dos colas.
Ahora se debe definir el nivel de significancia α.
Para este ejemplo se tiene un nivel de confianza (1-α)= 95%
Por lo que se tiene un nivel de confianza del 5% ósea el 0.05
α
Como es una prueba de dos colas, se tiene =0.025
2
En este problema se tiene el caso conocido como desviación estándar (y por tanto la
Varianza) de la población. También el tamaño de la muestra permite asumir la distribución
como normal y por tanto utilizar el estadístico z. los datos los podemos verter en un
gráfico de la distribución normal para que se visualice mejor el problema. Se tiene
entonces:
UnADM | DCEIT | MT | MEST1 39
Estadística I
Unidad 3. Prueba de hipótesis
α
Con este valor de α=0.05 (2 =0.025). Se observa un área del 47.5% ó sea 0.475 y con
este valor se busca en las tablas el valor de z (valor teórico).
Encontrándose que z= 1.96. Lo que corresponde para –z=-1.96.
En el Tercer paso se va a calcular el estadístico z para verificar si éste es mayor en valor
absoluto al del valor crítico z obtenido en tablas.
Veámoslo en un diagrama:
Pasemos a calcular la estadística de prueba:
Dado que la hipótesis H0:µ1= µ2
UnADM | DCEIT | MT | MEST1 40
Estadística I
Unidad 3. Prueba de hipótesis
Entonces se tiene que (µ1= µ2 )=0, Lo que implica que D0 = 0
El estadístico de prueba utilizado para dos Medias considerando la distribución normal se
simplifica como sigue:
Sustituyendo los siguientes valores
Muestra 1: n1=40, σ1=10,
Muestra 2:n2=30, σ2=9,
En la fórmula, se tiene:
Resolviendo la ecuación se llega a:
4
Zcalculado = 2.28 = 1.75
Zcalculado =1.75
El siguiente paso es tomar la decisión estadística.
UnADM | DCEIT | MT | MEST1 41
Estadística I
Unidad 3. Prueba de hipótesis
Si - ZtabuladoZcalculado +Ztabulado entonces el estadístico cae en la zona de no rechazo por
tanto no se rechaza la hipótesis nula.
Si, al contrario, se rechaza la H0 y se acepta la Ha.
se tiene:
-1.96 1.75 1.96
Por lo tanto, el estadístico no cae en la región de rechazo. Así que no se rechaza la
[Link] es que se esté aceptando H0,simplemente no hay evidencia suficiente para
rechazarla con un nivel de significación del 5%.
Por último, se realiza la conclusión:
Los resultados de la prueba muestran que no hay una diferencia significativa entre las
Medias (al menos, no para α=0.05), por lo tanto, se toma ese promedio como válido.
Nota: Aquí la cuestión sería hacer la prueba con otro nivel α, para ver si al modificar su
valor se sale de la zona de no rechazo.
3.3. Pruebas para las varianzas (muestras grandes)
En el punto anterior se revisaron las pruebas para la Media y diferencias de Media, ahora
se hará lo mismo, pero usando las Varianzas.
En la unidad uno se estudió las medidas de tendencia central y las de dispersión. Como
ya se había mencionado anteriormente, las medidas de dispersión también se conocen
como medidas de variabilidad y se utilizan para establecer cómo es la variación de los
datos respecto al valor central. Los conceptos más relevantes son la Varianza y la
Desviación típica o estándar.
UnADM | DCEIT | MT | MEST1 42
Estadística I
Unidad 3. Prueba de hipótesis
Recuerda que la Media es una medida de tendencia central y la Varianza es una medida
de dispersión. La Desviación estándar es la raíz cuadrada de la varianza y la razón de
esto es sólo para darle consistencia de unidades, para que no fueran cuadráticas. Por lo
tanto, se puede trabajar tanto con varianzas como con Desviaciones estándar.
Algunos autores consideran como muestras grandes el valor de 30, otros dicen que, con
25 datos de la muestra es suficiente.
También es importante recordar que cuando el tamaño de la muestra es menor a estos
valores, pero la población original sigue una distribución normal entonces la muestra
también sigue la tendencia normal. Pero si el tamaño de muestra es menor a estos
valores y la distribución de la población no sigue a la normal entonces no se puede
considerar la muestra como normal y será necesario por lo tanto utilizar otros métodos.
En este tema se abordarán dos casos: cuando solo se tiene una Varianza y donde se
trabaje con dos Varianzas.
3.3.1. Para la Varianza de una población
Cuando se desea realizar una Prueba de hipótesis para una varianza, se analiza una
muestra de la población y se calculan los intervalos de confianza para la Varianza
(también se puede hacer para la Desviación estándar).
La prueba de hipótesis sobre una Varianza se puede usar para determinar si la Varianza
(o la Desviación estándar) de una población (cuyo valor se desconoce), es igual a un valor
especificado por el investigador.
Esta prueba es muy útil en las industrias para determinar si la Varianza en la producción
es diferente a un estándar de la empresa.
La fórmula estadística que se ha usado en unidades previas como estimador de la
Varianza es:
UnADM | DCEIT | MT | MEST1 43
Estadística I
Unidad 3. Prueba de hipótesis
f ( xi − x)2
i =1
s2 =
n −1
Ahora bien, en esta unidad se ha estado trabajando con la distribución z. Si se desea
trabajar con una distribución s2, que esté basada en un muestreo aleatorio de una
distribución normal, unos datos de varianza y media especificas sería muy complicado.
Por lo que se recurre a la estandarización al igual que se hizo con la distribución z.
El estadístico estandarizado es:
Se le llama ji cuadrada. Y genera una distribución de muestreo llamada distribución de
probabilidad ji cuadrada. Éste será el estadístico de prueba para la Varianza de una
población.
Dónde:
(n-1)= grados de libertad, n=tamaño de la muestra.
Y la ecuación de densidad genera el siguiente tipo de gráfico:
UnADM | DCEIT | MT | MEST1 44
Estadística I
Unidad 3. Prueba de hipótesis
1. Nota que empieza en cero debido a que la Varianza no puede tener valores
negativos. así que los valores de X2 son mayores o iguales que 0.
2. Como la forma de la distribución depende de los grados de libertad, es decir, de n-
1, se tendrán infinitas posibilidades.
3. Al igual que la distribución normal, en la distribución ji cuadrada el área total bajo
la curva es igual a 1 o bien se dice que representa el 100%.
4. Este tipo de distribuciones no son simétricas como lo es la distribución normal. la
distribución ji cuadrada es sesgada a la derecha.
Lo que interesa de ella son los valores críticos que se reportan en tablas (al igual que la
distribución z)
Ahora bien, (al igual que se hizo para la Media) para realizar la prueba de hipótesis para
la Varianza de una población se sugieren los siguientes pasos.
• Primero se debe plantear la hipótesis nula. Generalmente será:
• Después se propone la hipótesis alternativa que como ya es sabido puede
tener tres posibilidades (>, ,<), cola superior, cola inferior y dos colas.
• Se trabaja con el estadístico de prueba:
• Se toma una decisión.
De igual manera que con la Media se tienen dos métodos.
UnADM | DCEIT | MT | MEST1 45
Estadística I
Unidad 3. Prueba de hipótesis
Método del valor crítico (o estadístico de prueba)
Se va a rechazar H0 cuando el valor absoluto de X2calculado sea mayor al de tablas (para la
prueba de dos colas), o bien, cuando el valor de X2calculado sea mayor al de tablas (para la
prueba de cola superior), o bien, cuando el valor de X2calculado sea menor al de tablas (para
la prueba de cola inferior).
En seguida se ejemplifican gráficamente los casos de cola superior y dos colas.
Método del valor P.
Simplemente se rechaza la H0 si el valor p <α. Para el caso de una prueba de dos colas
𝛼
se rechaza la H0 si el valor p < .
2
• Finalmente se concluye:
Como habrás notado, es prácticamente el mismo procedimiento que se siguió en la
prueba para la Media.
UnADM | DCEIT | MT | MEST1 46
Estadística I
Unidad 3. Prueba de hipótesis
Ejemplo 8:
Una clínica de tratamiento de la obesidad promete a sus clientes una reducción sustantiva
de peso en kilogramos al año. El gerente del negocio estima que la reducción de peso
prometida es cierta con una dispersión de σ=2.
Se realiza un estudio estadístico para saber si efectivamente los pacientes bajan
sustantivamente de peso. Para lo cual se tomó una muestra de 40 pacientes y se
obtuvieron los siguientes resultados:
Una reducción de peso promedio de 12.075 kg anuales, con una desviación típica de
1.845 kilogramos.
La pregunta es ¿se debe aceptar como válida la promesa de la clínica?
Solución:
Se resolverá utilizando el Método del valor P, y será utilizado un software estadístico.
Los datos que se pueden extraer del texto son los siguientes:
σ=2, así que σ2=4, n=40, s=1.845kg, =12.075 kg
Con estos datos se procede entonces a formular la prueba de hipótesis.
• Primeramente, se plantea la hipótesis nula y la alterna:
H0: en efecto la Media prometida por la clínica es igual a la Media poblacional
Ha: la Media prometida por la clínica es diferente. En este caso por tratarse de
reducción de peso a los clientes les interesa saber si es verdad o por el contrario
es menor (si fuese mayor a la prometida no habría inconveniente).
UnADM | DCEIT | MT | MEST1 47
Estadística I
Unidad 3. Prueba de hipótesis
De tal forma que expresadas en forma matemática se tiene:
H0:σ2=4
Ha: σ2<4 prueba de cola inferior o a la izquierda.
• Se define el nivel de significancia α.
Para este ejemplo se tomará un nivel de significación del 0.05. α=5%.
Por lo que se tiene un nivel de confianza del 0.95 ó sea el 95%.
• Con los datos obtenidos anteriormente se ingresa al programa y realiza la prueba
de hipótesis.
• El programa arroja los siguientes resultados:
Estadísticas
N [Link]. Varianza
40 1.85 3.40
95% Intervalos de confianza unilaterales
Límite Límite
superiorsuperior
para Método [Link]. varianza
Chi-cuadrada 2.27 5.17
Pruebas
Estadística
UnADM | DCEIT | MT | MEST1 48
Estadística I
Unidad 3. Prueba de hipótesis
Método de prueba GL Valor P
Chi-cuadrada 33.19 39 0.269
• Se toma la decisión estadística.
Dado que el P valor es mayor al valor de α.
0.269 > 0.05
Conclusión
La prueba señala que no hay suficiente evidencia para rechazar la hipótesis H0
Finalmente se concluye que como P, valor es mayor al valor de α y no se rechaza la H0
los clientes de la clínica deben tomar como cierto lo que le asegura el gerente de la
empresa.
3.2.2. Para la comparación de Varianzas
Para hacer inferencias sobre la igualdad de las Desviaciones estándar o varianzas entre
dos poblaciones, basadas en muestras independientes y aleatorias, se recurre a los
procedimientos de prueba e intervalo de confianza.
En la prueba de hipótesis para la comparación de varianzas se recurre a la razón de
varianzas muestrales:
s12
s 22
Esta relación tiene una distribución de distribución de probabilidad que en estadística se
conoce como distribución F. la gráfica típica para una distribución F es la siguiente:
UnADM | DCEIT | MT | MEST1 49
Estadística I
Unidad 3. Prueba de hipótesis
Al igual que en el caso de una Varianza se tiene que:
(n-1)= grados de libertad, n=tamaño de la muestra.
Para que se asuma que, la relación, de las Varianzas muéstrales presente una
distribución F, se debe de tener en cuenta que las muestras aleatorias deberán ser
independientes y se obtendrán de cada una de dos poblaciones normales. Además, la
variabilidad de las mediciones en las poblaciones deberá ser idéntica y, por lo tanto, podrá
ser medida con una varianza común. Esto es:
𝜎 2 = 𝜎12 = 𝜎22
La prueba de hipótesis se realiza básicamente en forma idéntica que para la de una
varianza, solo cambia el estadístico ji-cuadrada por el estadístico F.
• Primero se debe plantear la Hipótesis nula. Generalmente será:
• Después se propone la hipótesis alternativa que como ya es sabido puede
tener tres posibilidades (>,<,), ya sea que se trate de una cola o de dos
colas.
• Se trabaja con el estadístico de prueba
UnADM | DCEIT | MT | MEST1 50
Estadística I
Unidad 3. Prueba de hipótesis
Donde la Varianza muestral más grande es:
• Se toma una decisión. De igual manera que con la Media se tienen dos
métodos
✓ Para el Método del valor crítico (o estadístico de prueba)
Se va a rechazar H0 cuando el valor de F > Fα (para una cola)
Y Se va a rechazar H0 cuando el valor de F > F𝛼 ⁄2 (para dos colas)
✓ Para el método del valor P.
Simplemente se rechaza la H0 si el valor p <α.
• Finalmente se concluye que:
Ejemplo 9:
Al realizar un estudio sobre una población estudiantil, se tomaron dos muestras. Las
cuales arrojaron los siguientes datos:
Muestra1:
muestra n Desviación. Estándar.
1 42 1.96
Muestra 2:
muestra n Desviación Estándar.
2 32 2.13
Realice una Prueba de Hipótesis utilizando un software estadístico.
Solución:
UnADM | DCEIT | MT | MEST1 51
Estadística I
Unidad 3. Prueba de hipótesis
Se resolverá utilizando el Método del valor P, y será utilizado un software estadístico.
Los datos son suficientes para realizar la prueba, recuerda que, aunque no se tenga el
dato de la varianza, como ésta, es el cuadrado de la desviación estándar. Los programas
estadísticos, trabajan de manera idéntica, ya sea que se ingrese el dato de la varianza o
el de la desviación estándar.
Con los datos se procede a formular la prueba de hipótesis.
El primer paso es plantear la hipótesis nula y la alterna:
De tal forma que expresadas en forma matemática se tiene:
H0:
Ha:
Es una prueba de dos colas.
Ahora se debe de definir el nivel de significancia α.
Para este ejemplo, se tomará un nivel de significación del 0.05. α=5%.
Por lo que se tiene un nivel de confianza del 0.95, es decir, el 95%.
Con ellos ya se tienen los datos para ser ingresados en el programa y realizar la Prueba
de Hipótesis.
El programa arroja los siguientes resultados:
Prueba de IC para dos varianzas
* NOTA * Las gráficas que no sean de intervalos no se pueden crear con
datos resumidos.
UnADM | DCEIT | MT | MEST1 52
Estadística I
Unidad 3. Prueba de hipótesis
Método
Hipótesis nula Sigma (1) / Sigma(2) = 1
Hipótesis alterna Sigma (1) / Sigma(2) not = 1
Nivel de significancia Alfa = 0,05
Estadísticas
Muestra N [Link]. Varianza
1 42 1.960 3.842
2 32 2.130 4.537
Relación de deviaciones estándar = 0.920
Relación de varianzas = 0.847
Intervalos de confianza de 95%
IC para IC para
Distribución relación de relación de
de los datos [Link]. varianza
Normal (0.653; 1,277) (0.426; 1.630)
Pruebas
Estadística
Método GL1 GL2 de prueba Valor P
Prueba F (normal) 41 31 0.85 0.611
UnADM | DCEIT | MT | MEST1 53
Estadística I
Unidad 3. Prueba de hipótesis
El siguiente paso es tomar la decisión estadística.
Dado que el P valor es mayor al valor de α.
0.611 > 0.05
La prueba señala que no hay suficiente evidencia para rechazar la hipótesis H0
Finalmente se concluye que, como el P es mayor al valor de α, no se rechaza la hipótesis
nula H0.
Nota: para todos los ejemplos se ha utilizado el software estadístico minitab16. (El
estudiante puede hacer uso del software que guste)
3.4. Potencia de la Prueba
Hasta este momento has revisado conceptos como hipótesis nula, hipótesis alternativa,
los tipos de errores I y II. En este último tema retomarás esos conceptos para poder
entender lo que es la potencia de la prueba.
La potencia de una prueba se puede definir como la probabilidad de rechazar la hipótesis
nula cuando ésta se debe rechazar. Esto quiere decir, que la hipótesis nula es falsa y la
hipótesis alternativa es verdadera. En otras palabras, se diría que:
La potencia de la prueba es la probabilidad de rechazar correctamente una hipótesis nula
cuando ésta es falsa.
Para poner la definición en términos matemáticos es necesario recordar los tipos de
errores. En el primer tema de esta unidad se estudió en qué consiste el error del tipo I:
Rechazar la hipótesis nula cuando ésta no se debe rechazar. La probabilidad de cometer
este tipo de error se conoce como α y el error de tipo II es:
No rechazar la hipótesis nula cuando sí se debe de rechazar. La probabilidad de cometer
este tipo de error se conoce como β.
UnADM | DCEIT | MT | MEST1 54
Estadística I
Unidad 3. Prueba de hipótesis
Tanto α como β, pueden ser expresados en términos de probabilidad. Así se tiene que:
α= la probabilidad de rechazar H0cuando H0es verdadera (error tipo I)
β= la probabilidad de no rechazar H0 cuando H0 es falsa (error tipo II)
Considerando lo anterior, procedamos a definir la potencia de la prueba como:
Potencia= P (rechazar la hipótesis nula, H0 cuando ésta se debe rechazar)
Esta expresión también se puede poner en términos del complemento, es decir:
Potencia= 1- P (no rechazar la hipótesis nula, H0 cuando ésta se debe rechazar)
En términos del error se puede expresar como:
Potencia= 1- P (cometer error tipo II)
Potencia =1- β
Ésta sería la expresión más común para la potencia de la prueba. Cabe señalar que la
potencia de la prueba es un concepto muy importante, dado que es un indicador de la
cantidad de veces que se debe rechazar la hipótesis nula.
Finalmente, cabe señalar que la potencia de la prueba es una medida de la sensibilidad
de una prueba estadística.
3.4.1. Lema de Neyman Pearson
En los temas anteriores se ha trabajado con ejemplos practicos sobre la prueba de
hipótesis, se han abordado varios casos sobre el contraste y sugerido algunas
actividades. Ahora se tratarán temas dentro del campo de lo teórico, dicho lo anterior
pasemos a definir el Lema de Neyman- Pearson.
UnADM | DCEIT | MT | MEST1 55
Estadística I
Unidad 3. Prueba de hipótesis
En cierto sentido, se puede decir que este lema, es el primer teorema de clase de
decisión completa.
El lema de Neyman demuestra que la prueba óptima para realizar un contraste de
hipótesis simples ( es decir: H 0 : 0 H a : a ), consiste ante todo en la
y
comparación del cociente de verosimilitudes con un umbral.
También hay que mencionar que el lema, si bien proporciona siempre la mejor región
crítica, no siempre porporciona la región uniformemente más potente (UMP), por ejemplo,
en las pruebas de hipótesis simples como: H 0 : = 0 contra H a : 0
3.4.2. Función Potencia
La potencia se definió como la probabilidad de que en una prueba de hipótesis se
rechace la hipótesis H0 siendo ésta falsa, es decir, que se haya tomado la decisión
correcta.
Ya se mencionó que la potencia es igual a 1-β, y sabemos que β es la probabilidad de
cometer el error tipo II. A medida que α aumenta β disminuye, por lo tanto, la potencia
aumenta.
Pero si aumenta α, también, aumenta la probabilidad de cometer el error tipo I.
La prueba más potente es aquella que optimiza la α y la potencia de la prueba. Es decir,
encontrar una combinación óptima con α y β.
En seguida se señalan los factores más importantes que afectan a la potencia:
• El primer factor es el tamaño de la muestra. Cabe señalar que es conveniente
tomar muestras grandes, porque al aumentar el tamaño muestral se va a obtener
información más cercana de la población, así que a muestras grandes, aumenta la
UnADM | DCEIT | MT | MEST1 56
Estadística I
Unidad 3. Prueba de hipótesis
potencia.
• El segundo factor importante es el valor de α (error tipo I), ya que a mayor valor
será más probable rechazar la hipótesis nula.
• El tercero considera que la variabilidad de la población afecta a la potencia.
Cuando se tienen valores de σ pequeños aumenta la potencia, porque es más fácil
detectar una diferencia.
• El cuarto factor es la similitud (o no similitud), entre las poblaciones. Entre más
similares son las poblaciones es más difícil detectar una diferencia, así que la
potencia será menor.
De acuerdo a estos factores se puede comentar que si se desea hacer una prueba, por
ejemplo, para comparar dos medicamentos en el mercado (los de patente y los llamados
genéricos intercambiables) y detectar las diferencias entre ellos. Si los investigadores
desean aumentar la potencia de la prueba deberán incrementar el tamaño del muestreo,
para de este modo obtener más información en torno a la población. También se
recomienda implementar buenas técnicas de muestreo para que disminuya la Varianza
de error.
En seguida se utilizarán dos figuras para mostrar la prueba de hipótesis y su potencia.
Se ha graficado la función de densidad para la H0 cuya altura media es 0 . A la derecha
se ha graficado la distribución de la H a y R.C es la región crítica (está integrada por los
valores mayores al punto A).
UnADM | DCEIT | MT | MEST1 57
Estadística I
Unidad 3. Prueba de hipótesis
El error tipo I (la probabilidad de rechazar H0 siendo cierta) o el nivel de significancia α, es
la parte sombreada de la figura anterior.
El error tipo II (la probabilidad de no rechazar la H0 siendo falsa) es decir el valor β, es la
cola rayada de la curva de la derecha de la siguiente figura.
La potencia (1-β) está representada por la parte sombreada de la curva de la derecha de
la siguiente figura.
La decisión de rechazar H0 sucede cuando se obtiene un resultado mayor al punto A,
pero si es menor no se podrá rechazar.
Con esto queda claro que la potencia y el nivel de significación en una prueba de
hipótesis no son independientes. Lo que todo investigador quisiera es tener un mínimo
valor de α y un máximo valor de potencia, pero esto no se puede lograr porque no son
independientes así que si disminuye α también se reduce la potencia de la prueba.
Ésta es una forma de calcular la potencia de una prueba de manera un tanto manual.
Actualmente en la era digital sólo hay que elegir el software adecuado, introducir los datos
y analizar los resultados arrojados por el programa. En el mercado hay varios paquetes de
análisis estadístico, entre los que se pueden mencionar: Excel (la hoja de cálculo de
Microsoft), minitab, spss, statgraphics, entre muchos otros.
Cuando se tiene:
H 0 : = 0 contra H a : 0
UnADM | DCEIT | MT | MEST1 58
Estadística I
Unidad 3. Prueba de hipótesis
Y se ha fijado un valor para α. entonces la potencia de la prueba ya no tiene un valor
único, dado que, para cada valor de 0 se tendrá una distribución alterna y por lo
tanto una potencia, más bien, una función potencia.
Se llama potencia de la prueba, a la probabilidad de rechazar la hipótesis nula cuando
ésta es falsa (cuando las hipótesis son simples), y se le llamará función potencia, cuando
las hipótesis sean compuestas.
3.4.3. Prueba uniformemente más potente
La prueba más potente es aquella que optimiza la α y la potencia de la prueba. La prueba
uniformemente más potente, es la generalización de este hecho. Es decir, cuando se
tiene una prueba (o contraste) del tamaño del nivel de significación α, y si este contraste,
maximiza la potencia para todas las alternativas de la hipótesis alterna H a (Es decir para
todos los posibles valores del parámetro θ ϵ ϴa), se dice, que es un contraste (o una
prueba) uniformemente más potente y se abrevia como “UMP”.
Dónde:
ϴ = espacio paramétrico
ϴ0, ϴa = dos conjuntos disjuntos cuya unión es ϴ. El conjunto ϴ0 es la partición de ϴ
asociada a H0 (en otras palabras, contiene todos los posibles valores que puede tomar el
parámetro bajo la hipótesis nula), en tanto que, ϴaes la partición de ϴ asociada a Ha.
θ = es un parámetro desconocido cualquiera.
UnADM | DCEIT | MT | MEST1 59
Estadística I
Unidad 3. Prueba de hipótesis
Cierre de la unidad
A lo largo de estas tres unidades se han expuesto los temas más importantes de la
Estadística.
En la unidad uno, se revisaron los conceptos de la Estadística Descriptiva que son la base
de todo estudio e investigación estadístico: la Media, la desviación estándar la varianza,
entre otros.
En la unidad dos, se abordaron la Distribución normal, el Teorema del Límite Central y los
intervalos de confianza, que son el soporte para un buen entendimiento de las pruebas de
hipótesis vista en la presente unidad. Así, hay un hilo conductor que recorre las tres
unidades.
Las pruebas estadísticas aprendidas en esta unidad son de suma importancia. Se
recomienda al estudiante, revisar los temas de las unidades cuantas veces sea necesario
hasta tener dominio sobre ellos, dado que, como ya se comentó, son los pilares para
cualquier estudio posterior.
Fuentes de consulta
• Kuby, J. (2012). Estadística elemental. México: Cengage.
• Ojer, L. (1990). Estadística básica. Madrid: Dossat.
• Huntsberger, D. (1983). Elementos de Estadística Inferencial. España: Continental.
UnADM | DCEIT | MT | MEST1 60