0% encontró este documento útil (0 votos)
107 vistas28 páginas

Contraste de Hipótesis en Estadística

Este documento trata sobre el contraste de hipótesis. Explica que el contraste de hipótesis compara una estimación con los valores poblacionales para verificar si la estimación se ajusta a la realidad de forma confiable. Define la hipótesis nula y la hipótesis alternativa, y los errores tipo I y tipo II que pueden ocurrir al contrastar hipótesis. También cubre la distribución chi cuadrado y su uso para probar la igualdad de proporciones.

Cargado por

JOSE GIL
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
107 vistas28 páginas

Contraste de Hipótesis en Estadística

Este documento trata sobre el contraste de hipótesis. Explica que el contraste de hipótesis compara una estimación con los valores poblacionales para verificar si la estimación se ajusta a la realidad de forma confiable. Define la hipótesis nula y la hipótesis alternativa, y los errores tipo I y tipo II que pueden ocurrir al contrastar hipótesis. También cubre la distribución chi cuadrado y su uso para probar la igualdad de proporciones.

Cargado por

JOSE GIL
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

República Bolivariana de Venezuela.

Ministerio del Poder Popular para la Educación Superior.

Universidad Nacional Experimental “Simón Rodríguez”.

Maturín – Estado – Monagas.

UNIDAD II

CONRASTE DE HIPOTESIS

Facilitador(a): Participantes:
Monserrath Pérez Anilexis Granger
CI: 27.946.458
Sección: “R-3”
CONTRASTE DE HIPÓTESIS.
El contraste de hipótesis es un tipo de modelo utilizado en inferencia estadística
cuyo objetivo es comprobar si una estimación se adapta a los valores poblacionales. En
palabras menos abstractas, el objetivo de los métodos de contraste de hipótesis es verificar
si una estimación se adapta a la realidad de forma ‘fiable’.
Los supuestos se denominan hipótesis paramétricas. Es decir, se estable un criterio
de decisión. Si con esa condición se acepta la hipótesis de referencia, entonces podemos
afirmar con cierta probabilidad que la estimación puede ser muy cercana al supuesto valor
real.
En todo contraste de hipótesis existen dos supuestos. La hipótesis nula (H0) que
recoge la idea de que una variable tiene un valor predeterminado, y la hipótesis alternativa
(H1), que es la que se acepta cuando se rechaza la hipótesis nula (H0).

Ejemplo De Contraste De Hipótesis.


Siguiendo con los resultados anteriores.
 Partido A: 32%
 Partido B: 51%
 Partido C: 17%
Contraste de hipótesis sobre qué A tenga un 32% al 95% de confianza.
 H0: No tiene un 32% de votos con un 95% de probabilidad
 H1: Tiene  un 32% de votos con un 95% de probabilidad
En el caso que podamos rechazar la hipótesis nula (H0), podemos afirmar la hipótesis
alternativa. Es decir, en ese escenario, se podría asegurar que el partido A tiene un 32% de
votos con un 95% de probabilidad.

ANALIZAR LOS ELEMENTOS QUE CONSTITUYEN UN CONTRASTE DE


HIPÓTESIS.
La hipótesis para la que se desea encontrar evidencia se llama hipótesis alternativa o
hipótesis experimental. Se denota H1. μ < 0
La afirmación contraria a H1 se llama hipótesis nula. Se denota H0. μ=0
Como queremos confirmar si el grado medio realmente desciende, queremos
contrastar H0: μ = 0 frente a H1: μ < 0
El razonamiento básico para hacer un contraste es:
1. Supongamos que H0 es cierta, μ= 0.
2. Es el resultado obtenido a partir de los datos (x = -1.02) extraño bajo esta hipótesis?
3. Si esto es así, los datos aportan evidencia contra H0 y a favor de H1.
Para llevar a cabo el análisis anterior tenemos que estudiar qué valores son los que
cabe esperar que tome x cuando H0 es cierta.
Para simplificar suponemos de momento que la población es normal y que la
varianza es conocida y vale 1.
Recordamos que

Siendo H0 cierto, tenemos

Para ver si la media observada es compatible con μ = 0, calculamos

Y comparamos este valor con la distribución normal estándar.


Como -3,2255 es un valor bastante improbable para una distribución N(0, 1),
(mirando las tablas de la normal, se tiene P(Z < -3.2255) < 0.001), los datos proporcionan
bastante evidencia en contra de H0 y a favor de H1.

ENUNCIAR LOS ERRORES DE TIPO I Y TIPO II.


Estrictamente hablando, el contraste estadístico de hipótesis se reduce a la toma de
una decisión por parte del investigador en un contexto de probabilidad, más
específicamente de error o acierto. Dado que los argumentos estadísticos de la prueba
siempre representarán sólo una ganancia a los niveles de incertidumbre general con relación
a la naturaleza del fenómeno estudiado, existirá, por tanto, una posibilidad de acertar las
características “verdaderas” o también de equivocarnos en la decisión que tomemos con
respecto a las interpretaciones de los resultados de nuestras observaciones. Los autores han
reducido a dos clases los tipos de error que se pueden cometer en el contexto del contraste
de hipótesis estadística, a saber: error tipo I y II.
La teoría del contraste de hipótesis sostiene que pueden existir uno de dos estados,
mutuamente excluyentes, en la naturaleza: los casos en los cuales la Ho es cierta o aquellos
en los cuales la H1 es cierta. Razón por la cual, tras estudiar el comportamiento de una
muestra, se llega a una de las dos decisiones mencionadas. Lo cual implicará en cualquier
caso el riesgo de cometer alguna de las formas de error comentados en el párrafo anterior.
La tabla a continuación ilustra las combinaciones de dichos eventos y la condición de la
decisión tomada según el caso.

Decisión

No acepta H0 Acepta H0

Evento H0 es cierta Error tipo I Decisión correcta


p=α p=1-β

H0 es falsa Decisión correcta Error tipo II


p=1-α p=β

De esta manera, se entiende por error tipo I al caso en el cual se rechaza la hipótesis
nula cuando esta es verdadera. En otras palabras, no se acepta la hipótesis nula y se asume
que las observaciones arrojan diferencias “estadísticamente significativas” cuando en
“verdad” no es así.
De esta manera, el investigador asumirá típicamente que los efectos de una
determinada variable independiente sobre una determinada variable dependiente son
“verdaderos” cuando en “realidad” no es así.
Por su parte, el error tipo II es el caso contrario al error tipo I. se dice que un
investigador ha cometido un error tipo II cuando acepta la hipótesis nula en lugar de la
alternativa siendo ésta en “realidad” falsa. En otras palabras, se acepta la hipótesis nula y se
asume que las observaciones NO arrojan diferencias “estadísticamente significativas”
cuando en “verdad” no es así. De esta manera, el investigador asumirá típicamente que los
efectos de una determinada variable independiente sobre una determinada variable
dependiente NO “existen” cuando en “realidad” no es así.

ESTABLECER E INTERPRETAR LA POTENCIA DE UNA PRUEBA DE


HIPÓTESIS.
La potencia de una prueba de hipótesis es la probabilidad de que la prueba rechace
correctamente la hipótesis nula. La potencia de una prueba de hipótesis se ve afectada por
el tamaño de la muestra, la diferencia, la variabilidad de los datos y el nivel de significancia
de la prueba.
Si una prueba tiene poca potencia, es posible que no se detecte un efecto y concluya
erróneamente que no existe ninguno. Si la potencia de una prueba es demasiado alta,
efectos muy pequeños y posiblemente sin importancia podrían parecer significativos.
Ninguna prueba es perfecta, siempre existe la posibilidad de que los resultados de una
prueba conduzcan a rechazar la hipótesis nula (H0) cuando en realidad sea verdadera (un
error de tipo I) o a no rechazar H0 cuando realmente sea falsa (error de tipo II). Esto se debe
a que para poder estimar las medias de la población, usted tiene que utilizar muestras
aleatorias, y las muestras aleatorias son precisamente eso, aleatorias. Por lo tanto, siempre
es posible que la media de la muestra resulte muy diferente de la media de la población. Por
ejemplo, supongamos que cierta población distribuida normalmente tiene una media (μ) de
10 y una desviación estándar (σ) de 2. Esta distribución indica que 95.44% de los valores
de esta población se encuentran entre 6 y 14. Sin embargo, siempre es posible que usted
seleccione 10 observaciones de forma aleatoria y termine con una media de la muestra de 4.
¡Con una muestra como esa, usted no podría inferir que la media de la población es
realmente 10!
ENUNCIAR LA DISTRIBUCIÓN JI CUADRADO, SUS CARACTERÍSTICAS
Y USO.
Se define a la Distribución Chi Cuadrado como: “Aquella distribución denominada
también ji-cuadrado de Pearson, es una distribución de probabilidad continua con un
parámetro “k”, que representa los grados de libertad de la variable aleatoria”. Según
Es considerada como una prueba no paramétrica, que mide la discrepancia entre una
distribución observada y otra teórica (bondad de ajuste), indicando la medida de las
diferencias existentes entre ambas, y de haberlas, se deben al azar en el contraste de
hipótesis, también se utiliza para probar la independencia de dos variables entre sí,
mediante la presentación de los datos en tablas de contingencia.
Las Pruebas de Chi Cuadrado, nos permiten verificar si más de dos proporciones de
poblaciones pueden considerarse iguales. En realidad, éstas nos permiten hacer muchas
cosas y no simplemente probar la igualdad de varias proporciones. Por ejemplo: si
clasificamos una población de diversas categorías respectos a dos atributos, como la edad y
rendimiento en el trabajo, se puede aplicar entonces la Prueba del Chi Cuadrado, para
determinar si ambos atributos son independientes entre sí.
Se calcula a través de una fórmula y los cálculos son fáciles de hacer. Si el valor de
Chi Cuadrado da cero, indica que las frecuencias observadas son exactamente iguales a las
frecuencias esperadas. Si el valor es diferente de cero, entonces este valor obtenido refleja,
que hay diferencia entre los valores observados y los valores esperados, es importante
mencionar que este valor es comparado con otro estadístico de Chi Cuadrado, que se
determina cuando se calculan los grados de libertad y se tiene el nivel de significancia
escogido; este valor es buscado en la tabla de Distribución Chi Cuadrado, correspondiente
al extremo derecho y así se determina si se rechaza la hipótesis nula o se acepta.
La fórmula que da el estadístico es la siguiente:

X ²=Σ (fo – fe) ²


fe
Dónde:
X²= Chi Cuadrado
Σ= “La suma de”
fo= Frecuencia observada
fe= Frecuencia esperada

Características De La Distribución De Chi Cuadrado.


 Es una curva asimétrica a la derecha, es decir, con sesgo positivo y las frecuencias más
altas se encuentran en el lado izquierdo de la media; mientras que en el derecho hay
frecuencias más pequeñas.
 El valor de Chi Cuadrado nunca es negativo, porque la diferencia entre fo y fe se eleva
al cuadrado, esto es (fo y fe)².
 Existe una familia de distribuciones de Chi Cuadrado; una para cada grado de libertad
(gl). El número de grados de libertad está determinado por (K-1), donde “K”, es el
número de categorías, en consecuencia, la forma de la distribución de la muestra no
depende del tamaño de ésta. Por ejemplo, si 200 empleados de una aerolínea, se
clasifican en una de estas tres categorías: personal de vuelo, personal auxiliar en tierra
y personal administrativo; entonces habría K-1 = 3-1= 2 grados de libertad.
 Las distribuciones de Chi Cuadrado tienen sesgo positivo, pero conforme aumenta el
número de grados de libertad, la distribución se aproxima a la de tipo normal.

ANALIZAR EL CONTRASTE DE HIPÓTESIS APLICANDO LA


DISTRIBUCIÓN JI CUADRADA PARA CONOCER LA INDEPENDENCIA Y
HOMOGENEIDAD DE VARIABLES, ASÍ COMO BONDAD DE AJUSTE
DE UNA DISTRIBUCIÓN DETERMINADA.
Prueba Ji-Cuadrado De Independencia.
Objetivo de la prueba: se utiliza cuando se tiene una muestra de n individuos que se
clasifican respecto a dos variables, preferentemente cualitativas (nominales dicotómicas o
politómicas) y se desea conocer a partir de datos muéstrales, si existe asociación de estas a
nivel poblacional.
Hipótesis:
H0: Existe poblacionalmente independencia entre las variables estudiadas (no existe
asociación a nivel poblacional entre las variables estudiadas)
H1: No existe poblacionalmente independencia (existe asociación a nivel poblacional entre
las variables estudiadas)
En las tablas 2x2 se emplea la prueba Ji-cuadrado Corrección de Yates siempre.
Limitaciones de la prueba:
-Se necesita que más del 20% de los valores esperados estén por encima de 5 y que
ninguna celda tenga valor esperado menor a 1.
-Si la tabla es de 2x2, todas las celdas deben tener valores esperados por encima de 5.
-En el caso de la tabla de 2x2 si existe una sola celda con valor esperado menor que 5,
esto representaría un 25% de las celdas con esa condición, por lo que se utilizaría la
Prueba de las Probabilidades exactas de Fisher en lugar de la Prueba χ2, ya que en éste
caso no es posible agrupar categorías.
-En el caso de las tablas 2x2 se sugiere incluir en el estadígrafo la corrección de
continuidad de Yates, que consiste en restarle ½ al numerador de la expresión, para
atenuar el efecto de usar una distribución continua para representar una distribución
discreta de frecuencias muéstrales.
El estadígrafo de prueba y la regla de decisión son similares a los de la Prueba Ji-
cuadrado de homogeneidad.

Prueba De Homogeneidad De Muestras.


Otra de las aplicaciones interesantes de la prueba chi-cuadrado de independencia
consiste en la comprobación de la homogeneidad de distintas muestras de una variable.
Supongamos que hemos obtenido j muestras de tamaño nj de una misma variable
aleatoria (x) y queremos comprobar si son homogéneas, es decir, si la variable tiene la
misma distribución de probabilidad en todas ellas, bien para utilizarlas conjuntamente, bien
porque se trate de identificar diferencias entre las poblaciones de procedencia de las
distintas muestras. Las frecuencias observadas serán las de la tabla siguiente, en la que fi es
la frecuencia absoluta total del valor xi y t es el número total de observaciones
T = ∑ xi
i
El razonamiento en este caso es idéntico al anterior. Si las muestras son
homogéneas, se puede obtener una estima conjunta de la frecuencia de cada valor xi (Fi / T)
y el valor esperado de la frecuencia absoluta de xi en cada muestra se calcular como el
producto de dicha frecuencia por el tamaño de la muestra correspondiente.

Fi Fi .Cj
Eij = .nj =
T T

Así pues, las hipótesis de la prueba serán:


Hipótesis Nula: Las muestras son homogéneas La clasificación de las observaciones según
los valores de la variable es independiente de la clasificación en muestras.
Hipótesis Alternativa: Las muestras no son homogéneas. La clasificación de las
observaciones según los valores de la variable no es independiente de la clasificación en
muestras.
Obviamente, la prueba se realizar según la metodología habitual.
En este caso, a la prueba chi-cuadrado de contingencia se le suele llamar chi-
cuadrado de homogeneidad.

Ji-Cuadrado Como Prueba De Bondad De Ajuste.


También se puede usar el estadístico ji-cuadrado para evaluar cuán buena puede
resultar una distribución teórica, cuando pretende representar la distribución real de los
datos de una muestra determinada. A esto se le llama evaluar la bondad de un ajuste. Probar
la bondad de un ajuste es ver en qué medida se ajustan los datos observados a una
distribución teórica o esperada.
Tomemos como ejemplo la distribución esperada para los individuos de una
población que son clasificados según grupo sanguíneo. Según estudios realizados en
población, se espera que dicha distribución, en porcentajes, sea la siguiente:
Grup
Frecuencia esperada
o
AB 2,0%
A 30,5%
B 9,3%
0 58,2%

En una muestra de 150 dadores de sangre se encontró la siguiente distribución:


Grup
Frecuencia observada
o
AB 4
A 48
B 15
0 83

Las hipótesis del problema son:


H0: los datos se ajustan a la distribución teórica.
H1: los datos no se ajustan a la distribución teórica.

Siguiendo el esquema general de solución propuesto para las pruebas de hipótesis,


ahora corresponde elegir un nivel de significación elegimos entonces alfa=0,01. El
estadístico de prueba será ji-cuadrado, cuya fórmula es:

Debemos calcular las frecuencias esperadas en nuestro grupo. Si aplicamos los


porcentajes esperados a la muestra de 150 casos podemos obtener las siguientes frecuencias
esperadas (ei):

Grupo Frec. oi Frec. ei


AB 4 3,00
A 48 45,75
B 15 13,95
0 83 87,30
Total 150 150,00

Los grados de libertad de esta tabla se obtienen restando 1 al número de filas, en


este caso: gl=4-1=3
Recordemos que la fila del total no se considera para los grados de libertad.
Si ya tenemos las frecuencias observadas y esperadas, podemos proceder a evaluar la
diferencia entre ellas utilizando el estadístico ji-cuadrado. Si la diferencia entre frecuencias
observadas y esperadas es grande, significará que la hipótesis nula es falsa, o sea, esta
distribución no se ajusta a la distribución teórica y si, en cambio, resulta que la diferencia
entre frecuencias observadas y esperadas no es muy grande, significará que la hipótesis
nula es verdadera; por lo tanto, la distribución en la muestra se ajusta a la distribución
teórica y diremos que no hay significación estadística.
El valor del estadístico de prueba (x2) es una medida de la diferencia entre
frecuencias observadas y esperadas; por lo tanto, mientras mayor resulte, más fácil será
rechazar la hipótesis

Se calcula el estadístico de prueba con los datos del ejemplo

Se compara este valor con el valor de ji-cuadrado de la tabla


El valor de ji-cuadrado lo buscaremos con alfa=0,01 y 3 grados de libertad. Según
tabla, ese valor es 11,34.
Al comparar el valor del estadístico de prueba (0,73) con el valor de tabla (11,34),
vemos que 0,73 se encuentra a la izquierda de 11,34 desplazado hacia el centro de la curva
y que, por lo tanto, la probabilidad de valores mayores a él es muy superior al nivel de
significación alfa=0,01.
Conclusión.
Dado que la probabilidad de  es mayor que alfa, se acepta la hipótesis
nula. Esto significa que los datos observados se ajustan a la distribución teórica, por lo
tanto las diferencias observadas no son estadísticamente significativas

INTERPRETAR EL CONTRASTE DE HIPÓTESIS PARA LA VARIANZA


POBLACIONAL.
Cuando se contrasta la hipótesis de igualdad de medias de dos poblaciones o cuando
se realiza un análisis de la varianza (ANOVA) es fundamental decidir si puede aceptarse
que las muestras independientes provienen de poblaciones con la misma varianza. Este
problema se resuelve a partir del análisis exploratorio que proporciona los diagramas de
caja y el estadístico del contraste de Levene.
Si la altura de las 'cajas' y los 'bigotes' correspondientes a los diagramas de caja de
cada una de las muestras son aproximadamente iguales, se tiene un indicio de que
posiblemente las muestras provienen de poblaciones con igual varianza.
Como complemento numérico al gráfico se realiza la prueba de Levene que calcula
un estadístico que mide la diferencia entre las varianzas y la probabilidad de haberla
obtenido al azar bajo el supuesto de que las varianzas poblacionales de los grupos sean
iguales. Las hipótesis del contraste son:
La secuencia es:
Analizar
Estadísticos Descriptivos
Explorar
En el cuadro de diálogo se indica la variable de interés 'Dependiente' y la variable
que define los grupos 'Factores'. En Gráficos se debe activar la opción Estimación de
potencia.
El contraste de Levene se realiza por defecto cuando se contrasta la diferencia de
dos o más medias.
ENUNCIAR LA DISTRIBUCIÓN F Y SUS CARACTERÍSTICAS.
La distribución F o distribución de Fisher-Snedecor es la que se usa para comparar
las varianzas de dos poblaciones diferentes o independientes, cada una de las cuales sigue
una distribución normal.
La distribución que sigue la varianza de un conjunto de muestras de una sola población
normal es la distribución ji-cuadrada (Χ2) de grado n-1, si cada una de las muestras del
conjunto tiene n elementos.
Para comparar las varianzas de dos poblaciones diferentes, es necesario definir un
estadístico, es decir una variable aleatoria auxiliar que permita discernir si ambas
poblaciones tienen o no igual varianza.
Dicha variable auxiliar puede ser directamente el cociente de las varianzas muéstrales de
cada población, en cuyo caso, si dicho cociente es cercano a la unidad, se tiene evidencia
que ambas poblaciones tienen varianzas semejantes.
Características De La Distribución F:
 F tiene valores no negativos; es igual a cero o positiva.
 F es asimétrica, está sesgada a la derecha.
 Existen muchas distribuciones F, de manera semejante a las distribuciones t.
 Existe una distribución para cada par de grados de libertad gl1 (grados de libertad del
numerador) y gl2. (Grados de libertad del denominador).

EJERCICIOS.
1. Un sociólogo ha pronosticado, que en una determinada ciudad, el nivel de
abstención en las próximas elecciones será del 40% como mínimo. Se elige al azar una
muestra aleatoria de 200 individuos, con derecho a voto, 75 de los cuales estarían
dispuestos a votar. Determinar con un nivel de significación del 1%, si se puede admitir
el pronóstico.
Enunciamos las hipótesis nula y alternativa:
H0: μ ≥ 0.40      La abstención será como mínimo del 40%.
H1: μ < 0.40     La abstención será como máximo del 40%;
Zona de aceptación
Para α = 0.01, le corresponde un valor crítico: zα = 2.33.
Determinamos el intervalo de confianza para la media:

Verificación

Decisión
Aceptamos la hipótesis nula H0. Podemos afirmar, con un nivel de significación del 1%.

2. Un informe indica que el precio medio del billete de avión entre Canarias y Madrid
es, como máximo, de 120 € con una desviación típica de 40 €. Se toma una muestra de
100 viajeros y se obtiene que la media de los precios de sus billetes es de 128 €.
¿Se puede aceptar, con un nivel de significación igual a 0.1, la afirmación de partida?
Enunciamos las hipótesis nula y alternativa:
H0: μ ≤ 120
H1: μ > 120
Zona de aceptación
Para α = 0.1, le corresponde un valor crítico: zα = 1.28.
Determinamos el intervalo de confianza:

Verificación
Valor obtenido de la media de la muestra: 128 €.
Decisión
No aceptamos la hipótesis nula H0. Con un nivel de significación del 10%.

3. Se sabe que la desviación típica de las notas de cierto examen de Matemáticas es


2.4. Para una muestra de 36 estudiantes se obtuvo una nota media de 5.6. ¿Sirven estos
datos para confirmar la hipótesis de que la nota media del examen fue de 6, con un nivel
de confianza del 95%?
Enunciamos las hipótesis nula y alternativa:
H0: μ = 6      La nota media no ha variado.
H1: μ ≠ 6       La nota media ha variado.
Zona de aceptación
Para α = 0.05, le corresponde un valor crítico: zα/2 = 1.96.
Determinamos el intervalo de confianza para la media.
La fórmula que aplicamos es:
Estimación puntual (Valor critico) · (Error estándar)
Conocemos la estimación puntual: 6
Conocemos el valor crítico: 1.96
Averiguamos el Error Estándar. Su fórmula es:
Entonces tenemos

Verificación
Valor obtenido de la media de la muestra: 5.6.
Decisión
Aceptamos la hipótesis nula H0, con un nivel de significación del 5%.

4. Un fabricante de lámparas eléctricas está ensayando un nuevo método de


producción que se considerará aceptable si las lámparas obtenidas por este método dan
lugar a una población normal de duración media 2400 horas, con una desviación típica
igual a 300. Se toma una muestra de 100 lámparas producidas por este método y esta
muestra tiene una duración media de 2320 horas. ¿Se puede aceptar la hipótesis de
validez del nuevo proceso de fabricación con un riesgo igual o menor al 5%?
Enunciamos las hipótesis nula y alternativa:
H0: μ = 2400
H1: μ ≠2400
Zona de aceptación
Para α = 0.05, le corresponde un valor crítico: zα/2 = 1.96.
Determinamos el intervalo de confianza para la media:

Verificación
Valor obtenido de la media de la muestra: 2320.
Decisión
Rechazamos la hipótesis nula H0, con un nivel de significación del 5%.

5. Se ha comprobado que el tiempo de espera (en minutos) hasta ser atendido, en cierto
servicio de urgencias, sigue un modelo normal de probabilidad.
A partir de una muestra de  100  personas que fueron atendidas en dicho servicio, se ha
calculado un tiempo medio de espera de  14,25 minutos y una desviación típica de  2,5 
minutos.
¿Podríamos afirmar, con un nivel de significación del  5 %  que el tiempo medio de
espera, en este servicio de urgencias, no es de  15 minutos?
Se formula la hipótesis nula H0 y la hipótesis alternativa H1.
Hipótesis nula:              H0:    μ = 15
Hipótesis alternativa:      H1:    μ ≠ 15
Puesto que nuestra hipótesis nula está formulada en forma de igualdad, tenemos un
contraste bilateral.
Identificamos la distribución de probabilidad y el tamaño de la muestra.
Por el enunciado sabemos que la población sigue una distribución normal. Tomamos una
muestra de tamaño n = 100 con una media μ = 14,25 y desviación típica σ = 2,5. La
muestra se distribuye:

Construimos las regiones de aceptación y rechazo.


Construimos nuestra región de aceptación a partir de un nivel de significación  α = 0,05. 
Como es un contraste bilateral, emplearemos  zα/2:

 Calcular el estadístico de contraste y verificar la hipótesis.

Nuestro estadístico de contraste es el tiempo de media de espera en urgencias,  μ =


14,25.
En este caso,  14,25 ∉ (14,51; 15,49).
Nuestro estadístico de contraste no pertenece a la región de aceptación.
Interpretación de la decisión.
Como nuestro estadístico de contraste no pertenece a la región de aceptación,
rechazamos la hipótesis nula.
Por lo tanto, no podemos afirmar que el tiempo medio de espera sea de  15  minutos.
Hemos rechazado la hipótesis nula por no poder afirmar que el tiempo medio de espera
sea de  15  minutos, pero podemos estar equivocados. De ser así, estaríamos cometiendo
un error de tipo I.
Si la muestra seleccionada hubiera tenido un tiempo medio de espera de  14,52  minutos
(apenas 16 segundos más)  hubiéramos aceptado la hipótesis nula. En caso de
equivocación, estaríamos cometiendo un error de tipo II.

6. En una partida de Rol se lanza 200 veces un dado de cuatro caras obteniéndose
60veces el número 1, 45 veces el número 2, 38 veces el número 3 y 57 veces el número
4.Se puede aceptar, a un nivel de confianza del 95%, que estos resultados corresponden
aun dado homogéneo.
Solución:
1º La hipótesis nula será que el dado es homogéneo, esto implica que la distribución
delos números es uniforme, es decir que los cuatro números tienen una probabilidad
desaparecer de 0,25.
2º La hipótesis alternativa será que la distribución no es uniforme.
3º Como la variable es discreta utilizaremos el test Ji-cuadrado de bondad de ajuste a
una distribución.
4º En la tabla siguiente se han realizado todos los cálculos necesarios, obteniéndose el
valor 4,36 para el estadístico de contraste
xi ni pi Npi ni-npi (ni- (ni-
npi)2 npi)2/npi
1 60 0,2 50 10 100 2
5
2 45 0,2 50 -5 25 0,5
5
3 38 0,2 50 -12 144 2,88
5
4 57 0,2 50 7 49 0,98
5
20 4,36
0

5º Como el estadístico tenía 4 sumandos, buscamos en las tablas de la Ji-cuadrado con


3grados de libertad el valor que deja por debajo una probabilidad de 0,95 y obtenemos
que el valor crítico sea 7,81.
6º Como el valor del estadístico es inferior al valor crítico, aceptamos la hipótesis nula.
7º Estos resultados son compatibles con el hecho de que el dado sea homogéneo.

7. En un grupo de enfermos que se quejaban de que no dormían se les dio somníferos


y placebos. Con los siguientes resultados. Nivel de significación: 0, 05.
¿Es lo mismo tomar somníferos o placebos para dormir bien o mal en este grupo de
enfermos?
Las hipótesis de este ejercicio, serían las siguientes:
Ho: No es lo mismo tomar somníferos o placebos para dormir mal o bien
H1: Es lo mismo tomar somníferos o placebos para dormir bien o mal.
Para la realización del problema se muestran los pasos a seguir, a continuación.
Paso 1: Completar la tabla de las frecuencias observadas.

Duermen bien Duermen mal total


somníferos 44 10 54
placebos 51 35 116
total 125 45 170

Paso 2: Calcular las frecuencias teóricas.


(Es importante caer en la cuenta de que la suma de las frecuencias observadas debe de
ser igual a la suma de las frecuencias teóricas).
Para este cálculo, tenemos que basarnos en la fórmula: (total  filas x total columnas) /
total
– ƒe 1 (Duermen bien con somníferos):

– ƒe 2 (Duermen bien con placebos):

– ƒe 3 (Duermen mal con somníferos):


– ƒe 4 (Duermen mal con placebos):

Como dijimos antes, la suma de las frecuencias observables debía de ser igual a la suma


de las frecuencias esperadas. En este caso podemos decir, que dicho pronóstico se
cumple:
– Suma frecuencias observadas = 170
– Suma de frecuencias esperadas: 39, 71 + 85, 29 + 14, 29 + 30, 71 = 170
Paso 3: Calcular los grados de libertad. En este caso, como son dos los criterios de
clasificación, el grado de libertad se calcularía así:
Grados de libertad = (nº de filas – 1) por (nº de columnas – 1)
Grados de libertad = (2 – 1)(2 – 1) = 1 x 1 = 1
Paso 4: Calcular el valor de chi cuadrado (usando para ello la fórmula escrita al principio
de esta entrada)

Paso 5: Ver la tabla.


En este apartado, buscamos en la tabla de la distribución X2  el valor que se compara con
el del resultado del chi cuadrado. Para ello, tenemos que tener en cuenta el nivel de
significación (0, 05) y el grado de libertad (1). La tabla que se utiliza,  se muestra en
seguida:
Observando la tabla, obtenemos pues que el valor que buscamos es 3, 84.
Paso 6: Comparar los valores.
– Valor calculado –> 2, 57
– Valor de la tabla –> 3, 84
Conclusión: como 2, 57 < 3, 84 ——–> ACEPTAMOS H0 y rechazamos H1. Podemos
decir que la diferencia no es estadísticamente significativa y que se debe al azar. Es
decir, no es lo mismo usar somníferos o placebos para dormir bien o mal en este grupo
de enfermos.
8. Considere dos muestras de poblaciones que tienen la misma varianza poblacional.
Si la muestra 1 tiene tamaño n1 = 5 y la muestra 2 tiene tamaño n2 = 10, determine la
probabilidad teórica que el cociente de sus varianzas respectivas sea menor o igual a 2.
Solución
Debe recordarse que el estadístico F se define como:

Pero se nos dice que las varianzas poblacionales son iguales, por lo que para este
ejercicio se aplica:

Como se desea saber la probabilidad teórica de que este cociente de varianzas muestrales
sea menor o igual a 2, necesitamos conocer el área bajo la distribución F entre 0 y 2, el
cual puede obtenerse por tablas o software. Para esto ha de tenerse en cuenta que la
distribución F requerida tiene d1 = n1 – 1 = 5 – 1 = 4 y d2 = n2 – 1 = 10 – 1 = 9, es decir
la distribución F con grados de libertad (4, 9).
Mediante el uso de la herramienta estadística de geogebra se determinó que esta área es
0.82, por lo que se concluye que la probabilidad que el cociente de varianzas muéstrales
sea menor o igual a 2 es del 82%.
9. Se tienen dos procesos de manufactura de láminas delgadas. La variabilidad del
espesor debe ser lo menor posible. Se toman 21 muestras de cada proceso. La muestra
del proceso A tiene una desviación estándar de 1,96 micras, mientras que la del proceso
B tiene desviación estándar de 2,13 micras. ¿Cuál de los procesos tiene menor
variabilidad? Utilizar un nivel de rechazo del 5%.
Solución
Los datos son los siguientes: Sb = 2,13 con nb = 21; Sa = 1,96 con na = 21. Esto
significa que ha de trabajarse con una distribución F de (20, 20) grados de libertad.
La hipótesis nula implica que la varianza poblacional de ambos procesos es idéntica, es
decir σa^2 /  σb^2 = 1. La hipótesis alternativa implicaría varianzas poblacionales
diferentes.
Entonces, bajo la suposición de varianzas poblacionales idénticas, se define el
estadístico F calculado como: Fc = (Sb/Sa)^2.
Como el nivel de rechazo se ha tomado como α= 0,05, entonces α/2= 0,025
La distribución F(0.025; 20,20) = 0,406, mientras que F(0.975; 20,20) = 2,46.
Por lo tanto, la hipótesis nula será cierta si el F calculado cumple: 0,406≤Fc≤2,46. De lo
contrario se rechaza la hipótesis nula.
Como Fc=(2,13/1,96)^2 = 1,18 se concluye que el estadístico Fc está en el rango de
aceptación de la hipótesis nula con una certeza del 95%. En otras palabras con una
certeza del 95% ambos procesos de manufactura tienen la misma varianza poblacional.
10. Para la variable Coste de la encuesta Enctran.sav contrastar si existe diferencia
significativa entre las varianzas del coste en transporte de los alumnos que viven en
Barcelona y de los que viven fuera.
En el ejemplo 3 del epígrafe Diferencia de medidas poblacionales se trataba de verificar
si existía una diferencia significativa entre el coste esperado en transporte de los
alumnos que viven en Barcelona y el de los que viven fuera. En este caso es fundamental
probar si las varianzas de ambos grupos pueden considerarse o no iguales, ya que de este
supuesto depende que se deba escoger uno u otro de los dos estadísticos de prueba que
aparecen en el cuadro de resultados del contraste.
Los resultados que se obtuvieron fueron los siguientes:

Como puede verse, bajo la hipótesis nula de varianzas iguales el estadístico de Levene
(F) toma el valor 37,671. Este valor es suficientemente grande como para rechazar la
hipótesis nula para cualquier nivel de significación. Si se observan los correspondientes
diagramas de caja:

Se ve claramente que la variabilidad del coste en el grupo de los residentes en Barcelona


es menor que en el de los no residentes.
11. Con referencia a la encuesta Enctrans.sav se quiere comprobar si la distribución del
Peso es o no más homogénea (presenta menor varianza) en el grupo de las mujeres que
en el de los hombres.
Las hipótesis que se quieren contrastar son:
La secuencia es Analizar > Estadísticos Descriptivos > Explorar.
Una vez seleccionadas las variables (Dependiente: Peso y Factor: Género) con el botón
Gráficos se abre el cuadro de diálogo correspondiente en el cual se activa la opción
Estimación de potencia.
En el cuadro Descriptivos que aparece en el visor de resultados se observa que la
varianza correspondiente al grupo de mujeres es 76,368 y la de los hombres es 97,613.
El contraste de Levene permite decidir si esta diferencia puede considerarse significativa
o bien es debida únicamente al azar del muestreo.

El diagrama de caja (Box-Plot) pone de manifiesto que el recorrido del 50% de las
observaciones centrales de la variable peso en el grupo de mujeres es algo mayor que en
el grupo de hombres; pero, por otra parte, en este segundo grupo hay 4 casos outliers o
extremos que si se tienen en cuenta determinan un recorrido total de la distribución
mayor en este grupo. En consecuencia, esta primera aproximación gráfica, no permite
llegar a ninguna conclusión.

El estadístico F de la prueba de Levene (basándose en la media como valor central) es


igual a 0,214, que a una cola presenta un nivel de significación crítico igual a 0,644. esto
significa que no puede rechazarse la hipótesis nula para los niveles de significación
habituales y, por lo tanto, concluimos que la diferencia de varianzas muéstrales no es
significativa.
BIBLIOGRAFÍA
https://economipedia.com/definiciones/contraste-de-hipotesis.html
https://support.minitab.com/es-mx/minitab/18/help-and-how-to/statistics/power-and-
sample-size/supporting-topics/what-is-power/
http://www.es.wikipedia.org/wiki/Estadística/ Prueba_de_χ² - 20k.

https://support.minitab.com
https://files.sld.cu/prevemi/files/2018/02/Prueba-Ji-cuadrado-de-Independencia.-
Ejemplo.pdf
https://www.medwave.cl/link.cgi/Medwave/Series/MBE04/5266
https://www.lifeder.com/distribucion-f/

También podría gustarte