Estadística II - Capítulo 4
Estadística II - Capítulo 4
Objetivos
1. Introducción.
2. Procedimiento para la prueba de hipótesis; pruebas de una y dos colas.
3. Errores de la prueba de hipótesis.
4. Pruebas de hipótesis para la media poblacional
4.1. Varianza poblacional conocida, poblaciones normales o
muestra mayores que 30 (cualquier distribución
poblacional).
4.2. Varianza poblacional desconocida, poblaciones
normales y no normales.
5. Función de potencia. Curva OC.
6. Pruebas de hipótesis para la proporción y varianza.
6.1. Pruebas de hipótesis referida al parámetro proporción
poblacional.
6.2. Pruebas de hipótesis referida al parámetro varianza poblacional 2.
121
1. INTRODUCCIÓN
Una hipótesis estadística es un enunciado provisional con respecto a una situación del mundo real,
generalmente expresada a través de relaciones particulares de ciertas variables en estudio.
Este método de inferencia consiste en un proceso mediante el cual un investigador formula una
hipótesis sobre un aspecto de la población y debe decidir entre dos cursos de acción a seguir derivados
de esa afirmación. Para decidir por uno de esos cursos de acción, deberá seleccionar una muestra
aleatoria que contendrá información respecto de la variable relacionada a la afirmación. Habrá además
una medida resumen de la variable en la muestra llamada estadístico que se constituirá en el elemento
de decisión en base al cual el investigador deberá decidir si rechaza la afirmación inicial en virtud de lo
importante que resultó la evidencia de la muestra, o bien mantendrá la afirmación inicial, si la muestra
no ha generado evidencia que permita rechazar.
Ejemplos:
1. El contador de una empresa afirma basándose en los registros contables, que el importe
promedio por cuentas pendiente de cobro no es superior a $ 287000. El auditor deberá tomar
una muestra aleatoria de cuentas de la empresa para contrastar esa afirmación del contador,
obtendrá un valor promedio por cuentas pendientes de cobro en la muestra que le permitirá
rechazar o no lo que dice el contador.
De esta forma el resultado de la muestra aleatoria se utilizará para decidir sobre la veracidad de la
afirmación que permanece inalterable hasta que se pruebe lo contrario.
Ahora bien, determinar la importancia o relevancia de la evidencia muestral para rechazar la afirmación
inicial, depende de los resultados del procedimiento de inferencia que se desarrollará a continuación
y se basa en la teoría de probabilidad.
122
2. PROCEDIMIENTO DE PRUEBA DE HIPÓTESIS. CONCEPTOS Y ETAPAS.
Los actores de un juicio pueden resumirse en un acusado, un fiscal y un juez que es quien debe tomar la
decisión de declarar o no culpable al acusado.
El acusado será considerado inocente hasta tanto las pruebas presentadas por el fiscal demuestren lo
contrario.
El procedimiento de prueba de hipótesis comienza con el supuesto que hace el investigador respecto al
valor de un parámetro en la población, por ejemplo: la media: µ; la proporción de éxitos: P o la varianza:
σ2, entre otros, que constituye la afirmación inicial que llamaremos hipótesis nula, que se mantendrá
hasta que no tengamos evidencia para rechazarla. Por ello, en el caso de la acusación por un delito, la
hipótesis nula es la que considera que el acusado es inocente.
Una hipótesis nula es un supuesto acerca de uno o más parámetros
u otras características de la población, que puede ser rechazado o
no en base a la evidencia muestral.
En general, la hipótesis nula no se “acepta” sino que “se rechaza” o “no se rechaza”. Su rechazo implica
la “aceptación” de la alternativa (en el caso del juicio, el rechazo de la inocencia implica aceptación de
la culpabilidad, en el caso del contador, el rechazo del valor promedio de los registros, implica que el
valor promedio de las cuentas pendientes de cobro es mayor al de los registros). Es por ello que suele
colocarse como hipótesis nula, la situación que el investigador piensa será rechazada.
Una hipótesis se denomina nula en el sentido que se supone que no existe una diferencia importante
entre el verdadero valor del parámetro de la población y el valor del parámetro especificado en la
hipótesis nula (supuesto de inocencia, tasa de deserción inferior a un valor estable). En la hipótesis nula
123
se expresa un valor particular, de referencia, del parámetro. Cuando se tienen dos o más poblaciones,
suele establecer la igualdad de los parámetros que se quieren comparar.
En el ejemplo 1, del contador, la hipótesis nula indicaría, que el valor promedio de las cuantas pendientes
de cobro es a lo sumo $ 287000. Entonces la hipótesis nula es:
H0: µ ≤ 287000
En el ejemplo 2, acerca de la deserción escolar la hipótesis nula establecida sería que la proporción de
alumnos que desertaron en las escuelas públicas es igual a una cifra que suponemos en base a registros
previos por ejemplo 0,25.
H0: P = 0,25
Si la hipótesis nula es falsa, deberá existir otra hipótesis que sea verdadera. Esta hipótesis recibe el nombre
de hipótesis alternativa.
H1: P ≠ 0,25
Ejemplo 3: Supongamos que se cree que no más del 50% de los consumidores prefiere una marca de
celular en particular. Para ver si la hipótesis es verdadera o no, se decide indagar sobre el tema. Se
seleccionan aleatoriamente 200 consumidores y 120 están de acuerdo en preferir esa marca. Si resulta
poco probable que menos del 50% prefiere la marca, entonces, se puede concluir que más del 50% de
todos los consumidores están a favor de la marca mencionada.
H0: P 0.50
Hasta aquí hemos resuelto el primer paso a seguir en el planteamiento de hipótesis, o sea, el
establecimiento de la hipótesis nula y de la hipótesis alternativa.
Recordemos que en general, la hipótesis alternativa es la que expresa lo que el investigador está
sospechando ocurrirá en los ejemplos, (el acusado será declarado culpable, el valor promedio de las
cuentas pendientes de cobro es superior a $ 287000, la proporción de estudiantes que han desertado
en las escuelas públicas es diferente a lo especificado).
Además, podemos observar que la hipótesis alternativa se expresa como opuesta a la hipótesis nula
orientándose en el sentido de lo que el investigador quiere comprobar con los datos observados de la
realidad.
Las pruebas de hipótesis estadísticas según como el investigador plantea estas hipótesis dan lugar a
pruebas de tres tipos:
a) Bilateral: cuando se plantea en la hipótesis nula un valor particular del parámetro, mientras que
en la hipótesis alternativa se plantea un conjunto de valores por debajo y por encima de ese
124
valor particular definido en la hipótesis nula.
b) Lateral derecha: cuando se plantea en la hipótesis nula un conjunto de valores menores o iguales
a un valor particular del parámetro, mientras que en la hipótesis alternativa se plantean los
valores mayores.
A modo de síntesis, podemos decir que la forma de expresar a la hipótesis alternativa es la que nos
indica si se trata de pruebas laterales derechas, o izquierdas o bilaterales.
En la siguiente figura se muestra, las diferentes situaciones de planteo de hipótesis para el caso
particular del parámetro µ.
Tipos de hipótesis
a) Hipótesis que especifiquen un valor o un intervalo de valores para algún parámetro de una
distribución poblacional.
d) Hipótesis que se refieran a relaciones existentes entre variables (por ejemplo, si son o no
independientes, si existe entre ellas una relación funcional, etc.).
125
En esta unidad estudiaremos las hipótesis de los tipos indicados en a). Las pruebas indicadas en b), c) y
d) se estudian en otras unidades; se trata de pruebas de comparación de parámetros, no paramétricas
o de regresión.
Para poder tomar una decisión con respecto a rechazar o no la hipótesis nula planteada, hay que
establecer ciertas reglas de decisión.
El criterio estadístico que permitirá especificar de manera objetiva, a partir de qué valor se tomará la
decisión de rechazar la hipótesis nula es conocido como criterio de discrepancia (se basa en cuanto
deberá ser la diferencia entre el resultado de la muestra y el parámetro, para que se rechace la hipótesis
nula).
Como consecuencia de este criterio de test adoptado se podrá establecer un valor crítico que
determinará una región de rechazo y una región de no rechazo de la hipótesis nula. El valor crítico
dependerá del estimador del parámetro objeto del test, y del estadístico de prueba cuya distribución
de probabilidad sea conocida en caso de cumplimiento de la hipótesis nula.
Sobre la distribución del estadístico, se establece, en función del sentido especificado para la prueba en
la hipótesis alternativa, una probabilidad llamada nivel de significación, simbolizada con la letra griega
α, que mide en términos de probabilidad la región de rechazo.
Por último, la decisión en relación a la hipótesis nula, se toma utilizando la información de la muestra
mediante la cual se calcula el valor observado del estadístico que actúa como elemento de decisión
conduciendo, a rechazar la hipótesis nula si el valor pertenece al área de rechazo o, en caso contrario,
no rechazar la hipótesis nula, si el valor pertenece al área de no rechazo.
DEFINIR LA
DISTRIBUCIÓ
DEFINIR EL N DE
DEFINIR UN ESTIMADOR DEFINIR EL
PROBABIIDAD
PARAMETRO PUNTUAL ESTADISTICO
DE LA DEL DE PRUEBA
POBLACIÓN PARÁMETRO
126
3. ERRORES DE LAS PRUEBAS DE HIPÓTESIS
Los errores que pueden cometerse son de dos tipos, en el caso del ejemplo 3, son:
- Rechazar la hipótesis nula cuando no es falsa, lo que implica establecer considerando el ejemplo
3, que la preferencia de los consumidores por esa marca de celular es significativa, cuando en
realidad ocurre lo contrario, situación que conduce a asignar a la marca un valor superior al que
efectivamente tiene. (En adelante lo llamaremos Error tipo I).
- No rechazar la hipótesis nula, cuando en realidad es falsa, por lo que consideraríamos que los
consumidores no prefieren esa marca, cuando efectivamente la prefieren y en este caso
estaríamos quitando valor a la marca. (En adelante lo llamaremos Error tipo II).
Es necesario que el investigador plantee la prueba de hipótesis previendo que las probabilidades de
cometer cualquiera de estos errores sean lo más bajas posibles.
El error de tipo I es aquel que se comete al rechazar una hipótesis nula cuando ella
es verdadera.
La probabilidad de cometer un error de tipo I se simboliza con la letra griega ; se conoce también
como nivel de significación de un test.
= P (rechazar H0 / H0 es verdadera)
El error de tipo II es aquel que se comete al no rechazar una hipótesis nula cuando en
realidad es falsa.
El siguiente cuadro resume todas las acciones que se pueden llevar a cabo en un procedimiento de
prueba de hipótesis, y cuáles serán sus consecuencias según la hipótesis nula sea verdadera o falsa:
127
DC: decisión correcta, EI: error tipo I, EII: Error tipo II
Nos ocuparemos en este punto de la prueba de hipótesis referida al parámetro media poblacional ().
El procedimiento a seguir es similar para todos los demás parámetros estudiados hasta ahora
(principalmente varianza poblacional 2 y proporción poblacional P). Las diferencias sólo se refieren a la
elección del estadístico de prueba bajo diferentes condiciones tales como distribución de la población,
conocimiento de varianzas, tamaños de muestra, etc. Tal como mencionáramos más arriba, los
estadísticos son muy parecidos a los utilizados en la Unidad 2 para estimación por intervalos de los
parámetros.
128
Veremos a continuación, los diferentes casos que pueden plantearse.
4.1 Varianza poblacional conocida, poblaciones normales o muestra mayores que 30 (cualquier
distribución poblacional)
La producción diaria de una planta agro industrial registrada durante 100 días tiene un promedio en la
muestra de 950 toneladas. En registros de la empresa se ha observado información que indica un
promedio diario de producción de 850 toneladas con una desviación estándar de 280 toneladas.
Con esta idea, la media en la población de la variable toneladas diarias producidas en la empresa es de
850 toneladas con una desviación estándar de 280 toneladas. Por otra parte, en la muestra de 100 días,
el promedio de toneladas diarias producidas es de 950, lo que implica una diferencia positiva de 100
toneladas entre los promedios considerados.
Conforme a lo observado:
Como estamos tratando de probar una hipótesis referida al parámetro media poblacional, utilizaremos
como estimador para tomar la decisión, a la media muestral (𝑿).
Ya hemos visto que la media muestral es un estimador insesgado, de mínima varianza y que tiende a la
129
distribución normal a medida que se incrementa el tamaño de la muestra.
En este caso particular se aplica un test de hipótesis lateral derecho tal como está expresada la hipótesis
alternativa, la hipótesis nula se rechazará cuando el estimador puntual 𝑥̅ tome valores mayores que
850. Cuanto más alejado esté de ese valor, con mayor razón vamos a rechazar la H0.
La región de rechazo de la hipótesis nula estará a la derecha de la distribución tal como se observa en
la siguiente figura:
Existirá un valor que denominaremos valor crítico y simbolizaremos con 𝑥̅ ∗ que separará la región de
rechazo de H0 de la región de no rechazo.
A continuación, calculamos el valor crítico que separará las zonas de rechazo y no rechazo de la hipótesis
nula.
Como estas zonas son áreas de la distribución normal, podemos estandarizar el valor critico 𝑥̅ ∗ que
establece el límite entre las dos zonas, de acuerdo con la probabilidad de cometer el error tipo I que se
ha fijado.
En el caso como el del ejemplo, que se trata de un test unilateral derecho, con las siguientes hipótesis:
Estandarizando el punto crítico, bajo el supuesto que la hipótesis nula es verdadera, se tiene:
𝑋∗ − µ
𝑧∗ = ∼ 𝑁(0,1)
𝜎/√𝑛
El valor z*, es el valor del cuantil de la distribución teórica, en este caso la normal, correspondiente al
130
área o probabilidad α de la región de rechazo.
De esta expresión se puede despejar el valor del estimador 𝑥̅ ∗ que separa las zonas de no rechazo
y rechazo de la hipótesis nula.
Conocido el valor crítico, se pueden establecer el siguiente criterio de decisión o del test:
Si 𝑥̅ ≥ 𝑥̅ ∗ , se rechaza H0
Si 𝑥̅ < 𝑥̅ ∗ , no se rechaza H0
Cuando se elige una determinada prueba para una hipótesis estadística, las reglas de decisión deben ser
formuladas de manera tal que indiquen claramente cuándo los datos experimentales son consistentes
con la hipótesis nula y cuándo no lo son.
En este caso particular, donde se está hablando de probar hipótesis con respecto al parámetro media
poblacional , las reglas de decisión deben señalar un rango de valores para 𝑥̅ para los cuales la decisión
sea rechazar H0.
En nuestro ejemplo,
Si el investigador decide aceptar equivocarse en no más del 5% de las veces al tomar una decisión de
rechazar la hipótesis nula cuando es cierta, α = 0.05.
Para determinar el valor crítico que separa las zonas de rechazo y no rechazo de H0 se debe encontrar
el valor del cuantil z que acumula el 0.95 de probabilidad. Ese valor de z es 1.645.
131
Conocido este valor crítico, se pueden establecer las siguientes reglas de decisión:
Si 𝑥̅ ≥ 896.06 se rechaza H 0
Como el valor de la media muestral, 𝑥̅ = 950 pertenece al área de rechazo de H0, se concluye que el
promedio de toneladas diarias producidas por la empresa es significativamente superior al valor
especificado en los registros de la empresa.
Considerando el valor de z, existe otra manera de determinar las zonas de rechazo y de no rechazo de
la hipótesis nula, trabajando sobre la distribución de probabilidad normal de la variable z. Por ejemplo,
se tiene el valor de z* = 1.645 como punto “crítico”. Si llamamos zo “observado” al valor estandarizado
de 𝑥̅ , las reglas de decisión serán:
Si zo > z* se rechaza H0
Si zo ≤ z* no se rechaza H0
El valor de z observado es: 3.57, pertenece a la región de rechazo dado que es mayor a 1.645 en
consecuencia se deberá rechazar la hipótesis nula
950 − 850
𝑧 = = 3.57
28
10
También es factible resolver el problema utilizando el valor p, que es la probabilidad asociada al valor
observado del estadístico de prueba tomando la decisión mediante la comparación de valor p con nivel
de significación α.
Esta prueba puede ser realizada con un software y para las decisiones en las pruebas de hipótesis, se
utiliza el valor de significación o “valor p”.
El valor “p” se define como la probabilidad de obtener una discrepancia mayor o igual que la observada
en la muestra cuando se cumple H0.
132
Esta medida de discrepancia, en general puede definirse como (siendo el valor del parámetro y 𝜃, el
valor del estimador puntual):
ˆ
di
ˆ
Es decir, se trata del cálculo del “valor observado” del estadístico de prueba para una muestra en
particular, y tiene una distribución de probabilidad conocida.
Si la prueba es unilateral se debe tener en cuenta si la dirección de la hipótesis nula es hacia la izquierda
o hacia la derecha de la distribución de probabilidad utilizada.
p = P (d 𝑑 / H0)
Este valor de p debe compararse con el que el investigador está dispuesto a aceptar. Si p es menor
que , entonces debemos rechazar la H0, de lo contrario no podemos rechazarla. Dicho de otro modo,
cuanto menor sea p, menor es la probabilidad de aparición de una discrepancia como la observada y
menor será la credibilidad de H0.
En el ejemplo que estamos desarrollando, como se trata de un estadístico con distribución normal, sería
posible calcular el valor exacto de p (“valor de significación”). Este es:
133
Ello significa que hay una probabilidad prácticamente nula de obtener una discrepancia como la
observada (o menor) si la H0 fuera verdadera, si la producción media diaria fuere de 850.
En la comparación de ambas probabilidades, para rechazar la H0, el valor p, debe ser inferior a la
probabilidad que define la región de rechazo (α), de lo contrario si fuere mayor o igual a el nivel de
significación (α), no se podrá rechazar H0
Aplicando el procedimiento.
134
Al llegar a la conclusión que la producción media de la empresa no es 850, el investigador puede efectuar
una estimación por intervalos para averiguar cuál es la verdadera producción media en la población.
280 280
μ = 950 − 1.96 ≤ μ ≤ 950 + 1.96 = 0.95
√100 √100
Realizando los cálculos, encontramos que el intervalo que va entre 895.12 y 1004.88 contiene el valor
promedio de la producción en la empresa agroindustrial, con un 95% de confianza.
El valor del promedio de producción diaria estimada es muy superior al planteado en la hipótesis nula
por lo que puede concluirse que la empresa produce diariamente más toneladas.
Si la población es normal, el estadístico adecuado para probar hipótesis acerca de la media poblacional
es:
𝑥̅ − 𝜇
𝑡= ∼𝑡
𝑠/√𝑛
135
Si la población no es normal, ese estadístico no podría ser utilizado, ya que para aplicar un estadístico
con distribución t de Student, se requiere que la población sea normal. Pero, empíricamente puede
comprobarse que para muestras de tamaño 100 o mayor, si la población no es normal, la varianza es
un estimador consistente, por lo que puede usarse la distribución normal.
la población es normal, se utiliza el estadístico t para cualquier tamaño de muestra. Cuando los
grados de libertad son mayores a 120, por la aproximación de la t a la normal, las probabilidades
son prácticamente iguales entre ambas distribuciones.
la población no es normal, puede usarse el estadístico con distribución normal sólo si n > 100. De
lo contrario hay que recurrir a pruebas no paramétricas.
Actualmente, en la mayoría de las situaciones que el investigador debe enfrentar, resuelve los
problemas de pruebas de hipótesis con el auxilio de programas específicos de computación. Para que
Uds. se habitúen a la lectura de los resultados que proporcionan estos programas, desarrollamos un
problema donde se efectúa el test de hipótesis para la media utilizando un programa de computación
InfoStat.
Ejemplo 1
Los siguientes datos se refieren a salarios de 36 empleados de una fábrica seleccionados
aleatoriamente del archivo de empleados:
De acuerdo con informaciones del INDEC (Instituto Nacional de Estadística y Censos), el salario promedio
en la ciudad de Córdoba es de $490. ¿Se puede pensar que esta hipótesis es consistente con el salario
recibido por los empleados de esta fábrica?
136
donde se presenta el tamaño de la muestra n, la media muestral y la desviación estándar muestral.
En la siguiente salida, el valor de prueba es el valor establecido para el parámetro salario promedio
poblacional en la hipótesis nula, o sea 0. También se da el valor de t observado calculado como
X 609, 06 490
tO 4, 44
s/ n 26, 79
A continuación, se da el valor de significación exacto p = 0,0001. Este valor es inferior al 0,05. Como se
puede observar, la probabilidad de obtener un promedio en la muestra de $609 tiene una muy baja
probabilidad de ocurrir bajo el supuesto de hipótesis nula cierta, (0,0001 < 0.05). Por lo tanto, se decide
rechazar la hipótesis nula. Los empleados de esta fábrica ganan en promedio más que la media
establecida para toda la provincia de Córdoba.
Función de densidad
T Student(35): p(evento)=0,0500
0,40
0,30
Densidad
0,20
0,00
-5,15 -2,57 0,00 2,57 5,15
4,44
Variable
En la siguiente figura se observa un gráfico de probabilidad normal, (ya estudiado en Estadística I), por
medio del cual se puede visualizar si la distribución de la variable salarios es normal. Existen algunos
valores atípicos de salarios bajos, pero podemos ver que la distribución es bastante normal. Si la
distribución es normal, entonces podemos utilizar el estadístico t con cualquier tamaño de muestra
137
Esta “visualización” de la distribución de frecuencias, para saber si la población es o no es normal se
completa con un test de hipótesis denominado de normalidad y que se debe a Kolmogorov y Smirnov.
Este test pertenece a los denominados test no paramétricos que se estudiarán en la unidad 6.
La medida de discrepancia en este test es de 0.12 con un valor de significación p = 0.640. Como este
valor p es muy elevado, (mayor que cualquier α que tengamos en mente, existe una alta probabilidad
que esta medida de discrepancia ocurra cuando se cumple la hipótesis nula; por lo cual no la rechaza,
concluyendo que la distribución de los salarios en la población puede considerarse normal.
Para determinar el verdadero valor del salario promedio de empleados de esta fábrica se estimó el
mismo por medio de un intervalo de confianza: (utilizamos el valor z en lugar de t porque los grados de
libertad son mayores que 30; hay poca diferencia entre uno y otro, y además no se encuentran tabulados
todos los valores de t para más de 30 grados de libertad; también podría utilizarse algún t cercano a 35
grados de libertad).
[554,68; 663,44]
El intervalo encontrado contiene al verdadero valor del salario promedio de los empleados de esta
fábrica, con una confianza del 95%.
Ejemplo 2
138
Supongamos que el Departamento de Control de Calidad de una fábrica de televisores asegura que, de
acuerdo al plan implementado, los televisores no deben fallar hasta los tres años de uso.
El Departamento de Comercialización, con el objetivo de corroborar esta afirmación, lleva a cabo una
encuesta dirigida a compradores del producto con más de 3 años de antigüedad. Una de las preguntas
estaba referida a cuándo requirió por primera vez asistencia técnica por falla del aparato.
Las respuestas obtenidas (tiempo desde que compró el aparato hasta que registró la primera asistencia
técnica en años), en una muestra de 20 compradores, fueron las siguientes:
2.5 3.1 2.8 3.5 4.8 3.9 2.6 4.0 3.8 3.2
3.8 2.3 3.1 4.1 3.8 3.0 3.4 4.1 2.6 3.0
H0) µ 3 años
La varianza del tiempo transcurrido hasta la primera asistencia técnica fue s2 = 0.4327 y la
correspondiente desviación estándar muestral es de 0.66 años.
Como ocurre generalmente en la práctica, es imposible calcular la varianza del tiempo transcurrido entre
la compra del televisor y su primer pedido de asistencia en la población de televisores vendidos por la
empresa. Por este motivo, la única medida de variabilidad es la correspondiente a la muestra de 20
televisores.
También en este caso nos encontramos con el problema que, en lugar de aparecer la desviación estándar
poblacional , nos encontramos con su estimador muestral insesgado s. Como ya hemos visto, el
estadístico de prueba se distribuye como una t de Student con n – 1 grados de libertad.
En nuestro ejemplo, la hipótesis alternativa establecida determina una prueba lateral derecha por lo
cual la zona de rechazo de la hipótesis nula estará en la cola derecha de la distribución t de Student.
Gráficamente, tendremos:
139
El paso siguiente consiste en determinar un nivel de significación , que podría ser 0.05.
̅∗
Estableciendo el criterio de test como: 𝑡∗ = ~𝑡
√
En el ejemplo, se tiene una variable t con 19 grados de libertad cuyo valor crítico que acumula el 0.95
de probabilidad, es t*19;0.95 = 1.729.
̅ .
𝑡 = = , = 2.52
√ √
Con los datos de la muestra, tobs = 2.52, es mayor al valor t* =1.729 (valor de la distribución teórica para
el α dado), por lo que la decisión será rechazar la H 0.
También podemos considerar el valor p=0.0105 (probabilidad asociada al valor observado del estadístico
que generalmente es parte de la salida de computación para la prueba), en este caso inferior al valor de
α = 0.05, se deberá adoptar igual decisión, rechazar H0.
140
0,66
𝑥̅ ∗ = 3 + 1,729. = 3 + 0,26 = 3,26
√20
La media en la muestra de televisores fue de 3.37 años. Como este valor es superior a 3.26, se rechaza la
hipótesis nula.
El valor de la media muestral cae en la zona de rechazo de la hipótesis nula por lo cual llegamos a la
conclusión de que el tiempo promedio hasta que solicita asistencia técnica por primera vez, es superior a
3 años. Por ello, el Departamento de Comercialización podrá seguir publicitando la duración de los
productos de la fábrica.
Cuando se rechaza la hipótesis nula, se puede estar interesado en estimar el verdadero valor del
parámetro poblacional, en este caso : tiempo promedio hasta que se solicita asistencia técnica por
primera vez.
Para ello se efectúa una estimación por intervalos que, en este caso, será:
De acuerdo a la información proporcionada por la muestra, el tiempo promedio hasta que se requiere
asistencia técnica es un valor comprendido en este intervalo con un 90% de confianza. Si el valor del
parámetro media fuere de 3, el intervalo de confianza con esta muestra no lo abarca, a un nivel de
confianza de 0,90.
141
Con la información procesada, ¿puede considerar que la variable tiene distribución normal? ¿Qué
implicaría no cumplir con el requerimiento de normalidad de la variable en la población?
Los siguientes datos se refieren a la antigüedad (en años) y los salarios mensuales percibidos de una
muestra aleatoria de empleados de una empresa que tiene tres sedes:
Antigüedad Salario
40.00 585.00
35.00 2066.00
20.00 838.00
30.00 502.00
31.00 269.00
41.00 537.00
22.00 1279.00
10.00 470.00
14.00 475.00
20.00 568.00
39.00 549.00
14.00 541.00
20.00 739.00
33.00 1007.00
142
Verificamos el supuesto de normalidad mediante el test de Kolmogorov - Smirnov y el gráfico de
normalidad procesando con InfoStat.
Con la información procesada, ¿puede considerar que la variable tiene distribución normal? ¿Qué
implicaría no cumplir con el requerimiento de normalidad de la variable en la población?
Los siguientes datos se refieren a la antigüedad (en años) y los salarios mensuales percibidos de una
muestra aleatoria de empleados de una empresa que tiene tres sedes:
Antigüedad Salario
40.00 585.00
35.00 2066.00
20.00 838.00
30.00 502.00
31.00 269.00
41.00 537.00
22.00 1279.00
10.00 470.00
14.00 475.00
20.00 568.00
39.00 549.00
14.00 541.00
20.00 739.00
33.00 1007.00
39.00 857.00
143
En la salida de Infostat se describen las medidas resumen de las variables antigüedad y salario
El área de recursos humanos de la empresa sostiene que los trabajadores tienen una antigüedad
promedio de 25 años y que el salario promedio es de $500. Los datos de la muestra aleatoria de 15
empleados indican que la antigüedad es mayor y en relación al sueldo es diferente a lo especificado
por el área de recursos humanos. Al efecto se realizarán las pruebas de hipótesis para las dos variables
con el fin de observar si la evidencia muestral permite refutar la afirmación del área de recursos
humanos. Se trabajará con un nivel de significación del 0,05 en ambas pruebas.
Las hipótesis planteadas para el parámetro promedio de antigüedad son las siguientes:
En relación al supuesto de normalidad por el test de normalidad de Kolmogorov para una muestra (p =
0.87), también mayor que 0.05, por lo que no se rechaza la normalidad de la variable antigüedad.
144
ACTIVIDADES DE APRENDIZAJE
Actividad 1:
El gerente de un Banco local ha informado al Directorio que las últimas medidas económicas
implementadas, que restringen el retiro de fondos de los bancos, ha generado un movimiento mayor en
los cajeros automáticos. Hasta ahora sus clientes utilizaban los mismos a un promedio de 6 operaciones
mensuales. Seleccionando a 130 clientes de su base de datos se encontró:
Estadística descriptiva
N 130
𝑥̅ 8.68
Varianza 4.12
Error estándar de la media 0.18
Valor mínimo 4
Valor máximo 14
Mediana 9
Suma 1129
b) ¿Cuál es la verdadera cantidad promedio de extracciones mensuales que ahora realizan sus clientes?
Trabaje con (1-) = 0,99.
Actividad 2:
La Facultad de Ciencias Económicas viene afirmando que la duración de la carrera de Contador Público
es de 8.5 años con una desviación estándar de 2.6 años. Luego de haber implementado distintas medidas
a fin de mejorar este valor, decide evaluarlas. Para ello selecciona aleatoriamente 40 legajos de
egresados en la última colación encontrando los siguientes datos:
Duración
Media 7,007
Error típico 0,242
Mediana 6,940
Desviación estándar 1,534
Varianza de la muestra 2,352
Curtosis -0,622
Coeficiente de asimetría 0,391
Rango 5,990
Mínimo 4,480
Máximo 10,470
Suma 280,260
N 40,000
¿Puede la Facultad decir que las medidas implementadas han sido efectivas a un nivel de 10%?
145
Actividad 3
Los mosaicos producidos por una fábrica de la ciudad de Córdoba poseen una resistencia media a la
ruptura de 80 Kg. con una desviación estándar de 15 Kg. El gerente de producción propone un nuevo
método para fabricar los mosaicos, sosteniendo que el mismo aumenta la resistencia a la ruptura.
Para evaluar esta afirmación se someten a prueba de resistencia mosaicos fabricados con el nuevo
método, con el siguiente resultado:
Estadística descriptiva
Resumen Resistencia
N 32
Media 107,22
Var(n-1) 223,66
E.E. 2,64
Mín. 68,12
Máx. 131,30
Mediana 107,51
Actividad 4:
El Balance General de una S.A., que posee 200 deudores, arroja para el rubro Otros Créditos un total de $
3.500.000. El directorio contrata un auditor externo ya que considera que el saldo promedio de dicha
cuenta no es el que refleja la contabilidad. Se envían circulares a 49 deudores elegidos aleatoria- mente,
los cuales confirmaron adeudar un total de $ 870.000. Se conoce que la varianza poblacional es 300.000
pesos2. A un nivel del 5%, ¿es confiable la cifra que muestra el balance?
Actividad 5:
Un envasador de gaseosas dice que la cantidad promedio de bebida en sus botellas de 1 litro es de 1.08.
La Oficina de Defensa al Consumidor ha recibido numerosos reclamos de clientes que afirman que el
contenido es menor que 1 litro. Para poder responder a estas quejas, la Oficina Estatal decide llevar a
cabo una prueba de hipótesis. Explique el significado del error tipo I, eligiendo una de las siguientes
alternativas:
Actividad 6
Los hipermercados instalaron sistemas de auto pago para los clientes. La duda que surge es: ¿Con que
frecuencia lo utilizan? Al efecto se realizó un muestreo durante 20 días en el Hipermercado DC. Los datos
146
del relevamiento se detallan a continuación.
Se pide:
¿Es factible considerar que la cantidad de clientes que utilizan el servicio de auto pago, supera los
100 clientes diarios en este hipermercado? Aplique el procedimiento adecuado con un nivel de
significación de 0,05. Destaque hipótesis, estadístico y decisión. Fundamente si con los datos puede
verificar el cumplimento de los requisitos para aplicar el estadístico definido en la prueba.
Actividad 7
En 2016, la tarifa media para viajar en avión de Córdoba a Buenos Aires, fue de 1540 $, por
147
incorporación de un nuevo sistema de vuelos internos, se redujo el valor del vuelo mencionado,
Los valores promedio registrados en una muestra de una muestra aleatoria de tarifas de
diferentes empresas de transporte aéreo en el mes de marzo de 2017 arrojó los siguientes
resultados:
Datos:
1200 1380 1300 1280 1250 1110 1150 1300 1400 1380 1300 1280
Se pide:
Aplique el procedimiento adecuado para determinar si hay evidencia con la información de la muestra,
para considerar que efectivamente ha disminuido la tarifa de vuelo en la ruta Córdoba, Buenos Aires.
Utilice los datos procesados y un nivel de significación de 0,05. Destaque hipótesis, estadístico y
decisión. Fundamente si con los datos puede verificar el cumplimento de los requisitos para aplicar el
estadístico definido en la prueba.
Actividad 8
Una fábrica automotriz informa a su proveedor autopartista los valores necesarios en su proceso para la
fabricación de una determinada pieza de ensamble, en las siguientes dos características:
148
4 1,59 86 19 0,97 94
5 1,25 90 20 1,77 84
6 1,58 88 21 1,93 91
7 1,23 92 22 0,96 82
8 0,91 97 23 1 83
9 0,99 97 24 1,9 94
10 1,78 97 25 1,51 87
11 1,28 84 26 0,67 81
12 1,49 91 27 1,44 86
13 1,62 78 28 1,21 100
14 1,86 88 29 1,16 87
15 1,61 94 30 1,89 89
Actividad 9
Una panificadora está considerando establecer un servicio de reparto de facturas los domingos a la
mañana en un barrio. Considerando el costo del servicio y las utilidades que se pueden lograr ha llegado
a la siguiente conclusión: si hay pruebas de que el pedido promedio será de más de 6 facturas por casa
del barrio, se instalará el servicio. Un estudio realizado arroja la siguiente información (considere =
0,05):
Shapiro-Wilks (modificado)
149
Actividad 10
Una gran cadena de ferreterías vende, en promedio, 5 cortadoras de pasto por sucursal mensualmente.
Durante el último mes, implemento una oferta y el número de cortadoras vendidas en una muestra de
10 sucursales fue: 10, 6, 8, 5, 7, 8, 3, 7, 7, 9. Al nivel de significación del 5%, ¿se puede decir que la oferta
incrementó la venta promedio mensual?
Interprete los elementos de la siguiente tabla y compare con los resultados obtenidos por usted.
Actividad 11
Un fabricante de ropa produce 22500 m de tela por día. Cada día, 16 pedazos de 50 m. cada uno son
testeados para probar su resistencia a la rotura. En un día en particular se obtuvo una media de
resistencia de 340 Kg. con una varianza de 298. ¿Qué actitud deberá tomar el fabricante si la tela debe
tener una resistencia a la rotura de 350 Kg?? Trabaje con un nivel de significación del 5%.
150
Hemos visto que definir una prueba de hipótesis equivale a definir una medida de discrepancia (d), o
estadístico de prueba en cuya distribución de probabilidad se asignará un nivel de significación () que
definirá la medida de la región de rechazo de la hipótesis nula.
También se ha hablado de los distintos errores que se pueden cometer cuando se toma una decisión en
este procedimiento, los que detallamos como:
El error de tipo I es aquel que se comete al rechazar una hipótesis nula cuando ella es verdadera. Siendo
la probabilidad de cometer un error de tipo I, = P (rechazar H0 / H0 es verdadera).
El error de tipo II es aquel que se comete al no rechazar una hipótesis nula cuando en realidad es falsa.
Siendo la probabilidad de cometer un error de tipo II, = P (no rechazar H0 / H0 es falsa).
La elección de un criterio de test que defina reglas de decisión adecuadas a la hipótesis que queremos
probar, depende de la potencia que tenga la prueba para detectar cuando rechazar o no una hipótesis
nula. En otras palabras, se debe buscar una prueba que sepa discriminar correctamente cuando las
diferencias entre los valores muestrales realmente observados por el investigador y el valor verdadero
que toma el parámetro a ser probado se deban solamente al azar (no se rechaza H0) y cuando la
discrepancia es tan grande que la evidencia muestral no pueda sostener al valor que toma el parámetro
en la hipótesis nula (se rechaza H0).
Esto se resume diciendo que se debe buscar la prueba más potente. Para ello pasamos a definir lo que
se entiende por potencia de una prueba estadística.
De acuerdo a la definición anterior, la potencia de una prueba de hipótesis es igual a 1 - , o sea, uno
menos la probabilidad de cometer un error de tipo II. Si el error de tipo II consiste en “no rechazar la
hipótesis nula cuando es falsa”, la potencia es “rechazar la hipótesis nula cuando es falsa” (o lo que es
igual, cuando es verdadera la alternativa).
Pero si bien la hipótesis nula puede identificarse con un valor exacto o una situación exacta siempre
tiene el signo igual, aunque sea unilateral; o si se trata por ejemplo de una prueba de normalidad, la
hipótesis nula establece “la distribución de la población es normal”; en cambio la alternativa señala un
conjunto infinito de valores o de situaciones: el parámetro es “mayor que…” o “distinto a…” o “la
distribución de la población no es normal”, etc.
Para cada uno de los posibles valores que puede tomar el parámetro en la hipótesis alternativa es posible
calcular la probabilidad de rechazar la hipótesis nula, esto es, calcular la potencia correspondiente a ese
valor.
Y ocurre que, para valores de la alternativa cercanos a la hipótesis nula, la distribución de probabilidad
será muy parecida (superpuesta), y resultará difícil rechazar la hipótesis nula; la potencia de un test para
valores de la alternativa cercanos a la hipótesis nula es baja, y aumente cuando la alternativa se aleja
de la hipótesis nula. Así como se puede calcular la función de potencia, también se puede calcular su
complemento, que es la probabilidad de cometer el error de tipo II (b); la función que se origina en este
caso, se llama “Curva CO” (significa curva operativa, terminología utilizada en algunos métodos de
control de calidad).
En lo que sigue estudiaremos cómo se calcula la potencia y la probabilidad de error tipo II para valores
particulares de la alternativa, y cómo se construyen las curvas de potencia y CO, pero sólo lo haremos
para el caso de un estadístico con distribución normal en pruebas sobre la media con varianza conocida,
151
en los demás casos el procedimiento será igual, utilizando la distribución del estadístico de prueba
correspondiente.
Ejemplo
Supongamos que se han establecido las siguientes hipótesis con respecto al parámetro poblacional m:
Además, que se conoce que la desviación estándar poblacional (puede ser por algún trabajo realizado
anteriormente) es = 2; se toma una muestra de n = 16 elementos. Además, supongamos que la variable
x se distribuye normalmente en la población.
Como se trata de una prueba unilateral derecha, la medida el estadístico de prueba es:
𝑥̅ − 5
𝑧=
2/√16
Bajo supuesto de hipótesis nula verdadera, z tiene una distribución de probabilidad conocida que es la
N(0,1). Si se toma para la probabilidad a el valor 0.05, el valor de z* tal que P (z > z* / H0) es 1.645, mientras
que 𝑥̅ ∗ es 5.822 y las regiones de no rechazo o rechazo de la hipótesis nula serán:
Calculamos ahora la probabilidad de cometer el error de tipo II con esta prueba cuando 1 = 6, lo que
implica no rechazar H0, cuando la media no es igual a 5, sino igual a 6.
Las probabilidades se obtuvieron mediante la función probabilidades y cuantiles del software Infostat.
152
Gráficamente, se tiene:
5,82
25
5,82
25
Puede observarse en el gráfico que, si disminuyera , aumentaría . ¿Cómo podríamos disminuir las
probabilidades de ambos tipos de errores a la vez? Si aumentáramos el tamaño de la muestra, se
reduciría el error estándar de la distribución de la media muestral, y entonces podríamos reducir tanto
como . Esta es la única manera de reducir ambos errores a la vez; con un tamaño de muestra fijo,
cuando disminuye b aumenta a y viceversa.
153
En general, la potencia para una prueba lateral derecha, se puede escribir como:
1– β = P(𝑥̅ > 𝑥̅ ∗ /𝑥̅ ∼ N( ; ))
Si quisiéremos construir la curva CO, se procedería de igual manera, pero calculando para cada valor
de .
La primera de las distribuciones normales considera que la hipótesis nula es verdadera; por ello el
estadístico 𝑥̅ se distribuye alrededor de = 0. En cambio, la segunda distribución normal supone que
la hipótesis alternativa es la verdadera y que 𝑥̅ varia alrededor de 1 siendo 1 un valor posible entre los
infinitos valores de que establece la hipótesis alternativa.
Dijimos que el error tipo II consiste en no rechazar la hipótesis nula cuando es falsa, por lo cual estará
representado por la parte sombreada correspondiente a la aceptación de H0 pero bajo la curva normal
dada por la hipótesis alternativa. La potencia 1 - está representada en el área de rechazo de la
distribución bajo la hipótesis nula, pero considerando también que se cumple la hipótesis alternativa, o
sea bajo la segunda distribución con media m 1.
Supongamos que se desea saber si ha variado el valor de la canasta familiar mínima calculada en base a
una familia tipo en la Argentina en el rubro Alimentación luego de haber transcurrido un tiempo desde
la devaluación. A principios del año 2001, su cálculo era de $ 400 con una desviación estándar de $ 50.
Como existen opiniones divergentes sobre si ha aumentado o disminuido, se decide tomar una muestra
al azar de 100 familias para probar las siguientes hipótesis:
154
Rechazar H0 , si H0 es cierta, cuya probabilidad se refleja por α, probabilidad de cometer el error tipo I
La probabilidad α, (Probabilidad de cometer el error tipo I), se establece a priori como parte del
procedimiento de prueba, siendo la medida probabilística mediante la cual el investigador indicará a
partir de que valor de la variable (punto crítico) considera conveniente rechazar la H0 con la muestra
disponible. Ese valor crítico del estimador puntual del parámetro, permite definir el área de rechazo y
no rechazo, necesaria para el cálculo de las probabilidades y su complemento.
Por otra parte, la probabilidad se calculará una vez definido el valor de α, para cada valor alternativo
del parámetro, es decir situaciones en las que la H0 podría no ser cierta en virtud de que el parámetro
asume otro valor llamado alternativo.
Obviamente, para cada valor alternativo del parámetro, surge una nueva distribución de probabilidad
del el estimador del parámetro, y es allí donde se calcula la probabilidad (probabilidad de cometer el
error tipo II) y su complemento 1 - (Potencia de prueba, probabilidad de rechazar una H0, falsa),
manteniendo el área de rechazo y no rechazo establecido a partir del valor de α.
En el ejemplo, si establecemos dos valores alternativos del parámetro = 387,5 y = 412,5, los
cálculos serán:
En primer lugar, determinaremos el valor crítico que delimita la región de rechazo y no rechazo en la
distribución de la media muestral 𝑥̅ , que en el caso del ejemplo es la distribución de probabilidad
normal: 𝑥 ~N( = 400, = ), si α= 0,05 , siendo la prueba bilateral, entonces el área de rechazo se
distribuye a ambos lados de la media para dos valores de 𝑥̅ ∗ .
AR AR
𝑥̅ ∗ = 390,2 𝑥̅ ∗ = 409,80
155
Con estos valores críticos, quedan definidas las regiones de rechazo y no rechazo para el cálculo de las
probabilidades y su complemento 1- en las distribuciones que surgen de aplicar valores alternativos
al parámetro .
156
Gráficamente:
AR AR
157
Sugerimos a usted hacer los gráficos correspondientes a estos cálculos para los ejemplos siguientes.
Recuerde graficar una curva correspondiente a la hipótesis nula verdadera, con el o los puntos críticos
correspondientes; luego, debajo, y manteniendo la escala, dibuje otras curvas, una para cada uno de los
valores del parámetro según la hipótesis alternativa. Marque en estas curvas los puntos críticos
encontrados en la primera, y a partir de ello puede ubicar los valores de y 1- .
Vamos a calcular ahora la potencia cuando = 400, exactamente el valor que toma el parámetro en la
hipótesis nula (recordando que la potencia es la probabilidad de no rechazar la hipótesis nula cuando
esta es verdadera, antes de leer lo que sigue, le sugerimos que usted reflexiona acerca de cuál será el
valor de 1- en esta situación).
La potencia, calculada en el valor del parámetro dado por la hipótesis nula es exactamente igual a (
= 1 - ).
Observación importante: esta igualdad sólo ocurre en el punto correspondiente a la hipótesis nula: en
este punto, coinciden la potencia y .
Si seguimos calculando varios valores de la potencia para diferentes valores de , se puede construir la
siguiente tabla:
Hipótesis Potencia
H1 375.0 0.000 1.000
H1 382.5 0.062 0.938
H1 387.5 0.295 0.705
H1 392.5 0.677 0.323
H1 397.5 0.921 0.079
H0 400.0 1-=0.95 =0.05
H1 402.5 0.921 0.079
H1 407.5 0.677 0.323
H1 412.5 0.295 0.705
H1 417.5 0.062 0.938
H1 425.0 0.000 1.000
Probabiidad 1 -
1,20
1,00
0,80
0,60
0,40
0,20
0,00
360,00 380,00 400,00 420,00 440,00
158
Si se grafican los valores de b, la probabilidad de cometer el error de tipo II, tal como dijimos
anteriormente se obtiene una curva que se conoce con el nombre de curva operativa (CO).
Probabilidad
1,2
0,8
0,6
0,4
0,2
0
370,00 380,00 390,00 400,00 410,00 420,00 430,00
Si en el ejemplo de la canasta familiar, la opinión más fuerte hubiera sido que su costo había aumentado,
hubiéramos planteado las siguientes hipótesis:
H0) 400
Al emplear el procedimiento anterior para calcular la potencia de la prueba se obtendrían los siguientes
valores:
Hipótesis Potencia
H1 390 0,9999 0,0001
H0 400 1-=0,95 =0,050
H1 410 0,3617 0,6383
H1 412 0,2254 0,7746
H1 415 0,0879 0,9121
H1 420 0,0093 0,9907
Y la curva de potencia:
159
Al comparar esta curva con la de potencia correspondiente a la de la prueba bilateral, tendríamos:
A la inversa serían las curvas si la prueba fuera unilateral izquierda, como en el caso que la opinión
predominante se inclinara por una reducción del costo de la canasta.
Como se puede observar en el último gráfico, la curva de potencia correspondiente a la prueba unilateral
está por encima de la bilateral hacia el lado que indica la hipótesis alternativa, pero tiene a cero hacia el
otro lado. Se dice por ello que las pruebas unilaterales son “uniformemente más potentes” que las
bilaterales (en el caso de considerar que el tamaño de la muestra y el nivel de significación a se
160
mantienen constantes) considerando el sentido de la hipótesis alternativa; esto significa que es menos
probable cometer el error tipo II con una prueba unilateral. Por ello, cuando se tiene algún indicio de la
dirección que toma el parámetro en la hipótesis alternativa, es preferible trabajar con pruebas
unilaterales. No obstante, si existieran dudas acerca del sentido de la alternativa deberá plantearse una
prueba bilateral, porque de lo contrario se corre el riesgo de una potencia casi nula.
I. Calcular el punto crítico que delimita las regiones de rechazo y no rechazo, conforme al valor
asignado para α, la probabilidad de cometer el error tipo I.
II. Calcular la probabilidad del área correspondiente en la nueva distribución del estimador
puntual que surge al asignar valores alternativos para el parámetro bajo supuesto de hipótesis
nula falsa, conforme al punto crítico.
ACTIVIDADES DE APRENDIZAJE
Actividad 12
161
Actividad 13
a) Determinar el valor del valor promedio por vuelo en la ruta Córdoba, Buenos Aires, a partir del
cual se rechaza la hipótesis nula de que el promedio del costo de vuelo, es igual a $ 1540.
b) Calcular la probabilidad de considerar válida la hipótesis nula, cuando el verdadero valor del
parámetro es $ 1480. Indicar el nombre de esa probabilidad.
c) Calcule la función potencia si los valores alternativos del parámetro fueren, $1520, $1530 , $1535
y $1538.
Actividad 14
Los cerámicos producidos por una fábrica poseen una resistencia media a la ruptura de 80 Kg. con una
desviación estándar de 15 Kg. Se pretende aplicar un nuevo proceso de fabricación y que el mismo no
haga variar la resistencia media. Para ello se toman 64 cerámicos fabricados por este nuevo proceso.
Obtenga los valores de la Función de Potencia y de la Curva OC para = 70; 75; 80 y 85 ( = 0,01). Explique
162
qué significan las curvas y sus valores particulares.
Veamos un ejemplo: De acuerdo a trabajos de marketing ya realizados, se piensa que no más del 30% de
las personas que habitualmente salen a comer a restaurantes (habitualmente se entenderá por lo menos
una vez a la semana), eligen el comercio en función del precio de los servicios ofrecidos.
Un grupo inversor desea montar una cadena de restaurantes utilizando la calidad de los alimentos
ofrecidos como publicidad para penetrar en el mercado.
Para asegurarse que el precio no será un factor fundamental en la decisión de por lo menos el 70% de los
potenciales clientes, encarga a una empresa de encuestas de opinión, investigar sobre el tema.
La empresa decide tomar una muestra aleatoria de 400 personas que ingresan a restaurantes
cuidadosamente seleccionados; una de las preguntas de la entrevista estaba referida a la importancia del
precio del servicio en la elección del local.
Luego de sistematizar la información obtenida en la muestra, se observó que el 38% de los encuestados
163
consideraba al precio como factor preponderante en la elección.
Se decide poner a prueba la hipótesis estadística de que la consideración del precio era un factor
preponderante más importante de lo que se creía (afectaba a más del 30% de las personas).
H0) P 0,30
Ya se ha dicho, al hablar de la estimación del parámetro proporción poblacional P, que cuando n (el
tamaño de la muestra) es grande, la variable aleatoria proporción muestral se distribuye normal.
𝑝̂ ∼Normal (P, )
√
El valor de P en la hipótesis nula, 𝑃 es igual a 0,30, este valor recordemos que es la esperanza de la
. . . .
variable aleatoria 𝑝̂ , la varianza será , igual a: = = 0.000525 y la = 0.023. La
estandarización de 𝑝̂ , será:
. .
𝑧= = = 3.48
. /√ . . . /√
Distribución de la
proporción muestral
𝑝̂ ~Normal (P, )
√
𝑝̂ ~Normal (0.,3, 0.023 )
RR
164
Distribución del
estadístico de prueba
𝑧 ~Normal (0, 1 )
RR
En este ejemplo, zobs, es 3.48, en consecuencia, se rechaza H0 y se concluye que el porcentaje de clientes
que eligen el restaurante por el pecio de los servicios ofrecidos es significativamente mayor al 30%, de
modo que, con un α de 0,05, el precio será un factor importante.
Regla de decisión:
Si valor p ≥ α, no se rechaza H0
165
Actividad 15
Los siguientes datos corresponden a información acerca de las exportaciones que realizan las empresas
alimenticias de la Provincia. Considerando la distribución de frecuencias de las exportaciones en miles de $,
en base a una muestra de 61 empresas ¿se puede decir que el porcentaje de empresas que exportan más de
$ 130 mil supera el 20%? Utilice = 0,10.
Actividad 16
La Universidad Nacional afirma que el 85% de los estudiantes está de acuerdo con el pago de una
contribución estudiantil mientras que el centro de Estudiantes de una Facultad del área de las Ciencias
Sociales afirma que el porcentaje es bastante menor y, para ello, ha consultado a 160 alumnos de varias
facultades obteniendo una cantidad de éxitos (a favor) de 126. ¿Puede usted ayudar a este Centro de
Estudiantes a justificar su opinión con un nivel de significación del 5%?
Actividad 17
Un fabricante de televisores anuncia que el 90 % de sus aparatos no necesita ninguna reparación durante
los dos primeros años de uso. La oficina de reparaciones informa que de 100 aparatos vendidos en los
últimos dos años ya van 14 que necesitaron alguna reparación. Al nivel de significación de 0,01, ¿se debe
166
rectificar el anuncio que realiza el fabricante?
Supongamos que un operador de bolsa, al aconsejar a un cliente con respecto a la inversión en una acción
en particular, destaca la poca variabilidad de su cotización. De acuerdo a lo estipulado por el operador
económico, esta acción presentaría una varianza de las cotizaciones diarias 2 = 0.2. El cliente, quien debe
realizar una fuerte inversión, y no estaría dispuesto a hacerla si la varianza es grande, decide poner a
prueba la hipótesis del operador, estableciendo las siguientes hipótesis estadísticas:
H0) 2 0,2
Para probar esta hipótesis, selecciona una muestra de 15 días donde registra la cotización diaria. El cálculo
de la varianza en su muestra es s2 = 0.4.
El cliente deberá buscar un criterio de test adecuado que relacione el parámetro y el estadístico muestral
y que a su vez tenga una distribución de probabilidad conocida para poder calcular el error de su
inferencia.
(𝑛 − 1)𝑠
𝜒 = ∼𝜒 ( )
𝜎
El valor observado del estadístico será el elemento de decisión que, comparado con el valor teórico,
167
llamado crítico que proviene de la distribución del estadístico, para el valor del nivel de significación α.
Si α es igual a 0.05, 𝜒 ∗
𝑐𝑜𝑛 14 𝑔𝑙, será: 23.68, delimitando la región de rechazo y no rechazo.
Si 𝜒 𝑜𝑏𝑠 > 𝜒 ∗
, se rechaza H0
Si 𝜒 𝑜𝑏𝑠 ≤ 𝜒 ∗
, no se rechaza H0
∗ .
El valor observado en el ejemplo es 𝜒 = .
= 28 ,dado que este valor es superior al valor
crítico 23.68, se rechaza H0.
La evidencia muestral parece indicar que el operador económico estaba equivocado y que en
realidad la cotización diaria de la acción en cuestión es bastante más variable de lo que él cree.
168
El valor p, en la prueba lateral derecha es la probabilidad a la derecha del valor observado del
estadístico (28). Como p = 0.014, que es inferior a α = 0 .05, se rechaza la H 0.
Actividad 18
Una hamburguesería del medio expende gaseosa en vasos a través de máquinas automáticas. La
variabilidad con que la máquina vierte la gaseosa es un elemento crítico para controlar ya que, si el
contenido del vaso fuera menor al informado se recibirían quejas de los clientes; mientras que si el
contenido es excesivo no se podría colocar la tapa con facilidad. Para los vasos de 250 cc. la varianza
máxima especificada para la máquina es de 225 cc2. Se analizó recientemente el contenido de una
muestra de vasos de 250 cc. y se encontró lo siguiente:
Estadística descriptiva
Resumen Resistencia
n 30
Media 250,88
Var(n-1) 223,57
E.E. 2,73
Mín. 216,53
Máx. 290,41
Mediana 249,60
Actividad 19
Un slogan muy común en las empresas es el siguiente: reducir la variabilidad. Por ejemplo, si se están
fabricando faros para una determinada marca de auto, es deseable que la capa de pintura de los
mismos tenga siempre el mismo espesor porque esta característica incide fundamentalmente en la
iluminación. La medida de variabilidad por excelencia es la varianza y en estudios realizados en la
fábrica la varianza del espesor ha sido de 3 mm.2. Como esta variabilidad fue estimada como excesiva
por el Departamento de Control de Calidad se tomaron medidas tendientes a su reducción tales como
seleccionar un proveedor de pintura de buena calidad, cuidar el lugar donde se guarda la pintura,
169
controlar la presión de los picos de la maquina usada para pintar, etc. Luego de dos meses en que se
implementaron todas estas acciones correctivas, se seleccionó una muestra de 50 faros y se obtuvo
una varianza en la muestra de 1.8 mm.2. Cree usted que las acciones han sido eficaces. Trabaje con
un nivel de significación de 0.01.
Actividad 20
Un asesor de empresas considera que para invertir en una acción determinada esta debe tener un
bajo riesgo. Para que sea considerada de bajo riesgo, la variabilidad de su cotización diaria no debe
tener una varianza igual a 5. Estudiando durante 30 días la cotización de esta acción, se obtuvo una
varianza en la muestra s2 = 6. Puede considerarse que invertir en esta acción es una inversión de bajo
riesgo. Concluya con un nivel de significación del 5%.
ACTIVIDADES DE INTEGRACIÓN
Actividad 21
Responda las siguientes aseveraciones con Verdadero o Falso, justificando en cada caso:
1. Cuando en una prueba de hipótesis rechazamos la hipótesis nula, sabemos que es falsa.
2. En algunos casos es posible rechazar la hipótesis nula al nivel de significación del 0,01 pero no al
nivel de 0,05.
3. En algunos casos es posible no rechazar la hipótesis nula al nivel de significación del 0,01 pero sí
al nivel de 0,03.
4. Si el valor p de la prueba es mayor que el nivel de significación que nos interesa, entonces
rechazamos la hipótesis nula.
5. Si conocemos el valor p de la prueba no es necesario comparar la estadística de prueba con el
valor crítico obtenido de una tabla.
6. Al efectuar la prueba correspondiente, si no rechazamos la hipótesis nula hemos demostrado
que es cierta.
7. Es posible rechazar la hipótesis nula al nivel de significación del 0,05 pero no al nivel de 0,02.
8. Con la estadística de prueba obtenemos un valor p = 0,025, entonces al nivel de significación de
0,03 rechazamos la hipótesis nula.
9. El valor de la estadística de prueba para la hipótesis H0: = 12 contra Ha : < 12 es igual a -2,10
y el valor crítico es -2,025, esto indica que la hipótesis nula debe ser rechazada.
10. El error tipo I es el nivel de significación. (V-F)
11. El error tipo I es la probabilidad de rechazar la hipótesis nula cuando esta es cierta. (V-F)
12. El error tipo II es la probabilidad 1 - α (V-F)
13. Al realizar una prueba de hipótesis sólo se puede cometer un error, rechazar una hipótesis nula
cierta. (V-F).
14. Cuando la curva de potencia para una muestra dada, no es muy alta es aconsejable disminuir el
nivel de significación y de esta forma mejorar la calidad de la prueba para esa muestra. (V-F).
15. En una prueba lateral izquierda en la que la curva operatoria característica es alta, se aconseja
disminuir el nivel de significación para bajar la curva. (V-F).
170
Actividad 22
Responda:
1. Un funcionario debe decidir si es conveniente otorgar a las personas de su distrito un subsidio por
desempleo, para ello debe contar con más del 30% de las personas responsables de familia
desempleadas, que acciones se relacionan con los dos tipos de error en este caso y cuál de ellos es
más arriesgado?
2. En un procedimiento de prueba de hipótesis para la varianza, el valor de probabilidad de la
muestra es de cero. ¿Cree Ud. que a cualquier nivel α, esta muestra permite aceptar la hipótesis
nula?
3. Para probar la hipótesis de que el gasto medio por familia en alimentación es inferior a 150$
mensuales, se ha tomado una muestra de familias de barrios humildes de la ciudad, obteniéndose
una probabilidad para el resultado muestral de 0.40, ¿Cree Ud. que con esta muestra se podrá
subsidiar a las familias de este sector con 150$?
4. En una prueba lateral derecha para la media poblacional, si el valor p es de 0.4, ¿Qué nivel de
significación debería fijar para rechazar la hipótesis nula?, ¿es coherente ese nivel de significación,
qué importancia tiene en el procedimiento de prueba?
5. En una prueba lateral izquierda para P, el valor observado del estadístico de prueba es de 0.8, ¿cuál
es el valor p? ¿Qué nivel de significación debería aplicar para aceptar la hipótesis nula?
6. ¿Es bueno lograr una curva de potencia baja? ¿Qué significa lo mencionado?
7. ¿Es bueno lograr una curva operatoria característica alta? ¿Qué significa lo mencionado
Actividad 1
a)
H0) µ ≤ 6
H1) µ > 6
( ̅ µ)
Estadístico: 𝑧 = ≈ 𝑁(0,1)
/√
,
z* (0,99)= 2,33 𝑧 = ,
Z 0= 15,06
El valor de z observado es: 15,06, pertenece a la región de rechazo dado que es mayor a
2.33. En consecuencia, se deberá rechazar la hipótesis nula. Es razonable lo informado por
el gerente al nivel del 1%.
b)
171
√4,12 √4,12
𝑃 8,68 − 2,5758 ≤ μ ≤ 8,68 + 2,5758 = 0.99
√130 √130
IC = (8,22-9,14)
Con una confianza del 99% la verdadera cantidad promedio de extracciones mensuales que ahora
realizan sus clientes será un valor entre 8,22 y 9,14.
Actividad 2
𝐻 ) 𝜇 ≥ 8,5
𝐻 ) 𝜇 < 8,5
, ,
𝑧 = , /√
= −3,63 𝑧 ∗, = −1,282
Se rechaza la hipótesis nula con un nivel de significación de 0,10. Las medidas fueron efectivas al nivel
el 10%.
Actividad 3
H0) µ ≤ 80
H1) µ > 80
( ̅ µ)
Estadístico: 𝑧 = /√
≈ 𝑁(0,1)
El valor de z observado es: 10,26, pertenece a la región de rechazo dado que es mayor a 2.33. En
consecuencia, se deberá rechazar la hipótesis nula. Es razonable lo informado por el gerente al nivel
del 1%.
Actividad 4
3.500.000
𝜇=
200
𝐻 ) 𝜇 = 17500
𝐻 ) 𝜇 ≠ 17500
. . .
𝑧 = = −3.26 𝑧 ∗; , = −1,96 𝑧 ∗; , = 1,96
, /√
Se rechaza la hipótesis nula con un nivel de significación de 0,05. No es confiable la cifra del balance al
nivel del 5%.
Actividad 5:
172
H0) µ > 1
H1) µ < 1
El significado del error tipo I, es la acción de rechazar H0 cuando H0 es cierta, en este caso la opción
2. Concluir que < 1 litro cuando en realidad 1.
Actividad 6
𝐻 ) 𝜇 ≤ 100
𝐻 ) 𝜇 > 100
Se rechaza la hipótesis nula con un nivel de significación de 0,05. La cantidad de clientes diarios
promedio que usan el auto pago es mayor que 100.
Actividad 7:
El valor de z observado es: -10,13, pertenece a la región de rechazo dado que es menor al valor
crítico -1,6955. En consecuencia, se deberá rechazar la hipótesis nula. Efectivamente ha disminuido
la tarifa de vuelo en la ruta Córdoba, Buenos Aires al nivel del 5%.
Con los datos de las pruebas de normalidad y bondad de ajuste se puede verificar el cumplimento
del requisito de normalidad para aplicar el estadístico definido en la prueba.
Actividad 8
Variable diámetro.
Para la media:
𝐻 ) 𝜇 = 1,35
173
𝐻 ) 𝜇 ≠ 1,35
, ,
𝑡 = = 0,6259 𝑡∗ ; , = −2,045 𝑡∗ ; , = 2,045
, /√
No se rechaza la hipótesis nula con un nivel de significación de 0,05. La pieza cumple con las
especificaciones dadas para el promedio del diámetro.
Para la varianza (lo que importa es que la varianza no sea mayor; una variabilidad menor es aceptable):
𝐻 ) 𝜎 ≤ 0,06
𝐻 ) 𝜎 > 0,06
. ,
𝜒 = ,
= 986,80 𝜒 ; , = 42,55
Se rechaza la hipótesis nula con un nivel de significación de 0,05. La variabilidad del diámetro es mayor
al valor especificado.
Variable peso:
Para la media:
𝐻 ) 𝜇 = 90
𝐻 ) 𝜇 ≠ 90
,
𝑡 = , /√
= 0,2830 𝑡∗ ; , = −2,045 𝑡∗ ; , = 2,045
No se rechaza la hipótesis nula con un nivel de significación de 0,05. La pieza cumple con las
especificaciones dadas para el promedio del peso.
Para la varianza:
𝐻 )𝜎 ≤7
𝐻 )𝜎 >7
. ,
𝜒 = = 40,96𝜒 ; , = 42,55
No se rechaza la hipótesis nula con un nivel de significación de 0,05. La pieza cumple con las
especificaciones dadas para la varianza del peso.
Actividad 9:
H0) µ ≤ 6
H1) µ > 6
( ̅ µ)
Estadístico: 𝑡 = ~𝑡
/√
174
Reglas de Decisión: Si el valor p < se rechaza H0 Si el valor p > no se rechaza H0.
En este caso p = 0.1698, mayor que el nivel de significación, por lo que no se rechaza la hipótesis nula.
No se aconsejaría implementar el nuevo servicio de reparto de facturas los domingos a la mañana en
un barrio con un nivel de significación del 5%.
Actividad 10
𝐻 )𝜇 ≤5
𝐻 )𝜇>5
𝑡 = /√
= 3,16 𝑡 ∗; , = 1,833
Se rechaza la hipótesis nula con un nivel de significación de 0,05. La oferta incrementó la venta
promedio mensual.
Actividad 11
El valor de t observado es: -2,3171 pertenece a la región de rechazo dado que es menor al valor crítico
-1,7530. En consecuencia, se deberá rechazar la hipótesis nula. El fabricante está trabajando con una
resistencia a la rotura promedio menor que la que realmente necesita.
Actividad 12
a)
𝐻 ) 𝜇 = 100
𝐻 ) 𝜇 ≠ 100
7,03
𝑥̅ ∗ = 100 − 1,9596 = 96,9195 ≅ 97
√20
7,03
𝑥̅ ∗ = 100 + 1,9596 = 103,0804 ≅ 103
√20
b)
175
96,9195 − 104
𝑧∗ = = −4,5042
7,03/√20
103,0804 − 104
𝑧∗ = = −0,5850
7,03/√20
𝛽 = 1 − (1 − 𝛽) = 0,2793
La probabilidad de considerar válida (aceptar) la hipótesis nula, cuando el verdadero valor del
parámetro es 104 (cuando la hipótesis nula es falsa) se denomina error tipo II y se simboliza con 𝛽.
c)
Para 𝜇 = 104
96,9195 − 104
𝑧∗ = = −4,5042
7,03/√20
103,0804 − 104
𝑧∗ = = −0,5850
7,03/√20
Para 𝜇 = 106
96,9195 − 106
𝑧∗ = = −5,7765
7,03/√20
103,0804 − 106
𝑧∗ = = −1,8573
7,03/√20
Para 𝜇 = 108
96,9195 − 108
𝑧∗ = = −7,0488
7,03/√20
103,0804 − 108
𝑧∗ = = −3,1296
7,03/√20
Actividad 13
176
̅
Estadístico: 𝑧 = /√
∼ 𝑁(0,1)
,
𝑥̅ ∗ = 1540 − 1,6955 ∗ 𝑥̅ ∗ = 1540 − 2,6256 𝑥̅ ∗ = 1533,45
√
a) el valor a partir del cual se rechaza la hipótesis nula de que el promedio del costo de vuelo,
es igual a $ 1540 es de $1533,45.
c) la función potencia si los valores alternativos del parámetro fueren, $ 1520, $ 1530, $ 1535 y
$ 1538.
,
1- β= P (𝑥̅ < 1533,45/ = 1538)= P(Z ≤ , /√
)
Hipótesis Potencia
H0 1540 1-=0,95 =0,050
H1 1538 0,8733 0,1266
HI 1535 0,6514 0,3486
H1 1530 0,8068 0,1932
H1 1520 0,9963 0,0004
Actividad 14
𝐻 ) 𝜇 = 80
𝐻 ) 𝜇 ≠ 80
15
𝑥̅ ∗ = 80 − 2,5758 = 75,17
√64
15
𝑥̅ ∗ = 80 + 2,5758 = 84,83
√64
Para 𝜇 = 70
177
75,17 − 70
𝑧∗ = = 2,7573
15/√64
84,83 − 70
𝑧∗ = = 7,9093
15/√64
Para 𝜇 = 75
75,17 − 75
𝑧∗ = = 6,09
15/√64
84,83 − 75
𝑧∗ = = 5,24
15/√64
Para 𝜇 = 85
75,17 − 85
𝑧∗ = = −5,24
15/√64
84,83 − 85
𝑧∗ = = −0,09
15/√64
𝜇 1−𝛽 𝛽
70 0,9970 0,003
75 0,5359 0,4641
80 0,01 0,99
85 0,5359 0,4641
Actividad 15
𝐻 ) 𝑝 ≤ 0,20
𝐻 ) 𝑝 > 0,20
, ,
𝑧 = , ,
= −0,0644 𝑧 ∗, = 1,2815
No se rechaza la hipótesis nula con un nivel de significación de 0,10. No hay evidencia suficiente para
decir que el porcentaje de empresas que exportan más de $130.000 supera el 20%.
Actividad 16
178
H1) P < 0,85
( ̅ )
Estadístico: 𝑧 = /√
≈ 𝑁(0,1)
El valor de z observado es -2,2140, pertenece a la región de rechazo dado que es menor a -1,645 en
consecuencia se deberá rechazar la hipótesis nula. Conclusión: Se rechaza Ho. Es razonable lo
informado por el centro de Estudiantes al nivel del 5%.
Actividad 17
𝐻 ) 𝑝 ≤ 0,10
𝐻 ) 𝑝 > 0,10
, ,
𝑧 = , ,
= 1,33 𝑧 ∗, = 2,3263
No se rechaza la hipótesis nula con un nivel de significación de 0,01. No se debe rectificar el anuncio.
Actividad 18
( )
Estadístico: ≈ 𝑥2
El valor de χ2 observado es 28,815, pertenece a la región de no rechazo dado que es menor a 39,0875.
En consecuencia, no se deberá rechazar la hipótesis nula. La máquina funciona adecuadamente a un
nivel del 10%.
Actividad 19
𝐻 )𝜎 ≥3
𝐻 )𝜎 <3
,
𝜒 = = 29,4 𝜒 ; , = 28,94
No rechazo la hipótesis nula con un nivel de significación de 0,01. Las acciones no han sido eficaces.
Actividad 20
H0) σ2 > 5
179
H1) σ2 < 5
( )
Estadístico: ~𝑥
El valor de χ2 observado es 34,8, pertenece a la región de no rechazo dado que es menor a 17,7084.
En consecuencia, no se deberá rechazar la hipótesis nula.. Con un nivel de significación del 5% puede
considerarse que invertir en esta acción no es una inversión de bajo riesgo.
Actividad 21
10. Esto es VERDADERO. El error tipo I es la probabilidad de rechazar la hipótesis nula si esta es
verdadera y es igual al nivel de significación 𝛼.
180
11. La afirmación es FALSA. El error tipo I es una acción que consiste en rechazar la hipótesis nula
cuando ésta es cierta y la probabilidad de cometer el error tipo I se simboliza como α.
12. Esto es FALSO. El error tipo II es la probabilidad de no rechazar la hipótesis nula si esta es falsa
y se simboliza con 𝛽. Por otro lado, 1 − 𝛼 es la probabilidad de no rechazar la hipótesis nula si
es verdadera.
13. La afirmación es FALSA. Al realizar una prueba de hipótesis se pueden cometer dos errores.
El error tipo I que consiste en rechazar la hipótesis nula cuando ésta es cierta y El error tipo II
que consiste en no rechazar la hipótesis nula cuando ésta es falsa.
14. Esta afirmación es FALSA. La potencia de la prueba se define como la función que establece la
probabilidad de rechazar la hipótesis nula cuando es falsa y se representa como 1 − 𝛽. Por
otro lado, el nivel de significación 𝛼, es la probabilidad de rechazar la hipótesis nula si es
verdadera. Ambas probabilidades están relacionadas a la acción de rechazar (sea la hipótesis
nula falsa o verdadera) y están vinculadas. La probabilidad de cometer el error tipo I, 𝛼, es el
punto más bajo de la curva de potencia, por lo que, si disminuye, la curva de potencia será
más baja aún.
15. La afirmación es FALSA. Si en una prueba lateral izquierda en la que la curva operatoria
característica es alta, si se disminuye el nivel de significación, aumenta beta y en consecuencia
sube la curva.
Actividad 22
1. El funcionario se enfrenta a dos tipos de errores si plantea la hipótesis nula 𝑝 < 0,3 y la
hipótesis alternativa 𝑝 > 0,3. El error tipo I es la probabilidad de rechazar 𝐻 si 𝐻 es
verdadera (𝛼). En ese caso estaría aplicando el subsidio sin cumplir el requisito del 30%. El
error tipo II es la probabilidad de no rechazar 𝐻 si 𝐻 es falsa. En este caso no aplicaría el
subsidio cuando hay más del 30% de personas desempleadas. Este error es el más arriesgado
porque se podría dejar a una gran cantidad de personas sin subsidio cuando lo necesitan.
3. Para probar la hipótesis de que el gasto medio por familia en alimentación es inferior a
$150 mensuales, se establece que H0: µ >150 H1: µ < 150 (hipótesis del investigador),
dado que el valor p =0,40 por lo tanto no se rechaza la Ho , con lo cual se concluye que, a
partir de los datos suministrados por la muestra, no existe evidencia para concluir que el
gasto medio por familia sea inferior a $150. Por lo tanto, no se podrá subsidiar a las familias
de este sector con $ 150.
4. Si en una prueba lateral derecha para la media se tiene que 𝑝 = 0,4 , para rechazar 𝐻
debería fijar un 𝛼 > 𝑝 ya que de esa forma el valor observado cae en zona de rechazo.
Este nivel de significación no es coherente ya que es una probabilidad de cometer el error
tipo I muy elevada. En el procedimiento 𝛼 es sumamente importante porque es la
probabilidad de cometer el error tipo I que como investigador/a estoy dispuesto/a tolerar.
181
5. No es bueno, ya que una curva de potencia baja significa que, para diferentes valores
falsos del parámetro con respecto a la hipótesis nula, la probabilidad de rechazar es muy
baja.
182