0% encontró este documento útil (0 votos)
20 vistas19 páginas

Estimación de Intervalos de Confianza en Estadística

Cargado por

luli2ferraris
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
20 vistas19 páginas

Estimación de Intervalos de Confianza en Estadística

Cargado por

luli2ferraris
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

ESTIMACIÓN POR INTERVALOS DE

CONFIANZA Y ENSAYO DE HIPÓTESIS


Ejercicios modelo resueltos
INTRODUCCIÓN A LA ESTADÍSTICA
LICENCIATURA EN ESTADÍSTICA

AÑO 2020

Lic. Maite San Martín


Mgs. Nora Arnesi
Mgs. Guillermina Harvey
INTRODUCCIÓN A LA ESTADÍSTICA

LICENCIATURA EN ESTADÍSTICA

UNIDAD 6 - PRÁCTICA

EJERCICIOS MODELO RESUELTOS

Supongamos que como profesionales de la estadística nos encargan asesorar a una industria
que produce insumos informáticos. Dentro de todos sus productos, la gerencia está
particularmente interesada en analizar distintas características de la vida útil de una
componente. Se llama vida útil al tiempo (en este caso medido en años) transcurrido desde
el primer uso de la componente hasta que deja de funcionar definitivamente.
A continuación, se describen algunas situaciones problemáticas que podríamos abordar
como estadístico/as para producir conocimiento útil para la industria que solicita nuestros
servicios profesionales. Se trabajará con dos técnicas inferenciales para analizar datos (la
estimación por intervalos de confianza y los test de hipótesis) y se requerirá inferir sobre
distintos parámetros (promedio µ, proporción 𝑝 y variancia 𝜎 2 ) en distintos escenarios
(variancia conocida o desconocida, tamaño de muestra pequeño o grande, 𝑋~𝑁(𝜇, 𝜎) o
𝑋~𝑓(𝑋) con 𝑓(𝑋) desconocida) a partir de esta situación genérica disparadora.
Todo lo planteado en texto negro común (como este) indica el procedimiento necesario para
resolver las consignas planteadas. En este sentido, todo lo que figura como resolución será
solicitado a la hora de una instancia evaluativa (examen parcial o final). Todo lo planteado en
texto coloreado (como este) y el texto ubicado en recuadros como este o como este refiere
a aclaraciones, explicaciones o razonamientos propuestos por la cátedra que pueden ser
útiles a la hora de entender el proceso lógico que implica realizar test de hipótesis o construir
intervalos de confianza.

1. Estimación por intervalos de confianza

La estimación es un procedimiento para inferir el valor de un parámetro. Puede realizarse


de dos formas distintas: a través de un estimador puntual o a través de un estimador de
intervalo (que se construye a partir del estimador puntual y su distribución en probabilidad,
y permite juzgar la precisión de la estimación). Pueden sistematizarse a grandes rasgos los
pasos a seguir para construir una estimación por intervalos de confianza:
a) Identificación y definición de la variable en estudio.
b) Identificación y definición del parámetro en estudio, el que interesa estimar.
c) Identificación de los datos proporcionados por el ejercicio (datos muestrales como
estadísticas o el tamaño de la muestra, datos poblacionales como otros parámetros
que se conozcan, nivel de confianza con el que se desea trabajar).

- 1 -
d) Identificación del estimador puntual y de su distribución en el muestreo (en base
al parámetro que se desee analizar y a la información con la que contemos).
e) Definición de la estadística pivote y de su distribución.
f) Cálculos: estadística pivote observada, margen de error (semiamplitud), límite
inferior y límite superior del intervalo.
g) Interpretación del intervalo en términos del problema.

1.1. Estimación del promedio µ

La gerencia de la industria mencionada desea estimar la vida útil de una línea de las
componentes bajo análisis. Se sabe que la duración de las componentes sigue una
distribución Normal con desvío estándar igual a 0,8 años. Se extrae entonces una muestra
aleatoria de 17 componentes y se encuentra que la duración promedio de las mismas es de
2,82 años. Estimar la vida útil promedio de las componentes de forma puntual y con un
coeficiente de confianza de 0,95.

X: tiempo de vida útil de la componente (años). Esto nos ayudará luego


a interpretar en
Parámetro bajo estudio: µ, tiempo de vida útil promedio de
términos del problema
las componentes (años).

Datos:
 𝑋~𝑁(𝜇, 𝜎) ¿Por qué el dato “0,8 𝑎ñ𝑜𝑠” corresponde al desvío
estándar poblacional 𝝈 y no al desvío estándar
 𝜎 = 0,8 𝑎ñ𝑜𝑠
muestral 𝑺?
 𝑛 = 17 𝑐𝑜𝑚𝑝𝑜𝑛𝑒𝑛𝑡𝑒𝑠
 𝑋̅ = 2,82 𝑎ñ𝑜𝑠 El dato sobre la variabilidad es informado en conjunto
 𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 con otro dato poblacional (la distribución de la variable
𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎: 𝑋), y no con los datos muestrales. A partir de ello,
podemos interpretar que ese dato corresponde a un
1 − 𝛼 = 0,95
valor poblacional. Si, en cambio, el enunciado hubiese
sido:
Se sabe que la duración de las componentes sigue una
distribución Normal. Se extrae entonces una muestra
aleatoria de 17 componentes y se encuentra que la
duración promedio de las mismas es de 2,82 años con
un desvío estándar igual a 0,8 años.
Dado que el interés entonces podríamos interpretar que el dato “0,8 𝑎ñ𝑜𝑠”
recae en la estimación corresponde a información muestral (𝑆) y no
del tiempo de vida poblacional (𝜎).
promedio de las
componentes (µ),
entonces el estimador
puntual será el
promedio muestral (𝑋̅).

- 2 -
El estimador puntual de la vida útil promedio de las componentes es 𝑋̅ = 2,82 𝑎ñ𝑜𝑠.
Podríamos interpretarlo diciendo: “Se estima que las componentes tienen una vida útil
promedio de 2,82 años”. Dado que esta estimación puntual no ofrece ninguna medida del
error o variabilidad inherente a la estimación, el verdadero interés viene dado por la
estimación del parámetro a través de un intervalo de confianza.

Dado que la variable en estudio 𝑋 sigue una distribución 𝑁(𝜇, 𝜎), y que el desvío estándar
poblacional 𝜎 es conocido, entonces la distribución en el muestreo de 𝑋̅, nuestro estimador
puntual será:
𝜎 Esto es así porque la combinación lineal
𝑋̅ ~ 𝑁(𝜇, )
√𝑛 (𝑋̅ es una combinación lineal de
variables 𝑋𝑖 ) de variables Normales (el
La estadística pivote surge a partir de la enunciado indica que 𝑋 se distribuye
según un modelo Normal, por lo que la
estandarización del estimador puntual. En este
muestra aleatoria de tamaño 𝑛 = 17
caso, la estadística pivote a utilizar para construir
puede interpretarse como una sucesión
el intervalo de confianza y su distribución en de 𝑛 = 17 variables 𝑋𝑖 ) sigue también
probabilidad serán: una distribución Normal, con parámetros
𝑋̅ − 𝜇 que dependen de la forma de dicha
𝑍= 𝜎 ~ 𝑁(0,1) combinación lineal (más adelante, al
√𝑛 enunciar el Teorema Central del Límite,
podemos recordar de dónde surgen
Fórmula para el cálculo del intervalo de confianza: dichos parámetros).
𝜎 𝜎
𝐼𝐶𝜇,95% = (𝑋̅ − 𝑍0,975 ∗ ; 𝑋̅ + 𝑍0,975 ∗ )
√𝑛 √𝑛

Formas alternativas para expresar la fórmula de los IC para la media (todas expresan lo
mismo y conducen al mismo resultado):

𝜎 𝜎 𝑍𝛼 tiene misma magnitud (valor


𝐼𝐶𝜇,95% = (𝑋̅ + 𝑍0,025 ∗ ; 𝑋̅ + 𝑍0,975 ∗ )
√𝑛 √𝑛 absoluto) que 𝑍1−𝛼 pero distinto signo
𝜎
𝐼𝐶𝜇,95% = (𝑋̅ ± 𝑍0,975 ∗ )
√𝑛
𝜎 𝜎 Esta expresión deja de ser correcta al
𝑃 (𝑋̅ − 𝑍0,975 ∗ ≤ 𝜇 ≤ 𝑋̅ + 𝑍0,975 ∗ ) = 0,95
√𝑛 √𝑛 reemplazar los símbolos por valores

- 3 -
¿De dónde surge la fórmula para calcular los intervalos de confianza?
El origen está en pensar cuál es nuestro interés al estimar un parámetro a través de un
intervalo de confianza: encontrar dos valores (límites del intervalo) tales que
contengan al parámetro de interés con una probabilidad deseada (1 − 𝛼).

1−𝛼

̅
X
𝑙𝑖𝑛𝑓 𝜇 𝑙𝑠𝑢𝑝

Dado que conocemos el estimador puntual de nuestro parámetro, a partir del cual
definimos nuestra estadística pivote y su distribución en probabilidad, podemos
pensar en cuáles serían los dos valores de dicha estadística (en este caso, 𝑍) que
encierran una probabilidad igual a la deseada (1 − 𝛼):

𝑃 (𝑍𝛼 ≤ 𝑍 ≤ 𝑍1−𝛼 ) = 1 − 𝛼
2 2

1−𝛼 Y dado que conocemos cómo se define Z,


podríamos reemplazar y despejar:

Z 𝑋̅ − 𝜇
𝑍0,025 0 𝑍0,975 𝑃 (𝑍𝛼 ≤
2
𝜎 ≤ 𝑍1−𝛼2 ) = 1 − 𝛼
√𝑛
Multiplicamos cada miembro
𝜎 𝜎
de la desigualdad por 𝜎𝑋̅
𝑃 (𝑍𝛼 ∗ ≤ 𝑋̅ − 𝜇 ≤ 𝑍1−𝛼 ∗ ) = 1 − 𝛼
2 √𝑛 2 √𝑛

Sumamos a cada miembro 𝜎 𝜎


𝑃 (𝑍𝛼 ∗ − ̅ ≤ −𝜇 ≤ 𝑍 𝛼 ∗
𝑋 − 𝑋̅) = 1 − 𝛼
de la desigualdad −𝑋
̅
2 √𝑛
1−
2 √𝑛

Multiplicamos cada 𝜎 𝜎
miembro por -1 𝑃 ((𝑍𝛼 ∗ − 𝑋̅) ∗ (−1) ≥ 𝜇 ≥ (𝑍1−𝛼 ∗ − 𝑋̅) ∗ (−1)) = 1 − 𝛼
(cambian los signos 2 √𝑛 2 √𝑛
de “≤” a “≥”)
𝜎 𝜎
Reordenamos
𝑃 (𝑋̅ − 𝑍1−𝛼 ∗ ≤ 𝜇 ≤ 𝑋̅ − 𝑍𝛼 ∗
)= 1−𝛼
2√𝑛 2 √𝑛

𝜎 𝜎
Cambiamos −𝑍𝛼 por 𝑍1−𝛼 𝑃 (𝑋̅ − 𝑍1−𝛼 ∗ ≤ 𝜇 ≤ 𝑋̅ + 𝑍1−𝛼 ∗ ) = 1 − 𝛼
2 2
2 √𝑛 2 √𝑛
para emprolijar

Este desarrollo que acabamos de hacer es lo que llamamos deducción de los límites
del intervalo de confianza.

- 4 -
Reemplazando los valores observados en la fórmula de cálculo del intervalo de confianza:
𝜎 𝜎
𝐼𝐶𝜇,95% = (𝑋̅ − 𝑍0,975 ∗ ; 𝑋̅ + 𝑍0,975 ∗ ) Recuerden indicar el
√𝑛 √𝑛
paso a paso y los
0,8 0,8 resultados parciales,
𝐼𝐶𝜇,95% = (2,82 − 1,96 ∗ ; 2,82 + 1,96 ∗ )
√17 √17 además de todos los
planteos, razonamientos
𝐼𝐶𝜇,95% = (2,82 − 0,38 ; 2.82 + 0,38) y supuestos necesarios

𝐼𝐶𝜇,95% = (2,44 ; 3,20)

Interpretación: Con una confianza del 95% el intervalo (2,44 años; 3,20 años) cubre el
verdadero tiempo de vida promedio de las componentes.

¿Cuál es la precisión de la estimación?


La precisión de la estimación viene dada por el margen de error
(semiamplitud del intervalo). En este caso, es igual a 0,38 𝑎ñ𝑜𝑠.

Algunas preguntas… ¿El resultado obtenido significa que la probabilidad de que el


parámetro esté incluido en el intervalo es igual a 𝟎, 𝟗𝟓?
NO. En primer lugar, no hablamos en términos de “parámetro
incluido”, ya que el parámetro es un valor fijo y desconocido y
no es una cantidad variable sobre la cual se pueda calcular
una probabilidad. En segundo lugar, si bien en la deducción de
los límites del intervalo hablamos de “encontrar dos valores que
cubran al parámetro de interés con cierta probabilidad”, es
correcto hablar de probabilidad antes de realizar la
estimación, mientras hablamos en términos teóricos. Una vez
realizada la estimación, esta puede cubrir (probabilidad igual a
1) o no cubrir (probabilidad igual a 0) al verdadero valor del
parámetro, y no hay forma de saber cuál es el caso.

¿Y qué significa el coeficiente de confianza? ¿Qué garantías


tengo sobre la calidad de mi estimación?
Si utilizáramos el estimador de intervalo repetidamente en
muestras simples al azar de tamaño n=17 componentes, el 95%
de los intervalos construidos cubrirían al parámetro de interés,
es decir que darían buenos resultados. Esto ocurre porque, al
conocer la distribución en el muestreo del estimador puntual 𝑋̅,
sabemos que el 95% de los promedios muestrales se
0,8
encontrarían a una distancia de 1,96 ∗ de 𝜇, que es la 𝐸(𝑋̅).
√17
De este modo, tenemos un 95% de confianza de que el
intervalo estimado contenga a 𝜇, ya que fue construido con un
método tal que, si se extraen reiteradas muestras, todas de
igual tamaño y para cada una de ellas se construye el
mencionado IC, es de esperar que el 95% de los intervalos
cubran a 𝜇.

- 5 -
Universo paralelo 1: 𝝈 desconocido

¿Qué hubiese pasado si el dato poblacional sobre la variabilidad inherente a los datos
fuese desconocido? ¿Cómo hubiésemos procedido si contáramos con 𝑺 = 𝟎, 𝟖 𝒂ñ𝒐𝒔 en
vez de 𝝈 = 𝟎, 𝟖 𝒂ñ𝒐𝒔?
𝑋̅ −𝜇 𝑋̅ −𝜇
En este caso, la estadística pivote ya no sería 𝜎/√𝑛
, sino que será 𝑆/√𝑛
, dado que no
contamos con el valor de 𝜎 y debe ser estimado a través de S. Pero ahora, ¿qué
distribución en probabilidad sigue la estadística pivote? La nueva estadística pivote
seguirá una distribución t de Student: el punto de partida es una estadística 𝑍, en cuyo
denominador reemplazamos 𝜎 por 𝑆. De este modo, si hacemos el cociente entre una
estadística 𝑍 Normal y la raíz de una estadística 𝑌 Chi-Cuadrado (dado que 𝑌 modela
la distribución de 𝑆 2 ), partida por sus grados de libertad obtenemos:
𝑋̅ − 𝜇
𝑍 𝜎/√𝑛 𝑋̅ − 𝜇 𝜎2 𝑋̅ − 𝜇 𝜎 𝑋̅ − 𝜇
𝑡= = = 𝜎 ∗√ 2 = 𝜎 ∗ =
𝑆 2 (𝑛 − 1) 1 𝑆 𝑆 𝑆
√ 𝑌 √ ∗ (𝑛 − 1) √ 𝑛 √ 𝑛
𝑛−1 𝜎 2 √𝑛
𝑋̅ −𝜇
De este modo, la estadística pivote y su distribución serán: 𝑡 = 𝑆 ~ 𝑡𝑛−1
√𝑛

Entonces, si no contáramos con información poblacional sobre la variabilidad de la


variable 𝑋, la estadística pivote sería 𝑡, con una distribución t de Student de n-1 grados
de libertad. Cabe destacar que para que esto sea así, la variable X debe tener
distribución Normal.

En este sentido, tenemos dos escenarios: a) sabemos que la variable X es Normal (por
ejemplo, desde un fundamento teórico se sabe que muchas variables provenientes de
la naturaleza siguen un modelo Normal) entonces ya es suficiente para conocer la
distribución de nuestra estadística pivote, o bien b) desconocemos la forma funcional
de la variable X, por lo que será necesario verificar su normalidad (a través de un
gráfico de probabilidad Normal o de test de normalidad), ya que todos los cálculos
que realicemos y las conclusiones a las que arribemos dependerán de que 𝑋 sea , al
menos, aproximadamente Normal.
Una vez resuelto el tema de la estadística pivote y su distribución, la fórmula de un
intervalo del 95% de confianza para 𝜇 será:
𝑆 𝑆
𝐼𝐶𝜇,95% = (𝑋̅ − 𝑡𝑛−1; 0,975 ∗ ; 𝑋̅ + 𝑡𝑛−1; 0,975 ∗ )
√𝑛 √𝑛

Universo paralelo 2: 𝑿 no Normal, pero 𝒏 grande


¿Qué hubiese pasado si el dato poblacional sobre la forma del modelo de probabilidad
que siguen los datos fuese desconocido? ¿Cómo hubiésemos procedido si no
contáramos con la oración “Se sabe que X se distribuye aproximadamente Normal”, o
incluso se supiera que 𝑿 no sigue una distribución Normal?

Si contamos con un tamaño de muestra grande (en la práctica se considera


aproximadamente n≥30), no es necesario que la variable 𝑋 se distribuya según una
Normal para conocer la distribución del estimador puntual 𝑋̅. Por el Teorema Central del

- 6 -
Límite es sabido que, si se cuenta con una sucesión 𝑋1 , 𝑋2 , … , 𝑋𝑛 de variables aleatorias
cualesquiera, independientes e igualmente distribuidas {i.i.d.) con esperanza y variancia
finitas 𝐸(𝑋𝑖 ) = 𝜇 y 𝑉𝑎𝑟(𝑋𝑖 ) = 𝜎 2 (∀ 𝑖 = 1, … , 𝑛), entonces
𝑛
1 𝜎2
𝑋̅ = ∑ 𝑋𝑖 ~ 𝑁 (𝜇, √ )
𝑛 𝑛
𝑖=1 𝑛→∞
¿Y de dónde salen esos parámetros? ¿Por qué la esperanza de 𝑋̅ es igual a 𝜇? ¿Por
𝜎 2
qué el desvío estándar de 𝑋̅ es igual a √ ? Veamos:
𝑛

𝑛 𝑛 𝑛 𝑛
1 1 1 1 1
𝐸(𝑋̅) = 𝐸 ( ∑ 𝑋𝑖 ) = ∗ 𝐸 (∑ 𝑋𝑖 ) = ∑ 𝐸(𝑋𝑖 ) = ∑ 𝜇 = ∗ 𝑛 ∗ 𝜇 = 𝜇
𝑛 𝑛 𝑛 𝑛 𝑛
𝑖=1 𝑖=1 𝑖=1 𝑖=1

Observaciones: en la primer igualdad reemplazamos 𝑋̅ por su fórmula de cálculo; en la segunda


igualdad “sacamos” el factor 1/𝑛 de adentro de la esperanza por ser una constante; en la
tercera igualdad, dado que las variables 𝑋𝑖 son i.i.d., la esperanza de esa suma es igual a la
suma de las esperanzas; en la cuarta igualdad recordamos que todas las variables tienen la
misma esperanza (𝜇); en la quinta igualdad, sumar 𝑛 veces 𝜇 es igual a 𝑛 ∗ 𝜇.

𝑛 𝑛 𝑛 𝑛
1 1 1 1
𝑉𝑎𝑟(𝑋̅) = 𝑉𝑎𝑟 ( ∑ 𝑋𝑖 ) = 2 ∗ 𝑉𝑎𝑟 (∑ 𝑋𝑖 ) = 2
∑ 𝑉𝑎𝑟(𝑋𝑖 ) = ∑ 𝜎 2 =
𝑛 𝑛 𝑛 𝑛
𝑖=1 𝑖=1 𝑖=1 𝑖=1
1 𝜎2
2
= 2∗𝑛∗𝜎 = Queda pendiente identificar los porqués de
𝑛 𝑛 cada igualdad en la deducción de la variancia
del promedio muestral, tal como se hizo con la
esperanza

Universo paralelo 3: cuando 𝒏 es la incógnita

¿Qué haríamos si el enunciado tuviese un apartado adicional: “Determine el tamaño


muestral necesario para estimar la vida útil promedio de las componentes con una
confianza del 95% y un margen de error de a lo sumo 0,25 𝑎ñ𝑜𝑠”?
En este caso, es necesario pensar en los datos desde otro lugar. Contamos con un dato
adicional: el margen de error debe ser menor o igual a 0,25 𝑎ñ𝑜𝑠. ¿Y qué es el margen de
error? Tal como se dijo previamente, el margen de error es la semiamplitud del intervalo,
que en este caso viene dado por:
𝜎
𝑒𝑟𝑟𝑜𝑟 = 𝑍0,975 ∗
√𝑛
De este modo, el procedimiento es sencillo: dado que el interés está en conocer el
mínimo tamaño de muestra necesario (𝑛) para garantizar cierta confianza y un margen
de error determinado, entonces reemplazamos en la expresión los valores conocidos y
despejamos 𝑛:
𝜎 0,8 0,8
𝑒𝑟𝑟𝑜𝑟 = 𝑍0,975 ∗ ⇒ 0,25 = 1,96 ∗ ⇒ √𝑛 = 1,96 ∗ ⇒
√𝑛 √𝑛 0,25

- 7 -
⇒ 𝑛 = 6,2722 = 39,34 𝑐𝑜𝑚𝑝𝑜𝑛𝑒𝑛𝑡𝑒𝑠

Se necesita una muestra de al menos 40 componentes para poder estimar la vida útil
promedio con un 95% de confianza y una precisión de 0,25 años.

Nota: SIEMPRE redondeamos el valor obtenido para arriba: si se necesitan al menos 39,34
componentes en la muestra, se deducen dos cuestiones: a) no es posible incluir una parte
de una componente en la muestra, por lo que la muestra incluirá 39 o 40 componentes
pero no podrá tener exactamente 39,34; b) si el mínimo tamaño de muestra necesario
para garantizar las condiciones deseadas es 39,34 componentes, entonces está claro
que si incluimos 39 componentes en la muestra no será suficiente, porque se necesitan
por lo menos 39,34. En definitiva, siempre será necesario redondear para arriba el valor
calculado para 𝑛, es la única forma de garantizar las condiciones deseadas.

1.2. Estimación de la proporción 𝒑

Además de estimar la vida útil promedio de la componente en cuestión, la gerencia de la


industria desea estimar la proporción de componentes que duraron menos de 1,5 años. Se
cuenta con información de una muestra aleatoria de 76 componentes y se encuentra que para
12 de ellas se registró una vida útil menor de 1,5 años. Estimar a través de un intervalo del
99% de confianza la proporción poblacional de componentes que duran menos de 1,5 años.

X: tiempo de vida útil de la componente (años).

Parámetro bajo estudio: 𝑝, proporción de componentes con vida útil menor a 1,5 años.

Datos:
 𝑛 = 76 𝑐𝑜𝑚𝑝𝑜𝑛𝑒𝑛𝑡𝑒𝑠
 12 𝑐𝑜𝑚𝑝𝑜𝑛𝑒𝑛𝑡𝑒𝑠 𝑐𝑜𝑛 𝑣𝑖𝑑𝑎 ú𝑡𝑖𝑙 𝑚𝑒𝑛𝑜𝑟 𝑎 1,5 𝑎ñ𝑜𝑠
 𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎: 1 − 𝛼 = 0,99 (coloquialmente también se lo suele nombrar
como “𝐶𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎: 99%”)

El estimador puntual de la proporción de componentes con una vida útil menor a 1,5 años es
12
𝑝̂ = 76 = 0,1579. Podríamos interpretarlo diciendo: “Se estima que la proporción de
componentes cuya vida útil no alcanza el año y medio de duración es igual a 0,1579”. Dado
que esta estimación puntual no cuenta con ninguna medida del error o variabilidad inherente
a la estimación, el verdadero interés viene dado por la estimación del parámetro a través de
un intervalo de confianza.

Sabemos que la proporción muestral es una estadística con distribución aproximadamente


Normal cuando el tamaño de la muestra es grande:

- 8 -
𝑝(1 − 𝑝)
𝑝̂ ~ 𝑁 (𝑝, √ )
𝑛
𝑛→∞
La estadística pivote surge a partir de la estandarización del estimador puntual. En este caso,
la estadística pivote a utilizar para construir el intervalo de confianza y su distribución en
probabilidad serán:
𝑝̂ − 𝑝
𝑍= ~ 𝑁(0,1)
𝑝 (1 − 𝑝) 𝑛 → ∞

𝑛

Fórmula para el cálculo del intervalo de confianza:


𝑝(1 − 𝑝) 𝑝(1 − 𝑝)
𝐼𝐶𝑝,99% = (𝑝̂ − 𝑍0,995 ∗ √ ; 𝑝̂ + 𝑍0,995 ∗ √ )
𝑛 𝑛

Dado que el desvío estándar de la estadística pivote depende de 𝑝, y 𝑝 es nuestro parámetro


objeto de estimación y por lo tanto es desconocido, es imposible el cálculo del intervalo de
confianza tal como está planteado. Por este motivo, lo que se calcula en realidad es un
intervalo de confianza aproximado, utilizando a 𝑝̂ para estimar el desvío estándar de la
estadística pivote. De este modo, el intervalo de confianza se estimará a través de:

𝑝̂ (1 − 𝑝̂ ) 𝑝̂ (1 − 𝑝̂ )
𝐼𝐶𝑝,99% ≅ (𝑝̂ − 𝑍0,995 ∗ √ ; 𝑝̂ + 𝑍0,995 ∗ √ )
𝑛 𝑛

Reemplazando los valores observados en la fórmula de cálculo:

𝑝̂ (1 − 𝑝̂ )
𝐼𝐶𝑝,99% ≅ (𝑝̂ ± 𝑍0,995 ∗ √ )
𝑛

0,1579 (1 − 0,1579)
𝐼𝐶𝑝,99% ≅ (0,1579 ± 2,58 ∗ √ )
76

𝐼𝐶𝑝,99% ≅ (0,1579 − 0,1077 ; 0,1579 + 0,1077)


𝐼𝐶𝑝,99% ≅ (0,0502 ; 0,2656)

Interpretación: Con una confianza del 99% el intervalo (0,0502; 0,2656) cubre la proporción
poblacional de componentes con vida útil menor a 1,5 años.

- 9 -
¿Qué sucedería si el tamaño de muestra fuese chico?
En ese caso, la distribución de 𝑝̂ ya no es Normal, sino que sigue un modelo Binomial (no
lo vemos en este curso, pero sí lo van a ver en otras materias). Si esto ocurriera, no
podríamos utilizar la fórmula planteada, dado que la distribución para la estadística
pivote se cumple cuando 𝑛 → ∞. En términos prácticos, es muy probable que todos los
ejercicios planteados tengan un tamaño de muestra grande (de otro modo, ustedes no
lo podrían resolver), pero es fundamental no olvidarse que la distribución de 𝑝̂ solo es
Normal si y solo si 𝑛 → ∞ (por lo que es muy importante que esa expresión sea indicada
bajo el símbolo de “se distribuye” (~) al momento de enunciar su distribución.

¿Qué sucedería si alguno de los límites del intervalo cae fuera del intervalo [𝟎; 𝟏]?

En primer lugar, corresponde pensar: ¿tiene sentido hablar de una proporción negativa?
¿Podemos decir que el −5% de las componentes cumplen con cierta característica? O
análogamente, ¿podemos hablar de una proporción mayor a 1? Claramente la
respuesta es NO. Sin embargo, dado que los límites de los intervalos de confianza se
obtienen a través de cálculos, y matemáticamente podemos llegar a algún valor que
en la práctica no tenga sentido (como una proporción negativa), entonces una opción
podría ser “recortar” el intervalo obtenido en función de los valores que puede tomar el
parámetro: cero “0”. En ese caso, si a través de los cálculos llegáramos por ejemplo a un
intervalo igual a (-0,05; 0,15) entonces podríamos interpretar el intervalo (0,0; 0,15).

1.3. Estimación de la variancia 𝝈𝟐

Un factor que la gerencia considera fundamental es la variabilidad en la vida útil de las


componentes: de nada sirve que la vida útil promedio sea alta si simultáneamente hay
componentes con larga duración y componentes con una vida útil muy corta. Se sabe que la
duración de las componentes sigue una distribución Normal. Se extrae entonces una muestra
aleatoria de 17 componentes y se encuentra que el desvío estándar de la duración de las
mismas es de 0,8 años. Se solicita construir un intervalo del 90% de confianza para estimar
la variancia poblacional.

X: tiempo de vida útil de la componente (años).


Parámetro bajo estudio: 𝜎 2 , variancia de la vida útil de las componentes (años 2).

Datos:
 𝑛 = 17 𝑐𝑜𝑚𝑝𝑜𝑛𝑒𝑛𝑡𝑒𝑠
 𝑆 = 0,8 𝑎ñ𝑜𝑠
 𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎: 1 − 𝛼 = 0,90

El estimador puntual de la variancia del tiempo de vida útil de las componentes es 𝑆 2 =


(0,8 𝑎ñ𝑜𝑠)2 = 0,64 𝑎ñ𝑜𝑠 2 . Podríamos interpretarlo diciendo: “Se estima que la variancia del

- 10 -
tiempo de vida útil de las componentes bajo estudio es igual a 0,64 años2”. Dado que esta
estimación puntual no cuenta con ninguna medida del error o variabilidad subyacente a la
estimación, el verdadero interés viene dado por la estimación del parámetro a través de un
intervalo de confianza.

Dado que X es una variable Normal, entonces Y es una estadística con distribución Chi
Cuadrado. Esta será nuestra estadística pivote:
𝑆 2 (𝑛 − 1) 2
𝑌= ~ 𝜒𝑛−1
𝜎2

Fórmula para el cálculo del intervalo de confianza:


𝑆 2 (𝑛 − 1) 𝑆 2 (𝑛 − 1)
𝐼𝐶𝜎 2,90% = ( 2 ; 2 )
𝜒16; 0,95 𝜒16; 0,05

Reemplazando los valores observados en la fórmula de cálculo:

𝑆 2 (𝑛 − 1) 𝑆 2 (𝑛 − 1)
𝐼𝐶𝜎 2,90% =( 2 ; 2 )
𝜒16;0,95 𝜒16;0,05

0,82 (17 − 1) 0,82 (17 − 1)


𝐼𝐶𝜎 2,90% = ( ; )
26,296 7,962

𝐼𝐶𝜎 2,90% = (0,389 ; 1,286)

Interpretación: Con una confianza del 90% el intervalo (0,389 años2; 1,296 años2) cubre la
variancia poblacional de la duración de las componentes.

Cabe recordar que la distribución Chi-Cuadrado no es una distribución simétrica, por lo


que deben buscarse ambos valores en la tabla (no podemos proceder como en el caso
de la distribución Normal o t de Student, donde bastaba con encontrar 𝑍𝛼 o 𝑡𝛼 para
2 2

conocer 𝑍1−𝛼 o 𝑡1−𝛼 respectivamente, ya que solo hacía falta cambiar su signo).
2 2

Además, no admite valores negativos (de hecho, no tiene sentido pensar en variabilidad
negativa). Por la forma de cálculo de los límites de confianza, no es matemáticamente
posible obtener resultados negativos si los cálculos son correctos; en caso de obtener
algún límite negativo ¡¡debemos revisar los cálculos!!

- 11 -
2. Test de hipótesis

Tal como vimos en la primera unidad, y retomamos ahora nuevamente, los test de
hipótesis consisten en la evaluación de la información muestral a la luz de dos hipótesis,
para decidir cuál es más probable de ser sustentada por los datos observados y, así,
decidir si rechazamos la hipótesis nula o no. Pueden definirse una serie de pasos para
ordenar la resolución de un test de hipótesis:
a) Identificación y definición de la variable en estudio.
b) Identificación y definición del parámetro en estudio.
c) Planteo de las hipótesis estadísticas (necesariamente en lenguaje simbólico,
aunque también pueden identificarse las hipótesis en términos del problema si les
sirve).
d) Identificación de los datos proporcionados por el ejercicio (datos muestrales
como estadísticas o el tamaño de la muestra, datos poblacionales como otros
parámetros que se conozcan, nivel de significación con el que se desea trabajar).
e) Definición de la estadística de prueba y de su distribución (en base al parámetro
que se desee analizar y a la información con la que contemos).
g) Determinación y redacción de la regla de decisión, que nos va a guiar en el
proceso de toma de decisión (su forma dependerá del enfoque que se utilice
para resolver).
h) Cálculos: estadística de prueba observada, p-value, valor/es críticos según
corresponda (es decir, según se aplique el enfoque clásico o el enfoque del p-
value para resolver el test).
i) Decisión: evaluación de la información muestral a la luz del valor crítico (o valores
críticos) o del nivel de significación.
f) Conclusión en términos del problema.

2.1. Test de hipótesis sobre el promedio µ

La gerencia de la industria mencionada desea saber si hay motivos para discontinuar la línea
de componentes bajo análisis. El problema estaría en su duración: si la duración promedio es
inferior a 3 años entonces las componentes no son competitivas en el mercado y deberán
dejar de producirlas. Se extrae entonces una muestra aleatoria de 17 componentes y se
encuentra que la duración promedio de las mismas es de 2,82 años, y que presentan un
desvío estándar igual a 0,8 años. ¿Hay evidencia para sugerirle a la gerencia de la industria
que deje de producir la componente? Trabajar con un nivel de significación del 10% y resolver
a través del enfoque clásico.

X: tiempo de vida útil de la componente (años).


Parámetro bajo estudio: µ, tiempo de vida útil promedio de las componentes (años).

- 12 -
𝐻0 ) 𝜇 = 3 Lo que queremos probar (si la duración promedio es inferior a 3 años)
𝐻1 ) 𝜇 < 3 siempre va a ubicarse como hipótesis alternativa; la hipótesis nula
manifiesta el NO CAMBIO.
Un paso previo que puede resultar útil es hacernos preguntas sobre el
problema:
- ¿Cuál es la situación actual? Actualmente se producen las
componentes.
- ¿Qué representaría un cambio? Dejar de producirlas
- ¿En qué contexto dejarían de producirlas? Si la duración promedio
es menor a 3 años (Y ESTA ES NUESTRA HIPÓTESIS ALTERNATIVA, EL
CAMBIO)
- ¿En qué contexto seguirían produciéndolas? Si la duración promedio
es de al menos 3 años (Y ESTA ES NUESTRA HIPÓTESIS NULA, EL NO
CAMBIO)

Datos:
Recordar la distinción
 𝑛 = 17 𝑐𝑜𝑚𝑝𝑜𝑛𝑒𝑛𝑡𝑒𝑠 Hablamos de coeficiente de confianza (𝟏 − 𝜶)
 𝑋̅ = 2,82 𝑎ñ𝑜𝑠 cuando estimamos un parámetro mediante un
 𝑆 = 0,8 𝑎ñ𝑜𝑠 intervalo. Hablamos de nivel de significación (𝜶)
 𝑁𝑖𝑣𝑒𝑙 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑐𝑖ó𝑛 = 𝛼 = 0,10 cuando llevamos a cabo un test de hipótesis.

Estadística de prueba: Dado que no se conoce la variancia poblacional de 𝑋, esta debe ser
estimada a través de 𝑆 2 introduciendo una fuente de variabilidad extra a la estimación. Si se
puede corroborar que la vida útil de las componentes sigue una distribución aproximadamente
Normal, la estadística de prueba a utilizar y su distribución en probabilidad bajo 𝐻0 serán:

𝑋̅ − 𝜇0
𝑡= ~ 𝑡𝑛−1
𝑆
𝐻0
√𝑛

Dado que se trata de un test unilateral por


𝐷𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑑𝑒 𝑡 𝑏𝑎𝑗𝑜 𝐻0 : 𝑡16 izquierda, los valores favorables a la hipótesis
alternativa se encontrarán sobre la izquierda de
la distribución en probabilidad bajo 𝐻0 de 𝑡. Por
este motivo, la región de rechazo se conformará
con los valores que se encuentran a la izquierda
𝛼 = 0,10 del valor crítico. Teniendo en cuenta el nivel de
significación con el que debemos trabajar (𝛼 =
𝑡 0,10), el valor crítico será el percentil 0,10 de la
distribución t-Student con 𝑛 − 1 = 16 grados de
𝑡16; 0,10 = −1,337 libertad.

Región de rechazo Regla de decisión:


Región de aceptación Rechazo 𝐻0 ) si 𝑡𝑜𝑏𝑠 ≤ 𝑡0,10 ;16 = −1,337

- 13 -
𝑋̅ − 𝜇0 2,82 − 3
𝑡𝑜𝑏𝑠 = = = −0,928
𝑆 0,8
√𝑛 √17

𝑡𝑜𝑏𝑠 = −0,928 > −1,337 = 𝑡16; 0,10

𝛼 = 0,10 ⇒ 𝐷𝑒𝑐𝑖𝑠𝑖ó𝑛: 𝑁𝑜 𝑟𝑒𝑐ℎ𝑎𝑧𝑜 𝐻0 )

𝑡16; 0,10 = −1,337 𝑡𝑜𝑏𝑠 = −0,928

Región de rechazo
Región de aceptación

Conclusión: En base a la evidencia muestral y con un nivel de significación del 10% no hay
evidencia para afirmar que la vida útil promedio de las componentes bajo estudio sea inferior
a 3 años, por lo que no hay motivos para discontinuar su línea de producción.

¿Cómo hubiésemos procedido a través del enfoque del p-value?


En primer lugar, la regla de decisión hubiese sido otra:
Rechazo 𝐻0) si 𝑝 − 𝑣𝑎𝑙𝑢𝑒 ≤ 0,10.

Siempre que resolvamos un test de hipótesis a través del enfoque del p-value la regla de
decisión será igual a esta, sin importar si el test es unilateral o bilateral. Esto es así porque
el enfoque del p-value compara la probabilidad de observar lo observado o algo más
extremo suponiendo que H0 es cierta con la probabilidad admitida de error de tipo 1,
prefijada de antemano al comienzo de la investigación. De este modo, la regla de
decisión no cambia, pero sí es necesario tener en cuenta la dirección del test al
momento de calcular el p-value.

𝑝 − 𝑣𝑎𝑙𝑢𝑒 = 𝑃(𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑟 𝑙𝑜 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑜 𝑜 𝑎𝑙𝑔𝑜 𝑚á𝑠 𝑒𝑥𝑡𝑟𝑒𝑚𝑜/ 𝐻0 𝑒𝑠 𝑐𝑖𝑒𝑟𝑡𝑎)

𝑋̅ − 𝜇0 2,82 − 3
𝑝 − 𝑣𝑎𝑙𝑢𝑒 = 𝑃(𝑋̅ ≤ 2,82 / 𝜇 = 𝜇0 = 3) = 𝑃 ( ≤ ) = 𝑃(𝑡 ≤ −0,928)
𝑆 0,8
√𝑛 √17
Para encontrar dicha probabilidad nos remitimos a la tabla de valores críticos de la
distribución t de Student, y hacemos foco en la fila que nos corresponde (16 grados de
libertad).

- 14 -
Cabe destacar que la tabla t de Student con la que trabajamos
presenta las probabilidades de la cola superior (valores positivos).
Dado que la distribución es simétrica, al conocer los valores y
probabilidades asociadas en la cola superior podemos también
conocer de forma directa lo correspondiente a la cola inferior.

Para hallar la probabilidad asociada a 𝑡 = −0,928 recurrimos a la búsqueda de la


probabilidad asociada a 𝑡 = 0,928. Como el valor que necesitamos (0,928) no figura,
pero podemos encontrarlo entre el 0,865 y el 1,071, entonces:
0,865 < 0,928 < 1,071 ⇒ 0,15 < 𝑝 − 𝑣𝑎𝑙𝑢𝑒 < 0,20

y por lo tanto
−1,071 < −0,928 < −0,865 ⇒ 0,15 < 𝑝 − 𝑣𝑎𝑙𝑢𝑒 < 0,20

Dado que claramente


𝑝 − 𝑣𝑎𝑙𝑢𝑒 > 𝛼 = 0,10
𝑝 − 𝑣𝑎𝑙𝑢𝑒 > 0,15
la decisión es no rechazar H0,
llegando a la misma conclusión que
a través del enfoque clásico.
𝛼 = 0,10
𝑡

2.2. Test de hipótesis sobre la proporción 𝒑

La gerencia de la industria desea saber si la proporción de componentes que duraron menos


de 1,5 años difiere de 0,20. Se cuenta con información de una muestra aleatoria de 76
componentes y se encuentra que para 25 de ellas se registró una vida útil menor de 1,5 años.
Resolver a través del enfoque del p-value utilizando un nivel de significación del 5%.

X: tiempo de vida útil de la componente (años).

Parámetro bajo estudio: 𝑝, proporción de componentes con vida útil menor a 1,5 años.

𝐻0 ) 𝑝 = 0,20
𝐻1 ) 𝑝 ≠ 0,20

Datos:
 𝑛 = 76 𝑐𝑜𝑚𝑝𝑜𝑛𝑒𝑛𝑡𝑒𝑠
 25 𝑐𝑜𝑚𝑝𝑜𝑛𝑒𝑛𝑡𝑒𝑠 𝑐𝑜𝑛 𝑣𝑖𝑑𝑎 ú𝑡𝑖𝑙 𝑚𝑒𝑛𝑜𝑟 𝑎 1,5 𝑎ñ𝑜𝑠
 𝛼 = 0,05

- 15 -
Estadística de prueba: Dado que la proporción muestral es una estadística con distribución
aproximadamente Normal cuando el tamaño de la muestra es grande, la estadística de
prueba a utilizar y su distribución en probabilidad bajo 𝐻0 serán:

𝑝̂ − 𝑝0
𝑍= ~ 𝑁(0,1)
𝑝0 (1 − 𝑝0 ) 𝑛→∞

𝑛 𝐻0

Regla de decisión: Rechazo 𝐻0 ) si 𝑝 − 𝑣𝑎𝑙𝑢𝑒 ≤ 0,05

𝑝 − 𝑣𝑎𝑙𝑢𝑒 = 𝑃 (𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑟 𝑙𝑜 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑜 𝑜 𝑎𝑙𝑔𝑜 𝑚á𝑠 𝑒𝑥𝑡𝑟𝑒𝑚𝑜 / 𝐻0 𝑒𝑠 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑎 )

En un test bilateral, debemos considerar los valores “más extremos” hacia ambos lados:

𝑝0 (1 − 𝑝0 )
𝐷𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑑𝑒 𝑝̂ 𝑏𝑎𝑗𝑜 𝐻0 : 𝑁 (𝑝0 , √ )
𝑛
Teniendo en cuenta que 𝑝̂ =
0,3289 y que 𝑝0 = 0,20, entonces
el p-value deberá considerar tanto
los valores iguales o mayores a
𝑝 − 𝑣𝑎𝑙𝑢𝑒
𝑝 − 𝑣𝑎𝑙𝑢𝑒 𝑝̂ = 0,3289 como los valores
2
2 menores o iguales al simétrico de
𝑝̂ = 0,3289 respecto de 𝑝0 = 0,20,
es decir, valores menores o iguales
𝑝0 = 0,20 a 0,0711.
0,0711 𝑝̂ = 0,3289

𝑝 − 𝑣𝑎𝑙𝑢𝑒 = 𝑃 (𝑝̂ ≤ 0,0711 / 𝑝 = 0,20) + 𝑃(𝑝̂ ≥ 0,3289 / 𝑝 = 0,20)

𝑝̂ − 𝑝0 0,0711 − 0,20 𝑝̂ − 𝑝0 0,3289 − 0,20


𝑝 − 𝑣𝑎𝑙𝑢𝑒 = 𝑃 ≤ +𝑃 ≥
√𝑝0 (1 − 𝑝0 ) √0,20(1 − 0,20) √𝑝0 (1 − 𝑝0 ) √0,20(1 − 0,20)
( 𝑛 76 ) ( 𝑛 76 )

𝑝 − 𝑣𝑎𝑙𝑢𝑒 = 𝑃( 𝑍 ≤ −2,39 ) + 𝑃 ( 𝑍 ≥ 2,39 ) = 0,0084 + 0,0084 = 0,0168

𝑝 − 𝑣𝑎𝑙𝑢𝑒 = 0,0168 < 0,05 = 𝛼 ⇒ 𝐷𝑒𝑐𝑖𝑠𝑖ó𝑛: 𝑅𝑒𝑐ℎ𝑎𝑧𝑜 𝐻0 )

Conclusión: En base a la evidencia muestral y con un nivel de significación del 5% podemos


afirmar que la proporción de componentes con vida útil menor a 1,5 años difiere de 0,20.

2.3. Test de hipótesis sobre la variancia 𝝈𝟐

El último dato que la gerencia de la industria necesita para tomar una decisión acerca de la
continuidad de la componente entre sus líneas productivas tiene que ver con la variabilidad
existente en la vida útil de las componentes: si el desvío estándar de la vida útil de las

- 16 -
componentes es significativamente superior a 0,70 entonces es probable que dejen de
producirse. Se cuenta con información de una muestra aleatoria de 17 componentes y se
encuentra que la duración promedio de las mismas es de 2,82 años, y que presentan un
desvío estándar igual a 0,8 años. Resolver a través del enfoque clásico, utilizando un nivel de
significación del 1%.

X: tiempo de vida útil de la componente (años).

Parámetro bajo estudio: 𝜎 2 , variancia de la vida útil de las componentes (años2).

𝐻0 ) 𝜎 2 ≤ 0,702 Las hipótesis siempre van planteadas en términos de la variancia 𝜎 2 y no del


desvío 𝜎, aunque el enunciado nos brinde los datos sobre el desvío estándar
𝐻1 ) 𝜎 2 > 0,702

Datos:
 𝑛 = 17 𝑐𝑜𝑚𝑝𝑜𝑛𝑒𝑛𝑡𝑒𝑠 Aunque tenemos también el dato de 𝑋̅, no nos resulta útil en
 𝑆 = 0,8 𝑎ñ𝑜𝑠 este caso, dado que la distribución de Y no considera de
ningún modo al promedio. ¡Hay que estar siempre atento a
 𝛼 = 0,05 cuáles datos nos son útiles y cuáles no!

Estadística de prueba: Dado que no se cuenta con información sobre la distribución en


probabilidad de X, deberíamos chequear si se trata de una variable Normal (mediante, por
ejemplo, un gráfico de probabilidad Normal). En caso de que X sea una variable normal,
entonces la estadística de prueba a utilizar y su distribución en probabilidad bajo 𝐻0 serán:

𝑆 2 (𝑛 − 1) 2
𝑌= ~ 𝜒𝑛−1
𝜎02 𝐻0

Dado que se trata de un test unilateral por derecha,


2
𝐷𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑑𝑒 𝑌 𝑏𝑎𝑗𝑜 𝐻0 : 𝜒16 los valores favorables a la hipótesis alternativa se
encontrarán sobre la derecha de la distribución en
probabilidad bajo 𝐻0 de 𝑌. Por este motivo, la
región de rechazo se conformará con los valores
que se encuentran a la derecha del valor crítico.
Teniendo en cuenta el nivel de significación con el
𝛼 = 0,01
que debemos trabajar (𝛼 = 0,01), el valor crítico
será el percentil 0,01 de la distribución Chi
Cuadrado con 𝑛 − 1 = 16 grados de libertad.
2
𝜒16; 0,01 = 32,00
Regla de decisión:
2
Rechazo 𝐻0 ) si 𝑌𝑜𝑏𝑠 ≥ 𝜒16; 0,01 = 32,00

𝑆 2 (𝑛 − 1) 0,82 (17 − 1)
𝑌𝑜𝑏𝑠 = = = 20,90
𝜎02 0,72

2
𝑌𝑜𝑏𝑠 = 20,90 < 32,00 = 𝜒16; 0,01 ⇒ 𝐷𝑒𝑐𝑖𝑠𝑖ó𝑛: 𝑁𝑜 𝑟𝑒𝑐ℎ𝑎𝑧𝑜 𝐻0 )

- 17 -
Conclusión: En base a la evidencia muestral y con un nivel de significación del 1% podemos
afirmar que la variancia de la vida útil de las componentes no es superior a 0,7 años.

Sin realizar cálculos, ¿hay forma de saber si el p-value será mayor o menor a 𝜶 = 𝟎, 𝟎𝟏?

Teniendo en cuenta que a través de los dos enfoques llegamos siempre al mismo
resultado, entonces a través del enfoque del p-value decidiríamos no rechazar H 0.
Teniendo esto en cuenta, y que la regla de decisión en el enfoque del p-value hubiese
sido “𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 𝑠𝑖 𝑝 − 𝑣𝑎𝑙𝑢𝑒 ≤ 𝛼”, entonces el p-value hubiese sido mayor a 𝛼 = 0,01.

Sin realizar cálculos, ¿hay forma de saber si el p-value será mayor o menor a 0,05?

Al no haber rechazado H0 con un nivel de significación de 1%, sabemos con certeza que
el p-value será mayor a 0,01. Sin embargo, es la única información que tenemos sin
realizar cálculos, y podría suceder que 𝑝 − 𝑣𝑎𝑙𝑢𝑒 = 0,30 o bien que 𝑝 − 𝑣𝑎𝑙𝑢𝑒 = 0,03. De
este modo, es imposible saber solo con ese dato si el p-value es mayor o menor que 0,05:
para saberlo con certeza deberíamos calcular el p-value.

Nota de la cátedra
El contenido de este documento está sujeto a correcciones, y se complementa
con las exposiciones en clase y el resto del material propuesto por el plantel
docente.
Muchas de las menciones realizadas en cada ejercicio pueden generalizarse a
otros. Queda propuesto (como forma de estudio y ejercicios propuestos) extender
las consideraciones al resto de las situaciones. Puntualmente será útil:

- La deducción de los límites de los intervalos de confianza para todos los


parámetros vistos en clase (promedio, proporción y variancia, así como
también para un parámetro genérico 𝜃).

- Poner en práctica la justificación de la distribución en probabilidad de las


estadísticas pivote y estadísticas de prueba para todas las situaciones
posibles (𝜎 conocido o 𝜎 desconocido, X Normal o no Normal, tamaño de
muestra chico o grande, etcétera).

- Test de hipótesis unilaterales por izquierda, por derecha y bilaterales.

- Resolución de test de hipótesis a través de ambos enfoques.

Es fundamental la práctica de la escritura simbólica y de la redacción de


interpretaciones y justificaciones.

- 18 -

También podría gustarte