PROBABILIDADES Y
ESTADÍSTICA _ MÓDULO XI
Ingeniería Industrial
Facultad de Ingeniería - UNSTA
Prof. Eugenia Matas
Módulo XI
• Objetivos: Desarrollar la noción de estimación por
intervalos, conocer y aplicar el método de estimación por
intervalos y su aplicación en situaciones reales.
Temas
• Concepto de estimación por intervalos
• Estimación por intervalos de confianza para la media,
para la diferencia de medias. Para la varianza, el cociente
entre dos varianzas, de una proporción.
Estimación por intervalos de confianza
• Es probable que incluso el estimador más eficiente no
estime al parámetro poblacional con exactitud. Es cierto
que la precisión se incrementa con muestras grandes,
pero de ningún modo se puede pretender o esperar que
la estimación puntual de una muestra de un valor idéntico
al del parámetro poblacional que se estima.
• Por ello, se desea que una estimación esté acompañada
de una posible medida de error de esa estimación. Esto
se puede hacer indicando el error estándar del estimador
o dando un intervalo que incluya al verdadero valor del
parámetro con un cierto nivel de confianza.
• Ejemplo: si se quiere reportar el diámetro promedio de
una pieza, en vez de decir que la media del diámetro se
estima en 25 mm se podría decir que, con confianza del
95%, el rendimiento promedio para esa máquina está
entre 23.5 y 26.5 mm
El procedimiento que permite calcular los límites superior e
inferior del intervalo antedicho se conoce como:
estimación por intervalo y al intervalo obtenido: Intervalo
de Confianza.
Ejemplo: Supongamos que tenemos una m.a. 𝑋1 , 𝑋2 , … , 𝑋𝑛
de una distribución 𝑁 𝜇, 𝜎02 con varianza 𝜎02 conocida.
𝜎02 ത
𝑋−𝜇
ത
Sabemos que 𝑋~𝑁 𝜇, sí y solo si ~𝑁 0,1 y por
𝑛 𝜎0Τ 𝑛
ത
𝑋−𝜇
lo tanto la 𝑃 −1.96(−𝑧0.025 ) ≤ ≤ 1.96(𝑧0.025 ) = 0.95
𝜎0Τ 𝑛
𝜎0 𝜎0
𝑃 −1.96 ത
≤ 𝑋 − 𝜇 ≤ 1.96 = 0.95
𝑛 𝑛
𝜎0 𝜎0
𝑃 𝑋ത − 1.96 ≤ 𝜇 ≤ 𝑋ത + 1.96 = 0.95
𝑛 𝑛
Es decir que la probabilidad de que el intervalo
𝜎0 𝜎0
ത
𝑋 − 1.96 ത
; 𝑋 + 1.96
𝑛 𝑛
contenga al verdadero valor del parámetro 𝜇 es 0.95. este
intervalo se denomina intervalo de confianza para 𝜇 de
nivel de confianza 0.95 (o 95%)
Definición: Una estimación por intervalo de un parámetro
poblacional 𝛉 es un intervalo aleatorio construido de tal
manera que la probabilidad de contener al parámetro sea
de 1 − 𝛼, es decir 𝑃 𝐿𝐼 ≤ 𝛉 ≤ 𝐿𝑆 = 1 − 𝛼, para 0 < 𝛼 < 1
• Esta expresión se lee: “el intervalo con límites aleatorios 𝐿𝐼 y
𝐿𝑆 tiene probabilidad 1 − 𝛼 de contener al parámetro 𝛉”.
No es correcto decir la probabilidad de que 𝛉 pertenezca al
intervalo es 1 − 𝛼 ya que el parámetro no es una variable
aleatoria, el intervalo es aleatorio ya que sus extremos son
funciones de la muestra.
• Donde 𝐿𝐼 = límite inferior , 𝐿𝑆 = límite superior y 1 − 𝛼
denota la confianza de la estimación. Aunque la confianza
se define como una cantidad entre 0 y 1, es frecuente
expresarla como porcentaje, es decir 1 − 𝛼 100%.
• Tanto 𝐿𝐼 como 𝐿𝑆 son dos funciones de la muestra.
• 𝛼 es un valor pequeño en general (0.10; 0.05; 0.01).
• Para un 𝛼 = 0.05 se tiene un intervalo de confianza del 95%.
Valores usuales de confianza son 0.95,0.99,0.999. Estos
niveles de confianza aunque ampliamente aceptados, no
constituyen una norma y pueden utilizarse otros.
INTERPRETACIÓN
• Decir que un intervalo tiene una confianza del 1 − 𝛼 ×
100% significa que: “si se utiliza el mismo procedimiento
de construcción del intervalo para 𝑚 muestras aleatorias
independientes de idéntico tamaño 𝑛 , entonces 𝑚 1 − 𝛼
intervalos contendrán al verdadero valor del parámetro”.
• Ejemplo: Si de una población con 𝜇 = 28, se toman 200
muestras independientes 𝑚 = 200 de tamaño "𝑛“ y se
construye por cada una un intervalo de confianza con
coeficiente 0,90 (o del 90%), entonces se debe “esperar”
que 180 de los 200 intervalos incluyan al valor 28.
Método general para obtener intervalos de confianza:
• Existe una función continua (estadístico) que relaciona al
parámetro 𝛉 y su estimador 𝜃 , esto es 𝑔 𝜃, 𝜃 .
• La función 𝑔 𝜃, 𝜃 tiene una distribución 𝑓 cuya
especificación (o forma funcional) no dependa del
parámetro 𝛉
• Esta función 𝑔 𝜃, 𝜃 se denomina pivote
• 𝑔 𝜃, 𝜃 es el estadístico que relaciona al parámetro y a su
estimador y 𝑓 su función de distribución, entonces : 𝑃൫𝑞1 ≤
𝑔 𝜃, 𝜃 ≤ 𝑞2 ൯ = 1 − 𝛼 implica que 𝑞1 es el valor tal que
𝛼
𝑃 𝑔 𝜃, 𝜃 ≤ 𝑞1 = y que 𝑞2 es el valor tal que 𝑃൫𝑔 𝜃, 𝜃 ≤
2
𝛼 𝛼
𝑞2 ൯ = 1 − o sea 𝑞1 deja a su izquierda un área de debajo
2 2
𝛼
de la distribución 𝑓 y 𝑞2 deja a su izquierda un área de 1 −
2
debajo de la distribución 𝑓.
• Una vez que se han determinado 𝑞1 y 𝑞2 , los límites 𝐿𝐼 y 𝐿𝑆
surgen despejando 𝛉 a partir de 𝑔 𝜃, 𝜃
• Observación: una vez construido el intervalo a partir de una
muestra dada, ya no tiene sentido hablar de probabilidad. En
tal caso, tenemos “confianza” de que el intervalo contenga a 𝛉.
La confianza está puesta en el método de construcción de los
intervalos, que nos asegura que 1 − 𝛼 100% de las muestras
producirán intervalos que contienen a 𝛉.
Estimación por IC de la media si se conoce 𝝈𝟐 (esto es una
generalización de los visto anteriormente)
• Para estimar a la media poblacional 𝜇, se utilizará como
estimador a la media muestral 𝑋. ത La función 𝑔 𝜇, 𝑋ത para
ത
𝑋−𝜇
relacionar 𝜇 y su estimador 𝑋ത podría ser: 𝑔 𝜇, 𝑋ത =
𝜎Τ 𝑛
• Si la muestra se selecciona de una población normal, la
ത
𝑋−𝜇
distribución de 𝑔 𝜇, 𝑋ത = ~𝑁 0,1 por lo visto en el
𝜎Τ 𝑛
Módulo X, esta distribución es independiente de 𝜇.
• Si 𝑧𝛼Τ2 es el valor de 𝑧 a la derecha del cual se tiene un
área de 𝛼Τ2 ( o sea deja a su izquierda un área de
𝛼
1− y −𝑧𝛼Τ2 es el valor de 𝑧 a la izquierda del cual se
2
tiene un área de 𝛼Τ2 observando la figura vemos que:
• 𝑃 −𝑧𝛼Τ2 ≤ 𝑍 ≤ 𝑧𝛼Τ2 = 1 − α
ത
𝑋−𝜇
• Donde 𝑍 = , reemplazando en la expresión anterior y
𝜎Τ 𝑛
trabajando algebraicamente tenemos que:
𝜎 𝜎
ത − 𝑧𝛼Τ2
• 𝑃 𝑋 ≤ 𝜇 ≤ 𝑋ത + 𝑧𝛼Τ2 =1−𝛼
𝑛 𝑛
• Se selecciona una muestra aleatoria de tamaño 𝑛 de una
población Normal cuya varianza 𝜎 2 se conoce, se calcula la
media 𝑥ҧ , el intervalo de confianza de 1 − 𝛼 × 100% para 𝜇
𝜎 𝜎
es : 𝐼𝐶 1−𝛼 100% 𝜇 = 𝑥ҧ − 𝑧𝛼Τ2 ; 𝑥ҧ + 𝑧𝛼Τ2 .
𝑛 𝑛
• Si se trabaja con una confianza del 95%, entonces 𝛼 = 0,05;
𝛼
2
=0,025 ; 1 − 𝛼2=0,975. Luego 𝑧𝛼Τ2 = 1.96 y -𝑧𝛼Τ2 = −1,96
• Si la muestra aleatoria tiene un 𝑛 lo bastante grande
𝑛 ≥ 30 , se puede determinar el intervalo de confianza de 𝜇
considerando que 𝑋ത será aproximadamente normal con media
𝜎2 ത
𝑋−𝜇
𝜇𝑋ത = μ y varianza 𝜎 𝑋ത = , por lo tanto 𝑔 𝜇, 𝑋ത =
2 =
𝑛 𝜎Τ 𝑛
𝑍~𝑎𝑝𝑟𝑜𝑥𝑁 0,1
• Siguiendo el procedimiento anterior tendremos que:Se
selecciona una muestra aleatoria de tamaño 𝑛 de una
población cuya varianza 𝜎 2 se conoce, se calcula la media 𝑥ҧ ,
el intervalo de confianza de 1 − 𝛼 × 100% para 𝜇 es:
𝜎 𝜎
• 𝐼𝐶 1−𝛼 100% 𝜇 = 𝑥ҧ − 𝑧𝛼 Τ2 ; 𝑥ҧ + 𝑧𝛼Τ2
𝑛 𝑛
• Ejemplo: Se calcula que la media de los promedios de las
notas de una muestra aleatoria de 36 alumnos universitarios
del último año es 2.6 . Encuentre el intervalo del 95% y del
99% para la media de los promedios académico del total de
alumnos del último año. Asuma que el desvío estándar de la
población es 0.3
• Los datos del ejemplo son 𝑛 = 36, 𝑥ҧ = 2.6 y 𝜎 = 0.3. No
sabemos nada sobre la distribución de la población de la
que fueron extraída los datos aparte de conocer la varianza,
pero como la muestra aleatoria tiene un 𝑛 = 36 lo
suficientemente grande 𝑛 ≥ 30 , se puede determinar el
intervalo de confianza de 𝜇 considerando que 𝑋ത será
aproximadamente normal, de los visto anteriormente la
forma de los intervalos de confianza buscados será
𝜎 𝜎
𝐼𝐶 1−𝛼 100% 𝜇 = 𝑥ҧ − 𝑧𝛼Τ2 ; 𝑥ҧ + 𝑧𝛼Τ2
𝑛 𝑛
• Para obtener el intervalo del 95% comenzamos teniendo en
cuenta que que 1 − 𝛼 × 100% = 95% ⇒ 1 − 𝛼 = 0.95 ⇒ 𝛼 =
0.05 ⇒ 𝛼Τ2 = 0.025, de donde 𝑧0.025 = 1.96
• Remplazando los datos tenemos que: 𝐼𝐶95% 𝜇 = ቂ2.6 −
0.3 0.3
𝑧0.025 ; 2.6 + 𝑧0.025 ቃ=
36 36
• 2.6 − 1.96 × 0.05; 2.6 + 1.96 × 0.05 = 2.50; 2.70
• Este intervalo se interpreta como: “Existe una confianza del
95% que el intervalo que va de 2.5 a 2.7 contenga al
verdadero valor de la media poblacional de los promedios
académicos de los alumnos universitarios del último año”.
• Para obtener el intervalo del 99% comenzamos teniendo en
cuenta que que 1 − 𝛼 × 100% = 99% ⇒ 1 − 𝛼 = 0.99 ⇒
𝛼 = 0.01 ⇒ 𝛼Τ2 = 0.005, de donde 𝑧0.005 = 2.58
• Reemplazando los datos tenemos que:
• 𝐼𝐶99% 𝜇 = 2.6 − 𝑧0.005 × 0.05; 2.6 + 𝑧0.005 × 0.05 = 2.47; 2.73
• Con este ejemplo observamos que se requiere un intervalo
mas grande para estimar 𝜇 con mayor precisión.
• Este intervalo se interpreta como: “Existe una confianza del
99% que el intervalo que va de 2.47 a 2.73 contenga al
verdadero valor de la media poblacional de los promedios
académicos de los alumnos universitarios del último año”.
Estimación por IC de la media si no se conoce 𝝈𝟐
• Con frecuencia se intenta estimar la media de una población
cuando se desconoce la varianza.
• Luego el estadístico que relaciona al estimador con el
parámetro a estimar que surge de lo visto en el Módulo IX
ത
𝑋−𝜇
ത
es: 𝑔 𝜇, 𝑋 = , recordemos que si se tiene una muestra
𝑠Τ 𝑛
aleatoria de una distribución normal, entonces la variable
ത
𝑋−𝜇
aleatoria T = tiene distribución 𝑡 de Student con 𝑛 − 1
𝑆Τ 𝑛
grados de libertad 𝑇 ~𝑡 𝑛−1
• El procedimiento para determinar el intervalo de confianza
es: 𝑃 −𝑡 𝑛−1 𝛼Τ2 ≤ 𝑇 ≤ 𝑡 𝑛−1 𝛼Τ2 = 1 − α, donde 𝑡 𝑛−1 𝛼Τ2
es el valor de 𝑡 con 𝑛 − 1 grados de libertad, que deja a la
derecha un área de 𝛼Τ2 y debido a la simetría deja un área
igual a 𝛼Τ2 a la izquierda de −𝑡𝛼Τ2 .
Estimación por IC de la media si no se conoce 𝝈𝟐
• Al sustituir 𝑇 y trabajando algebraicamente, tenemos que:
𝑆 𝑆
𝑃 𝑋ത − 𝑡 𝑛−1
𝛼Τ2 𝑛 ≤ 𝜇 ≤ 𝑋ത + 𝑡 𝑛−1 𝛼Τ2 =1−𝛼
𝑛
• Se selecciona una muestra aleatoria de tamaño 𝑛 de una
población normal cuya varianza 𝜎 2 no se conoce, se calcula la
media 𝑥ҧ y el desvío estándar 𝑠, el intervalo de confianza de
1 − 𝛼 × 100% para 𝜇 es:
𝑛−1 𝑠 𝑛−1 𝑠
𝐼𝐶 1−𝛼 ×100% 𝜇 = 𝑥ҧ − 𝑡 𝛼 Τ2 𝑛 ; 𝑥ҧ +𝑡 𝛼 Τ2 𝑛
donde 𝑡𝛼Τ2 el valor de 𝑡 con 𝑛 − 1 grados de libertad, que deja a
la derecha un área de 𝛼 Τ2
• También puede usarse la distribución 𝑡, cuando la distribución de
la cual se extrajo la m.a. tenga forma de campana e incluso
cuando no se pueda suponer normalidad, con varianza
desconocida y 𝑛 ≥ 30, 𝑠 podría reemplazar a 𝜎 y utilizar el
𝑠 𝑠
intervalo 𝑥ҧ − 𝑧𝛼Τ2 ≤ 𝜇 ≤ 𝑥ҧ + 𝑧𝛼Τ2
𝑛 𝑛
Ejemplo: Los contenidos de 7 recipientes similares de ácido
sulfúrico son 9.8, 10.2, 10.4, 9.8, 10.0, 10.2 y 9.6 𝑙𝑡. Encuentre un
intervalo de confianza del 95% para la media de todos los
recipientes, suponiendo una distribución aprox. normal.
Con la ayuda de Excel calculamos los elementos para poder
𝑛−1 𝑠
reemplazar en la expresión: 𝐼𝐶95% 𝜇 = 𝑥ҧ − 𝑡 𝛼 2 𝑛 ; 𝑥ҧ
Τ +
𝑛−1 𝑠
𝑡 𝛼 Τ2 𝑛൨
𝛼
Tenemos que = 0.025, 𝑛 = 7, 𝑥ҧ = 10.0, 𝑠 = 0,2828 y 𝑡 6 0.025 =
2
2.447. De donde 𝐼𝐶95% 𝜇 = 9.74; 10.26
Existe una confianza del 95% que el intervalo que va de 9.74 a
10.26 contenga al verdadero valor de la media poblacional de los
recipientes.
Estimación de la diferencia entre medias si se
conocen las varianzas
• Se tienen dos poblaciones normales, la primera con
media 𝜇1 y varianza 𝜎12 y la segunda con media 𝜇2 y
varianza 𝜎22 .
• El estimador puntual de la diferencia entre 𝜇1 y 𝜇2 lo da el
estadístico 𝑋ത1 − 𝑋ത2 . Para obtener una estimación puntual
de 𝜇1 − 𝜇2 se seleccionan dos m.a. independientes de
tamaños 𝑛1 y 𝑛2 y se calculan las diferencias de las
medias muestrales.
• Del Teorema estudiado en el Módulo IX podemos deducir
que la distribución muestral de la diferencia de medias
𝑋ത1 − 𝑋ത2 está distribuida de forma normal con media y
2 𝜎12 𝜎22
varianza: 𝜇𝑋ത1−𝑋ത2 = 𝜇1 − 𝜇2 , 𝜎 𝑋ത1−𝑋ത2 = 𝑛 + 𝑛
1 2
• Por lo que podemos usar como 𝑔 𝜇1 − 𝜇2 , 𝑋ത1 − 𝑋ത2 a 𝑍 =
𝑋ത1 − 𝑋ത2 − 𝜇1 −𝜇2
2 2
.El procedimiento para calcular el intervalo de
𝜎1 𝜎2
+
𝑛1 𝑛2
confianza es: 𝑃 −𝑧𝛼Τ2 ≤ 𝑍 ≤ 𝑧𝛼Τ2 = 1 − α reemplazando y
trabajando algebraicamente llegamos a:
𝜎12 𝜎22 𝜎12 𝜎22
• 𝑃 𝑋ത1 − 𝑋ത2 − 𝑧𝛼Τ2 + ≤ 𝜇1 − 𝜇2 ≤ 𝑋ത1 − 𝑋ത2 + 𝑧𝛼Τ2 + =1−𝛼
𝑛1 𝑛2 𝑛1 𝑛2
• Si 𝑥ҧ1 y 𝑥ҧ2 son las medias de dos muestras aleatorias
independientes de tamaños 𝑛1 y 𝑛2 de poblaciones
normales con varianzas conocidas 𝜎12 y 𝜎2 2
respectivamente, un intervalo de confianza de 1 − 𝛼 ×
100% para 𝜇1 − 𝜇2 es:
𝜎12 𝜎22
• 𝐼𝐶 1−𝛼 ×100% 𝜇1 − 𝜇2 = ቈ 𝑥ҧ1 − 𝑥ҧ2 − 𝑧𝛼Τ2 + ; 𝑥ҧ1 − 𝑥ҧ2 +
𝑛1 𝑛2
𝜎12 𝜎22
𝑧𝛼Τ2 +
𝑛1 𝑛2
• Para poblaciones que no son normales, si el tamaño de
ambas muestras 𝑛1 ≥ 30 𝑦 𝑛2 ≥ 30 por el Teorema
central del límite sabemos que 𝑋1 - 𝑋2 está distribuido de
manera aproximadamente normal con media y varianza:
𝜎12 𝜎22
𝜇𝑋ത1 −𝑋ത2 = 𝜇1 − 𝜇2 , 𝜎2 𝑋ത1 −𝑋ത2 = 𝑛 + , el intervalo para 𝜇1 −
1 𝑛2
𝜇2 tiene la forma antedicha.
• Ejemplo: Se aplica una prueba estandarizada de química
a 50 niñas y 75 niños. Las niñas obtienen una calificación
promedio de 76, y los niños de 82. Encuentre un intervalo
de confianza del 96% para la diferencia 𝜇1 − 𝜇2 , donde 𝜇1
es la calificación promedio de todos los niños y 𝜇2 es la
calificación promedio de todas las niñas que pudieron
realizar el examen. Suponga que las desviaciones
estándar de las poblaciones para las niñas y los niños
son 6 y 8 respectivamente.
La estimación de 𝜇1 − 𝜇2 es 𝑥1ҧ − 𝑥ҧ2 = 82 − 76 = 6. Utilizando 𝛼 =
0.04 tenemos que 𝑧0.02 = 2.05. Sustituyendo en 𝐼𝐶96% 𝜇1 − 𝜇2 =
𝜎12 𝜎22 𝜎12 𝜎22
𝑥ҧ1 − 𝑥ҧ2 − 𝑧𝛼Τ2 + ; 𝑥ҧ1 − 𝑥ҧ2 + 𝑧𝛼Τ2 +
𝑛1 𝑛2 𝑛1 𝑛2
64 36
Encontramos que 6 − 2.05 × + ≅ 3.43 y que 6 + 2.05 ×
75 50
64 36
+ ≅ 8.57 es decir 𝐼𝐶96% 𝜇1 − 𝜇2 = 3.43; 8.57
75 50
Estimación de la diferencia entre medias si se
desconocen las varianzas
• Si las varianzas no se conocen y las distribuciones
involucradas son aproximadamente normales, se usa la
distribución 𝑡 como en el caso de una sola muestra.
• Si no se está dispuesto a suponer normalidad, para muestras
grandes (mayores que 30), también se usará la distribución 𝑡,
pero se obtiene una aproximación del intervalo de confianza.
Estimación de la diferencia entre medias si se
desconocen las varianzas
Caso de varianzas iguales
• Considérese el caso en el cual se desconocen 𝜎12 y 𝜎22 . Si
𝜎12 = 𝜎22 = 𝜎 2 , se tiene que para estimar la diferencia de
𝑋ത1 − 𝑋ത2 − 𝜇1 −𝜇2
medias 𝜇1 − 𝜇2 , se usará el estadístico T= 1 1
,
𝑆𝑝 𝑛 +𝑛
1 2
2 𝑛1 −1 𝑆12 + 𝑛2 −1 𝑆22
donde 𝑆𝑝 = , por lo que podemos escribir:
𝑛1 +𝑛2 −2
𝑛1+𝑛2−2
𝑋ത1 − 𝑋ത2 − 𝜇1 − 𝜇2 𝑛1+𝑛2−2
𝑃 −𝑡 𝛼 Τ2 ≤ ≤𝑡 𝛼 Τ2 =1−𝛼
1 1
𝑆𝑝 +
𝑛1 𝑛2
• Se realizan los cálculos matemáticos para obtener 𝑥ҧ1 y 𝑥ҧ2 y
la varianza común 𝑠𝑝2 se obtiene el intervalo de confianza
• Si 𝑥ҧ1 y 𝑥ҧ2 son las medias de dos muestras aleatorias
independientes de tamaños 𝑛1 y 𝑛2 de poblaciones
aproximadamente normales con varianzas iguales pero
desconocidas 𝜎12 y 𝜎22 respectivamente, un intervalo de
confianza de 1 − 𝛼 × 100% para 𝜇1 − 𝜇2 es:
1 1
• 𝐼𝐶 1−𝛼 ×100% 𝜇1 − 𝜇2 = ቈ 𝑥1 − 𝑥2 − 𝑡𝛼Τ2 𝑠𝑝 + 𝑛 ; (𝑥1 −
𝑛1 2
1 1
𝑥2 ) +𝑡𝛼Τ2 𝑠𝑝 +𝑛
𝑛1 2
donde 𝑡𝛼Τ2 el valor de 𝑡 con 𝜈 = 𝑛1 + 𝑛2 − 2 grados de
libertad, que deja a la derecha un área de 𝛼Τ2
• Ejemplo: Se quiere determinar la relación entre parámetros
fisicoquímicos seleccionados y las diferentes mediciones de
las estructuras de la comunidad de macro invertebrados.
Una faceta de la investigación fue la evaluación de la
eficacia de un índice numérico de diversidad de especies
para indicar la degradación del agua debida al drenaje de
una mina de ácido.
Desde el punto de vista conceptual, un alto índice de diversidad en
las especies de macro invertebrados debe indicar un sistema de
agua no contaminado.
Para este estudio se seleccionaron dos estaciones independientes
para realizar el muestreo, una localizada río debajo de la
localización de la mina y la otra río arriba.
Para 12 muestras recogidas mensualmente
en la estación río abajo, el índice de
diversidad de especies tuvo un valor
promedio de 𝑥ҧ1 = 3.11 y un desvío de 𝑠1 =
0.771, mientras que en 10 muestras
recogidas mensualmente en la estación río
arriba, el valor del índice promedio fue 𝑥ҧ2 =
2.04 y un desvío de 𝑠2 = 0.448. Encuentre un
intervalo de confianza del 𝟗𝟎% para la
diferencia entre las medias poblacionales de
las dos estaciones, asumiendo que las
poblaciones están distribuidas
aproximadamente de forma normal con
varianzas iguales
• La estimación de 𝜇1 − 𝜇2 es 𝑥1ҧ − 𝑥ҧ2 = 3.11 − 2.04 = 1.07.
El estimador común 𝑠𝑝2 de la varianza común 𝜎 2 es:
2 𝑛1 −1 𝑠12 + 𝑛2 −1 𝑠22 11× 0.77712 +9× 0.4482
𝑠𝑝 = = = 0.417
𝑛1 +𝑛2 −2 12+10−2
• Al obtener la raíz cuadrada se obtiene 𝑠𝑝 = 0.646.
• Tenemos que 𝛼 = 0.01 tenemos que 𝑡0.005 = 1.725 para
𝜈 = 12 + 10 − 2 = 20 grados de libertad. Sustituyendo en
1 1
• 𝐼𝐶90% 𝜇1 − 𝜇2 = ቈ 𝑥1 − 𝑥2 − 𝑡𝛼 Τ2 𝑠𝑝 + ; (𝑥1 −
𝑛1 𝑛2
1 1
𝑥2 ) +𝑡𝛼Τ2 𝑠𝑝 +
𝑛1 𝑛2
1 1
• Encontramos que 1.07 − 1.725 × 0.646 + = 0.593 y
12 10
1 1
que 1.07 + 1.725 × 0.646 + = 1.547 lo que implica
12 10
que el 𝐼𝐶90% 𝜇1 − 𝜇2 = 0.593; 1.547
• Interpretación: Se tiene una confianza del 90% de que
el intervalo de 0.593 a 1.547 contiene la diferencia de las
medias poblacionales para valores de los índices de
diversidad de especies en las dos estaciones. El valor
que estaría indicando que no hay diferencia entre las
estaciones es “0” (cero), como los límites del intervalo de
confianza, claramente el valor cero no está contenido y
esto indicaría que en promedio, el índice de diversidad en
la estación ubicada río abajo del punto de descarga es
mayor que para la localizada río arriba.
Caso de varianzas distintas
• El procedimiento para determinar los intervalos de confianza
para 𝜎12 = 𝜎22 = 𝜎 2 desconocidas requiere la suposición de
que las poblaciones son normales. Las desviaciones ligeras
de la suposición de varianzas iguales o de la normalidad, no
altera el grado de confianza del intervalo.
• Si las varianzas son considerablemente diferentes, aún se
obtienen resultados razonables cuando las poblaciones son
normales, siempre que 𝑛1 = 𝑛2 .
• Consideremos el problema de estimar la diferencia de
′ 𝑋ത1 − 𝑋ത2 − 𝜇1 −𝜇2
medias 𝜇1 − 𝜇2 , se usará el estadístico 𝑇 = S
2
S
2
1 + 2
n1 n2
la cual tiene aproximadamente una distribución 𝑡 con 𝜈 =
2 2 2
S1 S2
n1
+ n2
2 2 2 2 grados de libertad
S1 S2
ൗ 𝑛1 −1 + ൗ 𝑛2 −1
n1 n2
• Dado que 𝜐 rara vez es un entero, se redondea al entero más
cercano.
• Podemos escribir: 𝑃 −𝑡𝛼 Τ2 ≤ 𝑇 ′ ≤ 𝑡𝛼 Τ2 ≅ 1 − 𝛼
• Al sustituir 𝑇 ′ en la desigualdad y trabajar algebraicamente,
luego reemplazar por los valores obtenidos para 𝑥ҧ1 , 𝑥ҧ2 , 𝑠12 y
𝑠22 provenientes de muestras pequeñas independientes 𝑛1 y
𝑛2 aproximadamente normales con varianzas diferentes y
desconocidas el intervalo de confianza aproximado de
1 − 𝛼 × 100% para 𝜇1 − 𝜇2 está dado por:
𝑠12 𝑠2 2 𝑠12 𝑠2 2
𝑥1 − 𝑥2 − 𝑡𝛼Τ2 + ≤ 𝜇1 − 𝜇2 ≤ 𝑥1 − 𝑥2 + 𝑡𝛼Τ2 +
𝑛1 𝑛2 𝑛1 𝑛2
2
S21 S22
+
n1 n2
donde 𝑡𝛼Τ2 el valor de 𝑡 con 𝜈 = 2 2
S21 S22
n1
ൗ 𝑛1 −1 + n2
ൗ 𝑛2 −1
grados de libertad, con un área de 𝛼 Τ2 a la derecha.
Estimación de una proporción mediante Intervalos de
Confianza
Sea 𝑋1 ,𝑋2 , … … . . , 𝑋𝑛 una muestra aleatoria de una distribución
𝐵𝑒𝑟 𝜋 . Entonces 𝑋 = σ𝑛𝑖=1 𝑋𝑖 ~𝐵𝑖𝑛 𝑛, 𝜋
Un estimador de la proporción 𝜋 de un experimento binomial
𝑋
está dado por el estadístico 𝜋ො = , donde 𝑋 representa el
𝑛
número de éxitos en 𝑛 intentos.
Si no se espera que el valor desconocido de la proporción 𝜋
se acerque demasiado a 0 o a 1 se puede establecer un
intervalo de confianza asintótico para 𝜋 utilizando el TCL.
𝑋 σ𝑛
𝑖=1 𝑋𝑖 𝜋 1−𝜋
Tenemos que 𝜋ො = = ~ 𝑁 𝜋,
𝑛 𝑛 𝑎𝑝𝑟𝑜𝑥 𝑛
𝑋 σ𝑛
𝑖=1 𝑋𝑖
Por la Ley de los grandes números 𝜋ො = = →𝜋
𝑛 𝑛 𝑝
Resumiendo: Para un 𝑛 lo suficientemente grande, 𝜋ො está
distribuida de forma aproximadamente normal, ya que puede
considerarse a 𝜋ො como la media muestral de 𝑛 valores que
toman el valor 0 ó 1 según sea éxito o fracaso.
2 ෝ 1−ෝ
𝜋 𝜋
La media es 𝜇𝜋ෝ = 𝜋 y la varianza 𝜎𝜋ෝ = por lo tanto
𝑛
𝑋
𝑛
−𝜋
𝑃 −𝑧𝛼Τ2 ≤ ≤ 𝑧𝛼Τ2 ≅ 1 − α tenemos que:
ෝ 1−ෝ
𝜋 𝜋
𝑛
𝑋 𝑋 𝑋 𝑋
𝑋 𝑛
1−𝑛 𝑋 𝑛
1−𝑛
•𝑃 − 𝑧𝛼Τ2 ≤𝜋≤ + 𝑧𝛼Τ2 ≅1−𝛼
𝑛 𝑛 𝑛 𝑛
Por lo tanto el intervalo de confianza aproximado del
1 − 𝛼 × 100 % para la proporción 𝜋 por la estimación
𝑥
puntual 𝜋ො = cuando esta es la proporción de éxitos en una
𝑛
muestra aleatoria de tamaño 𝑛 tiene la forma:
𝑋 𝑋 𝑋 𝑋
𝑋 1− 𝑋 1−
𝑛 𝑛 𝑛 𝑛
𝐼𝐶 1−𝛼 ×100% 𝜋 = − 𝑧𝛼Τ2 ; + 𝑧𝛼Τ2
𝑛 𝑛 𝑛 𝑛
Ejemplo: En una muestra aleatoria de tamaño 𝑛 = 500
familias que poseen televisiones en la ciudad de Hamilton,
Canadá, se encontró que 𝑥 = 340 se habían suscriptos a
HBO. Determinar el intervalo de confianza del 95% para la
proporción de familias de esta ciudad que suscriben a
HBO.
340
La estimación puntual de 𝜋 es 𝜋ො = = 0.68. Tenemos que
500
𝑧0.025 = 1.96 , por lo tanto encontramos que:
0.68×0.32 0.68×0.32
• 0.69 − 1.96 = 0.64 y que 0.69 + 1.96 =
500 500
0.72.
Interpretación: con un 95% de confianza el intervalo que va
de 0.64 a 0.72 es uno de los intervalos que contiene a la
proporción de familias de la ciudad de Hamilton suscriptas a
HBO.
Estimación de la varianza mediante Intervalos de
Confianza
• Si se toma una muestra de tamaño 𝑛 de una población
normal, con varianza 𝜎 2 , y se calcula la varianza muestral
𝑠 2 , se obtiene un valor del estadístico 𝑆 2 . Esta varianza
muestral se utilizará como una estimación puntual de 𝜎 2 .
• Se utilizará para obtener el intervalo de la estimación de la
2 𝑛−1 𝑆 2
varianza al estadístico: 𝜒 = que ya vimos tiene una
𝜎2
distribución Ji Cuadrada con ν = 𝑛 − 1 grados de libertad
cuando las muestras se seleccionan a partir de una
población normal.
𝑛−1 𝑆 2
• Se puede escribir: 𝑃 𝜒2 1−𝛼Τ2 ≤ < 𝜒2𝛼Τ2 = 1 − 𝛼
𝜎2
• Reemplazando y despejando se obtiene
𝑛 − 1 𝑆2 2
𝑛 − 1 𝑆 2
𝑃 2
< 𝜎 < 2 =1−𝛼
𝜒 𝛼Τ2 𝜒 1−𝛼Τ2
• Para la muestra aleatoria particular de tamaño 𝑛 extraída
de una población normal se calcula la varianza muestral
𝑠 2 y se obtiene el intervalo de confianza del 1 − 𝛼 ×
100% para 𝜎 2 que es:
2 𝑛−1 𝑆 2 𝑛−1 𝑆 2
𝐼𝐶 1−𝛼 ×100% 𝜎 = ; 2
𝜒2𝛼Τ2 𝜒 1−𝛼Τ2
Donde 𝜒2𝛼Τ2 y 𝜒21−𝛼Τ2 son valores de 𝜒 2 con ν = 𝑛 − 1 ,
con áreas de 𝛼Τ2 y 1 − 𝛼 Τ2, respectivamente a la derecha
• Ejemplo : la varianza de los pesos de 10 paquetes de
semillas de pasto de una determinada compañía es de
0.286. Obtenga el intervalo de confianza del 95%
• Como 𝛼 = 0.05 obtenemos con la App 𝜒 2 0.975 = 2.700,
𝜒 2 0.025 = 19.023 con 𝜈 = 9 grados de libertad.
9×0.286
• Por lo tanto tenemos que = 0.135 y además que
19.023
9×0.286
= 0.953 de donde el 𝐼𝐶95% 𝜎 2 = 0.135; 0.953
2.700
• Se tiene una confianza del 95% que el intervalo que va
de 0.135 a 0.953 contenga al verdadero valor de la
varianza poblacional de los pesos de los paquetes de
semillas de pasto de la compañía.
Estimación de la razón de dos varianzas
Una estimación puntual del cociente de dos varianzas
poblacionales 𝜎1 2 Τ𝜎2 2 está dada por la razón 𝑠1 2 Τ𝑠2 2 de
las varianzas muestrales. De aquí que el estadístico
𝑆1 2 Τ𝑆2 2 se llama estimador de 𝜎1 2 Τ𝜎2 2 .
Si 𝜎12 y 𝜎22 son las varianzas de poblaciones normales, se
puede establecer la estimación por intervalo de 𝜎1 2 Τ𝜎2 2
utilizando el estadístico:
𝑆12 Τ𝜎12 𝑆12 .𝜎22
𝐹= = tiene una distribución F con 𝜈1 y 𝜈2
𝑆22 Τ𝜎22 𝑆22 .𝜎12
grados de libertad
Si 𝑠12 y 𝑠22 son las varianzas de muestras independientes
de tamaño 𝑛1 y 𝑛2 , respectivamente, de poblaciones
normales, entonces un intervalo de confianza del
1 − 𝛼 100% para 𝜎1 2 Τ𝜎2 2 es:
𝑠1 2 1 𝜎1 2 𝑠1 2
2
< 2 < 2 𝑓𝛼Τ2 𝜈2 , 𝜈1
𝑠2 𝑓𝛼Τ2 𝜈1 , 𝜈2 𝜎2 𝑠2
Donde 𝑓𝛼Τ2 𝜈1 , 𝜈2 es un valor 𝑓 con 𝜈1 = 𝑛1 − 1 y 𝜈2 = 𝑛2 − 1
grados de libertad con un área de 𝛼Τ2 a la derecha, y
𝑓𝛼Τ2 𝜈2 , 𝜈1 es un valor similar 𝑓 con 𝜈2 = 𝑛2 − 1 y 𝜈1 = 𝑛1 − 1
grados de libertad.
Nota: Un intervalo de confianza del 1 − 𝛼 100% para 𝜎1 Τ𝜎2
se obtiene al sacar la raíz cuadrada de cada punto extremo
𝜎1 2
del intervalo para .
𝜎2 2
Ejemplo: En una fabrica los obreros nuevos requieren
alrededor de un mes de capacitación para alcanzar la máxima
eficiencia en una operación de ensamblaje. Se sugiere un
nuevo método de capacitación y se realiza una prueba para
compararlo con el método tradicional. Para este fin se
capacitan dos grupos de 9 obreros cada uno; en uno se
aplica el método nuevo y en el otro el método tradicional.
Al final de las tres semanas de capacitación se mide el
tiempo (en minutos) que le toma a cada empleado
ensamblar el dispositivo. Suponemos que los tiempos de
embalaje tienen una distribución aproximadamente normal
y las muestras son tomadas de forma independiente una
de otra. Las mediciones obtenidas fueron las siguientes :
la varianza de la muestra en el grupo con capacitación
tradicional fue de 24,44 y en método nuevo fue de 22,03.
Se pide construir un intervalo de confianza del 90% para el
cociente de varianza de los tiempos de embalaje en ambos
grupos ya que necesitamos realizar la estimación por
intervalos de la diferencia de esperanzas de los tiempos de
embalaje entre ambos grupos de obreros.
Necesitamos calcular 𝑓0,05 8,8 = 3.43810 reemplazando
en la forma del intervalo de confianza nos queda que:
𝜎1 2
El 𝐼𝐶90% = 0,322; 4,626
𝜎2 2
Observamos que el valor 1 está contenido en este
intervalo, indicando que las varianzas de los tiempo de
ensamble de los dos grupos pueden ser iguales, por lo que
es razonable suponer varianzas iguales en la construcción
del intervalo de la diferencia de esperanzas en los tiempos
de ensamblado en los grupos con diferente método de
capacitación.