100% encontró este documento útil (1 voto)
147 vistas33 páginas

Intervalos de Confianza en Estadística

Este documento trata sobre intervalos de confianza para estimar parámetros poblacionales a partir de datos de una muestra. Explica conceptos como media, proporción, varianza poblacional conocida y desconocida, y cómo calcular intervalos de confianza para la media en cada caso.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
100% encontró este documento útil (1 voto)
147 vistas33 páginas

Intervalos de Confianza en Estadística

Este documento trata sobre intervalos de confianza para estimar parámetros poblacionales a partir de datos de una muestra. Explica conceptos como media, proporción, varianza poblacional conocida y desconocida, y cómo calcular intervalos de confianza para la media en cada caso.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Estadística Inferencial

Semana 2
Intervalos de Confianza
Logro de la sesión
El alumno conoce los principales conceptos y tipos de
estimación, así como también, los principales conceptos
del intervalo de confianza para la
- Media
- Diferencia de Medias
- Proporción
- Diferencia de Proporciones
- Varianza
Estimación
Se trata de Parámetros Estadísticos
Muestra
emplear los
estadísticos para
Población 𝝁 Media ഥ
𝑿 (𝑛)
(𝑁)
estimar los
parámetros, lo 𝝅 Proporción
𝒑
cual es un
proceso de utilizar 𝝈 Desviación
𝑺
información de
una muestra
(Estadísticos) para Estimación Puntual Estimación por Intervalo
extraer Utilización de datos de la muestra para calcular un solo Ofrece un intervalo de
conclusiones número para estimar el parámetro de interés. valores razonables dentro
acerca de toda la Muestra: Alumnos de esta clase de estadística del cual se pretende que
población → 𝑿ഥ 𝑬𝒅𝒂𝒅 = 𝟐𝟒 𝒂ñ𝒐𝒔 esté el parámetro de
(Parámetros) interés 𝜽(𝝁, 𝝈, 𝝅) con
Poblacion: Edad promedio estimada de los estudiantes de la UTP
෡ ≅ 𝜽)
(𝜽 ഥ 𝑬𝒅𝒂𝒅 = 𝟐𝟒 𝒂ñ𝒐𝒔
→ 𝝁ෝ 𝑬𝒅𝒂𝒅 = 𝑿 cierto grado de confianza.

Datos/Observaciones
Estimación por Intervalos
En lugar de indicar El Nivel de Confianza es la probabilidad asumida Es decir, se puede garantizar
simplemente un de que el parámetro este contenido en el intervalo con una probabilidad de 𝟏 − 𝜶
único valor como de confianza buscado en el experimento . que el intervalo contendrá el
estimación del (𝟏 − 𝜶 = 𝟗𝟗%, 𝟗𝟖%, 𝟗𝟓%, 𝟗𝟎%, … ) valor verdadero de θ(𝜇, 𝜎, 𝜋)
parámetro
poblacional
෡ ≤ 𝜽 ≤ 𝑳𝒔𝒖𝒑 (𝜽)
𝑷 𝑳𝒊𝒏𝒇 (𝜽) ෡ =𝟏−𝜶 → ෡ 𝑳𝒔𝒖𝒑 (𝜽)
𝑰. 𝑪. 𝜽 = 𝑳𝒊𝒏𝒇 (𝜽), ෡
𝜃(𝜇, 𝜎, 𝜋), lo que
se hace es calcular
un intervalo de
valores en el que
se tiene cierta
probabilidad (nivel
de confianza) de
que se encuentre
el verdadero valor
de 𝜃 (parámetro).

Datos/Observaciones
Intervalo de Confianza
para la Media
Intervalo de Confianza
Varianza poblacional conocida
para la Media
𝝈 ഥ −𝝁
𝑿

𝑿~𝑵(𝝁, ) 𝒁 = 𝝈 ~𝑵(𝟎, 𝟏) 𝑷(𝒁𝜶ൗ ≤ 𝒁 ≤ 𝒁𝟏−𝜶ൗ ) = 𝟏 − 𝜶
𝒏 𝟐 𝟐
𝒏
𝑿ഥ −𝝁
→ 𝑷(𝒁𝜶ൗ ≤ 𝝈 ≤ 𝒁𝟏−𝜶ൗ ) = 𝟏 − 𝜶
𝟐 𝟐
𝒏
Nivel de 𝝈 𝝈

→ 𝑷(𝑿 − 𝒁𝟏−𝜶ൗ ഥ
≤ 𝝁 ≤ 𝑿 − 𝒁𝜶ൗ )=𝟏−𝜶
Confianza 𝟐 𝒏 𝟐 𝒏
𝜶ൗ 𝜶ൗ
𝟐 𝟏−𝜶 𝟐 𝝈 𝝈
ഥ − 𝒁𝟏−𝜶ൗ
→ 𝑷(𝑿 ഥ
≤ 𝝁 ≤ 𝑿 + 𝒁𝟏−𝜶ൗ )=𝟏−𝜶
𝟐 𝒏 𝟐 𝒏
𝒁𝜶ൗ 𝒁 𝒁𝟏−𝜶ൗ
𝟐 𝟐
Intervalo de Confianza para
la Media con Varianza Conocida
Si 𝝈𝟐 es conocida:
𝝈 𝝈
La población es Normal ó
no sabemos si la población
ഥ −𝒁 𝜶
𝑰. 𝑪. 𝝁 = 𝑿 ഥ+𝒁 𝜶
,𝑿
𝟏− 𝒏 𝟏−
es normal pero 𝒏 ≥ 𝟑𝟎 𝟐 𝟐 𝒏

Intervalo de Confianza para la Media


con 𝟏 − 𝜶 de confianza Error (𝜺) Tamaño de la Muestra (𝒏)
𝝈 𝝈 𝜎 𝑍(1−𝛼) . 𝜎 2
−𝒁𝟏−𝜶 ഥ≤ 𝒁 𝜶
≤𝝁−𝑿 𝜺 = 𝑋ത − 𝜇 ≤ 𝑍1−𝛼 2
𝟐 𝒏 𝟏− 𝟐 𝒏 2 𝑛 𝒏≥
𝜀

Longitud del Intervalo Error Estándar


𝝈 𝝈
ഥ−𝒁 𝜶
𝑿 𝝁 ഥ
𝑿 ഥ+𝒁 𝜶
𝑿 𝟏− 𝜎 𝜎
𝟏−
𝟐 𝒏 𝟐 𝒏
𝑳 = 2 𝑍1−𝛼 𝝈𝑿ഥ =
𝝈 𝝈 2 𝑛
𝑛
→ −𝒁𝟏−𝜶 ഥ≤ 𝒁 𝜶
≤𝝁−𝑿
𝟐 𝒏 𝟏− 𝟐 𝒏

Datos/Observaciones
Intervalo de Confianza para
la Media con Varianza Desconocida
Para población Normal, tamaño de 𝑺 𝑺
ഥ −𝑻 𝜶
𝑰. 𝑪. 𝝁 = 𝑿 ഥ
, 𝑿 + 𝑻(𝟏−𝜶,𝒏−𝟏)
muestra 𝒏 < 𝟑𝟎 y 𝝈𝟐 desconocida. (𝟏− ,𝒏−𝟏)
𝟐 𝒏 𝟐 𝒏
Para población con cualquier 𝑺 𝑺
distribución, tamaño de muestra ഥ −𝒁 𝜶
𝑰. 𝑪. 𝝁 = 𝑿 ഥ
, 𝑿 + 𝒁𝟏−𝜶
𝟏− 𝒏 𝟐 𝒏
𝒏 ≥ 𝟑𝟎 y 𝝈𝟐 desconocida. 𝟐

• Cuando la varianza poblacional no es conocida utilizamos la distribución


t- Student para tamaños de muestra 𝒏 < 𝟑𝟎.
• Como σ² no se conoce se estima mediante S².
• La distribución se desvía en forma apreciable cuando los grados de
libertad (𝒗 = 𝒏 − 𝟏) son pequeños.
• El estadístico 𝒕 definido resulta de una muestra aleatoria seleccionada
de una población normal, con varianza 𝜎² no conocida.

Datos/Observaciones
Uso de la tabla T - Student
𝑻𝒏−𝟏 𝛼 = 𝑻(𝜶, 𝒏 − 𝟏) = 𝑻(𝜶,𝒏−𝟏)
• Si 𝑛 = 8 y 𝛼 = 0.8 :
→ 𝑻(𝟎.𝟖, 𝟕) = 𝟎. 𝟖𝟗𝟔

• Si 𝑛 = 15 y 𝛼 = 0.94 :

→ 𝑻(𝟎.𝟗𝟒, 𝟏𝟒) = 𝟏. 𝟔𝟓𝟔

• Si 𝑛 = 4 y 𝛼 = 0.01 :
→ 𝑻(𝟎.𝟎𝟏, 𝟑) = −𝟒. 𝟓𝟒𝟎𝟕

Datos/Observaciones
Un fabricante produce focos que Datos Población Datos Muestra 𝝈 𝝈
ഥ−𝒁 𝜶
𝑰. 𝑪. 𝝁 = 𝑿 ഥ
, 𝑿 + 𝒁𝟏−𝜶
tienen un promedio de vida de 𝟏− 𝒏
𝑛 = 40 𝟐 𝟐 𝒏
distribución normal y una 𝜎 = 40 ℎ𝑜𝑟𝑎𝑠
𝑋ത = 780 horas 40 40
desviación estándar de 𝟒𝟎 horas. = 780 − (1.96) , 780 + (1.96)
a) Si una muestra de 𝟒𝟎 focos 40 40
𝐍. 𝐂 = 𝟏 − 𝛂 = 𝟗𝟓% = 0.95
tiene una vida promedio de = [780 − 12.4, 780 + 12.4]
𝜶
𝟕𝟖𝟎 horas, encuentre el → 𝛂 = 0. 05 → = 0.025
intervalo de confianza del 𝟐 → 𝑰. 𝑪. (𝝁) = [𝟕𝟔𝟕. 𝟔, 𝟕𝟗𝟐. 𝟒]
𝜶
𝟗𝟓% para la media de la → 𝟏 − = 0.975
población de todos los focos 𝟐 Con un nivel de confianza del 𝟗𝟓%, el
que produce la empresa. tiempo de vida promedio de los focos
→ 𝒁𝟎.𝟗𝟕𝟓 = 𝟏. 𝟗𝟔 estará entre 𝟕𝟔𝟕. 𝟔 y 𝟕𝟗𝟐. 𝟒 horas.
b) Que tan grande se requiere
que sea una muestra si se
desea tener una confianza del Tamaño de la Muestra (𝒏) Se requiere una muestra
𝟗𝟓% que la media 2 de 𝟔𝟐 focos para tener
𝑍(1−𝛼) . 𝜎 (1.96)(40)
2
poblacional estará dentro de 2 un error máximo 𝟏𝟎
𝒏≥ = =
= 61.46
61.46 ≅
≅ 62
62
las 𝟏𝟎 horas del promedio 𝜀 10 horas con 𝟗𝟓% de
muestral. confianza.
→ 𝒏 = 𝟔𝟐
Un proceso está programado para embolsar café. Se toma una muestra aleatoria de 26 bolsas, resultando
una media de 246.5 gramos y una desviación típica de 12 gramos. Construya un intervalo de confianza del
90% para el verdadero peso medio de las bolsas con café.

Datos Población Datos Muestra 𝑺 𝑺


ഥ −𝑻 𝜶
𝑰. 𝑪. 𝝁 = 𝑿 ഥ
, 𝑿 + 𝑻(𝟏−𝜶,𝒏−𝟏)
𝒏 = 26 < 30 (𝟏− ,𝒏−𝟏)
𝟐 𝒏 𝟐 𝒏
𝝈 =? ? ഥ = 𝟐𝟒𝟔. 𝟓
𝑿
12 12
𝑺 = 𝟏𝟐 = 246.5 − 𝑻(𝟎.𝟗𝟓,𝟐𝟓) , 246.5 + 𝑻(𝟎.𝟗𝟓,𝟐𝟓)
26 26
𝐍. 𝐂 = 𝟏 − 𝛂 = 90% = 0.9 = [ 246.5 − (1.708)(2.3534), 246.5 + (1.708)(2.3534)]
𝜶 = [ 246.5 − 4.0196, 246.5 + 4.0196]
→ 𝛂 = 0. 1 → = 0.05
𝟐
𝜶 → 𝑰. 𝑪. (𝝁) = [𝟐𝟒𝟐. 𝟒𝟖, 𝟐𝟓𝟎. 𝟓𝟐]
→ 𝟏 − = 0.95
𝟐 Con un nivel de confianza del 𝟗𝟎%, el peso promedio de
→ 𝑻(𝟎.𝟗𝟓,𝟐𝟓) = 𝟏. 𝟕𝟎𝟖 las bolsas de café estará entre 𝟐𝟒𝟐. 𝟒𝟖 𝒈𝒓 y 𝟐𝟓𝟎. 𝟓𝟐 𝒈𝒓.
Intervalo de Confianza para
la Diferencia de Medias
Intervalo de Confianza para la Diferencia de Medias
con Varianzas Conocidas y Desconocidas
Si 𝑋ത1 y 𝑋ത2 son las medias de dos muestras aleatorias independientes de tamaño 𝑛1 y 𝑛2 , dado un nivel de
confianza 𝟏 − 𝜶 , el intervalo de confianza para la diferencia de medias poblacionales:
𝑰. 𝑪. 𝝁𝟏 − 𝝁𝟐 = [𝑳𝑰𝒏𝒇 , 𝑳𝑺𝒖𝒑 ] 𝑳𝑰𝒏𝒇 ≤ 𝝁𝟏 − 𝝁𝟐 ≤ 𝑳𝑺𝒖𝒑 𝑷 𝑳𝑰𝒏𝒇 ≤ 𝝁𝟏 − 𝝁𝟐 ≤ 𝑳𝑺𝒖𝒑 = 𝟏 − 𝜶

estará dado según los cuatro casos que veremos mas adelante.

Veamos primero las interpretaciones de tres casos que se nos podrá presentar:
Si 𝑰. 𝑪. 𝝁𝟏 − 𝝁𝟐 = [+, +] 𝟎 < + ≤ 𝝁𝟏 − 𝝁𝟐 𝝁𝟐 < 𝝁𝟏 con 𝟏 − 𝜶 de confianza

Si 𝑰. 𝑪. 𝝁𝟏 − 𝝁𝟐 = [−, −] 𝝁𝟏 − 𝝁𝟐 ≤ − < 𝟎 𝝁𝟏 < 𝝁𝟐 con 𝟏 − 𝜶 de confianza

Si 𝑰. 𝑪. 𝝁𝟏 − 𝝁𝟐 = [−, +] − ≤ 𝝁𝟏 − 𝝁𝟐 ≤ + 𝝁𝟏 = 𝝁𝟐 con 𝟏 − 𝜶 de confianza

Datos/Observaciones
𝝈𝟐𝟏 y 𝝈𝟐𝟐 conocidas 𝝈𝟐𝟏 𝝈𝟐𝟐 𝝈𝟐𝟏 𝝈𝟐𝟐
ഥ 𝟏 −𝑿
(𝑿 ഥ 𝟐) − 𝒁 𝜶 + ഥ 𝟏 −𝑿
≤ 𝝁𝟏 − 𝝁𝟐 ≤ (𝑿 ഥ 𝟐) + 𝒁 𝜶 +
𝟏− 𝟐 𝒏𝟏 𝒏𝟐 𝟏− 𝟐 𝒏 𝒏𝟐
𝟏

𝝈𝟐𝟏 y 𝝈𝟐𝟐 desconocidas 𝑺𝟐𝟏 𝑺𝟐𝟐 𝑺𝟐𝟏 𝑺𝟐𝟐


ഥ 𝟏 −𝑿
(𝑿 ഥ 𝟐) − 𝒁 𝜶 + ഥ 𝟏 −𝑿
≤ 𝝁𝟏 − 𝝁𝟐 ≤ (𝑿 ഥ 𝟐) + 𝒁 𝜶 +
𝟏− 𝒏𝟏 𝒏𝟐 𝟏− 𝟐 𝒏 𝒏𝟐
𝒏𝟏 y 𝒏𝟐 grandes (𝒏𝒊 > 𝟑𝟎) 𝟐 𝟏

𝒏𝟏 y 𝒏𝟐 pequeños
𝟏 𝟏 𝟏 𝟏
ഥ 𝟏 −𝑿
(𝑿 ഥ 𝟐) − 𝑻 𝜶 𝑺𝟐
𝒑 + ഥ 𝟏 −𝑿
≤ 𝝁𝟏 − 𝝁𝟐 ≤ (𝑿 ഥ 𝟐) + 𝑻 𝜶 𝑺𝟐
𝒑 +
(𝒗,𝟏− ) 𝒏𝟏 𝒏𝟐 (𝒗,𝟏−𝟐 ) 𝒏𝟏 𝒏𝟐
𝟐
𝝈𝟐𝟏 = 𝝈𝟐𝟐 (𝒏𝟏 − 𝟏)𝑺𝟐𝟏 +(𝒏𝟐 − 𝟏)𝑺𝟐𝟐
𝒈. 𝒍. = 𝒗 = 𝒏𝟏 + 𝒏𝟐 − 𝟐 , 𝑺𝟐𝒑 =
𝒏𝟏 + 𝒏𝟏 − 𝟐

𝟐
𝒔𝟐𝟏 𝒔𝟐𝟐
+
𝒏𝟏 𝒏𝟐
𝑺𝟐𝟏 𝑺𝟐𝟐 𝑺𝟐𝟏 𝑺𝟐𝟐
𝝈𝟐𝟏 ≠ 𝝈𝟐𝟐 ഥ 𝟏 −𝑿
(𝑿 ഥ 𝟐) − 𝑻 𝜶
(𝒗,𝟏− )
+
𝒏𝟏 𝒏𝟐
ഥ 𝟏 −𝑿
≤ 𝝁𝟏 − 𝝁𝟐 ≤ (𝑿 ഥ 𝟐) + 𝑻 𝜶
(𝒗,𝟏−𝟐 ) 𝒏
+
𝒏𝟐
, 𝒗= 𝒔𝟐𝟏
𝟐
𝒔𝟐𝟐
𝟐
𝟐 𝟏 𝒏𝟏 𝒏𝟐
+
𝒏𝟏 − 𝟏 𝒏𝟐 − 𝟏
Se quiere comparar el gasto mensual en arbitrios de dos ciudades A y B, por lo cual se toma una muestra al azar de
300 hogares de cada ciudad, donde la media de la ciudad A resulto S/. 250 y la de B; S/. 235. Si se sabe que la
desviación poblacional en A es de S/. 60 y en B de S/. 50, calcule el intervalo de confianza a un 95% para la diferencia
de medias e indique que ciudad tiene mayor gasto.

Ciudad A Ciudad B Variable: 𝑋 = Gasto Arbitrio (en soles)


𝜶
Población Muestra Población Muestra 𝐍. 𝐂 = 𝟏 − 𝛂 = 𝟗𝟓% = 0.95 → 𝛂 = 0. 05 → = 0.025
𝟐
𝜎𝐴 = 60 𝑛𝐴 = 300 𝜎𝐵 = 50 𝑛𝐵 = 300 𝜶
𝑋ത𝐴 = 250 𝑋ത𝐵 = 235
→ 𝟏 − = 0.975 → 𝒁𝟎.𝟗𝟕𝟓 = 𝟏. 𝟗𝟔
𝟐
Varianzas Poblacionales Conocidas
𝝈𝟐𝑨 𝝈𝟐𝑩 𝝈𝟐𝑨 𝝈𝟐𝑩 Con un nivel de confianza
ഥ 𝑨 −𝑿
(𝑿 ഥ 𝑩) − 𝒁 𝜶 + ഥ 𝑨 −𝑿
≤ 𝝁𝑨 − 𝝁𝑩 ≤ (𝑿 ഥ 𝑩) + 𝒁 𝜶 + del 95%, dado el
𝟏− 𝒏𝑨 𝒏𝑩 𝟏−
𝟐 𝟐 𝒏𝑨 𝒏𝑩
intervalo de confianza; se
𝟓𝟎 𝟐 𝟔𝟎 𝟐 (𝟓𝟎)𝟐 (𝟔𝟎)𝟐
puede deducir que la
→ 𝟐𝟓𝟎 − 𝟐𝟑𝟓 − 𝟏. 𝟗𝟔 + ≤ 𝝁𝑨 − 𝝁𝑩 ≤ 𝟐𝟓𝟎 − 𝟐𝟑𝟓 + (𝟏. 𝟗𝟔) + ciudad A tiene mayor
𝟑𝟎𝟎 𝟑𝟎𝟎 𝟑𝟎𝟎 𝟑𝟎𝟎
gasto ya que los límites
→ 𝟏𝟓 − 𝟖. 𝟖𝟑𝟖 ≤ 𝝁𝑨 − 𝝁𝑩 ≤ 𝟏𝟓 + 𝟖. 𝟖𝟑𝟖 del IC son positivos.
→ 𝟔. 𝟏𝟔𝟐 ≤ 𝝁𝑨 − 𝝁𝑩 ≤ 𝟐𝟑. 𝟖𝟑𝟖

→ −𝟐𝟑. 𝟖𝟑𝟖 ≤ 𝝁𝑩 − 𝝁𝑨 ≤ −𝟔. 𝟏𝟔𝟐


La siguiente tabla presenta los resultados de dos muestras aleatorias para comparar el contenido Marca A B
de nicotina de dos marcas de cigarrillos. Suponiendo que los conjuntos de datos provienen de ഥ
𝑿 5.1 5
muestras tomadas al azar de poblaciones normales con varianzas desconocidas e iguales. A un
𝒏 12 10
98% de confianza ¿Se puede decir que en promedio los cigarrillos de la marca A contienen la
misma cantidad de nicotina que los de la marca B?. 𝑺 0.6 0.4

𝜶 𝜶
Variable: 𝑋 = Unidades de nicotina 𝐍. 𝐂 = 𝟏 − 𝛂 = 𝟗𝟖% = 0.98 → 𝛂 = 0. 02 → = 0.01 →𝟏− = 0.99
𝟐 𝟐
Varianzas Desconocidas pero Iguales → 𝑻(𝟐𝟎,𝟎.𝟗𝟗) = 𝟐. 𝟓𝟐𝟖
𝟏 𝟏 𝟏 𝟏
ഥ 𝑨 −𝑿
(𝑿 ഥ𝑩) − 𝑻 𝜶 𝑺𝟐𝒑 + ഥ 𝑨 −𝑿
≤ 𝝁𝑨 − 𝝁𝑩 ≤ (𝑿 ഥ 𝑩) + 𝑻 𝜶 𝑺𝟐
𝒑 +
𝒗,𝟏− 𝒏𝑨 𝒏𝑩 (𝒗,𝟏− ) 𝒏𝑨 𝒏𝑩
𝟐 𝟐

𝒈. 𝒍. = 𝒗 = 𝒏𝟏 + 𝒏𝟐 − 𝟐 , 𝑺𝟐𝒑 =
(𝒏𝑨 − 𝟏)𝑺𝟐𝑨 +(𝒏𝑩 − 𝟏)𝑺𝟐𝑩
𝒏𝑨 + 𝒏𝑩 − 𝟐
→ 𝑣 = 12 + 10 − 2 Con un nivel de
10 − 1 (0.4)2 +(12 − 1)(0.6)2
→ 𝒗 = 𝟐𝟎 2
→ 𝑆𝑝 = = 𝟎. 𝟐𝟕 confianza del 98%, se
10 + 12 − 2
puede decir que la
𝟏 𝟏 𝟏 𝟏 cantidad media de
→ 𝟓. 𝟏 − 𝟓 − 𝟐. 𝟓𝟐𝟖 𝟎. 𝟐𝟕 + ≤ 𝝁𝑨 − 𝝁𝑩 ≤ 𝟓. 𝟏 − 𝟓 + (𝟐. 𝟓𝟐𝟖) (𝟎. 𝟐𝟕) +
𝟏𝟎 𝟏𝟐 𝟏𝟎 𝟏𝟐 nicotina en ambas
marcas es la misma
→ 𝟎. 𝟏 − 𝟎. 𝟓𝟔𝟐𝟓 ≤ 𝝁𝑨 − 𝝁𝑩 ≤ 𝟎. 𝟏 + 𝟎. 𝟓𝟔𝟐𝟓

→ −𝟎. 𝟒𝟔𝟐𝟓 ≤ 𝝁𝑨 − 𝝁𝑩 ≤ 𝟎. 𝟔𝟔𝟐𝟓 → 𝝁𝑨 = 𝝁𝑩


Intervalo de Confianza
para la Proporción
Intervalo de Confianza
para la Proporción
Dada una muestra de tamaño 𝒏 y
proporción 𝒑 de una variable a 𝒑𝒒 𝒑𝒒
estudiar 𝑿, el I.C para la proporción 𝑰. 𝑪. 𝝅 = 𝒑 − 𝒁𝟏−𝜶 , 𝒑 + 𝒁𝟏−𝜶
poblacional 𝝅 será: 𝟐 𝒏 𝟐 𝒏

𝒑 es la proporción Ejemplo
𝑿 𝑋 2065
de éxitos en 𝒑= 𝒏: Total de votos
𝒏 𝒑= =
nuestra muestra. (𝟐𝟎𝟎𝟎𝟎) 𝑛 20000
𝑿: Votos No Validos
𝒒 es la proporción (𝟐𝟎𝟔𝟓) → 𝒑 = 0.10325 = 𝟏𝟎. 𝟑𝟐%
de fracasos en 𝒒=𝟏−𝒑 𝒑: Proporción de votos
nuestra muestra. No Validos → 𝒒 = 1 − 0.10325 = 𝟎. 𝟖𝟗𝟔𝟖 = 𝟖𝟗. 𝟔𝟖%

Datos/Observaciones
Un proceso está programado para embolsar la cantidad media gramos de café. Últimamente se ha visto
que la maquina está embolsando menos, por tal razón se toma una muestra aleatoria de 𝟐𝟎𝟎 bolsas,
resultando que 22 de ellas tienen menos de 250 gramos. Construya un intervalo de confianza del 90%
para la proporción de bolsas con menor peso de lo deseado.

𝒑: proporción de bolsas con menor peso.


𝒑𝒒 𝒑𝒒
Datos Muestra
𝑰. 𝑪. 𝝅 = 𝒑 − 𝒁𝟏−𝜶 , 𝒑 + 𝒁𝟏−𝜶
𝟐 𝒏 𝟐 𝒏
𝒏 = 200 𝑿 = 22
22 0.11 0.89 (0.11)(0.89)
𝒑= = 𝟎. 𝟏𝟏 → 𝒒 = 1 − 0.11 = 𝟎. 𝟖𝟗 → 0.11 − (1.65) ≤ 𝜋 ≤ 0.11 + (1.65)
200 200 200

𝐍. 𝐂 = 𝟏 − 𝛂 = 90% = 0.9 → 0.11 − (1.65)(0.0221) ≤ 𝜋 ≤ 0.11 + (1.65)(0.0221)


𝜶
→ 𝛂 = 0. 1 → = 0.05 → 0.11 − 0.0365 ≤ 𝜋 ≤ 0.11 + 0.0365
𝟐
→ 𝒁𝟏−𝜶 = 𝒁𝟎.𝟗𝟓 = 𝟏. 𝟔𝟓 → 𝑰. 𝑪. 𝝅 = [𝟎. 𝟎𝟕𝟑𝟓, 𝟎. 𝟏𝟒𝟔𝟓]
𝟐

Con un nivel de confianza del 90%, la proporción de las bolsas de café


con menor peso estará entre 7.35% y 14.65%.
En las elecciones de este año, a un conteo de boca de urna se obtuvo que de 2000 votos; el 10.32% fueron
votos no válidos. Construya un intervalo de confianza del 95% para el porcentaje de votos validos.

𝑿: Votos Validos
𝒑𝒒 𝒑𝒒
𝒑: Porcentaje de Votos Validos 𝑰. 𝑪. 𝝅 = 𝒑 − 𝒁𝟏−𝜶 , 𝒑 + 𝒁𝟏−𝜶
𝟐 𝒏 𝟐 𝒏
𝒒: Porcentaje de Votos No Validos

Datos Muestra 0.8968 0.1032 0.8968 0.1032


→ 0.8968 − 1.96 ≤ 𝜋 ≤ 0.8968 + (1.96)
2000 2000
𝒏 = 2000
𝒒 = 10.32% = 0.1032 = 𝟏 − 𝒑 → 0.8968 − 1.96 0.0068 ≤ 𝜋 ≤ 0.8968 + (1.96)(0.0068)
𝒑 = 0.8968 → 0.8968 − 0.0133 ≤ 𝜋 ≤ 0.8968 + 0.0133

𝐍. 𝐂 = 𝟏 − 𝛂 = 95% = 0.95 → 𝑰. 𝑪. 𝝅 = [𝟎. 𝟖𝟖𝟑𝟓, 𝟎. 𝟗𝟏𝟎𝟏]


𝜶
→ 𝛂 = 0. 05 → = 0.025
𝟐 Con un nivel de confianza del 95%, el porcentaje de votos válidos
→ 𝒁𝟏−𝜶 = 𝒁𝟎.𝟗𝟕𝟓 = 𝟏. 𝟗𝟔 estará entre 88.35% y 91.01%.
𝟐
Intervalo de Confianza para la
Diferencia de Proporciones
Intervalo de Confianza para
la Diferencia de Proporciones
Dados 𝒑1 y 𝒏1 de una muestra tomada de una primera población y, 𝒑2 y 𝒏2 de otra muestra tomada de
una segunda población, el intervalo de confianza para la diferencia de las proporciones poblacionales
𝝅𝟏 − 𝝅𝟐 dado un nivel de confianza 1 − 𝛼 estará dado por

𝒑𝟏 𝟏 − 𝒑𝟏 𝒑𝟐 𝟏 − 𝒑𝟐 𝒑𝟏 𝟏 − 𝒑𝟏 𝒑𝟐 𝟏 − 𝒑𝟐
𝑰. 𝑪. 𝝅𝟏 − 𝝅𝟐 = 𝒑𝟏 − 𝒑𝟐 − 𝒁𝟏−𝜶 + , 𝒑𝟏 − 𝒑𝟐 + 𝒁𝟏−𝜶 +
𝟐 𝒏𝟏 𝒏𝟐 𝟐 𝒏𝟏 𝒏𝟐

Recordemos las interpretaciones de tres casos que se nos podrá presentar:


Si 𝑰. 𝑪. 𝝅𝟏 − 𝝅𝟐 = [+, +] 𝟎 < + ≤ 𝝅𝟏 − 𝝅𝟐 𝝅𝟐 < 𝝅𝟏 con 𝟏 − 𝜶 de confianza

Si 𝑰. 𝑪. 𝝅𝟏 − 𝝅𝟐 = [−, −] 𝝅𝟏 − 𝝅𝟐 ≤ − < 𝟎 𝝅𝟏 < 𝝅𝟐 con 𝟏 − 𝜶 de confianza

Si 𝑰. 𝑪. 𝝅𝟏 − 𝝅𝟐 = [−, +] − ≤ 𝝅𝟏 − 𝝅 𝟐 ≤ + 𝝅𝟏 = 𝝅𝟐 con 𝟏 − 𝜶 de confianza

Datos/Observaciones
Se hace un estudio a dos muestras de estudiantes de ingeniería, 500 en lima y 300 en provincia. Se obtiene
que, de la muestra en Lima, el 25% de estudiantes de ingeniería son mujeres y en provincia solo el 20%.
Halle el intervalo de confianza del 95% para la diferencia de proporciones ¿A que conclusión se llega?

𝒑 = Proporción de estudiantes mujeres 𝜶


𝐍. 𝐂 = 𝟏 − 𝛂 = 𝟗𝟓% = 0.95 → 𝛂 = 0. 05 → = 0.025
Muestra 𝟐
𝜶
Lima 𝒏𝑳 = 500 𝒑𝑳 = 25% = 0.25 → 𝟏 − = 0.975 → 𝒁𝟏−𝜶 = 𝒁𝟎.𝟗𝟕𝟓 = 𝟏. 𝟗𝟔
𝟐 𝟐
Provincia 𝒏𝑷 = 300 𝒑𝑷 = 20% = 0.2

𝒑𝑳 𝟏 − 𝒑𝑳 𝒑𝑷 𝟏 − 𝒑𝑷 Con una confianza del 95%,


𝑰. 𝑪. 𝝅𝑳 − 𝝅𝑷 = 𝒑𝑳 − 𝒑𝑷 ± 𝒁𝟏−𝜶 + se puede decir que la
𝟐 𝒏𝑳 𝒏𝑷
proporción de estudiantes
mujeres de ingeniería en
0.25 1 − 0.25 0.2 1 − 0.2
= 0.25 − 0.2 ± 1.96 + Lima y la proporción en
500 300 Provincia son la misma.

→ 𝑰. 𝑪. 𝝅𝑳 − 𝝅𝑷 = 0.05 ± 1.96 0.0301 = 0.05 ± 0.059

→ −0.009 ≤ 𝝅𝑳 − 𝝅𝑷 ≤ 0.109
Intervalo de Confianza
para la Varianza
Distribución Muestral de la Varianza
El estadístico 𝑺𝟐 (𝑜 𝑺𝟐𝒏−𝟏 ) Muestras ഥ )𝟐
σ𝒏𝒊=𝟏(𝒙𝒊 − 𝑿
es un buen estimador del Población (tamaño 𝑛)
𝟐
𝑺 =
𝒏−𝟏
parámetro 𝝈𝟐 , es decir, si σ 𝑁
(𝑥 − 𝜇) 2
𝑖=1 𝑖
simuláramos tomar muchas 𝝈𝟐 = Muestra 1 𝑺𝟐 Muestra 1

muestras de tamaño 𝒏 y en
𝑁
cada una de ellas Muestra 2 𝑺𝟐 Muestra 2
calculáramos la varianza
muestral, hallaríamos que: 2 ⋮ ⋮
𝟐
𝑆𝜎2 =𝑺 variable aleatoria Muestra K 𝑺𝟐
La media de la varianza Muestra K

muestral se encuentra
cerca de la varianza
poblacional 𝜎 2 𝑺𝟐 Muestra 𝟏 + 𝑺𝟐 Muestra 𝟐 + ⋯ + 𝑺𝟐 Muestra 𝑲
𝑬(𝑺𝟐𝒏−𝟏 )=𝝈𝟐 → 𝝈𝟐
𝑲 𝐾 → +∞

Datos/Observaciones
Distribución Chi - Cuadrado
Si la población de las cuales se extraen las
(𝒏−𝟏)𝑺𝟐
muestras es Normal, la variable
𝝈𝟐
tiene una distribución Chi – Cuadrado con
n-1 grados de libertad:
(𝒏 − 𝟏)𝑺𝟐
𝟐
~𝝌𝟐𝒏−𝟏
𝝈

Si 𝑛 es suficientemente grande, la
distribución de la variable tiene
forma de la distribución Normal.

Datos/Observaciones
Uso de la tabla Chi - Cuadrado
• Si 𝑛 = 8 y 𝛼 = 0.025 :
𝝌𝟐𝒏−𝟏 𝛼 = 𝝌𝟐(𝜶,𝒏−𝟏) = 𝝌𝟐(𝟎.𝟎𝟐𝟓,𝟖−𝟏)

→ 𝝌𝟐(𝟎.𝟎𝟐𝟓,𝟕) = 𝟏. 𝟔𝟗𝟎

• Si 𝑛 = 15 y 𝛼 = 0.1 :

→ 𝝌𝟐(𝟎.𝟏,𝟏𝟒) = 𝟕. 𝟕𝟗𝟎

• Si 𝑛 = 4 y 𝛼 = 0.05 :

→ 𝝌𝟐(𝟎.𝟎𝟓,𝟑) = 𝟎. 𝟑𝟓𝟐

Datos/Observaciones
Intervalo de Confianza para la Varianza

𝑷(𝝌𝟐 𝜶Τ ,𝒏−𝟏 < 𝝌𝟐 < 𝝌𝟐 (𝟏−𝜶Τ ,𝒏−𝟏) ) = 𝟏 − 𝜶


𝟐 𝒏−𝟏 𝟐

Región de Confianza
(𝒏−𝟏)𝑺𝟐
(𝒏 − 𝟏)𝑺𝟐
~𝝌𝟐𝒏−𝟏
𝑃(𝜒 2 (𝛼Τ2,𝑛−1) < < 𝜒 2 (1−𝛼Τ ,𝑛−1) ) = 1 − 𝛼
𝝈𝟐 𝝈𝟐 2

𝑛−1 𝑆 2 (𝑛−1)𝑆 2
𝑃( < 𝝈𝟐 < )=1−𝛼
𝜒2 𝛼 𝜒2 𝛼
1− 2 ,𝑛−1 ( 2 ,𝑛−1)

𝜶ൗ
𝟐 𝟏−𝜶 𝜶ൗ
Nivel de Confianza 𝟐 𝒏 − 𝟏 𝑺𝟐 (𝒏 − 𝟏)𝑺𝟐
𝑰. 𝑪. 𝝈𝟐 = 𝟐 , 𝟐
𝝌 𝟏−𝜶 ,𝒏−𝟏 𝝌 (𝜶 ,𝒏−𝟏)
𝟐 𝟐
𝝌𝟐 (𝜶ൗ 𝝌𝟐 𝝌𝟐
𝟐,𝒏−𝟏) 𝒏−𝟏 (𝟏−𝜶ൗ𝟐,𝒏−𝟏)

Datos/Observaciones
En el área de producción de una gran embotelladora se desea estudiar la variabilidad del diámetro de la
tapa de frasco, para ello se realiza una muestra de 24 envases donde la varianza es de 4.9 𝑚𝑚2 . Si al
95% de confianza, la desviación es menor a 1.41 𝑚𝑚, no se procede a hacer una revisión de las
maquinas, en caso contrario se hará una revisión general. Con la información obtenida ¿que procede?

Muestra 𝑵. 𝑪 = 𝟏 − 𝜶 = 𝟗𝟓% = 𝟎. 𝟗𝟓 𝒏 − 𝟏 𝑺𝟐 (𝒏 − 𝟏)𝑺𝟐


𝑰. 𝑪. 𝝈𝟐 = 𝟐 ,
𝒏 = 𝟐𝟒 𝜶 𝜶 𝝌 𝟏−𝜶 ,𝒏−𝟏 𝝌𝟐 (𝜶 ,𝒏−𝟏)
→ = 0. 025 𝑦 𝟏 − = 0.975 𝟐 𝟐
𝑺𝟐 = 𝟒. 𝟗 𝟐 𝟐

→ 𝝌𝟐 (𝟎.𝟗𝟕𝟓,𝟐𝟑) = 𝟑𝟖. 𝟎𝟕𝟔 23 4.9 23 4.9


→ 𝑰. 𝑪. 𝝈𝟐 = , = [𝟐. 𝟗𝟔𝟎, 𝟗. 𝟔𝟒𝟐]
38.076 11.689
→ 𝝌𝟐 (𝟎.𝟎𝟐𝟓,𝟐𝟑) = 𝟏𝟏. 𝟔𝟖𝟗
→ 2.960 ≤ 𝝈𝟐 ≤ 9.641 → 2.960 ≤ 𝝈 ≤ 9.642

→ 𝑰. 𝑪. 𝝈 = [𝟏. 𝟕𝟐𝟎, 𝟑. 𝟏𝟎𝟓𝟏]


Con 95% de confianza, la desviación
poblacional es mayor a 1.41 mm, así se → 𝝈 ≥ 𝟏. 𝟕𝟐𝟎 > 𝟏. 𝟒𝟏 → 𝝈 > 𝟏. 𝟒𝟏
procede a hacer la revisión.
Actualmente el nivel de ventas promedio en una empresa es de 17.5 miles de soles con una varianza de
7.1 (miles de soles)2 entre los ejecutivos de ventas. Con la finalidad de que las ventas se igualen entre los
ejecutivos se les da un nuevo entrenamiento en ventas, luego se toma a 28 ejecutivos, los cuales dieron como
resultado una varianza de 3.9 (miles de soles)2 . Utilizando un intervalo de confianza al 90% ¿se puede decir
que las ventas después del nuevo entrenamiento son menos variables?

Muestra 𝑵. 𝑪 = 𝟏 − 𝜶 = 𝟗𝟎% = 𝟎. 𝟗𝟎 𝒏 − 𝟏 𝑺𝟐 (𝒏 − 𝟏)𝑺𝟐


𝟐
𝜶 𝜶 𝑰. 𝑪. 𝝈 = 𝟐 ,
𝒏 = 𝟐𝟖 → = 0. 05 𝑦 𝟏 − = 0.95 𝝌 𝟏−𝜶 ,𝒏−𝟏 𝝌𝟐 (𝜶 ,𝒏−𝟏)
𝟐 𝟐 𝟐 𝟐
𝑺𝟐 = 𝟑. 𝟗
→ 𝝌𝟐 (𝟎.𝟎𝟓,𝟐𝟕) = 𝟏𝟔. 𝟏𝟓𝟏
𝟐𝟕 𝟑. 𝟗 𝟐𝟕 𝟑. 𝟗 𝟏𝟎𝟓. 𝟑 𝟏𝟎𝟓. 𝟑
→ 𝑰. 𝑪. 𝝈𝟐 = , = ,
→ 𝝌𝟐 = 𝟒𝟎. 𝟏𝟏𝟑 𝟒𝟎. 𝟏𝟏𝟑 𝟏𝟔. 𝟏𝟓𝟏 𝟒𝟎. 𝟏𝟏𝟑 𝟏𝟔. 𝟏𝟓𝟏
(𝟎.𝟗𝟓,𝟐𝟕)
→ 𝑰. 𝑪. 𝝈𝟐 = 𝟐. 𝟔𝟐𝟓, 𝟔. 𝟓𝟐𝟎

Con 90% de confianza, la varianza poblacional es menor a 7.1 → 𝟐. 𝟔𝟐𝟓 ≤ 𝝈𝟐 ≤ 𝟔. 𝟓𝟐𝟎 < 𝟕. 𝟏
(miles de soles)2 , se puede decir que las ventas después
del entrenamiento son menos variables.
Practica Calificada 1
La Practica Calificada 1 comienza las 20:30 pm y
termina a las 22:00 pm

También podría gustarte