ESTADISTICA INFERENCIAL
Ejercicio 11
The Cincinnati Enquirer informa que en Estados Unidos 66% de los adultos y 87% de los jóvenes entre 12 y 17
años usan Internet (The Cincinnati Enquirer, 7 de febrero de 2006). Considere estos datos como proporciones
poblacionales y suponga que se usará una muestra de 300 adultos y 300 jóvenes para obtener información
respecto de su opinión acerca de la seguridad en Internet.
a) Describa la distribución de muestreo de 𝑝,ҧ siendo 𝑝ҧ la proporción muestral de adultos que usan Internet.
np ≥ 5 y n(1 - p) ≥ 5 300(0.66) = 198 y 300(1 – 0.66) = 102 ambos mayores que 5 es una distribución normal con
𝑃(1 −𝑃) 0.66(1 −0.66)
𝜎𝑝ҧ = = = 0.02735
𝑛 300 𝜎𝑝ҧ = 0.0273
E(𝑝)ҧ = 0.66 y 𝜎𝑝ҧ = 0.02735
E(𝑝)ҧ = 0.66
b) ¿Cuál es la probabilidad de que la diferencia entre la proporción muestral y la proporción poblacional de
adultos que usan Internet no sea mayor que ± 0.04?
E(𝑝)ҧ = 𝜇 = 0.66 𝜎𝑝ҧ = 0.02735
𝜇 ± 0.04
0.66 ± 0.04 = 0.7 y 0.62
𝑋 − 𝜇 0.7 − 0.66
z= = = 1.4652 = 1.47
𝜎 0.0273
Vamos a la tabla
𝑋 − 𝜇 0.62 − 0.66
z= = = -1.4652 = - 1.47
𝜎 0.0273
P(1.47) = 0.9292
P = 0.9292 – 0.0708 = 0.8584
P(- 1.47) = 0.0708
c) ¿Cuál es la probabilidad de que la diferencia entre la proporción muestral y la proporción poblacional de
jóvenes que usan Internet no sea mayor que ± 0.04?
𝑃(1 −𝑃) 0.87(1 −0.87)
E(𝑝)ҧ = 𝜇 = 0.87 𝜎𝑝ҧ = = = 0.019416
𝑛 300
𝜇 ± 0.04
0.87 ± 0.04 = 0.91 y 0.83
𝑋 − 𝜇 0.91 −0.87
z= = = 2.06
𝜎 0.019416
Vamos a la tabla
𝑋 − 𝜇 0.83 −0.87
z= = = - 2.06
𝜎 0.0199416
P(2.06) = 0.9803
P = 0.9803 – 0.0197 = 0.9606
P(- 2.06) = 0.0197
Muestreo, distribuciones de muestreo y estimadores puntuales
Valor Esperado E(𝑥ҧ ) = 𝜇 Valor Esperado E(𝑝)=
ҧ p
Selección De Una Muestra
(Estimador puntual 𝑥ҧ ) (Estimador puntual 𝑝)ҧ
Estimación por intervalo de la media de una población
estimación por intervalo
𝜎 conocida
La cadena mantiene su liderazgo
Supermercados de Estados en precios bajos y asegura la
Unidos, con 1,200 tiendas en calidad a partir de eficientes
11 estados del sudeste y el controles
Atlántico medio.
Fundada
1957
Entre ellos, formatos estándar de
Siendo un negocio intensivo en
tienda, diseño innovador de los
inventarios, Food Lion decidió
almacenes, instalaciones con uso
adoptar como forma de valuación
eficiente de energía y sincronización
de inventarios el método UEPS
de datos con los proveedores.
el cual compara los costos y los
ingresos actuales, minimizando
los efectos de los cambios
radicales de precios sobre los
resultados de utilidad y pérdida
Además, el método UEPS reduce la utilidad neta, disminuyendo con
ello los impuestos al ingreso o sobre la renta durante los periodos de
inflación.
Food Lion establece un índice UEPS para cada uno de los siete grupos de
inventario: abarrotes, papel/artículos para el hogar, artículos para mascotas,
bienes para la salud y la belleza, lácteos, cigarros/tabaco y cervezas/vinos
Para ahorrar tiempo y gastos Por ejemplo, un índice UEPS de
excesivos por el conteo del inventario 1.008 para el grupo de abarrotes
en las 1 200 tiendas, Food Lion indica que el valor de este
selecciona una muestra aleatoria inventario, a los costos actuales,
simple de 50 establecimientos. El refleja un aumento de 0.8%
inventario físico de final de año se debido a la inflación en el último
realiza en cada una de las tiendas de periodo de un año.
la muestra.
Con un nivel de confianza de 95%, Food
Lion calculó un margen de error de 0.006 En uno de los últimos años, la
para la estimación muestral. Por tanto, el estimación muestral del índice
intervalo de 1.009 a 1.021 proporciona UEPS para el inventario del grupo
una estimación por intervalo de de productos de salud y belleza
confianza de 95% del índice UEPS fue de 1.015
poblacional
También verán cómo usar esta información para construir e interpretar
Aprenderán cómo calcular el margen de error asociado con una estimaciones por intervalo para una media poblacional y una proporción
estimación puntual. poblacional.
Hasta ahora hemos visto que un estimador puntual es un estadístico muestral que se usa para estimar un
parámetro poblacional. Por ejemplo, la media muestral 𝑥ҧ es un estimador puntual de la media poblacional µ, y
la proporción muestral 𝑝ҧ es un estimador puntual de la proporción poblacional p.
Como no se puede esperar que dicho estadístico muestral suministre el valor exacto del parámetro poblacional,
se suele calcular una estimación por intervalo al sumar y restar a la estimación puntual una cantidad llamada
margen de error. La forma general de una estimación por intervalo es:
Estimación puntual ± margen de error
El objetivo de la estimación por intervalo es aportar información sobre qué tan cerca se encuentra la
estimación puntual obtenida de la muestra, del valor del parámetro poblacional
Vamos a ver cómo obtener una estimación por intervalo para la media poblacional µ y para la proporción
poblacional p. La fórmula general para obtener una estimación por intervalo de una media poblacional es la
siguiente.
𝑥ҧ ± margen de error
De manera similar, la fórmula general para obtener una estimación por intervalo de una proporción poblacional
es la que se indica enseguida.
𝑝ҧ ± margen de error
Las distribuciones de muestreo de 𝑥ҧ y de 𝑝ҧ son clave para calcular estas estimaciones por intervalo
Media poblacional: σ conocida
Para obtener una estimación por intervalo para la media poblacional se necesita la desviación estándar poblacional σ
o la desviación estándar muestral s a efecto de calcular el margen de error
En la mayoría de los casos no se conoce σ, y para calcular el margen de error se emplea s. Sin embargo, en algunas
aplicaciones se cuenta con una gran cantidad de datos anteriores (históricos) que se pueden usar para calcular la
desviación estándar poblacional antes de tomar la muestra.
También en aplicaciones sobre control de calidad, en las que se supone que el proceso se desarrolla
correctamente o “en control”, se considera que se conoce la desviación estándar. A tales situaciones se les
denomina casos de σ conocida
Para una estimación por intervalo de la media poblacional se realiza con la siguiente expresión
donde (1 - α) es el coeficiente de confianza y 𝑧∝/2 es el valor de Z que
proporciona un área α/2 en la cola superior de la distribución de
probabilidad normal estándar
Veamos un ejemplo en el que es razonable considerar que se conoce σ y se muestra cómo construir una estimación
por intervalo.
Un comercio selecciona una muestra aleatoria simple de 100 clientes con objeto de conocer información acerca de
la cantidad que gastan en cada visita a la tienda
Si x representa la cantidad gastada en cada visita a la tienda, la media muestral n, 𝑥ҧ es una estimación puntual de µ,
la cantidad media gastada en cada visita a la tienda por la población integrada por los clientes del comercio
La tienda ha realizado estos estudios semanales durante varios años. Con base en sus datos anteriores, supone que
el valor conocido de la desviación estándar poblacional es σ = $20. Los datos anteriores (históricos) indican también
que la población tiene una distribución normal.
En la semana más reciente, en su estudio de 100 clientes (n = 100), la tienda obtuvo como media muestral 𝑥ҧ = $82
Construir un intervalo de confianza con un 95%
𝜎
𝑥ҧ ± 𝑧𝛼/2 𝑧𝛼/2 es el valor de z que proporciona un área α/2 en la cola superior de
𝑛
la distribución de probabilidad normal estándar
∝ = 1 - 0.95 = 0.05 α/2 = 0.05/2 = 0.025 P = (1 – 0.025) = 0.975
En la tabla de probabilidad normal estándar se encuentra que 95% de los valores de cualquier variable aleatoria
distribuida normalmente aparecen dentro de 𝑧∝/2 ±1.96
𝜎
𝑥ҧ ± 𝑧𝛼/2 𝑥ҧ = $82 n = 100 σ = $20 𝑧∝/2 ±1.96
𝑛
𝜎 20
𝑥ҧ ± 𝑧𝛼/2 𝑥ҧ ± 1.96 𝑥ҧ ± 1.96*(2) 𝑥ҧ ± 3.92 82 ± 3.92
𝑛 100
nivel de confianza de 95%
Al valor 0.95 se le conoce como coeficiente de confianza
y al intervalo 78.08 a 85.92 como intervalo de confianza de 95%.
Veámoslo gráficamente
Distribución de muestreo de x que ilustra la ubicación de la media muestral
que está dentro de 3,92 de µ
Aunque a menudo se usa un nivel de confianza de 95%, también suelen utilizarse otros niveles, como 90 y 99%
∝ = 1 - 0.90 = 0.10 α/2 = 0.10/2 = 0.05 P = (1 – 0.05) = 0.950
∝ = 1 - 0.99 = 0.01 α/2 = 0.01/2 = 0.005 P = (1 – 0.005) = 0.995
Buscando los valores de z en la tabla para esas probabilidades
0.950
1.645
0.995
2.575
Valores de 𝑧∝/2 para los niveles de confianza más utilizados
Nivel de confianza ∝ ∝/2 𝑧∝/2
90% 0.10 0.05 1.645
95% 0.05 0.025 1.960
99% 0.01 0.005 2.575
Si la población tiene una distribución normal, el intervalo de confianza que se obtiene con la expresión es exacto.
En otras palabras, si esta expresión se usa repetidas veces para generar intervalos de confianza de 95%, exactamente
95% de los intervalos generados contendrán la media poblacional.
Si la población no tiene una distribución normal, el intervalo de confianza obtenido con la expresión será aproximado.
En tal caso, la calidad de la aproximación depende tanto de la distribución de la población como del tamaño de la
muestra
En la mayoría de las aplicaciones, cuando se utiliza la expresión recién vista, un tamaño de muestra n ≥ 30 es
adecuado para obtener una estimación por intervalo de la media poblacional.
El procedimiento de estimación por intervalo aquí estudiado se basa en el supuesto de que la desviación estándar
poblacional σ es conocida.
Decir que σ es conocida significa que se cuenta con datos históricos o con otra información que permita obtener
una buena estimación de la desviación estándar poblacional antes de tomar la muestra que se usará para obtener
la estimación de la media poblacional
De manera que, técnicamente, esto no significa que σ se conozca con seguridad. Sólo significa que se obtuvo una
buena estimación de la desviación estándar antes de tomar la muestra,
El tamaño de la muestra n aparece en el denominador de la expresión para la estimación por intervalo.
En consecuencia, si un determinado tamaño de muestra proporciona un intervalo demasiado amplio como para que
tenga utilidad práctica, se debe considerar aumentar el tamaño de la muestra.
AVISOS
Se han recibido tres grupos
Segundo parcial Jueves 18 de marzo