ESTADÍSTICA INFERENCIAL. ACTIVIDAD [Link].
MATERIA: ESTÁDISTICA INFERENCIAL.
MAESTRA: LAURA SOTO ARMENTA.
ACTIVIDAD 1.- “EJERCICIOS SOBRE
DISTRIBUCIONES MUESTRALES”.
ALUMNO: RODRIGO FUENTES SALAZAR.
23/NOV/2024
ESTADÍSTICA INFERENCIAL. ACTIVIDAD [Link].
ACTIVIDAD 1: EJERCICIOS SOBRE DISTRIBUCIONES
MUESTRALES.
Con base en el material consultado en la unidad resuelve los ejercicios que se
plantean acerca de los siguientes temas:
➢ Distribuciones muestrales.
➢ Teorema del Límite Central (TLC).
Técnicas básicas.
1. Una población consta de cinco números: 2,3,6,8,11. Considere todas las muestras
posibles de tamaño dos que pueden extraerse con reemplazo de esta población.
Encontrar:
a. La media de la población.
𝜇 =Σ𝑥𝑖/𝑁 =2 + 3 + 6 + 8 + 11 / 5
𝝁=6
b. La desviación estándar de la población.
(𝒙𝒊 − 𝝁)𝟐
𝝈 = √∑
𝑵
(𝟐 − 𝟔) 𝟐 + (𝟑 − 𝟔) 𝟐 + (𝟔 − 𝟔) 𝟐 + (𝟖 − 𝟔) 𝟐 + (𝟏𝟏 − 𝟔) 𝟐
𝝈=√
𝟓
(−𝟒) 𝟐 + (−𝟑) 𝟐 + (𝟎) 𝟐 + (𝟐) 𝟐 + (𝟓) 𝟐
𝝈√
𝟓
σ√10 − 8
𝝈 = 𝟑. 𝟐𝟗
c. El valor esperado de la media muestral.
Tenemos un muestreo con reposición y la ecuación es:
𝑵n
𝑁 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛
𝑛 = 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑜𝑠 𝑔𝑟𝑢𝑝𝑜𝑠 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
𝑵n = 𝟓2
𝑵n = 𝟐𝟓
Nuestra muestra consta de 25 elementos.
2 3 6 8 11
2 2.0 2.5 4.0 5.0 6.5
3 2.5 3.0 4.5 5.5 7.0
6 4.0 4.5 6.0 7.0 8.5
8 5.0 5.5 7.0 8.0 9.5
11 6.5 7.0 8.5 9.5 11.5
(2,0) + (2,5) + (3,0) + (4,0) + (4,5) + (5,0) + (5,5) + (6,0) + (6,5) + (7,0) + ⋯ + (8,0) + (8,5) + (9,5) + (11,5)
𝜇=
25
150
𝜇=
25
𝝁=𝟔
ESTADÍSTICA INFERENCIAL. ACTIVIDAD [Link].
d. La desviación estándar (error estándar) de la media muestra.
𝜎 = √∑(𝑥𝑖 − 𝜇)2
(2 − 6) 2 + (2.5 − 6) 2 + (4 − 6) 2 + (5 − 6) 2 + (6.5 − 6) 2 + (2.5 − 6) 2 + (11 − 6) 2
𝜎=√
25
𝜎 = √5. 4
𝝈 = 𝟐. 𝟑𝟐
2.- Se seleccionaron muestras aleatorias de tamaño n de poblaciones con las
medias y varianzas dadas aquí. Encuentre la media y desviación estándar de la
distribución de muestreo de la media muestral X en cada caso:
a. n = 36, 𝝁 = 10, 𝝈 𝟐 = 9
𝜇 = 𝜇𝑥̅= 10
𝜎
𝜎𝑥̅= 𝑛
√
𝑥 3
𝜎 =
√36
= 0.5
b. n = 100, 𝝁 = 5, 𝝈 𝟐= 4
𝜇 = 𝜇𝑥̅= 5
𝜎
𝜎𝑥̅= 𝑛
√
2
𝜎𝑥 =
√100
= 0.2
c. n = 8, 𝝁 = 120, 𝝈 𝟐= 1
𝜇 = 𝜇𝑥̅= 5
𝜎
𝜎𝑥̅= 𝑛= 120
√
21
𝜎𝑥 =
√8
= 0.35
Si las poblaciones muestreadas son normales, ¿cuál es la distribución de
muestreo de X para los incisos a, b y c?
R= Cuando la población muestreada es normal, la distribución de muestreo también
lo es, sin importar el tamaño de la muestra como en el inciso c) que es n= 8.
De acuerdo con el Teorema del Límite Central, si las poblaciones muestreadas
no son normales, ¿qué se puede decir acerca de la distribución muestral de X
para los incisos a, b y c?
R= El Teorema del Límite Central nos dice que para que la distribución muestral se
ESTADÍSTICA INFERENCIAL. ACTIVIDAD [Link].
considere normal, aunque la población no lo sea, n debe ser grande igual o mayor a
30. El inciso a) y b) cumplen a excepción de c), donde el tamaño de muestra es igual
a n= 8.
3. Una muestra aleatoria de n observaciones se selecciona de una población
con desviación estándar 𝜎 = 1. Calcule el error estándar de la media (SE) para
los siguientes valores de n.
a.n =1
b. n = 2
c.n = 4
d. n = 9
e. n = 16
f.
n = 25
g.
n = 100
4. Se seleccionaron muestras aleatorias de tamaño n de poblaciones
binomiales con parámetros poblacionales p dados aquí. Encuentre la media y
la desviación estándar de la distribución de muestreo de la proporción
muestral pˆ en cada caso:
ESTADÍSTICA INFERENCIAL. ACTIVIDAD [Link].
5. ¿Es adecuado utilizar la distribución normal para aproximar la distribución
de muestreo de P ˆ en las siguientes circunstancias?
Si es adecuado, si se cumple al menos una de las siguientes condiciones:
• 𝑛 > 30
• 𝑛𝑝 ≥ 5
a. n= 50, p= 0.05
Cumple con una de las condiciones:
• 𝑛 > 30 ⇒ 50 > 30
• 𝑛𝑝 ≥ 5 ⇒ (50)(0.05) ≥ 5 ⇒ 2.5 ≥ 5
Por lo tanto:
𝜇𝑝̂ = 𝑝 𝑦
𝑝𝑞
𝜎𝜌 = √
𝑛
𝜇𝑝̂ = 0.05 𝑦 𝜎𝑝̂ = 0.03
b. n= = 75, p= 0.1
Cumple con las dos condiciones:
• 𝑛 > 30 ⇒ 75 > 30
ESTADÍSTICA INFERENCIAL. ACTIVIDAD [Link].
• 𝑛𝑝 ≥ 5 ⇒ (75)(0.1) ≥ 5 ⇒ 7.5 ≥ 5
Por lo tanto:
𝜇𝑝̂ = 𝑝 𝑦
𝑝𝑞
𝜎𝜌 = √
𝑛
𝜇𝑝̂ = 0.1 𝑦 𝜎𝑝̂ = 0.04
c. n= 250, p= 0.99
Cumple con las dos condiciones:
• 𝑛 > 30 ⇒ 250 > 30
• 𝑛𝑝 ≥ 5 ⇒ (250)(0.99) ≥ 5 ⇒ 247.5 ≥ 5
Por lo tanto:
𝜇𝑝̂ = 𝑝 𝑦
𝑝𝑞
𝜎𝜌 = √
𝑛
𝜇𝑝̂ = 0.99 𝑦 𝜎𝑝̂ = 0.006
Aplicaciones.
1. Enfermedad de Alzheimer. La duración de la enfermedad de Alzheimer desde el
principio de los síntomas hasta el fallecimiento varía de 3 a 20 años; el promedio es
8 años con una desviación estándar de 4 años. El administrador de un gran centro
médico selecciona al azar, de la base de datos del centro, los registros médicos de
30 pacientes de Alzheimer ya fallecidos y anota la duración de la enfermedad para
cada unidad en muestra. Encuentre las probabilidades aproximadas para los
siguientes eventos:
a. La duración promedio es menor a 7 años.
• Debemos calcular el valor de 𝑧 para 𝑥̅ = 7, pero antes debemos calcular el
valor de la desviación estándar muestral.
Por lo tanto:
𝑃(𝑥̅ < 7) = 𝑃(𝑧 < −1.37) = 𝑃(𝑧 < 0) − 𝑃(−1.37 < 𝑧 < 0)
= 0.5 − 0.4147 = 𝟎. 𝟎𝟖𝟓𝟑
𝑃(𝑧 < −1.37)
ESTADÍSTICA INFERENCIAL. ACTIVIDAD [Link].
b. La duración promedio excede de 7 años.
𝑃(𝑥̅ > 7) = 𝑃(𝑧 > −1.37) = 1 − 𝑃(𝑧 < −1.37)
= 1 − 0.0853 = 𝟎. 𝟗𝟏𝟒𝟕
c. La duración promedio está a no más de un año de la media poblacional 𝝁 =
8
𝑃(7 < 𝑥̅ < 9) = 𝑃(−1.37 < 𝑧 < 1.37) = 𝑃(𝑧 > −1.37) − 𝑃(𝑧 < −1.37)
= 0.9147 − 0.0853 = 𝟎. 𝟖𝟐𝟗𝟒
𝑃(−1.37 < 𝑧 < 1.37)
Grafique el error estándar de la media (SE) contra el tamaño muestral n y
enlace los puntos con una curva suave. ¿Cuál es el efecto de aumentar el
ESTADÍSTICA INFERENCIAL. ACTIVIDAD [Link].
tamaño de muestra sobre el error estándar?
A medida que el tamaño de la muestra aumenta el error estándar va siendo menor.
2.
2.- Salarios de profesores. Suponga que los profesores de una universidad en
E.U.A. -con rango de profesor en instituciones públicas que imparten programas
académicos de dos años-, ganan un promedio de 71,802 dólares por año, con una
desviación estándar de 4,000 dólares. En un ejercicio por verificar este nivel de
salario se seleccionó una muestra aleatoria de 60 profesores de una base de datos
del personal académico de todas las instituciones públicas que imparten programas
de dos años en E.U.A.
Describa la distribución de muestreo de la media muestral X
Calculamos la media y la distribución muestrales
𝜇𝑥̅ = 𝜇 = 71,802
𝜎 4,000
𝜎𝑥̅ = = = 516.4
√𝑛 √60
a. ¿Dentro de qué límites se esperaría que esté el promedio muestral,
con probabilidad 0.95?
• Primero determinamos los valores de z que limitan el 0.95:
Dado 0.95 como área central, las dos colas deben contener un total de 0.05.
Por lo tanto, cada cola contiene21 de 0.05, o sea 0.025. Debemos encontrar
los valores de z para 𝑧(0.025) y 𝑧(0.975) = −𝑧(0.025)
ESTADÍSTICA INFERENCIAL. ACTIVIDAD [Link].
Para hallar 𝑧(0.025) debemos determinar el área entre la media y 𝑧(0.025). Que es 0.5-
0.025=0.4750 .
En la tabla de z, buscamos el valor z que le corresponde a 0.4750 y es 1.96. Por lo tanto:
𝑧(0.025) = 1.96
𝑧(0.975) = −𝑧(0.025) = −1.96
Conociendo los límites de z, podemos calcular los límites de la media muestral.
𝑥̅ − 𝜇
𝑍𝑐 = 𝜎
√𝑛
Para 𝑧(0.025) = 1.96
𝜎 𝜎
𝑥̅ = 𝑧 ( )+𝜇
√𝑛
4000
𝑥̅ = 𝑧 ( ) + 𝜇 = 1.96 ( ) + 71,802 = 72,814.14 = 72,814 dolares
√𝑛 √60
Para 𝑧(0.975) = −𝑧(0.025) = −1.96
𝜎
𝑥̅ = 𝑧 ( ) + 𝜇 = −1.96 ( 4000
)+ 71,802 = 70,789.86 = 70,790 dolares
√𝑛 √60
Los límites de la media son:
𝟕𝟎, 𝟕𝟗𝟎 < 𝝁 < 𝟕𝟐, 𝟖𝟏𝟒
b. Calcule la probabilidad de que la media muestral x sea mayor que 73,000
dólares.
𝑥̅ − 𝜇 73,000 −
𝑍𝑐 = 𝜎 71,802 = 2.32
=
√𝑛 4000
√60
𝑃(𝑥̅ > 73,00) = 𝑃(𝑧 > 2.32) = 0.4898
𝑃(𝑧 > 2.32)
c. Si una muestra aleatoria en realidad produjo una media muestral de
ESTADÍSTICA INFERENCIAL. ACTIVIDAD [Link].
73,000 dólares, ¿consideraría usted que esto es poco común? ¿Qué
conclusión obtendría?
Si la media poblacional es diferente de la media muestral, no tenemos una
distribución normal, por lo que se requiere que el tamaño de la muestra sea
más grande
2. Requerimiento de Potasio. El requerimiento normal diario de Potasio en seres
humanos está en el intervalo de 2,000 a 6,000 miligramos (mg), con cantidades más
grandes necesarias durante los meses calurosos de verano. La cantidad de potasio en
distintos alimentos varía, pero las mediciones indican que el plátano contiene un nivel
alto de potasio, con aproximadamente 422 mg en un plátano de tamaño mediano.
Suponga que la distribución de potasio en plátanos está distribuida normalmente, con
media igual a 422 mg y desviación estándar de 13 mg por plátano. Usted come n = 3
plátanos al día y T es el número total de miligramos de potasio que recibe de ellos.
a. Encuentre la media y la desviación estándar de T.
𝜇 = 422
𝜎 = 13
𝜇𝑥̅ = 𝜇 = 422
𝜎 13
𝜎𝑥̅ = = = 7.5
√𝑛 √3
Encuentre la probabilidad de que su ingesta diaria de potasio de los tres plátanos exceda de
1,300 mg. (Sugerencia: Observe que T es la suma de tres variables aleatorias X1, X2 y X3
donde X1 es la cantidad de potasio en el plátano 1, etc.)
𝑇 = 𝑋1 + 𝑋2 + 𝑋3
𝑃(𝑇 > 1,300)
3. Duración de baterías para automóvil. Un fabricante de baterías para automóvil
afirma que la distribución del tiempo de duración (tiempo de vida) de las baterías de su
mejor marca tiene una media 𝜇 = 54 meses y una desviación estándar 𝜎 = 6 meses.
Suponga que un grupo de consumidores decide verificar la afirmación y para ello
compran una muestra de 50 baterías y las somete a prueba para medir su tiempo de
vida.
a. Suponiendo que la afirmación del fabricante es verdadera, describa la
distribución de muestreo de la media muestral cuando n = 50 baterías.
𝜇 = 54
𝜎=6
𝜇𝑥̅ = 𝜇 = 54
𝜎 6
𝜎𝑥̅ = = = 0.8485
√𝑛 √50
b. Suponiendo que la afirmación del fabricante es verdadera, ¿cuál es la
probabilidad de que la muestra de 50 baterías tenga un tiempo de vida de 52
ESTADÍSTICA INFERENCIAL. ACTIVIDAD [Link].
meses o menos?
𝑥̅ − 𝜇 52 − 54
𝑍𝑐 = = = −2.36
𝜎 0.8485
√𝑛
𝑃(𝑥̅ ≤ 52) = 𝑃(𝑧 ≤ −2.36) = 0.5 − 0.4909 = 𝟎. 𝟎𝟎𝟗𝟏
𝑃(𝑧 ≤ −2.36)
4. Temperatura corporal. Suponga que la temperatura corporal de personas
sanas se distribuye aproximadamente normal con media 37.0 C y desviación
estándar de 0.4 C.
a. Si 130 personas sanas se seleccionan aleatoriamente, ¿cuál es la
probabilidad de que la temperatura promedio para estas personas sea de
36.80 o menor?
𝜇 = 37
𝜎 = 0.4
𝜇𝑥̅ = 𝜇 = 37
𝜎 0.4
𝜎𝑥̅ = = = 0.035
√𝑛
√130
ESTADÍSTICA INFERENCIAL. ACTIVIDAD [Link].
𝑥̅ − 𝜇 36.8 − 37
𝑍𝑐 = = = −2.36
𝜎 0.035
√𝑛
𝑃(𝑥̅ ≤ 36.8) = 𝑃(𝑧 ≤ −2.36) = 1 − 0.4909 = 𝟎. 𝟓𝟎𝟗𝟏
b. ¿Consideraría una temperatura promedio de 36.80 como poco probable de
ocurrir, si la verdadera temperatura promedio de las personas sanas es de 37
C?
Hay una probabilidad del 50.91% de que ocurra. Por lo tanto, es más probable que
improbable de que ocurra.
TÉRMINOS PROBABILIDAD DE QUE OCURRA
Prácticamente seguro > 99%
Extremadamente probable > 95%
Muy probable > 90%
Probable > 66%
Más probable que improbable > 50%
Poco probable < 33%
Muy poco probable < 10%
Extremadamente improbable < 5%
5. Costo de un apartamento. El costo promedio de un apartamento en el
desarrollo Cedar Lakes es de $62,000 usd con una desviación estándar de
$4,200 usd.
a. ¿Cuál es la probabilidad de que un apartamento en este desarrollo cueste al
menos $65,000 usd?
La expresión “al menos” significa mayor o igual.
𝜇 = 62,000
𝜎 = 4,200
𝑥̅ − 𝜇 65,000 − 62,000
𝑍𝑐 = = = 0.71
𝜎 4,200
𝑃(𝑥̅ ≥ 65,000) = 𝑃(𝑧 ≥ 0.71) = 0.5 − 0.2611 = 𝟎. 𝟐𝟑𝟖𝟗
𝑃(𝑧 ≥ 0.71)
ESTADÍSTICA INFERENCIAL. ACTIVIDAD [Link].
b. La probabilidad de que el costo promedio de una muestra de dos
apartamentos sea al menos de $65,000 usd es mayor o menor que la
probabilidad de que un apartamento cueste eso. ¿En qué cantidad difiere?
𝑥̅ − 𝜇 65,000 −
𝑍𝑐 = 𝜎 62,000 = 1.01
=
√𝑛 4,200
√2
𝑃(𝑧 ≥ 1.01) = 0.5 − 0.3438 = 𝟎. 𝟏𝟓𝟔𝟐
Es menor (0.1562)
6. Lanzamiento de una moneda. Una moneda justa se lanza n = 80 veces.
Sea pˆ la proporción muestral de caras (soles). Encuentre P(0.44 < pˆ <
0.61)
1
𝑃= = 0.5
2
𝑛 = 80
𝑝̂ − 𝑃 0.61 − 0.5 𝑝̂ − 𝑃 0.44 − 0.5
𝑧= = = 1.43 𝑧= = = −0.78
√𝑃𝑞 √0.5 ∗ 0.95 √𝑃𝑞 √0.5 ∗ 0.95
𝑛 80 𝑛 80
𝑃(0.44 < 𝑝̂ < 0.61) = 𝑃(0.61 < 𝑝̂) − 𝑃(0.44 < 𝑝̂) =
𝑃(1.43 < 𝑧) − 𝑃(0.78 < 𝑧) =
0.4236 − 0.2823 =
= 𝟎. 𝟏𝟒𝟏𝟑
7. Herramientas defectuosas. Se ha encontrado que 2% de las herramientas que
produce cierta máquina tienen algún defecto. ¿Cuál es la probabilidad de que en 400
de dichas herramientas,
a. 3% o más tengan algún defecto?
𝑃∗𝑞 (0.02)(0.98)
𝑁 [𝑝; √ ] = 𝑁 [0.02; √ ]= 𝑁[0.02; 0.007]
𝑛 400
𝑝 − 𝑃 0.03 − 0.02
𝑃(𝑝̂ ≥ 0.03) ⇒ 𝑧 = = = 1.43
𝑃𝑞 0.007
√
𝑛
𝑃(𝑧 ≥ 1.43) = 0.5 − 𝑃(𝑧 < 1.43) = 0.5 − 0.4236 = 𝟎. 𝟎𝟕𝟔𝟒
b. 2% o menos tengan algún defecto?
ESTADÍSTICA INFERENCIAL. ACTIVIDAD [Link].
𝑝−𝑃 0.02 − 0.02
𝑃(𝑝̂ ≤ 0.02) ⇒ 𝑧 = = =0
√𝑃𝑞 √(0.02)(0.98)
𝑛 400
𝑃(𝑧 ≤ 0) = 0.5 − 𝑃(𝑧 > 0) = 0.5 − 0 = 𝟎. 𝟓
CONCLUSIONES
En ocasiones es complejo calcular los valores estadísticos reales de las
poblaciones (parámetros poblacionales) y lo que hacemos es que a través de
una muestra de la población estimamos las características poblacionales usando la
estadística muestral, que son los valores calculados a través de la muestra. Para
que los valores calculados o inferidos sean confiables nuestra muestra debe ser
representativa de la población, aleatoria y entre más grande será también más
confiable.
Las técnicas que se usan para calcular los valores estadísticos de las muestras
poblacionales son distribución muestral de las medias y distribución muestral de
las proporciones y que nos brinda información acerca de la distribución de
probabilidades de los valores que puede tomar el estadístico a lo largo de todas las
posibles muestras con el mismo número de observaciones extraídas de la
población (Llinás, 2017).
En los ejercicios de esta serie usamos z para la variable normalizada, para
muestras mayores o iguales a 30 donde z tiene una distribución normal y a través
de estos cálculos nos pudimos dar cuenta que tan probable es que nuestros
valores caigan dentro o fuera de los rangos esperados. El error estándar nos
permite visualizar el rango de valores que caen dentro de una desviación estándar
de la curva del error, en otras palabras, también nos indica la variabilidad de las
medias muestrales.
ESTADÍSTICA INFERENCIAL. ACTIVIDAD [Link].
REFERENCIAS
(S/f-d). [Link]. Recuperado el 28 de noviembre de 2024, de
[Link]
ESTADISTICA_PARA_NEGOCI.pdf
(S/f-e). [Link]. Recuperado el 28 de noviembre de 2024, de
[Link]
Estadistica%20Inferencial%20-
%20%20Diplomado%20en%20An%C3%A1lisis%20de%20Informaci%C3%B3n%20Geoesp
[Link]
ESTADÍSTICA INFERENCIAL. ACTIVIDAD [Link].