lOMoARcPSD|26508671
ESTADISTICA INFERENCIAL
ACTIVIDAD # 1
José Marcos Flores Guzmán
lOMoARcPSD|26508671
ACTIVIDAD 1
1. Una población consta de cinco números: 2,3,6,8,11. Considere todas las muestras
posibles de tamaño dos que pueden extraerse con reemplazo de esta población.
Encontrar:
a. La media de la población
Σ𝑥𝑖 2 + 3 + 6 + 8 + 11
𝜇= =
𝑁 5
𝝁=𝟔
b. La desviación estándar de la población
Σ(𝑥𝑖 − 𝜇)2 (2 − 6)2 + (3 − 6)2 + (6 − 6)2 + (8 − 6)2 + (11 − 6)2
𝜎=√ =√
𝑁 5
(−4)2 + (−3)2 + (0)2 + (2)2 + (5)2
=√ = √10.8
5
𝝈 = 𝟑. 𝟐𝟗
c. El valor esperado de la media muestral
Para obtener una muestra el ejercicio nos menciona que sean todas las
muestras posibles de tamaño dos con reemplazo.
Por lo tanto, tenemos un muestreo con reposición y la ecuación es:
𝑵𝒏
𝑁 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛
𝑛 = 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑜𝑠 𝑔𝑟𝑢𝑝𝑜𝑠 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
𝑵𝒏 = 𝟓𝟐 = 𝟐𝟓
lOMoARcPSD|26508671
Nuestra muestra consta de 25 elementos.
2 3 6 8 11
2 2,0 2,5 4,0 5,0 6,5
3 2,5 3,0 4,5 5,5 7,0
6 4,0 4,5 6,0 7,0 8,5
8 5,0 5,5 7,0 8,0 9,5
11 6,5 7,0 8,5 9,5 11,5
(2,0)+(2,5)+(3,0)+(4,0)+(4,5)+(5,0)+(5,5)+(6,0)+(6,5)+(7,0)+⋯+(8,0)+(8,5)+(9,5)+(11,5)
𝜇= 25
𝟏𝟓𝟎
𝝁= =𝟔
𝟐𝟓
d. La desviación estándar (error estándar) de la media muestral
n
(2 − 6)2 + (2.5 − 6)2 + (4 − 6)2 + (5 − 6)2 + (6.5 − 6)2 + (2.5 − 6)2 +(11 − 6)2
σ = √∑(xi − μ)2 = √
25
i=1
𝝈𝒙 = √𝟓. 𝟒 = 𝟐. 𝟑𝟐
2. Se seleccionaron muestras aleatorias de tamaño n de poblaciones con las medias
y varianzas dadas aquí. Encuentre la media y desviación estándar de la distribución
de muestreo de la media muestral X en cada caso:
a. n = 36, 𝝁 = 10, 𝝈𝟐 = 9
𝜇 = 𝜇𝑥̅ = 10
𝜎 3
𝜎𝑥̅ = = = 0.5
√𝑛 √36
b. n = 100, 𝝁 = 5, 𝝈𝟐 = 4
𝜇 = 𝜇𝑥̅ = 5
𝜎 2
𝜎𝑥̅ = = = 0.2
√𝑛 √100
c. n = 8, 𝝁 = 120, 𝝈𝟐 = 1
lOMoARcPSD|26508671
𝜇 = 𝜇𝑥̅ = 120
𝜎 1
𝜎𝑥̅ = 𝑛 = 8 = 0.35
√ √
Si las poblaciones muestreadas son normales, ¿cuál es la distribución de
muestreo de X para los incisos a, b y c?
Cuando la población muestreada es normal, la distribución de muestreo también lo
es, sin importar el tamaño de la muestra como en el inciso c) que es n= 8.
De acuerdo con el Teorema del Límite Central, si las poblaciones muestreadas
no son normales, ¿qué se puede decir acerca de la distribución muestral de X
para los incisos a, b y c?
El Teorema del Límite Central nos dice que para que la distribución muestral se
considere normal, aunque la población no lo sea, n debe ser grande igual o mayor
a 30.
El inciso a) y b) cumplen a excepción de c), donde el tamaño de muestra es igual a
n= 8.
3. Una muestra aleatoria de n observaciones se selecciona de una población con
desviación estándar 𝜎 = 1. Calcule el error estándar de la media (SE) para los
siguientes valores de n.
a. n =1
𝜎 1
𝑆𝐸 = =1
√𝑁 √1
b. n = 2
𝜎 1
𝑆𝐸 = = 0.707
√𝑁 √2
c. n = 4
𝜎 1
𝑆𝐸 = = 0.5
√𝑁 √4
d. n = 9
𝜎 1
𝑆𝐸 = = 0.33
√𝑁 √9
e. n = 16
𝜎 1
𝑆𝐸 = = 0.25
√𝑁 √16
f. n = 25
𝜎 1
𝑆𝐸 = = 0.2
√𝑁 √25
g. n = 100
lOMoARcPSD|26508671
𝜎 1
𝑆𝐸 = = 0.1
√𝑁 √100
4. Se seleccionaron muestras aleatorias de tamaño n de poblaciones binomiales con
parámetros poblacionales p dados aquí. Encuentre la media y la desviación
estándar de la distribución de muestreo de la proporción muestral pˆ en cada caso:
a. n = 100, p = 0.3
𝑃𝑞
𝜇𝑝̂ = 𝑝 𝑦 𝜎𝑝̂ = √
𝑛
(0.3)(0.7)
𝜇𝑝̂ = 0.3 𝑦 𝜎𝑝̂ = √ = 0.046
100
b. n = 400, p = 0.1
𝑃𝑞
𝜇𝑝̂ = 𝑝 𝑦 𝜎𝑝̂ = √
𝑛
(0.1)(0.9)
𝜇𝑝̂ = 0.1 𝑦 𝜎𝑝̂ = √ = 0.015
400
c. n = 250, p = 0.6
𝑃𝑞
𝜇𝑝̂ = 𝑝 𝑦 𝜎𝑝̂ = √
𝑛
(0.6)(0.4)
𝜇𝑝̂ = 0.6 𝑦 𝜎𝑝̂ = √ = 0.031
250
5. ¿Es adecuado utilizar la distribución normal para aproximar la distribución de
muestreo de 𝑃̂ en las siguientes circunstancias?
Si es adecuado, si se cumple al menos una de las siguientes condiciones:
• 𝑛 > 30
• 𝑛𝑝 ≥ 5
a. n = 50, p = 0.05
Cumple con una de las condiciones:
• 𝑛 > 30 ⇒ 50 > 30
• 𝑛𝑝 ≥ 5 ⇒ (50)(0.05) ≥ 5 ⇒ 2.5 ≥ 5
Por lo tanto:
𝑃𝑞
𝜇𝑝̂ = 𝑝 𝑦 𝜎𝑝̂ = √
𝑛
lOMoARcPSD|26508671
𝜇𝑝̂ = 0.05 𝑦 𝜎𝑝̂ = 0.03
b. n = 75, p = 0.1
Cumple con las dos condiciones:
• 𝑛 > 30 ⇒ 75 > 30
• 𝑛𝑝 ≥ 5 ⇒ (75)(0.1) ≥ 5 ⇒ 7.5 ≥ 5
Por lo tanto:
𝑃𝑞
𝜇𝑝̂ = 𝑝 𝑦 𝜎𝑝̂ = √
𝑛
𝜇𝑝̂ = 0.1 𝑦 𝜎𝑝̂ = 0.04
c. n = 250, p = 0.99
Cumple con las dos condiciones:
• 𝑛 > 30 ⇒ 250 > 30
• 𝑛𝑝 ≥ 5 ⇒ (250)(0.99) ≥ 5 ⇒ 247.5 ≥ 5
Por lo tanto:
𝑃𝑞
𝜇𝑝̂ = 𝑝 𝑦 𝜎𝑝̂ = √
𝑛
𝜇𝑝̂ = 0.99 𝑦 𝜎𝑝̂ = 0.006
Aplicaciones
1. Enfermedad de Alzheimer. La duración de la enfermedad de Alzheimer desde el
principio de los síntomas hasta el fallecimiento varía de 3 a 20 años; el promedio es 8
años con una desviación estándar de 4 años. El administrador de un gran centro médico
selecciona al azar, de la base de datos del centro, los registros médicos de 30 pacientes
de Alzheimer ya fallecidos y anota la duración de la enfermedad para cada unidad en
muestra. Encuentre las probabilidades aproximadas para los siguientes eventos:
Nota importante:
El promedio o media nos dice el ejercicio que es µ=8 años y este valor no es central con
respecto a los limites inferior y superior (3 a 20 años). Pero la muestra que se toma en
el centro médico es de 30 pacientes y la teoría de distribuciones normales nos dice que
“Si la población de donde se extraen las muestras no es normal, entonces el
tamaño de la muestra debe ser mayor o igual a 30, para que la distribución
muestral tenga una forma acampanada”, así que el comportamiento de nuestra
muestra lo tomaremos como normal.
a. La duración promedio es menor a 7 años.
lOMoARcPSD|26508671
• Debemos calcular el valor de 𝑧 para 𝑥̅ = 7, pero antes debemos calcular el
valor de la desviación estándar muestral.
𝜎 4
𝜎𝑥̅ = = = 0.73
√𝑛 √30
𝑥̅ − 𝜇 7 − 8
𝑍𝑐 = 𝜎 = = −1.37
0.73
√𝑛
Por lo tanto:
𝑃(𝑥̅ < 7) = 𝑃(𝑧 < −1.37) = 𝑃(𝑧 < 0) − 𝑃(−1.37 < 𝑧 < 0)
= 0.5 − 0.4147 = 𝟎. 𝟎𝟖𝟓𝟑
𝑃(𝑧 < −1.37)
b. La duración promedio excede de 7 años.
𝑃(𝑥̅ > 7) = 𝑃(𝑧 > −1.37) = 1 − 𝑃(𝑧 < −1.37)
= 1 − 0.0853 = 𝟎. 𝟗𝟏𝟒𝟕
𝑃(𝑧 > −1.37)
c. La duración promedio está a no más de un año de la media poblacional µ
= 8.
𝑃(7 < 𝑥̅ < 9) = 𝑃(−1.37 < 𝑧 < 1.37) = 𝑃(𝑧 > −1.37) − 𝑃(𝑧 < −1.37)
= 0.9147 − 0.0853 = 𝟎. 𝟖𝟐𝟗𝟒
lOMoARcPSD|26508671
𝑃(−1.37 < 𝑧 < 1.37)
Grafique el error estándar de la media (SE) contra el tamaño muestral n y
enlace los puntos con una curva suave. ¿Cuál es el efecto de aumentar el
tamaño de muestra sobre el error estándar?
A medida que el tamaño de la muestra aumenta el error estándar va siendo menor.
Tamaño de muestra contra el error estándar de la
muestra
0.8
0.7
0.6
0.5
SE
0.4
0.3
0.2
0.1
0
0 10 20 30 40 50 60 70 80 90 100 110
n
2. Salarios de profesores. Suponga que los profesores de una universidad en E.U.A. -con
rango de profesor en instituciones públicas que imparten programas académicos de dos
años-, ganan un promedio de 71,802 dólares por año, con una desviación estándar de
4,000 dólares. En un ejercicio por verificar este nivel de salario se seleccionó una
muestra aleatoria de 60 profesores de una base de datos del personal académico de
todas las instituciones públicas que imparten programas de dos años en E.U.A.
lOMoARcPSD|26508671
a. Describa la distribución de muestreo de la media muestral X
Calculamos la media y la distribución muestrales
𝜇𝑥̅ = 𝜇 = 71,802
𝜎 4,000
𝜎𝑥̅ = = = 516.4
√𝑛 √60
b. ¿Dentro de qué límites se esperaría que esté el promedio muestral, con
probabilidad 0.95?
• Primero determinamos los valores de z que limitan el 0.95:
Dado 0.95 como área central, las dos colas deben contener un total de 0.05.
1
Por lo tanto, cada cola contiene2 de 0.05, o sea 0.025. Debemos encontrar
los valores de z para 𝑧(0.025) y 𝑧(0.975) = −𝑧(0.025)
Para hallar 𝑧(0.025) debemos determinar el área entre la media y 𝑧(0.025).
Que es 0.5-0.025=0.4750 .
En la tabla de z, buscamos el valor z que le corresponde a 0.4750 y es 1.96.
Por lo tanto:
𝑧(0.025) = 1.96
𝑧(0.975) = −𝑧(0.025) = −1.96
Conociendo los límites de z, podemos calcular los límites de la media
muestral.
𝑥̅ − 𝜇
𝑍𝑐 = 𝜎
√𝑛
Despejamos 𝑥̅ ,
𝜎
𝑥̅ = 𝑧 ( )+𝜇
√𝑛
Para 𝑧(0.025) = 1.96
𝜎 4000
𝑥̅ = 𝑧 ( ) + 𝜇 = 1.96 ( )+ 71,802 = 72,814.14 = 72,814 dolares
√𝑛 √60
Para 𝑧(0.975) = −𝑧(0.025) = −1.96
lOMoARcPSD|26508671
𝜎 4000
𝑥̅ = 𝑧 ( ) + 𝜇 = −1.96 ( )+ 71,802 = 70,789.86 = 70,790 dolares
√𝑛 √60
Los límites de la media son:
𝟕𝟎, 𝟕𝟗𝟎 < 𝝁 < 𝟕𝟐, 𝟖𝟏𝟒
c. Calcule la probabilidad de que la media muestral x sea mayor que 73,000
dólares.
𝑥̅ − 𝜇 73,000 − 71,802
𝑍𝑐 = 𝜎 = = 2.32
4000
√𝑛 √60
𝑃(𝑥̅ > 73,00) = 𝑃(𝑧 > 2.32) = 0.4898
𝑃(𝑧 > 2.32)
d. Si una muestra aleatoria en realidad produjo una media muestral de 73,000
dólares, ¿consideraría usted que esto es poco común? ¿Qué conclusión
obtendría?
Si la media poblacional es diferente de la media muestral, no tenemos una
distribución normal, por lo que se requiere que el tamaño de la muestra sea más
grande.
3. Requerimiento de Potasio. El requerimiento normal diario de Potasio en seres humanos
está en el intervalo de 2,000 a 6,000 miligramos (mg), con cantidades más grandes
necesarias durante los meses calurosos de verano. La cantidad de potasio en distintos
alimentos varía, pero las mediciones indican que el plátano contiene un nivel alto de
potasio, con aproximadamente 422 mg en un plátano de tamaño mediano. Suponga
que la distribución de potasio en plátanos está distribuida normalmente, con media igual
a 422 mg y desviación estándar de 13 mg por plátano. Usted come n = 3 plátanos al día
y T es el número total de miligramos de potasio que recibe de ellos.
a. Encuentre la media y la desviación estándar de T.
𝜇 = 422
𝜎 = 13
𝜇𝑥̅ = 𝜇 = 422
𝜎 13
𝜎𝑥̅ = = = 7.5
√𝑛 √3
b. Encuentre la probabilidad de que su ingesta diaria de potasio de los tres plátanos
exceda de 1,300 mg. (Sugerencia: Observe que T es la suma de tres variables
lOMoARcPSD|26508671
aleatorias X1, X2 y X3 donde X1 es la cantidad de potasio en el plátano 1, etc.)
𝑇 = 𝑋1 + 𝑋2 + 𝑋3
𝑃(𝑇 > 1,300)
4. Duración de baterías para automóvil. Un fabricante de baterías para automóvil afirma
que la distribución del tiempo de duración (tiempo de vida) de las baterías de su mejor
marca tiene una media 𝜇 = 54 meses y una desviación estándar 𝜎 = 6 meses. Suponga
que un grupo de consumidores decide verificar la afirmación y para ello compran una
muestra de 50 baterías y las somete a prueba para medir su tiempo de vida.
a. Suponiendo que la afirmación del fabricante es verdadera, describa la
distribución de muestreo de la media muestral cuando n = 50 baterías.
𝜇 = 54
𝜎=6
𝜇𝑥̅ = 𝜇 = 54
𝜎 6
𝜎𝑥̅ = = = 0.8485
√𝑛 √50
b. Suponiendo que la afirmación del fabricante es verdadera, ¿cuál es la
probabilidad de que la muestra de 50 baterías tenga un tiempo de vida de 52
meses o menos?
𝑥̅ − 𝜇 52 − 54
𝑍𝑐 = 𝜎 = 0.8485 = −2.36
√𝑛
𝑃(𝑥̅ ≤ 52) = 𝑃(𝑧 ≤ −2.36) = 0.5 − 0.4909 = 𝟎. 𝟎𝟎𝟗𝟏
𝑃(𝑧 ≤ −2.36)
5. Temperatura corporal. Suponga que la temperatura corporal de personas sanas se
distribuye aproximadamente normal con media 37.0 C y desviación estándar de 0.4 C.
a. Si 130 personas sanas se seleccionan aleatoriamente, ¿cuál es la probabilidad
de que la temperatura promedio para estas personas sea de 36.80 o menor?
𝜇 = 37
𝜎 = 0.4
𝜇𝑥̅ = 𝜇 = 37
𝜎 0.4
𝜎𝑥̅ = = = 0.035
√𝑛 √130
lOMoARcPSD|26508671
𝑥̅ − 𝜇 36.8 − 37
𝑍𝑐 = 𝜎 = 0.035 = −2.36
√𝑛
𝑃(𝑥̅ ≤ 36.8) = 𝑃(𝑧 ≤ −2.36) = 1 − 0.4909 = 𝟎. 𝟓𝟎𝟗𝟏
b. ¿Consideraría una temperatura promedio de 36.80 como poco probable de
ocurrir, si la verdadera temperatura promedio de las personas sanas es de 37
C?
Hay una probabilidad del 50.91% de que ocurra. Por lo tanto, es más probable que
improbable de que ocurra.
TÉRMINOS PROBABILIDAD DE QUE OCURRA
Prácticamente seguro > 99%
Extremadamente probable > 95%
Muy probable > 90%
Probable > 66%
Más probable que improbable > 50%
Poco probable < 33%
Muy poco probable < 10%
Extremadamente improbable < 5%
6. Costo de un apartamento. El costo promedio de un apartamento en el desarrollo Cedar
Lakes es de $62,000 usd con una desviación estándar de $4,200 usd.
a. ¿Cuál es la probabilidad de que un apartamento en este desarrollo cueste al
menos $65,000 usd?
La expresión “al menos” significa mayor o igual.
𝜇 = 62,000
𝜎 = 4,200
𝑥̅ − 𝜇 65,000 − 62,000
𝑍𝑐 = = = 0.71
𝜎 4,200
𝑃(𝑥̅ ≥ 65,000) = 𝑃(𝑧 ≥ 0.71) = 0.5 − 0.2611 = 𝟎. 𝟐𝟑𝟖𝟗
𝑃(𝑧 ≥ 0.71)
lOMoARcPSD|26508671
b. La probabilidad de que el costo promedio de una muestra de dos
apartamentos sea al menos de $65,000 usd es mayor o menor que la
probabilidad de que un apartamento cueste eso. ¿En qué cantidad difiere?
𝑥̅ − 𝜇 65,000 − 62,000
𝑍𝑐 = 𝜎 = = 1.01
4,200
√𝑛 √2
𝑃(𝑧 ≥ 1.01) = 0.5 − 0.3438 = 𝟎. 𝟏𝟓𝟔𝟐
Es menor (0.1562)
7. Lanzamiento de una moneda. Una moneda justa se lanza n = 80 veces. Sea pˆ la
proporción muestral de caras (soles). Encuentre P(0.44 < pˆ < 0.61)
1
𝑃= = 0.5
2
𝑛 = 80
𝑝̂ − 𝑃 0.61 − 0.5 𝑝̂ − 𝑃 0.44 − 0.5
𝑧= = = 1.43 𝑧= = = −0.78
√𝑃𝑞 √0.5 ∗ 0.95 √𝑃𝑞 √0.5 ∗ 0.95
𝑛 80 𝑛 80
𝑃(0.44 < 𝑝̂ < 0.61) = 𝑃(0.61 < 𝑝̂ ) − 𝑃(0.44 < 𝑝̂ ) =
𝑃(1.43 < 𝑧) − 𝑃(0.78 < 𝑧) =
0.4236 − 0.2823 =
= 𝟎. 𝟏𝟒𝟏𝟑
8. Herramientas defectuosas. Se ha encontrado que 2% de las herramientas que produce
cierta máquina tienen algún defecto. ¿Cuál es la probabilidad de que en 400 de dichas
herramientas,
a. 3% o más tengan algún defecto?
𝑃∗𝑞 (0.02)(0.98)
𝑁 [𝑝; √ ] = 𝑁 [0.02; √ ] = 𝑁[0.02; 0.007]
𝑛 400
𝑝−𝑃 0.03 − 0.02
𝑃(𝑝̂ ≥ 0.03) ⇒ 𝑧 = = = 1.43
0.007
√𝑃𝑞
𝑛
𝑃(𝑧 ≥ 1.43) = 0.5 − 𝑃(𝑧 < 1.43) = 0.5 − 0.4236 = 𝟎. 𝟎𝟕𝟔𝟒
b. 2% o menos tengan algún defecto?
lOMoARcPSD|26508671
𝑝−𝑃 0.02 − 0.02
𝑃(𝑝̂ ≤ 0.02) ⇒ 𝑧 = = =0
√𝑃𝑞 √(0.02)(0.98)
𝑛 400
𝑃(𝑧 ≤ 0) = 0.5 − 𝑃(𝑧 > 0) = 0.5 − 0 = 𝟎. 𝟓
CONCLUSIONES
En ocasiones es complejo calcular los valores estadísticos reales de las poblaciones
(parámetros poblacionales) y lo que hacemos es que a través de una muestra de
la población estimamos las características poblacionales usando la estadística
muestral, que son los valores calculados a través de la muestra. Para que los
valores calculados o inferidos sean confiables nuestra muestra debe ser
representativa de la población, aleatoria y entre más grande será también más
confiable.
Las técnicas que se usan para calcular los valores estadísticos de las muestras
poblacionales son distribución muestral de las medias y distribución muestral de
las proporciones y que nos brinda información acerca de la distribución de
probabilidades de los valores que puede tomar el estadístico a lo largo de todas las
posibles muestras con el mismo número de observaciones extraídas de la población
(Llinás, 2017).
En los ejercicios de esta serie usamos z para la variable normalizada, para muestras
mayores o iguales a 30 donde z tiene una distribución normal y a través de estos
cálculos nos pudimos dar cuenta que tan probable es que nuestros valores caigan
dentro o fuera de los rangos esperados. El error estándar nos permite visualizar el
rango de valores que caen dentro de una desviación estándar de la curva del error,
en otras palabras, también nos indica la variabilidad de las medias muestrales.
lOMoARcPSD|26508671
REFERENCIAS
• Johnson, R., & Kuby, P. (2008). Estadística elemental: Lo esencial. México:
CENAGUE Learning.
• Llinás, H. (2017). Estadística Inferencial. Colombia: Universidad del Norte.