Facultad de Economía
Semana N° 09:
Estimación
Asignatura: Estadística inferencial aplicada
Mg. Carmen Valdivia Arenas
Semestre Académico 2020-2
U ni ver sidad N ac i onal
Federico Villarreal
• Los números que aparecen en las
distribuciones de probabilidad de
las variables aleatorias tales como:
p en la distribución binomial, μ y σ
en la distribución normal entre
otros, se llaman parámetros o
Estimación características de la población.
estadística
• La estimación estadística es el
proceso mediante el cual se
aproxima el valor del parámetro de
la población a partir de la
información de una muestra.
U ni ver sidad N ac i onal
Federico Villarreal
• La estimación de un parámetro
puede adoptar la forma de un solo
punto (un solo valor del parámetro
de interés); o de un intervalo (rango
de valores dentro del cual se espera
Tipos de el valor del parámetro).
estimación
• La primera se llama estimación
estadística puntual y la segunda estimación
por intervalo.
Ejemplo: si decimos que una distancia se ha
medido como 5,28 metros, se trata de una
estimación de punto. Pero si decimos que la
distancia es 5,28±0,03 (está entre 5,25 y 5,31),
estamos dando una estimación de intervalo.
U ni ver sidad N ac i onal
Federico Villarreal
Estimación estadística
La inferencia estadística consiste en seleccionar una muestra
aleatoria de la población, de manera que a partir de la
información que se obtenga de la muestra se pueda:
• Determinar el valor del parámetro desconocido.
A esto se denomina estimación del parámetro
• Decidir si el parámetro o alguna función de del parámetro es
igual a algún valor preconcebido del mismo.
U ni ver sidad N ac i onal
Federico Villarreal
Supondremos:
• se observa una variable aleatoria X,
• que sigue una distribución conocida (normal, exponencial,
Poisson, etc)
• aunque con parámetros desconocidos
• El problema es cómo estimar estos parámetros a
partir de los datos de la muestra.
• De estos parámetros lo único que se conoce es su
rango de posibles valores, denominado espacio
paramétrico.
• Ejemplos: Algunos parámetros de interés podrían ser la
media o la varianza poblacional, o la proporción de la
población que posee determinado atributo
U ni ver sidad N ac i onal
Federico Villarreal
Generalmente, las estimaciones surgen de muestreos. Si de una población
se extraen varias muestras, estas darían valores cercanos pero distintos de
tal manera que se puede construir una tabla de valores con los resultados
muestrales. En ese caso, se asume que estos resultados corresponden a
una variable aleatoria que puede estimarse.
U ni ver sidad N ac i onal
Federico Villarreal
Teorema del limite central
Si se toman sucesivas muestras (k) de tamaño n de una
población que puede o no ser normal, la distribución de
probabilidad de esas muestras, conforme n se vuelve grande,
se aproxima a una distribución normal con:
x = x =
x =
n
x−
Z =
x
Conceptos a tomar en cuenta
⚫ La distribución muestral es una lista de todos los valores posibles
para un estadístico y la probabilidad asociada con ese valor.
⚫ El error estándar de la distribución muestral de medias es:
2
2
2
x = = 2
=
2
n=
x
x x
n n
⚫ Con Factor de corrección para poblaciones finitas
N −n
2
=2
*
x
n N −1
⚫ Las estimaciones son mejores con muestras más grandes
Ejemplo
El valor nominal de la resistencia de una lámina de un
metal compuesto es de 8500 psi. Por estudios pasados se
conoce que la desviación estándar de esta resistencia es
1950 psi. Se tiene una muestra de 100 láminas. ¿Cuál es
la probabilidad de que la media de esa muestra:
a. Sea mayor a 8900 psi?
b. Sea menor a 8000 psi?
c. Esté entre 8200 y 8700 psi?
DR. JORGE ACUÑA A., PROFESOR
U ni ver sidad N ac i onal
Federico Villarreal
Solución:
=8500 =1950 n=100
a. Media mayor que 8900
P( x 8900) = 1 − P( x 8900)
8900 − 8500
P( x 8900) = 1 − = 1 − 2.05
1950 / 100
P( x 8900) = 1 − 0.9798 = 0.0202
U ni ver sidad N ac i onal
Federico Villarreal
• . Media menor que 8000
8000 − 8500
P( x 8000) = = −2.56 = 0.0053
1950 / 100
• c. Media entre 8200 y 8700
8700 − 8500 8200 − 8500
P(8200 x 8700) = −
1950 / 100 1950 / 100
P(8200 x 8700) = 1.03 x −1.54 = 0.8485 − 0.0618 = 0.7867
U ni ver sidad N ac i onal
Federico Villarreal
Proporciones en estadística
• La proporción es la medida de estadística descriptiva
que más se usa.
• Es el número de observaciones con una característica en
particular entre la población de referencia. El numerador
siempre está incluido en el denominador. Se expresa en
porcentaje.
• Por ejemplo:
• Determinar la proporción de personas que están
indecisas en cuanto a votar por un determinado candidato
en las próximas elecciones generales. Se ha tomado una
muestra de 1200 personas y 300 de ellas han
manifestado estar indecisos. ¿Cual es la proporción de
votantes con esa característica?.
𝑥 300
• Función: 𝑝 = σ 𝑛𝑖 = 1200 = 0.25 ≅ 25%
Proporciones muestrales
n1 xi
pi =
N
n2
ni
n3
p1 p2 p3 p4 ........ pk
n4 p=
p
k :# de muestras
k
p −
nk Z=
p
Distribución de las proporciones muestrales
⚫ Error estándar de la distribución poblacional y muestral
de proporciones :
* (1 − )
p =
n
p * (1 − p )
sp =
n
π = proporción de éxito
⚫ Factor de corrección para poblaciones finitas
* (1 − ) N − n p * (1 − p) N − n
= sp =
n N −1 n N −1
Ejemplo
Se afirma que el 8% de los lotes de un producto es
defectuoso. Al inspeccionar un lote del producto
sobre la base de una muestra de 1098 unidades se
encuentran 102 que no reúnen los requisitos
requeridos para ser adecuados. ¿Qué probabilidad
de ocurrencia tiene un porcentaje igual o menor al
encontrado en esta muestra?
Solución
=0.08
p= 125/1250= 0.1 (porcentaje hallado en la muestra)
f(p≤0.1)
Calculando la Desviación estándar de la proporción:
0.1 ∗ 0.9
𝜎𝑝 = = 0.0085
1250
Estandarizando la proporción para hallar la probabilidad
0.1 − 0.08
𝑍= = 2.35
0.0085
Buscando en la tabla: 0.9906. Entonces:
f(Z≤2.35)= 0.9906=99.06%
U ni ver sidad N ac i onal
Federico Villarreal
• Para estimar el valor de un parámetro poblacional, la característica
correspondiente se debe calcular con los datos de la muestra, lo que se
conoce como estadístico muestral.
• Por ejemplo. Se tiene los datos de salarios de una muestra procedente
de una población de 300 empleados de una compañía.
Nº Salarios Capacitación
1 4300 Si
2 2400 No
3 5200 Si
4 3200 Si
5 1800 No
6 2400 No
7 3600 Si
8 4100 Si
U ni ver sidad N ac i onal
Federico Villarreal
Calculamos los estadísticos de la muestra: media, varianza, desviación
estándar y proporción.
σ 𝑋𝑖 27000
• Media 𝑀𝑒𝑑𝑖𝑎 = = = 3375
𝑛 8
2 σ 𝑋𝑖 −𝑋 2
• Varianza 𝑆 = = 1144.86
𝑛−1
• Desviación estándar 𝑆 = 𝑆 2 = 33.84
𝑋𝑖 5
• Proporción 𝑝 = = = 0.625
𝑛 8
Cada uno de ellos es un estimador puntual
U ni ver sidad N ac i onal
Federico Villarreal
• Ejemplo: asuma que de la población del ejercicio anterior se han
extraído varias muestras y se han calculado sus medias y proporciones.
Resultado de esto, es la tabla siguiente.
Nº Medias Proporciones
1 3375 0.625
2 3350 0.630
3 3450 0.650
4 3340 0.630
5 3300 0.610
• Cada media, toma distintos valores en la distribución de probabilidad de
x. Esto se conoce como distribución muestral de x. Asuma que se ha
calculado la desviación estándar y esta tiene un valor de 40
U ni ver sidad N ac i onal
Federico Villarreal
• Calcule los parámetros puntuales de la distribución
• Media de medias
E(x) =µx=3363
• Desviación estándar de medias:
300−5 40
𝜎𝑥 = =17.77 aprox.
300−1 5
40
𝜎𝑥 = =17.89 para población infinita o n/N≤ 5%
5
de la población (5/300)=0.02 aprox. (2%)
U ni ver sidad N ac i onal
Federico Villarreal
Distribución muestral de X (Media)
Es la distribución de probabilidad de todos los valores de la media muestral X.
Propiedades:
• Media de medias
E(x) =µ La media de medias=µx
• Desviación estándar de medias:
𝑁−𝑛 𝜎
𝜎𝑥 = 𝑁−1 𝑛
para población finita
𝜎
𝜎𝑥 = para población infinita o n/N≤ 5% de la población
𝑛
• Factor de corrección para población finita pequeña y sin reemplazo de
datos
𝑁−𝑛
𝑁−1
U ni ver sidad N ac i onal
Federico Villarreal
Tomemos en cuenta el ejercicio anterior
• Suponga que se tiene conocida la desviación estándar de la población
(δ=40)
• Se sabe que la población es conocida y finita (N=300)
• Además, considere que la media población es 3400.
U ni ver sidad N ac i onal
Federico Villarreal
• Calcule los parámetros puntuales de la distribución
• Media de medias
E(x) =µx=3363
• Desviación estándar de medias:
300−5 40
𝜎𝑥 = =17.77 aprox.
300−1 5
40
𝜎𝑥 = =17.89 para población infinita o n/N≤ 5%
5
de la población (5/300)=0.02 aprox.
U ni ver sidad N ac i onal
Federico Villarreal
Estimación por intervalos
Sean μS y S la media y la desviación típica de la distribución de
muestreo de un estadístico llamado S. entonces, si la distribución
de muestreo de S es aproximadamente normal (n≥30) podemos
esperar hallar un estadístico muestral real S que esté en los
intervalos:
μS - S hasta μS + S al 68,27%
μS - 2S hasta μS + 2S al 95,45%
μS - 3S hasta μS + 3S al 99,73%
U ni ver sidad N ac i onal
Federico Villarreal
Limites de confianza
Son los valores que marcan los extremos de una estimación
y para ello se toma en cuenta el valor de Z.
El porcentaje se llama nivel de confianza y los números son
los coeficientes de confianza o valores críticos y se denotan
por zc.
De los niveles de confianza podemos deducir los
coeficientes de confianza y viceversa.
Valores de Zc correspondientes a niveles de confianza utilizados en la práctica .
Nivel de confianza 99,73% 99% 98% 96% 95,45% 95% 90% 80% 68,27% 50%
Zc 3,00 2,58 2,33 2,05 2,00 1,96 1,645 1,28 1,00 0,6745
Intervalos de confianza para
la media μ
U ni ver sidad N ac i onal
Federico Villarreal
Intervalo de confianza para la media µ:
varianza σ2 supuesta conocida
• Sea X1, X2,…Xn una muestra aleatoria de tamaño n seleccionada de
una población normal (o de cualquier otro tipo si n≥30) con media µ
y varianza σ2 supuestamente conocida.
• El mejor estimador puntual del parámetro µ es la media muestral X.
• Se utiliza entonces, la distribución muestral de la media X para
determinar el intervalo de confianza del parámetro µ.
U ni ver sidad N ac i onal
Federico Villarreal
• Si la población es normal N(µ, σ2 ), entonces la
distribución de la estadística X es normal N(µ, σ2/n )
para cualquier valor de n (n≥2).
• Si la población no es normal pero tiene media μ y
varianza σ2 finitas, entonces siempre que el tamaño n
de la muestra sea suficientemente grande (n≥30), por
el teorema del limite central, la distribución de x es
aproximadamente normal N~ (µ, σ2 ).
U ni ver sidad N ac i onal
Federico Villarreal
• Según sea el caso, la distribución de la variable aleatoria
𝑋 −𝜇
𝑍= 𝜎
ൗ√𝑛
• Es exactamente (o aproximadamente) normal N~ (0, 1 ).
U ni ver sidad N ac i onal
Federico Villarreal
• Dado el valor 1 – α en la distribución de Z, se determinan los valores:
±z1-α/2 tales que:
𝑃 z1−α/2 ≤ 𝑍 ≤ z1−α/2 =
1 − α/2
• Sustituyendo Z, se tiene que:
𝑋−𝜇
𝑃 z1−α/2 ≤ 𝜎 ≤ z1−α/2 =
1 − α/2
ൗ√𝑛
• De donde resulta:
𝑃 X−z1−α/2∗ 𝜎ൗ ≤ 𝜇 ≤ X+z1−α/2∗ 𝜎ൗ =
1 − α/2
𝑛 𝑛
U ni ver sidad N ac i onal
Federico Villarreal
Si la población fuera finita y el muestreo fuera sin reemplazo.
• Si la muestra aleatoria de tamaño n es escogida sin reposición de una
población finita de tamaño N, entonces si n≥30, la variable aleatoria Z se
construirá:
𝑋−𝜇
𝑍=
𝜎 𝑁 −𝑛
ൗ 𝑛 𝑁−1
U ni ver sidad N ac i onal
Federico Villarreal
Error estándar
• Se denomina error estándar de un estimador a la desviación estándar de
estimador. Su valor numérico denomina error estándar estimado. Su
función es:
𝜎
𝜎𝑥 =
𝑛
• Pero si se trata de una población finita y sin reposición, el error estándar
es:
𝜎 𝑁 −𝑛
𝜎𝑥 =
𝑛 𝑁−1
U ni ver sidad N ac i onal
Ejercicio
Federico Villarreal
Hallar los intervalos de confianza al 95% y al 99% entre los cuales se encuentra la altura media de 100
estudiantes cuya media muestral es de 1,708 m.
mi fi mifi (mi-x)2 (mi-x)2*fi
1.60 5 8 0.012 0.058
1.65 18 29.7 0.003 0.060
1.70 42 71.4 0.000 0.002
1.75 27 47.25 0.002 0.049
1.80 8 14.4 0.009 0.068
Límites de confianza al 95% de confianza:
total 100 170.75 0.025 0.237
Solución: Media= 1.708
Varianza= 0.002
Error típico= 0.045
𝑃 X−z1−α/2∗ 𝜎ൗ ≤ 𝜇 ≤ X+z1−α/2∗ 𝜎ൗ =
1 − α/2
𝑛 𝑛
Tomando en cuenta el valor z de la tabla para un 95% de confianza:1,96
[1,708 - 1,96*0,045/√100 ≤ μ ≤ 1,708 + 1,96*0,045/√100]=0,95
[1,708 – 0,009 ≤ μ ≤ 1,708 + 0,009]=0,95
[1,699 ≤ μ ≤ 1,717]=0,95
U ni ver sidad N ac i onal
Federico Villarreal
Límites de confianza al 99% de confianza:
Solución:
Tomando en cuenta el valor z de la tabla para un 99% de
confianza:2,58
[1,708 – 2,58*0,045/√100 ≤ μ ≤ 1,708 + 2,58*0,045/√100]=0,99
[1,708 – 0,012 ≤ μ ≤ 1,708 + 0,012]=0,99
[1,696 ≤ μ ≤ 1,720]=0,99
U ni ver sidad N ac i onal
Ejercicio
Federico Villarreal
Las medidas de los diámetros de una muestra aleatoria de 200 bolas de
rodamiento producidas por una maquina en una semana, dieron una media
de 0,824 cm. y una desviación típica de 0,042 cm. Hallar los límites de
confianza al 95% y 99% para el diámetro medio de las bolas de rodamiento
indicadas.
Solución:
Valor z para 95% de confianza=1,96
[0,824 - 1,96*0,042/√200 ≤ μ ≤ 0,824 + 1,96*0,042/√200]=0,95
[0,824 – 0,006 ≤ μ ≤ 0,824 + 0,006]=0,95
[0,818 ≤ μ ≤ 0,830]=0,95
Valor z para 99% de confianza=2,58
[0,824 – 2,58*0,042/√200 ≤ μ ≤ 0,824 + 2,58*0,042/√200]=0,99
[0,824 – 0,008 ≤ μ ≤ 0,824 + 0,008]=0,99
[0,816 ≤ μ ≤ 0,832]=0,95
U ni ver sidad N ac i onal
Federico Villarreal
Ejercicio 1
•Una muestra aleatoria de 400 pequeños
comerciantes indico que la media de los
ingresos mensuales era de S/.800. Estime la
media de la población de los ingresos de todos
los pequeños comerciantes mediante un
intervalo de confianza del 95%. Asuma que la
desviación estándar de esta población es de
S/.200
U ni ver sidad N ac i onal
Federico Villarreal
Ejercicio 2
Un analista de investigación de mercados escogió
una muestra aleatoria de 100 clientes de una
población de 500 clientes de una gran tienda que
declara ingresos mayores a S/.800. el encontró que
los clientes de la muestra gastaban en la tienda un
promedio de S/.1000 por año. Si con este valor de la
muestra estimó que el gasto promedio por año de
esta población finita varia de S/.940 a S/.1060. ¿Qué
nivel de confianza utilizó? Suponga que la desviación
estándar de tal población es S/.300.
U ni ver sidad N ac i onal
Federico Villarreal
Tamaño de la muestra
• Se puede determinar que tan grande debe ser el tamaño de la
muestra, de manera que si µ se estima por X, el error de
estimación no sea mayor que un valor dado e. Entonces el valor
de n se obtiene de:
2
𝑍1−𝛼/2 𝜎2
𝑛=
𝑒2
• Si la población es finita de tamaño N y el muestreo es sin
sustitución, la muestra se calcula:
2
𝑍1−𝛼/2 𝜎2 𝑁
𝑛=
2
𝑍1−𝛼/2 𝜎 2 + 𝑒 2(𝑁 − 1)
U ni ver sidad N ac i onal
Federico Villarreal
Ejemplo de tamaño de muestra
• Se desea calcular un tamaño de muestra en donde el nivel
de confianza es del 95% y se asume que el error de la
estimación no será mayor de 15. se conoce que la
desviación estándar es de S/.200.
2
𝑍1−𝛼/2 𝜎2
𝑛=
𝑒2
(1.962 )(2002 )
• Reemplazando: 𝑛 = 152
= 682.95
U ni ver sidad N ac i onal
Federico Villarreal
• Se necesita calcular el tamaño de muestra con un nivel de confianza del
97% para estimar la media de la población que tiene un tamaño de 500.
La desviación es de S/.300. El error de la estimación no será mayor de
S/.50, cuando el tamaño de n sea al menos…..
2
𝑍1−𝛼/2 𝜎2 𝑁 2.172 ∗ 3002 ∗ 500
𝑛= = 2 2 2 = 126.79
2
𝑍1−𝛼/2 𝜎2 + 𝑒 2 (𝑁 − 1) 2.17 ∗ 300 + 50 (500 − 1)
U ni ver sidad N ac i onal
Federico Villarreal
Intervalo de confianza para la media μ:
varianza σ2 supuesta desconocida
• Si la población no es normal pero el tamaño de la muestra es lo
suficientemente grande (n≥30), se utiliza la desviación estándar S
(estimada) de la muestra, como estimación puntual de la desviación
estándar o de la población.
𝑃 X−z1−α/2∗ 𝑆ൗ ≤ 𝜇 ≤ X+z1−α/2∗ 𝑆ൗ =
1 − α/2
𝑛 𝑛
U ni ver sidad N ac i onal
Federico Villarreal
Ejercicio
•Los agentes de ventas de una empresa
presentan un informe semanal que enumera
los clientes contactados durante una semana.
En un muestra de 65 informes semanales, la
media muestral es de 19.5 clientes por
semana y la S (muestral) es 5.2. Estime los
intervalos de confianza al 90% y 95% para la
media poblacional indicada.
¡Muchas gracias por su atención!