UNIDAD 2
TUTORIA 5
ESTIMACIÓN
ESTIMACIÓN
Los métodos básicos de la estadística inferencial son la
estimación y el contraste de hipótesis, que juegan un
papel fundamental en la investigación.
ESTIMACIÓN
Estimación (o estimar) es el proceso de encontrar
una aproximación sobre una medida, lo que se ha de
valorar con algún propósito es utilizable incluso si los
datos de entrada pueden estar incompletos, incierto, o
inestables. En el ámbito de la estadística estimación
implica usar el valor de una estadística derivada de una
muestra para estimar el valor de
un parámetro correspondiente a una población.
ESTIMACIÓN
ESTIMACIÓN PUNTUAL E INTERVALOS DE CONFIANZA
Existen básicamente dos métodos de estimación de parámetros: ESTIMACIÓN
PUNTUAL e INTERVALO DE CONFIANZA.
Si a partir de las observaciones de una muestra, se calcula un valor único como
estimación de un parámetro poblacional desconocido, este sistema empleado se
denomina ESTIMACIÓN PUNTUAL.
EJEMPLO: Supongamos que deseamos conocer el rendimiento promedio de los
120 obreros de una compañía para cumplir un determinado lote de producción y
que para tal fin, tomamos una muestra de 15 obreros cuyo rendimiento
promedio fue de 72 unidades por hora. Si éste valor 72 (estimador), se acepta sin
discusión, como un estimativo del rendimiento promedio de los 120 obreros,
entonces, decimos que 72 es una estimación puntual.
ESTIMACIÓN
Si de acuerdo con el ejemplo anterior, estimamos que el
promedio de los 120 obreros fluctúa entre 70 y 74 unidades
por hora, entonces el intervalo “70 - 74”, se denomina
ESTIMACIÓN POR INTERVALO
Si a una estimación por intervalo la asociamos con una
probabilidad de que el verdadero parámetro poblacional se
encuentre ubicado dentro de dicho intervalo, entonces, la
estimación así obtenida la denominamos INTERVALO DE
CONFIANZA.
ESTIMACIÓN
el ejemplo de los obreros si al intervalo “70 - 74”, lo
En
asociamos con una probabilidad 0.95 de que el
promedio del rendimiento de los 120 obreros se
encuentre dentro de dicho intervalo, entonces, el
intervalo de confianza correspondiente lo podemos
escribir así:
P(70 74) = 0.95
ESTIMACIÓN
INTERVALO
DE CONFIANZA PARA LA MEDIA,
CONOCIDA
Si una población es normal, las medias muestrales () de todas
las muestras de tamaño “n”, que pueden tomarse de una
población “N”, se distribuyen normalmente, sin importar el
tamaño de la muestra.
Por otra parte, si una población no está normalmente distribuida
o no se sabe nada de ella, según el teorema central del límite, las
medias muestrales se distribuirán aproximadamente de acuerdo
a una distribución normal, siempre y cuando el tamaño de la
muestra sea mayor que 30 (n>30).
ESTIMACIÓN
Si queremos
estimar la media de una población utilizando para ello un
intervalo de confianza, lo primero que tenemos que hacer es calcular la
media de una muestra aleatoria extraída de dicha población. Esa media
muestral podrá tener un valor cualquiera a lo largo del eje , como se
muestra en el gráfico.
ESTIMACIÓN
La probabilidad de que el parámetro poblacional se
encuentre dentro del intervalo y es igual a “1 - ”, mientras
que la probabilidad de que no se encuentre dentro de dicho
intervalo es igual a “ ”. Es decir, el resultado de “1 - ” lo
vamos a llamar nivel de confianza. La afirmación que
acabamos de hacer, la podemos escribir matemáticamente
como sigue:
P
ESTIMACIÓN
La anterior expresión de acuerdo con el gráfico, referida al eje
Z, también la podemos escribir así:
P
Como Z = Reemplazando el valor de Z en la fórmula
anterior y realizando algunos procedimientos matemáticos
nos queda:
P
ESTIMACIÓN
Fórmula para un intervalo de confianza para la media
poblacional utilizando la distribución normal.
Si el tamaño de la muestra es mayor que 30 (n >30) y el valor
de es desconocida, entonces, la desviación estándar de la
muestra “S”, puede reemplazar al valor de . Por lo tanto,
puede reemplazarse por S en la fórmula si se cumple la
anterior condición.
ESTIMACIÓN
EJEMPLO
1
Si = 24, = 3 y n = 36 construya para la media poblacional
una estimación de intervalo de confianza del 95%
SOLUCIÓN:
Primero hallamos
95% = 0.95 por lo tanto = 1 – 0.95 = 0.05
Luego = = 0.025 Luego 1 – 0.025 = 0.975
ESTIMACIÓN
hallar el valor de buscamos este valor (0.9750) en la tabla «área bajo la
Para
curva»
Por lo tanto = = 1.96
ESTIMACIÓN
La siguiente gráfica nos muestra lo anterior.
ESTIMACIÓN
Remplazando
valores y realizando lo cálculos se obtiene:
Interpretación: Existe un 95% de confianza de que la media
poblacional se encuentre entre 23,02 y 24,98
ESTIMACIÓN
EJEMPLO
2
Se recibe un cargamento muy grande de 2.500 bultos de
plátanos provenientes de una importación y se desea
estimar el peso promedio ( ) de dichos bultos, para lo cual
se toma una muestra aleatoria de 100 de bultos, que arrojan
un peso promedio de =21.6 kilos. Se sabe por experiencias
anteriores, que la desviación estándar de dichos
cargamentos es de =5.1 kilos. Se quiere un nivel de
confianza en la estimación del 95%.
ESTIMACIÓN
SOLUCIÓN
Observemos que no se sabe si el peso de los bultos de
plátano se distribuye normalmente, pero como n=100>30,
entonces, las medias muestrales se comportarán
aproximadamente de acuerdo a una distribución normal.
Datos del problema:
=21.6 kilos n = 100 =5.1 kilos
ESTIMACIÓN
Calculamos
el valor de
Como el nivel de confianza es del 95% entonces
O sea que y = 0.025
Por lo tanto 1 – 0.025 = 0.975
Buscamos el valor 0.9750 en la tabla “área bajo la curva
normal” tenemos que = 1.96
ESTIMACIÓN
Reemplazamos
en la fórmula: =21.6 n = 100 =5.1
P
P
P
P
P
En consecuencia, con un 95% de confianza la media del peso de todo el
cargamento fluctúa entre 20.6 y 22.6 kilos.
ESTIMACIÓN
EJEMPLO 3
De acuerdo con el ejemplo anterior, supongamos que
no conocemos el valor de , por lo cual calculamos la
desviación estándar de la muestra cuyo valor fue de
S=4.8.
Se pide calcular el intervalo correspondiente con un
nivel de confianza del 99%.
ESTIMACIÓN
SOLUCIÓN
=21.6 kilos n = 100 S = 4.8 kilos
Calculamos el valor de
Como el nivel de confianza es del 99% entonces = 0.01
O sea que y = 0.005
Por lo tanto 1 – 0.005 = 0.995
ESTIMACIÓN
Buscamos el valor 0.9950 en la tabla “área bajo la curva
normal”
Y tenemos que = 2.575
= 2.58
ESTIMACIÓN
Reemplazamos
en la fórmula:
P Se reemplaza a por S
P
P
P
P
En consecuencia, podemos interpretar lo anterior, diciendo
que con el 99% de confianza la media del peso de todo el
cargamento fluctúa entre 20.36 y 22.84 kilos.
ESTIMACIÓN
INTERVALO
DE CONFIANZA PARA LA MEDIA,
DESCONOCIDA Y TAMAÑO DE MUESTRA PEQUEÑA
Si una población es normal y por otra parte el tamaño de la
muestra es pequeño (n<30) y no se conoce , entonces las
medias muestrales se distribuirán de acuerdo a la distribución
t-Student.
En consecuencia, el intervalo de confianza correspondiente será
el mismo de la fórmula anterior excepto que debemos cambiar
los valores de por y además cambiar el valor de por S, así:
P
ESTIMACIÓN
EJEMPLO
Una máquina empacadora de un producto industrial viene
presentando fallas que originan diferencias en el contenido de las
bolsas empacadas cuyo peso nominal es de 23.5 gramos. Con el
fin de determinar el peso promedio de pérdida de un gran lote
de producción, se tomó aleatoriamente una muestra de 16 de
dichas bolsas en las cuales se encontró un promedio ( ) de
pérdida de 3.42 gramos, con una desviación estándar (S) de 0.68
gramos. Se pide construir un intervalo de confianza para estimar
la pérdida promedio del lote con un nivel de confianza de 0.99.
Se supone que la pérdida del peso se distribuye normalmente.
ESTIMACIÓN
SOLUCIÓN
La población se distribuye normalmente, n<30 y no se
conoce , por lo cual las medias muestrales se distribuyen de
acuerdo a la ley t-Student.
=3.42 n = 16 S = 0.68 kilos
Determinamos con n – 1 grado de libertad o sea 15 grados
de libertad.
Buscamos en la tabla de distribución t
Por lo tanto = = 2.947 con 15 grados de libertad
ESTIMACIÓN
la tabla de la distribución t se encuentra que = 2.947 con 15 gl.
En
ESTIMACIÓN
Reemplazando en la fórmula. =3.42 n = 16 S = 0.68 = 2.947
P
Con una confianza del 99%, la pérdida promedio del gran lote de producción fluctúa entre 2.92 y
3.92 kilos
ESTIMACIÓN
INTERVALO
DE CONFIANZA PARA LA PROPORCIÓN
P Siendo:
p = Proporción de la muestra
q=1–p
= Proporción de la población
n = Tamaño de la muestra
ESTIMACIÓN
EJEMPLO
De un total de 2800 estudiantes aspirantes a
ingresar a una universidad, se quiere estimar la
proporción de aspirantes que nacieron en la
ciudad sede de la universidad, para lo cual se
toma una muestra de 144, de los cuales 108
nacieron en la ciudad sede. Calcule el intervalo
con un nivel de confianza del 95%.
ESTIMACIÓN
SOLUCIÓN
Como n>30, las proporciones muestrales se distribuyen
normalmente de acuerdo al teorema central del límite.
Según la muestra la proporción de aspirantes nacidos
en la ciudad sede es:
p = = = 0.75 q = 1 – 0.75 = 0.25
Buscamos el valor el valor de = en la tabla.
= 1.96
ESTIMACIÓN
Aplicamos la fórmula: p= 0.75 q = 0.25 = 1.96 n= 144
P
P
ESTIMACIÓN
P
Con una probabilidad del 95% la proporción de estudiantes nacidos en
la ciudad sede de la universidad fluctúa entre 68% y 82%.
ESTIMACIÓN
INTERVALOS DE CONFIANZA PARA LA DIFERENCIA
ENTRE LAS MEDIAS DE DOS DISTRIBUCIONES
NORMALES CON DESVIACIONES ESTÁNDAR
CONOCIDAS
Se calcula con la siguiente fórmula.
medias muestrales. tamaños de las muestras.
medias poblacionales. desviaciones estándar poblacionales.
ESTIMACIÓN
EJEMPLO
Dos compañías A y B fabrican el mismo tipo de cable y un
distribuidor desea conocer la diferencia promedio de la resistencia a la
rotura de los mismos, para lo cual toma muestras de 100 cables de A y
50 cables de B. La muestra de los cables de la compañía A arrojan una
resistencia promedio a la rotura de 4.500 libras y los cables de la
compañía B arrojan una resistencia promedio a la rotura de 4.000
libras. Si se sabe por experiencia que la desviación estándar de la
resistencia a la rotura es de 300 libras para la compañía A y de 200
libras para la compañía B, se pide estimar el intervalo de confianza de
la diferencia de medias de la resistencia a la rotura entre los dos
cables, con un nivel de confianza del 95%. Se sabe que la resistencia a
la rotura se distribuye normalmente para ambas compañías.
ESTIMACIÓN
SOLUCIÓN
Como ambas poblaciones son normales y los tamaños
de las muestras son mayores que 30, entonces, las
diferencias de las medias muestrales también se
distribuirán normalmente, lo cual quiere decir que
podemos aplicar la fórmula anterior para estimar el
intervalo de confianza correspondiente.
ESTIMACIÓN
Organizamos los datos que proporciona el problema.
Medias Desviaciones Tamaño
muestras estándar muestra
COMPAÑÍA
COMPAÑÍA A
A = 4500 = 300 = 100
COMPAÑÍA B = 4000 = 200 = 50
COMPAÑÍA B
ESTIMACIÓN
Hallamos Z en la tabla, con = 0.025
Por lo tanto = 1.96
Reemplazamos en la fórmula
ESTIMACIÓN
Por lo tanto
Con un nivel de confianza del 95% la diferencia de los
promedios a la rotura de ambos cables fluctúa entre 419.19 y
580.81 libras
ESTIMACIÓN
INTERVALOS DE CONFIANZA PARA LA DIFERENCIA ENTRE LAS MEDIAS DE
DOS DISTRIBUCIONES NORMALES CON DESVIACIONES ESTÁNDAR
DESCONOCIDAS Y TAMAÑOS DE MUESTRAS PEQUEÑAS( Fórmula para
analizar)
ESTIMACIÓN
EJERCICIOS PROPUESTOS
1) Se sabe por experiencia que la desviación estándar de la duración de cierto
tipo de fusibles producidos por una compañía es de 24,8 horas. Se toma
aleatoriamente una muestra de 100 unidades de dicho tipo de fusible y se
encuentra que la misma presenta una media de 1685.2 horas. Determine el
intervalo de confianza para estimar la media de la duración con un nivel de
confianza del 99%.
2) Una empresa que elabora muebles de uso hospitalario compró un lote de
piezas de madera de 1 metro de longitud según el vendedor. La empresa con
el fin de comprobar la exactitud de dicha medida tomó una muestra aleatoria
de dicho lote y encontró las siguientes medidas: 0.99, 1.04, 0.98, 0.97, 1.02, 1.01,
0.99 0.95, 1.03, 1.02. Calcule el intervalo de confianza del verdadero promedio
de longitud del lote con un nivel de confianza del 90%
ESTIMACIÓN
3) Una muestra aleatoria de 5.000 obreros de una ciudad arrojó
que 188 de ellos eran hombres que vivían en unión libre. Calcular
el intervalo de confianza del 90% para la verdadera proporción de
éste tipo de unión entre la totalidad de obreros de la ciudad.
4) Se quiere estimar la media de las mediciones del peso específico
de cierto metal. Se sabe que dichos pesos se distribuyen
normalmente. Para tal estimación se toma una muestra aleatoria
de 3.000 mediciones y se encuentra que la misma arroja una media
de 3.2 libras con desviación estándar de 0.3 libras. Se requiere un
nivel de confianza del 95% en la estimación.
ESTIMACIÓN
5) Se quiere estimar la diferencia de los promedios de los
salarios entre los empleados de la empresa KTD y los
empleados de la empresa TJH. Para tal fin se toma una
muestra aleatoria de 200 empleados en la primera empresa
la cual arroja un salario promedio de $535.000 mensuales y
desviación estándar de $128.000, mientras que una muestra
de 120 empleados en la segunda empresa arroja un salario
promedio de $492.000 y desviación estándar de $75.000. Se
pide estimar el intervalo de confianza para la diferencia de
salarios entre las dos empresas con un nivel de confianza
del 90%.