ESTIMACION DE PARAMETROS
INTRODUCCCION
Se pueden hacer inferencias acerca de los parámetros poblacionales de dos maneras. Se estiman los
valores de los parámetros o podemos tomar decisiones con respecto a ellos. El procedimiento que se
utilice depende muchas veces de las circunstancias que motivan la realización de inferencias. Por
ejemplo, en empresas con producción masiva es imposible o al menos impráctico medir cada pieza de
material que llega o las propiedades de cada producto terminado. En estos casos, las características se
estudian mediante muestras de artículos extraídos al azar y los resultados se generalizan a toda la
producción.
Suponga que una fábrica tiene dos incentivos de trabajo para que los empleados incrementen la
producción. Se hace un muestreo de los empleados y con base en los resultados de este, se escoge el
incentivo que da una mayor producción. Así es que se desea tomar una decisión acerca de la diferencia
en la producción, pero es necesario medir el riesgo de tomar una decisión incorrecta haciendo que la
probabilidad de que esto ocurra sea relativamente pequeña.
Si se observa detenidamente, en todo momento se están haciendo estimaciones. Los gerentes recurren
a las estimaciones porque en la mayoría de casos deben tomar decisiones racionales sin disponer de
información completa y con mucha incertidumbre respecto a lo que les depara el futuro.
La teoría de la probabilidad constituye el fundamente de la inferencia estadística, rama de la estadística
que se ocupa del uso de los conceptos de la probabilidad para afrontar la incertidumbre en la toma de
decisiones. La inferencia estadística se basa en la estimación, que se tratara en esta lectura y en la
siguiente sobre prueba de hipótesis, en donde se harán inferencias respecto a las características de la
población a partir de la información contenida en las muestras.
Estimación de parámetros
Tipos de estimación
Los procedimientos de estimación pueden dividirse en dos tipos, estimación puntual y estimación por
intervalos. Suponga que un vendedor de productos químicos quiere estimar la ganancia media en cada
venta de un producto nuevo. Se podría establecer la estimación mediante un solo número, por ejemplo,
$95.000 o se podría afirmar que la ganancia media esta entre $90.000 a $100.000. El primer tipo se
llama estimación puntual, ya que se puede asociar al único número que representa la estimación. El
segundo tipo se llama estimación por intervalo.
La estimación puntual utiliza la información de una muestra para llegar a un solo número que estima el
parámetro de interés. La estimación se realiza mediante un estimador.
Un estimador es una regla que expresa como calcular la estimación, basándose en la información de la
muestra y se enuncia mediante una formula.
Por ejemplo, la media muestral:
Es un estimador puntual de la media poblacional u y explica como puede obtenerse el valor numérico de
la estimación. En forma similar la varianza muestral:
Es un estimador puntual de la varianza poblacional a2.
La estimación por intervalo es una regla que indica como calcular dos números con base en los datos
muestrales, estos dos números tienen asociada una probabilidad llamada grado de confiabilidad, la cual
mide que el verdadero parámetro poblacional se encuentre dentro del intervalo.
La estimación puntual es a menudo insuficiente y no permite medir la confiabilidad de los resultados, es
por esto por lo que se utiliza más la estimación por intervalo.
Intervalos de confianza
Intervalo de confianza para la media poblacional
Aquí se tendrán en cuenta los métodos que se utilizan para construir intervalos de confianza para la
media poblacional, en tres situaciones diferentes:
1) Cuando la población es normal y la varianza de la población es conocida
2) Cuando la población es normal y la varianza de la población es desconocida
3) Cuando la población no es normal
Intervalo para la media de una población normal y la varianza de la población conocida
Por lo que se vio en las distribuciones muestrales, se sabe que la distribución muestral de X, es normal
con media u y varianza
Se expresa el nivel de confianza del intervalo como la probabilidad (1-a), donde a es el nivel de
significación, tal como la muestra la figura 1:
El intervalo esta dado por:
Que se escribe en forma resumida como:
Donde:
Z es el valor de la table normal que deja por arriba o por abajo una probabilidad igual a a/2 que
corresponde al nivel de confianza (1-a) y es el error estándar.
Recuerde que el error estándar se obtiene como:
Ejemplo 1:
El gerente de una fabrica preocupado por la demora en la producción, desea estimar el tiempo
promedio que gastan sus trabajadores en ensamblar una pieza determinada. Por experiencia se sabe
que el tiempo gastado tiene distribución normal con desviación estándar de 3,38 minutos. Se toma una
muestra de seis obreros y se registra el tiempo, en minutos, que gastan obteniendo:
Obtener una estimación con un nivel de confianza del 90%
Solución
Con los datos de la muestra se obtiene X
Para una confiabilidad o nivel de confianza del 90% encontramos el valor Zx/2 en la tabla de la
distribución normal, para ello haremos lo siguiente:
Paso 1: Encontrar el nivel alfa. Si se le da el nivel alfa en la pregunta (por ejemplo, un nivel alfa
de 10%), vaya al paso 2. Para este caso Restamos el nivel de confianza del 100%. Es decir, si
tiene un nivel de confianza del 90% entones el 100%-90%=10%.
Paso 2: Divida la cantidad que se encontró en el paso 1 en 2 para poder obtener el nivel alfa
para una prueba de dos colas: 10%/2=5%.
Paso 3: Reste el paso de 2 del 50%: 50%-5%=45%.
Paso 4: Convertir Paso 3 a un decimal y encontrar esa zona en el centro de la tabla Z.
El más cercano de puntuación Z de 45% (0,45) se encuentra entre Z=1,64 y Z=1,65; lo que haremos es
sumar estos dos datos y dividir en dos el resultado, obteniendo
El intervalo queda entonces:
Con una confiabilidad del 90%, se estima que el tiempo promedio de ensamblado esta entre 14,32 y
19,47 minutos.
Intervalo para la media de una población norma, la varianza de la población desconocida y muestra
pequeña (n<30).
Como se vio en las distribuciones muestrales, utilizamos S desviación estándar de la muestra como una
estimación de o desviación estándar poblacional y se trabaja con la distribución t student con (n-1)
grados de libertad.
El intervalo entonces queda:
Donde:
es el valor de la t de la distribución t-student que deja por arriba o por debajo una
probabilidad igual a a/2 con (n-1) grados de libertad.
es el error estándar
Luego
s: desviación de la muestra
n: tamaño de la muestra
Ejemplo 2:
Un supermercado vende café cuya etiqueta dice “40 onzas”. Ante los reclamos hechos, el gerente toma
una muestra de 14 paquetes y encuentra un peso promedio de 34,86 y una desviación estándar de 4,23.
Con una confiabilidad del 95%, estimar el peso promedio de todos los paquetes.
Datos:
n: 14, número de muestras
X: 34,86 (media de la muestra)
s: 4,23 (desviación estándar)
n-1: 14-1=13 (grados de libertad)
Para una confiabilidad o nivel de confianza del 95% encontramos el valor t en la tabla de la distribución
t-student, para ello haremos lo siguiente:
Paso 1: Encontrar el nivel alfa. Si se le da el nivel alfa en la pregunta (por ejemplo, un nivel alfa
de 10%), vaya al paso 2. Para este caso Restamos el nivel de confianza del 100%. Es decir, si
tiene un nivel de confianza del 95%, entonces el 100%-95%=5%.
Paso 2: Divida la cantidad que se encontró en el paso 1 en 2 para obtener el nivel alfa para una
prueba de dos colas: 5%/2=2.5%.
Paso 3: Ubique en la columna 1 de la tabla, los n-1 grados de libertad, en este caso da 13.
Paso 4: Convertir Paso 2 a un decimal 2.5% (0.025) y encontrar la intersección en la tabla T, tal
como lo muestra la figura 4.
Con una confianza del 95%, se puede decir que el peso promedio se encuentra entre 32.42 y 37.0 onzas.
Intervalo para la media de una población no normal
En la lectura anterior se dijo que para poblaciones no normales cuando n es grande entonces el valor de
se distribuye en forma aproximadamente normal, también se dijo que una muestra se
considera grande si n>30. Entonces el intervalo queda:
Si se desconoce a2 se estima con la varianza muestral S2
Ejemplo 3:
Un gran distribuidor de partes para automóviles necesita una estimación de la vida media que cabe
esperar de los limpia brisas en condiciones normales de manejo. La gerencia ya ha determinado que la
desviación estándar de la vida de la población es seis meses. Se selecciona una muestra aleatoria simple
de 100 limpiabrisas obteniéndose una vida media de 21 meses. Como el distribuidor utiliza miles de
estas piezas al año, quiere encontrar una estimación por intervalo con un nivel de confianza del 95%.
Solución
Dado que el tamaño de la muestra es mayor que 30, se puede utilizar la distribución normal como la
distribución de muestreo y por lo tanto:
Como el grado de confiabilidad (1-a) = 95% entonces en la distribución normal el valor de Z=1.96 (ver
pasos del ejemplo 1 para hallar el valor de Z)
El intervalo queda entonces:
Ahora, se puede decir que la vida media de los limpiabrisas se estima entre 19.82 y 22.18 meses con una
confiabilidad del 95%.
Intervalos de confianza para proporciones de una población (tamaño de muestra grande)
Las proporciones se refieren a aquella parte de la población que satisface cierta característica. Como es
una proporción se refiere a una fracción, es decir, una parte del total que cumple con cierta condición.
La proporción muestral está dada por:
Donde P representa la proporción de la muestra, X el número de éxitos y n el número de elementos de
la muestra.
Usando el modelo de la distribución binominal tenemos lo siguiente: si P es la proporción de éxitos en
una muestra de n datos independientes, para la cual la probabilidad de éxito es P, entonces, por el
teorema del limite central se tiene que la variable aleatoria.
Es aproximadamente una distribución normal estándar.
Si no se conoce de P (la probabilidad de éxito) este valor puede ser estimado con P siempre que el
tamaño de la muestra dado sea mayor que 30 (n>30), así la distribución de variable aleatoria,
Es aproximadamente una distribución normal estándar. Haremos uso de este resultado para obtener los
intervalos de confianza de la proporción de la población:
Luego, si la proporción muestral observada es P, se obtiene un intervalo de confianza aproximado de la
producción de la población al por medio de:
Ejemplo 4:
En una muestra aleatoria de 95 empresas manufactureras, 67 han indicado que su empresa ha obtenido
la certificación ISO en los dos últimos años. Halle el intervalo de confianza al 99% de la proporción
poblacional de empresas que han recibido la certificación en los dos últimos años.
Solución:
La proporción muestral está dada por:
Para una confiabilidad o nivel de confianza del 99% encontramos el valor Z en la tabla de la distribución
normal, para ello haremos lo siguiente:
Paso 1: Encontrar el nivel alfa. Si se le da el nivel alfa en la pregunta (por ejemplo, un nivel alfa
de 10%), vaya al paso 2. Para este caso Restamos el nivel de confianza del 100%. Es decir, si
tienen un nivel de confianza del 90%, entonces el 100%*99%= 1%.
Paso 2: Divida la cantidad que se encontró en el paso 1 en 2 para obtener el nivel alfa para una
prueba de dos colas: 1%/2=0.5%.
Paso 3: Reste el paso 2 del 50%: 50%-0.5%=49.5%
Paso 4: Convertir Paso 3 a un decimal y encontrar esa zona en el centro de la tabla Z.
El más cercano de puntuación Z de 49.5% (0.495) se encuentra entre Z=2.57 y Z=2.58; lo que haremos es
sumar estos dos datos y dividir en dos el resultado, obtenido
Hallemos el intervalo de confianza:
Así la proporción de empresas con certificación ISO (con un margen de error de un 12% y un nivel de
confianza del 99%) se encuentra entre el 58% y el 71% aproximadamente.
Intervalos de confianza de la varianza de una población que se distribuye normal.
Si se tiene una muestra aleatoria de tamaño n cuyas observaciones son extraídas de una población que
se distribuye normal con varianza a2 desconocida y la varianza muestral es S2 entonces un intervalo de
confianza para la varianza poblacional con un nivel de confianza de 100(1-a)% es
La variable aleatoria,
Sigue una distribución Ji-cuadrado con (n-1) grados de libertad. Este resultado constituye la base para
hallar intervalos de confianza de la varianza poblacional cuando se extrae una muestra de una población
que sigue una distribución normal.
Ejemplo 5
El director de control de calidad de una empresa química ha extraído una muestra aleatoria de veinte
sacos de fertilizante de 100 Kilos para estimar la varianza de los kilos de impurezas. Se ha observado que
la varianza muestral es de 6.62. Determine el intervalo de confianza al 95% de la varianza poblacional de
los kilos de impureza.
Solución:
Dado que S2=6.62 y n=20 vamos a establecer las valores
Elección del tamaño de la muestra
Es posible que cuando realicemos una estimación por intervalo observemos que el tamaño de este es
demasiado grande. Por ende, si ampliamos el tamaño de la muestra es posible que encontremos
intervalos de confianza mas pequeños de nos ayuden a establecer conclusiones mas precisas y cercanas
al valor de los parámetros poblacionales.
Para esto, es necesario elaborar un proceso que nos permita establecer el tamaño mas adecuado de la
muestra. Dicho tamaño de muestra se obtiene utilizando el margen de error.
Tamaño de la muestra para estimar la media poblacional con distribución normal y varianza conocida
Dado que el margen de error, que denotaremos e es igual a para determinar el valor de n
solo necesitamos despejarlo:
Téngase en cuenta que los datos dados deben ser el margen de error y la varianza poblacional.
Tamaño de la muestra para estimar la proporción poblacional con distribución normal.
Al igual que en el caso anterior, dado que el margen de error, que denotaremos ME es igual a
Para determinar el valor de n solo necesitamos despejarlo:
Téngase en cuenta que los datos dados deben ser el margen de error y la varianza poblacional.
Ejemplo 6:
La política de gobierno en asuntos internos ha recibido un índice de aprobación del 65% en una
encuesta reciente. Se ha dicho que el margen de error era de 0.035. ¿De que tamaño era la muestra
utilizada para hacer esta encuesta si suponemos que el nivel de confianza era del 95%?
Solución:
Organicemos la información dada:
Determinamos el valor de alfa:
Para una confiabilidad o nivel de confianza del 95% encontramos el valor Z en la tabla de la distribución
normal, para ello haremos lo siguiente:
Paso 1: Encontrar el nivel alfa. Si se le da el nivel alfa en la pregunta (por ejemplo, un nivel alfa
de 10%), vaya al paso 2. Para este caso Restamos el nivel de confianza del 100%. Es decir, si
tiene un nivel de confianza del 90%, entonces el 100%-95%=5%.
Paso 2: Divida la cantidad que se encontró en el paso 1 en 2 para obtener el nivel alfa para una
prueba de dos colas: 5%/2=2.5%.
Paso 3: Reste el paso 2 del 50%: 50%-2.5%=47.5%
Paso 4: Convertir Paso 3 a un decimal y encontrar esa zona en el centro de la tabla Z.
El más cercano de puntuación Z de 47.5% (0.475) se encuentre entre
Luego,
El tamaño de la muestra utilizada para hacer esta encuesta con un nivel de confianza del 95% es de 714.