Estimación de parámetros
INTRODUCCIÓN
Con frecuencia, las organizaciones requieren tener indicios del comportamiento de cierta variable de interés. Por ejemplo, el área de
mercadotecnia de un banco pudiera estar interesada en conocer qué proporción de tarjetahabientes del producto premium responden
a una promoción relacionada con un viaje a pagar en plazos sin intereses. O una organización no gubernamental dedicada a implementar
programas para mejorar la nutrición de los niños entre seis y 12 años de comunidades rurales querría conocer el promedio de ingesta
calórica de esta población.
Como se ha explicado en la primera unidad de este material, el comportamiento de la población está determinado por el valor de un
parámetro. Este parámetro, normalmente desconocido, se calculará con la información de una muestra.
Estimaciones por punto y estimaciones por intervalo
Como se mencionó en la unidad de introducción al muestreo, la finalidad de la estadística inferencial es realizar estimaciones de
parámetros poblacionales con los valores de una muestra. Supóngase que en una organización se realizará un evento deportivo donde
se ofrecerán bebidas energéticas a 800 participantes: los organizadores se preguntan qué cantidad del líquido adquirir. Para resolver
este problema, encuestan a una muestra de 50 posibles asistentes acerca de la cantidad de bebida que consumen en un evento similar.
La encuesta arrojó que en promedio consumen cuatro litros por persona; así, los organizadores estiman que deberán adquirirse 800 x
4 = 3200 litros. Los organizadores creen que no necesariamente se tendría que consumir esa cantidad, por lo que prefieren manejar un
intervalo., y después de un análisis de la información estiman que el consumo será entre 3000 y 3400 litros. ¿Qué diferencia hubo entre
ambas estimaciones? En este subtema, se responderá esta pregunta.
Notación y conceptos
Un parámetro es un valor de la población que determina su comportamiento; por ejemplo, el comportamiento de una población con un
promedio de cinco unidades es diferente a otra con promedio de ocho unidades. Para hacer referencia a un parámetro poblacional, se
utilizará la letra θ.
El estimador es la regla que indica cómo realizar el cálculo de una estimación a través de una fórmula que involucre los valores de una
muestra; se denota como 𝜽̂. El símbolo “^” significa que la fórmula es un estimador del parámetro θ. Por ejemplo, si el parámetro
poblacional a estimar (θ) es el promedio poblacional 𝑿̅, el estimador del parámetro se denotará como 𝑿̅̂.
Como observación adicional, para referirse a parámetros poblacionales se utilizan letras mayúsculas o letras del alfabeto griego
Se define como estimación al valor resultante de aplicar el estimador con los datos de la muestra.
En la figura 1 se ilustra el objetivo de un estimador
Figura 1. Objetivo de un estimador
La figura anterior presenta dos conjuntos de diferente tamaño. El menor ejemplifica una muestra de tamaño n tomada del conjunto
mayor, que es la población con N elementos. Dentro de la muestra, se obtiene el estimador 𝜽̂, el cual busca estimar el valor del parámetro
poblacional θ, que normalmente se desconoce. Se espera que la estimación se aproxime al valor real, lo cual se representa con el
símbolo ≈.
Tipos de estimación
En el ejemplo narrado al comienzo de esta sección, los organizadores del evento estimaron la cantidad de bebida energética de dos
maneras: a través de un valor puntual y mediante un rango. Lo anterior ejemplifica que la estimación de un parámetro puede hacerse
de forma puntual o por intervalo. La figura 2 explica ambos tipos de estimación.
Tipos de estimación
La figura anterior define los tipos de estimación (puntual y de intervalo). La parte inferior de la figura representa esos tipos de estimación:
la línea central de color azul señala la estimación puntual del parámetro (3200 litros de bebida energética); y las líneas en color verde,
el rango de valores donde se espera que se encuentre el valor del parámetro (3000, 3400).
Estimación puntual (por punto)
Los parámetros poblacionales que habitualmente interesa estimar son el promedio y la proporción poblacional. La tabla siguiente
presenta los estimadores para estos parámetros.
Parámetros y estimadores más usados
En la tabla anterior, la primera columna muestra el nombre y la notación del parámetro. Las siguientes dos columnas hacen referencia
al estimador del parámetro: una indica cómo denotarlo; la otra, la fórmula que lo define.
Cuando se desconoce la varianza poblacional, se recurre a estimarla con la muestral:
Estimación por intervalos
Consiste en calcular un rango de valores en los que se espera, con cierto nivel de confianza, que se encuentre contenido el parámetro.
El resultado de esta estimación es un intervalo. Es común llamar a este rango de valores intervalo de confianza.
Fórmula general para construir el intervalo de confianza:
𝑰𝑪 = 𝜽̂ ± 𝜹𝝈𝜽̂
Donde:
La siguiente tabla muestra, para los parámetros promedio y proporción, su estimador, la fórmula para realizar la construcción del intervalo
de confianza para muestras grandes y pequeñas, la fórmula para realizar una estimación puntual y la desviación estándar del estimador
Elementos para construir un intervalo de confianza para el promedio y proporción poblacional
Error de muestreo y errores que no son de muestreo
Error de muestreo
Toda estimación tiene un error debido a que se conoce una parte de la información. Al comienzo de cualquier ejercicio de estimación se
debe fijar el límite de error permitido, como un porcentaje o como una desviación de unidades.
El error de muestreo se refiere a un error de la estimación atribuible a la muestra.
Por ejemplo, supóngase que se determinó manejar un error de cinco puntos porcentuales en la estimación de la proporción de alumnos
que reprueban un curso de matemáticas financieras; supóngase además que la proporción real es de 36% y la muestra obtenida arroja
una estimación de 15%. El error en la estimación más que a la metodología se debe a los alumnos que fueron seleccionados: el error
es atribuible a la muestra.
Error de muestreo
Como se sabe, el valor del parámetro determina la distribución de la población, por eso en el eje horizontal se relaciona con el valor del
parámetro, por tanto, la distribución se encuentra asociada a este valor.
La estimación resultó estar alejada del parámetro real, aunque de acuerdo con la distribución es menos probable que ocurra (esto no
significa que no pueda ocurrir).
La distancia entre el valor real del parámetro y su estimación es el error. Para manejar este error, se buscará un tamaño de muestra
que garantice
Error no atribuible al muestreo
El error no atribuible al muestreo se debe, entre otras causas, a un mal diseño del instrumento, la logística implementada o una elevada
tasa de no respuesta
Un buen diseño que considere estas eventualidades ayudará a reducir y controlar el riesgo de error.
Un ejemplo de error no atribuible al muestreo es el siguiente. Una empresa desea conocer el número de tazas de café que toma cierto
segmento de interés, y en vez de utilizar una variable cuantitativa en la respuesta de su pregunta emplea una cualitativa.
Propiedades de los estimadores
Para estimar un parámetro, puede existir en ocasiones más de un estimador, por lo que es necesario utilizar aquellos que
tengan las propiedades que se explican a continuación.
Propiedades deseables de los estimadores
Insesgado
La primera propiedad de un estimador es que estime lo que se quiere estimar; por ejemplo, si se realizara una estimación
con muchas muestras aleatorias, el valor esperado del estimador es el parámetro poblacional de interés. Cuando esto
ocurre, el estimador es insesgado.
Un estimador es insesgado si satisface la siguiente condición:
𝑬[𝜽̂] = 𝜽
Si esto se cumple, entonces:
𝑬𝑪𝑴[𝜽̂] = 𝑽𝒂𝒓 [𝜽̂]
Distribución de un estimador insesgado
Con menos variabilidad
La siguiente característica que se busca en un estimador es que sus estimaciones varíen lo menos posible del parámetro
poblacional. Un estimador así es más eficiente o con menos variabilidad.
Sean 𝜽̂𝟏 y 𝜽̂𝟐 dos estimadores del parámetro θ
Entonces, 𝜽̂𝟏 es más eficiente que 𝜽̂2
Eficiencia de dos estimadores insesgados
Consistente
La última propiedad esperada en un estimador es que, a medida que utilice mayor información de la población, su
estimación sea cada vez más cercana al parámetro poblacional. Cuando esto ocurre, el estimador es consistente.
Comportamiento de un estimador consistente
Estimación de una media con muestras grandes
El teorema del límite central garantiza que, conforme aumenta el tamaño de la muestra, la distribución del promedio
muestral se acerca a una distribución normal cuya media es el promedio poblacional, y la varianza es la varianza
poblacional entre el tamaño de la muestra. Como regla general:
Se considera que con un tamaño de muestra al menos de 30 elementos la distribución del promedio muestral sigue una
distribución normal.
Elementos para realizar la estimación puntual y por intervalo de la media (promedio) con muestras grandes
Ejemplo:
Supóngase que se desea realizar una estimación con un nivel de confianza del 95%, 90%, 99%.
Ejemplos de estimación de una media con muestras grandes
El director financiero de una agencia de publicidad desea conocer el gasto promedio de la organización, pues está
preocupado por el nivel de gasto registrado recientemente. Por tal motivo realiza una auditoría a 30 facturas elegidas al
azar.
La información de las erogaciones seleccionadas se muestra a continuación
Con la información de esta muestra, procede lo siguiente:
Estimar el gasto promedio de la organización con una estimación puntual.
Estimar un intervalo de confianza con un nivel de confianza del 99%.
Interpretar los resultados.
Ejercicio II
Una farmacéutica cuenta con 500 representantes médicos. Con la intención de diseñar un plan de incentivos, se quiere
conocer el promedio de visitas que realizan los representantes, para lo cual se analizó una muestra de 35 representantes
médicos elegidos al azar.
En la siguiente tabla, se muestran las visitas realizada en un día por 35 representantes seleccionados.
a. Estimar el promedio de visitas que realizan los representantes médicos, con una estimación puntual.
b. Estimar un intervalo de confianza con un nivel de confianza del 95%.
c. Interpretar los resultados.
Estimación de una media con muestras pequeñas