Estimación
La estimación en estadística es el proceso de hacer inferencias o estimaciones sobre una
población basándose en la información obtenida de una muestra representativa de esa
población. En esencia, implica utilizar los datos recopilados de una muestra para hacer
afirmaciones o sacar conclusiones sobre parámetros o características de interés en la
población más amplia.
El objetivo principal de la estimación es obtener una medida numérica que represente un
parámetro desconocido de la población. Algunos ejemplos comunes de parámetros
poblacionales incluyen la media, la proporción, la varianza, entre otros.
Inferencia estadística:
La inferencia estadística es el proceso de sacar conclusiones sobre una población
basándose en la información recopilada de una muestra de esa población. En esencia,
implica hacer generalizaciones sobre una población más amplia utilizando datos limitados
recopilados de una muestra representativa de esa población.
El objetivo principal de la inferencia estadística es estimar parámetros desconocidos de
una población y realizar conclusiones sobre la incertidumbre asociada a esas
estimaciones.
Existen dos tipos de estimación:
Estimación puntual:
La estimación puntual es un método utilizado en estadística para estimar un parámetro
poblacional desconocido utilizando una sola estimación, es decir, un único valor numérico.
Este valor estimado se conoce como estimador puntual.
Por ejemplo, si queremos estimar la media de una población a partir de una muestra de
datos, podemos calcular la media de la muestra y usar ese valor como nuestra estimación
puntual de la media poblacional.
El objetivo de la estimación puntual es obtener un valor lo más cercano posible al
parámetro poblacional verdadero. Sin embargo, debido a la aleatoriedad inherente a las
muestras, es importante comprender que el estimador puntual puede variar de una
muestra a otra.
Cómo se utiliza para estimar parámetros desconocidos:
La estimación puntual se utiliza para estimar diversos parámetros poblacionales, como la
media, la proporción, la varianza, entre otros. Dependiendo del parámetro de interés,
utilizaremos diferentes estadísticos muestrales como estimadores puntuales.
Para realizar una estimación puntual, necesitas los siguientes elementos:
Muestra representativa: Debes tener una muestra aleatoria que sea representativa
de la población que estás estudiando. La muestra debe seleccionarse de manera
que refleje fielmente las características de la población en términos de las
variables de interés.
Variable de interés: Debes tener una variable o parámetro específico de la
población que deseas estimar. Puede ser la media, la proporción, la varianza u
otro parámetro de interés.
Cálculo de la estimación: Utilizando los datos de la muestra, calculas una sola
estimación del parámetro poblacional. Por ejemplo, si estás estimando la media
poblacional, calcularías la media muestral como tu estimación puntual.
Estimación por intervalo:
La estimación por intervalo es un método utilizado en estadística para estimar un
parámetro poblacional desconocido mediante la construcción de un intervalo que contiene
al valor del parámetro con cierto nivel de confianza. Este intervalo se conoce como
intervalo de confianza.
El proceso de construcción de un intervalo de confianza implica utilizar la información de
una muestra para determinar un rango plausible de valores para el parámetro poblacional.
Esto se logra mediante el uso de estadísticos muestrales y distribuciones de probabilidad
específicas.
Cómo se construyen intervalos de confianza para parámetros poblacionales:
Para construir un intervalo de confianza, se utiliza un estadístico muestral y se calcula un
margen de error basado en la variabilidad de la muestra y un nivel de confianza deseado.
Este margen de error se suma y resta al valor del estadístico muestral para obtener los
límites del intervalo.
Los intervalos de confianza se construyen de tal manera que, en un número determinado
de experimentos o muestras, un cierto porcentaje de intervalos contendrán el parámetro
poblacional verdadero. Este porcentaje se conoce como nivel de confianza y
generalmente se expresa en términos de un valor de z-score o t-score correspondiente a
una distribución normal estándar o una distribución t de Student.
Para realizar una estimación por intervalo, se necesitan los siguientes elementos:
1. Muestra de datos: Se requiere una muestra aleatoria de la población de interés.
Esta muestra debe ser representativa de la población en su conjunto para obtener
resultados precisos.
2. Estadístico muestral: Se utiliza un estadístico muestral para calcular la
estimación puntual del parámetro poblacional. Por ejemplo, para estimar la media
poblacional, se utiliza la media muestral (ˉxˉ); para estimar la proporción
poblacional, se utiliza la proporción muestral (^p).
3. Distribución muestral del estadístico: Es necesario conocer la distribución de
probabilidad del estadístico muestral bajo el supuesto de que la hipótesis nula es
verdadera. Esto puede ser una distribución normal o una distribución t de Student,
dependiendo del tamaño de la muestra y del conocimiento de la desviación
estándar poblacional.
4. Nivel de confianza: Se debe especificar un nivel de confianza deseado para el
intervalo de confianza. El nivel de confianza generalmente se expresa como un
porcentaje, como el 90%, 95% o 99%. Indica el grado de confianza que se tiene en
que el intervalo de confianza contiene el parámetro poblacional verdadero.
5. Valor crítico: Se determina el valor crítico correspondiente al nivel de confianza
especificado y a la distribución muestral del estadístico. Este valor crítico se utiliza
para calcular el margen de error del intervalo de confianza.
6. Margen de error: El margen de error se calcula utilizando el valor crítico y la
desviación estándar del estadístico muestral. Este margen de error se suma y
resta a la estimación puntual para obtener los límites del intervalo de confianza.
La elección entre utilizar la distribución t de Student (t) o la distribución normal estándar
(Z) depende de si conocemos o no la desviación estándar poblacional y del tamaño de la
muestra. Aquí te indico en qué casos se utilizan cada una:
Distribución Z (Z):
Se utiliza cuando la desviación estándar de la población es conocida.
Adecuada para muestras grandes (generalmente n > 30) donde la distribución de
la media muestral tiende a seguir una distribución normal debido al teorema del
límite central.
La tabla Z se utiliza para encontrar los valores críticos correspondientes a los
niveles de confianza deseados.
Distribución t de Student (t):
Se utiliza cuando la desviación estándar de la población es desconocida y se
estima a partir de la muestra.
Adecuada para muestras pequeñas (generalmente n < 30) donde la distribución de
la media muestral no sigue exactamente una distribución normal, y la distribución t
de Student tiene colas más pesadas para acomodar esta variabilidad adicional.
Los valores críticos de t varían según los grados de libertad (df), que se calculan
como el tamaño de la muestra menos uno (df = n - 1).
La tabla t de Student se utiliza para encontrar los valores críticos correspondientes
a los niveles de confianza deseados y a los grados de libertad específicos.
Grados de libertad
Los grados de libertad específicos se refieren al número de valores que pueden variar
independientemente en una situación dada. En estadística, los grados de libertad suelen
asociarse con las distribuciones de probabilidad y los modelos estadísticos, y se utilizan
para determinar la variabilidad en los datos y calcular estadísticas de prueba.
Cuando hablamos de grados de libertad específicos en el contexto de la distribución t de
Student, nos referimos al número de observaciones en una muestra que pueden variar
independientemente cuando calculamos una estimación o realizamos una prueba de
hipótesis.
Proporción:
La proporción se utiliza para representar la frecuencia relativa de una característica dentro
de una muestra o población, y es fundamental en la inferencia estadística sobre
proporciones poblacionales.