Distribución muestral
es lo que resulta de considerar todas las muestras posibles que pueden ser
tomadas de una población. Su estudio permite calcular la probabilidad que se
tiene, dada una sola muestra, de acercarse al parámetro de la población.
Mediante la distribución muestral se puede estimar el error para un tamaño de
muestra dado.
La distribución de muestreo de una estadística es la distribución de esa
estadística, considerada como una variable aleatoria, cuando se deriva de una
muestra aleatoria de tamaño n. Se puede considerar como la distribución de la
estadística para todas las muestras posibles de la misma población de un
tamaño de muestra dado. La distribución del muestreo depende de la
distribución subyacente de la población, la estadística que se considera, el
procedimiento de muestreo empleado y el tamaño de muestra utilizado. A
menudo existe un considerable interés en si la distribución muestral puede
aproximarse mediante una distribución asintótica, que corresponde al caso
límite ya que el número de muestras aleatorias de tamaño finito, tomadas de
una población infinita y utilizadas para producir la distribución, tiende a infinito.
El teorema central del límite o teorema del límite central
El teorema central del límite, uno de los fundamentales en estadística, estudia
el comportamiento de la suma de variables aleatorias, cuando crece el número
de sumandos, asegurando su convergencia hacia una distribución normal en
condiciones muy generales. Este teorema, del cual existen diferentes versiones
que se han ido desarrollando a lo largo de la historia, tiene una gran aplicación
en inferencia estadística, pues muchos parámetros de diferentes distribuciones
de probabilidad, como la media, pueden expresarse en función de una suma de
variables. Permite también aproximar muchas distribuciones de uso frecuente:
binomial, Poisson, chi cuadrado, t-student, gamma, etc., cuando sus
parámetros crecen y el cálculo se hace difícil (Devore 2001: 232). Por otro lado,
la suma de variables aleatorias aparece en forma natural en muchas
aplicaciones de la ingeniería: determinación de masa forestal, carga soportada
por una estructura, tiempo de espera de servicios, etc.
Todo ello explica por qué muchos métodos estadísticos requieren la condición
de normalidad para su correcta aplicación y, en consecuencia, este teorema es
un componente importante de la formación estadística de los ingenieros, ya
que, por otro lado, su enseñanza plantea interrogantes importantes al profesor.
El teorema se apoya y relaciona entre sí con otros conceptos y procedimientos
básicos en estadística, como los de variable aleatoria y sus transformaciones,
distribución muestral, convergencia, tipificación, cálculo de probabilidades, etc.,
algunos de los cuales podrían plantear problemas de aprendizaje.
El error estándar y su interpretación
La variabilidad de las medias muestrales se puede medir por su desviación
estándar. Esta medida se conoce como el error estándar y tiende a disminuir
cuando aumenta el tamaño de la(s) muestra(s).
Definición (Error estándar)SE=σ√N𝑆𝐸=𝜎𝑁
si conocemos la desviación estándar de la población, y
SE=s√N𝑆𝐸=𝑠𝑁
si usamos la desviación estándar de la muestra.
donde:
SE: el error estándar (por sus siglas en inglés «Standard Error»)
σ𝜎: la desviación estándar de la población
s: desviación estándar de la muestra
N: número de observaciones de la muestra
Nótese que el error estándar no disminuye en relación directamente
proporcional con el tamaño de la muestra. Ya que tomamos la raíz cuadrada de
N, es necesario cuadruplicar el tamaño de la muestra para reducir el error
estándar a la mitad.
DISTRIBUCIONES MUESTRALES
El estudio de determinadas características de una población se efectúa a
través de diversas muestras que pueden extraerse de ella.
El muestreo puede hacerse con o sin reposición, y la población de partida
puede ser infinita o finita. Una población finita en la que se efectúa muestreo
con reposición puede considerarse infinita teóricamente. También, a efectos
prácticos, una población muy grande puede considerarse como infinita. En todo
nuestro estudio vamos a limitarnos a una población de partida infinita o a
muestreo con reposición.
Consideremos todas las posibles muestras de tamaño n en una población.
Para cada muestra podemos calcular un estadístico (media, desviación típica,
proporción,...) que variará de una a otra. Así obtenemos una distribución del
estadístico que se llama distribución muestral.
Las dos medidas fundamentales de esta distribución son la media y la
desviación típica, también denominada error típico.
Hay que hacer notar que si el tamaño de la muestra es lo suficientemente
grande las distribuciones muestrales son normales y en esto se basarán todos
los resultados que alcancemos.
Distribución muestral de medias
Cada muestra de tamaño n que podemos extraer de una población
proporciona una media. Si consideramos cada una de estas medias como
valores de una variable aleatoria podemos estudiar su distribución que
llamaremos distribución muestral de medias.
Si tenemos una población normal N(,) y extraemos de ella muestras
de tamaño n, la distribución muestral de medias sigue también una
distribución normal
Si la población no sigue una distribución normal pero n>30, aplicando
el llamado Teorema central del límite la distribución muestral de
medias se aproxima también a la normal anterior.
Distribución muestral de proporciones
En numerosas ocasiones se plantea estimar una proporción o porcentaje.
En estos casos la variable aleatoria toma solamente dos valores diferentes
(éxito o fracaso), es decir sigue una distribución binomial y cuando la
extensión de la población es grande la distribución binomial B(n,p) se
aproxima a la normal .
Para muestras de tamaño n>30, la distribución muestral de
proporciones sigue una distribución normal
donde p es la proporción de uno de los valores que presenta la variable
estadística en la población y q=1-p.