14206
Apunte 9
TEORÍA DEL LÍMITE
CENTRAL,
DISTRIBUCIONES
MUESTRALES
Ricardo Rivera
INDUSTRIA VIRTUAL 2021 1
INDUSTRIA VIRTUAL 2021 2
TEORÍA DEL LÍMITE CENTRAL, DISTRIBUCIONES MUESTRALES
Introducción
La distribución de frecuencias es uno de los primeros pasos que debemos realizar al inicio del análisis
estadístico. En conjunto con la aplicación de las medidas descriptivas, refleja cómo se reparten los
individuos de una muestra según los valores de una variable. Cuando se trata de poblaciones, la
probabilidad de observar los diferentes valores de una variable aleatoria pueden expresarse como una
función de probabilidad.
La mayoría de los fenómenos de interés en investigación científica, como pueden ser la talla y la presión
arterial, siguen leyes o distribuciones de probabilidad teóricas. Leyes especificadas matemáticamente en
las que se basan la mayoría de los métodos estadísticos. La distribución más conocida es la distribución
Normal o de Gauss. Muchos de los procedimientos estadísticos habitualmente utilizados asumen la
normalidad de los datos observados. Aunque muchas de estas técnicas no son demasiado sensibles a
desviaciones de la distribución normal y, en general, esta hipótesis puede obviarse cuando se dispone de
un número suficiente de datos (teorema central del límite), resulta recomendable contrastar si se puede
asumir o no una distribución Normal.
Para decidir si nuestra muestra procede o no de una distribución normal, existen gráficos (gráficos P-P y
Q-Q) y contrastes de hipótesis (test de Kolmogorov-Smirnov) que pueden ayudarnos. Cuando los datos
no son normales pueden transformarse o emplearse otros métodos estadísticos que no exijan este tipo de
restricciones, estos se llaman métodos no paramétricos.
Al realizar un estudio, debemos medir la(s) variable(s) que caracterizan los resultados del mismo. Tales
variables se conocen como variables aleatorias. Por lo tanto, decimos que una variable es continua si
puede tomar cualquier valor en un intervalo conocido (por ejemplo, TAS) y es discreta si solo puede
tomar algunos valores (respuesta completa, respuesta parcial, enfermedad estable).
Dado lo anterior, en el presente material, estudiaremos la teoría del límite central y distribuciones muestrales.
Esto con el objeto de comprender cómo esta teoría se aplica en la Estadística. La importancia del teorema
INDUSTRIA VIRTUAL 2021 3
central del límite radica en que mediante un conjunto de teoremas, se desvela las razones por las que, en
muchos campos de aplicación, se encuentran en todo momento distribuciones normales o casi normales.
Desarrollo
Teoría del límite central
El teorema central del límite es uno de los resultados fundamentales de la estadística. Este teorema
dice que si una muestra es lo bastante grande (generalmente cuando el tamaño muestral (n) supera los
30), sea cual sea la distribución de la media muestral, seguirá aproximadamente una distribución normal.
Es decir, dada cualquier variable aleatoria, si extraemos muestras de tamaño n (n>30) y calculamos los
promedios muestrales, dichos promedios seguirán una distribución normal. Además, la media será la
misma que la de la variable de interés y la desviación estándar de la media muestral será
aproximadamente el error estándar.
Un caso concreto del teorema central del límite es la distribución binomial. A partir de n=30, la
distribución binomial se comporta estadísticamente como una normal, por lo que podemos aplicar los
tests estadísticos apropiados para esta distribución
Si una población tiene media y desviación típica , y tomamos muestras de tamaño n con n > 30 (o
cualquier tamaño si la población es "normal"), la media de estas muestras siguen aproximadamente una
distribución normal dada por:
Distribuciones muestrales
En estadística, todos los sucesos se intentan definir como variables aleatorias. Existen muchos tipos de
ellas según sea su distribución de probabilidad. Dado que estas distribuciones tienen una relación directa
INDUSTRIA VIRTUAL 2021 4
con los datos por sí mismos y con las pruebas que deben realizarse para su análisis, comentaremos las
distribuciones más comunes como: la distribución normal, la binomial, la Ji-cuadrado, la F de Fisher,
entre otras. A continuación estudiaremos las distribuciones más relevantes
• La distribución normal
En muchas distribuciones de probabilidad de las variables cuantitativas, se observa una tendencia de los
valores alrededor de la media y menos observaciones a medida que nos acercamos a los extremos del
rango de valores. Si el número de observaciones es grande la distribución adopta una forma de campana
llamada campana de Gauss o distribución Normal. La curva en forma de campana viene dada por la
ecuación:
Donde x representa un valor de la variable, μ su media y σ la desviación estándar. La distribución normal
o gaussiana viene determinada por dos parámetros, su media y su desviación estándar. Estas están
denotadas, generalmente, por μ y σ. Así, se dice que una característica X sigue una distribución Normal
de media μ y varianza σ2 y se denota como X~ N (μ , σ), ver la figura 1.
INDUSTRIA VIRTUAL 2021 5
Figura 1: Curva de Gauss
Fuente: Matematicas10.net (2020)
La distribución normal se define por presentar ciertas propiedades importantes. Es una función
continua que tiende asintóticamente a infinito por los extremos. Es simétrica con respecto a su media μ,
por lo que existe una probabilidad de un 50% de observar un valor mayor a la media y la misma
probabilidad de observar un valor menor. Dadas las características de esta distribución, la media, la
mediana y la moda coinciden siempre.
La forma de la campana depende de los parámetros μ y σ. La media indica la posición de la campana, de
modo que para diferentes valores de μ, la gráfica se desplaza a lo largo del eje horizontal. El parámetro σ
indica la dispersión de los datos entorno a la media, así cuando mayor sea σ más plana será la curva, tal
como se indica en la siguiente figura. De un modo gráfico, podemos decir que σ es la distancia que existe
entre la media μ y el punto de inflexión de la curva (ver figura 2).
INDUSTRIA VIRTUAL 2021 6
Figura 2: Diferentes formas de funciones normales
Fuente: Díaz, N. C. (2006)
• Distribución normal estándar
Los valores de una población normal (μ, σ2) pueden transformarse en valores de una población
estandarizada. Este proceso de normalización transforma la función original N (μ, σ2) en una función
estandarizada N (0,1), resultando interesante en la práctica, ya que de esta distribución existen tablas
publicadas a partir de las que se puede obtener la probabilidad de observar un dato menor o igual a un
cierto valor z. La ecuación de estandarización es:
Véase un ejemplo:
INDUSTRIA VIRTUAL 2021 7
Suponga que observamos una característica que sigue una distribución normal con μ igual a 50 y σ2 igual
a 81 (el valor σ es 9), siendo su notación N(50,9). El objetivo es conocer cuál es la probabilidad de que
una observación obtenida al azar tome un valor mayor a 63. Mediante la estandarización, se obtendría:
De modo que P (X > 63) = P [(X – 50)/9 > (63 – 50)/9)] = P (Z > 1,4) = 1 – P (Z ≤ 1,4). Esta probabilidad
se encuentra a partir de las tablas de la N (0 , 1) que se encuentran en el Anexo. Situándonos en el valor
de Z correspondiente al valor 1,4, observamos que el valor de p, que le corresponde, es de P (Z ≤ 1,4) =
0,925. Así, se obtiene que la probabilidad de elegir un valor mayor a 63 (el complementario de que sea
menor o igual) es de 1-0,925 = 0,075. Es decir, del 7,5%.
Existen unos valores de Z que son muy conocidos por su amplia utilización en cualquier prueba en la que
se utilice esta distribución. Dichos valores corresponden a los puntos de la función de densidad que dejan
una probabilidad acumulada conocida. Tal como se indica en la siguiente figura (3), el punto z=1,96, deja
una probabilidad acumulada de 0,975 y su simétrico (z=-1,96) deja una probabilidad acumulada de 0,025.
Esto implica que el área que se establece entre un punto y otro de la curva, corresponde a la resta de sus
dos probabilidades, siendo de 0,95. Esta probabilidad está asociada a lo que veremos como intervalo de
confianza al 95% (ver figura 3).
Figura 3: Distribución normal (0,I) y área bajo la curva (Área marcada = P (z1 < Z < z2) = 0.95)
Fuente: Díaz, N. C. (2006)
INDUSTRIA VIRTUAL 2021 8
Otros valores críticos de la distribución normal estandarizada son los valores z=1.64 y z=2.58, que se
representan a continuación (figura 4):
Figura 4: Tabla de valores
Fuente: Díaz, N. C. (2006)
• Contrastes de normalidad
Los gráficos de probabilidad normal son una herramienta gráfica para averiguar si un conjunto de datos
procede de una distribución normal. Básicamente, consiste en enfrentar en un gráfico los datos
observados frente a los datos que se obtendrían en una distribución normal. Si la distribución coincide
con la normal, los puntos se concentrarán entorno de una línea recta. En los gráficos P-P se comparan las
proporciones acumuladas de la variable con las de la distribución normal, mientras que, los gráficos Q-Q
representan los cuartiles de la variable respecto los cuartiles de la distribución normal.
En el gráfico P-P, se representa para cada probabilidad acumulada de los valores de la variable
(Probabilidad acumulada observada), la probabilidad acumulada esperada, si la muestra perteneciera a
una distribución normal. Si la variable sigue una distribución Normal, los puntos estarán dispersados a lo
largo de la línea diagonal, que representa la igualdad entre las probabilidades observadas y esperadas. El
gráfico Q-Q representa los valores observados de la variable peso tipificados frente a los valores normales
esperados de una distribución N(0,1). La variable estudiada seguirá una distribución Normal si los puntos
de la figura se encuentran alrededor de la línea diagonal (ver figura 5).
INDUSTRIA VIRTUAL 2021 9
Figura 5: Gráficos de normalidad P-P y Q-Q
Fuente: Díaz, N. C. (2006)
También, existen test estadísticos para contrastar si una variable sigue una distribución normal. El test
más extendido es el test de Kolmogorov-Smirnov. Consiste en comparar la función acumulada de los
datos observados con la de la distribución normal, midiendo la distancia entre ambas curvas. Véase un
ejemplo de aplicación del test de Kolmogorov-Smirnov. El objetivo es contrastar si el peso de los
pacientes de la muestra sigue una distribución normal.
Ahora, nos adentraremos un poco en la prueba de normalidad, sin embargo, las pruebas y los contrastes de
hipótesis se desarrollarán más adelante. Como en cualquier test de hipótesis, la hipótesis nula se rechaza
cuando el p-valor es inferior al nivel de significación fijado (se suele utilizar p=0,05). En este caso, el p-
valor es de 0,515, por lo que no se puede rechazar la hipótesis nula y se asume la distribución normal.
• La distribución t de Student
La distribución de la t de Student es una distribución de probabilidad teórica, muy similar a la
distribución normal estándar. Uno de los parámetros necesarios en la distribución normal es la
desviación estándar poblacional. Pero en el caso de no disponer de ella, puede utilizarse la desviación
estándar muestral. En este caso, ya no se trata de una distribución normal, sino que se conoce como la
distribución t de Student. Esta se diferencia de la distribución normal, puesto que en ella aparece un
parámetro, llamado grados de libertad (df ‘degrees of freedom’). Esto significa que para cada medida de la
INDUSTRIA VIRTUAL 2021 10
muestra n, en realidad tenemos una distribución diferente. La distribución t de Student con n grados de
libertad, denotada como tn, es muy parecida a la distribución normal N (0,1):
• Es simétrica respecto al 0 y se extienden desde menos infinito a más infinito.
• Cuanto mayor es el número de df, más se aproxima la distribución t de Student a la distribución
normal (0,1).
• Puede considerarse aproximar la tn por una normal estándar para n>100 (ver figura 6).
Figura 6: Distribución t de Student para diferentes grados de libertad
Fuente: Díaz, N. C. (2006)
Generalmente, este modelo se aplica al caso de la media, proporciones y sus diferencias o sumas. Para una
estimación con 30 o más grados de libertad, se pueden usar tanto el modelo de Gauss, como el de Student.
Sin embargo, los intervalos obtenidos con Student son más anchos que sus equivalentes gaussianos. Por
eso, se dice que el modelo Student tiene menor precisión que el de Gauss. Los casos más frecuentes en la
práctica son (ver figura 7):
INDUSTRIA VIRTUAL 2021 11
Figura 7: Cálculo de diferentes estadísticos donde se usa la distribución t de Student
Fuente: Díaz, N. C. (2006)
INDUSTRIA VIRTUAL 2021 12
Los valores de probabilidad, según los grados de libertad de la distribución de la t de Student (se
presentan en el Anexo).
• La distribución Ji-Cuadrado
Esta distribución de probabilidad, a diferencia de las dos anteriores, no es simétrica respecto el valor 0,
sino que es asimétrica positiva, es decir, solo toma valores positivos. Como en la distribución t de Student
depende de los gados de libertad. Se denota como X2 con n grados de libertad. Esta distribución se hace
más simétrica al aumentar los grados de libertad.
La prueba X2 asociada a dicha distribución se utiliza para comparar variables de tipo ordinal o nominal, lo
que es lo mismo, comparaciones de frecuencias observadas contra las frecuencias esperadas con datos de
recuento. Más adelante, se desarrolla mejor este tema, lo mismo que su uso para testear la independencia
de dos o más factores en una tabla de contingencia.
Los grados de libertad se calculan como (número de filas -I) x (número de columnas -I) y, a medida que
aumentan los grados de libertad, tiende a una distribución normal (ver figura 8).
INDUSTRIA VIRTUAL 2021 13
Figura 8: Distribución Ji-cuadrado para diferentes grados de libertad
Fuente: Díaz, N. C. (2006)
• La distribución F de Snedecor
Principalmente, esta distribución de probabilidad se caracteriza por ser totalmente asimétrica y depender
de dos parámetros o grados de libertad. Si de dos poblaciones normales, o aproximadamente normales, se
extraen dos muestras aleatorias e independientes, y a cada una se le calcula su respectiva varianza, el
cociente de ambos valores F tendrá una distribución de Fisher, cuyos valores críticos fueron obtenidos
por W. Snedecor. Esta tabla se caracteriza por tener dos grados de libertad, el correspondiente al
numerador nI - I y el del denominador n2 – I (la tabla de distribución F se presenta en el Anexo según los
grados de libertad) ver figura 9.
INDUSTRIA VIRTUAL 2021 14
Figura 9: Distribución F de Fisher con n l y n2 grados de libertad
Fuente: Díaz, N. C. (2006)
El principal uso de esta función asociada a la comparación varianzas, es el análisis de varianza.
Comparación de medias para cuando se necesita comparar más de dos medias muestrales a la vez. En
estos casos, la idea es detectar si el efecto de uno o más tratamientos afecta a las muestras testeadas. En
cambio, cuando se tiene el caso de dos muestras, la idea es testear si hay homoscedasticidad (igualdad de
varianzas) en las dos poblaciones en estudio.
Una vez verificado este supuesto, se puede avanzar más verificando si hay diferencia entre las medias
muestrales. Así, verificar si ambas muestras tienen igual media y varianza, porque eso significa que en
realidad provienen de la misma población normal.
• La distribución binomial
La distribución binomial se utiliza cuando la variable solo tiene dos valores posibles, obtener un éxito
con probabilidad p o un fracaso con probabilidad I-p. Por tanto, en cada prueba del experimento solo son
INDUSTRIA VIRTUAL 2021 15
posibles dos resultados: el suceso A (éxito) y el suceso B (fracaso). Además, la probabilidad (p) del
suceso A es constante e independiente de los resultados obtenidos anteriormente y la probabilidad del
contrario del suceso A es I-p, representado por q. El experimento consta de un número de pruebas n. Su
variabilidad se estima como p x q, o lo que es lo mismo p x (1-p). Por ejemplo, si 50 de cada 1000
personas presenta una determinada enfermedad (p=50/1000=0,05, prevalencia de la enfermedad), la
distribución tendrá como parámetros p=0,05 y de variabilidad q=p x (1- p) = 0,047. La probabilidad
depende de dos parámetros, n y p, y se calcula como:
La distribución multinomial es una generalización de la distribución binomial. En vez de tener dos
alternativas en cada experimento, se tienen k alternativas (k > 2). Por ejemplo, hay seis resultados
posibles cuando se tira un dado. Si el “1” tiene probabilidad p1, el “2” tiene probabilidad p2,...,el “6” tiene
probabilidad p6, y si hacemos n lanzamientos independientes, los números M1 de “1”, M2 de “2”,..., M6 de
“6” constituyen un vector aleatorio M con una distribución multinonimal de parámetros n, p1, p2,..., p6.
INDUSTRIA VIRTUAL 2021 16
Conclusiones
Al terminar este apunte, hemos aprendido sobre las diferentes distribuciones muéstrales, partiendo del
teorema de distribución central y su gran utilidad para realizar estimaciones. También, se pudo estudiar
otras distribuciones muestrales tales como la distribución normal, la normal estándar, la de t de Student,
Ji-Cuadrado y la binomial cuyos usos y utilidad varían según los datos que se poseen.
Finalmente, con el estudio de este apunte se espera haber contribuido en el desarrollo de habilidades y
destrezas necesarias para una cabal comprensión del curso de Estadística y, asimismo, el desarrollo
integral de las los futuros Ingenieros Industriales en su quehacer profesional.
Nota: el anexo será entregado en la semana en curso.
Referencias bibliográficas
Hines, W. y Montgomery, D. (1990). Probabilidad y Estadística para Ingeniería (Tercera Edición ed.).
CECSA.
Walpole, R., Myers, R. y Myers, S. (2012). Probabilidad y Estadística para Ingenieros (Novena Edición ed.).
Prentice may.
Díaz, N. C. (2006). Distribuciones de probabilidad. El teorema central del límite. [imagen]. https://
www.revistaseden.org/files/8-CAP%208.pdf
INDUSTRIA VIRTUAL 2021 17