DISTRIBUCI”N NORMAL
1. IntroducciÛn
2. La distribuciÛn Normal general
3. La distribuciÛn Normal Reducida (Tipificada)
[Link]Ûn de que la distribuciÛn Normal Reducida es
una distribuciÛn de probabilidad
4. Funciones de distribuciÛn . ejemplo 1
5. FunciÛn generatriz de momentos
6. Media y Varianza de la DistribuciÛn Normal .
7. Coeficientes de asimetrÌa y kurtosis de la distribuciÛn normal .
8. Teorema de adiciÛn . ejemplo 2
9. Teorema Fundamental de las Distribuciones Normales . ejemplo 3
10. Distribuciones Normales-Transformadas
1. IntroducciÛn
La distribuciÛn normal es , con mucho , la m·s importante de todas las
distribuciones de probabilidad . Es una distribuciÛn de variable continua , con campo de
variaciÛn ]- , [ . Fue Ç descubierta por Gauss al estudiar la distribuciÛn de los
errores en las observaciones astronÛmicas.
Debe su importancia a tres razones fundamentales:
Por un lado, un gran n˙mero de fenÛmenos reales se pueden modelizar con esta
distribuciÛn (tales el caso de las caracterÌsticas cuantitativas de casi todas las grandes
poblaciones). Por otro lado, muchas de las distribuciones de uso frecuente tienden a
aproximarse a la distribuciÛn normal bajo ciertas condiciones ; y , por ˙ltimo ,en virtud
del Teorema Central del LÌmite, todas aquellas variables que puedan considerarse
causadas por un gran n˙mero de pequeÒos efectos (como pueden ser los errores de
observaciÛn) tienden a distribuirse con una distribuciÛn normal.
Para comprender mejor la distribuciÛn normal planteemos su descubrimiento ,
en un pequeÒo gr·fico . Nos encontramos midiendo la distancia a un astro (d) ;
evidentemente cada distancia observada no ha de ser es igual a la anteriormente tomada
pues cometemos errores mediciÛn , bien por nosotros , bien por lo instrumentos .
TeÛricamente un error puede ser tan grande que la distancia observada sea mas
infinito, y tambiÈn teÛricamente , menos infinito. Plasmamos en un gr·fico, y sobre un
eje , cada observaciÛn que realizamos ( en el gr·fico un cuadrado). Cuantas m·s
observaciones realizamos los diversos cuadrados , en conjunto , van tomando una
determinada forma ; si nos planteamos calcular la expresiÛn analitica de dicha forma
llegamos a la funciÛn de la curva , que tomada como funciÛn de densidad , pues posee
las caracterÌsticas de dicho tipo de funciones , es la de la distribuciÛn normal .
Dependiente , como se observa , de dos p·rametros : uno , el valor central de la curva , y
,otro, la distancia de dicho valor a los puntos de inflexiÛn (luego comprobaremos que
dichos par·metros son la media y la desviaciÛn tÌpica)
1
[Link] & [Link]
La distribuciÛn normal es una distribuciÛn de variable continua que queda
especificada por dos par·metros de los que depende su funciÛn de densidad y que
resultan ser la media y la desviaciÛn tÌpica de la distribuciÛn . Su estudio teÛrico suele
introducirse directamente a partir de su funciÛn de densidad.
2. La distribuciÛn Normal general
Como se ha dicho ,depende de dos par·metros , , , que como luego
comprobaremos , son su media y su desviaciÛn tÌpica .
El hecho de que una variable x se distribuya con una distribuciÛn normal de
media y desviaciÛn tÌpica se representa por:
X N[ ; ] Û L(X) N[ ; ]
(Aunque nosotros seguiremos este sistema de especificaciÛn , es bastante
corriente , tambiÈn Ç que a la distribuciÛn normal se la especifique por los par·metros
2
media y varianza ( en vez de desviaciÛn tÌpica), ,
Su funciÛn de densidad es:
Las caracterÌsticas de dicha funciÛn de densidad ser·n:
Si realizamos la primera derivada de dicha funciÛn tendremos que :
dado que :
la segunda derivada ser·:
Igualando a cero la primera derivada obtenemos que y'=0 para X = y para X = .
Como la segunda derivada en x = es negativa ,concluimos que la funciÛn de
densidad presenta un m·ximo en X = , lo que nos hace afirmar que la media ( es
tambiÈn la moda de la distribuciÛn normal.
Es f·cil comprobar que la funciÛn de densidad presenta dos puntos de
inflexiÛn en los valores X =
Por otro lado para cualquier valor de a se verifica que: ( +a)= ( -a)
por lo que la funciÛn es simÈtrica respecto a
3. La distribuciÛn Normal Reducida (Tipificada)
Si, a partir de una variable X que siga una distribuciÛn Normal obtenemos una
variable z que sea :
su funciÛn de densidad vendr· dada por la siguiente expresiÛn :
donde dado que
asÌ
luego
Comparando (z) con (x) es f·cil ver que la funciÛn de densidad de z serÌa la
de una distribuciÛn normal que tenga por par·metros = 0 y = 1
A partir de este resultado y aplicando las caracterÌsticas ya estudiadas de la funciÛn de
una normal , se puede concluir las siguientes propiedades de la "distribuciÛn-normal-
cero-uno":
Su funciÛn de densidad es simÈtrica respecto z = 0
Su funciÛn de densidad presenta dos asÌntotas para tendiendo a cero por ambos
lados
Presenta dos puntos de inflexiÛn
en z = ± 1
Presenta un m·ximo en z=0 . AsÌ
su representaciÛn gr·fica serÌa:
3.1. ComprobaciÛn de que la distribuciÛn Normal Reducida es una distribuciÛn
de probabilidad
La funciÛn de densidad es siempre positiva por lo que bastar· para probar que
puede ser una distribuciÛn de probabilidad con el hecho de comprobar que su funciÛn
de distribuciÛn toma el valor 1 en el infinito: es decir F( )=1
Conocemos por otra parte que la integral impropia (integral de Poisson) es
siendo ,evidentemente , U una funciÛn de z.
por lo que realizando el cambio por lo que y
tendremos que la integral que buscamos resolver ser·:
por lo que se demuestra que es funciÛn de distribuciÛn de
probabilidad.
4. Funciones de distribuciÛn
Como ya conocemos la distribuciÛn normal(general) de probabilidad tiene una
funciÛn de densidad
que integrada para todo su campo ]- , [ darÌa como resultado la expresiÛn analÌtica
de su funciÛn de distribuciÛn de probabilidad . Para el c·lculo de probabilidades
especificas para un determinado valor de la variable X ( que se plantea que se distribuye
seg˙n una Normal) tendrÌamos que la probabilidad de que la variable X se menor o
igual (el hecho igual es indiferente pues estamos ante una variable continua) a un valor
X1 es :
La realizaciÛn de este c·lculo de probabilidad supone la realizaciÛn de la
integral y depender· para cada caso del valor de los par·metros de la funciÛn y .
Dado que los valores que pueden tener dichos par·metros son infinitos y
distintos para cada caso , nos vemos en la necesidad de realizar la integral y el c·lculo
para cada valor de probabilidad que queramos establecer. Para solventar este problema
operativo la soluciÛn radica en transformar la normal con la que estemos trabajando en
la normal tipificada N[0;1] . ; tipificando los valores de la variable de los que queramos
establecer probabilidades.
De esta manera solo tendremos que actuar con la funciÛn de densidad de la
normal reducida que , evidentemente , es m·s sencilla de manera que:
si X N[ ; ] y pretendemos calcular P(x X )
harÌamos : trabajar, con la m·s sencilla , normal reducida Z N[0;1]
calculando P(z z ) donde
1
es decir el valor tipificado de X1
de esta manera tendrÌamos que realizar:
que resulta m·s f·cil de resolver
Dado que todas las distintas normales con las que nos podemos encontrar son
susceptibles de transformarse en "tipificadas" , la ˙nica que tiene sus valores tabulados
en una tabla es , precisamente, la normal [ 0;1] . Si bien lo anteriormente mencionado ha
sido lo habitual , en estos momentos, y gracias a las posibilidades inform·ticas, es
posible establecer algoritmos de ejecuciÛn para cualquier par de par·metros que definan
una normal , y es posible por ello el c·lculo de probabilidades "directo" sin necesidad de
tipificar los valores de la variable. Este tipo de algoritmo funciona , como se puede
comprobar, en el "script" de la distribuciÛn normal que se ofrece en la ìCaEstî en
http//[Link]/lejarza/caes
ejemplo 1
Sea X una variable aleatoria que se distribuye seg˙n una normal de media 5 y
desviaciÛn tÌpica 2 . Calcular la probabilidad de que dicha variable tome valores
inferiores a 4 .
X N(5;2) se nos pide P(x 4) sin utilizar tablas o algoritmos de recurrencia
tendrÌamos que realizar la integral :
para no tener que resolver dicha integral y dado que no podemos tener tabuladas todas
las posibles distribuciones normales ( por ejemplo esta , la N(5;2)) transformaremos el
valor de la variable sobre el que queremos calcular una probabilidad aun valor tipificado
(estandarizado) , para poder usar la tabla de la N(0;1) que habitualmente tenemos a
mano realizada-calculada por varios autores . AsÌ , siendo t N(0;1) tendrÌamos:
asÌ el efecto de lo apuntado serÌa el expuesto en la imagen:
Utilizando una tabla de la normal 0,1 obtendrÌamos el valor 0.691
5. FunciÛn generatriz de momentos
Vamos a calcular primero la F.G.M. de la distribuciÛn normal reducida v(t).
Una vez obtenida Ç esta , teniendo en cuenta que una variable normal general puede
verse como una transformaciÛn lineal de una variable normal
reducida [ x= z + ] ,obtener la F.G.M. de la normal general ser sencillo ya que:
siendo la F.G.M. de la normal reducida
manipulando el exponente tendremos que:
con lo que la F.G.M. quedar :
si llevamos a cabo el cambio de variable u=z-t tendremos que :
dz = du y adem·s si : y si
tendremos que :
ya que el integrando , prescindiendo del nombre de la variable, es la funciÛn de
densidad de una normal reducida que integrada para todo el campo y su valor ser· uno.
AsÌ pues la F.G.M. de la normal reducida es:
Y, por tanto , la F.G.M. de la normal general ser· :
6. Media y Varianza de la DistribuciÛn Normal
La media es el momento ordinario de primer orden ( E(x)= ) y, por lo tanto
ser· (seg˙n el teorema que conocemos como de los momentos) el valor que tome la
primera derivada de la funciÛn generatriz en el punto t =0.
luego aplicando lo enunciado:
que para el valor de t = 0
tomar· el valor con lo que queda demostrado
que la media de la distribuciÛn normal es su par·metro
La varianza , como conocemos, es siendo el momento
ordinario de orden segundo ; que obtendremos aplicando el valor t = 0 a la segunda
derivada de la FunciÛn Generatriz de Momentos. AsÌ:
que para el valor t = 0 ser·:
por lo que la varianza quedar· :
lo que nos indica que la varianza de la distribuciÛn normal coincide con su
par·metro al cuadrado ;lÛgicamente la desviaciÛn tÌpica ser· .
7. Coeficientes de asimetrÌa y kurtosis de la distribuciÛn normal
Dado que se trata de calcular el coeficiente de asimetrÌa para cualquier
distribuciÛn normal , pues es evidente que todas tendr·n la misma forma . Es
conveniente que nos planteemos la resoluciÛn para la normal reducida N[0;1] , lo que
lÛgicamente nos ahorrar· c·lculos
El coeficiente de asimetrÌa de la normal reducida o tipificada , , es el
momento central de tercer orden de dicha variable tipificada (z), asÌ:
ya que la media de la variable tipificada es cero , para calcular el coeficiente de
asimetrÌa nos bastar· con calcular el momento ordinario de tercer orden de la variable
tipificada. y el momento de tercer orden de la variable tipificada ser· el valor que tome
la tercera derivada de la F.G.M. de la distribuciÛn de z ( normal reducida) en el punto
t =0:
la F.G.M de la tipificada resultaba ser
la primera derivada ser·
luego para t = 0 ser·:
la segunda derivada ser·
luego para t = 0 ser· :
la tercera derivada ser·
o lo que es lo mismo
haciendo t =0 tendremos que :
luego quedarÌa
Por lo que el coeficiente de asimetrÌa de la distribuciÛn normal es cero lo que
supone , como cabrÌa esperar, que la distribuciÛn es simÈtrica .Su eje de simetrÌa es la
media ( µ ) que por esta razÛn es tambiÈn le mediana de la distribuciÛn
En cuanto al coeficiente de kurtosis , operaremos de la misma manera que lo
hicimos con el de asimetrÌa, es decir ,bas·ndonos en la normal reducida .Conocemos
que dicho coeficiente es el momento central de cuarto orden de la variable tipificada
menos tres unidades . Pero al tratarse de una variable tipificada , cuya media es cero el
momento central debe coincidir , y coincide con el momento ordinario ; es decir ,
con el valor de la cuarta derivada de la FunciÛn Generatriz de Momentos para el valor
t = 0.
tendremos asÌ que la cuarta derivada de F.G.M. es :
para t = 0 tendremos que :
por tanto el valor del momento central de orden cuarto toma el valor 3.
asÌ , planteando el coeficiente de kurtosis como
el coeficiente de Kurtosis es 0 ; como se puede constatar el hecho de que haya resultado
0 , es precisamente por habÈrsele restado el propio valor del momento central de orden
cuarto , para con ello tomar la forma de la distribuciÛn normal como modelo de
comportamiento para otras distribuciones , de ahÌ que algunos autores consideren que el
coeficiente de Kurtosis no tiene como valor de referencia centrado el 0 , si no el 3 . Es
por tanto la distribuciÛn normal la que posee la forma tipo en cuanto a aplastamiento o
apuntamiento , y sirve de modelo para las dem·s distribuciones.
8. Teorema de adiciÛn
La distribuciÛn normal verifica el teorema de adiciÛn para los par·metros media
y varianza . Esto es, dado un conjunto de variables aleatorias normales independientes
de distintas medias y distintas varianzas , la variable suma de todas ellas se distribuir·
seg˙n una distribuciÛn normal con media, la suma de las medias; y con varianza , la
suma de las varianzas.
Teniendo en cuenta que nosotros hemos caracterizado la distribuciÛn normal con los
par metros media , , y desviaciÛn tÌpica , , el enunciado del teorema quedarÌa de la
siguiente manera:
Dado un conjunto de variables aleatorias normales independientes de distintas medias y
distintas desviaciones tÌpicas , la variable aleatoria suma de todas ellas se distribuir
seg˙n una distribuciÛn normal , con media , la suma de las medias ; y con desviaciÛn
tÌpica , la raÌz cuadrada de la suma de los cuadrados de las desviaciones tÌpicas.
Teniendo en cuenta la recursividad de la operaciÛn suma, para demostrar el teorema
para cualquier n˙mero de variables aleatorias basta probarlo para el caso de dos
variables.
DemostraciÛn:
Sean X e Y dos variables aleatorias independientes y tales que:
X N [ x ; x ]
Y N [ y ; y ]
queremos comprobar que la variable U=X +Y es tal que:
AsÌ y en efecto:
por ser x e y normales sus Funciones Generatrices de Momentos ser·n:
para X ser·
para Y ser·
dado que son independientes , la F.G.M . de la suma ser· el producto de las Funciones
Generatrices de Momentos
y asÌ:
luego :
que es la funciÛn generatriz de momentos de una distribuciÛn normal con
media y varianza
luego lo es de la distribuciÛn :
queda , por tanto , demostrado que la distribuciÛn normal verifica el teorema de adiciÛn
para los par·metros : y
ejemplo 2
Dos variables X e Y son independientes y , adem·s se distribuyen normalmente
de manera que: X N(2;1) mientras que Y N(4;2) ; suponemos que Z=X+Y . Nos
preguntamos por cu·l ser· la distribuciÛn y par·metros de la variable Z.
dado que X e Y son normales e independientes la variable Z tambiÈn ser· normal y en
aplicaciÛn del teorema de adiciÛn tendremos que sus par·metros ser·n:
por lo que Z N(6 ; 2,236)
9. Teorema Fundamental de las Distribuciones Normales
Se trata de una generalizaciÛn del teorema anterior: "cualquier combinaciÛn lineal de
variables aleatorias normales independientes es una variable aleatoria normal con media
la misma combinaciÛn lineal de las medias y con varianza la combinaciÛn lineal de las
varianzas con los coeficientes que las acompaÒan al cuadrado ".(Su desviaciÛn tÌpica
ser· la raÌz cuadrada de esta combinaciÛn lineal)
Sean las variables aleatorias Xi , con i=1,2,3,...n, todas ellas independientes tales que:
y sean los n˙meros reales a i con i=1,2,3,...n
la variable combinaciÛn lineal
:
se distribuir· seg˙n :
DemostraciÛn: a partir de cada variable Xi construimos la correspondiente variable ,
ui = ai xi
por ser las u transformaciones lineales de las xi sus F.G.M. ser·n:
las nuevas variables ui son tambiÈn Ç independientes y , por otro lado , la variable Y se
puede descomponer como la suma de las variables ui . y asÌ
de forma que la F.G.M. de la variable Y ser· el producto de las
F.G.M. de las ui , por serÇ estas independientes:
cuya expresiÛn no es m·s que la FunciÛn Generatriz de Momentos de una distribuciÛn
normal
con media y varianza tal y como querÌamos demostrar
ejemplo 3
Una pieza J est· compuesta por 2 elementos de A y uno de B , que se unen sin
solapamiento . La longitud de las piezas A sigue una N[4;1] cm. , mientras que las B
tambiÈn son normales N[12;2]cm. . Queremos conocer la probabilidad de crear una
pieza J de longitud inferior a 20,2 cm
Longitud de J = longitud de A+ longitud de A + longitud de B
y no Longitud de J = 2veces longitud de A + longitud de B
dado que si una pieza A es de una determinada longitud aleatoria la otra pieza A no
tiene porque ser de la misma longitud (aunque proceda o se distribuya con la misma
distribuciÛn de probabilidad). A parte de esto ,el hecho de utilizar suma o producto no
da el mismo resultado al aplicar el teorema fundamental de las distribuciones normales ,
dado que la suma o producto se realizan dentro de una raÌz . Por ello ,en este caso ,
hemos de tomar la primera expresiÛn , asÌ:
L(J)=L(A)+L(A)+L(B) simplificando J=A+A+B dado que:
A N [ 4; 1] y B N[12; 2] y son independientes:
y en aplicaciÛn del teorema fundamental de las distribuciones normales , tendremos que
Luego J N[20 ; 2.449]
y que evidentemente no resultarÌa lo mismo si hubiÈsemos hecho, como antes dijimos, :
cuyo resultado serÌa : J N[20 ; 2.82]
Conociendo que la verdadera longitud de la pieza es J N[20 ; 2.449]
se nos pregunta por
siendo el resultado seg˙n tabla de la N[0;1] ; 0.532
10. Distribuciones Normales-Transformadas
Una variable aleatoria x sigue una distribuciÛn normal-transformada si, no siendo ella
misma normal, si lo es una cierta funciÛn de ella:
z = h (x) N [ ; ]
la funciÛn de densidad de x ser· :
donde el jacobiano
de forma que la funciÛn de densidad quedarÌa de la siguiente manera :
Un caso especialmente importante es el de la distribuciÛn logaritmo-normal , log-
normal, o distribuciÛn de Galton:
X sigue una distribuciÛn de Galton si Z = ln (x - a) N ( ; )
y , asÌ , su funciÛn de densidad ser· :
que evidentemente , sÛlo estar· definida para valores x > a.
a modo orientativo planteamos la forma de tres distribuciones lognormales con
medias y varianza distintas :