6.
DISTRIBUCIONES DE PROBABILIDAD
CONTINUAS
Como dijimos en el capítulo correspondiente a variables aleatorias, existen
variables aleatorias discretas y continuas. Las variables aleatorias continuas
son aquellas que pueden tomar cualquier valor real dentro de un intervalo
(a,b) (o [a,b], donde a y b ), o cualquier valor real de la recta numérica.
Sus distribuciones de probabilidad reciben el nombre de distribuciones de
probabilidad continuas o modelos de probabilidad continuos.
A continuación veremos:
La distribución uniforme o rectangular.
La distribución normal o de Gauss.
La distribución exponencial.
La distribución chi-cuadrado.
La distribución t de Student.
6.1.Distribución uniforme o rectangular TN
U
Definición:
Supongamos que X es una v.a. continua que toma todos los valores en el
SF
intervalo [a , b], donde a y b son finitos. Si la función de densidad de
probabilidad está dada por:
1
FR
f (x) = a ≤ x ≤ b, con a b
ba
0 Para cualquier otro valor.
E
Diremos que x está distribuida uniformemente en el [a , b].
Función de Densidad de Probabilidad:
y
f(x) debe cumplir las siguientes condiciones para ser una función de
densidad de probabilidad:
P
a) f x 0 x
b) f x dx 1
Demostración:
a) Se cumple por ser b > a.
f x dx f x dx f x dx f x dx
a b
b)
a b
1 ba
0 x ba 0 1
ba ba
ab
Si queremos calcular, por ejemplo, P x hacemos:
2
ab
a b f x dx a b f x dx b f x dx a b
b b 1
P x dx 0
2 2 2 2 ba
a b 2b a b
b
1 2 2 ba
x ba b 1/ 2
ba 2 ba ba 2b a
Este resultado es coherente con el concepto de distribución uniforme, pues
el evento {X (a + b) / 2} se presenta en todos los puntos que pertenecen a
la segunda mitad del intervalo [a , b] y su probabilidad resulta entonces
0.50.
Representación Gráfica:
f(x)
ab
P x
2
1/(b-a)
a (a+b)/2 b TN x
U
Función de Distribución:
xa
SF
F x P X x f t dt f t dt 0
a x x 1 1
dt t x
ba ba ba
a
a a
0 x<a
FR
xa
F (x) = a≤x≤b
ba
1 x>b
E
Esperanza y Variancia:
y
E x xf x dx xf x dx b xf x dx
a 1 b
b a a
xdx
P
1 x2 1 b 2 a 2 b a b a a b
0 b
0
ba 2 ba 2b a
a
2 2
V x E x 2 E x
2
E x 2 x 2 f x dx x 2 f x dx x 2
a
a
ba
1
b
dx x 2 f x dx
b
0
1 x b b a
3
3 3
2
b a b ab a 2 b 2 ab a 2
ba 3 3b a 3b a
a
3
b 2 ab a 2 a b 4b 2 4ab 4a 2 3a 2 6ab 3b 2
2
V x
3 4 12
a 2 2ab b 2 a b
2
12 12
Ejemplo:
Una v.a. continua X obedece a una distribución uniforme con una función de
densidad dada por:
f (x) = 1/200 si 0 x 200
0 en otro caso
Calcular:
a) La función de distribución
b) P (x > 60)
c) P (60 < x < 120)
d) E (x) y (x)
Solución:
0 x<0
a) F (x) = x / 200 0 x 200
1 x > 200
b) P (x > 60) = 1 – P (x 60) = 1 – F (60) = 1 – 60/200 = 1 – 0.3 = 0.7
c) P (60 < x < 120) = F (120) – F (60) = 0.6 – 0.3 = 0.3 (Recordemos que,
por tratarse de v.a. continuas, las probabilidades puntuales valen 0 y, por
d) E (x) = (a + b) / 2 = (0 + 200) / 2 = 100
x b a / 12 200 0 / 12 57.74
TN
lo tanto, da lo mismo calcular P (x < 40) o P (x 40))
U
Ejercicio Propuesto:
SF
Las ventas de nafta que realiza una estación de servicio siguen un modelo
uniforme continuo. Debido a las limitaciones de capacidad de los tanques de
FR
la estación, las ventas diarias no pueden superar los 30000 litros. Calcule:
a) La probabilidad de que, en un día cualquiera, se vendan más de 20000
litros.
b) La probabilidad de que, en un día cualquiera, se vendan, a lo sumo,
E
25000 litros.
c) El valor esperado de la cantidad de litros que se venden por día.
y
6.2.Distribución normal o de Gauss
P
Es la distribución más importante en la Estadística. Esto se debe,
principalmente, a las siguientes razones:
a) La distribución normal constituye una muy buena aproximación de otras
distribuciones de probabilidad discretas y continuas. Por ejemplo, se
puede probar que, a medida que el valor de n aumenta, la distribución
binomial y la de Poisson tienden a la normal. Si realizamos
representaciones gráficas con algún paquete estadístico y vamos
aumentando el tamaño de n o de , respectivamente, podremos observar
cómo la forma asimétrica a la derecha (o a la izquierda, en caso de la
binomial) va tendiendo a la forma acampanada simétrica, es decir, a la
forma de la distribución normal o de Gauss.
b) Muchas variables que se observan en la vida diaria siguen una
distribución normal. Podemos citar: el peso, la estatura, el cociente
intelectual de las personas, la duración de algún producto perecedero
como una bombita eléctrica o un componente de alguna máquina, y los
errores aleatorios en las mediciones.
c) Independientemente de la distribución de probabilidades que tenga una
población, si extraemos muestras aleatorias y hallamos luego la
distribución muestral de los estadísticos, muchos de ellos serán
normales. Por ejemplo, sabemos que la x (media muestral) tiene una
distribución aproximadamente normal si el tamaño de la muestra es
suficientemente grande (Teorema Central del Límite).
Función de Densidad de Probabilidad:
Si x y tiene una distribución normal, su f.d.p. es la siguiente:
1 x
2
f x
1 2
e
2
La notación x ~ N ( , ) se lee: “x es una v.a. normal con esperanza y
desviación típica ”. Recordemos que puede tomar en general cualquier
valor real, mientras que puede tomar cualquier valor real positivo, es
decir: y +.
Recordemos también que, para una v.a. continua, las probabilidades se
calculaban integrando la función de densidad de probabilidad en el intervalo
TN
U
de interés, es decir:
P x a, b Pa x b f x dx
b
SF
a
En el caso de la distribución normal:
1 x
2
1 x
2
FR
b 1 1 b
e
2 2
e dx dx
a
2 2 a
Esta integral no puede evaluarse por métodos comunes, pues no tiene
E
primitiva y, por tanto, no podemos aplicar el teorema fundamental del
cálculo. Pero no nos desanimemos pensando en lo complicado de hallar las
y
probabilidades; los métodos de integración numérica nos dan la herramienta
para poder resolverlo. Alguien ya se tomó este trabajo por nosotros
P
anteriormente y tabuló los valores. Por lo tanto, para poder calcular
probabilidades normales, sólo debemos aprender a usar una tabla de
probabilidades normales que se encuentra en el Apéndice del presente libro.
Graficamos N (2 , 0.5), es decir, una distribución normal donde = 2 y =
0.5 y marcamos en el gráfico la P (1 < x < 3):
f(x)
0 1 =2 3 x
Algunas características de la distribución normal:
Toda el área bajo la curva es igual a 1. Esto es obvio si pensamos que,
por ser una f.d.p., la ley normal o de Gauss verifica las condiciones de la
misma, que según ya vimos eran:
a) Condición de no negatividad: f x 0; x
b) Condición de cierre: f x dx 1
Esta última condición es la que nos permite afirmar que el área bajo la
curva es igual a 1.
TN
La distribución tiene forma de campana simétrica, por eso vulgarmente
se habla de “campana de Gauss”. El punto máximo es la ordenada de ,
U
que además coincide con la mediana y con el modo, por tratarse de una
distribución simétrica.
SF
El eje x es asíntota de la curva, es decir, a partir de la curva se extiende
indefinidamente hacia la izquierda y hacia la derecha, tendiendo al eje x
pero sin tocarlo nunca. En la práctica, a una distancia 3 de (hacia la
FR
derecha y hacia la izquierda), el valor de f (x) es muy próximo a 0.
El eje de simetría de la curva es x = (es decir, la vertical que pasa por
).
E
Los valores de y determinan, respectivamente, la ubicación de la
curva sobre el eje x y la forma de la misma.
y
La curva tiene sus puntos de inflexión en x = ; es cóncava hacia
P
abajo si - < x < + y es cóncava hacia arriba en cualquier otro
punto.
f(x)
- + x
Ejercicio Propuesto:
a) Comparar las formas de distribuciones normales con la misma y
diferentes , trazando las gráficas sobre un mismo sistema de ejes
coordenados.
b) Ídem anterior, pero tomando los mismos y diferentes .
Dada una v.a. x ~ N ( , ), ¿cómo resolvemos el cálculo de probabilidades
para intervalos? No olvidemos que, si la v.a. es continua, la probabilidad de
que tome un valor particular es 0, es decir: P(x = x0) = 0. Además, las
siguientes probabilidades resultan iguales:
P (a < x < b) = P (a x < b) = P (a < x b) = P (a x b)
Como ya dijimos , en general, puede tomar cualquier valor real y
cualquier valor +. Luego, para cada posible par de valores ( , ) tengo
una distribución normal diferente y, obviamente, la cantidad de pares
posibles es infinita. Dijimos, además, que la distribución normal estaba
tabulada. Pero, de todas las distribuciones que existen, ¿cuál está tabulada?
TN
Los estadísticos resolvieron este problema tabulando una única distribución
normal, llamada la distribución normal típica o estándar, e ideando un
procedimiento que permite transformar cualquier distribución normal en la
U
distribución normal típica, como veremos a continuación.
SF
6.2.1.Distribución normal típica o estándar
Sea z una v.a. normal tipificada o estandarizada, la f.d.p. de z es:
1
1 2 z2
f z
FR
e ;z
2
Los valores característicos de z son: E (z) = 0 y z = 1, es decir, z ~ N (0,1).
Luego:
E
Si x ~ N ( , ) z ~ N (0,1)
y
Transformación
x
z
P
A esta transformación a veces se la llama proceso de tipificación de la
variable.
Ejercicio Propuesto:
Aplicando propiedades de esperanza matemática y variancia, demostrar que:
E (z) = 0 y V (z) = 1.
En la figura siguiente mostramos una distribución normal cualquiera y la
típica o estándar:
f(z)
f(x)
x =1
z
x1 x2 x
z1 z2 0 z
Distribución Normal (,)
Distribución Normal (0,1)
Todos los valores x entre x1 y x2 de la primera distribución tienen sus
correspondientes valores z entre z1 y z2 en la segunda distribución. Por lo
tanto, las áreas sombreadas son equivalentes. Luego, con una sola tabla (la
TN
de la distribución normal típica) resolvemos nuestro problema de cálculo de
probabilidades.
Ejemplo de Uso de la Tabla:
U
Reproducimos una parte de la tabla P (Z z1):
SF
z 0.00 0.01 0.02 0.03 0.04 ...
0.0
0.1
FR
0.2
0.3
0.4
E
0.5 0.6985
...
y
Gráficamente:
P
f(z)
P (Z 0.52) = 0.6985
0 0.52 z
Veremos cuatro casos:
Caso 1: En una distribución normal típica, encontrar probabilidades para
determinados valores de la variable.
Caso 2: En una distribución normal típica, encontrar valores de la variable
para determinadas probabilidades.
Caso 3: En una distribución normal cualquiera, encontrar probabilidades
para determinados valores de la variable.
Caso 4: En una distribución normal cualquiera, encontrar valores de la
variable para determinadas probabilidades.
Caso 1:
Ejemplo
Dada una distribución normal estándar, encuentre el área bajo la curva que
está:
a) A la derecha de z = 1.50.
b) Entre z = -1.30 y z = 0.32.
Solución
a)
f(z) (z > 1.50) y (z 1.50) son sucesos contrarios
Por lo tanto:
P (z > 1.50) = 1 – P (z 1.50) =
= 1 – 0.9332 = 0.0668
0 1.50 z
TN
Obtenida de la Tabla
U
b)
SF
f(z)
P (-1.30 < z < 0.32) =
FR
= P (z < 0.32) – P (z -1.30) =
= 0.6255 – 0.0968 = 0.5287
-1.30 0 0.32 z
E
y
Caso 2:
Ejemplo
P
Dada una distribución normal estándar, encuentre los valores de z0 tales que:
a) P (z > z0) = 0.3015
b) P (z0 < z < -0.18) = 0.4197
Solución
a)
f(z)
0.3015 Podría surgirnos la duda de si el
valor de z0 es positivo o negativo.
0 z0 z
Si lo hubiéramos ubicado a la izquierda del 0, nos hubiera quedado así:
f(z) El área sombreada ¿puede valer
0,3015? Es evidente que no pues,
al incluir mitad completa de la
campana, debería ser un área
mayor que 0,50.
Luego, concluimos que z0 debe ser
TN
z0 0 z positivo.
En la tabla de probabilidades de z, debemos buscar 1 – 0.3015 = 0.6985 en
el cuerpo de la tabla, es decir, entre los valores de probabilidades; luego,
U
resulta que z0 = 0.52.
b)
SF
f(z) P (z0 < z < -0.18) =
= P (z < -0.18) - P (z < z0) =
FR
= 0.4286 - P (z < z0) = 0.4197
Luego:
P (z < z0) = 0.4286 – 0.4197
P (z < z0) = 0.0089
E
z0 -0.18 0 z De la tabla, se tiene que z0 = -2.37
y
Caso 3:
P
Ejemplo
Si x ~ N (30,7), calcule:
a) P (x 32)
b) P (27 < x 31)
Solución
32 30
Px 32 P z Pz 0.28 0.6103
7
x
Tipificamos, es decir, aplicamos la transformación z
27 30 31 30
P27 x 31 P z P 0,43 z 0,14
7 7
P z 0.14 P z 0.43 0.5557 0.3336 0.2221
Caso 4:
Ejemplo
Dada la v.a. x ~ N (40,6), encuentre el valor de x que tiene:
a) El 40% del área a la izquierda.
b) El 20% del área a la derecha.
Solución
a)
P X x0 0.40
f(x)
x 40
0.40 P Z 0 0.40
6
z0
x0 40 x
De tabla resulta que z0 -0.25 (valor que corresponde a un área de 0.4013;
el resultado no variará mucho). Es decir:
x 40
TN
se podría interpolar linealmente para encontrar un valor más exacto, aunque
U
0.25 0 x0 40 0.25 * 6 38.5
6
SF
b)
f(x)
P X x0 0.20
FR
P X x0 1 0.20 0.80
0.20 x 40
P Z 0 0.80
6
E
z0
40 x0 x
y
De tabla resulta que z0 0.84 (valor que corresponde a un área de 0.7995).
P
Es decir:
x 40
0.84 0 x0 40 0.84 * 6 45.04
6
Problemas Propuestos:
a) Encuentre los dos puntajes z que delimitan el 50% central de una
distribución normal.
b) ¿Cuáles son los valores de z que corresponden al 1º, 2º y 3º cuartil de
una distribución normal típica?
c) Un profesor universitario dice a sus alumnos: “Para obtener la
calificación Distinguido es necesario que su calificación esté ubicada en
el 10% superior de la distribución de las calificaciones del curso”. La
media de las calificaciones resultó ser 68 puntos y la desviación típica
10 puntos. El profesor ha comprobado en sucesivos exámenes que la
distribución de las calificaciones es normal.
- ¿Cuál es la nota mínima que debe obtener un alumno para tener
Distinguido?
- ¿Cuál es la nota más alta del 20% de los alumnos con calificaciones
más bajas?
Propiedades:
a) Si x ~ N (,) y tenemos, además, una v.a. y = a * x + b, luego: y ~ N (a
* + b , a * ).
b) Si x1 ~ N (1,1) y x2 ~ N (2,2), y x1 y x2 son variables independientes
entonces y = x1 + x2 resulta con distribución y ~ N (1 + 2 , 12 22 ).
Se puede generalizar para la suma de n variables aleatorias normales
independientes.
Ejemplo:
Supongamos que tres resistencias están dispuestas en serie, de tal manera
que la resistencia del sistema se puede pensar como una v.a. y, tal que y = x1
+ x2 + x3.
x1 x2
Si x1 ~ N (10,2), x2 ~ N (12,3) y x3 ~ N (8,1).
TN
x3
U
a) Determine la esperanza y desviación típica de y.
Calcule las siguientes probabilidades:
SF
b) P (y > 32)
c) P (y < 27)
FR
6.2.2.Aproximación de la distribución binomial a la normal
Al aumentar el tamaño de la muestra, la distribución binomial se acerca a la
forma lisa y acampanada. Si X es aproximadamente normal, su valor se
E
puede transformar en un valor de Z aplicando la fórmula:
X n. p
Z
y
n. p.q
P
Debe tenerse en cuenta que, en la transformación de una variable binomial
discreta en normal tipificada continua, es necesario hacer una corrección de
continuidad, ya que para la variable aleatoria continua, por ejemplo, P (X =
3) = 0. Por lo tanto, en este caso deberá cambiarse por P (2.5 X’ 3.5), o
sea, que la probabilidad de que la variable binomial sea 3 es equivalente a la
probabilidad de que la variable aleatoria continua esté entre 2.5 y 3.5.
P (a X b) P (a – 0.5 X’ b + 0.5),
donde X’ es una variable normal transformada.
Vamos a ver ahora cómo la aproximación de la binomial a la normal es
mejor a medida que n crece. Supongamos que x ~ B (10,0.5) y se desea
hallar la P (2 x 4) = 0.0439 + 0.1172 + 0.2051 = 0.3662. Para la
aproximación normal de la binomial debemos primero hacer la corrección
de continuidad:
P (2 x 4) P (2 – 0.5 x’ 4 + 0.5)
Entonces, si x ~ B (10,0.5):
E x n. p 10 * 0.5 5
x n. p.q 2.5 1.58
x n. p 1.5 5 4.5 5
z z1 2.22 y z 2 0.32
n. p.q 1.58 1.58
P (-2.22 z -0.32) = 0,3745 – 0,0132 = 0,3613
Si comparamos los dos valores de probabilidad obtenidos aplicando la
distribución binomial directamente y luego la aproximación de la binomial a
la normal, la diferencia entre 0.3662 y 0.3613 es tan sólo de 0.0049.
Supongamos ahora que aumenta n, o sea, x ~ B (30,0.5). Si queremos
calcular P (11 x 14) aplicando la distribución binomial:
P (11 x 14) = 0.0509 + 0.0805 + 0.1115 + 0.1354 = 0.3783
Haciendo la corrección de continuidad:
P (11 x 14) P (10.5 < x’ < 14.5)
Si x ~ B (30,0.5):
E x 30 * 0.5 15
x 7.5 2.74
z1
10.5 15
1.64
TN
U
2.74
14.5 15
z2 0.18
SF
2.74
P (-1.64 < z < -0.18) = 0.4286 – 0.0505 = 0.3781
FR
La diferencia entre 0.3783 y 0.3781 es de sólo 0.0002.
En general, a medida que aumenta el tamaño de n la aproximación resulta
mejor, es decir, los valores de probabilidad que se obtienen con la
aproximación son más cercanos a los valores que resultan de aplicar
E
directamente la distribución binomial.
y
6.3.Distribución exponencial
P
Definición:
Se dice que una variable aleatoria continua X que toma todos los valores no
negativos tiene una distribución exponencial con parámetro > 0 si su f.d.p.
está dada por:
f (x) = .e-.x x>0
0 para cualquier otro valor
Representación Gráfica:
f (x)
x
Se puede probar que: f x dx 1
0
La distribución exponencial desempeña un papel importante en la
descripción de una gran clase de fenómenos, especialmente en el área de la
teoría de la confiabilidad de equipos electromecánicos.
Función de Distribución:
f t dt 1 e
TN
x
.x
F (x) = P (X x) = x0
0
0 para cualquier otro valor
U
Por lo tanto, la probabilidad del suceso contrario, es decir P (X > x) = e-.x.
SF
Valores Característicos:
E (x) = 1 /
V (x) = 1 / 2
FR
Observación: Algunos autores definen el parámetro = 1/; en tal caso, la
f.d.p. de X se definiría como:
E
f (x) = (1/) e–x/ para x > 0
y
0 en cualquier otro caso
P
De esta manera, el parámetro es igual al valor esperado de x.
La distribución exponencial tiene una propiedad importante. Considerando
cualesquiera u, v > 0, tenemos:
P X u v e u v
P X u v / X u .u e .v
P X u e
Por lo tanto:
P (X > u + v / X > u) = P (X > v)
Generalmente, a las distribuciones que cumplen con esta propiedad se les
dice que “no tienen memoria”. Esto significa: supongamos en una
distribución discreta que el evento A no ha ocurrido durante las primeras
repeticiones del experimento. Entonces, la probabilidad de que no ocurra
durante las próximas t repeticiones es la misma que la probabilidad de que
no ocurra durante las primeras t repeticiones. En otras palabras, la
información de ningún éxito es “olvidada” en lo que se refiere a cálculos
subsecuentes.
Ejemplo:
Un sistema electrónico contiene ciertos componentes. La v.a. T describe el
tiempo de falla en años de los mismos. Esta variable está distribuida
exponencialmente y su tiempo promedio de falla es de 6 años. Calcular:
a) La probabilidad de que un componente cualquiera dure más de 7 años.
b) La probabilidad de que, al menos, dos componentes duren más de 7
años, siendo que el sistema está compuesto por cuatro de tales
componentes.
Solución:
La v.a. que estamos analizando es T = tiempo de falla de cierto componente
de un sistema electrónico (medido en años), E (t) = 6 años = 1/. Por lo
tanto, = 1/6. Luego:
f (t) = (1/6).e-(1/6).t t > 0
0 en cualquier otro caso
TN
-(1/6).7
a) P (t > 7) = e = 0.3114
b) Ahora nuestra v.a. es X = número de componentes (entre los 4 del
sistema) que duran más de 7 años, X ~ B(n,p). El valor de n es 4. La
U
probabilidad de éxito p = probabilidad de que una componente dure más
de 7 años es p = 0.3114 (calculada en el ítem a)). Luego, debemos
SF
hallar:
P (x 2) = 1 – P (x ≤ 1) = 1 – [P (x = 0) + P (x = 1)] =
= 1 – (0.2248 + 0.4067) = 0.3685
FR
Ejercicio Propuesto:
Suponga que el tiempo de respuesta X en cierta terminal de computadora en
línea (es decir, el tiempo transcurrido entre el fin de la consulta del usuario y
E
el principio de la respuesta del sistema a esa consulta) tiene una distribución
exponencial con tiempo esperado de respuesta igual a 5 segundos.
y
a) ¿Cuál es el valor del parámetro ?
P
b) ¿Cuál es la probabilidad de que el tiempo de respuesta sea, a lo sumo, 10
segundos?
c) ¿Cuál es la probabilidad de que el tiempo de respuesta supere los 12
segundos, dado que ya superó los 11 segundos?
6.4.Distribución chi-cuadrado
Definición:
Una variable aleatoria continua X tiene una distribución chi-cuadrado, con v
grados de libertad, si su función de densidad es la siguiente:
1
f (x) = x v / 21e x / 2 x>0
2 v/2
v / 2
0 en cualquier otro caso
donde v es un entero positivo y dónde ( v/2) es el valor de la función
t
v 1 t
gamma definida por: ( v)= e dt , con v>0.
0
La distribución chi-cuadrado juega un papel vital en la Inferencia
Estadística.
Valores Característicos:
La media y la variancia de la distribución chi-cuadrado son:
=v y 2 = 2v
6.5.Distribución t de Student
La mayoría de las veces no se tiene la suerte suficiente como para conocer la
variancia de la población de la cual se seleccionan las muestras aleatorias.
Para muestras de tamaño n 30, se proporciona una buena estimación de 2
al calcular un valor de S2. ¿Qué le ocurre entonces al estadístico
X / / n del Teorema Central del Límite si se reemplaza 2 por S2?
Si el tamaño muestral es pequeño, los valores de S2 fluctúan
TN
considerablemente de muestra en muestra y la distribución de la variable
aleatoria X / S / n se desvía en forma apreciable de una distribución
U
normal estándar. Ahora se está tratando con la distribución de un estadístico
que recibe el nombre de T, donde:
SF
X
T
S/ n
FR
Al derivar la distribución muestral de T, se asumirá que la muestra aleatoria
se seleccionó de una población normal. Se puede expresar entonces:
T
X / / n Z
V / n 1
E
S 2 / 2
donde
y
X
Z
/ n
P
tiene la distribución normal estándar, y
V
n 1S 2
2
tiene una distribución chi-cuadrado con v = n – 1 grados de libertad. Al
muestrear poblaciones normales, puede demostrarse que X y S2 son
independientes y, en consecuencia, lo son Z y V.
Valores característicos.
E(tn-1) = 0 , para n>1.
V(tn-1) = n /(n-2), para n>2.
Obsérvese que si n 1 la distribución T-Student carece de esperanza
matemática, y si n 2, carece de varianza.
Teorema:
Sea Z una variable aleatoria normal estándar y V una variable aleatoria chi-
cuadrado con v grados de libertad. Si Z y V son independientes, entonces la
distribución de la variable aleatoria T, donde:
Z
T
V /v
está dada por:
v 1 / 2
v 1 / 2 t 2
ht 1 -<t<
v / 2 v v
y se conoce como distribución t con v grados de libertad.
6.6.Los grados de libertad como una medición de la
información muestral
Se sabe que, cuando una muestra aleatoria se toma de una distribución
normal, la variable aleatoria:
n
X i 2
i 1 2
TN
tiene una distribución 2 con n grados de libertad. Es muy simple observar
U
que, en las mismas condiciones, la variable aleatoria:
n 1s 2 n xi x 2
SF
2 i 1 2
tiene una distribución 2 con n – 1 grados de libertad. Se puede indicar que,
FR
cuando no se conoce y se considera la distribución de:
n
x i x 2
i 1 2
E
existe un grado de libertad menos, o se pierde un grado de libertad en la
estimación de (es decir, cuando es reemplazada por x ). Cuando los
y
datos (los valores en la muestra) se utilizan para calcular la media, hay 1
grado de libertad menos en la información utilizada para estimar 2.
P
Aproximaciones entre distribuciones continuas.
1- Aproximación de la distribución T-Student por la distribución Normal:
si n>30 se cumple que tn-1 se distribuye aproximadamente como una
normal típica Z.
2- Aproximación de la distribución Chi-cuadrado por la distribución
Normal:
a) Para cálculos de probabilidades: si n>30 se cumple que la distribución
Chi-cuadrado con n-1 grados de libertad se distribuye aproximadamente
como una normal con esperanza matemática n-1 y desvío standard
[2.(n-1)]1/2
b) Para cálculos de percentiles: si n>30 el percentil p de la distribución
Chi-cuadrado con n-1 grados de libertad se puede aproximar por la
expresión ½.[zp +(2.n-3)1/2]2
6.7.Autoevaluación conceptual
En cada una de las siguientes proposiciones coloque Verdadero o Falso. Si
es Falso, enuncie una nueva proposición que resulte Verdadera.
a) En la distribución uniforme el valor esperado es el punto medio del
intervalo [a , b], en el cual la función de densidad de probabilidad es
distinta de 0.
b) En una distribución normal, la media siempre se halla entre la moda y la
mediana.
c) Si las distribuciones de dos variables aleatorias normales independientes
tienen las medias µ1 y µ2 y las variancias 12 y 22, entonces la
distribución de la suma de dichas variables tiene la media µ1 + µ2 y la
variancia 12 + 22.
d) En una distribución normal con = 120 y = 35, el porcentaje de área
bajo la curva que se encuentra entre 50 y 190 es aproximadamente del
95%.
e) El eje de simetría de la campana de Gauss es x = .
TN
f) En una distribución uniforme continua, la probabilidad de que la
variable sea mayor o igual que su esperanza matemática es igual a 1/2.
g) En una distribución normal con E(X) = 0, la P(X > X0) = P(X < X 0)
U
h) Una de las razones de la importancia de la distribución normal es que
muchas variables de las que se observan en la vida diaria, siguen una
SF
distribución normal.
i) El eje de simetría de toda curva normal es x =0.
j) Toda curva normal es cóncava hacia arriba si μ - σ < X < μ + σ.
FR
k) Si X es una V. A. normal, entonces: P(a < X < b) = P(X < b) - P(X > a).
l) Para definir completamente una distribución de probabilidad normal
necesitamos un solo parámetro.
E
m) En una distribución exponencial ocurre que si un evento A no ha
ocurrido durante las primeras t repeticiones del experimento, la
y
probabilidad de que no ocurra durante las próximas t repeticiones es la
misma que la probabilidad de que no ocurra durante las primeras t
P
repeticiones.
n) La distribución Binomial tiende a aproximarse a una distribución normal
conforme el tamaño de la muestra disminuye.
o) En una distribución normal con E(X) = 0 , la P(X>X0) = P(X< -X 0)