Distribuciones de Probabilidad Continuas y Discretas
Distribuciones de Probabilidad Continuas y Discretas
55
Figura 3.1. Histograma de probabilidad de la variable aleatoria Y.
56
Propiedades de las funciones de distribución
1. lím F ( y ) = F (− ) = 0
y →
2. lím F ( y ) = F ( ) = 1
y →
F ( y ) = p (Y y ) = f ( t ) dt (3.5)
−
57
La propiedad uno quiere decir que la gráfica de la función de densidad nunca está por debajo
del eje horizontal y la segunda propiedad significa que el área total bajo la gráfica de la
función de densidad entre menos infinito e infinito es uno.
y
F ( y ) puede calcularse como F ( y ) = f (t )dt , según se vio antes, así que la probabilidad de
−
que una variable aleatoria continua Y esté en el intervalo a, b está dada por
b
p ( a Y b ) = f ( y ) dy (3.6)
a
b) Obtener F ( y ) .
c) Graficar f ( y ) y F ( y ) .
Para encontrar el valor de c, recordemos que todas las funciones de densidad cumplen con
58
0 2 0 2 2
(2 − 0 2 ) = 2c = 1 c =
2
c 2 c 2 1
= c ydy =
2
y =
0
2 0 2 2
Para encontrar F ( y ) = p(Y y ) , otra vez nos encontramos con la dificultad de que la función
de densidad está definida de distintas formas en tres intervalos diferentes, así que tendremos
que considerar tres casos.
Caso i) y 0 :
y
Caso ii) 0 y 2 :
y 0 y y
59
Caso iii) y 2 :
y 0 2 y 2
F (y) = f (t )dt = f (t )dt + f (t )dt + f (t )dt = 0 + 2 tdt + 0 = 4 t
1 1
=1
2
0
− − 0 2 0
Ejemplo 3.4. El periodo de funcionamiento hasta su primera falla (en cientos de horas) para
cierto transistor, es una variable aleatoria Y con una función de distribución dada por
0, si y 0
F (y) =
− y2
1 − e , si y 0
a) Demostrar que F ( y ) tiene las propiedades de una función de distribución.
b) Obtener f ( y ) .
60
c) Calcular la probabilidad de que el transistor trabaje por lo menos durante 200 horas hasta
tener su primera falla.
a) Primero mostramos que F ( y ) tiene las propiedades de una función de distribución.
y → y →
(
2. F ( ) = lím F ( y ) = lím 1 − e − y = 1
2
)
3. Supongamos que F (a ) F (b) . Entonces 1 − e − a 1 − e − b
2 2
Para y 0 , f ( y ) = (0) = 0
dF d
=
dy dy
Para y 0 , f ( y ) =
dF d
=
dy dy
( )
1 − e − y = 2 ye − y
2 2
2 ye − y , si y 0
2
f (y) =
0 , en cualquier otro punto
(
c) p(Y 2) = 1 − p(Y 2) = 1 − p(Y 2) = 1 − F (2) = 1 − 1 − e −2 = e −4
2
)
Distribución uniforme
Se dice que una variable aleatoria Y está distribuida uniformemente sobre el intervalo
a, b si su función de densidad de probabilidad está dada por
1
si a y b
f ( y) = b − a (3.7)
0 en otro caso
61
Figura 3.5. Gráfica de una distribución uniforme definida en el intervalo a, b
Como se puede ver, a y b determinan la forma de la función de densidad pues la amplitud de
variación y la probabilidad de que Y caiga en un intervalo dado dependen de a y b. A las
constantes que tengan esta propiedad las llamaremos parámetros de la función de densidad.
Cuando una variable aleatoria Y tenga distribución uniforme con parámetros a y b, lo
denotaremos como Y U ( a, b ) .
Ejemplo 3.5. La variación en la profundidad de un río de un día para otro, medida (en
centímetros) en un sitio específico, es una variable aleatoria Y con la siguiente función de
densidad:
k si − 60 y 60
f ( y) =
0, en cualquier otro punto
(a) Determinar el valor de k.
(b) Obtener la función de distribución para Y.
Como f ( y ) es una función de densidad, sabemos que f ( y )dy = 1 , pero como en este caso
−
60 60
f ( y )dy =
1
−
− 60
kdy = k dy = ky 60
− 60
− 60 = 120k =1 k=
120
62
Como la función de densidad está definida de tres maneras distintas en tres intervalos,
tenemos que dividir en casos los cálculos.
Caso i) y −60 :
y
Caso iii) y 60 :
y −60 60 y 60
F (y) = f (t )dt = f (t )dt + f (t )dt + f (t )dt = 0 + 120 dt + 0 = 120 t
1 1
=1
60
− 60
− − − 60 60 − 60
Ejemplo 3.6. El tiempo de un viaje (ida y vuelta) de los camiones que transportan el concreto
hacia una obra de construcción en una carretera, está distribuido uniformemente en un
intervalo de 50 a 70 minutos. ¿Cuál es la probabilidad de que la duración del viaje sea mayor
a 65 minutos si se sabe que la duración del viaje es mayor a 55 minutos?
Sabemos que, si definimos
Y = tiempo de un viaje, de ida y vuelta de los camiones que transportan el concreto hacia una
obra de construcción
Entonces Y U ( 50,70 ) , y su función de densidad de probabilidad es:
1
, si 50 y 70
f ( y ) = 20
0, en cualquier otro caso
Luego, la probabilidad de que la duración del viaje sea mayor a 65 minutos si se sabe que la
duración del viaje es mayor a 55 minutos, se calcula como
63
p (Y 65) (Y 55) p (Y 65) (1 20 )( 70 − 65) 5 1
p (Y 65 | Y 55) = = = = =
p (Y 55) p (Y 55) (1 20 )( 70 − 55) 15 3
Distribución normal
Se dice que una variable aleatoria Y se encuentra distribuida normalmente, con
parámetros y , si su función de densidad de probabilidad está dada por
1 y − 2
, donde y (− , ) , (− , ) y 0 (3.8)
1
f ( y) = exp −
2 2
Cuando una variable aleatoria Y tenga distribución normal con parámetros y , lo
para distintos valores de con fijo y en la figura 3.7 se muestran tres gráficas de f ( y )
para distintos valores de con fijo.
1
b
1 y − 2
2 a
exp− dy
2
pero como no existe una solución exacta de esta integral, recurriremos a métodos de
aproximación por medio de tablas. Pero como no puede haber tantas tablas como valores
posibles pueden tomar los parámetros y , es necesario abordar el problema por otro
lado, que veremos a continuación.
64
Figura 3.6. Gráficas de la distribución normal para distintos valores de y = 1 fija.
Figura 3.7. Gráficas de la distribución normal para distintos valores de y = 4.5 fija.
65
Distribución normal estándar
La distribución de una variable aleatoria normal con media cero y varianza uno se
llama distribución normal estándar y se acostumbra denotarla con la letra Z. Es decir,
Z N ( = 0, = 1) o bien, simplemente, Z N ( 0, 1)
1
b
1 y − 2
p (a Y b) = a exp − 2 dy
2
y−
Usando el teorema del cambio de variable, con z = y = + z
Diferenciando la última expresión, dy = dz y el integrando queda en función de z.
a− b−
En cuanto a los límites, cuando y = a z = y cuando y = b z =
Entonces, la integral queda como
b−
b
1 y − 2 1 + z − 2
p(a Y b ) =
1
2 a
exp− dy =
2 2 exp− 2 dz
a−
b−
z2
1 1 2 1 1
p (a Y b) = a− exp − 2 z dz = 2 exp − 2 z
2
dz (3.9)
2 z1
a− b−
En el último paso, definimos z1 = y z2 = .
En resumen, a modo de receta, diremos que para calcular p(a Y b) donde
66
Puesto que todos los valores de Y que se encuentran entre a y b tienen valores
a− b−
correspondientes de Z entre z1 = y z2 = , el área bajo la curva f ( y ) entre las
rectas y = a y y = b es igual al área bajo las curva f (z ) entre las correspondientes rectas
0.7995 en las tablas, se elige z 0 = 0.83 puesto que 0.7975 está más próximo a 0.7967. Pero,
para hallar z 0 tal que p(z z 0 ) = 0.7981, que está a la mitad entre 0.7967 y 0.7995 se toma
z 0 = 0.835
Ejemplo 3.7. Utilizar tablas para encontrar las probabilidades siguientes para una variable
aleatoria normal estándar Z.
(a) p(0 Z 1.2) (b) p(− 0.9 Z 0) (c) p(0.3 Z 1.56)
(d) p(− 0.2 Z 0.2) (e) p(− 1.56 Z −0.2) (f) p(2 Z 10)
Ejemplo 3.8.
(a) Determinar el valor de z 0 tal que p(Z z 0 ) = 0.5
67
Si definimos la variable aleatoria,
Y = cantidad semanal gastada en el mantenimiento y en las reparaciones en cierta fábrica
68
a − np − 0.5 b − np + 0.5
p(a Y b ) = p Z
npq
npq
(el término 0.5 que aparece en esta fórmula es una corrección provocada por el cambio de
una distribución discreta a una continua).
Este resultado asegura que podemos utilizar la distribución normal para evaluar las
probabilidades binomiales cuando n es grande o aún en el caso de que tenga valores pequeños
siempre que p esté cerca de 1/ 2 . De manera empíricas se sabe que la aproximación es
aceptable cuando los productos np y nq son mayores que 5.
Ejemplo 3.11. La probabilidad de que un paciente se recobre de una delicada operación del
corazón es de 0.9. ¿Cuál es la probabilidad de que, de los 100 pacientes sometidos a esta
intervención, (a) sobrevivan entre 84 y 95 inclusive? (b) sobrevivan menos de 86?
Sea Y = Número de pacientes sometidos a esta intervención que sobreviven de los 100
Claramente Y b ( y; n = 100, p = 0.9 ) , así que, para el inciso (a) sería necesario calcular
p (84 Y 95) , pero como los productos np = 90 y nq = 10 , son mayores que 5, entonces
podemos aproximar Y ( )
N = np, = npq = N ( 90, 3) , por lo que
84 − 0.5 − 90 Y − np 95 + 0.5 − 90
p ( 84 Y 95 ) p
3 3
npq
El número 0.5, que se suma y se resta de los extremos es un término de corrección necesario
debido al paso de una distribución discreta (la binomial) a una continua (la normal).
Entonces, p ( 84 Y 95) p ( −2.17 Z 1.83) = 0.9514
Función Gama
La función gama está definida por
( x ) = y x −1e− y dy (3.11)
0
69
2) Cuando x = n , siendo n un número entero positivo, (n) = (n − 1)!
1
3) =
2
Esto último se demuestra haciendo el cambio de variable y = 2w en la definición de
1 1 −1 2
la función gama para x =
2
y sabiendo que
2 exp 2
x dy = 1
−
Distribución gama
La variable aleatoria continua Y tiene distribución gama, con parámetros y , si
su función de densidad está dada por
1 −1 − y
y e si y 0
f ( y) = ( ) , donde 0 y 0 (3.12)
0
en otro caso
70
p (Y 9 ) = −
1
3
( 0 − 9 exp ( −3) ) − ( 0 − exp ( −3) ) = 3exp ( −3) + exp ( −3) = 4 exp ( −3) = 0.1991
Distribución Ji – cuadrada
(Es la distribución gama especial para la cual = 2 y = 2 )
La variable aleatoria continua Y tiene distribución ji – cuadrada con grados de
libertad si su función de densidad está dada por
1 2 −1 − y 2
2 2 2 y e si y 0
f ( y) = ( ) , donde es un entero positivo (3.13)
0 en cualquier otro caso
Cuando una variable aleatoria Y tenga distribución ji – cuadrada con grados de libertad,
escribiremos, Y 2 ( ) . En la figura 4.9 aparece la función Ji – cuadrada para 2, 3 y 4
grados de libertad.
71
Figura 3.9. La función Ji-cuadrada para = 2, 3 y 4 grados de libertad.
Distribución exponencial
(Es la distribución gama especial para la cual = 1 )
La variable aleatoria continua Y tiene distribución exponencial con parámetro , si
su función de densidad está dada por
1 −y
e si x 0
f ( y) = , donde 0 (3.14)
0 en cualquier otro caso
En la figura 3.10 se presentan las gráficas de la distribución exponencial para = 1, 2 y 4 .
Ejemplo 3.13. La vida en años de un cierto tipo de interruptor eléctrico tiene una distribución
exponencial con parámetro, = 2. Si 100 de estos interruptores se instalan en diferentes
sistemas, ¿cuál es la probabilidad de que a lo más 30 fallen durante el primer año?
En este problema se trata de dos variables aleatorias, que son
Y = Vida en años de un cierto tipo de interruptor eléctrico , que es una variable aleatoria que
72
X = Número de interruptores, de entre los 100, que fallan durante el primer año ,
X − np 30 + 0.5 − 39.35
Entonces, p ( X 30 ) p = p ( Z −4 ) 0
npq
4.8853
73
Distribución de Weibull
La variable aleatoria continua Y tiene distribución de Weibull con parámetros y
, si su función de densidad está dada por
y −1 exp ( − y ) si y 0
f ( y) = , donde 0 y 0 (3.15)
0 en cualquier otro caso
En caso de que una variable aleatoria tenga distribución de Weibull, con parámetros y
74
1 2
y exp − y si y 0
f ( y) = 2 donde 0 y 0
0 en cualquier otro caso
Para calcular la probabilidad de que la pila dure más de 2 años,
M
1 1 1
M
p (Y 2 ) = y exp − y 2 dy = lím y exp − y 2 dy = lím − exp − y 2 dy =
2 2 M →
2 2 M →
2 2
1 1
p (Y 2 ) = − lím exp − M 2 − exp − 22 = exp ( −2 ) = 0.1353
M →
2 2
Distribución beta
La variable aleatoria continua Y tiene distribución de probabilidad beta con
parámetros y , si su función de densidad está dada por
( + ) −1
y (1 − y ) si 0 y 1
−1
f ( y ) = ( ) ( ) (3.16)
0
en cualquier otro punto
( 5)
(1 − y ) si 0 y 1
3
f ( y ) = (1) ( 4 )
0
en cualquier otro punto
75
Pero de las propiedades de la función gama, sabemos que ( 5) = 4! , ( 4 ) = 3! y (1) = 1 ,
76
Valor esperado de una función de una variable aleatoria continua
Sea Y una variable aleatoria continua con función de densidad f ( y ) . La media o
Teorema 3.2. Sea f (Y ) una función de una variable aleatoria Y y sea c una constante.
Teorema 3.4. 2 = V (Y ) = E (Y − ) = E Y 2 − 2
2
( )
A continuación, presentamos una tabla donde aparecen los valores esperados o medias de
algunas de las variables aleatorias continuas comunes omitiendo la demostración.
77
Distribución Función de densidad Media Varianza
Uniforme 1
si a y b
a+b (b − a )2
f (y) = b − a 2 12
0 en otro caso
Normal 1 y − 2 2
f (y) =
1
exp −
2 2
Gama 1 2
y −1e − y , para y 0
f ( y ) = ( )
0
en otro caso
Exponencial 1 −y 2
e si y 0
f (y) =
0 en otro caso
Ji cuadrada 1 2
2 y 2−1e − y 2 si y 0
f ( y ) = 2 ( 2)
0
en otro caso
Weibull
f (y) =
( )
y −1 exp − y si si y 0
−1 1 +
1
Weibull
2
0 en otro caso
( + ) −1 beta
2
Beta
y (1 − y ) si 0 y 1
−1
f ( y ) = ( )( ) +
0
en cualquier otro punto
2 1
2
donde 2
= −2
1 + − 1 + y beta
2
=
Weibull
( + ) ( + + 1)
2
Ejemplo 3.16. Refiriéndose al problema 3.14, ¿Cuánto tiempo se espera que dure la pila?
1
Sabemos, de la tabla anterior, que si Y W = , = 2 ,
2
−1 2
1 1 3 2 1 2
E (Y ) = 1 + = 2 = = = 1.25 años
2 2 2 2 2 2
Ejemplo 3.17. En el problema 3.15, hallar el valor esperado de la proporción anual de nuevos
restaurantes que se espera que fracasen en esta ciudad.
78
1
Como Y ( = 1, = 4 ) , de la tabla, E (Y ) = = = 0.20
+ 5
Entonces, podemos esperar que el 20% de los restaurantes nuevos fracasen durante su primer
año en esa ciudad.
Teorema de Tchebysheff
Sea Y una variable aleatoria con una media finita y desviación estándar .
Entonces, para cualquier constante positiva k,
1
p (| Y − | k ) 1 − (3.21)
k2
o equivalentemente, y debido al teorema 1.7,
1
p (| Y − | k ) (3.22)
k2
Este resultado puede utilizarse para obtener un límite inferior de la probabilidad de que la
variable aleatoria de interés Y caiga en un intervalo de la forma k
Ejemplo 3.18. Sea Y una variable aleatoria con media 11 y varianza 9. Utilice el teorema de
Tchebysheff para encontrar:
(a) Un límite inferior para p(6 Y 16)
1
(a) El teorema de Tchebysheff afirma que p(| Y − | k ) 1 − , o lo que es lo
k2
mismo, por las propiedades del valor absoluto:
1
p ( − k Y − k ) = p ( − k Y + k ) 1 −
k2
Y, si comparamos con la probabilidad que se quiere acotar, p(6 Y 16) , resulta que
− k = 11 − 3k = 6 y + k = 11 + 3k = 16 .
5
De cualquiera de estas ecuaciones, concluimos que k= . Luego,
3
1 9 16
p ( 6 Y 16 ) 1 − = 1− = = 0.64
( 5 3)
2
25 25
79
(b) Ahora, como queremos el valor de C, tal que p(Y − 11 C) 0.09 y el teorema de
1
Como el teorema de Tchebysheff, afirma que p(| Y − | k ) 1 − , entonces hay
k2
que resolver el sistema de ecuaciones:
1
k = 1 y 1 − = 0.75
k2
1 1 1
De donde obtenemos, k 2 = k=2 y = =
0.25 k 2
que es el máximo valor para la desviación estándar que se puede admitir para que se cumplan
los objetivos del fabricante.
80