DISTRIBUCIÓN DE VARIABLES CONTINUAS
Recordemos que una variable aleatoria X es una función que asigna un
número real a cada resultado en el espacio muestral de un experimento
aleatorio. El conjunto de los posibles valores de la variable aleatoria X se
denomina rango. Diremos que la variable aleatoria es continua si su rango es
un intervalo (ya sea finito o infinito) de números reales.
Diremos que la función f(x) que va del conjunto de valores posibles de la
variable aleatoria X al intervalo [0, 1] es la función densidad de
probabilidad para X si y sólo si se satisfacen las siguientes propiedades:
f(x) 0 para todo x
f ( x) d x =1
−
b
P( a X b ) = f ( x) d x
a
Obs.: Para una variable aleatoria continua cualquiera X se tiene que
P( a X b ) = P( a < X b ) = P( a X < b ) = P( a < X < b )
Se define la distribución acumulada F(x) para la variable aleatoria X como
x
F(x) = P(X x) = f ( t ) dt
−
x
d d
Obs.: F( x) = f (t ) d t = f ( x )
dx dx −
Dagoberto Salgado Horta Página 1
DISTRIBUCIÓN UNIFORME
Una variable aleatoria X tiene una distribución uniforme continua, si y sólo si
su densidad de probabilidad está por:
1
x
f ( x) = −
0
en cualquier otro parte
Se tiene que su media y su varianza son las siguientes:
+ ( − )2
E(X) = μ= y V(X) =σ2 =
2 12
DISTRIBUCIÓN NORMAL
Sin lugar a dudas, la distribución más utilizada para modelar experimentos
aleatorios es la distribución normal, también conocida como distribución
Gaussiana.
Diremos que la variable aleatoria X con función densidad de probabilidad
dada por
1 (x − )2
f(x) = exp− tiene distribución normal con parámetros y
2 2
2
; donde − y 0 . El valor determina el centro de la función
mientras que determina la dispersión. La apariencia gráfica de la
distribución normal es una curva simétrica, con respecto al valor , con forma
de campana, que se extiende sin límite tanto en la dirección positiva como en
la negativa como se muestra en la figura dada a continuación:
De la simetría de la función se concluye que P(X ) = P(X ) = . Como la
1
2
distribución normal desempeña un papel básico en la estadística y su densidad
de probabilidad no puede integrarse de forma directa, se ha tabulado para el
caso especial = 0 y = 1. La distribución normal con estos valores para
Dagoberto Salgado Horta Página 2
y se conoce como distribución normal estándar. Para una distribución
normal con valores y cualesquiera empleamos la siguiente relación
X−
Z= , que transforma X en una variable aleatoria Z con distribución
normal estándar; de modo que para determinar las probabilidades asociadas a
una variable aleatoria X cuya distribución es normal con parámetros y
basta con tener la tabla para la distribución normal estándar ( = 0 y = 1).
Esta transformación de la variable se denomina estandarización.
Algunas veces, la distribución normal se presenta como una distribución
continua que ofrece una muy buena aproximación a la distribución binomial
cuando n, el número de ensayos, es lo suficientemente grande y la
probabilidad de lograr un éxito está cercana a 1 2 .
A continuación se muestra una sección de una tabla de la distribución
normal estándar:
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.5000 0.5039 0.5079 0.5119 0.5159 0.5199 0.5239 0.5279 0.5318 0.5358
0.1 0.5398
0.2 0.5792
0.3 0.6179
0.4 0.6554
0.5 0.6914
0.6 0.7257 ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
0.7 0.7580 ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
...
...
Esta tabla proporciona los valores de área acumulada bajo la curva normal a
la derecha de la media.
Dagoberto Salgado Horta Página 3
Hay tablas que proporcionan los valores de área acumulada bajo la curva
normal a la izquierda de la media, otras proporcionan los valores de área
acumulada de cola derecha, otras los de cola izquierda y otras proporcionan
tanto los valores de área de cola izquierda como de cola derecha.
La primera columna de esta tabla proporciona el valor z con un decimal; el
segundo decimal se ubica en el renglón superior. Así, el área acumulada bajo
la curva hasta el valor z = 0,7 (P(Z < 0,7)) es el valor que se encuentra en la
intersección del renglón 9 y la columna 2, que es 0,7580
Las probabilidades que no tengan la forma P(Z < z) se obtienen mediante el
empleo de las reglas básicas de probabilidad y de la simetría de la distribución
normal, junto con la tabla.
La calculadora CASIO modelo fx-991MS, contiene un submenú, localizado en
el MODO SD, llamado DISTR, que calcula el área de algunos sectores de la
distribución normal estandarizada con las siguientes funciones:
P(t) = P(Zt) (distribución acumulativa)
Q(t) = P(0 ≤ Z ≤ t)
R(t) = P(Z t)
Es decir,
Ejemplo:
Calcular la probabilidad para Z ≤ 0,7
P(0,7) = 0,75804
Calcular la probabilidad para Z comprendido entre -0,5 y 0,7
Q(0,5)+Q(0,7) = 0,19146+0,25804 = 0,4495
Dagoberto Salgado Horta Página 4
Calcular la probabilidad para Z comprendido entre -0,4 e
R(0,4) = 0,65542 o de la otra manera: Q(0,4)+ 0,5 = 0,15542+0,5 = 0,65542
EJERCICIOS:
1.- En cierta ciudad, el número de interrupciones del suministro eléctrico por
mes se considera una variable aleatoria normal para la cual μ = 11.6 y σ = 3.3
Determine la probabilidad de que en un mes cualquiera haya al menos ocho
interrupciones.
Determine la probabilidad de que en un mes cualquiera haya entre tres y siete
interrupciones.
Determine la probabilidad de que en un mes cualquiera haya a lo más cinco
interrupciones.
Resp. 0.8623 0.0771 0.0228
2.- En un proceso fotográfico, el tiempo de revelado de las impresiones puede
considerarse una variable aleatoria normal para la cual μ = 12,9 minutos σ = 2
minutos.
Determine la probabilidad de que el tiempo de revelado tarde entre 16 y 16.5
minutos
Determine la probabilidad de que el tiempo de revelado se lleve al menos 16.2
minutos
Determine la probabilidad de que el tiempo de revelado se lleve a lo más
16.35 minutos
Resp. 0.0246 0.0495 0.9577
3.- El volumen de líquido que una máquina deposita en latas de una cierta
bebida gaseosa es una variable aleatoria normal para la cual μ = 12.4 onzas y σ
= 0.1 onzas
Dagoberto Salgado Horta Página 5
Determine la probabilidad de que el volumen depositado sea menor a 12 onzas
Si se desechan todas las latas que tienen menos de 12.1 o más de 12.6 onzas,
¿cuál es la proporción de latas desechadas?
¿cómo debe ser ajustado el promedio en este proceso si se quiere que el 99.9
% de todas las latas contenga más de 12 onzas?
Si la desviación estándar puede reducirse a 0.05 onzas, ¿cómo debe ser
ajustado el promedio en este proceso si se quiere que el 99.9 % de todas las
latas contenga más de 12 onzas?
Resp. 3.167*10-5 0.0241 12,31 12,15
4.- La cantidad de café instantáneo que una máquina dispensadora deposita en
vasos de 4 onzas puede considerarse una variable aleatoria con distribución
normal para la cual σ = 0.04 onzas. Si sólo 2 % de los vasos contienen menos
de 4 onzas, ¿cuál sería el contenido promedio de estos vasos?
Resp. μ = 4.082
5.- Los alambres que se utilizan en cierta computadora deben tener una
resistencia entre 0.12 y 0.14 ohms. Las resistencias reales de los alambres
producidos por la compañía A siguen una distribución normal con μ = 0.13
ohms y σ = 0.005 ohms
¿Cuál es la probabilidad de que un alambre seleccionado al azar de la
producción de la compañía A satisfaga las especificaciones?
Si se utilizan cinco de estos alambres en el sistema y se seleccionan de la
compañía A, ¿cuál es la probabilidad de que los cinco satisfagan las
especificaciones?
Resp. 0.9544 0.7919
6.- Se procede a detener el funcionamiento de una máquina para repararla si
en una muestra aleatoria de 100 artículos de la producción diaria se encuentran
por lo menos 15 % de artículos defectuosos. Si se sabe que la máquina
realmente produce 10 % de artículos defectuosos, encuentre la probabilidad de
detener la máquina un día cualquiera.
Dagoberto Salgado Horta Página 6
7.- Una línea aérea vende boletos sobre la base que el 5 % de las personas que
hacen reservación para un vuelo no se presentan. Se sabe que la aerolínea
vendió 160 boletos para un vuelo con sólo 155 asientos, ¿cuál es la
probabilidad de que haya un asiento disponible para cada persona con
reservación que se presenta al vuelo?
8.- La eficiencia de cierto tipo de reflectores es una variable aleatoria normal
para la cual μ = 9.5 y
σ = 0.5, según las especificaciones del productor. Los requerimientos de un
estacionamiento en el que deben instalarse nueve de estos reflectores exigen
que la eficiencia media de los mismos sea mayor a 10, ¿cuál es la probabilidad
de que se cumplan los requerimientos del estacionamiento?
OTRAS VARIABLES ALEATORIAS CONTINUAS IMPORTANTES
Existen tres modelos probabilísticos continuos que utilizaremos, éstos son:
a) t de Student
b) Chi cuadrado
c) F de Fisher
a) Modelo t de Student
Diremos que una variable aleatoria continua tiene una distribución t de
Student con m grados de libertad si su función de densidad está dada por:
m +1
( )
2 1 1
f ( x) = m +1
m
( ) m x2
(1 + ) 2
2 m
Anotaremos
X tm
Dagoberto Salgado Horta Página 7
Algunas propiedades de una v.a. X que sigue una distribución t de Student con
m grados de libertad son:
a) E(X) = 0
b) V(X) = m/(m-2)
c) La distribución es simétrica, es decir
P( X < - to ) = P( X > to ) to |R
Por la complejidad de la función de densidad de la distribución de Student, sus
percentiles se encuentran tabulados
Notación:
tm , (1-) = percentil (1- ) de la distribución t de Student con m grados de
libertad
Por ejemplo:
t5;0,8 = 0,92
Es el valor de la distribución t Student con 5 g.l. tal que el 80% de los valores
son menores a 0,92 y el 20% restante superiores a 0,92 ( percentil 0,8 de la t
con 5 g.l.)
b) Modelo chi cuadrado
Diremos que una variable aleatoria continua sigue una distribución chi
cuadrado con m grados de libertad si su función de densidad está dada por:
1
f ( x) = x m / 2−1e − x / 2
(m / 2)2 m/2
Anotamos
X m2
Dagoberto Salgado Horta Página 8
Observación:
a) E(X)=m
b) V(X)=2m
Al igual que la variable anterior también se encuentra tabulada ( explicación
del uso de la tabla en clase)
Notación
2m ,(1-) = percentil (1- ) de la distribución chi cuadrado con m grados de
libertad
Por ejemplo :
26 , 0.75 es un valor que deja por bajo al 75% de los casos y por sobre él al
25% de los casos ( percentil 0,75 de la distribución chi cuadrado con 6 grados
de libertad)
c) Distribución F de Fisher
Finalmente diremos que la variable aleatoria X sigue una distribución F de
Fisher con m grados de libertad en el numerador y k grados de libertad en el
denominador si su función de densidad está dada por:
m+k
( )
2 m m/2 x ( m − 2) / 2
f ( x) = ( )
(m / 2)(k / 2) k m
(1 + ( ) x) ( m + k ) / 2
k
Anotamos
X Fm,k
Dagoberto Salgado Horta Página 9
Observación:
Los percentiles de esta distribución se encuentran tabulados y su notación es la
siguiente:
Fm, k, (1-) es el percentil (1-) de la distribución F de Fisher con m y k grados
de libertad.
Por ejemplo:
F4;8;0.95 = 3,84
es el valor de la distribución F con 4 g.l. en el numerador y 8 g.l. en el
denominador que acumula hasta él un 95% de los casos y posterior a el hay
un 5% de los casos.
Propiedad:
1
Fk ;m; =
Fm,k ,(1− )
Por ejemplo:
1 1
F8;4;0.05 = = = 0,26
F4;8;0.95 3,84
Teoremas importantes
Los teoremas que se presentan a continuación (*) nos permitirán la
justificación en la construcción de diferentes intervalos de confianza.
Dagoberto Salgado Horta Página 10
Teorema 1:
Si X N( , 2) y Y = ( X- )2 / 2 entonces
Y 12
Dem: Por teorema de transformación de variables
Teorema 2:
Si Y1 k2 y Y2 v2 variables aleatorias independientes entonces
(Y1 + Y2 ) 2k+v
(*)Teorema 3:
Si X1, X2,…, Xn son v.a.i.i.d. N( , 2) entonces
(n-1)S2n-1 / 2 2(n-1)
donde S2n-1= ni=1 (xi - x )2 / (n-1)
Teorema 4:
X
Si X N(0,1) e Y v2 son v.a. independiente y T = Y
v
entonces T tv
(*)Teorema 5:
X −
Si X1, X2,…, Xn son v.a.i.i.d. N( , ) y T = S n −1
2
n
Entonces T t(n-1)
Dem: (aplicación teorema anterior)
Dagoberto Salgado Horta Página 11
Teorema 6:
X
Si X v2 e Y k2 son v.a. independientes y F = v
Y
k
entonces F Fv,k
(*)Teorema 7:
Si X1, X2,…, Xn es una m.a. N(1 , 12) y Y1, Y2,…, Ym es una m.a.
S n −1
1
N(2 , 2 ) independientes y si F =
2
S m −1
2
Entonces F F(n-1),(m-1)
Dagoberto Salgado Horta Página 12