ESTADISTICA I ___________
CAPITULO 3
Variables aleatorias y distribucin de probabilidad
Universidad de Chile
Economa & Negocios VARIBLES ALEATORIAS y DISTRIBUCIONES DE PROBABILIDAD
1. VARIABLES ALEATORIAS DISCRETA (V.A.D.) En la mayora de los problemas aplicados que contienen probabilidades slo nos interesa un aspecto particular de los resultados de los experimentos. Es as como a cada posible resultado se le puede asignar un valor, el cual nos interesar saber cuantas veces se repite ese resultado o el otro para ver la probabilidad asociada. Este valor se conoce como variable aleatoria. Definicin: Si S es un espacio muestral con una medida de probabilidad y X es una funcin de valor real definida sobre los elementos de S , entonces X se llama variable aleatoria. Se denotar con letras maysculas a las variables aleatorias y con letras minsculas al valor de dicha variable. Ejemplo 1. Se seleccionan dos calcetines al azar y se sacan en sucesin de una gaveta que contiene cinco calcetines cafs y tres calcetines verdes. Enumere los elementos del espacio muestral, las probabilidades correspondientes y los valores w que corresponde a la variable aleatoria W , donde W es el nmero de calcetines cafs seleccionados. Solucin. Utilizando el principio de probabilidad frecuencial o a posteriori como: Pr(Wi ) = lim que se obtiene la siguiente tabla. Elemento del espacio muestral
CC CV VC VV
i
T
con lo
Probabilidad
5 14
2 1 1 0
15 56 15 56 3 28
5 Entonces, es posible decir que Pr (W = 2) = 14 Se debe tener presente que el ejercicio habra sido el mismo si la variable aleatoria definida fuera los calcetines verdes seleccionados, Q , entonces, la probabilidad Pr(W = 2) , tambin se pudo haber calculado utilizando la variable aleatoria Q de la forma Pr(Q = 0) . Entonces, se puede concluir que dentro de un mismo espacio muestral es posible definir ms de una variable aleatoria que lo puedan enumerar, tal como se realizo en este ejercicio.
Pagina 1
ESTADISTICA I ___________
CAPITULO 3
Variables aleatorias y distribucin de probabilidad
La medida de probabilidad definida en un espacio muestral discreto automticamente provee las probabilidades de que una variable aleatoria asumir cualquier valor dado dentro de su intervalo. Ejemplo 2. Suponga que define un experimento en el cual son lanzados dos dados perfectamente equilibrados, por lo que enumere el espacio muestral de este experimento y establezca las probabilidades correspondientes a esta enumeracin. Solucin. Para resolver nuestro problema es necesario establecer una variable aleatoria que permita enumerar este espacio, as que los candidatos a variable aleatoria en este caso son: X : Es igual a la suma de los resultados obtenidos en cada dado lanzado. Y : La resta de los resultados de cada dado lanzado. Z : La media de los resultados de cada dado lanzado. Etc. Cualquiera de estas variables aleatorias puede servir para enumerar el espacio muestral de este experimento. Si tomamos por ejemplo la variable X , podemos representar su numeracin y probabilidad tal como se aprecia en la siguiente tabla, que propuesto para el lector realizar los mismo para las variable Y y Z .
x
Pr( X = x)
1 36 2 36 1 = 18
2 3 4 5 6 7 8 9 10 11 12
6 36
4 36
3 36
1 = 12
1 9
2 = 18 =
5 36
=
5 36 1 9
1 12 1 18 1 36
1 6
Los ejemplo 1 y 2, cuentan con variables aleatorias finitas, que los hace ms sencillos de manejar, pero en la realidad pueden existir variables aleatorias discretas que pueden ser infinitas o de una gran nmero de combinaciones, las que obviamente haran mucho ms complicado confeccionar una tabla de probabilidades, por esta razn es preferible utilizar un formato alternativo a una tabla, el cual debe entregar los mismo valores de probabilidad, as que si utilizamos una funcin f ( x) , esta necesariamente deber cumplir con f ( x) = P( X = x) , para cualquier valor que puede tomar X dentro del espacio muestral.
Pagina 2
ESTADISTICA I ___________
CAPITULO 3
Variables aleatorias y distribucin de probabilidad
Ejemplo 3. Determine una funcin de distribucin para el ejemplo 2. Solucin. Una forma de representar la funcin de probabilidad del ejemplo 1 sera:
Pr ( X = x ) f (x ) = 6 x7 36
Queda propuesto al lector verificar tal definicin. 1.1. Distribucin de Probabilidad de una V.A.D. Como se vi en el ejemplo 3, una forma de representar la probabilidad de que cierta variable aleatoria tome un valor especfico es a travs de una funcin, esta funcin en el caso de existir es conocida como funcin de distribucin de probabilidad (f.d.p.) o simplemente funcin de distribucin (f.d.). Definicin: Si X es una variable aleatoria discreta, la funcin dada para cada x dentro del intervalo de X se llama distribucin de probabilidades de X . Se debe destacar que dentro del espacio de las funciones, no todas ellas pueden ser utilizadas como funciones de distribucin, por ello el conjunto de las funciones de distribucin es un subconjunto del espacio de todas las funciones. Teorema 1. Una funcin puede servir como la distribucin de probabilidad de una variable aleatoria discreta X si y slo si sus valores satisfacen las siguientes condiciones: a.1. f ( x) = Pr( X = x) , para todos los valores que puede tomar X dentro de S. a.2. f : S = {x IR / X = x} [0,1] a.3. f (x ) 0 Para cada valor de su domino; a.4. xS f ( x) = 1 , donde la suma se extiende sobre todos los valores dentro de su dominio. Representacin Grfica: Histograma Para representar las funciones de distribucin, son muy utilizados los grficos de barras, o lo que ahora se conocer en estadstica como histogramas. Los histogramas o grficos de barras se usan principalmente en la estadstica descriptiva para comunicar visualmente la informacin proporcionada por una f.d.p. Supongamos que poseemos una base de datos que se compone de una lista de vehculos con diferentes modelos y aos, en la figura 1.a. podemos apreciar la frecuencia absoluta o cantidad de vehculos contenidos en la base de datos por ao, sin embargo, en la figura 1.b. se aprecia la frecuencia relativa 1 del nmero de vehculos segn el nmero de cilindros que posee. Claramente estos grficos proporcionan informacin resumida con la cual se puede concluir cosas diferentes.
1
La frecuencia relativa es igual a la probabilidad frecuencial o a posteriori. Pagina 3
ESTADISTICA I ___________
CAPITULO 3
Variables aleatorias y distribucin de probabilidad
Model Year (modulo 100)
50 30 40
Histogram
For CYLINDER= 6 Cylinders
30
20
20
Frequency
10 Std. Dev = 3,81 Mean = 20,0 0 16,0 20,0 24,0 28,0 32,0 36,0 38,0 18,0 22,0 26,0 30,0 34,0 N = 84,00
Frequency
10
0 70 71 72 73 74 75 76 77 78 79 80 81 82
Model Year (modulo 100)
Miles per Gallon
(a)
(b)
Figura 1. Histograma de la frecuencia absoluta de vehculos ordenados por ao y la frecuencia relativa de vehculos ordenados por nmero de cilindros. 1.3. Funcin de Distribucin Acumulada de una V.A.D. Hay muchos problemas en los que se necesitar obtener la probabilidad de que la variable aleatoria sea mayor que, menor que o se encuentre en un intervalo de valores. Pero este tipo de calculo no es igual al clculo de un valor puntual, a menos que el espacio muestral sea tan discreto que cualquiera de las condiciones anteriores quede representada por un solo valor, tal como ocurrira en el ejemplo 1 si se preguntar por la probabilidad de que la variable aleatoria W sea mayor o igual a 2, es exactamente igual a preguntar por la probabilidad de que W sea igual a 2. Sin embargo, en la generalidad esto no ocurrir. Por esta razn es muy utilizada una funcin que representa mejor la probabilidad cuando existen condiciones de desigualdad, esta funcin se denomina funcin de distribucin acumulada, F ( x) . Definicin. Si X es una variable aleatoria discreta, la funcin de distribucin acumulada, F ( x) , est definida por:
F (x ) = Pr ( X x ) =
f (w)
w x
(1.1)
Donde f (w) es el valor de la funcin de distribucin de probabilidad de X . Debe subyacerse que la funcin de distribucin acumulada (f.d.a.) se define de esta forma para toda variable aleatoria X , independiente de si la distribucin de X es discreta o continua o mixta. De la ecuacin 1.1. se deduce que la f.d.a. de una variable aleatoria X es una funcin F () definida sobre la recta real. Por tanto, la funcin de distribucin acumulada deber cumplir con ciertas condiciones, las cuales se describen a continuacin.
Pagina 4
ESTADISTICA I ___________
CAPITULO 3
Variables aleatorias y distribucin de probabilidad
Teorema 2. Los valores de F (x ) de la funcin de distribucin acumulada de una variable aleatoria discreta X , debe satisfacer las condiciones: b.1. F ( x) = P( X x) b.2. 1 F ( x) = P( X > x) b.3. F () : IR [0,1] b.4. lim F ( x) = 0
x inf( S )
x x
lim F ( x) = 0
b.5.
x sup( S )
lim
F ( x) = 1
lim F ( x) = 1
b.6. Si x y F ( x) F ( y ) Supongamos que poseemos los valores de esta f.d.a. pero requerimos los valores de la probabilidades especificas o los valores de la f.d.p. Entonces, si se conoce la f.d.a. de una variable aleatoria X , entonces se puede determinar la probabilidad de que X est en cualquier intervalo de la recta real a partir de la f.d.a. Ahora supongamos que X se distribuye discretamente en intervalos finitos de la siguiente forma:
x1 < x 2 < x 3 < ... < x n
(1.2)
Entonces, en base al teorema b.1 y b.4 se tiene que
F ( x1 ) = f ( x1 )
(1.3)
Por lo tanto, en forma recursiva se tiene que
F ( x i ) = f ( x1 ) + L + f ( x i 1 ) + f ( x i )
(1.4)
De la ecuacin 1.4 se puede concluir que la probabilidad de un xi corresponde a:
f ( x i ) = F ( x i ) F ( x i 1 )
(1.5)
Ejemplo 4. Analicemos el ejemplo 1 de los calcetines. En l se tena lo siguiente: Elemento del espacio muestral Probabilidad w 5 2 CC
14
CV VC VV
15 56 15 56 3 28
1 1 0
Determine la composicin de la funciones de distribucin acumulada y grafquela. Solucin.
F (0) = f (0) =
9 F (1) = f (0) + f (1) = 14 9 28
Pagina 5
ESTADISTICA I ___________
CAPITULO 3
Variables aleatorias y distribucin de probabilidad
Sin embargo, las probabilidades de obtener cuando mucho calcetines cafs de un cajn donde existen 5, no puede tener significado real. A pesar de este detalle podemos decir que la f.d.a. corresponde a:
0 3 F ( x) = 28 9 14 1 para x<0 para 0 x < 1 para 1 x < 2 para x2
F (2 ) = f (0) + f (1) + f (2) = 1 F ( ) = 1
Entonces, esta funcin queda representada grficamente tal como se ve en la figura 2.
F
1
9 14
3 28
Figura 2. Grafico de la f.d.a. discreta del ejemplo 4. Se debe tener presente, que cualquier grfico de una funcin de distribucin acumulada discreta tendr la forma de rectas escalonadas, donde la separacin depender bsicamente de la frecuencia absoluta de cada intervalo definido.
Pagina 6
ESTADISTICA I ___________
CAPITULO 3
Variables aleatorias y distribucin de probabilidad
2. VARIABLE ALEATORIA CONTINUA (V.A.C.) En el caso continuo, donde las variables aleatorias pueden asumir valores en una escala continua, el procedimiento en su mayor parte es el mismo que el caso discreto. Definir probabilidades en espacios muestrales continuos, es bastante complejo, ya que en la realidad no existen este tipo espacio muestrales, y lo que se hace es aproximar un espacio muestral discreto muy numeroso o de intervalo muy pequeos a un espacio muestral continuo, aunque esto trae como consecuencia cierta inexactitud en las probabilidades puntuales y por ende en sus estimaciones. Definicin. Una funcin con valores f (x ) , definida sobre el conjunto de todos los nmeros reales, se llama una funcin de densidad de probabilidad de la variable aleatoria continua X si y slo si: c.1. F ( x) Pr( X x) =
x inf( S )
f (t )dt =
f (t )dt
y
c.2. Pr( x X y ) = Pr( X y ) Pr( X x) = c.3. Pr( X > x) = 1 Pr( X x) = 1 c.4.
x inf( S )
f (t )dt
inf( S )
f (t )dt =
inf( S )
f (t )dt
x
f (t )dt =
sup( S )
f (t )dt
x
dF ( x) = f ( x) dx c.5. Pr( x X y ) = Pr( x X < y ) = Pr( x < X y ) = Pr( x < X < y ) x < y
De la definicin c.5 se puede desprender el hecho de la impresin del valor puntual de las probabilidades. Teorema 3. Una funcin f (x ) puede servir como una funcin de densidad de probabilidad de una variable aleatoria continua X si sus valores en f (x ) , satisfacen las siguientes condiciones: d.1. f () : IR IR + 0 f ( x) x IR d.2.
sup( S ) inf( S )
f (t )dt = 1
f (t )dt = 1
La propiedad d.2 indica que en ms de una ocasin ser necesario utilizar las propiedades y reglas para el clculo de integrales y sobre todo el uso de integrales impropias, por lo que se le recomienda al lector que realice un repaso sobre esta materia. Ejemplo 5. Sea X una variable aleatoria que tiene la siguiente funcin:
ke 3 x f ( x) = 0 x>0 x0
Encuentre k para que Pr (0,5 x 1) .
f (x )
sea funcin de densidad de probabilidad. Determine
Pagina 7
ESTADISTICA I ___________
CAPITULO 3
Variables aleatorias y distribucin de probabilidad
Solucin. Lo primero que podemos indicar si utilizamos la propiedad d.1 es que k debe ser positivo en forma estricta, ya que la parte exponencial es positiva y distinto de cero, y como el valor final de la funcin debe estar entre cero y uno, entonces, la constante buscada solo puede ser positiva en forma estricta. Por otro lado, tambin podemos utilizar la propiedad d.2 para determinar el valor puntual de k , por lo tanto, se debe cumplir:
f (t )dt = 1
(2.1)
Que en este caso se puede descomponer como:
f (t )dt =
f (t )dt +
f (t )dt
0
(2.2)
Esta separacin es una divisin geomtrica del rea que representan estas integrales, pero los lmites indeterminados deben ser resueltos en forma de integrales impropias, es decir,
f (t )dt = lim
f (t )dt +
f (t )dt = lim
f (t )dt + lim
f (t )dt
(2.3)
Sin embargo, la primera componente de la suma del lado derecho de la ecuacin la funcin tiene como valor cero dentro de todo el dominio, por tanto este lmite es cero, as que la ecuacin anterior se puede reducir a:
f (t )dt = lim
f (t )dt
(2.4)
= k 1 e 3 k 3
Resolviendo la integral dentro del lmite, se tiene que:
f (t )dt =
ke 3t dt = k
e 3t dt = k 1 e 3t 3
) (
1 3
(2.5)
Ahora colocamos el resultado de la ecuacin 2.5 en la ecuacin 2.4, y esto le imponemos la condicin definida en d.2, con lo que se obtiene: Por lo tanto, si el valor de k es igual a 3, f (x ) ser funcin de densidad de probabilidad. Adems el resultado anterior se puede ver grficamente en la figura 3, donde el rea achurada representada debe ser igual a uno, esto quiere decir que el total de las probabilidades se encuentran asignada a nuestro espacio austral.
Frecuencia
f (t )dt = lim k 1 e 3 k 3
[(
) (
1 3
)] = k 1 =1 3
k =3
f ( x) = 3e 3 x
Variable
Figura 3. Representacin grafica de una f.d.p.
Pagina 8
ESTADISTICA I ___________
CAPITULO 3
Variables aleatorias y distribucin de probabilidad
Ahora, calculamos la probabilidad solicitada, es decir:
Pr (0,5 x 1) =
3e 3t dt = e 3 x
1 0 ,5
= e 3(1) + e 3( 0,5) = 0,173
0, 5
) (
Este resultado se puede apreciar en la figura 4,
Frecuencia
Pr( 1 x 1) 2
f ( x) = 3e 3 x
1 2
Variable
Figura 4. Probabilidad representada por un rea achurada. El lector podr darse cuenta que fueron utilizadas varias propiedades de las integrales, pero hasta este momento slo han sido propiedades bsicas, pero ms adelante veremos otros ejercicios donde el nmero de propiedades y complejidad en la resolucin de integrales. Definicin. Si X es una variable aleatoria continua y el valor de su densidad de probabilidad en t es f (t ) , entonces la funcin dada por:
F (x ) = Pr ( X x ) =
f (t )dt =
inf( S )
f (t )dt
x IR
(2.6)
Ser tambin llamada funcin de distribucin acumulada. Teorema 4. Si f (x ) y F (x ) son los valores de la densidad de probabilidad y la funcin de distribucin de X en x , entonces:
Pr (a X b ) = F (b ) F (a ) a, b IR ab
(2.7)
Adems
f (x ) =
dF (x ) dx
ssi
F (x ) C 1
(2.8)
Pagina 9
ESTADISTICA I ___________
CAPITULO 3
Variables aleatorias y distribucin de probabilidad
3. DISTRIBUCIONES MULTIVARIADAS. En muchos experimentos es necesario considerar las propiedades de dos o ms variables aleatorias simultneamente. La distribucin de probabilidad conjunta se componen de una o ms variables aleatorias, las cuales pueden estar relacionadas o no, este conjunto de funciones pretenden establecer un vinculo entre un valor de probabilidad y la numeracin de ms una variable aleatoria al mismo tiempo. Examinaremos primero en el caso bivariado, esto es, en las situaciones donde nos interesa, al mismo tiempo, un par de variables aleatorias definidas en un especio muestral conjunto. Ms tarde, ampliaremos este examen al caso Multivariado que abarca cualquier nmero finito de variables aleatorias. 3.1. Distribuciones Bivariadas. Supngase que un experimento involucra dos variables aleatorias X e Y , cada una de las cuales tiene una distribucin discreta. Por ejemplo, si se selecciona una muestra de empresarios de teatro, una variable aleatoria podra ser el nmero X de personas en la muestra que superan los 60 aos de edad, y otra variable aleatoria podra ser el nmero Y de personas que viven a ms de 25 kilmetros. Si ambas, X e Y , tienen distribuciones discretas con un nmero finito de valores posibles, entonces existir un nmero finito de valores posibles distinto ( x, y ) para el par ( X , Y ) . Por otro lado, si X o Y pueden tomar un nmero finito de valores posibles, entonces tambin habr un nmero infinito de valores posibles para el par ( X , Y ) . Entonces, si X e Y son variables aleatorias discretas, la funcin dada para
f ( x, y ) = Pr ( X = x, Y = y ) ,
(3.1)
para cada par de valores ( x, y ) dentro del intervalo de ( x, y ) se llama distribucin de probabilidades conjunta de X e Y . Teorema 5. Una funcin bivariada puede servir como la distribucin de probabilidad conjunta de un par de variables aleatorias discretas X e Y si y slo si sus valores, f ( x, y ) , satisfacen las siguientes condiciones. e.1. f () : IR IR = IR 2 [0,1] e.2. 0 f ( x, y ) 1 ( x, y ) ( S x , S y ) , donde S x y S y representan el espacio muestral de X e Y , respectivamente, tal que S x , S y IR e.3.
xS x
yS y
f ( x, y ) =
yS y
xS x
f ( x, y ) = 1
Ejemplo 6. Supngase que la variable aleatoria X puede tomar solamente los valores 1,2 y 3; que la variable aleatoria Y puede tomar solamente los valores 1,2,3 y 4; y que la funcin de distribucin de probabilidad conjunta de X e Y es como especifica la tabla siguiente:
Pagina 10
ESTADISTICA I ___________
CAPITULO 3
Variables aleatorias y distribucin de probabilidad
1 2 3
1 0,1 0,3 0
2 0 0 0,2
3 0,1 0,1 0
4 0 0,2 0
Determine los valores de Pr( X 2, Y 2) y Pr( X = 1) Solucin. En este caso deberemos sumar todos los cuadros que aparecen subrayados en el cuadro siguiente, esto quiere decir que el resultado de la primera probabilidad solicitada ser:
X Y
1 2 3
1 0,1 0,3 0
2 0 0 0,2
3 0,1 0,1 0
4 0 0,2 0
Pr( X 2, Y 2) = f (2,2) + f (2,3) + f (2,4) + f (3,2) + f (3,3) + f (3,4) = 0,5
Ahora sumando las probabilidades de la primera fila de la tabla, se obtiene el valor de
Pr( X = 1) =
4 y =1
f (1, y ) = 0,2
Se debe tener presente que en la mayor parte de los casos se cumple que:
Pr( X = a, Y = b) Pr( X = b, Y = a)
(3.2)
A menos que la funcin sea simtrica, esto quiere decir que la funcin de distribucin bivariante debe ser par, es decir simtrica con respecto al eje vertical. Ejemplo 7. Determine el valor de k para el que la funcin dada por f ( x, y ) = kxy , sabiendo que S x = S y = {1,2,3} , esta puede servir como una distribucin de probabilidad conjunta. Solucin: En este caso, ser necesario determinar todos los valores que puede tener la funcin, tal que:
f (1,1) = k , f (1,2) = 2k ,
Entonces, si aplicamos la propiedad e.3 se obtiene la siguiente sumatoria
f (1,3) = 3k K
xS x
yS y
f ( x, y ) = k + 2k + 3k + 2k + 4k + 6k + 3k + 6k + 9k = 1
De esta manera el valor de la constante se obtiene que:
xS x
yS y
f ( x, y ) = 36k = 1 f ( x, y ) =
k=
1 36
De esta forma la funcin de distribucin de probabilidad conjunta corresponde a:
1 36
xy
Pagina 11
ESTADISTICA I ___________
CAPITULO 3
Variables aleatorias y distribucin de probabilidad
Definicin. Si X e Y son variables aleatorias discretas, la funcin dada por
F ( x, y ) = Pr( X x, Y y ) =
p x
q y
f ( p, q ) =
q y
p x
f ( p, q )
(3.3)
Donde f ( p, q) es el valor de la distribucin de probabilidades conjunta de X e Y en ( p, q) , se llama la funcin de distribucin acumulativa conjunta, de X e Y . Definicin Una funcin bivariada con valores f ( x, y) , definida sobre el plano x _ y , se llama funcin de densidad de probabilidad conjunta de las variables aleatorias continuas X e Y si y slo si.
Pr ( x, y ) S S x S y =
) S f ( x, y)dxdy = S f ( x, y)dydx
(3.4)
Para cualquier regin S en el plano x _ y . Teorema 6. Una funcin bivariada puede servir como la distribucin de probabilidad conjunta de un par de variables aleatorias continuas X e Y si y slo si sus valores, f ( x, y) , satisfacen las siguientes condiciones: f.1. f () : IR IR = IR 2 IR + f.2. 0 f ( x, y ) ( x, y ) ( S x , S y ) , donde S x y S y representan el espacio muestral de X e Y , respectivamente, tal que S x , S y IR f.3.
xS x
yS y
f ( x, y )dxdy =
yS y
xS x
f ( x, y )dxdy = 1
Podemos apreciar que las propiedades e.1 y e.2 son exactamente iguales a f.1 y f.2, respectivamente, esto debido a que son propiedades referentes al concepto que poseen las probabilidades, sin embargo, las e.3 y f.3 adems de hacer referencia al concepto estocstico, tambin tiene una fuerte relacin con las propiedades algebraicas que se deben utilizar para operaciones discretas y otras continuas. Ejemplo 8. Dada la siguiente funcin:
kx( y + x) 0 < x < 1; 0 < y < 2 f ( x, y ) = 0 otro caso
a. Determine el valor de k , para que la funcin definida sea una funcin de densidad de probabilidad. b. Con el valor de obtenido en (a), determine la probabilidad acumulada definida por: Pr ((x, y ) S ) si S = {(x, y ) / 0 < x < 1 ; 1 < y < 2} . 2 Solucin. Consideraremos el caso general del espacio muestral, la funcin anterior ser una funcin de distribucin si cumple con:
xS x
yS y
f ( x, y )dxdy =
yS y
xS x
f ( x, y )dxdy = 1
Pagina 12
ESTADISTICA I ___________
CAPITULO 3
Variables aleatorias y distribucin de probabilidad
En este caso el dominio sobre el cual se debe definir los lmites de integracin para completar la ecuacin anterior, se pude apreciar en la figura 5,
V.A. y
V.A. x
Figura 5. Dominio de integracin o base del espacio muestral bivariado Se debe tener presente que la funcin de distribucin conjunta de este problema es igual a cero para cualquier par ordenado ( x, y) que se encuentra fura de la regin achurada de la figura 5, de este modo nuestro problema se reduce a resolver la siguiente integral.
2 1 0
f ( x, y )dxdy =
2 1 0
kx( x + y )dxdy = 1
En este caso debemos recordar todas las propiedades para resolver las integrales dobles, como por ejemplo las integrales dobles se resuelven de adentro hacia fuera, es decir primero resolvemos la integral para x y luego para y , con lo que se obtiene:
0 2 0
kx( x + y )dx dy = 0
1 1 3
2 0
1 3 2 0
x3 + 1 yx 2 2 =k
) dy
1 0
k(
5 3
+1 y dy =k 2 k=
1 3
y+ 1 y2 4
(2 + 1) = 5 k 3 3
3 5
Bajo este concepto e igualamos a uno y obtenemos el valor de k , tal que:
k =1
3 5
f ( x, y ) =
x( x + y )
Ahora para responder la parte (b) de este ejemplo, debemos aplicar la integral anterior, pero sobre la regin que se describe en la figura 6. Pero, aunque esta rea corresponde a la mitad de la presentada en la figura 5, esto no quiere decir que la probabilidad sea igual a 0,5, esto de debe calcular.
Pagina 13
ESTADISTICA I ___________
CAPITULO 3
Variables aleatorias y distribucin de probabilidad
V.A. y
1 2
V.A. x
Figura 6. Dominio de integracin para la probabilidad de Pr ((x, y ) S ) . Entonces, para este problema se debe resolver lo siguiente:
0 2
12 0
3 5
x( x + y )dx dy =
2
2 0
3 5
1 3
x3 + 1 yx 2 2
2 0
1 2 0
dy
3 3 1 1 (3 y + 12 y 2 ) +1 y )]dy = 40 8 0 [53 (24 0 [(13 + y )]dy = 40
3 2 40 3
+2 =
1 5
Por lo tanto, el valor de la probabilidad pedida con responde a 0,2 que es menor a 0,5, tal como en este ejercicio se esperaba la probabilidad de la mitad del rea de integracin no necesariamente corresponde a la mitad de la probabilidad, esto debera ocurrir slo si la funcin es simtrica con respecto al espacio muestral o dominio de integracin. Ejemplo 9. Supngase que la f.d.p. conjunta de X e Y es la siguiente:
kx 2 y f ( x, y ) = 0 k para que f ( x, y ) x 1; x 2 y 1 otro caso
Determine el valor de probabilidad Pr( X Y ) . Solucin.
sea una f.d.p. conjunta y luego determine la
Definicin. Si X e Y son variables aleatorias continuas, la funcin dada por
F ( x, y ) = Pr( X x, Y y ) =
inf( S y )
f ( p, q )dpdq =
inf( S x )
f ( p, q )dpdq
(3.5)
Donde f ( p, q) es el valor de la densidad de probabilidad conjunta de X e Y en ( p, q) , se llama la funcin de distribucin conjunta de X e Y .
Pagina 14
ESTADISTICA I ___________
CAPITULO 3
Variables aleatorias y distribucin de probabilidad
3.2. Distribuciones Multivariantes Definicin Si x = (x1 , x 2 ,..., xT ) son variables aleatorias discretas, la funcin dada para f (x1 , x 2 ,..., xT ) corresponde a la funcin de distribucin para cada una de las variables contenidas en el vector. g.1.a. f (x) : IR T [0,1] Ahora si el vector de variables es continuo, se tiene que g.1.b. f (x) : IR T IR + v) = 1 g.2.a. x IR x IR L x IR f ( x
1 2 T
En el caso de ser un conjunto de variables aleatorias continuas. v v g.2.b. L f ( x ) dx = 1
x1IR x2 IR xT IR
Sin embargo, tambin pueden existir expresiones menos frecuentes de funciones de distribucin de probabilidades multivariadas mixtas, es decir, que dentro de la funcin existen variables aleatorias continuas y discretas, las cuales debern ser manejadas segn el comportamiento asociado a cada una. Por lo general este tipo de problemas son muy complejos de resolver. Definicin Una funcin multivariante definida sobre el espacio del vector de variable aleatorias, se llama funcin de densidad de probabilidad conjunta de las variables aleatorias si y slo si.
Pr[x1 A1 , x 2 A2 ,..., xT AT ] =
x1 A1
x2 A2
xT AT
v )dx dx L dx f (x T 1 2
(3.6)
Donde se debe cumplir que Ai IR i = 1,..., T , y asumiendo que el conjunto de los reales es la poblacin o universo de cada variable aleatoria continua. La expresin anterior es anloga para las variables discretas salvo que en vez de utilizar integrales se deben utilizar sumatorias. Importante: Se pueden realizar las siguientes definiciones de utilidad. f.1. f (x1 , x 2 ,..., xT ) = Pr ( X 1 = x1 , X 2 = x 2 ,...., X T = xT ) f.2. F (x1 , x 2 ,..., xT ) = Pr ( X 1 x1 , X 2 x 2 ,...., X T xT ) f.3. F (x1 , x 2 ,..., xT ) = f.4. f (x1 , x 2 ,..., xT ) =
x1
inf S1
x2
inf S 2
xT
inf ST
f (u1 , u 2 ,..., u T )du1 du 2 du T
F (x1 , x 2 ,..., xT ) x1 x 2 xT
Pagina 15
ESTADISTICA I ___________
CAPITULO 3
Variables aleatorias y distribucin de probabilidad
Ejemplo 10. Si la densidad de probabilidades para x, y, z est dada por:
( x + y )e z f ( x, y , z ) = 0 Pr[( x, y, z ) A] si A = ( x, y, z ) / 0 < x < 1 ; 2 0 < x < 1; 0 < y < 1; 0 < z Otro caso < y < 1, z < 1
Determine la probabilidad acumulada definida por:
1 2
Solucin. En este caso se tiene lo siguiente:
Pr[( x, y, z ) A] = Pr(0 < x < 1 ; 2
1 2
< y < 1, z < 1)
Pr[( x, y, z ) A] =
1 1
12
( x + y )e z dxdydz
0 12 0
Entonces, para resolver esta integral, es necesario resolver la primera integral, la cual corresponde a la ms interna, es decir
[(
1 1 0 12
0 12 1 8
1 1
12 0
( x + y )e z dx dydz =
[(
1 1 0 12
1 8
+1 y )e z dydz 2
+1 y )e z dydz = 2
1 4
1 0
e z dz = 1 (1 e 1 ) = 0,158 4
Pagina 16
ESTADISTICA I ___________
CAPITULO 3
Variables aleatorias y distribucin de probabilidad
3.3. DISTRIBUCIONES MARGINALES. En este caso intentaremos obtener la funcin de distribucin de una variable aleatoria contenida en una funcin de distribucin conjunta. 3.3.1. Caso Discreto. Definicin Si X e Y son variables aleatorias discretas y f ( x, y ) es la funcin de distribucin conjunta en ( x, y ) , la funcin dada por:
g ( x) =
yS y
f ( x, y )
(3.7)
para cada x dentro del intervalo X es llamada la distribucin marginal de X . Correspondientemente, la funcin dada por
h( y ) =
xS x
f ( x, y )
(3.8)
Para cada y es llamada la distribucin marginal de Y . Cuando X e Y son variables aleatorias continuas, las distribucin de probabilidad se reemplazan con densidades de probabilidad, las sumas se reemplazan con integrales con integrales y obtenemos. 3.3.2. Caso Continuo. Definicin Si X e Y son variables aleatorias discretas y f ( x, y ) es la funcin de distribucin conjunta en ( x, y ) , la funcin dada por:
g ( x) =
yS y
f ( x, y )dy
(3.9)
para cada x dentro del intervalo X es llamada la distribucin marginal de X . Correspondientemente, la funcin dada por
h( y ) =
xS x
f ( x, y )dx
(3.10)
Para cada y es llamada la distribucin marginal de Y .
Pagina 17
ESTADISTICA I ___________
CAPITULO 3
Variables aleatorias y distribucin de probabilidad
Ejemplo 11. Dada la densidad de probabilidad conjunta
2 ( x + 2 y ) 0 < x < 1; 0 < y < 1 f ( x, y ) = 3 0 Otro caso Encuentre la densidad marginal de X e Y .
Solucin Al efectuar las integraciones necesarias, obtenemos.
g (x ) =
f (x, y )dy =
4243 1 0
f (x, y )dy +
f (x, y )dy +
1 4 1 24 3 0
f (x, y )dy
g (x ) =
f (x, y )dy = 3 (x + 2 y )dy = 3 (x + 1)
2 2
0 0
De igual manera, para la otra funcin de distribucin marginal, se tiene:
h( y ) =
2 03
( x + 2 y )dy = 1 (1 + 4 y ) 3
Cuando estamos trabajando con ms de dos variables aleatorias, podemos hablar no slo de las distribuciones marginales de las variables aleatorias individuales, sino tambin de las distribuciones marginales conjuntas de muchas de las variables aleatorias. Si la distribucin de probabilidad conjunta de las variables aleatorias discretas X 1 , X 2 ,..., X T tiene los valores f (x1 , x 2 ,..., xT ) , la distribucin marginal de X 1 sola est dada por: Funcin marginal discreta
g ( x1 ) =
x2 S 2
x2 S 2
xT ST
f ( x1 , x 2 ,..., xT )
(3.11)
Funcin marginal conjunta discreta
m( x1 , x 2 , x 3 ) =
x4 S 4
x5 S 5
xT ST
f ( x1 , x 2 ,..., xT )
(3.12)
Funcin marginal continua
g ( x1 ) =
x2 S 2
x3S 3
xT ST
f ( x1 , x 2 ,..., xT )dx 2 dx 3 L dxT
(3.13)
Funcin marginal conjunta continua
m( x1 , x 2 , x 3 ) =
x4 S 4
x5 S 5
xT ST
f ( x1 , x 2 ,..., xT )dx 4 dx 5 L dxT
(3.14)
Pagina 18
ESTADISTICA I ___________
CAPITULO 3
Variables aleatorias y distribucin de probabilidad
Ejemplo 12. Considera la siguiente funcin de distribucin de probabilidad conjunta
( x + y )e z f ( x, y , z ) = 0 Encuentre la densidad marginal conjunta de x 0 < x < 1; 0 < y < 1; 0 < z Otro caso
y z , y la densidad marginal de slo de x . Solucin Al efectuar la integracin necesaria, encontramos que la densidad marginal conjunta de X y Z est dada por:
m ( x, z ) =
( x + y )e
0
dy = ( x + 1 )e z 2
0 < x < 1; 0 < z Otro caso
Entonces, la funcin conjunta marginal de x y z .
)e z ( x + 1 2 m ( x, z ) = 0 g ( x) =
Entonces, la funcin de distribucin de probabilidades de X , es:
1 0
( x + y )e z dydz =
(x + 1 )e z dz 2
g ( x) = ( x + 1 ) lim (e t ) (e 0 ) = x+ 1 2 2 t Del mismo modo, la funcin de distribucin marginal de x . ( x + 1 ) 0 < x <1 2 g ( x) = Otro caso 0
Pagina 19
ESTADISTICA I ___________
CAPITULO 3
Variables aleatorias y distribucin de probabilidad
3.4. DISTRIBUCIONES CONDICIONALES En esta parte analizaremos las funciones de distribucin de probabilidades, pero desde el punto de vista condicional. Un ejemplo de este fenmeno de distribuciones condicionales, es cuando se establece el comportamiento estocstico de una poblacin en particular en un periodo corto de tiempo. En este caso la funcin de distribucin que se obtiene para esta poblacin es en realidad una distribucin condicional, ya que, los parmetros que la componen son validos slo dentro del periodo considerado para el estudio, por ende, estn condicionales a ese periodo. Definicin Si f ( x, y) es el valor de la distribucin de probabilidades conjunta de las variables aleatorias discretas X e Y en ( x, y ) , y h( y ) es el valor de la distribucin marginal de Y en y , la funcin dada por:
f ( x / y) = f ( x, y ) h( y ) h( y ) 0
(3.15)
Para cada x dentro del intervalo de X , se llama la distribucin condicional de X dado Y = y . En forma correspondiente, si g ( x) es el valor de la distribucin marginal de X en x , la funcin dada por:
f ( y / x) = f ( x, y ) g ( x) g ( x) 0
(3.16)
Para cada y dentro del intervalo de Y , se llama la distribucin condicional de Y dado X = x . Ejemplo 13. Dada la densidad de probabilidad conjunta
2 ( x + 2 y ) 0 < x < 1; 0 < y < 1 f ( x, y ) = 3 0 otro caso Encuentre la densidad condicional de X dado Y = y , y sela para evaluar Pr (X 1 /Y = 2
1 2
Solucin. Si recordamos el ejemplo 11, en el cual se obtuvo que la funcin de distribucin marginal para y corresponde a h( y ) = 1 (1 + 4 y ) , que al reemplazar en la ecuacin 3.15 se obtiene que: 3
f ( x / y) = f ( x, y ) = h( y )
2 ( x + 2 y) 3 1 (1 + 4 y ) 3
2x + 4 y 1+ 4 y
Por lo tanto,
f (x / 1 )= 2 2x + 4 1 2 1+ 4 1 2
=2 ( x + 1) 3
Ahora, aplicando el concepto de probabilidades para variables continuas se tiene que:
Pr( X 1 /Y = 1 )= 2 2
12 0
2 3
5 ( x + 1)dx = 12
Pagina 20
ESTADISTICA I ___________
CAPITULO 3
Variables aleatorias y distribucin de probabilidad
Sin embargo, podemos generalizar un poco estas probabilidades condicionales. Sea un conjunto de variables aleatorias diferentes definidas como X 1 , X 2 , X 3 y X 4 . Entonces, es posible determinar las siguientes probabilidades condicionales: e.1. f ( x 3 / x1 , x 2 , x 4 ) = e.2. f ( x 2 , x 4 / x1 , x 3 ) = e.3. f ( x 2 , x 3 , x 4 / x1 ) =
f ( x1 , x 2 , x 3 , x 4 ) g ( x1 , x 2 , x 4 ) f ( x1 , x 2 , x 3 , x 4 ) m( x1 , x 3 ) f ( x1 , x 2 , x 3 , x 4 ) h( x1 ) g ( x1 , x 2 , x 4 ) 0 m( x1 , x 3 ) 0 h( x1 ) 0
Definicin Si f (x1 , x 2 ,..., xT ) es el valor de la distribucin de probabilidad conjunta de las T variables aleatorias discretas X 1 , X 2 ,..., X T en f (x1 , x 2 ,..., xT ) y f i (xi ) es el valor de la distribucin marginal de X i en xi para i = 1,2,..., T , entonces las T variables aleatorias son independientes si y slo si:
f ( x1 , x 2 ,..., xT ) = f 1 ( x1 ) f 2 ( x 2 ) L f T ( xT ) =
2 y
f ( xi ) i =1 i
xi S i
con
i = 1,..., T
(3.17)
Ejemplo 14.
f x ( x) = e
x
x > 0;
f y ( y ) = 2e
y > 0;
f z ( z ) = 3e
3 z
independientes X , Y y Z con densidades de probabilidad:
Dadas las variables z>0 aleatorias
Encuentre la densidad de probabilidad conjunta y sela para evaluar la probabilidad:
Pr( X + Y 1, Z > 1)
Solucin. Dado que las variables son independientes, entonces:
f ( x, y , z ) = f x ( x ) f y ( y ) f z ( z ) = 6e x 2 y 3 z
Sin embargo, para calcular la probabilidad sealada se debe tener cuidado en como se definen los lmites que se debe colocar a cada integral. Dado que dentro de la probabilidad la variable z, no tiene relacin directa con las otras dos variables y como tienen comportamiento independiente, entonces la integral
Pr( X + Y 1, Z > 1) =
zRz
xR xy
yR xy
6e x 2 y 3 z dxdydz
Se puede re-escribir de la siguiente forma
Pr( X + Y 1, Z > 1) =
zRz
3e 3 z dz
xR xy
yRxy
2e x 2 y dxdy
Donde la primera integral corresponde a
3e 3 z dz = e 3 z
= e 3 + e 3 = e 3
Pagina 21
ESTADISTICA I ___________
CAPITULO 3
Variables aleatorias y distribucin de probabilidad
Por lo que la probabilidad solicitada se reduce a:
Pr( X + Y 1, Z > 1) = e 3
xRxy
2e x 2 y dxdy yRxy
Ahora, slo nos resta determinar el valor de la segunda integral, pero esta tiene un comportamiento condicionado, por lo que, para tener una idea ms clara de cuales son los lmites de integracin, es que nos fijaremos en la figura 7, la cual representa la regin R xy , la cual se define por:
2 R xy = ( x, y ) IR+ / x + y 1
As la regin achurada corresponde al rea sobre la cual se debe aplicar la integral.
V.A. y
V.A. x
Figura 7. Regin condicional R xy de integracin. Entonces, la integral debe quedar definida por:
Al resolverla se tiene que:
2
1 y
2e x 2 y dxdy
0 0
e 2 y 0
1
1 y 0
e x dx dy = 2
1
1 y e 2 y e x dy = 2 0 0 1
1 0
e 2 y e y 1 + 1 dy = 2
1 0
[ e
1 0
y 1
+ e 2 y dy
[ e
0
y 1
+ e 2 y dy = 2e y 1 e 2 y
=e 2 2e 1 + 1
Por lo tanto, el resultado pedido es:
Pr( X + Y 1, Z > 1) = e 3 (e 2 2e 1 + 1)
Pagina 22
ESTADISTICA I ___________
CAPITULO 3
Variables aleatorias y distribucin de probabilidad
3.5. PROBLEMAS PROPUESTOS PROPUESTO 1 Verifique si la siguiente funcin dada por f (x ) = una f.p.d.
( x + 2), x = 1,2,3,4,5 ,
1 25
puede servir como
PROPUESTO 2 Encuentre una frmula para la distribucin de probabilidad del nmero total de caras obtenidas en 10 lanzamientos de una moneda equilibrada. PROPUESTO 3 Encuentre la funcin de distribucin acumulada del nmero de total de caras obtenidas en 10 lanzamientos de una moneda equilibrada. Adems construya el grfico de esta funcin. PROPUESTO 4 La densidad de probabilidad de la variable aleatoria Z est dada por:
kze z f (z ) = 0
2
para para
z>0 z0
Encuentre k y dibuje la grfica de esta densidad de probabilidad. PROPUESTO 5 La funcin de distribucin de la variable aleatoria Y est dada por:
1 9 y 2 f (y) = 0
para para
y>3 y3
Encuentre Pr (Y 5) y Pr (Y > 8) . PROPUESTO 6 Determine k de manera que:
kx( y x) 0 < x < 1; x < y < x f ( x, y ) = 0 Otro caso
Pueda servir como una densidad de probabilidad conjunta. PROPUESTO 7 Si la densidad de probabilidad conjunta de X e Y est dada
y + x 0 < x < 1; 0 < y < 1 f ( x, y ) = Otro caso 0
Encuentre la funcin de distribucin conjunta de estas variables aleatorias. PROPUESTO 8 Encuentre la funcin de distribucin de las variables aleatorias de X e Y cuya funcin de distribucin conjunta est dada por:
(1 e x )(1 e y ) x > 0, y > 0 F ( x, y ) = 0 Otro caso
Pagina 23
ESTADISTICA I ___________
CAPITULO 3
Variables aleatorias y distribucin de probabilidad
PROPUESTO 9 Si la funcin de distribucin para X , Y , Z est dada por:
1 ( x + y + z ) 0 < x < 1; 0 < y < 1; 0 < z < 1 f ( x, y , z ) = 3 0 Otro caso
Encuentre: ) (a) Pr (X = 1 ,Y = 1 ,Z = 1 2 2 2 1 1 1 (b) Pr (X 2 , Y 2 , Z 2 ) ) (c) Pr (X + Y 1 ,Z 1 2 2 Y, Z Y ) (d) Pr (X 1 2 PROPUESTO 10 Si la densidad de probabilidad conjunta de X e Y est dada por:
24 y (1 x y ) x > 0, y > 0, x + y < 1 f ( x, y ) = 0 Otro caso
Encuentre (a) La densidad marginal de X . (b) La densidad marginal de Y . PROPUESTO 11 Si X es la proporcin de personas que responder a una clase de solicitud por correo, Y es la proporcin que respondern a otra clase de solicitud por correo, y la densidad de probabilidad conjunta de X e Y est dada por:
2 ( x + 4 y ) 0 < x < 1, 0 < y < 1 f ( x, y ) = 5 0 Otro caso
Encuentre las probabilidades de que: (a) Al menos 30% responder a la primera clase de solicitud por correo; (b) Cuando mucho 50% responder a la segunda clase de solicitud por correo. PROPUESTO 12 Suponga que P , corresponde al precio de cierto producto en dlares, y S , sus ventas totales (en 10.000 unidades), son variables aleatorias cuya distribucin de probabilidad conjunta se puede aproximar a:
5 pe ps f ( p, s ) = 0
0,2 < p < 0,4 ; 0 < s Otro caso
Encuentre (a) La probabilidad de que el precio ser menos de 30 centavos y las ventas excedern 20.000 unidades. (b) La probabilidad de que el precio estar entre 25 y 30 centavos y las ventas sern de menos de 10.000 unidades. (c) La densidad marginal de P . (d) La densidad condicional de S dado P = p , y seale si ambas variables son independientes.
Pagina 24
ESTADISTICA I ___________
CAPITULO 3
Variables aleatorias y distribucin de probabilidad
(e) La probabilidad de que las ventas sern menores que 30.000 unidades cuando p = 25 centavos. PROPUESTO 13 Suponga que la probabilidad de tener un salario w en un periodo t cualquiera viene dada por:
( x + y )e t f ( x, y , t ) = 0 0 < x < 1 ;0 < y < 1; 0 t Otro caso
(a) Para qu valor de la funcin antes descrita es una funcin de distribucin? (b) Utilizando la informacin de la parte i, determine el valor de la siguiente probabilidad Pr( x 0.5; y 0.5; t > 0) . (c) Si suponemos que x e y corresponden a la fraccin que se consume de dos bienes que produce una industria y t es el periodo en que las produce, cul sera la interpretacin de la probabilidad calculada en el apartado (b)?
Pagina 25