1
MÓDULO III
VARIABLE ALEATORIA BIDIMENSIONAL DISCRETA
1. Presentación de la información mediante tablas Estadísticas Bidimensionales.
La tabla estadística que describe a las n observaciones, es una tabla de doble entrada llamada tabla de
distribución de probabilidades de variable bidimensional, donde figuran en las filas las modalidades o
valores de la característica X, y en las columnas las modalidades o valores de la característica Y (tabla de k
filas y de l columnas).
Tabla 1. Distribución Bidimensional de probabilidades.
Modalidades Totales horizontales
o valores de Y y1 y2 ... yj ... yq q
= p
j1
ij p i
Modalidades
o valores de X
x1 p11 p12 ... p1j ... p1q p1.
x2 p21 p22 ... p2j ... p2q p2.
... ... ... ... ... ... ...
xi pi1 pi2 ... pij ... piq pi.
... ... ... ... ... ... ...
xp pp1 pp2 ... ppj ... ppq pp.
Totales verticales p q
p p.1 p.2 ... p.j ... p.q p p ij 1
p
i 1
ij n j i 1 j1
donde:
pij = el número de veces que aparece repetido el par (xi, yj) y se llama frecuencia absoluta del par (xi, yj) ,
i =1, 2, ..., p ; j =1, 2, ..., q.
q
p i p ij = suma total de las frecuencias absolutas nij según el índice j, y se llama frecuencia marginal del
j1
valor xi.
p
p j p ij = suma total de las frecuencias absolutas nij según el índice i, y se llama frecuencia marginal del
i 1
valor yj.
p q
p
i 1 j1
ij 1 = suma de las probabilidades pij observadas es igual a l
2. Distribuciones Marginales.
Establecida la distribución conjunta de probabilidades de una variable bidimensional (X,Y) mediante la
correspondiente tabla de doble entrada o de correlación, pueden obtenerse a partir de ésta las distribuciones
de las variables unidimensionales X e Y que la componen. Estas distribuciones de las variables
unidimensionales se denominan distribuciones de probabilidad marginales. Cada distribución marginal será,
2
por tanto, es una distribución de probabilidad unidimensional y; consecuentemente, se le podrá aplicar
cualquiera de los resultados estudiados.
2.1. Distribución Marginal de X.
La distribución marginal de X se obtiene de la tabla anterior , sin más que adjuntar a cada uno de los valores
o modalidades x1, x2,..., xp de X, sus probabilidades p i que vienen dadas en la última columna (columna de
los totales horizontales) de dicha tabla.
Las probabilidades p i definen lo que se llama distribución marginal de la variable X.
q
p i p ij
j1
y también la suma de las frecuencias relativas marginales, como hemos visto es igual a la unidad:
p
p
i 1
i 1
Tabla 2. Distribución Marginal de X.
Probabilidades
Valores de X p i.
x1 p1.
x2 p2.
...
xi pi.
...
xp pp.
Total 1
2.2. Distribución Marginal de Y.
La distribución marginal de Y se obtiene de la tabla anterior , sin más que adjuntar a cada uno de los valores
o modalidades y1, y2,..., yq de Y, sus probabilidades p .j que vienen dadas en la última fila (fila de los totales
verticales ) de dicha tabla.
Las probabilidades p.j definen lo que se llama distribución marginal de la variable X.
q
p.j p ij
i 1
y también la suma de las frecuencias relativas marginales, como hemos visto es igual a la unidad:
q
p.j 1
j1
Tabla 3. Distribución Marginal de Y.
Probabilidades
Valores de Y p.j
y1 p.1
y2 p.2
...
yj p.j
...
yq p.q
Total 1
3
3. Distribución Condicionales
3.1. Distribución Condicional de X dado Y.
Definición. La distribución de frecuencias relativas de la variable X condicionada a que la variable Y tome
el valor fijo y j (Y = y j ), j = 1, 2,..., q es igual a:
p
ij
P(X/Y y ) , i = 1, 2,..., p
j p.
j
La tabla estadística de la distribución de X condicionada a que la variable Y tome el valor y j tiene la
siguiente forma:
Tabla 4
Probabilidades de X
Valores de X condicionada por Y = y j
p X / Yy
j
x1 p1j / p. j
x2 p 2j / p. j
... ...
xi p ij / p. j
... ...
xp p pj / p. j
Total 1
3.2. Distribución Condicional de Y dado X.
Definición. La distribución de frecuencias relativas de la variable Y condicionada a que la variable X tome
el valor fijo y j (X =x j ), i = 1, 2,..., p es igual a:
p
ij
P(Y/X x ) , j = 1, 2,..., q
i pi.
La tabla estadística de la distribución de Y condicionada a que la variable X tome el valor x i tiene la
siguiente forma:
Tabla 5
Probabilidades de Y
Valores de Y condicionada por X = x i
p Y / X x
i
y1 p i1 / pi.
y2 p i2 / pi.
... ...
yj pij / pi.
... ...
yq piq / pi.
Total 1
4
4. Esperanzas y varianzas de las distribuciones marginales.
De cada distribución marginal podemos construir tablas derivadas, añadiendo columnas que expresen las
probabilidades simples , las probabilidades acumuladas, los porcentajes, etc., de cada valor, así como
obtener, por ejemplo sus medidas de posición y de dispersión. En particular, la media y varianza de las
distribuciones marginales X e Y y que se escriben de la forma siguiente:
a. Esperanzas marginales:
p q
x x i pi . y y j p. j
1 1
b. Varianzas marginales:
Y2 y j y 2 p. j
q
X2 xi 2 pi.
1
5. Covarianza.
Definición. Sean (x1, y1), (x2, y2) ,..., (xp, yq) valores distintos de la variable bidimensional (X,Y), con
probabilidades conjuntas p11, p12,..., ppq , respectivamente. La covarianza entre las variables X e Y es dado
por:
X2 Y Cov(X, Y) xi x y j y pij
j
Observación 3. Sean (x1, y1), (x2, y2) ,..., (xp, yq) valores distintos de la variable bidimensional (X, Y), con
probabilidades p11, p12,..., ppq , respectivamente, entonces la formula abreviada de la covarianza es:
X2 Y Cov(X, Y) xi y j pij x y
j
6. APLICACIONES.
6.1. Sea la v.a bi-dimensional (X,Y), con función de probabilidad p(x,y)
3 2 4 Sumas : p(x)
1 0,1 0,2 0.2 0.5
3 0.3 0.1 0.1 0.5
Suma : 0.4 0.3 0.3 1
p(y)
a) Hallar la distribuciones marginales de X y de Y
b) Hallar la esperanza y varianzas de las distribuciones marginales de X y de Y
c) Hallar la cov(x,y) , esto es la covarianza de X y de Y
d) Hallar el coeficiente de correlación de X y de Y
e) ¿ X e Y son variables aleatorias independientes ?
Solución :
a) La distribución de X e Y :
a.1. Distribución marginal de X ( margen derecha):
X 1 3
p (x) 0.5 0.5
a.2. Distribución marginal de y ( margen inferior) :
Y 3 2 4
g(y) 0.4 0.3 0.3
b) Para calcular la covarianza.
Primero debemos calcular E(x) ; E(y) ; E(x y) y obtendremos : Cov( x,y) = E(x,y) – E(x).E(y). En
efecto :
E ( x) x x. p( x) (1)(0.5) (3)(0.5) 2
E ( y ) y y.g ( y ) ( 3)(0.4) (2)(0.3) (4)(0.3) 0.6
5
E ( xy ) xy.h( x, y ) (1)( 3)(0.1) (1)(2)(0.2) (3)( 3)(0.3) (3)(2)(0.1) (3)(4)(0.1) 0
Por tanto:
Cov( x, y ) E( xy ) E( x).E ( y ) 0 (2)(0.6) 1.2
cov( x, y )
c) Hallar el coeficiente de correlación entre X e Y : xy
x y
Debemos calcular varianzas y desviaciones estándares : x2 E x 2 x2 ;
E y
2
y
2 2
y
E ( x 2 ) x 2 . p( x) (1) 2 (0.5) (3) 2 (0.5) 5
E ( y 2 ) y 2 .h( y ) (3) 2 (0.4) (2) 2 (0.3) (4) 2 (0.3) 9.6 . Por tanto :
x2 E x 2 x2 5 (2) 2 1 , x 1
y2 E y 2 y2 9.6 (0.6) 2 9.24 y 3.0
cov( x, y ) 1.2
xy 0.4
x y (1)(3)
d) Las variables X e Y son independientes. Puesto que P( x = 1; y = - 3) ≠ P ( x=1 ) .P(y= -3). Es
decir el elemento :
h(1,-3) = 0.1 no es igual a f(1).g(-3) = (0.5)(0..4) = 0.2, `producto de elementos marginales
6.2. Si X e Y son v.a. independientes, con las distribuciones siguientes :
a) Distribución marginal de la v.a. X
X 1 3
P(x) 0.6 0.4
b). Distribución marginal de Y :
Y 5 10 15
g(y) 0.2 0.5 0.3
Entonces , la distribución bidimensional de la v.a. (X,Y), es l siguiente :
5 10 15 P(x)
1 0,12 0,3 0.18 0.6
2 0.08 0.2 0.12 0.4
g(y) 0.2 0.5 0.3 1
a) Hallar la cov(x,y) , esto es la covarianza de X y de Y
b) Hallar el coeficiente de correlación de X y de Y
c) ¿ X e Y son variables aleatorias independientes ?
4.2.Sea el experimento aleatorio: Se lanzan dos dados normales. Sea el espacio muestral :
{ (1,1); (1,2); (1,3);………….(6,6) }
a) Sea X. v.a. que hace corresponder cada punto ( a,b) de el máximo de sus números, o sea ,
X(a,b) = Máx (a,b)]. Luego X : 1 , 2 , 3 , 4 , 5 , 6.
Calculando la función de p(x) :
p(1) = P(x =1) = …... = 1/36 ; p(2) = P(x =2) = …..= 3/36 ;
p(3) = P(x =3) = … = 5/36 ; p(4) = P(x =4) = … = 7/36 ;
p(5) = P(x =5) = …… = 9/36 ; p(6) = P(x =6 ) = …. = 11/36
Ordenando la tabla :
X 1 2 3 4 5 6
p(x) 1/36 3/36 5/36 7/36 9/36 11/36
Hallar : x x. p( x) ........... 4.47
6
Calculando la varianza y desviación estándar :
x2 E x 2 x2 ;
E x 2 x 2 p( x ) 12 x1 / 36 22 x3 / 36 ........ 62 x11 / 36 791 / 36 21.97
Entonces la varianza es x2 21.97 (4.47) 2 1.99 y la 1.4
b) Sea la v.a. Y : que hace corresponder a cada punto (a,b) de , la suma de sus números, o sea :
Y(a,b) = a+b. Entonces:
Yes v.a. que asume valores : 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, con función de probabilidad g(y):
y 2 3 4 5 6 7 8 10 11 12
g(y) 1/36 2/36 3/36 4/36 5/36 6/36 7/36 9/36 11/36 12/36
Donde : g(4) = P ( 1,3) ; (2,2) ; (3,1) ] = 3/36
y y.g ( y) ........... 7
Calculando la varianza y desviación estándar : y2 E y 2 y2 ;
E y 2 y 2 g ( y ) 22 x1 / 36 32 x2 / 36 ........ 122 x1 / 36 54.8
Entonces la varianza es y2 54.8 7 2 5.8 y la 2.4
6.3.Se lanza dos dados ( ejemplo anterior). Sea { (1,1); (1,2); (1,3);………….(6,6) }
Sea X : v.a. que asocia el máximo número; Y: v.a. que asocia la suma de sus números. La
distribución conjunta de las variables (X,Y) es la siguiente :
2 3 4 5 6 7 8 9 10 11 12 P(x)
1 1/36 1/36
2 2/36 1/36 3/36
3 2/36 2/36 1/36 5/36
4 2/36 2/36 2/36 1/36 7/36
5 2/36 2/36 2/36 2/36 1/36 9/36
6 2/36 2/36 2/36 2/36 2/36 1/36 11/36
g(y) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36 1
p(3,5) = P (3,2) ; (2,3) ] = 2/36; donde la primera componente es el máximo número del par y la
segunda componente es la suma de sus números del par ordenado :
Hallar la Covarianza y correlación:
a) Cov( x, y ) E ( xy ) E ( x).E ( y )
E ( xy ) xy. p( x, y ) 1x2x1/36 + 2x3x2/36 +2x4x1/36 +…+ 6x12x1/36 = 1232/36 = 34.2
E ( x) x x. p( x) ........... 4.47 ; E ( y ) y y.g ( y ) ........... 7 ;
Del ejercicio anterior, se tiene : x 1.4 y 2.4
Por consiguiente :
Cov( x, y ) E ( xy ) E ( x).E ( y ) xy2 = 34.2 –(4.7)(7) = 2.9 ;
cov( x, y ) 2.9
xy 0.86
x y (1.4)(2.4)
6.3. Sea la distribución conjunta de X e Yen las siguientes tablas :
─4 2 7 Suma
1 1/8 1/4 1/8 1/2
5 1/4 1/8 1/8 1/2
Suma 3/8 3/8 2/8 1
7
─2 ─1 4 5 Suma
1 0,1 0,2 0 0,3 0,6
2 0,2 0,1 0,1 0 0,4
Suma 0,3 0,3 0,1 0,3 1
Hallar : E(x) ; E(y) ; Cov(x,y) ; x . y ; x.y
Piura mayo 2020
Dr. SPCV