9 Bidimensional
9 Bidimensional
ESTADÍSTICA BIDIMENSIONAL
1. INTRODUCCIÓN
La presentación de los datos así elaborados, forman una distribución bidimensional (si se trata
de atributos se denomina tabla de contingencia, y si se mezcla una variable con un atributo se
dice que es una bidimensional mixta) o ampliando el concepto a más variables, forman una
distribución multidimensional.
Figura 9.2.1
Tipos de distribuciones de dos variables, atributos o mixtas
Número de Número de
observaciones valores diferentes
Tipo I Pequeño Pequeño
Variables o atributos Tipo II Grande Pequeño
Tipo III Grande Grande
Se da cuando las observaciones efectuadas y los valores diferentes de las dos variables o las
modalidades diferentes de los dos atributos, son pocos. La organización de dichos datos, si se
201
trata de variables, se efectúa considerando valores ascendentes o descendentes y su
presentación en general, se efectúa tomando en cuenta dichos pares de valores registrados en
dos columnas de la forma general mostrada en la tabla 9.2.1, donde algunos valores de la
variable X pueden repetirse, pero con distinto valor de la variable Y, y viceversa:
Tabla 9.2.1
Distribución bidimensional (xi , yi) tipo I
xi yi
x1 y1
x2 y2
x3 y3
: :
xr ys
Ejemplo
Sea una variable bidimensional que relaciona unidades vendidas (miles de artículos) con
utilidades (miles de $us.) (ver tabla 9.2.2).
Tabla 9.2.2
Distribución bidimensional de utilidades vs. unidades vendidas
xi yi
(unidades) (Utilidades)
1 20
2 40
3 70
4 80
5 100
Fila 1: Cuando la empresa vendió 1000 unidades obtuvo 20000 $us de utilidades.
Fila 5: Cuando la empresa vendió 5000 unidades obtuvo 100000 $us de utilidades.
Esta distribución se presenta cuando las observaciones son muchas y pocos los valores
diferentes de las variables (o las modalidades de los atributos).
Los datos se organizan en un cuadro de doble entrada, de manera que en las filas se registren
los valores diferentes de la variable xi y en la columna se registren los valores diferentes de la
variable yj. El cuerpo de dicha tabla de doble entrada registra las veces que se repite el par
( x i , yi ) . Este número se denomina frecuencia absoluta bidimensional y se simboliza por nij.
202
El valor del universo, población o colectivo, es la suma de los valores de frecuencia absoluta
bidimensional, tal que:
r s
n = n ij
i=1 j=1
Tabla 9.2.3
Distribución bidimensional tipo II
yj y1 Y2 ... ys Total
xi
x1 n11 n12 ... n1s
x2 n21 n22 ... n2s
: : : : :
xr nr1 nr2 ... nrs
Total r s
n=
i=1 j=1
nij
Nota 1: En la distribución de frecuencias de una variable bidimensional tipo II, si en lugar de los
n ij
valores nij, se escriben h ij , se dice que es una distribución bidimensional de frecuencias
n
relativas.
i* j*
N i* j* = n ij
i=1 j=1
i* j*
H i* j* = h ij
i=1 j=1
203
Ejemplo
Sea la siguiente distribución bidimensional de frecuencias absolutas conjuntas (nij) (ver tabla
9.2.4):
Tabla 9.2.4
Bidimensional horas de TV al día vs. edad de los niños (nij)
yi 1 3 7 Total
xi
5 8 4 2 14
7 1 3 6 10
9 4 5 7 16
Total 13 12 15 40
Fila 1, columna 1: 8 de 40 niños tienen 5 años de edad y ven 1 hora de televisión al día.
Fila 3, columna 2: 5 de 40 niños tienen 9 años de edad y ven 3 horas de televisión al día.
Fila 2: 10 de 40 niños tienen 7 años.
Columna 2: 12 de 40 niños ven 3 horas de televisión al día.
Frecuencias relativas:
Tabla 9.2.5
Bidimensional horas de TV al día vs. edad de los niños (hij)
yi 1 3 7 Total
xi
5 20.0 10.0 5.0 35.0
7 2.5 7.5 15.0 25.0
9 10.0 12.5 17.5 40.0
Total 32.5 30.0 37.5 100.0
Fila 1, columna 1: El 20% de los niños tienen 5 años de edad y ven 1 hora de televisión al
204
día.
Fila 3, columna 2: El 12.5% de los niños tienen 9 años de edad y ven 3 horas de televisión al
día.
Fila 2: El 25% de los niños tienen 7 años.
Columna 2: El 30% de los niños ven 3 horas de televisión al día.
Tabla 9.2.6
Bidimensional horas de TV al día vs. edad de los niños (Nij)
yi 1 3 7
xi
5 8 12 14
7 9 16 24
9 13 25 40
Fila 2, columna 2: 16 de 40 niños tienen entre 5 y 7 años de edad y ven entre 1 y 3 horas de
televisión al día.
Fila 3, columna 2: 25 de 40 niños tienen como máximo 9 años de edad y ven a lo más 3
horas de televisión al día.
Tabla 9.2.7
Bidimensional horas de TV al día vs. edad de los niños (Hij)
yi 1 3 7
xi
5 20.0 30.0 35.0
7 22.5 40.0 60.0
9 32.5 62.5 100.0
Fila 2, columna 2: 40% de los niños tienen entre 5 y 7 años de edad y ven entre 1 y 3 horas
de televisión al día.
205
Fila 3, columna 2: 62.5% de los niños tienen como máximo 9 años de edad y ven a lo más 3
horas de televisión al día.
Ejemplo
Tabla 9.2.8
Distribuciones marginales de x y y
s
n xi = n ij
xi
j= 1
s
x1 n x1 = Σ n1j = n11 + n12 + . . . + n1s
j= 1
s
x2 n x2 = Σ n 2j = n 21 + n 22 + . . . + n 2s
j=1
: :
s
xr n xr = Σ n rj = n r1 + n r2 + . . . + n rs
j= 1
r s
n= n i= 1 j= 1
ij
r
n yj = n ij
yi
i= 1
r
y1 n y1 = Σ n i1 = n11 + n 21 + . . . + n r1
i=1
r
y2 n y2 = Σ n i2 = n12 + n 22 + . . . + n r2
i=1
: :
r
yr n ys = Σ206
n is = n1s + n 2s + . . . + n rs
i=1
r s
n= ni= 1 j= 1
ij
Fuente: Casa Aruta, Ernesto. Doscientos Problemas de Estadística Descriptiva, 1965.
207
Nota
de posición (moda)
Ejemplo
yi 1 3 7 Totales
xi
5 8 4 2 14
7 1 3 6 10
9 4 5 7 16
Totales 13 12 15 40
Resolución.
xi ni
5 14
7 10
9 16
40
yi ni
1 13
3 12
7 15
40
208
2.4. Distribución bidimensional tipo III
Esta forma de distribución se presenta cuando se han efectuado muchas observaciones y los
valores diferentes de la variable registrados son igualmente muchos.
Su organización, si se trata de presentar una distribución de frecuencias tipo III con intervalos
constantes para las dos variables, requiere:
Tabla 9.2.9
Distribución bidimensional tipo III
xi -1 - xi
xo - x1 n11 n12 n13 ... n1s
x1 - x2 n21 n22 n23 ... n2s
x2 - x3 n31 n32 n33 ... n3s
: : : : : :
xr-1 - xr nr1 nr2 nr3 ... nrs
Total r s
n = Σ Σ n ij
i= 1 j= 1
De la distribución bidimensional tipo III se obtienen dos distribuciones marginales tipo III.
209
En la UPB se hizo una encuesta a 50 estudiantes sobre el número de cigarrillos que consumen
al día (xi), y se los clasificó por edades (yi). Los datos recopilados fueron los siguientes:
xi: 1 11 15 6 0 3 12 10 6 5
yi: 19 20 20 19 18 20 19 18 20 19
xi: 2 0 1 6 0 2 4 2 5 11
yi: 20 19 20 18 20 19 20 19 20 18
xi: 1 8 4 6 7 5 7 1 10 3
yi: 20 18 19 20 19 18 20 20 20 19
xi: 0 1 5 3 4 3 10 13 2 2
yi: 20 19 20 20 20 20 19 18 20 18
xi: 0 15 2 14 4 1 5 4 8 4
yi: 20 18 20 19 20 18 19 20 20 19
Organice los datos en un cuadro bidimensional de frecuencias acumuladas relativas H i,j (%), de
forma de poder contestar:
a) ¿Qué porcentaje de los alumnos que tienen a lo más 19 años, consumen como máximo 10
cigarrillos?
b) ¿Qué porcentaje de los alumnos, tienen como máximo 20 años y consumen como máximo 5
cigarrillos?
Resolución
En este caso, como se debe contestar preguntas específicas, las dos variables son de
intervalos no constantes.
Rx = 15 - 0 = 15 Ry = 20 - 18 = 2
Establezca los intervalos de clase y su número según las exigencias del estudio o la
resolución del problema.
Tabla 9.2.10
Bidimensional consumo de cigarrillos diarios vs. edad (nij)
yi 18 19 20 Total
xi
0-5 4 10 18 32
210
5’ - 10 3 3 5 11
10’ - 15 3 2 2 7
Total 10 15 25 50
Tabla 9.2.11
Bidimensional consumo de cigarrillos diarios vs. edad (hij)
yi 18 19 20 Total
xi
0-5 8 20 36 64
5’ - 10 6 6 10 22
10’ - 15 6 4 4 14
Total 20 30 50 100
Tabla 9.2.12
Bidimensional consumo de cigarrillos diarios vs. edad (Hij)
yi 18 19 20
xi
0-5 8 28 64
5’ - 10 14 40 86
10’ - 15 20 50 100
Resultados.
a) 40% de los alumnos tienen como máximo 19 años y consumen como máximo 10 cigarrillos
al día.
b) 64% de los alumnos tienen 20 años y consumen como máximo 5 cigarrillos al día.
211
errores 0 2 1 0 3 1 0 1 2 1 3
examen B B N B N N B N N B N
errores 2 3 2 3 0 1 3 1 1 2 2
examen N M M M N M M N B N N
Resolución
Primero se debe tabular los datos en una distribución de frecuencias absolutas conjuntas
(ver tabla 9.2.13). Se tiene un atributo ordinal: clasificación del examen con tres
modalidades, y una variable discreta tipo II, con 4 valores diferentes de la variable; por lo
cual la bidimensional es mixta.
Tabla 9.2.13
Bidimensional clasificación de examen vs. errores cometidos (ni,j)
Luego se procede a determinar los cuadros faltantes y a responder a las preguntas (ver
tablas 9.2.14-16).
a) Con el cuadro ni,j, se puede saber que tres montadores de los 22, cometieron 3 errores y
obtuvieron una calificación de malo.
Tabla 9.2.14
Bidimensional clasificación de examen vs. errores cometidos (hi,j)
212
Fuente: Elaboración propia
b) Con el cuadro hi,j, se puede saber que el 18.18% de los montadores, obtuvieron una
calificación de normal y cometieron 1 error.
213
Tabla 9.2.15
Bidimensional clasificación de examen vs. errores cometidos (Ni,j)
c) Con el cuadro Ni,j, se puede saber que 5 de los 22 trabajadores cometieron no más de un
error y obtuvieron una nota de bueno.
Tabla 9.2.16
Bidimensional clasificación de examen vs. errores cometidos (Hi,j)
d) Con el cuadro Hi,j, se puede saber que el 68.18% de personas obtuvieron en su examen una
calificación de por lo menos normal y cometieron como máximo 2 errores.
3. COVARIANZA
3.1. Definición
Si es positiva, se dice que existe relación directa entre las variables (aumento o disminución
en x implica aumento o disminución en y).
Cuanto más alejado esté el valor de la covarianza hallado de cero, la relación entre las
variables será más intensa.
214
3.2. Determinación
a) Tipo I
(x i x )( yi y)
Sxy i 1
n
Sxy
(x i x )( yi y)
(x i y i y x i x y i x y)
x i yi
y
x i
x
y i
nx y
n n n n n n
Sxy
x i yi
yx xy x y
x i yi
yx
x i yi xi
yi
n n n n
n
Sxy
x i yi xi
yi
n n
n
Ejemplo
Sea una variable bidimensional tipo I que relaciona unidades vendidas (miles de artículos) con
utilidades (miles de $us.):
xi yi
(unidades) (Utilidades)
1 20
2 40
3 70
4 80
5 100
Resolución
Con ayuda de la tabla bidimensional tipo I, se obtienen las sumatorias adecuadas, según la
ecuación para hallar la covarianza (ver tabla 9.3.1):
215
Tabla 9.3.1
Cálculo de la covarianza en distribuciones tipo I: Utilidades vs unidades vendidas
xi yi xi*yi
1 20 20
2 40 80
3 70 210
4 80 320
5 100 500
15 310 1130
1130 15 310
Sxy 40
5 5 5
Conclusión: Como el valor de la covarianza es positivo y está alejado del cero, se puede decir
que existe una relación directa intensa entre las unidades vendidas y las utilidades de la
empresa.
b) Tipo II o III
(x x) * ( y y ) * n
i 1
i i i
Sxy =
n
Para cálculos:
Sxy
x i yi n i xi ni
y i n i
n n n
Ejemplo
yi 1 3 7 Total
xi
5 8 4 2 14
7 1 3 6 10
9 4 5 7 16
Total 13 12 15 40
216
Donde:
Resolución
Tabla 9.3.2
Cálculo de la covarianza en distribuciones tipo II: horas de TV vs edad
xi yi ni xi * ni yi * ni xi * yi * ni
5 1 8 40 8 40
5 3 4 20 12 60
5 7 2 10 14 70
7 1 1 7 1 7
7 3 3 21 9 63
7 7 6 42 42 294
9 1 4 36 4 36
9 3 5 45 15 135
9 7 7 63 49 441
40 284 154 1146
Se realizan los siguientes cálculos: xi*ni, yi*ni, xi*yi*ni en las columnas (4), (5) y (6)
respectivamente.
Se reemplazan los valores hallados en la ecuación:
Conclusión: Como la covarianza es positiva, pero el valor es cercano a cero, se puede decir
que existe una relación directa débil entre la edad de los niños y las horas que ven televisión al
día.
Cuando entre dos atributos no existe ninguna influencia mutua, se dice que son
independientes. En caso contrario se dice que hay asociación o dependencia.
Para fundamentar, aunque sea de una forma simple el razonamiento que sigue, vamos a
suponer una distribución de dos atributos cada uno de los cuales toma dos modalidades
distintas (ver tabla 9.3.3):
217
Tabla 9.3.3
Distribución bidimensional de atributos o mixtas
A a1 a2 Total
B
b1 n11 n21 ni1
b2 n12 n22 ni2
Total n1i n2i n
n 11 n 21
n 1i n 2i
i i
n 21 n 11 n 21 n i1
i
n 2i
i
n 1i n 2i
i i
n
y finalmente que:
n n 2i i1
n 21 i i
De otra forma, diremos que existirá independencia entre dos modalidades a y b cuando:
na nb
n ab
n
siendo aquí nab el número de elementos que poseen las dos modalidades a y b conjuntamente,
na el número de los que poseen la modalidad a y nb el de los que poseen la modalidad b.
Téngase en cuenta que no es necesario que dicha igualdad se cumpla estrictamente: desde el
punto de vista estadístico, basta con que la diferencia entre los dos miembros sea
relativamente pequeña.
218
na nb
n ab 0
n
y negativo si:
na nb
n ab 0
n
atracción
n n
n ab a b : independencia
n
repulsión
Ejemplo
Se realizó una encuesta a 30000 habitantes de una determinada ciudad. Se obtuvo la siguiente
distribución en cuanto a su estado civil y sexo (ver tabla 9.3.4).
Tabla 9.3.4
Bidimensional de estado civil vs sexo
Resolución
Se realizan los cálculos correspondientes, para cada combinación de modalidades entre los
dos atributos.
(14743)(16436)
n M S (8052) 8077 (independiente)
30000
(14743)(11804)
n M C (5815) 5801 (independiente)
30000
(14743)(1760)
n M V (542) 865 (repulsión)
30000
219
(15257)(16436)
n FS (8384) 8359 (independiente)
30000
(15257)(11804)
n FC (5989) 6003 (independiente)
30000
(15257)(1760)
n F V (1218) 895 (atracción )
30000
Nota: El método usado sirve únicamente para conocer la independencia o el tipo de asociación
existente entre dos modalidades cualquiera, perteneciente cada una de ellas a un atributo
observado empíricamente. Para conocer la existencia de independencia o asociación entre dos
atributos es necesario recurrir a otro método distinto que haga intervenir todas las frecuencias
absolutas conjuntas, que se denomina “prueba de independencia de atributos Chi-Cuadrada”,
pero que no se puede exponer aquí, por falta de nociones de Estadística Inferencial.
Sea un experimento aleatorio “E” que tiene un espacio muestral “S”, donde sus resultados
posibles se organizan atendiendo a dos criterios de ordenación (x i, yj). La presentación de estos
resultados se efectúa en un cuadro de doble entrada, donde nij indica el número de veces que
aparece el par (xi, yj); en consecuencia, una distribución bidimensional de probabilidades se
presenta en la siguiente forma general:
yj y1 y2 ... ys Total
xi
x1 n11 n12 ... n1s
x2 n21 n22 ... n2s
: : : : :
xr nr1 nr2 ... nrs
Total r s
n= n
i= 1 j= 1
ij
n ij Casos favorables
donde: P ij = =
n Casos posibles
Pij se lee como probabilidad del evento (xi, yj), que es la probabilidad conjunta; es decir la
probabilidad de que los sucesos xi y yi ocurran al mismo tiempo.
s
P ( x i ) = P ( x i, y j ) = n i1 + n i2 + n i3 + . . . + n is
j=1 n n n n
P( x i ) P( x i , y1 ) P( x i , y 2 ) P( x i , y s )
r
n1j n 2j n 3j n
P ( y j ) = P ( x i, y j ) = + + + . . . + rj
i=1 n n n n
P( y j ) P( x 1 , y j ) P( x 2 , y j ) P( x r , y j )
Se busca determinar la probabilidad de la unión de dos sucesos. Según que los sucesos sean
mutuamente excluyentes o no, la regla de la adición se determina de las dos siguientes formas:
P ( x y) P ( x ) P ( y)
P ( x y) P ( x ) P ( y) P ( x , y)
Nota: Para resolver problemas de adición de eventos en general, debe utilizarse la regla
correspondiente a dos sucesos cualesquiera, salvo que se tenga como dato que los sucesos
sean mutuamente excluyentes.
Para entender mejor la regla de adición de eventos se usan los diagramas de Venn
(investigador inglés, 1834-88), que son representaciones gráficas de los resultados de un
experimento aleatorio. Para elaborar un diagrama de Venn, se representa al espacio muestral
por un rectángulo, mientras que los eventos aparecen como regiones dentro del rectángulo,
generalmente en forma de círculos.
221
Las regiones sombreadas de los cuatro diagramas de Venn de la figura 9.4.1, representan
respectivamente: el evento A, su complemento, la unión de los eventos A y B y la intersección
de A y B (para sucesos que no son mutuamente excluyentes y para los que si son).
A
A
S S
A A’
A y A’ son mutuamente excluyentes
A B A B
S S
AB AB
A y B no son mutuamente excluyentes
A B A B
S S
AB AB
A y B son mutuamente excluyentes
El lector puede darse cuenta por qué en la suma de dos eventos que no son mutuamente
excluyentes, se debe restar la intersección (se estaría sumando dos veces el área sombreada).
Ejemplo
222
Resolución.
No se utilizan los dos diagramas del medio, ya que los eventos son mutuamente excluyentes,
suponiendo que los dos cursos estén programados a la misma hora y en las mismas fechas.
Dados dos sucesos o eventos xi, yj se define la probabilidad condicional cuando se busca
determinar la probabilidad del evento xi dado el evento yj; es decir, la probabilidad de que
ocurra un evento xi, ya que se sabe de antemano que ocurrió el evento yi.
P (x , y )
P (x /y ) = Si P(y) > 0
P (y )
P (x , y )
P (y /x ) = Si P(x) > 0
P (x )
a) Sucesos dependientes
Despejando las dos formas que expresan la probabilidad condicional y la probabilidad conjunta
se tiene:
P ( x , y ) P ( y) P ( x / y) (1)
P( y, x ) P( x ) P( y / x ) (2)
o mejor: P ( x , y ) P ( y) P ( x / y) P ( x ) P ( y / x ) (3)
223
b) Sucesos independientes
Si P( y / x ) P2 ( y) (4)
y P( x / y) P1 ( x ) (5)
P ( x , y) P ( x ) P2 ( y) P1 ( x ) P ( y)
y i y1 , y 2 , , y s
s
P (x ) = P (x, y1) + P (x, y 2) + P (x, y 3) + . . . + P (x, y s) = P (x, y j)
j=1
Permite determinar la probabilidad de las hipótesis y j dado el evento xi. Se expresa en forma de
una probabilidad condicional de la siguiente manera:
P (x i , y j ) P (y j ) * P (x i / y j )
P (y j / xi ) = = s
P (x i )
P ( y ) * P (x
j=1
j i /yj )
224
4.8. Ejemplo
Mediante el siguiente ejemplo se mostrará el cálculo de probabilidades usando todas las reglas
anteriores.
Sea Ai = estrato de votantes: joven, adulto y viejo; B j = partidos que participan en elecciones:
MNR, MIR, MBL. Mediante encuesta se ha determinado la siguiente distribución (ver tabla
9.4.1):
Tabla 9.4.1.
Bidimensional preferencia por partidos políticos vs. edad
13 9 0 22
P(V MBL) = + = = 0.55
40 40 40 40
P (x , y )
P (x /y ) = Si P(y) > 0
P (y )
225
P (A, MNR )
P (A /MNR ) =
P (MNR )
7
P (A, MNR ) =
40
15
P(MNR) =
40
Reemplazando valores:
7
7
P (A /MNR ) = 40 = = 0.47
15 15
40
Conclusión: La probabilidad de ser adulto dado que es del MNR es del 47%.
3
P (x ) = P (x, y j )
j=1
3
P (x ) = P ( y j ) * P (x / y j )
j=1
Conclusión: Por lo tanto se verifica que la probabilidad de ser del MIR no es 15/20 sino 16/40.
226
En términos de las modalidades de la distribución:
P(J, MIR) = [ P(J, MIR) + P(A, MIR) + P(V, MIR) ] * [ P(J / MIR) ]
6 3 7 6 16 6 6
=[ + + ] *[ ] = * =
40 40 40 16 40 16 40
Conclusión: No es cierto que la probabilidad de ser joven y del MIR sea 7/40. Su resultado es
6/40.
5) Demuestre que la probabilidad de ser adulto dado que es del MBL es de 5/9.
P (x i y j ) P ( y j ) * P (x i / y j )
P (y j /x i ) = = s
P (x i )
P (y
j=1
j ) * P (x i / y j )
P (MBL, A )
P (A /MBL ) =
P (MBL )
15 5 5
( )( )
5
P (A /MBL ) = 40 15 = 40 =
9 9 9
40 40
Conclusión: Se verifica que la probabilidad de ser adulto dado que es del MBL es de 5/9.
Ejemplo 1
Sea Ai = estrato de votantes: joven, adulto y viejo; B j = partidos que participan en elecciones:
MNR, MIR, MBL. Mediante encuesta se ha determinado la siguiente distribución:
En primer lugar se dará un instructivo de lo que significa cada rama de un diagrama de árbol y
cómo hallar las probabilidades.
Las primeras ramas del árbol presentan sucesos aleatorios que tienen probabilidades
marginales. Se puede comenzar por cualquier clasificación. Para diagramarlas debe hacerse
esta pregunta: Si se selecciona al azar una persona de entre las 40, ¿cuál es la clasificación
de su edad?
Las segundas ramas de árbol son sucesos dependientes que presentan probabilidades
condicionales. Para diagramarlas debe hacerse la siguiente pregunta: habiendo determinado
la edad de la persona elegida al azar, ¿de qué partido es?
228
P. totales
Ejemplo 2
88.24 0
21-41 1
42.39 4.22
2
90.07 0
39.87
7.00
41’-61 1
2
0
6.72
61’-71 1
2.96
2
Fuente: Elaboración propia
229
El administrador quiere estimar cuantas personas de cada categoría existirán, si este año hay
4194 nuevos conductores.
Resolución
En primer lugar, se pueden determinar las probabilidades del arboligrama que faltan, sabiendo
que la suma de probabilidades de eventos mutuamente excluyentes debe ser de uno.
Haciendo uso de las reglas de cálculo de probabilidades, se procede a hallar el valor de cada
variable.
N
P(21 41) 0.4239 N 0.4239(4194) 1778
4194
O 0.3987(4194) 1672
A A
P(0 / 21 41) 0.8824 A 0.8824(1778) 1569
N 1778
230
D 0.0754(1778) 134
B 0.9007(1672) 1506
E 0.007(1672) 117
H 1672 1506 117 49
C 0.9032(744) 672
F 0.0672(744) 50
I 744 672 50 22
Por último los totales de columna se obtienen sumando los valores de cada columna:
Tabla 9.5.1
Bidimensional del número de accidentes vs. edad
231
6. GENERALIZACIÓN DE LAS REGLAS PARA EL CÁLCULO DE
PROBABILIDADES
Se han mostrado las reglas para el cálculo de probabilidades cuando se tiene una distribución
bidimensional. Sin embargo se puede presentar el caso en el que existan ya no dos sino tres o
más clasificaciones. Para este tipo de problemas, se deberán generalizar las reglas para el
cálculo de probabilidades, para lo cual se considera un árbol que tiene tres ramificaciones o
eventos dependientes, cada uno de los cuales tiene dos resultados posibles (ver figura 9.6.1):
P. condicional P. conjuntas
P. condicional P(E/A,C)
E P(A, C, E) P(A) P(C / A) P(E / A, C)
P. marginal P(C/A) C
P(F/A,C) F P(A, C, F) P(A) P(C / A) P(F / A, C)
A
P(A) P(E/A,D) E P(A, D, E) P(A) P(D / A) P(E / A, D)
P(D/A) D
P(F/A,D) F P(A, D, F) P(A) P(D / A) P(F / A, D)
El lector puede darse cuenta qué pasaría si existen 4 eventos dependientes (en la cuarta
ramificación también se tendrían probabilidades condicionales).
Regla de la suma:
La suma de tres eventos dependientes, por ejemplo de los tres primeros, será:
232
Figura 9.6.2. Diagrama de Venn para tres eventos
X Y
2
7 5
1
4 3
6
8
Z
S
Ejemplo 1
a) Zona 3.
b) Zonas 1 y 2.
c) Zonas 4, 6, 7 y 8.
Resolución.
a) Puesto que esta zona parte de Y y Z, pero no de X, representa el evento de que en el día de
campo se servirá cerveza y torta de chocolate, pero no hamburguesas.
b) Ya que esta zona pertenece tanto a X como a Y, representa el evento de que se servirán
hamburguesas y cerveza
c) Dado que estas zonas son ajenas a Y, constituye el evento de que no se servirá cerveza.
Ejemplo 2
Con base en el siguiente diagrama de Venn (ver figura 9.6.3), sea A el evento de que un
ejecutivo de alto rango de una compañía esté en la cafetería de su empresa, B el evento de
que se encuentre en la oficina de otro ejecutivo y C el evento de que se encuentre jugando al
golf con un cliente. Halle la probabilidad de que una persona en un momento específico lo
encuentre en alguno de esos tres lugares.
233
Figura 9.6.3. Diagrama de Venn para encontrar a un ejecutivo
A B
0.24 0.06 0.19
0.04
0.16 0.11
0.09
C
S
Fuente: Freund y Simon. Estadística Elemental, 1994.
Resolución.
Reemplazando valores:
Respuesta: La probabilidad de que una persona encuentre al ejecutivo en alguno de los tres
lugares es del 23%.
Acción: Como la probabilidad es pequeña, si una persona quiere encontrarlo lo más lógico es
buscarlo en otros sitios, como su oficina o la sala de reuniones de la empresa.
234
Tabla 9.7.1
Función de cuantía conjunta
y y1 y2 ... ys Total
j
xi
x1 P11 P12 ... P1s P1j
x2 P21 P22 ... P2s P2j
: : : : : :
xr Pr1 Pr2 ... Prs Prj
Total Pi1 Pi2 … Pis r s
P
i =1 j =1
ij 1
Nota 1: También se puede dar una distribución de probabilidades para atributos o mixtos.
Nota 2: Las distribuciones marginales, cuya denominación deriva del simple hecho de que se
encuentran en los márgenes de la tabla de doble entrada, como cualquier otra distribución
unidimensional, son susceptibles de tratamiento estadístico individual.
Ejemplo
Se realizó una encuesta a 30000 habitantes de una determinada ciudad. Se obtuvo la siguiente
distribución en cuanto a su estado civil y sexo.
Para hallar las probabilidades conjuntas, simplemente se divide cada frecuencia absoluta
conjunta entre el total de encuestados. Para hallar las probabilidades marginales, se suman
las probabilidades conjuntas halladas (ver tabla 9.7.2).
Tabla 9.7.2
Bidimensional de probabilidades de estado civil vs sexo (Pi, j)
PM,S = 26.84, significa: Existe una probabilidad del 26.84% de que una persona elegida al azar
sea de sexo masculino y soltero.
PV = 5.87, significa: Hay una probabilidad del 5.87% de que la persona elegida al azar sea
viuda.
PF = 50.86, significa: La probabilidad de que una persona elegida al azar sea de sexo femenino
es de 50.86%.
a) f (x, y) 0
b)
f (x, y) dx dy 1 ; para: x y y
Luego: 0 f (x, y) 1
f 1 (x ) = f (x, y ) dy
distribución marginal de "x"
f 2 (y ) = f (x, y ) dx
distribución marginal de "y"
x o y0
F ( x o, y o ) = f (t , t
1 2 ) dt 1 dt 2
Para expresar la probabilidad de que la variable xi esté en el par (x1, y1) y que la variable yj esté
236
en el par (x2, y2) en términos de la función de distribución, se procede de la siguiente manera:
En cada eje se representan los valores del par (a1,b1) y del par (a2,b2).
Gráfico 9.7.1
Área bajo la función de densidad de probabilidad
yj
(a1, a2)
(b1, a2)
a2
a1 b1 xi
P(a1 < x < b1 ; a2 < y < b2) = F(b1 , b2) - F(b1 , a2) - F(a1 , b2) + F(a1 , a2)
b1 b2
a1 a2
f (x, y) dx dy
f (x, y )
(1 ) f (x /y ) = si f 2 (x ) > 0
f 2 (y )
f (x, y )
(2 ) f (y /x ) = si f 1 (x ) > 0
f 1 (x )
Ejemplo 1
Suponga que la función de densidad de probabilidad conjunta para las variables no negativas x
e y es f (x, y) xe x e y . Halle la probabilidad que 0 x 1 y 0 x 2 .
Resolución
237
La integral a resolver es la siguiente:
1 2
P(0 x 1;0 y 2) xe x e y dy dx
0 0
2
y 2 1 e2 1
y 2
e dy e e 1 2 1 2
0 0 e e
e2 1 1 x e2 1 x 1
1
e2 1 1
e 2 0 0
x x x
xe dx e 2 xe e dx xe e
0 e 2 0
e2 1 e 2 1 2 e2 1 e 2
e2 2e 1
1
e2 e 1 e 2 e 0.2285
Ejemplo 2
Suponga que x representa el tiempo (en minutos) que una persona pasa con un agente
mientras elige una póliza de seguro de vida e y el tiempo que el agente emplea en hacer el
papeleo una vez que el cliente se ha decidido. Usted acuerda encontrarse con un agente de
seguros para suscribir una póliza de seguro de vida. Si la función de densidad de probabilidad
conjunta de x e y es:
1 30x 10y
f (x, y) e e
300
Halle la probabilidad de que la operación requiera más de media hora.
Resolución.
30 Región:
y 30 x
30 238
Se plantea la integral:
30 30 x 1 30x 10y
P(x y 30) e e dy dx
0 0 300
Se resuelve:
30 x
10 30 30x 10y 1 30 30x x10
30
300 0
e e dx e e 1 dx
0
30 0
30
1 30 2x3090 30
x
1 30 2x3090
x
e dx e dx e
30
30 e
30
30 0 0
30 2 0
1 1 1
3 1 0.4730
2e 2e e
Acción: Si usted no tiene disponibilidad de media hora, entonces vuelva a programar su cita
para obtener una póliza de seguro de vida.
8.1. Introducción
Los problemas con pocas alternativas y estados de la naturaleza pueden ser analizados
usando tablas de decisión. Ahora iremos un paso más adelante en la exploración de la teoría
de la decisión, introduciendo los tópicos de árboles de decisión, valoración de probabilidades y
teoría de la utilidad.
Cualquier problema que puede ser presentado en una tabla de decisión, también puede ser
ilustrado gráficamente en un árbol de decisión. Tomemos otra visión al caso de la compañía
maderera Thompson. Podemos recordar que John Thompson estaba tratando de decidir si le
1 Esta porción ha sido extractada totalmente del libro: Quantitative Analysis for Management.
Render y Stair, 1997.
239
convenía expandir su operación construyendo una nueva planta para la producción de cabañas
de almacenamiento. Un árbol de decisión simple para representar la decisión de John es
mostrado en la figura 9.8.1.
Beneficios
EMV=10000 $
Nodo de estado de
la naturaleza Mercado favorable (0.5)
200000 $
Nodo de decisión
1 Mercado desfavorable (0.5)
Construir planta -180000 $
grande
Mercado favorable (0.5)
100000 $
Construir planta
pequeña 2
Mercado desfavorable (0.5)
-20000 $
No hacer nada
EMV=40000 $
0$
Note que los beneficios están localizados en el lado derecho de cada una de las ramas del
árbol de decisión. Las probabilidades son localizadas en paréntesis a continuación de cada
estado de la naturaleza. Los valores monetarios esperados para cada nodo de estado de la
naturaleza están calculados y localizados en sus respectivos nodos. El EMV del primer nodo es
10000 $. Esto representa la rama del nodo de decisión de construir una planta grande. El EMV
para el nodo 2, construir una planta pequeña, es 40000 $. No construir nada, por su puesto
tiene un beneficio de 0 $. Es escogida la rama que tiene el nodo de estado de la naturaleza que
contiene el mayor EMV. En el caso de Thompson, se escoge construir una planta pequeña.
Cuando se necesita realizar una secuencia de decisiones, los árboles de decisión son
herramientas mucho más poderosas que las tablas de decisión. Digamos que John Thompson
tiene que realizar dos decisiones, y la segunda depende del resultado de la primera. Antes de
decidir si construir una nueva planta, John tiene la opción de llevar a cabo su propio estudio de
investigación de mercado, a un costo de 10000 $. La información de su estudio podría ayudarlo
a decidir si construir una planta grande, pequeña o no hacer nada. Él reconoce que este
estudio de mercado no le proveerá una información perfecta, pero puede ayudarlo un poco de
cualquier manera.
Examinando el árbol, vemos que el primer punto de decisión de Thompson es si llevar a cabo o
no el estudio de mercado de 10000 $. Si escoge no hacer el estudio (La parte baja del árbol),
puede construir una planta grande, pequeña o no hacer nada. Este es el segundo punto de
decisión de John. El mercado puede ser favorable (0.5 de probabilidad) o desfavorable (0.5) si
construye. Los beneficios para cada consecuencia posible están listados en el lado derecho.
De hecho, la porción más baja del árbol de decisión es idéntica al árbol de decisión simple
mostrado en la figura 1. ¿Por qué es así?
Note que hay un 27% de probabilidad de que el mercado para cabañas sea favorable dado que
los resultados de la encuesta resulten negativos. Hay una probabilidad mucho más alta de 0.73
que el mercado sea desfavorable dado que el estudio de mercado fue negativo.
Finalmente, cuando observamos la columna de los beneficios, vemos que el costo del estudio
de mercado (10000 $) ha sido sustraído de cada una de las 10 ramas de arriba. Una planta
grande con un mercado favorable debería normalmente arrojar un beneficio neto de 200000 $,
pero debido a que fue realizado un estudio de mercado, éste se reduce a 190000 $. Se
procede de manera similar en las otras 9 ramas.
Con todas las probabilidades y beneficios especificados, podemos comenzar a calcular el valor
monetario esperado de cada una de las ramas. Comenzamos por el final, o del lado derecho
del árbol y trabajamos hacia atrás hacia el origen. Cuando terminemos, la mejor decisión será
conocida.
El EMV de no construir una planta es –10000 $ para esta rama. Entonces, si el resultado de la
encuesta es favorable, debería construir una planta grande.
El EMV de no construir una planta es –10000 $ para esta rama. Entonces, dado un resultado
negativo en el estudio de mercado, John debería construir una planta pequeña, con un valor
esperado de 2400 $.
3. Continuando en la parte superior del árbol y moviéndose hacia atrás, calculamos el valor
esperado de llevar a cabo el estudio de mercado.
242
4. Si la encuesta de mercado no es llevada a cabo:
Entonces, construir una pequeña planta es la mejor elección, dado que el estudio de mercado
no ha sido realizado.
5. Puesto que el valor monetario esperado de llevar a cabo la encuesta es 49200 $ versus un
EMV de 40000 por no llevar a cabo el estudio, la mejor elección es buscar información del
mercado. Si los resultados de la encuesta son favorables, John debería construir una planta
grande; pero si la investigación es negativa, debería construir una pequeña.
En la figura 2, los valores esperados han sido localizados en el árbol de decisión. Note que los
pares de líneas // cruzando una rama indica que la alternativa ha sido eliminada. Esto es
debido a que su EMV ha sido más bajo que la mejor alternativa.
Con el estudio de mercado que llevó a cabo, John Thompson sabe que es mejor decisión
construir una planta grande si el estudio es favorable o una planta pequeña si la encuesta
resulta negativa; pero John sabe que realizar un estudio de mercado no es gratis. Sería bueno
saber cuál es el valor verdadero de realizar el estudio de mercado. Una forma de medir el valor
de la información del mercado es calcular el valor esperado de la información muestral (EVSI).
En el caso de John, su EMV debería ser 59200 $ si no se hubiera sustraído los 10000 $ del
estudio de cada beneficio. El EMV de no obtener la información muestral es de 40000 $.
Entonces:
Esto significa que John podría haber pagado hasta 19200 $ por un estudio de mercado y aún
salir adelante. Puesto que sólo le costó 10000 $, la encuesta valió la pena.
El enfoque del teorema de Bayes establece que el tomador de decisiones no conoce con
certeza qué estado de la naturaleza ocurrirá. Esto permite al administrador revisar sus
valoraciones de probabilidad iniciales. Las probabilidades revisadas, son llamadas
probabilidades posteriores.
P ( MF / positivo ) 0.78
P(MD / positivo) 0.22
P( MF / negativo) 0.27
P( MD / negativo) 0.73
Mostraremos cómo John Thompson podría derivar esos valores con el teorema de Bayes.
Tabla 9.8.1
Probabilidades condicionales para la maderera Thompson
Estados de la naturaleza
Resultados de la encuesta
Mercado favorable (MF) Mercado desfavorable (MD)
Positivo (predice mercado P ( positiva / MF) 0.70 P(positiva / MD) 0.20
favorable para el producto)
Negativo (predice resultado P(negativa / MF) 0.30 P(negativa / MD) 0.80
desfavorable para el producto)
Recordemos que sin ninguna información de mercado, los mejores estimados de John de un
mercado favorable o desfavorable son:
244
P( MF) 0.50
P( MD) 0.50
Positivo
0.70
MF
0.5
0.30
Negativo
0.20 Positivo
0.5
MD
0.80
Negativo
Podemos ahora calcular las probabilidades posteriores o revisadas de Thompson. Éstas son
las inversas de las probabilidades de la tabla 9.8.1.
0.5(0.7)
P( MF / positivo) 0.78
0.5(0.7) 0.5(0.3)
0.5(0.2)
P( MD /´positivo) 0.22
0.5(0.7) 0.5(0.3)
0.5(0.3)
P(MF / negativo) 0.27
0.5(0.3) 0.5(0.8)
0.5(0.8)
P(MD / negativo) 0.73
0.5(0.3) 0.5(0.8)
MF
0.78
Estas probabilidades se pueden resumir en el siguiente arboligrama:
Positivo
0.45
0.22
MD
245
0.27 MF
0.55
Negativo
0.73
MD
Las probabilidades posteriores ahora proveen a John Thompson estimados de cada estado de
la naturaleza si los resultados de la encuesta son positivos o negativos.
Hemos usado el EMV para realizar decisiones. En la práctica, sin embargo, el uso del EMV
puede conducir a malas decisiones en muchos casos. Por ejemplo, suponga que es el feliz
propietario de un cartón de lotería. Después de 5 minutos una simple moneda puede ser
lanzada, y si sale cruz podrías ganar 5 millones, pero si sale cara, podrías no ganar nada. Justo
un momento antes, una persona rica te ofrece 2 millones por tu boleto. Vamos a asumir que no
tienes dudas sobre la validez de la oferta. La persona te dará un cheque certificado por la
cantidad, y estás absolutamente seguro que el cheque tiene fondos.
Un árbol de decisión es mostrado en la figura 9.8.3. El EMV dice que deberías retener tu
boleto, pero ¿qué deberías hacer realmente? Solo piensa, 2 millones asegurados versus un
50% de probabilidad de no obtener nada. Haz la suposición que tú eres lo suficientemente
codicioso para retener tu boleto, y luego pierdes. ¿Cómo lo explicarías a tus amigos? ¿Acaso
no debería ser suficiente 2 millones para estar confortable por un tiempo?
Aceptar la
2000000 $
oferta
Cruz (0.5)
0$
Rechazar la
1 Cara (0.5)
oferta
5000000 $
EMV=2500000 $
p
Mejor resultado
Utilidad 1
Alternativa 1
1-p
Peor resultado
Utilidad 0
Ahora, todo lo que tenemos que hacer es determinar el valor de la probabilidad p, que hace que
seas indiferente entre las alternativas 1 y 2. Para establecer esta probabilidad debes estar
conciente que la valoración de la utilidad es completamente subjetiva. Esto es un valor
establecido por el tomador de decisión que no puede ser medida en una escala objetiva.
Veremos un ejemplo.
Jane Dickson quiere construir una curva de utilidad que revele su preferencia por su dinero
entre 0 y 10000 $. Una curva de utilidad es una gráfica que relaciona el valor de la utilidad
versus el valor monetario. Ella puede invertir su dinero en una cuenta de banco o puede invertir
el mismo dinero en un bien inmueble.
Si el dinero es invertido en el banco, en tres años Jane debería tener 5000 $. Si invierte en
bienes raíces, después de tres años ella podría no tener nada o 10000 $. Jane sin embargo, es
muy conservadora. Si bien hay un 80% de probabilidad de conseguir 10000 $ de los bienes
raíces, Jane podría preferir tener su dinero en el banco, dónde está seguro. Lo que Jane hizo
aquí es asegurar su utilidad de 5000 $. Cuando hay un 80% de probabilidad (esto significa que
p es 0.8) de conseguir 10000 $, Jane es indiferente entre poner su dinero en bienes raíces y
ponerlo en el banco. La utilidad de Jane de 5000 $ es entonces igual a 0.8, que es la misma
que el valor para p. Esta valoración de la utilidad está mostrada en la figura 9.8.5.
247
P = 0.8
10000 $
U=1
Invertir en
Bienes raíces 1-p = 0.2
0$
U=0
Invertir en el 5000 $
banco U = p = 0.8
Otro valor de la utilidad puede ser valorado de la misma manera. Por ejemplo, ¿cuál es la
utilidad de Jane para 7000 $? ¿Cuál es el valor de p que haría que Jane sea indiferente entre
7000 $ y el riesgo que podría resultar de 10000 $ o 0 $? Para Jane, existe una probabilidad del
90% de conseguir los 10000 $. Por otro lado, ella preferiría tener los 7000 $ asegurados.
Entonces, su utilidad para 7000 $ es 0.9. La utilidad de Jane para 3000 $ puede ser
determinada de la misma manera. Si había un 50% de probabilidad de obtener los 10000 $,
Jane debería ser indiferente entre tener 3000 $ asegurados y tomar el riesgo de ganar 10000 $
o nada. Entonces la utilidad de 3000 $ para jane es 0.5. Por supuesto, este proceso puede
continuar hasta que Jane ha valorado su utilidad para tantos valores monetarios como ella
quiera. Sin embargo, estas valoraciones son suficientes para determinar una idea de los
sentimientos de Jane hacia el riesgo. De hecho, podemos graficar estos puntos en una curva
de utilidad, como se muestra en la gráfico 9.8.1.
1 1
0.9 0.9
0.8 0.8
0.7
0.6
Utilidad
0.5 0.5
0.4
0.3
0.2
0.1
0 0
0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000
Valor monetario
El gráfico 9.8.2 ilustra a una persona que es un buscador del riesgo, en oposición a una que es
adversa al riesgo. Este tomador de decisiones consigue más utilidad de un gran riesgo y más
248
alto beneficio potencial. A medida que el valor monetario se incrementa en su curva de utilidad,
la utilidad incrementa a una tasa ascendente. Una persona que es indiferente al riesgo tiene
una curva de utilidad que es una línea recta. La forma de la curva de utilidad de una persona
depende de la decisión específica que está siendo considerada, el trasfondo psicológico de la
persona, y los sentimientos acerca del futuro. Puede darse que tengas una curva de utilidad
para algunas situaciones y curvas muy diferentes para otras.
1
0.9
0.8
0.7
Utilidad
0.6
0.5
0.4
0.3
0.2
0.1
0
0 2000 4000 6000 8000 10000
Valor monetario
Después que la curva de utilidad ha sido determinada, los valores de utilidad de la curva son
usados para realizar decisiones. Los valores o resultados monetarios son reemplazados con
los valores apropiados de la utilidad y entonces es desarrollado el análisis de decisión usual.
Veamos un ejemplo.
Mark Simkin ama el riesgo. El decide jugar un juego que consiste en lanzar una chincheta al
aire. Si el punto sobre la chincheta está orientado al cielo, Mark gana 10000 $. Si el punto
sobre la chincheta está abajo, pierde 10000 $. ¿Debe Mark jugar el juego (alternativa 1) o no
(alternativa 2)?
Las alternativas 1 y 2 son desplegadas en el árbol mostrado en la figura 9.8.6. Como se puede
observar la alternativa 1 consiste en participar en el juego. Mark cree que hay 45% de
probabilidad de ganar 10000 $ y un 55% de perder 10000 $. La alternativa 2 es no participar en
el juego. ¿Qué debe hacer Mark? Por supuesto, esto depende de la utilidad de Mark hacia el
dinero. Como establecimos previamente él ama el riesgo. Usando el procedimiento descrito
anteriormente, Mark es capaz de construir una curva de utilidad mostrando su preferencia hacia
el dinero. Esta curva aparece en el gráfico 9.8.3.
249
Alternativa 2 0$
No jugar
Figura 9.8.6. Orientación de la decisión de Mark Simkin
0.6
0.5
0.4
Utilidad
0.3 0.3
0.2
0.15
0.1
0.05
0 0
-20000 -10000 0 10000 20000
Valor monetario
Podemos ver que la utilidad de Mark para –10000 $ es 0.05, su utilidad por no jugar (0 $) es de
0.15, y su utilidad para 10000 $ es de 0.30. Esos valores pueden ser usados en el árbol de
decisión. El objetivo de Mark es maximizar su utilidad esperada, que peude calcularse como
sigue:
Paso 1.
U (10000 $) 0.05
U (0 $) 0.15
U (10000 $) 0.30
Paso 2. Reemplazar los valores monetarios con valores de utilidad. Refiriéndose a la figura
9.8.7, las utilidades para las alternativas 1 y 2 son:
250
Utilidad
Tachuela con punto arriba (0.45)
0.30
Alternativa 1
Jugar Tachuela con punto abajo (0.55)
0.05
E=0.1625
Alternativa 2 0.15
No jugar
251
EJERCICIOS DE CLASE
Distribuciones bidimensionales
Tipo I
1. Una investigación de mercado reveló que las ventas semanales de una nueva barra de
caramelo se relacionaron con su precio como sigue. Interprete la información contenida en la
tabla.
Tipo II y III
2. Se sabe que el consumo de las personas (yi) depende de los ingresos que perciben (xi).
Para un grupo de 50 personas se tienen la siguiente información en cientos de bs.:
xi: 4 9 15 15 9 4 9 15 4 9 4 15 9 4 15 9 4 15 9 15 4 15 9 4 15
yi: 1 6 5 1 10 3 11 6 4 4 6 11 5 11 10 1 2 4 7 9 2 7 2 1 8
xi: 9 9 15 15 15 9 15 9 15 4 15 9 15 9 15 9 15 4 15 9 15 9 15 9 15
yi: 12 14 12 15 14 13 13 15 12 5 13 5 14 9 15 12 13 5 9 4 10 1 11 8 12
Covarianza
Tipo I
Tipo II y III
Atributos o mixtos
5. En una determinada empresa se hizo un examen a los 320 administrativos empleados en las
oficinas. Comparándose los resultados obtenidos con los errores mecanográficos cometidos
por cada uno de ellos durante un cierto espacio de tiempo, se elaboró la siguiente tabla de
doble entrada.
252
Errores cometidos Clasificación del examen Total
Cálculo de probabilidades
Diagrama de árbol
35.577 M1
T1 M2 P( T1 , M 2 ) 7.078 %
23.744
M3
34.234 M1 P ( T2 / M1 ) 26 .207 %
T2 M2
P( M 1 ) 33.105 %
M3
31.148 M1 P( M 3 ) 33.790 %
27.854
T3 M2
P( T3 , M 3 ) 9.361 %
M3
M1
T4
M2
253
37.624
M3
a) Determine la distribución bidimensional, que abarca a 438 unidades defectuosas.
b) ¿Qué porcentaje de las unidades defectuosas fueron producidas por el trabajador 4 o en
la máquina 2?
9. Suponga que x representa el tiempo (en minutos) que una persona pasa en la sala de
espera de cierto médico e y la duración (en minutos) de un examen físico completo. Usted
llega al consultorio para un examen físico, 50 minutos antes de tener que salir para una
reunión. Si la función de densidad de probabilidad conjunta de x e y es:
1 10x 50y
f (x, y) e e
500
254
EJERCICIOS PROPUESTOS
1. Se sabe que el consumo de las personas (y), depende de los ingresos que perciben (x). Para
un grupo de 50 personas, se tiene la siguiente información (cientos de bs.):
Ingresos Consumo
4 9 15
1- 5 8 7 3
5’ - 11 2 6 9
11’ - 15 0 5 10
2. La información sobre horas trabajadas (x) y producción en cientos de unidades (y) en una
empresa es la siguiente:
horas Producción
trabajadas 5–9 9’ - 13 13’ - 17
1- 3 3 5 0
3’ - 7 2 4 1
7’ - 11 1 6 7
11’ - 13 2 3 6
3. Se realizó una encuesta a 50 familias con los resultados que figuran en la tabla:
Nº de hijos Nº de autos
1-2 3-4 5-6
1- 5 4 6 15
5’ - 11 3 2 4
11’ - 15 8 6 2
255
c) ¿Cuánto vale la varianza del número de autos? ¿Qué ocurriría con esta varianza si cada
familia se compra dos autos adicionales?
5. Cada vendedor en una compañía se califica como abajo del promedio, promedio, o arriba
del promedio, con respecto a su habilidad para las ventas. Además cada vendedor se
clasifica con respecto a sus posibilidades de promoción:
6. Se recopilaron datos sobre las horas que ven televisión (xi) y edad de los televidentes (yi):
xi: 2 5 5 4 4 5 2 4 5 5 2 4 5 4 4 2 5 5 4 5
yi: 3 6 13 15 3 6 5 7 11 8 5 4 15 5 9 9 10 12 10 5
xi: 2 4 5 5 4 5 4 2 5 4 5 4 2 5 4 4 4 5 2 5
yi: 6 6 3 9 3 12 4 7 7 5 4 8 3 8 4 6 9 7 4 4
7. Un equipo de béisbol juega 70% de sus partidos por la noche y 30% durante el día. El
equipo gana 50% de sus juegos nocturnos y 90% de los diurnos. De acuerdo con el diario
del día de hoy ganó ayer. ¿Cuál es la probabilidad de que el partido se haya desarrollado
por la noche?
256
8. Una profesora ha estado enseñando Estadística durante muchos años. Sabe que 80% de
los estudiantes completan los problemas asignados. Determinó que de los alumnos que
hacen las tareas 90% aprobarán el curso. De aquellos estudiantes que no realizan la tarea
completa solo 60% aprobarán. Miguel Sánchez tomó Estadística el último semestre con la
profesora y tuvo calificación aprobatoria. ¿Cuál es la probabilidad de que sí haya hecho las
tareas?
10. Una compañía que fabrica tornillos, tiene 3 fábricas: A, B, C. Las fábricas B y C producen
el mismo número de tornillos, mientras que A produce el doble de las de B. Por experiencia
pasada, se sabe que el 2% de los tornillos producidos por A y B respectivamente son
defectuosos, en tanto que el 4% de los fabricados por C son defectuosos. Los tornillos
producidos por las tres fábricas se guardan en un mismo lugar.
11. Suponga que x representa el tiempo en minutos durante el cual una persona hace cola en
cierto banco e y la duración en minutos de una transacción de rutina en la ventanilla del
cajero. Usted llega al banco a depositar un cheque. Si la función de densidad de
probabilidad conjunta de x e y es:
1 x y
f (x, y) e 4 e 2
8
1. A Mónica Britt le gusta mucho pilotear botes pequeños a vela. Lo hace desde que tenía 7
años, cuando su madre comenzó a hacerlo con ella. Hoy, Mónica está considerando la
posibilidad de iniciar una compañía para producir pequeños botes para el mercado
recreativo. A diferencia de otros botes a vela producidos en masa, los suyos serán hechos
específicamente para niños entre 10 y 15 años. Serán de la más alta calidad y
extremadamente estables y el tamaño de la vela será reducido para prevenir problemas de
vuelco.
257
Debido al gasto involucrado al desarrollar los moldes iniciales y adquirir el equipo necesario
para producir botes de vela de fibra de vidrio para niños, Mónica ha decidido llevar a cabo un
estudio piloto para asegurarse que el mercado será adecuado. Ella estima que el estudio
piloto costará 10000 $. Además el estudio piloto puede ser exitoso o no. Su decisión básica
es construir una planta de manufactura grande, una pequeña o no construir nada. Con un
mercado favorable, Mónica espera hacer 90000 $ con una planta grande, o 60000 $ con una
planta pequeña. Si el mercado es desfavorable, Mónica estima perder 30000 $ con una
planta grande y perder 20000 $ con una planta pequeña. Mónica estima que la probabilidad
de un mercado favorable dado un estudio piloto exitoso es de 0.8. La probabilidad de un
mercado desfavorable dado un resultado del estudio piloto no exitoso es del 0.9. Mónica
siente que hay una probabilidad de 50-50 que el estudio piloto será exitoso. Por supuesto,
Mónica podría no realizar el estudio piloto y simplemente realizar la decisión de construcción
sin él. Si no haría un estudio piloto, ella estima que la probabilidad de un éxito en el mercado
es del 0.6. ¿Qué recomendaría?
2. John Jenkins siempre ha deseado desarrollar una pequeña línea de carritos para golfistas
de todas las habilidades. Sin embargo, cree que la probabilidad de una línea de autos
exitoso es del 40%. Un amigo le ha sugerido que lleve a cabo una encuesta en la comunidad
para obtener una mejor intuición de la demanda para construir una planta. Hay una
probabilidad de 0.9 de que la investigación sea favorable, si la planta será exitosa. Además,
se estima que hay una probabilidad de 0.8 de que la investigación de mercado será
desfavorable si la planta será exitosa. John podría determinar las probabilidades de una
exitosa línea de autos dado un resultado favorable del estudio de marketing.
3. Como muchos estudiantes, Anne Martin está enfrentando una difícil e importante decisión
acerca de su carrera profesional. Mientras estaba en colegio, Anne trabajó para una
empresa de contabilidad local. Hizo un buen trabajo y la empresa le ofreció un trabajo por
20000 $. Ella puede tomar todo el tiempo que quiera para tomar su decisión. Hay sin
embargo, otras dos compañías que están interesadas en ella. Contabilidad Barnes le ha
ofertado un trabajo por 22000 $. Desafortunadamente Barnes, le ha dado un plazo de dos
semanas para que tome su decisión. La compañía en la cual Anne realmente le gustaría
trabajar es Servicios de Contabilidad Ketchum. Esta compañía, ella siente, podría hacerle
una oferta de 28000 $. Desafortunadamente, Anne está bastante dudosa de que realmente
le ofrezcan el puesto. Entonces, Anne tiene una difícil decisión. ¿Podría ella aceptar la oferta
de Barnes de 22000 $, o debería esperar para conseguir la oferta de Ketchum? Para Anne
ser indiferente entre tomar el trabajo con Barnes y el riesgo de esperar y tratar de conseguir
el trabajo con Ketchum, la probabilidad de obtener el trabajo con Ketchum debería ser 0.6.
Dada esta información, ¿qué utilidad debería Anne tomar sobre los tres trabajos?
4. Jerry Young está pensando abrir una tienda de bicicletas en su ciudad natal. Jerry ama
tomar su bici y correr en un camino de 50 millas con sus amigos, pero cree que cualquier
negocio pequeño debería comenzar sólo si hay una buena probabilidad de obtener
ganancias. Jerry puede abrir un pequeño negocio, una tienda grande o no hacer nada.
Debido a que tendrá un alquiler por 5 años en un edificio, él quiere asegurarse hacer una
decisión correcta. También está pensando en contratar a su viejo profesor de marketing para
llevar a cabo un estudio de mercado. Si es llevado a cabo el estudio, los resultados pueden
ser favorables o desfavorables. Desarrollar un árbol de decisión para Jerry.
259
EJERCICIOS PARA EXAMEN
20-40 0.222
P ( 50) 0.2
0.427
F 0.1733 40’-50
>50
< 20
0.1981
20-40
BA 40’-50
>50
2. En la Papelera S.A. se producen blocs Líder con y sin espiral (50% de cada tipo), el 60% de
cada tipo son rojos, 20% de los blocs sin espiral son azules lo mismo que 25% de los con
espiral, el resto de los blocs son verdes.
3. Suponga que x es el tiempo (en días) que una persona permanece en el hospital después
de una cirugía abdominal e y el tiempo (en días) que una persona permanece en el hospital
después de una cirugía ortopédica. El lunes, el paciente de la cama 107 A es sometido a
260
una apendicetomía de emergencia, mientras que el paciente de la cama 107 B, compañero
de habitación, es sometido a una cirugía ortopédica para reparar el cartílago de la rodilla
rota. Si la función de densidad de probabilidad conjunta para x e y es:
1 x / 4 y / 3
f ( x , y ) e e
12
Halle la probabilidad de que ambos pacientes sean dados de alta del hospital en menos de 3
días.
261
CASO
BLAKE ELECTRONICS2
En 1947, Steve Blake fundó Blake Electronics en Long Beach, California, para manufacturar
resistors, capacitors, inductors y otros components electrónicos. Durante la Segunda Guerra
Mundial Steve fue un radio operador y fue durante ese tiempo que adquirió la habilidad para
reparar radios y otros equipos de comunicación. Steve consideró su experiencia de 4 años con
la armada con sentimientos encontrados. Odió la vida en la armada, pero su experiencia le dio
la confianza y la iniciativa para iniciar su propia empresa de electrónicos.
En el transcurso del tiempo, Steve cuidó su negocio sin realizar grandes cambios. En 1969, las
ventas totales anuales excedían los 2 millones de $. En 1964, el hijo de Steve, Jim, se unió a la
compañía después de terminar la preparatoria y dos años de cursos en electrónica en la
universidad de la comunidad de Long Beach. Jim fue siempre agresivo como atleta en la
preparatoria, y llegó a ser aún más agresivo gerente general de ventas de Blake Electronics.
Esta agresividad preocupaba a Steve, que era más conservador. Jim hacía tratos para proveer
a las compañías con componentes electrónicos sin antes preocuparse de saber si Blake
Electronics tenía la habilidad o capacidad para producir los componentes. En varias ocasiones
este comportamiento causó a la compañía momentos embarazosos, ya que Blake Electronics
era incapaz de producir los componentes electrónicos para compañías con las cuales Jim hizo
tratos.
En 1968, Jim comenzó a ir tras los contratos del gobierno para componentes electrónicos. En
1970, las ventas totales anuales ascendieron a más de 10 millones de $ y el número de
empleados excedía los 200. La mayoría de esos empleados eran especialistas en electrónica y
graduados de programas de ingeniería eléctrica de universidades prestigiosas. Pero la
tendencia de Jim de exagerar para obtener contratos continuó, hasta que por 1975, Blake
Electronics se ganó una reputación con las agencias del gobierno como de una compañía que
no podía entregar lo que prometía. De la noche a la mañana, los contratos con el gobierno se
detuvieron, y Blake Electronics se quedó con una fuerza de trabajo parada y equipo de
manufactura sin utilizar. Estos grandes gastos generales comenzaron a derretir el beneficio, y
en 1977, Blake Electronics se enfrentó con la posibilidad de tener una pérdida por primera vez
en su historia.
En 1978, Steve decidió ver la posibilidad de producir componentes electrónicos para uso del
hogar. Si bien era un mercado totalmente nuevo para Blake Electrónicos, Steve estaba
convencido de que esta era la única forma de mantener a la empresa fura de la línea roja. Al
equipo de investigación le fue dada la tarea de desarrollar nuevos dispositivos electrónicos para
el hogar. La primera idea del equipo fue el Centro de Control Maestro. Los componentes
básicos para este sistema se muestran en la figura 1.
El corazón del sistema es la caja de control maestro. Esta unidad, que debería tener un precio
al por menor de 250 $, tenía dos filas de 5 botones. Cada botón controla una luz o dispositivo y
puede ser dispuesto como un interruptor o un reóstato. Cuando se dispone como un interruptor,
un toque de dedo al botón enciende o apaga la luz. Cuando se dispone como un reóstato, un
2 Este caso ha sido extractado del libro: Quantitative Analysis for Management. Render y Stair, 1997.
262
toque de dedo del botón controla la intensidad de la luz. Si se deja el dedo en el botón, la luz
realiza un ciclo completo desde apagado hasta una luz muy brillante, regresando a apagado.
Adaptador de Adaptador de Disco de
salida interruptor de luz bombilla
Para obtener un máximo de flexibilidad, cada caja de control maestro es energizada por dos
baterías de tamaño D que pueden durar hasta un año, dependiendo de su uso. Además, el
equipo de investigación ha diseñado tres versiones de la caja de control maestro –las versiones
A, B y C. Si la familia quiere controlar más de 10 luces o dispositivos, puede ser comprada otra
caja de control maestro.
El disco bombilla, que debería tener un precio al por menor de 2.50 $, es controlado por la caja
de control maestro y es usada para controlar la intensidad de cualquier luz. Está disponible un
disco diferente para cada posición del botón para las tres cajas de control maestro. Insertando
el disco bombilla entre la bombilla y el socket, el botón apropiado de la caja de control maestro
puede controlar completamente la intensidad de la luz. Si es usado un interruptor de luz
estándar, debe ser encendido todas las veces por la caja de control maestro para que pueda
trabajar.
Una desventaja de usar un interruptor de luz estándar es que solamente la caja de control
maestro puede ser usada para controlar una luz particular. Para evitar este problema, el equipo
de investigación desarrolló un interruptor adaptador de luz especial que debería venderse en 15
$. Cuando este dispositivo está instalado, tanto la caja de control maestro como el interruptor
adaptador de luz pueden ser usados para controlar la luz.
Cuando se quiere controlar otros dispositivos además de la luz, la caja de control maestro debe
ser usada en conjunción con uno o más adaptadores de salida. Los adaptadores son
enchufados en un tabique de salida estándar, y el dispositivo es entonces enchufado al
adaptador. Cada adaptador de salida tiene un interruptor en la parte superior que permite que
263
el dispositivo sea controlado desde la caja de control maestro el desde el adaptador de salida.
El precio del adaptador de salida debería ser 25 $.
El equipo de investigación estimó que debería costar 500000 $ desarrollar el equipo y los
procedimientos necesarios para fabricar la caja de control maestro y los accesorios. Si es
exitosa, esta aventura podría incrementar las ventas en 2 millones de $ aproximadamente.
¿Pero será que la caja de control maestro será exitosa? Con un 60% de probabilidad de éxito
estimado por el equipo de investigación, Steve tiene serias dudas acerca de tratar de vender
las cajas de control maestro, aún cuando le gusta la idea básica.. Debido a sus reservas, Steve
decidió mandar solicitudes de propuestas (RFP’s) para investigaciones adicionales de mercado
a 30 compañías de investigación en el sur de California.
El primer RFP vino de una pequeña compañía llamada Marketing Associates, Inc. (MAI) que
quería cobrar 100000 $ por el estudio. De acuerdo a su propuesta, MAI ha estado en el negocio
por tres años y ha llevado a cabo cerca de 100 proyectos de investigación de mercados. Las
mayores fortalezas de MAI parecen ser la atención individual de cada informe, personal
experimentado y trabajo rápido. Steve se interesó particularmente en una parte de la
propuesta, que revelaba el record éxito de MAI con informes previos. Esto está mostrado en la
figura 12.
Resultados de la encuesta
Resultados Total
Favorable Desfavorable
Operación exitosa 35 20 55
Operación no exitosa 15 30 45
La otra propuesta que regresó fue de una oficina sucursal de Iverstine y Kinard, una de las más
grandes empresas de investigación de mercados en el país. El costo para un estudio completo
es de 300000 $. Si bien la propuesta no contiene el mismo registro de éxito de MAI, contiene
alguna información interesante. La probabilidad de obtener un resultado favorable del estudio,
dada una operación exitosa, es de 90%. Por el otro lado, la probabilidad de conseguir un
resultado desfavorable de la encuesta, dada una operación no exitosa, es de 80%. Entonces, a
Steve le parece que Iverstine y Kinard es capaz de predecir el éxito o fracaso de la caja de
control maestro con una gran certidumbre.
Preguntas
264