0% encontró este documento útil (0 votos)
285 vistas64 páginas

9 Bidimensional

Este documento describe diferentes tipos de distribuciones bidimensionales de datos, incluyendo tablas de contingencia y distribuciones mixtas. Explica distribuciones tipo I con pocas observaciones y valores, tipo II con muchas observaciones y pocos valores donde los datos se organizan en una tabla de doble entrada, y tipo III con muchas observaciones y valores. Proporciona ejemplos de distribuciones bidimensionales que muestran horas de TV vs edad de niños en tablas de frecuencias absolutas y relativas.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOC, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
285 vistas64 páginas

9 Bidimensional

Este documento describe diferentes tipos de distribuciones bidimensionales de datos, incluyendo tablas de contingencia y distribuciones mixtas. Explica distribuciones tipo I con pocas observaciones y valores, tipo II con muchas observaciones y pocos valores donde los datos se organizan en una tabla de doble entrada, y tipo III con muchas observaciones y valores. Proporciona ejemplos de distribuciones bidimensionales que muestran horas de TV vs edad de niños en tablas de frecuencias absolutas y relativas.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOC, PDF, TXT o lee en línea desde Scribd

CAPÍTULO 9

ESTADÍSTICA BIDIMENSIONAL

DISTRIBUCIÓN DE FRECUENCIAS DE DOS VARIABLES,


ATRIBUTOS O MIXTAS

1. INTRODUCCIÓN

Se ha estudiado hasta el momento los métodos estadísticos que hacían referencia a


estadísticas de carácter cuantitativo de una sola variable o unidimensionales o de carácter
cualitativo, insistiendo particularmente en su representación gráfica y en la obtención de
fórmulas para el cálculo de sus medidas más representativas.

Determinada la población correspondiente a un problema técnico, económico o social, los datos


correspondientes pueden ser organizados considerando dos o más variables o atributos,
ampliando los conceptos hasta ahora utilizados para el caso de una sola variable o atributo.
Las parejas de valores, así obtenidas por observación conjunta, podrán o no repetirse un
número determinado de veces.

La presentación de los datos así elaborados, forman una distribución bidimensional (si se trata
de atributos se denomina tabla de contingencia, y si se mezcla una variable con un atributo se
dice que es una bidimensional mixta) o ampliando el concepto a más variables, forman una
distribución multidimensional.

2. TIPOS DE DISTRIBUCIONES DE DOS VARIABLES, ATRIBUTOS O MIXTAS

Las mencionadas distribuciones según el número de observaciones y valores diferentes


respecto a dos variables o atributos considerados, pueden ser de los siguientes tipos (ver figura
9.2.1).

Figura 9.2.1
Tipos de distribuciones de dos variables, atributos o mixtas

Número de Número de
observaciones valores diferentes
Tipo I Pequeño Pequeño
Variables o atributos Tipo II Grande Pequeño
Tipo III Grande Grande

Fuente: Elaboración propia

2.1. Distribución bidimensional tipo I

Se da cuando las observaciones efectuadas y los valores diferentes de las dos variables o las
modalidades diferentes de los dos atributos, son pocos. La organización de dichos datos, si se
201
trata de variables, se efectúa considerando valores ascendentes o descendentes y su
presentación en general, se efectúa tomando en cuenta dichos pares de valores registrados en
dos columnas de la forma general mostrada en la tabla 9.2.1, donde algunos valores de la
variable X pueden repetirse, pero con distinto valor de la variable Y, y viceversa:

Tabla 9.2.1
Distribución bidimensional (xi , yi) tipo I

xi yi
x1 y1
x2 y2
x3 y3
: :
xr ys

Fuente: Casa Aruta, Ernesto. Doscientos Problemas de Estadística Descriptiva, 1965.

Ejemplo

Sea una variable bidimensional que relaciona unidades vendidas (miles de artículos) con
utilidades (miles de $us.) (ver tabla 9.2.2).

Tabla 9.2.2
Distribución bidimensional de utilidades vs. unidades vendidas

xi yi
(unidades) (Utilidades)
1 20
2 40
3 70
4 80
5 100

Fuente: Elaboración propia

La información se lee de la siguiente manera:

 Fila 1: Cuando la empresa vendió 1000 unidades obtuvo 20000 $us de utilidades.
 Fila 5: Cuando la empresa vendió 5000 unidades obtuvo 100000 $us de utilidades.

2.2. Distribución bidimensional tipo II

Esta distribución se presenta cuando las observaciones son muchas y pocos los valores
diferentes de las variables (o las modalidades de los atributos).

Los datos se organizan en un cuadro de doble entrada, de manera que en las filas se registren
los valores diferentes de la variable xi y en la columna se registren los valores diferentes de la
variable yj. El cuerpo de dicha tabla de doble entrada registra las veces que se repite el par
( x i , yi ) . Este número se denomina frecuencia absoluta bidimensional y se simboliza por nij.
202
El valor del universo, población o colectivo, es la suma de los valores de frecuencia absoluta
bidimensional, tal que:

r s
n =  n ij
i=1 j=1

La disposición general de un cuadro bidimensional tipo II, es la siguiente:

Tabla 9.2.3
Distribución bidimensional tipo II

yj y1 Y2 ... ys Total
xi
x1 n11 n12 ... n1s
x2 n21 n22 ... n2s
: : : : :
xr nr1 nr2 ... nrs
Total r s
n= 
i=1 j=1
nij

Fuente: Casa Aruta, Ernesto. Doscientos Problemas de Estadística Descriptiva, 1965.

donde: n21 es el número de veces que se repite el par (x2 , y1).

Nota 1: En la distribución de frecuencias de una variable bidimensional tipo II, si en lugar de los
n ij
valores nij, se escriben h ij  , se dice que es una distribución bidimensional de frecuencias
n
relativas.

Nota 2: La distribución bidimensional expresada en frecuencias absolutas conjuntas, puede ser


escrita en forma de frecuencias absolutas conjuntas acumuladas bidimensionales, cuando los
nij se sustituyen por:

i* j*

N i* j* =  n ij
i=1 j=1

Nota 3: La distribución bidimensional de frecuencias absolutas conjuntas acumuladas


bidimensionales se puede expresar mediante frecuencias relativas conjuntas acumuladas
bidimensionales, si Nij se sustituye por:

i* j*

H i* j* =  h ij
i=1 j=1

203
Ejemplo

Frecuencias absolutas conjuntas:

Sea la siguiente distribución bidimensional de frecuencias absolutas conjuntas (nij) (ver tabla
9.2.4):

Tabla 9.2.4
Bidimensional horas de TV al día vs. edad de los niños (nij)

yi 1 3 7 Total
xi
5 8 4 2 14
7 1 3 6 10
9 4 5 7 16
Total 13 12 15 40

Fuente: Elaboración propia

donde: x = edad de los niños


y = horas frente al televisor al día

La información se lee de la siguiente manera:

 Fila 1, columna 1: 8 de 40 niños tienen 5 años de edad y ven 1 hora de televisión al día.
 Fila 3, columna 2: 5 de 40 niños tienen 9 años de edad y ven 3 horas de televisión al día.
 Fila 2: 10 de 40 niños tienen 7 años.
 Columna 2: 12 de 40 niños ven 3 horas de televisión al día.

Frecuencias relativas:

De acuerdo a la nota 1, se determinará la distribución bidimensional de frecuencias relativas


conjuntas (hij), expresadas en porcentaje (ver tabla 9.2.5):

Tabla 9.2.5
Bidimensional horas de TV al día vs. edad de los niños (hij)

yi 1 3 7 Total
xi
5 20.0 10.0 5.0 35.0
7 2.5 7.5 15.0 25.0
9 10.0 12.5 17.5 40.0
Total 32.5 30.0 37.5 100.0

Fuente: Elaboración propia

La información se lee de la siguiente manera:

 Fila 1, columna 1: El 20% de los niños tienen 5 años de edad y ven 1 hora de televisión al
204
día.
 Fila 3, columna 2: El 12.5% de los niños tienen 9 años de edad y ven 3 horas de televisión al
día.
 Fila 2: El 25% de los niños tienen 7 años.
 Columna 2: El 30% de los niños ven 3 horas de televisión al día.

Frecuencias absolutas acumuladas conjuntas:

De acuerdo a la nota 2, se determinará la distribución bidimensional de frecuencias absolutas


acumuladas (Nij) (ver tabla 9.2.6):

Tabla 9.2.6
Bidimensional horas de TV al día vs. edad de los niños (Nij)

yi 1 3 7
xi
5 8 12 14
7 9 16 24
9 13 25 40

Fuente: Elaboración propia

La información se lee de la siguiente manera:

 Fila 2, columna 2: 16 de 40 niños tienen entre 5 y 7 años de edad y ven entre 1 y 3 horas de
televisión al día.
 Fila 3, columna 2: 25 de 40 niños tienen como máximo 9 años de edad y ven a lo más 3
horas de televisión al día.

Frecuencias relativas acumuladas conjuntas:

De acuerdo a la nota 3, se determinará la distribución bidimensional de frecuencias relativas


acumuladas (Hij), expresada en porcentaje (ver tabla 9.2.7):

Tabla 9.2.7
Bidimensional horas de TV al día vs. edad de los niños (Hij)

yi 1 3 7
xi
5 20.0 30.0 35.0
7 22.5 40.0 60.0
9 32.5 62.5 100.0

Fuente: Elaboración propia

La información se lee de la siguiente manera:

 Fila 2, columna 2: 40% de los niños tienen entre 5 y 7 años de edad y ven entre 1 y 3 horas
de televisión al día.
205
 Fila 3, columna 2: 62.5% de los niños tienen como máximo 9 años de edad y ven a lo más 3
horas de televisión al día.

2.3. Distribuciones marginales

En toda distribución de frecuencias bidimensional, cuando se considera una variable (x i) y se


prescinde de la otra (yj), se obtiene una distribución marginal o distribución de frecuencias de
una variable.

Ejemplo

Sea la distribución marginal de xi y la distribución marginal de yi (ver tabla 9.2.8):

Tabla 9.2.8
Distribuciones marginales de x y y

s
n xi =  n ij
xi

j= 1
s
x1 n x1 = Σ n1j = n11 + n12 + . . . + n1s
j= 1
s
x2 n x2 = Σ n 2j = n 21 + n 22 + . . . + n 2s
j=1
: :
s
xr n xr = Σ n rj = n r1 + n r2 + . . . + n rs
j= 1
r s
n= n i= 1 j= 1
ij

r
n yj =  n ij
yi

i= 1
r
y1 n y1 = Σ n i1 = n11 + n 21 + . . . + n r1
i=1
r
y2 n y2 = Σ n i2 = n12 + n 22 + . . . + n r2
i=1
: :
r
yr n ys = Σ206
n is = n1s + n 2s + . . . + n rs
i=1
r s
n=  ni= 1 j= 1
ij
Fuente: Casa Aruta, Ernesto. Doscientos Problemas de Estadística Descriptiva, 1965.

207
Nota

Determinadas las distribuciones marginales, mediante relaciones de cálculo conocidas pueden


determinarse cualquiera de los estadígrafos si se está caracterizando una variable:

 de posición (media aritmética, mediana, moda, media armónica y media geométrica).


 de dispersión (recorrido, varianza, desviación estándar).
 de comparación (coeficiente de variación y variable tipificada o estandarizada).
 de forma (asimetría y curtosis)

Si se está caracterizando un atributo ordinal, puede determinarse los estadígrafos:

 de posición (moda y mediana)

Si se está caracterizando un atributo nominal, puede determinarse los estadígrafos:

 de posición (moda)

Ejemplo

Sea la siguiente distribución bidimensional de frecuencias absolutas (nij):

yi 1 3 7 Totales
xi
5 8 4 2 14
7 1 3 6 10
9 4 5 7 16
Totales 13 12 15 40

donde: x = edad de los niños


y = horas frente al televisor al día

Muestre las distribuciones marginales.

Resolución.

Prescindiendo de la variable y: Prescindiendo de la variable x:

xi ni
5 14
7 10
9 16
40
yi ni
1 13
3 12
7 15
40

208
2.4. Distribución bidimensional tipo III

Esta forma de distribución se presenta cuando se han efectuado muchas observaciones y los
valores diferentes de la variable registrados son igualmente muchos.

Su organización, si se trata de presentar una distribución de frecuencias tipo III con intervalos
constantes para las dos variables, requiere:

 Calcular el recorrido de ambas variables.


 Establecer el número de clases para cada variable.
 Determinar la amplitud de clase para cada variable dividiendo el recorrido entre el número
de clases fijado.

Si la presentación es con intervalos no constantes, se requiere:

 Definir el recorrido de ambas variables.


 Establecer los intervalos de clase y su número según las exigencias del estudio o la
resolución del problema.

Su presentación general se efectúa de la siguiente manera (ver tabla 9.2.9).

Tabla 9.2.9
Distribución bidimensional tipo III

yj -1 - yj yo - y1 y1 - y2 y2 - y3 ... ys-1 - ys Total

xi -1 - xi
xo - x1 n11 n12 n13 ... n1s
x1 - x2 n21 n22 n23 ... n2s
x2 - x3 n31 n32 n33 ... n3s
: : : : : :
xr-1 - xr nr1 nr2 nr3 ... nrs
Total r s
n = Σ Σ n ij
i= 1 j= 1

Fuente: Casa Aruta, Ernesto. Doscientos Problemas de Estadística Descriptiva, 1965.

Nota: También puede expresarse en términos de frecuencia relativa, frecuencia absoluta


acumulada y frecuencia relativa acumulada conjunta.

 De la distribución bidimensional tipo III se obtienen dos distribuciones marginales tipo III.

 Las distribuciones marginales tipo III transformadas en distribuciones unidimensionales tipo


II, permiten mediante cálculos conocidos, determinar estadígrafos de posición central, de
dispersión, de comparación o de forma.

Ejemplo 1: bidimensional de dos variables

209
En la UPB se hizo una encuesta a 50 estudiantes sobre el número de cigarrillos que consumen
al día (xi), y se los clasificó por edades (yi). Los datos recopilados fueron los siguientes:

xi: 1 11 15 6 0 3 12 10 6 5
yi: 19 20 20 19 18 20 19 18 20 19
xi: 2 0 1 6 0 2 4 2 5 11
yi: 20 19 20 18 20 19 20 19 20 18
xi: 1 8 4 6 7 5 7 1 10 3
yi: 20 18 19 20 19 18 20 20 20 19
xi: 0 1 5 3 4 3 10 13 2 2
yi: 20 19 20 20 20 20 19 18 20 18
xi: 0 15 2 14 4 1 5 4 8 4
yi: 20 18 20 19 20 18 19 20 20 19

Organice los datos en un cuadro bidimensional de frecuencias acumuladas relativas H i,j (%), de
forma de poder contestar:

a) ¿Qué porcentaje de los alumnos que tienen a lo más 19 años, consumen como máximo 10
cigarrillos?
b) ¿Qué porcentaje de los alumnos, tienen como máximo 20 años y consumen como máximo 5
cigarrillos?

Resolución

 Determine para cada variable si la distribución es de intervalos constantes o no.

En este caso, como se debe contestar preguntas específicas, las dos variables son de
intervalos no constantes.

 Defina el recorrido de ambas variables.

Rx = 15 - 0 = 15 Ry = 20 - 18 = 2

 Establezca los intervalos de clase y su número según las exigencias del estudio o la
resolución del problema.

Para x: 0-5 5’ - 10 10’ - 15 (Tipo III)


Para y: 18 19 20 (Tipo II)

 Realice el conteo para las dos variables y determine la distribución bidimensional de


frecuencias absolutas conjuntas (nij)( ver tabla 9.2.10):

Tabla 9.2.10
Bidimensional consumo de cigarrillos diarios vs. edad (nij)

yi 18 19 20 Total
xi
0-5 4 10 18 32

210
5’ - 10 3 3 5 11
10’ - 15 3 2 2 7
Total 10 15 25 50

Fuente: Elaboración propia

 Determine la distribución bidimensional de frecuencias relativas conjuntas (h ij), en porcentaje


(ver tabla 9.2.11):

Tabla 9.2.11
Bidimensional consumo de cigarrillos diarios vs. edad (hij)

yi 18 19 20 Total
xi
0-5 8 20 36 64
5’ - 10 6 6 10 22
10’ - 15 6 4 4 14
Total 20 30 50 100

Fuente: Elaboración propia

 Determine la distribución bidimensional de frecuencias relativas acumuladas conjuntas (Hij),


en porcentaje (ver tabla 9.2.12):

Tabla 9.2.12
Bidimensional consumo de cigarrillos diarios vs. edad (Hij)

yi 18 19 20
xi
0-5 8 28 64
5’ - 10 14 40 86
10’ - 15 20 50 100

Fuente: Elaboración propia

Resultados.

a) 40% de los alumnos tienen como máximo 19 años y consumen como máximo 10 cigarrillos
al día.

b) 64% de los alumnos tienen 20 años y consumen como máximo 5 cigarrillos al día.

Ejemplo 2: bidimensional mixta (variable y atributo)

En una fábrica se hizo un examen psicotécnico a los 22 operarios de su sección de montaje,


clasificándolos a la vista de los resultados en buenos, normales y malos. Se observaron
también los errores cometidos por estos 22 montadores durante un cierto periodo de tiempo,
obteniéndose la siguiente información:

211
errores 0 2 1 0 3 1 0 1 2 1 3

examen B B N B N N B N N B N
errores 2 3 2 3 0 1 3 1 1 2 2
examen N M M M N M M N B N N

Determine los cuadros adecuados, para contestar:


a) ¿Cuántas personas cometieron 3 errores y obtuvieron una calificación de malo?
b) ¿Qué porcentaje de montadores obtuvieron una calificación de normal y cometieron 1 error?
c) ¿Cuántos trabajadores cometieron no más de un error y obtuvieron una nota de bueno?
d) ¿Qué porcentaje de personas obtuvieron en su examen una calificación de por lo menos
normal y cometieron como máximo 2 errores?

Resolución

 Primero se debe tabular los datos en una distribución de frecuencias absolutas conjuntas
(ver tabla 9.2.13). Se tiene un atributo ordinal: clasificación del examen con tres
modalidades, y una variable discreta tipo II, con 4 valores diferentes de la variable; por lo
cual la bidimensional es mixta.

Tabla 9.2.13
Bidimensional clasificación de examen vs. errores cometidos (ni,j)

Errores Clasificación del examen Totales


cometidos Buenos Normales Malos
0 3 1 0 4
1 2 4 1 7
2 1 4 1 6
3 0 2 3 5
Totales 6 11 5 22

Fuente: Elaboración propia

 Luego se procede a determinar los cuadros faltantes y a responder a las preguntas (ver
tablas 9.2.14-16).

a) Con el cuadro ni,j, se puede saber que tres montadores de los 22, cometieron 3 errores y
obtuvieron una calificación de malo.
Tabla 9.2.14
Bidimensional clasificación de examen vs. errores cometidos (hi,j)

Errores Clasificación del examen Totales


cometidos Buenos Normales Malos
0 13.64 4.54 0 18.18
1 9.09 18.18 4.55 31.82
2 4.54 18.19 4.54 27.27
3 0 9.09 13.64 22.73
Totales 27.27 50.00 22.73 100.00

212
Fuente: Elaboración propia

b) Con el cuadro hi,j, se puede saber que el 18.18% de los montadores, obtuvieron una
calificación de normal y cometieron 1 error.

213
Tabla 9.2.15
Bidimensional clasificación de examen vs. errores cometidos (Ni,j)

Errores Clasificación del examen


cometidos Buenos Normales Malos
0 3 4 4
1 5 10 11
2 6 15 17
3 6 17 22

Fuente: Elaboración propia

c) Con el cuadro Ni,j, se puede saber que 5 de los 22 trabajadores cometieron no más de un
error y obtuvieron una nota de bueno.

Tabla 9.2.16
Bidimensional clasificación de examen vs. errores cometidos (Hi,j)

Errores Clasificación del examen


cometidos Buenos Normales Malos
0 13.64 18.18 18.18
1 22.73 45.45 50.00
2 27.27 68.18 77.27
3 27.27 77.27 100.00

Fuente: Elaboración propia

d) Con el cuadro Hi,j, se puede saber que el 68.18% de personas obtuvieron en su examen una
calificación de por lo menos normal y cometieron como máximo 2 errores.

3. COVARIANZA

3.1. Definición

El grado de dependencia o relación entre las variables de una distribución bidimensional, se


determina mediante la covarianza. Se define como la media del producto de las desviaciones
de los valores de cada variable respecto de su media aritmética.

El signo de la covarianza define la naturaleza de la asociación:

 Si es positiva, se dice que existe relación directa entre las variables (aumento o disminución
en x implica aumento o disminución en y).

 Si es negativa, indica relación inversa entre las variables.

 Si es cero, no existe ninguna relación entre las variables.

Cuanto más alejado esté el valor de la covarianza hallado de cero, la relación entre las
variables será más intensa.
214
3.2. Determinación

a) Tipo I

La covarianza se simboliza por el signo S xy y se define de la siguiente manera para


distribuciones tipo I:

 (x i  x )( yi  y)
Sxy  i 1
n

Para calcular la covarianza se acostumbra a presentar la fórmula de forma más práctica.


Desarrollando la fórmula anterior, se tiene:

Sxy 
 (x i  x )( yi  y)

 (x i y i  y x i  x y i  x y)

x i yi
y
x i
x
y i

nx y
n n n n n n

Sxy 
x i yi
 yx  xy  x y 
x i yi
 yx 
x i yi   xi
 
  yi



n n n  n 
 n  

Sxy 
x i yi   xi
 
  yi



n  n 
 n  

Ejemplo

Sea una variable bidimensional tipo I que relaciona unidades vendidas (miles de artículos) con
utilidades (miles de $us.):

xi yi
(unidades) (Utilidades)
1 20
2 40
3 70
4 80
5 100

Halle la relación de asociación entre las ventas y las utilidades de la empresa.

Resolución

 Con ayuda de la tabla bidimensional tipo I, se obtienen las sumatorias adecuadas, según la
ecuación para hallar la covarianza (ver tabla 9.3.1):

215
Tabla 9.3.1
Cálculo de la covarianza en distribuciones tipo I: Utilidades vs unidades vendidas

xi yi xi*yi
1 20 20
2 40 80
3 70 210
4 80 320
5 100 500
15 310 1130

Fuente: Elaboración propia

 Se reemplazan los valores hallados en la fórmula:

1130  15  310 
Sxy       40
5  5  5 

Conclusión: Como el valor de la covarianza es positivo y está alejado del cero, se puede decir
que existe una relación directa intensa entre las unidades vendidas y las utilidades de la
empresa.

b) Tipo II o III

La fórmula de definición para distribuciones tipo II es:

 (x  x) * ( y  y ) * n
i 1
i i i

Sxy =
n

Para cálculos:

Sxy 
x i yi n i   xi ni
 
  y i n i



n n  n 
  

Ejemplo

Halle la covarianza de la siguiente distribución bidimensional de frecuencias absolutas:

yi 1 3 7 Total
xi
5 8 4 2 14
7 1 3 6 10
9 4 5 7 16
Total 13 12 15 40

216
Donde:

x = edad de los niños


y = horas frente al televisor

Resolución

 Se unidimensionaliza la distribución (ver tabla 9.3.2).

Tabla 9.3.2
Cálculo de la covarianza en distribuciones tipo II: horas de TV vs edad

xi yi ni xi * ni yi * ni xi * yi * ni
5 1 8 40 8 40
5 3 4 20 12 60
5 7 2 10 14 70
7 1 1 7 1 7
7 3 3 21 9 63
7 7 6 42 42 294
9 1 4 36 4 36
9 3 5 45 15 135
9 7 7 63 49 441
40 284 154 1146

Fuente: Elaboración propia

 Se realizan los siguientes cálculos: xi*ni, yi*ni, xi*yi*ni en las columnas (4), (5) y (6)
respectivamente.
 Se reemplazan los valores hallados en la ecuación:

1146  284   154 


Sxy =     1.315
40  40   40 

Conclusión: Como la covarianza es positiva, pero el valor es cercano a cero, se puede decir
que existe una relación directa débil entre la edad de los niños y las horas que ven televisión al
día.

c) Bidimensionales de atributos o mixtos

Si se tiene una tabla de contingencia, también se puede determinar el grado de asociación


entre atributos o series mixtas.

Cuando entre dos atributos no existe ninguna influencia mutua, se dice que son
independientes. En caso contrario se dice que hay asociación o dependencia.

Para fundamentar, aunque sea de una forma simple el razonamiento que sigue, vamos a
suponer una distribución de dos atributos cada uno de los cuales toma dos modalidades
distintas (ver tabla 9.3.3):

217
Tabla 9.3.3
Distribución bidimensional de atributos o mixtas

A a1 a2 Total
B
b1 n11 n21 ni1
b2 n12 n22 ni2
Total n1i n2i n

Fuente: Casa Aruta, Ernesto. Doscientos Problemas de Estadística Descriptiva, 1965.

Evidentemente, si A y B son independientes, el número de los elementos que poseen las


modalidades b1 y a1 y el número de los elementos que poseen las modalidades b 1 y a2 han de
guardar la misma proporción con respecto al total de a 1 y con respecto al total de a 2,
respectivamente. Algebraicamente:

n 11 n 21

 n 1i  n 2i
i i

de donde se puede escribir también que:

n 21 n 11  n 21 n i1
  i

 n 2i
i
 n 1i  n 2i
i i
n

y finalmente que:

n n 2i i1
n 21  i i

De otra forma, diremos que existirá independencia entre dos modalidades a y b cuando:

na nb
n ab 
n

siendo aquí nab el número de elementos que poseen las dos modalidades a y b conjuntamente,
na el número de los que poseen la modalidad a y nb el de los que poseen la modalidad b.
Téngase en cuenta que no es necesario que dicha igualdad se cumpla estrictamente: desde el
punto de vista estadístico, basta con que la diferencia entre los dos miembros sea
relativamente pequeña.

La asociación entre dos modalidades será, de tipo positivo si:

218
na nb
n ab  0
n

y negativo si:

na nb
n ab  0
n

llamándose “atracción” a la asociación de tipo positivo, y “repulsión” a la asociación de tipo


negativo.

En definitiva y resumiendo esquemáticamente:

 atracción
n n
n ab  a b : independencia
n
 repulsión

Ejemplo

Se realizó una encuesta a 30000 habitantes de una determinada ciudad. Se obtuvo la siguiente
distribución en cuanto a su estado civil y sexo (ver tabla 9.3.4).

Tabla 9.3.4
Bidimensional de estado civil vs sexo

Estado civil Soltero Casado Viudo Total


Sexo
Masculino 8052 5815 542 14743
Femenino 8384 5989 1218 15257
Total 16436 11804 1760 30000

Fuente: Casa Aruta, Ernesto. Doscientos Problemas de Estadística Descriptiva, 1965.

Determine el tipo de dependencia entre las modalidades de ambos atributos.

Resolución

 Se realizan los cálculos correspondientes, para cada combinación de modalidades entre los
dos atributos.

(14743)(16436)
n M S (8052)   8077 (independiente)
30000
(14743)(11804)
n M C (5815)   5801 (independiente)
30000
(14743)(1760)
n M  V (542)   865 (repulsión)
30000

219
(15257)(16436)
n FS (8384)   8359 (independiente)
30000
(15257)(11804)
n FC (5989)   6003 (independiente)
30000
(15257)(1760)
n F V (1218)   895 (atracción )
30000

Conclusión: Existe independencia entre sexo de la persona y si es casado o soltero. Sin


embargo, existe repulsión entre sexo masculino y estado civil, viudo. También existe atracción
entre sexo femenino y estado civil, viuda. Eso quiere decir que es frecuente que existan más
viudas que viudos.

Nota: El método usado sirve únicamente para conocer la independencia o el tipo de asociación
existente entre dos modalidades cualquiera, perteneciente cada una de ellas a un atributo
observado empíricamente. Para conocer la existencia de independencia o asociación entre dos
atributos es necesario recurrir a otro método distinto que haga intervenir todas las frecuencias
absolutas conjuntas, que se denomina “prueba de independencia de atributos Chi-Cuadrada”,
pero que no se puede exponer aquí, por falta de nociones de Estadística Inferencial.

4. REGLAS DE COMPOSICIÓN PARA EL CÁLCULO DE PROBABILIDADES

4.1. Generalidades. Probabilidad conjunta.

Sea un experimento aleatorio “E” que tiene un espacio muestral “S”, donde sus resultados
posibles se organizan atendiendo a dos criterios de ordenación (x i, yj). La presentación de estos
resultados se efectúa en un cuadro de doble entrada, donde nij indica el número de veces que
aparece el par (xi, yj); en consecuencia, una distribución bidimensional de probabilidades se
presenta en la siguiente forma general:

yj y1 y2 ... ys Total
xi
x1 n11 n12 ... n1s
x2 n21 n22 ... n2s
: : : : :
xr nr1 nr2 ... nrs
Total r s
n=  n
i= 1 j= 1
ij

n ij Casos favorables
donde: P ij = =
n Casos posibles

Pij se lee como probabilidad del evento (xi, yj), que es la probabilidad conjunta; es decir la
probabilidad de que los sucesos xi y yi ocurran al mismo tiempo.

Utilizando la información de la tabla de eventos o sucesos, dispuestos en forma de una


distribución bidimensional, se pueden determinar las siguientes reglas de composición.
220
4.2. Probabilidad marginal

Si en la distribución bidimensional de probabilidades se prescinde de uno de los criterios de


ordenación (digamos yj) y estamos interesados en los eventos que resultan de considerar el
criterio de ordenación xi, se habrá definido la probabilidad marginal de x i, que se denota por el
símbolo P(xi) y su cálculo se efectúa de la siguiente manera:

s
P ( x i ) =  P ( x i, y j ) = n i1 + n i2 + n i3 + . . . + n is
j=1 n n n n

P( x i )  P( x i , y1 )  P( x i , y 2 )    P( x i , y s )

Si se trata de la probabilidad marginal de yj, el cálculo se efectúa de la siguiente manera:

r
n1j n 2j n 3j n
P ( y j ) =  P ( x i, y j ) = + + + . . . + rj
i=1 n n n n

P( y j )  P( x 1 , y j )  P( x 2 , y j )    P( x r , y j )

La distribución marginal (o normal), es la probabilidad de ocurrencia de un evento simple.

4.3. Regla de adición

Se busca determinar la probabilidad de la unión de dos sucesos. Según que los sucesos sean
mutuamente excluyentes o no, la regla de la adición se determina de las dos siguientes formas:

a) Regla de adición para sucesos mutuamente excluyentes

P ( x  y)  P ( x )  P ( y)

donde x y y son sucesos mutuamente excluyentes y sus probabilidades son marginales.

b) Regla de adición para dos sucesos cualquiera

P ( x  y)  P ( x )  P ( y)  P ( x , y)

siendo P(x, y) la probabilidad conjunta.

Nota: Para resolver problemas de adición de eventos en general, debe utilizarse la regla
correspondiente a dos sucesos cualesquiera, salvo que se tenga como dato que los sucesos
sean mutuamente excluyentes.

Para entender mejor la regla de adición de eventos se usan los diagramas de Venn
(investigador inglés, 1834-88), que son representaciones gráficas de los resultados de un
experimento aleatorio. Para elaborar un diagrama de Venn, se representa al espacio muestral
por un rectángulo, mientras que los eventos aparecen como regiones dentro del rectángulo,
generalmente en forma de círculos.

221
Las regiones sombreadas de los cuatro diagramas de Venn de la figura 9.4.1, representan
respectivamente: el evento A, su complemento, la unión de los eventos A y B y la intersección
de A y B (para sucesos que no son mutuamente excluyentes y para los que si son).

Figura 9.4.1. Diagramas de Venn

A
A

S S
A A’
A y A’ son mutuamente excluyentes

A B A B

S S
AB AB
A y B no son mutuamente excluyentes

A B A B

S S
AB AB
A y B son mutuamente excluyentes

Fuente: Freund y Simon. Estadística Elemental, 1994.

El lector puede darse cuenta por qué en la suma de dos eventos que no son mutuamente
excluyentes, se debe restar la intersección (se estaría sumando dos veces el área sombreada).

Ejemplo

En la figura anterior, si A es el evento en el que cierto estudiante asiste a un curso de cálculo y


B es el evento en el que el estudiante está asistiendo a un curso de física, ¿qué eventos están
representados por las regiones sombreadas de los seis diagramas de Venn?

222
Resolución.

Primer diagrama: Representa el evento en que el estudiante asiste al curso de cálculo.

Segundo diagrama: El evento en que el estudiante no asiste al curso de cálculo (asiste al de


física).
Tercer diagrama: El estudiante está asistiendo al curso de cálculo o al de física.
Cuarto diagrama: El evento en el que asiste a los dos cursos a la vez (algo que no puede
ocurrir).

No se utilizan los dos diagramas del medio, ya que los eventos son mutuamente excluyentes,
suponiendo que los dos cursos estén programados a la misma hora y en las mismas fechas.

4.4. Probabilidad condicional

Dados dos sucesos o eventos xi, yj se define la probabilidad condicional cuando se busca
determinar la probabilidad del evento xi dado el evento yj; es decir, la probabilidad de que
ocurra un evento xi, ya que se sabe de antemano que ocurrió el evento yi.

La probabilidad de un suceso determinado, condicionado a otro suceso se denota en símbolos,


de la siguiente manera:

P(x / y) y se lee: "Probabilidad de x dado y".


P(y / x) y se lee: "Probabilidad de y dado x".

Esta probabilidad se determina dividiendo la probabilidad conjunta entre la probabilidad


marginal:

P (x , y )
P (x /y ) = Si P(y) > 0
P (y )
P (x , y )
P (y /x ) = Si P(x) > 0
P (x )

4.5. Regla multiplicativa

a) Sucesos dependientes

Despejando las dos formas que expresan la probabilidad condicional y la probabilidad conjunta
se tiene:

P ( x , y )  P ( y) P ( x / y) (1)

P( y, x )  P( x ) P( y / x ) (2)
o mejor: P ( x , y )  P ( y) P ( x / y)  P ( x ) P ( y / x ) (3)

La ecuación (3) expresa la regla multiplicativa para dos eventos dependientes.

223
b) Sucesos independientes

Si P( y / x )  P2 ( y) (4)
y P( x / y)  P1 ( x ) (5)

Reemplazando (4) y (5) en (3), tenemos:

P ( x , y)  P ( x ) P2 ( y)  P1 ( x ) P ( y)

que expresa la regla multiplicativa para dos sucesos independientes.

4.6. Probabilidad completa o total

Sea un atributo xi y un atributo yj compuesto por eventos mutuamente excluyentes:

y i  y1 , y 2 ,  , y s

La probabilidad total o completa se da cuando se desea averiguar la probabilidad del evento x i


en base a sus intersecciones con los eventos del atributo yj.

s
P (x ) = P (x, y1) + P (x, y 2) + P (x, y 3) + . . . + P (x, y s) =  P (x, y j)
j=1

Aplicando al segundo miembro la regla multiplicativa, se tiene:

P (x ) = P ( y1) * P (x / y1) + P ( y 2) * P (x / y 2) + . . . + P ( ys) * P (x / y s )


s
=  P ( y j ) * P (x / y j )
j=1

que expresa la regla de cálculo para la probabilidad completa.

4.7. Teorema de Bayes

Permite determinar la probabilidad de las hipótesis y j dado el evento xi. Se expresa en forma de
una probabilidad condicional de la siguiente manera:

Aplicando la propiedad multiplicativa al numerador y la definición de probabilidad total o


completa al denominador de la fórmula de probabilidad condicional, se tiene la siguiente
expresión:

P (x i , y j ) P (y j ) * P (x i / y j )
P (y j / xi ) = = s
P (x i )
 P ( y ) * P (x
j=1
j i /yj )

224
4.8. Ejemplo

Mediante el siguiente ejemplo se mostrará el cálculo de probabilidades usando todas las reglas
anteriores.

Sea Ai = estrato de votantes: joven, adulto y viejo; B j = partidos que participan en elecciones:
MNR, MIR, MBL. Mediante encuesta se ha determinado la siguiente distribución (ver tabla
9.4.1):
Tabla 9.4.1.
Bidimensional preferencia por partidos políticos vs. edad

Bj MNR MIR MBL Totales


Ai
J 2 6 4 12
A 7 3 5 15
V 6 7 0 13
Totales 15 16 9 40

Fuente: Elaboración propia

Mediante reglas de composición resolver las siguientes probabilidades:

1) Probabilidad de ser viejo o del MBL

 Se trata de hallar la probabilidad de la unión de dos sucesos.

P(x  y) = P(x) + P(y) - P(xy)

 En términos de las modalidades de la distribución:

P(V  MBL) = P(V) + P(MBL) - P(V, MBL)

 La probabilidad buscada utilizando los datos de la distribución, es:

13 9 0 22
P(V  MBL) = +  = = 0.55
40 40 40 40

Conclusión: La probabilidad de ser viejo o del MBL es del 55%.

2) Probabilidad de ser adulto dado que se es del MNR.

 Se trata de una probabilidad condicional:

P (x , y )
P (x /y ) = Si P(y) > 0
P (y )

 En términos de las modalidades de la distribución:

225
P (A, MNR )
P (A /MNR ) =
P (MNR )

donde: P(A, MNR) es la probabilidad conjunta y se lee en la tabla.

7
P (A, MNR ) =
40

y P(MNR) es la probabilidad marginal tal que:

15
P(MNR) =
40
 Reemplazando valores:
7
7
P (A /MNR ) = 40 = = 0.47
15 15
40

Conclusión: La probabilidad de ser adulto dado que es del MNR es del 47%.

3) Verifique si la probabilidad marginal de ser del MIR es de 15/40.

 Se trata de aplicar la probabilidad completa, donde:

3
P (x ) =  P (x, y j )
j=1
3
P (x ) =  P ( y j ) * P (x / y j )
j=1

 En términos de las modalidades:

P(MIR) = P(J)*P(MIR /J) + P(A)*P(MIR /A) + P(V)*P(MIR / V)


14 6 15 3 13 7
P (MIR ) = ( )( ) + ( )( ) + ( )( )
40 12 40 15 40 13
6 3 7 16
= + + =
40 40 40 40

Conclusión: Por lo tanto se verifica que la probabilidad de ser del MIR no es 15/20 sino 16/40.

4) Verifique si la probabilidad de ser joven y del MIR es de 7/40.

 Se trata de aplicar la regla multiplicativa:

P(x, y) = P(x) * P(y / x) = P(y) * P(x / y)

226
 En términos de las modalidades de la distribución:

P(J, MIR) = P(MIR) * P(J / MIR) = P(J) * P(MIR / J)

 Aplicando los datos de la distribución de probabilidades:

P(J, MIR) = [ P(J, MIR) + P(A, MIR) + P(V, MIR) ] * [ P(J / MIR) ]

6 3 7 6 16 6 6
=[ + + ] *[ ] = * =
40 40 40 16 40 16 40

Conclusión: No es cierto que la probabilidad de ser joven y del MIR sea 7/40. Su resultado es
6/40.

5) Demuestre que la probabilidad de ser adulto dado que es del MBL es de 5/9.

 Se trata del teorema de Bayes.

P (x i y j ) P ( y j ) * P (x i / y j )
P (y j /x i ) = = s
P (x i )
 P (y
j=1
j ) * P (x i / y j )

 En términos de las modalidades de la distribución:

P (MBL, A )
P (A /MBL ) =
P (MBL )
15 5 5
( )( )
5
P (A /MBL ) = 40 15 = 40 =
9 9 9
40 40

Conclusión: Se verifica que la probabilidad de ser adulto dado que es del MBL es de 5/9.

5. CÁLCULO DE PROBABILIDADES UTILIZANDO DIAGRAMA DE ÁRBOL

A veces es conveniente pasar la información que contiene una distribución bidimensional a un


diagrama de árbol o viceversa. Se determinaron arboligramas en el capítulo de Distribución de
Probabilidades, como un método para determinar espacios muestrales de experimentos
aleatorios.

Ejemplo 1

Sea Ai = estrato de votantes: joven, adulto y viejo; B j = partidos que participan en elecciones:
MNR, MIR, MBL. Mediante encuesta se ha determinado la siguiente distribución:

Pase la información probabilística contenida en el cuadro de contingencia del ejemplo anterior a


un diagrama de árbol, usando las reglas de composición descritas.
227
Resolución

En primer lugar se dará un instructivo de lo que significa cada rama de un diagrama de árbol y
cómo hallar las probabilidades.

 Las primeras ramas del árbol presentan sucesos aleatorios que tienen probabilidades
marginales. Se puede comenzar por cualquier clasificación. Para diagramarlas debe hacerse
esta pregunta: Si se selecciona al azar una persona de entre las 40, ¿cuál es la clasificación
de su edad?

 Las segundas ramas de árbol son sucesos dependientes que presentan probabilidades
condicionales. Para diagramarlas debe hacerse la siguiente pregunta: habiendo determinado
la edad de la persona elegida al azar, ¿de qué partido es?

 En otras palabras se está determinando el espacio muestral del experimento aleatorio, es


decir el conjunto de sus posibles resultados y sus probabilidades respectivas.

 Para hallar las probabilidades conjuntas en un diagrama de árbol se utiliza la regla


multiplicativa. Si se quiere hallar una probabilidad marginal que no se encuentra en las
primeras ramas, se utiliza la probabilidad total, y para hallar una probabilidad condicional
que no se encuentra en las segundas ramas se utilizará el teorema de Bayes.

Algunas características del diagrama de árbol son:

 La suma de probabilidades conjuntas es 1.


 La suma de probabilidades para sucesos mutuamente excluyentes es 1.

Se muestra a continuación el diagrama de árbol (ver figura 9.5.1)

Figura 9.5.1. Arboligrama preferencia por partidos políticos vs. edad

P. marginales P. condicionales P. conjuntas

2/12 P(J, MNR) = P(J)*P(MNR/J) = (12/40)*(2/12) = 2/40


MNR
6/12 P(J, MIR) = P(J)*P(MIR/J) = (12/40)*(6/12) = 6/40
J MIR
12/40 4/12 P(J, MBL) = P(J)*P(MBL/J) = (12/40)*(4/12) = 4/40
MBL
7/15 MNR P(A, MNR) = P(A)*P(MNR/A) = (15/40)*(7/15) = 7/40
15/40 3/15 P(A, MIR) = P(A)*P(MIR/A) = (15/40)*(3/15) = 3/40
A MIR
5/15 MBL P(A, MBL) = P(A)*P(MBL/A) = (15/40)*(5/15) = 5/40
13/40
6/13 P(V, MNR) = P(V)*P(MNR/V) = (13/40)*(6/13) = 6/40
MNR
V 7/13 P(V, MIR) = P(V)*P(MIR/V) = (13/40)*(7/13) = 7/40
MIR
0/13 P(V, MBL) = P(V)*P(MBL/V) = (13/40)*(0/13) = 0
MBL

Fuente: Elaboración propia

228
P. totales

P(MNR) = P(MNR, J)+P(MNR, A)+P(MNR, V) = (2/40)+(7/40)+(6/40) = 15/40


P(MIR) = P(MIR, J)+P(MIR, A)+P(MIR, V) = (6/40)+(3/40)+(7/40) = 16/40

P(MBL) = P(MBL, J)+P(MBL, A)+P(MBL, V) = (4/40)+(5/40)+(0/40) = 9/40


P. condicionales (Teorema de Bayes)

P(J/MNR) = P(MNR, J)/P(MNR) = (2/40)/(15/40) = 2/15

P(J/MIR) = P(MIR, J)/P(MIR) = (6/40)/(16/40) = 6/16


P(J/MBL) = P(MBL, J)/P(MBL) = (4/40)/(9/40) = 4/9
P(A/MNR) = P(MNR, A)/P(MNR) = (7/40)/(15/40) = 7/15

P(A/MIR) = P(MIR, A)/P(MIR) = (3/40)/(16/40) = 3/16


P(A/MBL) = P(MBL, A)/P(MBL) = (5/40)/(9/40) = 5/9

P(V/MNR) = P(MNR, V)/P(MNR) = (6/40)/(15/40) = 6/15


P(V/MIR) = P(MIR, V)/P(MIR) = (7/40)/(16/40) = 7/16
P(V/MBL) = P(MBL, V)/P(MBL) = (0/40)/(9/40) = 0

Ejemplo 2

El administrador de la unidad operativa de tránsito realizó un estudio sobre el número de


accidentes que hay en la ciudad con respecto a la edad del conductor. El arboligrama con las
probabilidades porcentuales está mostrado en la figura 9.5.2:

Figura 9.5.2. Arboligrama del número de accidentes vs. edad

88.24 0

21-41 1
42.39 4.22
2
90.07 0
39.87
7.00
41’-61 1

2
0
6.72
61’-71 1
2.96
2
Fuente: Elaboración propia
229
El administrador quiere estimar cuantas personas de cada categoría existirán, si este año hay
4194 nuevos conductores.

Resolución

En primer lugar, se pueden determinar las probabilidades del arboligrama que faltan, sabiendo
que la suma de probabilidades de eventos mutuamente excluyentes debe ser de uno.

P(61' 71)  100  42.39  39.87  17.74

P(1/ 21  41)  100  88.24  4.22  7.54

P( 2 / 41' 61)  100  90.07  7.00  2.93

P(0 / 61' 71)  100  6.72  2.96  90.32

Luego, se construye el cuadro bidimensional y se asignan variables a todas las categorías:

Edad/n° accidentes 0 1 2 Total


21-41 A D G N
41’-61 B E H O
61’-71 C F I P
total K L M 4194

Haciendo uso de las reglas de cálculo de probabilidades, se procede a hallar el valor de cada
variable.

 Con probabilidades marginales:

N
P(21  41)  0.4239  N  0.4239(4194)  1778
4194

De la misma manera se puede hallar el valor de O:

O  0.3987(4194)  1672

Restando del total se halla el valor de P:

P  4194  1778  1672  744

 Con probabilidades condicionales:

A A
P(0 / 21  41)  0.8824   A  0.8824(1778)  1569
N 1778

De la misma manera se procede para hallar el valor de D:

230
D  0.0754(1778)  134

Restando del total de personas de edad entre 21 a 41 años, se obtiene G:

G  1778  1569  134  75

 Con probabilidades condicionales:

Igualmente se hallan los valores para B, E y H:

B  0.9007(1672)  1506
E  0.007(1672)  117
H  1672  1506  117  49

 Con probabilidades condicionales:

La fila restante, se puede hallar mediante el mismo método:

C  0.9032(744)  672
F  0.0672(744)  50
I  744  672  50  22

Por último los totales de columna se obtienen sumando los valores de cada columna:

K  1569  1506  672  3747


L  134  117  50  301
M  75  49  22  146

El cuadro bidimensional resultante está mostrado en la tabla 9.5.1:

Tabla 9.5.1
Bidimensional del número de accidentes vs. edad

Edad/n° accidentes 0 1 2 Total


21-41 1569 134 75 1778
41’-61 1506 117 49 1672
61’-71 672 50 22 744
total 3747 301 146 4194

Fuente: Elaboración propia

El administrador de la unidad operativa de tránsito puede saber aproximadamente cuántos


nuevos conductores tendrán accidentes este año.

231
6. GENERALIZACIÓN DE LAS REGLAS PARA EL CÁLCULO DE
PROBABILIDADES

Se han mostrado las reglas para el cálculo de probabilidades cuando se tiene una distribución
bidimensional. Sin embargo se puede presentar el caso en el que existan ya no dos sino tres o
más clasificaciones. Para este tipo de problemas, se deberán generalizar las reglas para el
cálculo de probabilidades, para lo cual se considera un árbol que tiene tres ramificaciones o
eventos dependientes, cada uno de los cuales tiene dos resultados posibles (ver figura 9.6.1):

Figura 9.6.1. Arboligrama con tres ramificaciones

P. condicional P. conjuntas

P. condicional P(E/A,C)
E P(A, C, E)  P(A)  P(C / A)  P(E / A, C)
P. marginal P(C/A) C
P(F/A,C) F P(A, C, F)  P(A)  P(C / A)  P(F / A, C)
A
P(A) P(E/A,D) E P(A, D, E)  P(A)  P(D / A)  P(E / A, D)
P(D/A) D
P(F/A,D) F P(A, D, F)  P(A)  P(D / A)  P(F / A, D)

P(E/B,C) E P(B, C, E)  P(B)  P(C / B)  P(E / B, C)


P(C/B) C
P(F/B,C) F P(B, C, F)  P(B)  P(C / B)  P(F / B, C)
P(B)
B
P(E/B,D) E P(B, D, E)  P(B)  P(D / B)  P(E / B, D)
P(D/B) D
P(F/B,D) F P(B, D, F)  P(B)  P(D / B)  P(F / B, D)

Fuente: Elaboración propia

El lector puede darse cuenta qué pasaría si existen 4 eventos dependientes (en la cuarta
ramificación también se tendrían probabilidades condicionales).

Regla de la suma:

La suma de tres eventos dependientes, por ejemplo de los tres primeros, será:

P(A  C  E)  P(A)  P(C)  P(E)  P(A, C)  P(A, E)  P(C, E)  P(A, E, C)

El uso de diagramas de Venn puede ayudar a visualizar y comprender de mejor manera la


relación entre tres eventos. En la figura se puede observar que los círculos de tres eventos
dividen el espacio muestral en 8 zonas numeradas y es sencillo determinar si los eventos
correspondientes pertenecen a X o X’, a Y o Y’ y a Z o Z’ (ver figura 9.6.2)

232
Figura 9.6.2. Diagrama de Venn para tres eventos

X Y

2
7 5
1
4 3

6
8

Z
S

Fuente: Freund y Simon. Estadística Elemental, 1994.

Ejemplo 1

Si en el anterior diagrama, X es el evento de que servirán hamburguesas en el día de campo


de la compañía, Y es el evento de que se servirá cerveza y Z es el evento de que se servirá
una torta de chocolate, exprese con palabras los eventos que se representan por medio de las
siguientes zonas del diagrama de Venn:

a) Zona 3.
b) Zonas 1 y 2.
c) Zonas 4, 6, 7 y 8.

Resolución.

a) Puesto que esta zona parte de Y y Z, pero no de X, representa el evento de que en el día de
campo se servirá cerveza y torta de chocolate, pero no hamburguesas.

b) Ya que esta zona pertenece tanto a X como a Y, representa el evento de que se servirán
hamburguesas y cerveza

c) Dado que estas zonas son ajenas a Y, constituye el evento de que no se servirá cerveza.

Ejemplo 2

Con base en el siguiente diagrama de Venn (ver figura 9.6.3), sea A el evento de que un
ejecutivo de alto rango de una compañía esté en la cafetería de su empresa, B el evento de
que se encuentre en la oficina de otro ejecutivo y C el evento de que se encuentre jugando al
golf con un cliente. Halle la probabilidad de que una persona en un momento específico lo
encuentre en alguno de esos tres lugares.

233
Figura 9.6.3. Diagrama de Venn para encontrar a un ejecutivo

A B
0.24 0.06 0.19

0.04

0.16 0.11

0.09
C

S
Fuente: Freund y Simon. Estadística Elemental, 1994.

Resolución.

Siguiendo la ecuación de la suma de tres eventos, se tiene:

P(A  B  C)  P(A)  P(B)  P(C)  P(A, B)  P(A, C)  P(B, C)  P(A, B, C)

Reemplazando valores:

P(A  B  C)  0.24  0.19  0.09  0.06  0.16  0.11  0.04  0.23

Respuesta: La probabilidad de que una persona encuentre al ejecutivo en alguno de los tres
lugares es del 23%.

Acción: Como la probabilidad es pequeña, si una persona quiere encontrarlo lo más lógico es
buscarlo en otros sitios, como su oficina o la sala de reuniones de la empresa.

7. DISTRIBUCIONES BIDIMENSIONALES DE PROBABILIDADES

Al igual que existen funciones unidimensionales de probabilidad de cuantía (cuando la variable


aleatoria es discreta) y de densidad (cuando la variable aleatoria es continua), tratadas en el
capítulo de Distribución de Probabilidades, también se presentan los casos de funciones
bidimensionales de probabilidades.

7.1. Función de cuantía conjunta y marginal

La observación conjunta de dos variables aleatorias, ambas discretas, da lugar al concepto de


variable aleatoria discreta bidimensional: valores de la variable x y valores de la variable y, con
sus probabilidades de ocurrencia conjunta respectiva; es decir cada par de valores x i yj lleva
asociada la correspondiente probabilidad conjunta Pij. Estas variables suelen presentarse en
una tabla de doble entrada (ver tabla 9.7.1). La consideración de los valores x i con sus
correspondientes probabilidades de ocurrencia independiente de los valores de y, da lugar a la
distribución marginal de la variable x. Los mismo ocurre con la variable y.

234
Tabla 9.7.1
Función de cuantía conjunta

y y1 y2 ... ys Total
j
xi
x1 P11 P12 ... P1s P1j
x2 P21 P22 ... P2s P2j
: : : : : :
xr Pr1 Pr2 ... Prs Prj
Total Pi1 Pi2 … Pis r s

P
i =1 j =1
ij 1

Fuente: Elaboración propia

Nota 1: También se puede dar una distribución de probabilidades para atributos o mixtos.

Nota 2: Las distribuciones marginales, cuya denominación deriva del simple hecho de que se
encuentran en los márgenes de la tabla de doble entrada, como cualquier otra distribución
unidimensional, son susceptibles de tratamiento estadístico individual.

Ejemplo

Se realizó una encuesta a 30000 habitantes de una determinada ciudad. Se obtuvo la siguiente
distribución en cuanto a su estado civil y sexo.

Estado civil Soltero Casado Viudo Total


Sexo
Masculino 8052 5815 542 14743
Femenino 8384 5989 1218 15257
Total 16436 11804 1760 30000

Determine la distribución bidimensional conjunta y marginal de ambos atributos.


Resolución.

 Para hallar las probabilidades conjuntas, simplemente se divide cada frecuencia absoluta
conjunta entre el total de encuestados. Para hallar las probabilidades marginales, se suman
las probabilidades conjuntas halladas (ver tabla 9.7.2).

Tabla 9.7.2
Bidimensional de probabilidades de estado civil vs sexo (Pi, j)

Estado civil Soltero Casado Viudo Total


Sexo
Masculino 26.84 19.38 1.81 49.14
Femenino 27.95 19.96 4.06 50.86
Total 54.79 39.35 5.87 100.00
235
Fuente: Elaboración propia
Interpretación:

PM,S = 26.84, significa: Existe una probabilidad del 26.84% de que una persona elegida al azar
sea de sexo masculino y soltero.

PV = 5.87, significa: Hay una probabilidad del 5.87% de que la persona elegida al azar sea
viuda.

PF = 50.86, significa: La probabilidad de que una persona elegida al azar sea de sexo femenino
es de 50.86%.

7.2. Función de densidad conjunta y marginal

Una distribución de probabilidad, cuando corresponde a una variable aleatoria continua


bidimensional (también llamada superficie de frecuencia), requiere cumplir con las dos
condiciones siguientes:

a) f (x, y)  0
 
b)  
 
f (x, y) dx dy  1 ; para:   x   y   y  

Luego: 0  f (x, y)  1

La probabilidad que el par (x,y) sea para a1  x  b1 ; y para a 2  y  b 2 , se expresa de la


siguiente manera:
b1 b2
P(a1  x  b1 ;a 2  y  b 2 )    f (x, y) dx dy
a1 a2

La distribución bidimensional de probabilidades de variable aleatoria continua tiene dos


distribuciones marginales:

f 1 (x ) =  f (x, y ) dy

distribución marginal de "x"

f 2 (y ) =  f (x, y ) dx

distribución marginal de "y"

La distribución de probabilidad acumulada para la variable aleatoria bidimensional continua:

x o y0
F ( x o, y o ) =   f (t , t
 
1 2 ) dt 1 dt 2

donde t1 y t2 son variables auxiliares de trabajo.

Para expresar la probabilidad de que la variable xi esté en el par (x1, y1) y que la variable yj esté
236
en el par (x2, y2) en términos de la función de distribución, se procede de la siguiente manera:

 Se usa un sistema de ejes coordenados, donde en el eje de las abscisas se representan


valores de xi y en el eje de ordenadas los valores de yj .

 En cada eje se representan los valores del par (a1,b1) y del par (a2,b2).

 Se obtiene un cuadrilátero con los siguientes puntos de coordenadas que se observan en el


gráfico 9.7.1.

Gráfico 9.7.1
Área bajo la función de densidad de probabilidad
yj

(a1, b2) (b1, b2)


b2

(a1, a2)
(b1, a2)
a2

a1 b1 xi

Fuente: Elaboración propia

 Las áreas diferentes en el gráfico permiten determinar la probabilidad:

P(a1 < x < b1 ; a2 < y < b2) = F(b1 , b2) - F(b1 , a2) - F(a1 , b2) + F(a1 , a2)

b1 b2
 
a1 a2
f (x, y) dx dy

Conocida la forma de cálculo de una probabilidad conjunta y de la probabilidad marginal es


posible definir la probabilidad condicional:

f (x, y )
(1 ) f (x /y ) = si f 2 (x ) > 0
f 2 (y )
f (x, y )
(2 ) f (y /x ) = si f 1 (x ) > 0
f 1 (x )

Ejemplo 1

Suponga que la función de densidad de probabilidad conjunta para las variables no negativas x
e y es f (x, y)  xe  x e  y . Halle la probabilidad que 0  x  1 y 0  x  2 .

Resolución
237
 La integral a resolver es la siguiente:
1 2
P(0  x  1;0  y  2)    xe  x e  y dy dx
0 0

 Se resuelve primero la integral interna:

2
y 2 1 e2  1

y 2
e dy  e  e  1   2  1  2
0 0 e e

 Se reemplaza la integral interna y se resuelve la integral externa:

 e2  1 1  x  e2  1  x 1
1
  e2  1 1
 e 2  0 0  
x x x
xe dx   e 2    xe  e dx   xe  e
   
0   e 2   0

 e2  1  e 2  1   2   e2  1   e  2 
 e2     2e 1
 1
  e2   e  1   e 2   e   0.2285

       

Conclusión: La probabilidad conjunta que 0  x  1 y 0  x  2 es del 22.85%.

Ejemplo 2

Suponga que x representa el tiempo (en minutos) que una persona pasa con un agente
mientras elige una póliza de seguro de vida e y el tiempo que el agente emplea en hacer el
papeleo una vez que el cliente se ha decidido. Usted acuerda encontrarse con un agente de
seguros para suscribir una póliza de seguro de vida. Si la función de densidad de probabilidad
conjunta de x e y es:
1  30x 10y
f (x, y)  e e
300
Halle la probabilidad de que la operación requiera más de media hora.

Resolución.

Se quiere hallar: P(x  y  30)  1  P(x  y  30)

 Se dibuja la inecuación y se plantea la región de integración:

30 Región:
y  30  x

30 238
 Se plantea la integral:

30 30  x 1  30x 10y
P(x  y  30)    e e dy dx
0 0 300
Se resuelve:

30  x
10 30   30x 10y  1 30  30x  x10
30

300 0 
 e e  dx    e  e  1 dx
 0
30 0  
30
1  30 2x3090 30 
x
 1  30 2x3090  
x
   e dx   e dx     e
30
 30 e 
30
30  0 0
 30  2 0

1 1 1
  3   1  0.4730
2e 2e e

La probabilidad buscada es:

P(x  y  30)  1  P(x  y  30)  1  0.4730  0.5269

Respuesta: La probabilidad de que la operación completa requiera más de media hora es de


52.69%.

Acción: Si usted no tiene disponibilidad de media hora, entonces vuelva a programar su cita
para obtener una póliza de seguro de vida.

8. APLICACIONES A LOS ÁRBOLES DE DECISIÓN Y TEORÍA DE LA UTILIDAD 1

8.1. Introducción

Los problemas con pocas alternativas y estados de la naturaleza pueden ser analizados
usando tablas de decisión. Ahora iremos un paso más adelante en la exploración de la teoría
de la decisión, introduciendo los tópicos de árboles de decisión, valoración de probabilidades y
teoría de la utilidad.

8.2. Árboles de decisión

Cualquier problema que puede ser presentado en una tabla de decisión, también puede ser
ilustrado gráficamente en un árbol de decisión. Tomemos otra visión al caso de la compañía
maderera Thompson. Podemos recordar que John Thompson estaba tratando de decidir si le
1 Esta porción ha sido extractada totalmente del libro: Quantitative Analysis for Management.
Render y Stair, 1997.
239
convenía expandir su operación construyendo una nueva planta para la producción de cabañas
de almacenamiento. Un árbol de decisión simple para representar la decisión de John es
mostrado en la figura 9.8.1.

Beneficios
EMV=10000 $
Nodo de estado de
la naturaleza Mercado favorable (0.5)
200000 $
Nodo de decisión
1 Mercado desfavorable (0.5)
Construir planta -180000 $
grande
Mercado favorable (0.5)
100000 $
Construir planta
pequeña 2
Mercado desfavorable (0.5)
-20000 $
No hacer nada
EMV=40000 $
0$

Figura 9.8.1. Árbol de decisión de Thompson

Note que los beneficios están localizados en el lado derecho de cada una de las ramas del
árbol de decisión. Las probabilidades son localizadas en paréntesis a continuación de cada
estado de la naturaleza. Los valores monetarios esperados para cada nodo de estado de la
naturaleza están calculados y localizados en sus respectivos nodos. El EMV del primer nodo es
10000 $. Esto representa la rama del nodo de decisión de construir una planta grande. El EMV
para el nodo 2, construir una planta pequeña, es 40000 $. No construir nada, por su puesto
tiene un beneficio de 0 $. Es escogida la rama que tiene el nodo de estado de la naturaleza que
contiene el mayor EMV. En el caso de Thompson, se escoge construir una planta pequeña.

Una decisión más compleja para la maderera Thomspon

Cuando se necesita realizar una secuencia de decisiones, los árboles de decisión son
herramientas mucho más poderosas que las tablas de decisión. Digamos que John Thompson
tiene que realizar dos decisiones, y la segunda depende del resultado de la primera. Antes de
decidir si construir una nueva planta, John tiene la opción de llevar a cabo su propio estudio de
investigación de mercado, a un costo de 10000 $. La información de su estudio podría ayudarlo
a decidir si construir una planta grande, pequeña o no hacer nada. Él reconoce que este
estudio de mercado no le proveerá una información perfecta, pero puede ayudarlo un poco de
cualquier manera.

El nuevo árbol de decisión de John está representado en la figura 9.8.2. Observemos


cuidadosamente a este árbol mucho más complejo. Note que todos los resultados poribles y
alternativas están incluidas en su secuencia lógica, esta es una de las fortalezas al usar árboles
de decisión para realizar decisiones. El que los usa está forzado a examinar todas las posibles
soluciones, incluyendo las desfavorables, y también a realizar decisiones en una manera lógica
secuencial.
240
106400 $ Mercado favorable (0.78) 190000 $
Segunda
decisión
2 Mercado desfavorable (0.22) -190000 $
Planta
grande Mercado favorable (0.78)
63600 $
90000 $
Planta
pequeña 3
Mercado desfavorable (0.22)
Primera -30000 $
decisión Resultado 106400 $ No hacer nada
favorable -10000 $
(0.45)
49200 $
-87400 $ Mercado favorable (0.78) 190000 $
1
Resultado 4 Mercado desfavorable (0.22) -190000 $
desfavorable Planta
Con estudio (0.55) grande Mercado favorable (0.78)
2400 $
90000 $
Planta
pequeña 5
Mercado desfavorable (0.22)
-30000 $
2400 $
No hacer nada
-10000 $
49200 $
Mercado favorable (0.78) 200000 $
10000 $
Sin
estudio 6 Mercado desfavorable (0.22) -180000 $
Planta
grande Mercado favorable (0.78)
40000 $
100000 $
Planta
pequeña 7
Mercado desfavorable (0.22)
-20000 $
40000 $
No hacer nada
0$

Figura 9.8.2. Árbol de decisión completo para la maderera Thompson

Examinando el árbol, vemos que el primer punto de decisión de Thompson es si llevar a cabo o
no el estudio de mercado de 10000 $. Si escoge no hacer el estudio (La parte baja del árbol),
puede construir una planta grande, pequeña o no hacer nada. Este es el segundo punto de
decisión de John. El mercado puede ser favorable (0.5 de probabilidad) o desfavorable (0.5) si
construye. Los beneficios para cada consecuencia posible están listados en el lado derecho.
De hecho, la porción más baja del árbol de decisión es idéntica al árbol de decisión simple
mostrado en la figura 1. ¿Por qué es así?

La parte superior de la figura refleja la decisión de llevar a cabo un estudio de mercado. El


estado de la naturaleza del nodo 1 tiene dos ramas. Hay un 45 % de posibilidades que los
resultados del estudio de mercado indicarán un mercado favorable para las cabañas de
almacenamiento. También hay una probabilidad de 0.55 que los resultados de la encuesta
sean negativos.

El resto de las probabilidades mostradas en paréntesis en la figura son probabilidades


condicionales. Por ejemplo 0.78 es la probabilidad de un mercado favorable para las cabañas
dado un resultado favorable del estudio de mercado. Por supuesto, se podría esperar encontrar
una alta probabilidad de un mercado favorable dado que la investigación indicó que el mercado
241
era bueno. No se debe olvidar, que hay una posibilidad de que la encuesta de mercado de
10000 $ no resulte beneficiosa o aun no entregue información confiable. Cualquier estudio de
mercado está sujeto a error. En este caso, hay un 22% de probabilidad de que el mercado para
las cabañas sea desfavorable dado que los resultados de la encuesta son positivos.

Note que hay un 27% de probabilidad de que el mercado para cabañas sea favorable dado que
los resultados de la encuesta resulten negativos. Hay una probabilidad mucho más alta de 0.73
que el mercado sea desfavorable dado que el estudio de mercado fue negativo.

Finalmente, cuando observamos la columna de los beneficios, vemos que el costo del estudio
de mercado (10000 $) ha sido sustraído de cada una de las 10 ramas de arriba. Una planta
grande con un mercado favorable debería normalmente arrojar un beneficio neto de 200000 $,
pero debido a que fue realizado un estudio de mercado, éste se reduce a 190000 $. Se
procede de manera similar en las otras 9 ramas.

Con todas las probabilidades y beneficios especificados, podemos comenzar a calcular el valor
monetario esperado de cada una de las ramas. Comenzamos por el final, o del lado derecho
del árbol y trabajamos hacia atrás hacia el origen. Cuando terminemos, la mejor decisión será
conocida.

1. Dado un resultado favorable en la encuesta:

EMV (nodo 2)  EMV (planta grande / estudio positivo)


EMV ( nodo 2)  0.78(190000)  0.22(190000)  106400

EMV ( nodo 3)  EMV ( planta pequeña / estudio positivo)


EMV (nodo 3)  0.78(90000)  0.22(30000)  63600

El EMV de no construir una planta es –10000 $ para esta rama. Entonces, si el resultado de la
encuesta es favorable, debería construir una planta grande.

2. Dado un resultado negativo en la encuesta:

EMV (nodo 4)  EMV(planta grande / estudio negativo)


EMV (nodo 4)  0.27(190000)  0.73( 190000)  87400

EMV (nodo 5)  EMV (planta pequeña / estudio negativo)


EMV (nodo 5)  0.27(90000)  0.73( 300000)  2400

El EMV de no construir una planta es –10000 $ para esta rama. Entonces, dado un resultado
negativo en el estudio de mercado, John debería construir una planta pequeña, con un valor
esperado de 2400 $.

3. Continuando en la parte superior del árbol y moviéndose hacia atrás, calculamos el valor
esperado de llevar a cabo el estudio de mercado.

EMV (nodo1)  EMV (Re alizar estudio)


EMV (nodo1)  0.45(10640)  0.55(2400)  49200

242
4. Si la encuesta de mercado no es llevada a cabo:

EMV ( nodo 6)  EMV( planta grande)


EMV (nodo 6)  0.50(200000)  0.50(1800000)  10000

EMV (nodo 7)  EMV (planta pequeña )


EMV (nodo 7)  0.50(100000)  0.50(20000)  40000

El EMV por no construir es 0 $.

Entonces, construir una pequeña planta es la mejor elección, dado que el estudio de mercado
no ha sido realizado.

5. Puesto que el valor monetario esperado de llevar a cabo la encuesta es 49200 $ versus un
EMV de 40000 por no llevar a cabo el estudio, la mejor elección es buscar información del
mercado. Si los resultados de la encuesta son favorables, John debería construir una planta
grande; pero si la investigación es negativa, debería construir una pequeña.

En la figura 2, los valores esperados han sido localizados en el árbol de decisión. Note que los
pares de líneas // cruzando una rama indica que la alternativa ha sido eliminada. Esto es
debido a que su EMV ha sido más bajo que la mejor alternativa.

Valor esperado de la información muestral

Con el estudio de mercado que llevó a cabo, John Thompson sabe que es mejor decisión
construir una planta grande si el estudio es favorable o una planta pequeña si la encuesta
resulta negativa; pero John sabe que realizar un estudio de mercado no es gratis. Sería bueno
saber cuál es el valor verdadero de realizar el estudio de mercado. Una forma de medir el valor
de la información del mercado es calcular el valor esperado de la información muestral (EVSI).

 valor esperado de la mejor   Valor esperado 


   
 decisión con inf ormación   de la mejor 
EVSI     
muestral asumiendo decisión sin
   
 que no hay cos to   
   inf ormación muestral 

En el caso de John, su EMV debería ser 59200 $ si no se hubiera sustraído los 10000 $ del
estudio de cada beneficio. El EMV de no obtener la información muestral es de 40000 $.
Entonces:

EVSI  59200  40000  19200

Esto significa que John podría haber pagado hasta 19200 $ por un estudio de mercado y aún
salir adelante. Puesto que sólo le costó 10000 $, la encuesta valió la pena.

8.3. Estimación de probabilidades mediante análisis bayesiano


243
Hay muchas maneras de obtener los datos de probabilidad para un problema como el de
Thompson. Los valores (0.78, 0.22, 0.27, 0.73 en la figura 9.8.2) pueden ser evaluados por un
administrador basado en su experiencia e intuición; pueden ser estimados de datos históricos o
ser calculados de otros datos disponibles usando el teorema de Bayes. Ahora discutiremos la
última opción.

El enfoque del teorema de Bayes establece que el tomador de decisiones no conoce con
certeza qué estado de la naturaleza ocurrirá. Esto permite al administrador revisar sus
valoraciones de probabilidad iniciales. Las probabilidades revisadas, son llamadas
probabilidades posteriores.

Calculando probabilidades revisadas

En el caso de la maderera Thompson, hicimos la suposición de que eran conocidas las


siguientes cuatro probabilidades condicionales:

P ( MF / positivo )  0.78
P(MD / positivo)  0.22
P( MF / negativo)  0.27
P( MD / negativo)  0.73

Mostraremos cómo John Thompson podría derivar esos valores con el teorema de Bayes.

De discusiones con especialistas en investigación de mercados de una universidad local, John


sabe que las encuestas especiales, tal como es la suya, puede ser positiva (es decir, predecir
un mercado favorable) o negativa (predecir un mercado desfavorable). Los expertos le han
dicho a John que, estadísticamente, de todos los nuevos productos que tienen mercado
favorable (MF), las encuestas de mercado son positivas y predicen éxito correctamente un 70%
de las veces. 30% de las veces las encuestas predicen falsamente resultados negativos o un
mercado desfavorable. (MD). Por otro lado, cuando había un mercado desfavorable para un
nuevo producto, 80% de las encuestas predecían correctamente resultados negativos. Las
encuestas predecían incorrectamente resultados positivos el restante 20% de las veces. Estas
probabilidades condicionales son resumidas en la tabla 9.8.1. Hay una indicación de la
precisión de la encuesta que John está pensando como garantía.

Tabla 9.8.1
Probabilidades condicionales para la maderera Thompson

Estados de la naturaleza
Resultados de la encuesta
Mercado favorable (MF) Mercado desfavorable (MD)
Positivo (predice mercado P ( positiva / MF)  0.70 P(positiva / MD)  0.20
favorable para el producto)
Negativo (predice resultado P(negativa / MF)  0.30 P(negativa / MD)  0.80
desfavorable para el producto)

Recordemos que sin ninguna información de mercado, los mejores estimados de John de un
mercado favorable o desfavorable son:

244
P( MF)  0.50
P( MD)  0.50

Estas son llamadas como probabilidades iniciales.

Con todo esto podemos realizar un diagrama de árbol de la siguiente manera:

Positivo
0.70

MF
0.5
0.30
Negativo

0.20 Positivo
0.5
MD

0.80
Negativo

Podemos ahora calcular las probabilidades posteriores o revisadas de Thompson. Éstas son
las inversas de las probabilidades de la tabla 9.8.1.

Primero se calculan las probabilidades totales de obtener un resultado positivo en la encuesta y


la de obtener un resultado negativo:

P(Positivo)  0.5(0.7)  0.5(0.2)  0.45


P( Negativo)  0.5(0.3)  0.5(0.8)  0.55

Ahora se calculan las probabilidades mediante el teorema de Bayes:

0.5(0.7)
P( MF / positivo)   0.78
0.5(0.7)  0.5(0.3)

0.5(0.2)
P( MD /´positivo)   0.22
0.5(0.7)  0.5(0.3)

0.5(0.3)
P(MF / negativo)   0.27
0.5(0.3)  0.5(0.8)

0.5(0.8)
P(MD / negativo)   0.73
0.5(0.3)  0.5(0.8)
MF
0.78
Estas probabilidades se pueden resumir en el siguiente arboligrama:
Positivo
0.45
0.22
MD
245
0.27 MF
0.55
Negativo

0.73
MD
Las probabilidades posteriores ahora proveen a John Thompson estimados de cada estado de
la naturaleza si los resultados de la encuesta son positivos o negativos.

8.4. Teoría de la utilidad

Hemos usado el EMV para realizar decisiones. En la práctica, sin embargo, el uso del EMV
puede conducir a malas decisiones en muchos casos. Por ejemplo, suponga que es el feliz
propietario de un cartón de lotería. Después de 5 minutos una simple moneda puede ser
lanzada, y si sale cruz podrías ganar 5 millones, pero si sale cara, podrías no ganar nada. Justo
un momento antes, una persona rica te ofrece 2 millones por tu boleto. Vamos a asumir que no
tienes dudas sobre la validez de la oferta. La persona te dará un cheque certificado por la
cantidad, y estás absolutamente seguro que el cheque tiene fondos.

Un árbol de decisión es mostrado en la figura 9.8.3. El EMV dice que deberías retener tu
boleto, pero ¿qué deberías hacer realmente? Solo piensa, 2 millones asegurados versus un
50% de probabilidad de no obtener nada. Haz la suposición que tú eres lo suficientemente
codicioso para retener tu boleto, y luego pierdes. ¿Cómo lo explicarías a tus amigos? ¿Acaso
no debería ser suficiente 2 millones para estar confortable por un tiempo?

Aceptar la
2000000 $
oferta

Cruz (0.5)
0$
Rechazar la
1 Cara (0.5)
oferta
5000000 $

EMV=2500000 $

Figura 9.8.3. Árbol de decisión para el boleto de la lotería


La mayoría de la gente vendería su boleto por 2 millones. La mayoría de nosotros de hecho,
estaría dispuesta a hacerlo por una cantidad mucho menor. En cuánto podemos soltar el
boleto, por supuesto, es algo que tiene que ver con preferencias personales. Las personas
tienen diferentes sentimientos acerca de buscar o evitar el riesgo. El EMV no es una buena
forma para realizar ese tipo de decisiones.
246
Medida de la utilidad y construcción de una curva de utilidad

La valoración de la utilidad, se inicia asignando al peor resultado una utilidad de 0 y al mejor


resultado una utilidad de 1. Todos los demás resultados tendrán un valor de utilidad entre 0 y 1.
Para determinar las utilidades de los demás resultados, se considera un riesgo estándar. Este
riesgo es mostrado en la figura 9.8.4.

p
Mejor resultado
Utilidad 1
Alternativa 1
1-p
Peor resultado
Utilidad 0

Alternativa 2 Otro resultado


Utilidad ?

Figura 9.8.4. Riesgo estándar para la valoración de la utilidad

En la figura 4, p es la probabilidad de obtener el mejor resultado, y 1-p es la probabilidad de


obtener el mejor resultado. Para valorar la utilidad de cualquier otro resultado involucra la
determinación de la probabilidad, p, que hace que seas indiferente entre la alternativa 1, que es
el riesgo entre el mejor y el peor resultado, y la alternativa 2, que es obtener el otro resultado
de forma segura. Cuando eres indiferente entre las alternativas 1 y 2, las utilidades esperadas
para esas dos alternativas deben ser iguales. Esta relación está mostrada como:

Utilidad esperada de la alternativa 2  Utilidad esperada de la alternativa 1


Utilidad de otro resultado  p(1)  (1  p)(0)  p

Ahora, todo lo que tenemos que hacer es determinar el valor de la probabilidad p, que hace que
seas indiferente entre las alternativas 1 y 2. Para establecer esta probabilidad debes estar
conciente que la valoración de la utilidad es completamente subjetiva. Esto es un valor
establecido por el tomador de decisión que no puede ser medida en una escala objetiva.
Veremos un ejemplo.

Jane Dickson quiere construir una curva de utilidad que revele su preferencia por su dinero
entre 0 y 10000 $. Una curva de utilidad es una gráfica que relaciona el valor de la utilidad
versus el valor monetario. Ella puede invertir su dinero en una cuenta de banco o puede invertir
el mismo dinero en un bien inmueble.

Si el dinero es invertido en el banco, en tres años Jane debería tener 5000 $. Si invierte en
bienes raíces, después de tres años ella podría no tener nada o 10000 $. Jane sin embargo, es
muy conservadora. Si bien hay un 80% de probabilidad de conseguir 10000 $ de los bienes
raíces, Jane podría preferir tener su dinero en el banco, dónde está seguro. Lo que Jane hizo
aquí es asegurar su utilidad de 5000 $. Cuando hay un 80% de probabilidad (esto significa que
p es 0.8) de conseguir 10000 $, Jane es indiferente entre poner su dinero en bienes raíces y
ponerlo en el banco. La utilidad de Jane de 5000 $ es entonces igual a 0.8, que es la misma
que el valor para p. Esta valoración de la utilidad está mostrada en la figura 9.8.5.

247
P = 0.8
10000 $
U=1
Invertir en
Bienes raíces 1-p = 0.2
0$
U=0

Invertir en el 5000 $
banco U = p = 0.8

Figura 9.8.5. Utilidad de 5000 $

Otro valor de la utilidad puede ser valorado de la misma manera. Por ejemplo, ¿cuál es la
utilidad de Jane para 7000 $? ¿Cuál es el valor de p que haría que Jane sea indiferente entre
7000 $ y el riesgo que podría resultar de 10000 $ o 0 $? Para Jane, existe una probabilidad del
90% de conseguir los 10000 $. Por otro lado, ella preferiría tener los 7000 $ asegurados.
Entonces, su utilidad para 7000 $ es 0.9. La utilidad de Jane para 3000 $ puede ser
determinada de la misma manera. Si había un 50% de probabilidad de obtener los 10000 $,
Jane debería ser indiferente entre tener 3000 $ asegurados y tomar el riesgo de ganar 10000 $
o nada. Entonces la utilidad de 3000 $ para jane es 0.5. Por supuesto, este proceso puede
continuar hasta que Jane ha valorado su utilidad para tantos valores monetarios como ella
quiera. Sin embargo, estas valoraciones son suficientes para determinar una idea de los
sentimientos de Jane hacia el riesgo. De hecho, podemos graficar estos puntos en una curva
de utilidad, como se muestra en la gráfico 9.8.1.

1 1
0.9 0.9
0.8 0.8
0.7
0.6
Utilidad

0.5 0.5
0.4
0.3
0.2
0.1
0 0
0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000
Valor monetario

Gráfico 9.8.1. Curva de utilidad para Jane Dickson

La curva de utilidad de Jane es típica de un adverso al riesgo. Un adverso al riesgo es un


tomador de decisiones que consigue la menor utilidad o satisfacción de un riesgo grande y
tiende a evitar situaciones en las que pueden ocurrir grandes pérdidas. A medida que el valor
monetario incrementa en su curva de utilidad, la utilidad se incrementa a una tasa menor.

El gráfico 9.8.2 ilustra a una persona que es un buscador del riesgo, en oposición a una que es
adversa al riesgo. Este tomador de decisiones consigue más utilidad de un gran riesgo y más
248
alto beneficio potencial. A medida que el valor monetario se incrementa en su curva de utilidad,
la utilidad incrementa a una tasa ascendente. Una persona que es indiferente al riesgo tiene
una curva de utilidad que es una línea recta. La forma de la curva de utilidad de una persona
depende de la decisión específica que está siendo considerada, el trasfondo psicológico de la
persona, y los sentimientos acerca del futuro. Puede darse que tengas una curva de utilidad
para algunas situaciones y curvas muy diferentes para otras.

1
0.9
0.8
0.7
Utilidad

0.6
0.5
0.4
0.3
0.2
0.1
0
0 2000 4000 6000 8000 10000
Valor monetario

Adverso al riesgo Buscador del riesgo


Indiferente al riesgo

Gráfico 9.8.2. Preferencias frente al riesgo

La utilidad como criterio para tomar decisiones

Después que la curva de utilidad ha sido determinada, los valores de utilidad de la curva son
usados para realizar decisiones. Los valores o resultados monetarios son reemplazados con
los valores apropiados de la utilidad y entonces es desarrollado el análisis de decisión usual.
Veamos un ejemplo.

Mark Simkin ama el riesgo. El decide jugar un juego que consiste en lanzar una chincheta al
aire. Si el punto sobre la chincheta está orientado al cielo, Mark gana 10000 $. Si el punto
sobre la chincheta está abajo, pierde 10000 $. ¿Debe Mark jugar el juego (alternativa 1) o no
(alternativa 2)?

Las alternativas 1 y 2 son desplegadas en el árbol mostrado en la figura 9.8.6. Como se puede
observar la alternativa 1 consiste en participar en el juego. Mark cree que hay 45% de
probabilidad de ganar 10000 $ y un 55% de perder 10000 $. La alternativa 2 es no participar en
el juego. ¿Qué debe hacer Mark? Por supuesto, esto depende de la utilidad de Mark hacia el
dinero. Como establecimos previamente él ama el riesgo. Usando el procedimiento descrito
anteriormente, Mark es capaz de construir una curva de utilidad mostrando su preferencia hacia
el dinero. Esta curva aparece en el gráfico 9.8.3.

Tachuela con punto arriba (0.45)


10000 $
Alternativa 1
Jugar Tachuela con punto abajo (0.55)
-10000 $

249
Alternativa 2 0$
No jugar
Figura 9.8.6. Orientación de la decisión de Mark Simkin

0.6

0.5

0.4
Utilidad

0.3 0.3

0.2
0.15
0.1
0.05
0 0
-20000 -10000 0 10000 20000
Valor monetario

Gráfico 9.8.3. Curva de utilidad de Mark Simkin

Podemos ver que la utilidad de Mark para –10000 $ es 0.05, su utilidad por no jugar (0 $) es de
0.15, y su utilidad para 10000 $ es de 0.30. Esos valores pueden ser usados en el árbol de
decisión. El objetivo de Mark es maximizar su utilidad esperada, que peude calcularse como
sigue:

Paso 1.

U (10000 $)  0.05
U (0 $)  0.15
U (10000 $)  0.30

Paso 2. Reemplazar los valores monetarios con valores de utilidad. Refiriéndose a la figura
9.8.7, las utilidades para las alternativas 1 y 2 son:

250
Utilidad
Tachuela con punto arriba (0.45)
0.30
Alternativa 1
Jugar Tachuela con punto abajo (0.55)
0.05

E=0.1625

Alternativa 2 0.15
No jugar

Figura 9.8.7. Uso de utilidades esperadas en la toma de decisiones

E (alternativa 1)  0.45(0.30)  0.55(0.05)  0.1625


E (alternativa 2)  0.15

Por consiguiente, la alternativa 1 es la mejor estrategia usando la utilidad como criterio de


decisión. Si sería usado el EMV, la alternativa 2 habría sido la mejor estrategia. La curva de
utilidad es una de un buscador de riesgo, y la elección de jugar el juego ciertamente refleja su
preferencia por el riesgo.

251
EJERCICIOS DE CLASE

Distribuciones bidimensionales

Tipo I

1. Una investigación de mercado reveló que las ventas semanales de una nueva barra de
caramelo se relacionaron con su precio como sigue. Interprete la información contenida en la
tabla.

Precio Ventas semanales


(centavos) (miles de barras)
50 23.2
55 19.4
60 16.9
65 15.7

Tipo II y III

2. Se sabe que el consumo de las personas (yi) depende de los ingresos que perciben (xi).
Para un grupo de 50 personas se tienen la siguiente información en cientos de bs.:

xi: 4 9 15 15 9 4 9 15 4 9 4 15 9 4 15 9 4 15 9 15 4 15 9 4 15
yi: 1 6 5 1 10 3 11 6 4 4 6 11 5 11 10 1 2 4 7 9 2 7 2 1 8
xi: 9 9 15 15 15 9 15 9 15 4 15 9 15 9 15 9 15 4 15 9 15 9 15 9 15
yi: 12 14 12 15 14 13 13 15 12 5 13 5 14 9 15 12 13 5 9 4 10 1 11 8 12

a) Organice los datos en una distribución de frecuencias adecuada.


b) Presente la información sobre las frecuencias relativas, acumuladas, y relativas
acumuladas e interprete los valores.
c) Obtenga las distribuciones marginales de las dos variables.

Covarianza

Tipo I

3. Halle el grado de asociación entre las variables de la pregunta 1.

Tipo II y III

4. Tomando en cuenta la información de la pregunta 2, ¿Cuál es el grado de asociación que


existe entre las variables?

Atributos o mixtos

5. En una determinada empresa se hizo un examen a los 320 administrativos empleados en las
oficinas. Comparándose los resultados obtenidos con los errores mecanográficos cometidos
por cada uno de ellos durante un cierto espacio de tiempo, se elaboró la siguiente tabla de
doble entrada.
252
Errores cometidos Clasificación del examen Total

Óptimo Bueno Regular

0 – 10: Muy pocos 42 95 16 153


10 – 20: Pocos 29 56 32 117
20 – 30: Muchos 15 9 26 50
Total 86 160 74 320

Halle la asociación entre los distintos números de errores cometidos y la clasificación


obtenida en el examen.

Cálculo de probabilidades

6. Tomando en cuenta la información de la pregunta 2, hallar la probabilidad de:

a) tener un ingreso de 900 bs. y consumir entre 1100 a 1500 bs.


b) tener un ingreso de 400 bs.
c) consumir entre 100 a 300 bs.
d) consumir entre 500 a 1100 bs. o tener un ingreso de 900 bs.
e) consumir entre 1100 a 1500 bs o entre 300 a 500 bs.
f) tener un ingreso de 1500 bs. dado que se consume entre 100 a 300 bs.

Diagrama de árbol

7. El siguiente diagrama se refiere al número de unidades defectuosas producidas por cuatro


trabajadores operando tres diferentes máquinas, un día viernes.

35.577 M1

T1 M2 P( T1 , M 2 )  7.078 %
23.744
M3

34.234 M1 P ( T2 / M1 )  26 .207 %
T2 M2
P( M 1 )  33.105 %
M3

31.148 M1 P( M 3 )  33.790 %
27.854
T3 M2
P( T3 , M 3 )  9.361 %
M3

M1

T4
M2
253
37.624
M3
a) Determine la distribución bidimensional, que abarca a 438 unidades defectuosas.
b) ¿Qué porcentaje de las unidades defectuosas fueron producidas por el trabajador 4 o en
la máquina 2?

8. Pase la información de la pregunta 2, a un diagrama de árbol y responda los mismos incisos


de la pregunta 6.

Función de densidad conjunta

9. Suponga que x representa el tiempo (en minutos) que una persona pasa en la sala de
espera de cierto médico e y la duración (en minutos) de un examen físico completo. Usted
llega al consultorio para un examen físico, 50 minutos antes de tener que salir para una
reunión. Si la función de densidad de probabilidad conjunta de x e y es:

1 10x  50y
f (x, y)  e e
500

Halle la probabilidad de que usted salga tarde para su reunión.

254
EJERCICIOS PROPUESTOS

1. Se sabe que el consumo de las personas (y), depende de los ingresos que perciben (x). Para
un grupo de 50 personas, se tiene la siguiente información (cientos de bs.):

Ingresos Consumo
4 9 15
1- 5 8 7 3
5’ - 11 2 6 9
11’ - 15 0 5 10

a) ¿Cuál es la relación de asociación que existe entre las variables?


b) ¿Cuál es la probabilidad de consumir 15 bs?
c) ¿Cuál es la probabilidad de que una persona elegida al azar, tenga un ingreso entre 1100
y 1500 bs. y su consumo sea de 400 bs?
d) ¿Cuál es la probabilidad de que una persona elegida al azar, tenga un ingreso entre 1100
y 1500 bs. dado que su consumo sea de 400 bs?
e) ¿Cuál es la probabilidad de que una persona elegida al azar, tenga un ingreso entre 1100
y 1500 bs. o su consumo sea de 400 bs?

2. La información sobre horas trabajadas (x) y producción en cientos de unidades (y) en una
empresa es la siguiente:

horas Producción
trabajadas 5–9 9’ - 13 13’ - 17
1- 3 3 5 0
3’ - 7 2 4 1
7’ - 11 1 6 7
11’ - 13 2 3 6

a) Para la variable horas de trabajo, determine el histograma correspondiente.


b) Considere cada variable de manera independiente y determine cuál de ellas es más
homogénea.
c) Calcule la mediana de la distribución de la variable producción.
d) ¿Qué grado de relación tienen las variables?

3. Se realizó una encuesta a 50 familias con los resultados que figuran en la tabla:

Nº de hijos Nº de autos
1-2 3-4 5-6
1- 5 4 6 15
5’ - 11 3 2 4
11’ - 15 8 6 2

a) Determine la covarianza e interprete su resultado.


b) Con la distribución marginal del número de hijos, encuentre los límites del 50% central de
la distribución.

255
c) ¿Cuánto vale la varianza del número de autos? ¿Qué ocurriría con esta varianza si cada
familia se compra dos autos adicionales?

4. En un programa de entrenamiento para la gerencia de una empresa de cosméticos, 80% de


los asistentes son mujeres y 20% son hombres; 90% de las mujeres son egresadas de la
Universidad y 78% de los hombres También.

a) Se selecciona al azar una de las personas en entrenamiento. ¿Cuál es la probabilidad de


que se trate de una mujer que no asistió a la universidad?
b) Trace un arboligrama que muestre todas las probabilidades normales o marginales,
condicionales y conjuntas.

5. Cada vendedor en una compañía se califica como abajo del promedio, promedio, o arriba
del promedio, con respecto a su habilidad para las ventas. Además cada vendedor se
clasifica con respecto a sus posibilidades de promoción:

Habilidad en ventas Posibilidad de promoción


Regular Buena Excelente
Abajo del promedio 16 12 22
Promedio 45 60 45
Encima del promedio 93 72 135

a) Utilizando una de las reglas para combinar probabilidades, ¿cuál es la probabilidad de


que un vendedor seleccionado al azar tenga habilidad de ventas por encima del promedio
y excelentes posibilidades de promoción?
b) Trace un diagrama de árbol que muestre todas las probabilidades normales,
condicionales y conjuntas.

6. Se recopilaron datos sobre las horas que ven televisión (xi) y edad de los televidentes (yi):

xi: 2 5 5 4 4 5 2 4 5 5 2 4 5 4 4 2 5 5 4 5
yi: 3 6 13 15 3 6 5 7 11 8 5 4 15 5 9 9 10 12 10 5
xi: 2 4 5 5 4 5 4 2 5 4 5 4 2 5 4 4 4 5 2 5
yi: 6 6 3 9 3 12 4 7 7 5 4 8 3 8 4 6 9 7 4 4

a) Organice los datos en una distribución bidimensional de frecuencias absolutas. ¿Qué


grado de asociación existe entre dichas variables?
b) ¿Cuál es la probabilidad de ver 4 horas de televisión dado que el televidente tiene entre 3
a 7 años? ¿Cuál es la probabilidad de que el televidente tenga entre 11 - 15 años o de
que vea 2 horas? ¿Cuál es la probabilidad de que el televidente sea de 7 - 11 años?
¿Cuál es la probabilidad de que tenga entre 3 - 7 años y vea 4 horas?.

En los ejercicios 7 –10, emplee el teorema de Bayes:

7. Un equipo de béisbol juega 70% de sus partidos por la noche y 30% durante el día. El
equipo gana 50% de sus juegos nocturnos y 90% de los diurnos. De acuerdo con el diario
del día de hoy ganó ayer. ¿Cuál es la probabilidad de que el partido se haya desarrollado
por la noche?

256
8. Una profesora ha estado enseñando Estadística durante muchos años. Sabe que 80% de
los estudiantes completan los problemas asignados. Determinó que de los alumnos que
hacen las tareas 90% aprobarán el curso. De aquellos estudiantes que no realizan la tarea
completa solo 60% aprobarán. Miguel Sánchez tomó Estadística el último semestre con la
profesora y tuvo calificación aprobatoria. ¿Cuál es la probabilidad de que sí haya hecho las
tareas?

9. Tan solo el 20 % de las mujeres mayores de 40 años egresadas de la universidad ejercen su


profesión, mientras que un 70% de las egresadas menores de 40 también lo hacen. La
relación de mujeres profesionales mayores de 40 entre las menores de 40 es de 2 a 6.

a) Francis Morales es Ingeniero Químico y no ejerce su profesión. ¿Cuál es la probabilidad


de que tenga menos de 40 años?
b) Dibuje el arboligrama con todas las probabilidades marginales, condicionales y conjuntas.
c) Realice un cuadro de contingencias tomando en cuenta que n = 80 y verifique la
probabilidad anterior.

10. Una compañía que fabrica tornillos, tiene 3 fábricas: A, B, C. Las fábricas B y C producen
el mismo número de tornillos, mientras que A produce el doble de las de B. Por experiencia
pasada, se sabe que el 2% de los tornillos producidos por A y B respectivamente son
defectuosos, en tanto que el 4% de los fabricados por C son defectuosos. Los tornillos
producidos por las tres fábricas se guardan en un mismo lugar.

a) Dibuje un arboligrama, con todas las probabilidades.


b) Si se escoge aleatoriamente un tornillo del almacén, ¿Cuál es la probabilidad de que
sea defectuoso?.
c) ¿Cuál es la probabilidad de que el tornillo defectuoso escogido haya sido producido en
la fábrica A?

11. Suponga que x representa el tiempo en minutos durante el cual una persona hace cola en
cierto banco e y la duración en minutos de una transacción de rutina en la ventanilla del
cajero. Usted llega al banco a depositar un cheque. Si la función de densidad de
probabilidad conjunta de x e y es:

1 x y
f (x, y)  e 4 e 2
8

Halle la probabilidad de que realice su transacción en el banco en menos de 8 minutos.

Ejercicios de teoría de la utilidad

1. A Mónica Britt le gusta mucho pilotear botes pequeños a vela. Lo hace desde que tenía 7
años, cuando su madre comenzó a hacerlo con ella. Hoy, Mónica está considerando la
posibilidad de iniciar una compañía para producir pequeños botes para el mercado
recreativo. A diferencia de otros botes a vela producidos en masa, los suyos serán hechos
específicamente para niños entre 10 y 15 años. Serán de la más alta calidad y
extremadamente estables y el tamaño de la vela será reducido para prevenir problemas de
vuelco.

257
Debido al gasto involucrado al desarrollar los moldes iniciales y adquirir el equipo necesario
para producir botes de vela de fibra de vidrio para niños, Mónica ha decidido llevar a cabo un
estudio piloto para asegurarse que el mercado será adecuado. Ella estima que el estudio
piloto costará 10000 $. Además el estudio piloto puede ser exitoso o no. Su decisión básica
es construir una planta de manufactura grande, una pequeña o no construir nada. Con un
mercado favorable, Mónica espera hacer 90000 $ con una planta grande, o 60000 $ con una
planta pequeña. Si el mercado es desfavorable, Mónica estima perder 30000 $ con una
planta grande y perder 20000 $ con una planta pequeña. Mónica estima que la probabilidad
de un mercado favorable dado un estudio piloto exitoso es de 0.8. La probabilidad de un
mercado desfavorable dado un resultado del estudio piloto no exitoso es del 0.9. Mónica
siente que hay una probabilidad de 50-50 que el estudio piloto será exitoso. Por supuesto,
Mónica podría no realizar el estudio piloto y simplemente realizar la decisión de construcción
sin él. Si no haría un estudio piloto, ella estima que la probabilidad de un éxito en el mercado
es del 0.6. ¿Qué recomendaría?

2. John Jenkins siempre ha deseado desarrollar una pequeña línea de carritos para golfistas
de todas las habilidades. Sin embargo, cree que la probabilidad de una línea de autos
exitoso es del 40%. Un amigo le ha sugerido que lleve a cabo una encuesta en la comunidad
para obtener una mejor intuición de la demanda para construir una planta. Hay una
probabilidad de 0.9 de que la investigación sea favorable, si la planta será exitosa. Además,
se estima que hay una probabilidad de 0.8 de que la investigación de mercado será
desfavorable si la planta será exitosa. John podría determinar las probabilidades de una
exitosa línea de autos dado un resultado favorable del estudio de marketing.

3. Como muchos estudiantes, Anne Martin está enfrentando una difícil e importante decisión
acerca de su carrera profesional. Mientras estaba en colegio, Anne trabajó para una
empresa de contabilidad local. Hizo un buen trabajo y la empresa le ofreció un trabajo por
20000 $. Ella puede tomar todo el tiempo que quiera para tomar su decisión. Hay sin
embargo, otras dos compañías que están interesadas en ella. Contabilidad Barnes le ha
ofertado un trabajo por 22000 $. Desafortunadamente Barnes, le ha dado un plazo de dos
semanas para que tome su decisión. La compañía en la cual Anne realmente le gustaría
trabajar es Servicios de Contabilidad Ketchum. Esta compañía, ella siente, podría hacerle
una oferta de 28000 $. Desafortunadamente, Anne está bastante dudosa de que realmente
le ofrezcan el puesto. Entonces, Anne tiene una difícil decisión. ¿Podría ella aceptar la oferta
de Barnes de 22000 $, o debería esperar para conseguir la oferta de Ketchum? Para Anne
ser indiferente entre tomar el trabajo con Barnes y el riesgo de esperar y tratar de conseguir
el trabajo con Ketchum, la probabilidad de obtener el trabajo con Ketchum debería ser 0.6.
Dada esta información, ¿qué utilidad debería Anne tomar sobre los tres trabajos?

4. Jerry Young está pensando abrir una tienda de bicicletas en su ciudad natal. Jerry ama
tomar su bici y correr en un camino de 50 millas con sus amigos, pero cree que cualquier
negocio pequeño debería comenzar sólo si hay una buena probabilidad de obtener
ganancias. Jerry puede abrir un pequeño negocio, una tienda grande o no hacer nada.
Debido a que tendrá un alquiler por 5 años en un edificio, él quiere asegurarse hacer una
decisión correcta. También está pensando en contratar a su viejo profesor de marketing para
llevar a cabo un estudio de mercado. Si es llevado a cabo el estudio, los resultados pueden
ser favorables o desfavorables. Desarrollar un árbol de decisión para Jerry.

5. Jerry Young (del problema 4) ha realizado algunos análisis acerca de la rentabilidad de la


tienda de bicicletas. Si Jerry construye una tienda grande, tendrá una ganancia de 60000 $
258
si el mercado es favorable, pero perderá 40000 $ si el mercado es desfavorable. La tienda
pequeña generará un retorno de 30000 $ en un mercado favorable y una pérdida de 10000 $
en un mercado desfavorable. En el momento presente, cree que hay una probabilidad de 50-
50 de que el mercado sea favorable. Su viejo profesor de marketing le cobrará 5000 $ por el
estudio. Se ha estimado que hay una probabilidad de 0.6 de que la encuesta sea favorable.
Además, hay una probabilidad de 0.9 que el mercado sea favorable dado un resultado
favorable del estudio. Sin embargo, el profesor de marketing ha advertido a Jerry que hay
una probabilidad de sólo el 0.12 de un mercado favorable si los resultados del estudio de
mercado no son favorables. Jerry está confundido. ¿Qué debería hacer?

6. En el problema 5, Jerry determinó si debía o no buscar información del mercado de su


profesor de marketing y si debería abrir una tienda de bicicletas. En este problema, el
profesor de marketing de Jerry estimó que existía una probabilidad de 0.6 de que el
resultado del estudio de mercado sea favorable. Jerry, sin embargo, no está seguro que esta
probabilidad sea la correcta. ¿Cuál sensible es la decisión de Jerry, realizada en el problema
5, a este valor de probabilidad? ¿Cuánto puede desviarse este valor de probabilidad de 0.6
sin causar un cambio en la decisión de Jerry?

259
EJERCICIOS PARA EXAMEN

1. Se realizó un estudio de mercado a nivel nacional para determinar las preferencias de


varios grupos de hombres que tienen diferentes edades, para diferentes deportes. Se
selecciona una muestra aleatoria de 1000 hombres y se les pide que indiquen su deporte
favorito. Los resultados son los siguientes:
< 20

20-40 Información adicional:


VO 40’-50 111
P ( F / 20  40) 
>50 0.134 225
P ( F   20)  0.494
< 20

20-40 0.222
P ( 50)  0.2
0.427
F 0.1733 40’-50

>50

< 20
0.1981
20-40

BA 40’-50

>50

Edad\Deporte Voleibol Fútbol Básquetbol Total


Hasta 20 26 150
20’ – 40
40’ – 50 96
Mayores a 50
Total

a) Complete la bidimensional y el árbol de probabilidades.


b) Halle el porcentaje de los hombres que a lo menos tienen 40’ años y su preferencia es el
básquetbol.
c) ¿Cuál es la probabilidad que a un anciano le guste el básquetbol?.

2. En la Papelera S.A. se producen blocs Líder con y sin espiral (50% de cada tipo), el 60% de
cada tipo son rojos, 20% de los blocs sin espiral son azules lo mismo que 25% de los con
espiral, el resto de los blocs son verdes.

a) Represente al arboligrama, incluyendo las probabilidades normales, condicionales y


conjuntas.
b) Llene el cuadro bidimensional, si se sabe que en el día se produjeron 1000 blocs Líder, y
encuentre la probabilidad de escoger al azar un cuaderno rojo con espiral.

3. Suponga que x es el tiempo (en días) que una persona permanece en el hospital después
de una cirugía abdominal e y el tiempo (en días) que una persona permanece en el hospital
después de una cirugía ortopédica. El lunes, el paciente de la cama 107 A es sometido a

260
una apendicetomía de emergencia, mientras que el paciente de la cama 107 B, compañero
de habitación, es sometido a una cirugía ortopédica para reparar el cartílago de la rodilla
rota. Si la función de densidad de probabilidad conjunta para x e y es:

1 x / 4  y / 3
f ( x , y ) e e
12

Halle la probabilidad de que ambos pacientes sean dados de alta del hospital en menos de 3
días.

261
CASO

BLAKE ELECTRONICS2

En 1947, Steve Blake fundó Blake Electronics en Long Beach, California, para manufacturar
resistors, capacitors, inductors y otros components electrónicos. Durante la Segunda Guerra
Mundial Steve fue un radio operador y fue durante ese tiempo que adquirió la habilidad para
reparar radios y otros equipos de comunicación. Steve consideró su experiencia de 4 años con
la armada con sentimientos encontrados. Odió la vida en la armada, pero su experiencia le dio
la confianza y la iniciativa para iniciar su propia empresa de electrónicos.

En el transcurso del tiempo, Steve cuidó su negocio sin realizar grandes cambios. En 1969, las
ventas totales anuales excedían los 2 millones de $. En 1964, el hijo de Steve, Jim, se unió a la
compañía después de terminar la preparatoria y dos años de cursos en electrónica en la
universidad de la comunidad de Long Beach. Jim fue siempre agresivo como atleta en la
preparatoria, y llegó a ser aún más agresivo gerente general de ventas de Blake Electronics.
Esta agresividad preocupaba a Steve, que era más conservador. Jim hacía tratos para proveer
a las compañías con componentes electrónicos sin antes preocuparse de saber si Blake
Electronics tenía la habilidad o capacidad para producir los componentes. En varias ocasiones
este comportamiento causó a la compañía momentos embarazosos, ya que Blake Electronics
era incapaz de producir los componentes electrónicos para compañías con las cuales Jim hizo
tratos.

En 1968, Jim comenzó a ir tras los contratos del gobierno para componentes electrónicos. En
1970, las ventas totales anuales ascendieron a más de 10 millones de $ y el número de
empleados excedía los 200. La mayoría de esos empleados eran especialistas en electrónica y
graduados de programas de ingeniería eléctrica de universidades prestigiosas. Pero la
tendencia de Jim de exagerar para obtener contratos continuó, hasta que por 1975, Blake
Electronics se ganó una reputación con las agencias del gobierno como de una compañía que
no podía entregar lo que prometía. De la noche a la mañana, los contratos con el gobierno se
detuvieron, y Blake Electronics se quedó con una fuerza de trabajo parada y equipo de
manufactura sin utilizar. Estos grandes gastos generales comenzaron a derretir el beneficio, y
en 1977, Blake Electronics se enfrentó con la posibilidad de tener una pérdida por primera vez
en su historia.

En 1978, Steve decidió ver la posibilidad de producir componentes electrónicos para uso del
hogar. Si bien era un mercado totalmente nuevo para Blake Electrónicos, Steve estaba
convencido de que esta era la única forma de mantener a la empresa fura de la línea roja. Al
equipo de investigación le fue dada la tarea de desarrollar nuevos dispositivos electrónicos para
el hogar. La primera idea del equipo fue el Centro de Control Maestro. Los componentes
básicos para este sistema se muestran en la figura 1.

El corazón del sistema es la caja de control maestro. Esta unidad, que debería tener un precio
al por menor de 250 $, tenía dos filas de 5 botones. Cada botón controla una luz o dispositivo y
puede ser dispuesto como un interruptor o un reóstato. Cuando se dispone como un interruptor,
un toque de dedo al botón enciende o apaga la luz. Cuando se dispone como un reóstato, un

2 Este caso ha sido extractado del libro: Quantitative Analysis for Management. Render y Stair, 1997.
262
toque de dedo del botón controla la intensidad de la luz. Si se deja el dedo en el botón, la luz
realiza un ciclo completo desde apagado hasta una luz muy brillante, regresando a apagado.

Caja de control maestro


Adaptador de Adaptador de Disco de
salida interruptor de luz bombilla

Figura 1. Centro de Control Maestro

Para obtener un máximo de flexibilidad, cada caja de control maestro es energizada por dos
baterías de tamaño D que pueden durar hasta un año, dependiendo de su uso. Además, el
equipo de investigación ha diseñado tres versiones de la caja de control maestro –las versiones
A, B y C. Si la familia quiere controlar más de 10 luces o dispositivos, puede ser comprada otra
caja de control maestro.

El disco bombilla, que debería tener un precio al por menor de 2.50 $, es controlado por la caja
de control maestro y es usada para controlar la intensidad de cualquier luz. Está disponible un
disco diferente para cada posición del botón para las tres cajas de control maestro. Insertando
el disco bombilla entre la bombilla y el socket, el botón apropiado de la caja de control maestro
puede controlar completamente la intensidad de la luz. Si es usado un interruptor de luz
estándar, debe ser encendido todas las veces por la caja de control maestro para que pueda
trabajar.

Una desventaja de usar un interruptor de luz estándar es que solamente la caja de control
maestro puede ser usada para controlar una luz particular. Para evitar este problema, el equipo
de investigación desarrolló un interruptor adaptador de luz especial que debería venderse en 15
$. Cuando este dispositivo está instalado, tanto la caja de control maestro como el interruptor
adaptador de luz pueden ser usados para controlar la luz.

Cuando se quiere controlar otros dispositivos además de la luz, la caja de control maestro debe
ser usada en conjunción con uno o más adaptadores de salida. Los adaptadores son
enchufados en un tabique de salida estándar, y el dispositivo es entonces enchufado al
adaptador. Cada adaptador de salida tiene un interruptor en la parte superior que permite que
263
el dispositivo sea controlado desde la caja de control maestro el desde el adaptador de salida.
El precio del adaptador de salida debería ser 25 $.

El equipo de investigación estimó que debería costar 500000 $ desarrollar el equipo y los
procedimientos necesarios para fabricar la caja de control maestro y los accesorios. Si es
exitosa, esta aventura podría incrementar las ventas en 2 millones de $ aproximadamente.
¿Pero será que la caja de control maestro será exitosa? Con un 60% de probabilidad de éxito
estimado por el equipo de investigación, Steve tiene serias dudas acerca de tratar de vender
las cajas de control maestro, aún cuando le gusta la idea básica.. Debido a sus reservas, Steve
decidió mandar solicitudes de propuestas (RFP’s) para investigaciones adicionales de mercado
a 30 compañías de investigación en el sur de California.

El primer RFP vino de una pequeña compañía llamada Marketing Associates, Inc. (MAI) que
quería cobrar 100000 $ por el estudio. De acuerdo a su propuesta, MAI ha estado en el negocio
por tres años y ha llevado a cabo cerca de 100 proyectos de investigación de mercados. Las
mayores fortalezas de MAI parecen ser la atención individual de cada informe, personal
experimentado y trabajo rápido. Steve se interesó particularmente en una parte de la
propuesta, que revelaba el record éxito de MAI con informes previos. Esto está mostrado en la
figura 12.

Resultados de la encuesta
Resultados Total
Favorable Desfavorable
Operación exitosa 35 20 55
Operación no exitosa 15 30 45

La otra propuesta que regresó fue de una oficina sucursal de Iverstine y Kinard, una de las más
grandes empresas de investigación de mercados en el país. El costo para un estudio completo
es de 300000 $. Si bien la propuesta no contiene el mismo registro de éxito de MAI, contiene
alguna información interesante. La probabilidad de obtener un resultado favorable del estudio,
dada una operación exitosa, es de 90%. Por el otro lado, la probabilidad de conseguir un
resultado desfavorable de la encuesta, dada una operación no exitosa, es de 80%. Entonces, a
Steve le parece que Iverstine y Kinard es capaz de predecir el éxito o fracaso de la caja de
control maestro con una gran certidumbre.

Steve ponderó la situación. Desafortunadamente, ambos equipos de investigación de mercados


dieron otorgaron diferentes tipos de información en sus propuestas. Steve concluyó que no
había forma que las dos propuestas puedan ser comparadas a menos que consiguiera
información adicional de Iverstine y Kinard. Además, Steve no estaba seguro de lo que debería
hacer con la información y si valía la pena el gasto de contratar a una de las empresas de
investigación de mercado.

Preguntas

1. ¿Necesita Steve información adicional de Iverstine y Kinard?


2. ¿Qué recomendaría?

264

También podría gustarte