Distribución multinomial
Introducción
En esta lectura veremos cómo aparecen en teoría de probabilidades los coeficientes
multinomiales que vimos en la lectura anterior. Estos coeficientes aparecen en la
distribución multinomial, que es como la distribución binomial que estudiamos, solo
que se admiten más de dos resultados posibles.
En términos generales, la distribución multinomial es una distribución discreta de
probabilidad que describe la probabilidad de un evento que admite 𝑘 posibles
resultados cada uno con probabilidades 𝑝1 , 𝑝2 , . . . , 𝑝𝑘 (estas probabilidades son
conocidas de antemano).
La distribución multinomial es importante por varias razones, como dijimos, se aplica
a más situaciones que la distribución binomial, pues admite varios resultados
posibles, entonces, es muy útil para el análisis de datos en economía, ciencias
sociales, aprendizaje automático y otras disciplinas.
1. Empezamos
Una empresa cuenta con un grupo de trabajadores, formado por 12 empleados; 6 de
ellos son ingenieros, 3 son economistas y 3 son matemáticos. Hay un congreso al
finalizar cada año y, para ello, se selecciona siempre un trabajador. La empresa
manda cada año un representante.
Durante los últimos 4 años la empresa no guardó registros de quiénes fueron enviados
al congreso. Entonces, el gerente se formula la siguiente pregunta: ¿cuál es la
probabilidad de que en las cuatro últimas selecciones se hayan elegido 2 ingenieros
y 1 economista?
Comentario: notemos que estamos ante la presencia de un experimento que cumple
las siguientes características:
1) El experimento consta de pruebas repetidas. Por ejemplo, en la
selección de un empleado del grupo. El total de las repeticiones son 4.
2) Cada repetición es independiente de las demás. Por eso es importante,
en el ejemplo que propusimos de la selección del empleado, que
siempre que sea tenido en cuenta el próximo año. De este modo, el
ensayo de la selección es idéntico en todos los casos.
3) La probabilidad de cada suceso debe permanecer invariable a lo largo
del experimento. Por ejemplo, la probabilidad de obtener un empleado
de cada categoría es siempre la misma.
Este caso representa un problema especial cuya solución presentamos en el siguiente
teorema.
Teorema
Supongamos que un experimento tiene 𝑘 resultados posibles y los denotamos por
𝐸1 , 𝐸2 , . . . , 𝐸𝑘 . Además, supongamos que las probabilidades de tales estados son
𝑝1 , 𝑝2 , . . . , 𝑝𝑘 respectivamente. Entonces, si experimento los repetimos 𝑛 veces de
forma idéntica e independiente la probabilidad de que el estado 𝐸𝑖 aparezca 𝑥𝑖 viene
dada por
𝑛
𝑃(𝑥1 , 𝑥2 , . . . , 𝑥𝑘 ; 𝑝1 , 𝑝2 , . . . , 𝑝𝑘 ; 𝑛) = 𝑥 𝑝1 𝑥1 . . . 𝑝𝑘 𝑥𝑘
1 ,...,𝑥 𝑘
con ∑𝑘𝑖=1 𝑥𝑖 = 𝑛 y ∑𝑘𝑖=1 𝑝𝑘 = 1.
Observación: aquí 𝑥1 , . . . , 𝑥𝑘 representan valores específicos de las variables
𝑋1 , . . . , 𝑋𝑘 .
La respuesta al interrogante planteado por el gerente de la empresa es:
5
𝑃(𝑖𝑛𝑔 = 2, 𝑒𝑐𝑜 = 1, 𝑚𝑎𝑡 = 1) = (0.5)2 (0.25)1 (0.25)1
2,1,1
= 60(0.015625)
= 0.9375
𝑃(𝑖𝑛𝑔 = 2, 𝑒𝑐𝑜 = 1, 𝑚𝑎𝑡 = 1) denota la probabilidad de haber elegido 2 ingenieros, 1
economista y 1 matemático como representante en los congresos de los últimos
cuatro años.
Pensemos ahora en el siguiente problema: se tiene una urna con 12 bolas de las
cuales 6 son negras, 3 son rojas y 3 son verdes. Se extraen bolas con reemplazo, es
decir, cada vez que se toma una bola de la urna, se anota su color en un papel y se
la vuelve a colocar en la urna.
Si se realizan 4 extracciones con reemplazo, ¿cuál es la probabilidad de obtener 2
bolas negras, 1 bola roja y 1 bola verde?
La respuesta está dada por la siguiente fórmula:
5
𝑃(𝑛𝑒 = 2, 𝑟𝑜 = 1, 𝑣𝑒 = 1) = (0.5)2 (0.25)1 (0.25)1
2,1,1
= 60(0.015625)
= 0.9375
Imagen ilustrativa de una urna con bolas como la descrita en el problema.
Figura 1: Urna con bolas
Fuente: elaboración propia.
Notemos que la respuesta es idéntica para ambos problemas. Hemos usado la
fórmula dada por el teorema que caracteriza a lo que se conoce como distribución
multinomial.
Podemos decir que se trata de una generalización de la distribución binomial: si
existen más de dos resultados posibles en un experimento dado, en lugar de utilizar
las fórmulas de la distribución binomial, corresponderá usar la que acabamos de ver.
En los ejemplos que vimos, los resultados posibles son tres: se podrían haber elegido
ingenieros, economistas o matemáticos para el primer caso, o bien, podríamos haber
obtenido en cada extracción una bola de color negro, una bola de color rojo y una bola
de color verde.
A continuación, veremos un ejemplo y un problema donde se aplica la distribución
multinomial.
Ejemplo
En una elección presidencial se presentaron 3 candidatos. El candidato A obtuvo el
20 % de los votos, el candidato B obtuvo el 30 % de los votos y el candidato C
consiguió el 50 % de los votos en una ciudad.
Supongamos que tomamos al azar a diez votantes de dicha ciudad. ¿Cuál es la
probabilidad de que se tengan en dicha muestra tres votantes del candidato A, tres
votantes del candidato B y 4 votantes del candidato C?
Respuesta: como puede advertirse del enunciado del problema, se admiten más de
dos resultados posibles. Más precisamente, el espacio muestral de este experimento
consiste en tres posibilidades: se pueden tener votantes del candidato A, del candidato
B y del candidato C.
Además, cada votante elige según sus propias preferencias, por lo tanto, la elección
de un votante no influye en lo que haya elegido otro votante.
Por último, como la elección ya tuvo lugar, se sabe qué cantidad de votos obtuvo cada
votante. Podemos pasar los porcentajes dados a valores de probabilidad dividiendo
cada porcentaje entre 100.
Entonces, tenemos candidato A: 𝑝1 = 0.2; candidato B: 𝑝2 = 0.3 y candidato C: 𝑝3 =
0.5.
La cantidad de votantes de cada candidato que se espera obtener da el exponente al
cual se eleva cada una de las probabilidades que acabamos de obtener. Entonces, en
la fórmula de la distribución multinomial aparecerá: 𝑝1 3 , 𝑝2 3 y 𝑝3 4 .
Como la cantidad de votantes que se toma es 10, la fórmula de la distribución
multinomial nos queda:
10
(0.2)3 (0.3)3 (0.5)4 = 4200(0.0000135) = 0.0567
3,3,4
A continuación, un problema de múltiple opción.
Problema: dos amigos, a los cuales llamaremos Julián y Alexis, juegan a las cartas.
Analizando la historia previa de cada jugador se establece lo siguiente: la probabilidad
que Julián gane una partida es 𝑝1 = 0.25, la probabilidad de que Alexis gane una
partida es 𝑞 = 0.35 y la probabilidad de que queden empatados es 𝑟 = 0.4.
Se van a jugar 10 partidas y se desea hacer el siguiente cálculo: ¿cuál es la
probabilidad de que Julián gane 4 partidas, Alexis gane 3 y que queden empatados
en 3 partidas?
1. 0.025
2. 0.032
3. 0.045
Respuesta: utilizando la fórmula de la distribución multinomial se obtiene:
10
𝑝 = 4,3,3 (0.25)4 (0.35)3 (0.4)3 = 0.045
En esta lectura vimos la aplicación en probabilidad de los coeficientes multinomiales
vistos en la lectura anterior. Aparecen en un sinnúmero de problemas que son de vital
importancia en la vida cotidiana, como se verá en los problemas a resolver en las
actividades prácticas.
De esta manera, terminamos con el segundo módulo, donde abordamos técnicas de
conteo que tienen importantes aplicaciones en la teoría de probabilidades:
coeficientes binomiales y multinomiales, que aparecen en la distribución binomial y
multinomial, respectivamente. En las siguientes lecturas, seguiremos profundizando
en problemas de conteo y combinatorias vinculados también a otras disciplinas, no
solo a la probabilidad.