Distribuciones Discretas en Probabilidad
Distribuciones Discretas en Probabilidad
(Revisión 02/2022)
1. Introducción. ................................................................................................................ 1
2. Pruebas de Bernouilli. Distribución binomial ................................................................. 1
3. Distribución geométrica ................................................................................................ 5
4. Distribución de binomial negativa ................................................................................. 7
5. Distribución de hipergeométrica ................................................................................... 9
6. Distribución de Poisson ............................................................................................... 10
6.1. Características de una distribución de Poisson ......................................................................................... 13
6.2. Determinación empírica de la constante ............................................................................................... 13
Después de un estudio en profundidad de este capítulo, el estudiante deberá ser capaz de:
1. Introducción.
En muchos casos un experimento puede estar compuesto por la repetición, un cierto número
de veces, de un mismo experimento, de tal forma que estas repeticiones son independientes
pero se procura realizarlas en las mismas condiciones. A una serie de experimentos de este
tipo se les denomina una serie de pruebas de Bernouilli. Por ejemplo si consideramos los si-
guientes experimentos aleatorios y las correspondientes variables aleatorias:
Estos ejemplos muestran un mismo modelo, correspondiente a una serie de pruebas repetiti-
vas, en cada una de las cuáles se cuenta la ocurrencia o no de un determinado suceso, por lo
que en cada prueba ocurre un éxito (ocurrencia del suceso tenido en cuenta) o fracaso (no
Distribuciones discretas 5-2
ocurrencia de dicho suceso). Además, las pruebas son independientes, es decir, lo que ocurra
en una de ellas no depende de las anteriores y la probabilidad de éxito en cada prueba per-
manece constante.
Podemos por tanto caracterizar las pruebas de Bernouilli como un conjunto de pruebas que
cumplen tres propiedades:
Es corriente que en relación con una serie de pruebas de Bernouilli estemos interesados úni-
camente en el número de veces que aparece un determinado suceso 𝐴. Es decir, al realizar
cada prueba sólo nos interesa si aparece o no el suceso 𝐴 al que suele denominarse éxito o 𝐴̅
al que llama fracaso. En cada una de las pruebas se tendrá:
𝑃(𝐴) = 𝑝 𝑃(𝐴̅) = 1 − 𝑝 = 𝑞
𝐵1 × 𝐵2 × … × 𝐵𝑛
Donde 𝐵𝑖 es lo que ocurre en la prueba i desde el punto de vista que a nosotros nos importa.
Cada 𝐵𝑖 será entonces 𝐴 ó 𝐴̅. Si llamamos 𝑘 al número de éxitos en las 𝑛 pruebas se tendrá 𝑘
sucesos de tipo 𝐴 y (𝑛 − 𝑘) sucesos de tipo 𝐴̅. Está claro que la variación de 𝑘 es 0,1,2, … , 𝑛.
El suceso {obtener k éxitos en las n pruebas} puede aparecer de diversas formas mutuamente
excluyentes. Cada una de ellas corresponde a una de las formas en que aparecen 𝑘 éxitos en
un conjunto de 𝑛 posiciones de la serie.
Teniendo en cuenta que las componentes son independientes, para cada una de estas formas
es:
𝑃(𝐴 · 𝐴̅ · 𝐴̅ · 𝐴 · … · 𝐴) = 𝑝𝑘 𝑞 𝑛−𝑘
Ahora bien, las ordenaciones posibles de las 𝑛 letras (de las que 𝑘 son 𝐴 y el resto 𝐴̅)
𝐴 · 𝐴 · … · 𝐴 · 𝐴̅ · 𝐴̅ · … · 𝐴
son las permutaciones n-arias con repetición de n elementos, de los cuales 𝑘 son de tipo 𝐴 y
(𝑛 − 𝑘) de tipo 𝐴̅, es decir:
𝑛! 𝑛
=( )
𝑘! (𝑛 − 𝑘)! 𝑘
Entonces, llamando 𝑓(𝑥) a la probabilidad del suceso “obtener x éxitos en las n pruebas de
Bernouilli”, será:
𝑛
𝑓(𝑥) = ( ) 𝑝 𝑥 𝑞 𝑛−𝑥 𝑥 = 0,1,2, … , 𝑛
𝑥
Excel emplea la función = 𝐷𝐼𝑆𝑇. 𝐵𝐼𝑁. 𝑁(𝑥; 𝑛; 𝑝; 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑜) donde acumulado es 0 para
la obtener la probabilidad individual y 1 para obtener la suma de probabilidades de todos los
valores menores o iguales que 𝑥.
A una variable ordinaria de la forma 𝑘 = 0,1,2, … , 𝑛 junto con una función que da la probabi-
lidad de que la variable tome cada uno de los valores, se le denomina distribución de probabi-
lidad. En este caso, de tipo discreto, porque la variable ordinaria tiene un recorrido discreto.
Observamos que las probabilidades 𝑝𝑘 son precisamente los términos del desarrollo de la po-
tencia del binomio (𝑝 + 𝑞)𝑛 :
𝑛 𝑛
1 = (𝑝 + 𝑞)𝑛 = 𝑝𝑛 + ( ) 𝑝𝑞 𝑛−1 + ⋯ + ( ) 𝑝𝑘 𝑞 𝑛−𝑘 + ⋯ + 𝑞 𝑛
1 𝑘
Se trata de una familia de distribuciones que depende de los parámetros 𝑛 y 𝑝. Véase la Figura
2.
0,2
0,15
0,1
0,05
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
𝑥 𝑛
𝐹(𝑥) = ∑ ( ) 𝑝𝑘 𝑞 𝑛−𝑘
𝑘=0 𝑘
Se trata de una función escalonada con escalones en los puntos 1,2, … , 𝑛 de alturas iguales a
las probabilidades.
Los momentos ordinarios 𝛼𝑟 dan lugar a sumas finitas que no son fáciles de reducir. Por ello
emplearemos la función característica como función generatriz de momentos:
𝑛 𝑛 𝑛 𝑛 𝑘 𝑛
𝜑(𝑡) = 𝐸(𝑒 𝑖𝑡𝑋 ) = ∑ 𝑒 𝑖𝑡𝑘 ( ) 𝑝𝑘 𝑞 𝑛−𝑘 = ∑ ( ) (𝑝𝑒 𝑖𝑡 ) 𝑞 𝑛−𝑘 = (𝑝𝑒 𝑖𝑡 + 𝑞)
𝑘=0 𝑘 𝑘=0 𝑘
𝑛
𝜑(𝑡) = (𝑝𝑒 𝑖𝑡 + 𝑞)
𝑛−1
𝜑 ′ (𝑡) = 𝑛(𝑝𝑒 𝑖𝑡 + 𝑞) 𝑝𝑖𝑒 𝑖𝑡 ⇒ 𝜑 ′ (0) = 𝑛𝑝𝑖
𝑛−2 𝑖𝑡
𝜑 ′′ (𝑡) = 𝑛𝑝𝑖 2 (𝑝𝑒 𝑖𝑡 + 𝑞) 𝑒 (𝑛𝑝𝑒 𝑖𝑡 + 𝑞) ⇒ 𝜑 ′′ (0) = 𝑛𝑝𝑖 2 (𝑛𝑝 + 𝑞)
Luego
𝜑 ′ (0) 𝜑 ′′ (0)
𝛼1 = = 𝑛𝑝 𝛼2 = = 𝑛𝑝(𝑛𝑝 + 𝑞)
𝑖 𝑖2
Y la varianza:
Resumiendo:
𝜇 = 𝑛𝑝 𝜎 2 = 𝑛𝑝𝑞
Para determinar la moda (o modas) en la binomial es preciso determinar cómo varían las pro-
babilidades. Teniendo en cuenta la forma de 𝑝𝑘 conviene hacerlo por cociente.
Las posibles modas serán los diferentes valores de m que satisfagan las dos condiciones:
𝑝𝑚 𝑛−𝑚+1 𝑝
≥1 ⇒ · ≥1 ⇒ 𝑚 ≤ 𝑛𝑝 − 𝑞 + 1
𝑝𝑚−1 𝑚 𝑞
𝑝𝑚 𝑚+1 𝑞
≥1 ⇒ · ≥1 ⇒ 𝑚 ≥ 𝑛𝑝 − 𝑞
𝑝𝑚+1 𝑛−𝑚 𝑝
𝑛𝑝 − 𝑞 ≤ 𝑚 ≤ 𝑛𝑝 − 𝑞 + 1
𝑚 = ⌊𝑛𝑝 − 𝑞 + 1⌋
𝜇3 𝑞 − 𝑝
𝛾= =
𝜎 3 √𝑛𝑝𝑞
Luego si 𝑞 > 𝑝 entonces 𝛾 > 0 y la distribución está desviada a la derecha. Si 𝑞 < 𝑝 entonces
𝛾 < 0 y la distribución está desviada hacia la izquierda. Para 𝑝 = 𝑞 = 1/2 la distribución es
simétrica respecto a 𝑥 = 𝑛/2. Si 𝑛 → ∞ la distribución se hace simétrica pues 𝛾 → ∞.
𝜇4 1 − 6𝑝𝑞
𝛿= − 3 =
𝜎4 𝑛𝑝𝑞
3. Distribución geométrica
En relación con las pruebas de Bernouilli aparecen otra dos distribución discreta: la distribu-
ción geométrica.
Volvamos a los ejemplos iniciales del apartado anterior. En vez de considerar un número fijo
de prueba, consideremos el número de pruebas necesario hasta obtener un éxito, de decir,
sea 𝑋 la variable aleatoria que denota el número de pruebas hasta el primer éxito. Por ejem-
plo, en el apartado 2, el número de bits transmitidos hasta que ocurra el primer error. 𝑋 tiene
una distribución geométrica.
Resumiendo: en una serie de pruebas de Bernouilli, sea 𝑋 el número de pruebas hasta el pri-
mer éxito. Entonces 𝑋 tiene una distribución geométrica con parámetro 𝑝. Su función de pro-
babilidad es:
Excel no tiene una fórmula concreta de cálculo para esta distribución, pero estas probabilida-
des son fáciles de calcular con Excel.
A una distribución geométrica de parámetro p la denotaremos por G(p). La forma de esta dis-
tribución se aprecia en la Figura 2.
G(0´1) G(0´19)
0,25
0,2
0,15
0,1
0,05
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
1 1−𝑝
𝜇= 𝜎2 =
𝑝 𝑝2
Su obtención es algo laboriosa. Se deja como trabajo a realizar por el alumno (Recomendación:
calcular primero la función característica y seguidamente obtener los momentos ordinarios
de orden 1 y 2 a partir de los cuales se calculan la media y la varianza).
Esto implica que cuando se utilice la distribución geométrica, el sistema no tendrá un desgaste
apreciable, lo que implica que la probabilidad de error permanezca constante en todas las
transmisiones. Es en este sentido que se dice que la distribución no tiene memoria. Esta pro-
piedad también la tiene una distribución continua que se verá en el capítulo siguiente: la dis-
tribución exponencial.
Para concretar, consideremos el ejemplo del canal de transmisión digital. Supongamos que la
probabilidad de que un bit transmitido se reciba con error es 0.1. Asimismo supongamos que
las transmisiones son independientes y sea 𝑋 la variable aleatoria que representa el número
de bits transmitidos hasta el cuarto error. 𝑋 tiene una distribución binomial negativa con 𝑝 =
0.1 y 𝑟 = 4.
9
( ) 0.13 0. 96
3
9 9
𝑓(10) = ( ) 0.13 0. 96 × 0.1 = ( ) 0.14 0. 96
3 3
𝑥−1
𝑓(𝑥) = ( ) (1 − 𝑝)𝑥−𝑟 𝑝𝑟 𝑥 = 𝑟, 𝑟 + 1, 𝑟 + 2, …
𝑟−1
Puesto que se necesitan al menos r pruebas para obtener r éxitos, el rango de 𝑋 es desde r a
infinito. Si 𝑟 = 1 se tiene el caso particular de la distribución geométrica. La forma de esta
distribución se observa en la Figura 3.
Al igual que con la distribución geométrica, Excel no tiene una fórmula de cálculo de la distri-
bución binomial negativa. No obstante se puede emplear la fórmula de la distribución bino-
mial, retocándola adecuadamente.
𝑋 = 𝑋1 + 𝑋2 + ⋯ + 𝑋𝑟
0,25
0,2
0,15
0,1
0,05
0
5 10 15 20 25 30 35 40 45 50 55 60
𝑋1 𝑋2 𝑋3
1 2 3 4 5 7 8 9 10 11 12
Figura 4. Distribución binomial negativa representada como una suma de variables geométricas
En una variable binomial el número de pruebas es fijo y el número de éxitos aleatorio. En una
variable binomial negativa se da la situación contraria: el número de pruebas es variable y el
de éxitos fijo. En este sentido una variable binomial negativa puede considerarse como lo con-
trario (o negativo) de una binomial. De ahí su nombre.
Como se demostrará en un tema posterior, si una variable aleatoria es suma de variables alea-
torias independientes, entonces su valor medio es la suma de los valores medios de las varia-
bles que se suman y su varianza es la suma de las varianzas. Por consiguiente, para la variable
binomial negativa se tiene:
𝑟 𝑟(1 − 𝑝)
𝜇 = 𝐸(𝑋) = 𝜎 2 = 𝐷2 (𝑋) =
𝑝 𝑝2
5. Distribución de hipergeométrica
Para introducir esta distribución consideremos una máquina herramienta que produce 500
piezas al día, de las cuales 50 no cumplen las especificaciones del cliente. Se eligen dos piezas
al azar sin reemplazamiento. Sea 𝑋 el número de piezas (de las 2 elegidas) que no cumplen las
especificaciones. Calcular las probabilidades de que 𝑋 valga 0, 1 ó 2.
Este ejemplo se puede resolver empleando probabilidades condicionadas. Sean 𝐴 y 𝐵 los su-
cesos de que la primera y la segunda pieza no cumplen las especificaciones del cliente. Ten-
dremos:
50 49
𝑃(𝐴) = 𝑃(𝐵|𝐴) =
500 499
450 449
𝑃(𝑋 = 0) = 𝑃(𝑎𝑚𝑏𝑎𝑠 𝑝𝑖𝑒𝑧𝑎𝑠 𝑠𝑜𝑛 𝑐𝑜𝑛𝑓𝑜𝑟𝑚𝑒𝑠) = ( )×( ) = 0.8098
500 499
50 49
𝑃(𝑋 = 2) = 𝑃(𝑎𝑚𝑏𝑎𝑠 𝑝𝑖𝑒𝑧𝑎𝑠 𝑠𝑜𝑛 𝑛𝑜 𝑐𝑜𝑛𝑓𝑜𝑟𝑚𝑒𝑠) = ( )×( ) = 0.0098
500 499
Sea 𝑋 la variable que representa el número de éxitos en una muestra obtenida sin reempla-
zamiento. Entonces 𝑋 tiene una distribución hipergeométrica con la siguiente función de pro-
babilidad:
(𝑀
𝑥
)(𝑁−𝑀
𝑛−𝑥
)
𝑓(𝑥) = máx(0, 𝑛 + 𝑀 − 𝑁) ≤ 𝑥 ≤ mín(𝑛, 𝑀)
(𝑁𝑛)
0≤𝑥≤𝑀 0≤𝑥≤𝑀
} ⇒ } ⇒ máx(0, 𝑛 + 𝑀 − 𝑁) ≤ 𝑥 ≤ mín(𝑛, 𝑀)
0≤𝑛−𝑥 ≤𝑁−𝑀 𝑛+𝑀−𝑁 ≤𝑥 ≤𝑛
H(x;10,10,20) H(x;5,25,50)
0,35
0,30
0,25
0,20
0,15
0,10
0,05
0,00
0 1 2 3 4 5 6 7 8 9 10
𝑁−𝑛
𝜇 = 𝐸(𝑋) = 𝑛𝑝 𝜎 2 = 𝐷2 (𝑋) = 𝑛𝑝𝑞 ( )
𝑁−1
Siendo:
𝑀 𝑁−𝑀
𝑝= 𝑞=
𝑁 𝑁
6. Distribución de Poisson
Consideremos una distribución binomial 𝐵(𝑛, 𝑝) tal que el parámetro 𝑝 está ligado a 𝑛 por la
relación 𝑛𝑝 = 𝜆 siendo 𝜆 una constante. O sea, cuando crece 𝑛, al ser 𝑝 = 𝜆/𝑛, resulta que 𝑝
decrece adecuadamente. Veamos hacia qué tipo de distribución tiende 𝐵(𝑛, 𝑝) en estas con-
diciones. Para ver este límite consideremos el límite del recorrido y el de las probabilidades
en cada punto. O sea, el límite de la función de probabilidad de 𝐵(𝑛, 𝑝).
𝑛 𝑥 𝑛−𝑥 𝑛! 𝜆 𝑥 𝜆 𝑛−𝑥
𝑓(𝑥) = ( ) 𝑝 𝑞 = ( ) (1 − ) =
𝑥 𝑥! (𝑛 − 𝑥)! 𝑛 𝑛
𝑛(𝑛 − 1) … (𝑛 − 𝑥 + 1) 𝜆 𝑥 𝜆 𝑛−𝑥
= ( ) (1 − ) =
𝑥! 𝑛 𝑛
𝑛(𝑛 − 1) … (𝑛 − 𝑥 + 1) 𝜆𝑥 𝜆 𝑛−𝑥
= (1 − ) =
𝑛𝑥 𝑥! 𝑛
1 𝑥 − 1 𝜆𝑥 𝜆 𝑛 𝜆 −𝑥
= 1 · (1 − ) · … · (1 − ) (1 − ) (1 − )
𝑛 𝑛 𝑥! 𝑛 𝑛
𝜆𝑥 −𝜆
𝑓(𝑥) → 𝑒
𝑥!
Ejemplo. En una gran bobina de papel los defectos ocurren al azar. Sea 𝑋 la variable aleatoria
correspondiente al número de defectos en una longitud de L metros de papel y supongamos
que el número medio defectos en L metros es 𝜆. Procedemos a partir la longitud de la bobina
en 𝑛 subintervalos de longitud pequeña (por ejemplo 1 micrometro). Si el subintervalo es su-
ficientemente pequeño, la probabilidad de que uno o más defectos ocurran en el subintevalo
es prácticamente nula. Además, podemos interpretar que cada subintervalo tiene la misma
probabilidad de contener un defecto: llamamos 𝑝 a esta probabilidad. Finalmente, si asumi-
mos que la probabilidad de que un subintervalo contenga un defecto es independiente de los
otros subintervalos, entonces podemos modelar la distribución de 𝑋 como una distribución
binomial. Y puesto que 𝐸(𝑋) = 𝜆 = 𝑛𝑝 se tendrá 𝑝 = 𝜆/𝑛 con lo que si los subintervalos son
suficientemente pequeños, 𝑛 será muy grande y 𝑝 muy pequeño. Por tanto la distribución de
𝑋 se aproximará a una distribución de Poisson de parámetro 𝜆.
Este ejemplo puede generalizarse para incluir una amplia gama de experimentos aleatorios.
En el caso considerado el intervalo particionado fue la longitud de la bobina de papel, pero el
razonamiento puede aplicarse a cualquier tipo de intervalo: un intervalo de tiempo, un área,
un volumen, etc. Por ejemplo: el número de partículas radiactivas emitidas por un isótopo,
defectos en textiles, llamadas a una central telefónica, etc.
Con estos supuestos, los subintervalos pueden considerarse como pruebas de Bernoulli con
probabilidad de éxito 𝑝 = 𝜆∆𝑡 y el número de pruebas 𝑛 = 𝑇/∆𝑡. Por tanto 𝑛𝑝 = 𝜆𝑡 y cómo
∆𝑡 tiende a cero, entonces 𝑛 tiende a infinito. En consecuencia, por lo visto al comienzo de
este apartado, 𝑋 tiene una distribución de Poisson de parámetro 𝜆𝑡.
Todo lo anterior justifica la distribución de Poisson. Diremos que una variable aleatoria 𝑋 tiene
distribución de Poisson de parámetro 𝜆 > 0, cuando su función de probabilidad es:
𝜆𝑥 −𝜆
𝑓(𝑥) = 𝑒 𝑥 = 0,1,2, …
𝑥!
Excel utiliza la función = 𝑃𝑂𝐼𝑆𝑆𝑂𝑁. 𝐷𝐼𝑆𝑇(𝑥; 𝑚𝑒𝑑𝑖𝑎; 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑜) para calcular las probabili-
dades de Poisson, donde acumulado es 0 para calcular la probabilidad individual y 1 para cal-
cular la suma de probabilidades de todos los valores menores o iguales que 𝑥.
∞ 𝜆𝑥 −𝜆 ∞ 𝜆𝑥
∑ 𝑒 = 𝑒 −𝜆 ∑ = 𝑒 −𝜆 𝑒 𝜆 = 1
𝑥=0 𝑥! 𝑥=0 𝑥!
∞ 𝜆𝑘 −𝜆 ∞ (𝜆𝑒 𝑖𝑡 ) 𝑘
𝑖𝑡𝑋 𝑖𝑡𝑘 −𝜆 𝑖𝑡 𝑖𝑡
𝜑(𝑡) = 𝐸(𝑒 )=∑ 𝑒 𝑒 =𝑒 ∑ = 𝑒 −𝜆 𝑒 𝜆𝑒 = 𝑒 𝜆(𝑒 −1)
𝑘=0 𝑘! 𝑘=0 𝑘!
De aquí obtenemos:
𝑖𝑡 +𝑖𝑡−𝜆
𝜑 ′ (𝑡) = 𝜆𝑖𝑒 𝜆𝑒 ⇒ 𝜑 ′ (0) = 𝜆𝑖
𝑖𝑡 +𝑖𝑡−𝜆
𝜑 ′′ (𝑡) = 𝜆𝑖 2 𝑒 𝜆𝑒 (𝜆𝑒 𝑖𝑡 + 1) ⇒ 𝜑 ′′ (0) = 𝜆(𝜆 + 1)𝑖 2
De aquí:
𝜑 ′ (0) 𝜑 ′′ (0)
𝛼1 = =𝜆 𝛼2 = = 𝜆(𝜆 + 1)
𝑖 𝑖2
𝜎 2 = 𝛼2 − 𝛼12 = 𝜆
Resumiendo: 𝜇 = 𝜆 𝑦 𝜎 2 = 𝜆
𝑝𝑚 𝜆
≥1 ⇒ ≥1 ⇒ 𝑚≤𝜆
𝑝𝑚−1 𝑚
𝑝𝑚 𝑚+1
≥1 ⇒ ≥1 ⇒ 𝑚 ≥𝜆−1
𝑝𝑚+1 𝜆
menor. Supongamos que un experimento físico se repite un gran número 𝑁 de veces y que,
cada vez, contamos el número de sucesos en un intervalo de longitud fija 𝑡. Sea 𝑁𝑘 el número
de veces en que se observan 𝑘 sucesos. Entonces:
𝑁0 + 𝑁1 + 𝑁2 + ⋯ = 𝑁
𝑁1 + 2𝑁2 + 3𝑁3 … = 𝑛
𝑁𝑘
𝑝𝑘 (𝑡) =
𝑁
(𝜆𝑡)2 (𝜆𝑡)3
𝑛 ≅ 𝑁[𝑝1 (𝑡) + 2𝑝2 (𝑡) + 3𝑝3 (𝑡) + ⋯ ] = 𝑁𝑒 −𝜆𝑡 [𝜆𝑡 + + +⋯] =
1! 2!
−𝜆𝑡
(𝜆𝑡)1 (𝜆𝑡)2
= 𝑁𝑒 · 𝜆𝑡 · [1 + + + ⋯ ] = 𝑁𝑒 −𝜆𝑡 · 𝜆𝑡 · 𝑒 𝜆𝑡 = 𝑁𝜆𝑡
1! 2!
De aquí se obtiene:
𝑛
𝜆≅
𝑁·𝑡
Esta ecuación permite estimar 𝜆 a partir de las observaciones para calcular las probabilidades
y comparar con los posteriores experimentos.
𝑀
𝑝= ⇒ 𝑀 = 𝑁𝑝
𝑁
𝑁−𝑀
𝑞= ⇒ N − M = 𝑁𝑞
𝑁
(𝑀
𝑥
)(𝑁−𝑀
𝑛−𝑥
) (𝑁𝑝
𝑥
𝑁𝑞
)(𝑛−𝑥 ) 𝑛!
𝑓(𝑥) = = = ×
(𝑁𝑛) (𝑁𝑛) 𝑥! (𝑛 − 𝑥)!
𝑥 𝑓𝑎𝑐𝑡𝑜𝑟𝑒𝑠 𝑛 − 𝑥 𝑓𝑎𝑐𝑡𝑜𝑟𝑒𝑠
𝑁𝑝(𝑁𝑝 − 1)(𝑁𝑝 − 2) … (𝑁𝑝 − 𝑥 + 1) × 𝑁𝑞(𝑁𝑞 − 1)(𝑁𝑞 − 2) … (𝑁𝑞 − 𝑛 + 𝑥 + 1)
×
𝑁(𝑁 − 1)(𝑁 − 2) … (𝑁 − 𝑛 + 1)
𝑛 𝑓𝑎𝑐𝑡𝑜𝑟𝑒𝑠
Si N es suficientemente grande:
𝑁(𝑁 − 1)(𝑁 − 2) … (𝑁 − 𝑛 + 1) ≅ 𝑁 𝑛
Entonces:
𝑛
≤ 0.1
𝑁
Por otra parte, para aproximar una distribución binomial por una de Poisson, suele tomarse
como regla empírica para una buena aproximación el que sea 𝑝 ≤ 0.1 con 𝑛𝑝 ≤ 0.5. Por ejem-
plo para 𝑝 = 0.1 debería ser 𝑛 ≤ 50, y valores mayores de 𝑛 para 𝑝 más pequeño. Para valores
muy grandes de 𝑛, aunque 𝑝 sea pequeña, suele ser mejor aproximar la distribución binomial
mediante la distribución normal que se verá en un capítulo posterior.
Estos resultados son útiles para cuando se hagan cálculos a mano o con calculadora no pro-
gramable.
8. Problemas
5-2. Una compañía de seguros con 10.000 asegurados sabe que el 0.005% de la población
fallece cada año en un cierto tipo de accidente. Calcular:
a) Probabilidad de que la compañía tenga que pagar a más de 3 de los asegurados contra
tal accidente.
b) Número de accidentes al año por término medio.
Solución: a) 0.001751, b) 𝐸(𝑋) = 𝜆 = 0.5. Luego habrá de pagar 0.5 accidentes por año o, lo
que es equivalente, un accidente cada dos años por término medio.
5-3. La producción de bombillas de una factoría es tal que el 5% de las bombillas son defec-
tuosas. Las bombillas se inspeccionan en grandes lotes. Un lote se acepta si la muestra de 20
bombillas seleccionada al azar de él contiene no más de 2 defectuosas; en caso contrario se
rechaza. Calcular la probabilidad de que:
Solución: 0.1866.
5-6. Una factoría produce un cierto tipo de fusibles mediante un proceso automático. Los fu-
sibles se empaquetan en cajas de 24 unidades para ser despachadas a los clientes. La produc-
ción está bajo control estadístico y se conoce por la experiencia pasada que un 3% de los fusi-
bles producidos son defectuosos,
Se seleccionan al azar cuatro cajas para ser inspeccionadas. Encontrar la probabilidad de que:
Si un electricista compra 100 cajas de fusibles, determinar el número esperado de cajas cada
una de las cuáles contenga:
5-7. Una máquina que opera a un elevado ritmo de trabajo se estropea y para ocasionalmente
a consecuencia de una pieza particular que se desgasta con el uso. Estas paradas ocurren al
azar y de forma independiente a una tasa de 4 paradas por día con jornadas laborales de 8
horas de trabajo.
5-8. Una gran empresa de transportes tiene una flota de 1000 autobuses y observa que, por
término medio, la probabilidad de que un autobús se averíe un día cualquiera es del 0.24%.
Solución: a) Por Poisson: 0.011594, b) Por Poisson: 0.61046, c) 8 averías por día, d) Por Poisson:
0.0003.
5-9. Los aeroplanos llegan a un aeropuerto de acuerdo con una distribución de Poisson con
un tiempo medio entre llegadas de 5 minutos.
5-11. Un resorte se somete un cierto número de veces a una prueba de resistencia hasta que
se hace inservible. La probabilidad de que se haga inservible en cada prueba se mantiene
constante y es igual a 0.001. Las pruebas pueden considerarse independientes. Determinar la
probabilidad de que uno de estos elementos se haga inservible después de que se haya pro-
bado 1000 veces.
5-12. La compañía OCAIVA, S.A. dispone de un modelo de avión que se revisa antes de cada
vuelo de manera que la probabilidad de que tenga alguna avería en el vuelo siguiente es inde-
pendiente de la que tuvo en el anterior e igual a 0.001. Se pide:
a) Función de probabilidad del número de averías que tiene un avión de dicho modelo a lo
largo de un año, suponiendo que hace tres vuelos diarios.
b) Función de probabilidad del número de vuelos hasta que se produce la primera avería.
Número de vuelos que, por término medio, se efectúan hasta que se produce la primera
avería.
c) Función de probabilidad del número de días que transcurren hasta que se produce la
primera avería. Número de días que, por término medio, transcurren hasta que se pro-
duce la primera avería.
5-13. Se está realizando un estudio durante la estación de invierno del tiempo en Ferrol en
cuanto a la clasificación en tiempo soleado y tiempo no soleado. En invierno se ha observado
que la probabilidad de que un día sea soleado es 0.3. De acuerdo con este dato:
a) Encontrar la probabilidad de que una semana tenga 𝑘 días soleados. Aplicar al caso
concreto 𝑘 = 3
b) ¿Cuál es la probabilidad de que un fin de semana (sábado y domingo) sea soleado?
5-15. Los retrasos de vuelos en los principales aeropuertos estadounidenses son una fuente
creciente de exasperación para los ejecutivos, que como resultado no llegan a importantes
reuniones. Alrededor de 190.000 vuelos se retrasaron más de 15 minutos durante los 6 pri-
meros meses de 1984, con muchos de los retrasos durando horas (Revista Fortune, 1 Octubre
1984). Durante este periodo, el 13% de las llegadas y salidas del aeropuerto de La Guardia en
Nueva York tuvieron retrasos de al menos 15 minutos. El correspondiente nivel de retrasos en
el aeropuerto Stapleton de Denver fue del 5%. Supóngase que un ejecutivo hace tres vuelos
de ida y vuelta de Denver a Nueva Cork durante este periodo.
5-16. En un país se juega a la MEGALOTO que es una lotería consistente en comprar boletos con
seis números diferentes que pueden ir del 1 al 36 sin repetir. El sorteo tiene lugar extrayendo
al azar sin reemplazo 6 bolas de una urna que tiene 36 bolas numeradas del 1 al 36. El boleto
que tiene los seis números iguales a los obtenidos en el sorteo (no importa el orden) gana el
primer premio de 50 millones de euros. Los boletos con cinco números acertados reciben un
premio de 10.000 euros y, finalmente, los que tienen 4 números acertados reciben 1000 eu-
ros. Se supone que no hay boletos iguales. Un jugador ha comprado un billete:
5-17. Sean los sucesos A = {obtener cara} y B = {obtener cruz} al lanzar una moneda legal. Si
se hacen tres lanzamientos de la moneda, calcular la probabilidad de:
a) La secuencia AAA.
b) La secuencia ABA.
c) Un resultado total de dos caras y una cruz.
d) Más caras que cruces.
e) Más caras que cruces dado que al menos se obtiene una cruz.
f) Más caras que cruces dado que al menos se obtienen dos cruces.
5-18. Una fábrica dispone de tres grandes máquinas, todas las cuales producen el mismo ar-
tículo y trabajan independientemente. Para el funcionamiento de cada máquina se necesitan
dos empleados de forma que, por ejemplo, si en una jornada hay cinco empleados entonces
sólo dos máquinas pueden estar en funcionamiento. La tasa de producción de cada máquina
es de 2000 unidades del artículo por jornada laboral. La tasa de absentismo es del 10%.
a) Suponiendo que la fábrica tiene una plantilla de seis empleados, ¿cuál es la probabilidad
de que en una jornada estén en funcionamiento dos de las tres máquinas?
b) ¿Cuál es la producción media diaria si la plantilla es de seis empleados?
c) ¿Cuántos operarios deberá tener la fábrica para que la producción media diaria sea su-
perior a 5900 unidades?
Se considera ahora un nuevo factor que es la posibilidad de avería en las máquinas. Supo-
niendo que una máquina ha de estar parada por avería en el 5% de los días laborales y te-
niendo en cuenta el absentismo laboral:
d) ¿Cuál es la probabilidad de que en una jornada estén en funcionamiento dos de las tres
máquinas si la fábrica tiene seis empleados?
e) ¿Cuál será en este caso la producción media diaria?
5-19. El benceno es un disolvente orgánico empleado para sintetizar plásticos y que se en-
cuentra en ciertos productos de consumo como por ejemplo la gasolina de alto octanaje sin
plomo. Se ha demostrado que el benceno produce leucemia. Sea 𝑋 el nivel (en partes por
millón, ppm) de benceno en el aire de una planta petroquímica. Se ha comprobado que 𝑋
sigue una distribución de Poisson. El Ministerio de Medioambiente establece como norma un
nivel máximo permisible de benceno de 1 ppm. Cualquier industria que vulnere esta norma
está sometida a graves sanciones.
a) Suponga que el nivel medio de benceno en las plantas petroquímicas es de 5 ppm. De-
termine la probabilidad de que una planta petroquímica vulnere la norma gubernamen-
tal.
b) Repita el apartado anterior para un nivel medio de 2 ppm.
c) Un estudio del Ministerio de Medioambiente reveló que el 88% de las industrias que
utilizan benceno exponen a sus trabajadores a 1 ppm o menos de disolvente. ¿Cuál de-
berá ser el valor medio real del nivel de benceno?
5-20. La Caja 1 contiene 1000 bombillas de las cuales el 10% son defectuosas. La Caja 2 con-
tiene 2000 bombillas de las que el 5% son defectuosas. Se extraen dos bombillas de una Caja
elegida al azar.
5-21. En una factoría se producen hojas de afeitar para vender en paquetes de cinco unidades.
Por un estudio previo del proceso de fabricación se sabe que el 32 por ciento de las hojas
producidas son de calidad normal y el resto de calidad extra. Calcular, con cinco cuatro signi-
ficativas, la probabilidad de que un cliente compre un paquete con:
Si, por término medio, el cliente usa doce paquetes de hojas de afeitar al año, encontrar con
cuatro cifras significativas, la probabilidad de que reciba:
a) Calcular la probabilidad de que el almacén tenga que pagar la compensación por una
bolsa de patatas suministrada al granjero.
El granjero necesita al año 120 bolsas y se sabe que por término medio la compensación por
bolsa es 95 céntimos de euro. Calcular:
5-24. Un experimento se realiza con objeto de observar un determinado suceso. Se sabe que
en cada una de las pruebas la probabilidad de que aparezca el suceso es 1/5. Se define la
variable aleatoria X como el número de pruebas que se precisa realizar hasta que aparece
dicho suceso por primera vez. Para la variable aleatoria X, determinar:
5-25. En un examen hay 10 preguntas de tipo “test”. Cada una de ellas tiene 3 opciones, de
las que sólo una es válida. Una estudiante que no ha estudiado nada ha decidido presentarse
y responder a las 10 preguntas al azar.
c) Cada pregunta acertada suma un punto y cada pregunta fallada resta c puntos (donde
0 < 𝑐 < 1). Expresa la variable aleatoria 𝑌, que representa la puntuación que va a ob-
tener esa persona, en función de la variable 𝑋 (número de respuestas que va a acertar)
y de la constante c.
d) ¿Cuál ha de será el valor de c para que la puntuación media de alguien que contesta al
azar sea 0?
5-26. El número de averías en la línea de producción de una fábrica se ajusta a una distribución
de Poisson con igual a 2 averías por semana. Determinar:
5-27. Una planta de gas está equipada con un generador que se pone automáticamente en
funcionamiento si falla la red general de energía eléctrica. Se ha estimado que, en un día dado,
hay una probabilidad del 1.5% de que falle la red eléctrica general. El generador es fiable en
un 95%. Si el generador falla, se dispone también de un sistema de alimentación ininterrum-
pida (SAI). El SAI consiste de seis baterías conectadas en paralelo de manera que la SAI sumi-
nistra potencia si una de las seis baterías está cargada. La SAI puede suministrar suficiente
potencia para n horas, siendo n el número de baterías cargadas. Cada una de las baterías del
SAI tiene una probabilidad de 0.1 de que no esté cargada.
5-28. Las llamadas telefónicas a la centralita del Campus de Esteiro siguen una distribución de
Poisson de parámetro igual a 3 llamadas cada 5 minutos. Calcular las siguientes probabilida-
des:
5-29. Una centralita telefónica puede atender un máximo de cinco llamadas por minuto. El
promedio de llamadas es de 180 llamadas por hora. Calcular:
b) Número medio de minutos por hora en que la centralita podrá atender las llamadas re-
cibidas.
c) Probabilidad de que no se produzca saturación en ningún minuto a lo largo de una hora.
5-30. La centralita telefónica de una empresa multinacional puede atender un máximo de seis
llamadas por minuto. El promedio de llamadas por hora es 225.
5-31. En un proceso industrial se obtienen muestras de 25 piezas cada hora con objeto de
comprobar si el proceso está o no bajo control. De manera habitual, un 1% de las piezas ne-
cesita un reprocesado. Sea 𝑋 el número de piezas de la muestra de 25 que necesitan un re-
procesado. Un proceso industrial se supone que está fuera de control si 𝑋 excede su media en
más de tres veces su desviación estándar.
a) Función de probabilidad de 𝑋
b) Si el porcentaje de piezas que necesitan un reprocesado permanece en un 1%, ¿cuál es
la probabilidad de que 𝑋 exceda su media en más de tres veces su desviación típica?
c) Si el porcentaje de piezas que necesitan un reprocesado aumenta a un 4%, ¿cuál es la
probabilidad de que 𝑋 sea mayor que 1?
d) Si el porcentaje de piezas que necesitan un reprocesado aumenta a un 4%, ¿cuál es la
probabilidad de que 𝑋 sea mayor que 1 en al menos una de las siguientes cinco horas
de muestras?
5-32. Una gran empresa de transporte utiliza para sus vehículos unos neumáticos de los que
se sabe que el número de pinchazos que sufre un vehículo tiene una distribución de Poisson
de media 0.2 pinchazos por cada 50.000 Km recorridos. Si el vehículo recorre en dos meses
una distancia de 10.000 Km, calcular:
Si la empresa dispone de una flota de 100 vehículos iguales que emplean el mismo tipo de
neumáticos: