Distribuciones Binomial y Hipergeométrica
Distribuciones Binomial y Hipergeométrica
Probabilidad y estadística
Unidad 3
2
Distribución binomial
Es una distribución de probabilidad discreta que describe el número de éxitos al realizar n
experimentos independientes entre sí, acerca de una variable aleatoria.
Existen una gran diversidad de experimentos o sucesos que pueden ser caracterizados bajo esta
distribución de probabilidad. Imaginemos el lanzamiento de una moneda en el que definimos el
suceso “sacar cara” como el éxito. Si lanzamos 5 veces la moneda y contamos los éxitos (sacar
cara) que obtenemos, nuestra distribución de probabilidades se ajustaría a una distribución
binomial.
Por lo tanto, la distribución binomial se entiende como una serie de pruebas o ensayos en la que
solo podemos tener 2 resultados (éxito o fracaso), siendo el éxito nuestra variable aleatoria.
Para que una variable aleatoria se considere que sigue una distribución binomial, tiene que
cumplir las siguientes propiedades:
En cada ensayo, experimento o prueba solo son posibles dos resultados (éxito o fracaso).
La probabilidad del éxito ha de ser constante. Esta se representa mediante la letra p. La
probabilidad de que salga cara al lanzar una moneda es 0,5 y esta es constante dado que la
moneda no cambia en cada experimento y las probabilidades de sacar cara son constantes.
La probabilidad de fracaso ha de ser también constate. Esta se representa mediante la
letra q = 1-p. Es importante fijarse que mediante esa ecuación, sabiendo p o sabiendo q, podemos
obtener la que nos falte.
El resultado obtenido en cada experimento es independiente del anterior. Por lo tanto, lo
que ocurra en cada experimento no afecta a los siguientes.
Los sucesos son mutuamente excluyentes, es decir, no pueden ocurrir los 2 al mismo
tiempo. No se puede ser hombre y mujer al mismo tiempo o que al lanzar una moneda salga cara
y cruz al mismo tiempo.
Los sucesos son colectivamente exhaustivos, es decir, al menos uno de los 2 ha de
ocurrir. Si no se es hombre, se es mujer y, si se lanza una moneda, si no sale cara ha de salir cruz.
La variable aleatoria que sigue una distribución binomial se suele representar como
X~(n,p), donde n representa el número de ensayos o experimentos y p la probabilidad de éxito.
Es importante resaltar que la expresión entre corchetes no es una expresión matricial, sino que es
un resultado de una combinatoria sin repetición. Este se obtiene con la siguiente formula:
Imaginemos que un 80% de personas en el mundo ha visto el partido de la final del último
mundial de fútbol. Tras el evento, 4 amigos se reúnen a conversar, ¿Cuál es la probabilidad de
que 3 de ellos hayan visto el partido?
x = número de éxitos, que en este caso es igual a 3, dado que buscamos la probabilidad de que
3 de los 4 amigos lo hayan visto.
Por tanto, nuestro resultado final sería: 4*0,512*0,2 = 0,4096. Si multiplicamos por 100 tenemos
que hay una probabilidad del 40,96% de que 3 de los 4 amigos haya visto el partido de la final
del mundial.
4
La última novela de un autor ha tenido un gran éxito, hasta el punto de que el 80% de los lectores
ya la han leído.
Distribución hipergeométrica
Cada una de las pruebas puede dar únicamente dos resultados mutuamente excluyentes: A y
no A.
Función de cuantía.
Veamos :
6
que para valores de X comprendidos entre el conjunto de enteros 0,1,…. .n será la expresión de
la función de cuantía de una distribución , Hipergeométrica de parámetros N,n,p .
Media y varianza.
Es bien sabido que la media de la suma de variables aleatorias (sean éstas independientes o no)
es la suma de las medias y por tanto la media de una distribución hipergeométrica será , como en
el caso de la binomial :
Si se evalúa el valor de la varianza para nuestro caso se obtiene que la varianza de una
distribución hipergeométrica de parámetros N,n,p es : si
7
Esta forma resulta ser la expresión de la varianza de una binomial (n, p) afectada por un
coeficiente corrector [N-n/N-1] , llamado coeficiente de exhaustividad o Factor Corrector de
Poblaciones Finitas (F.C.P.F.) y que da cuenta del efecto que produce la no reposición de los
elementos extraídos en el muestreo.
Este coeficiente es tanto más pequeño cuanto mayor es el tamaño muestral (número de
pruebas de n ) y puede comprobarse como tiende a aproximarse a 1 cuando el tamaño de la
población N es muy grande . Este último hecho nos confirma lo ya comentado sobre la
irrelevancia de la reposición o no cuando se realizan extracciones sucesivas sobre una población
muy grande. Con una población muy grande se cual fuere el tamaño de n , el factor corrector
sería uno lo que convertiría , en cierto modo a la hipergeométrica en una binomial (ver D.
Binomial) . Así
Hemos visto como la media de la distribución hipergeométrica [H{N,n,p)], tomaba siempre el
mismo valor que la media de una distribución binomial [B{n,p)] también hemos comentado que
si el valor del parámetro N crecía hasta aproximarse a infinito el coeficiente de exhaustividad
tendía a ser 1, y, por lo tanto, la varianza de la hipergeométrica se aproximaba a la de la binomial
: puede probarse asimismo , cómo la función de cuantía de una distribución hipergeométrica
tiende a aproximarse a la función de cuantía de una distribución binomial cuando
8
De manera análoga a como se obtenía la moda en la distribución binomial es fácil obtener la
expresión de ésta para la distribución hipergeométrica. De manera que su expresión X0 sería la
del valor o valores enteros que verificasen.
Ejercicios
Diez refrigeradores de cierto tipo han sido devueltos a un distribuidor debido al a presencia de un
ruido oscilante agudo cuando el refrigerador está funcionando. Supongamos que 4 de estos 10
refrigeradores tienen compresores defectuosos y los otros 6 tienen problemas más leves. Si se
examinan al azar 5 de estos 10 refrigeradores, y se define la variable aleatoria X: “el número
entre los 5 examinados que tienen un compresor defectuoso”. Indicar:
1.
X∼Hipergeométrica(N=10,M=4,n=5)X∼Hipergeométrica(N=10,M=4,n=5)
2.
P(X≥1)=1–P(X=0)=1–(40)(65)(105)=0,97619P(X≥1)=1–P(X=0)=1–(40)(65)(105)=0,97619
10
3.
P(X≤4)=1
Un grupo de amigos del secundario se reúnen en la casa de Laura para comer un asado. En este
grupo hay 8 mujeres y 6 varones. De las mujeres 5 estudian letras y el resto exactas, mientras que
de los varones sólo uno estudia letras y el resto exactas.
a) Si las primeras en llegar a la casa son tres chicas, ¿cuál es la probabilidad de que estudien lo
mismo?
A)
Si las primeras que llegan son tres chicas (Laura ya está en su casa…) entonces hay cuatro chicas
(tres + Laura). La única forma de que estudien lo mismo es que estudien letras (no existen 4
chicas que estudien exactas en el grupo). Entonces Laura estudia Letras.
Son siete chicas las que pueden llegar a la casa de Laura (4 estudian letras y 3 exactas). Podemos
considerar a esas siete chicas cómo la población, de la que se extraen aleatoriamente tres
invididuos:
X:X: cantidad de chicas que estudian letras entre las tres primeras en llegar a la casa de Laura
(elegidas entre siete chicas en total)
12
X∼Hipergeométrica(N=7,M=4,n=3)X∼Hipergeométrica(N=7,M=4,n=3)
P(x=3)=(43)(30)(73)≅0,11429P(x=3)=(43)(30)(73)≅0,11429
B)
En esta pregunta ya no interesa el sexo de cada uno sino lo que estudian. Tenemos la siguiente
composición:
Podemos definir la variable YY: cantidad de chicos que estudian letras de un total de 3 amigos
elegidos aleatoriamente entre 14 amigos. Esa variable tiene distribución hipergeométrica
con N=14N=14, M=6M=6, n=3n=3.
Notemos que si Y=3Y=3 entonces los tres amigos estudian letras, pero si Y=0Y=0 entonces los
tres amigos estudian exactas.
P(estudienlomismo)P(estudienlomismo)
=P(Y=0)+P(Y=3)=P(Y=0)+P(Y=3)
≅0,05495+0,15385≅0,05495+0,15385
≅0,2088≅0,2088
C)
13
XX: cantidad de amigos que estudian letras entre los dos elegidos
X∼Hipergeométrica(N=14,M=6,n=2)X∼Hipergeométrica(N=14,M=6,n=2)
E(X)=nMNE(X)=nMN
E(X)=2.614=67≅0,8571E(X)=2.614=67≅0,8571
V(X)=(N–nN–1)n.MN.(1–MN)V(X)=(N–nN–1)n.MN.(1–MN)
V(X)=(14–214–1)2.614.(1–614)V(X)=(14–214–1)2.614.(1–614)
V(X)=288637=0,452V(X)=288637=0,452
Generalmente el muestreo se hace a partir de una población grande, por lo que la distribución
hipergeométrica es mucho menos usada en la vida real que la binomial. Sin embargo, si la
población es pequeña, entonces la distribución correcta a utilizar será la hipergeométrica.
N / n < 10
14
Sea X una variable aleatoria con distribucion hipergeometrica, como en la section anterior. Si el
tamano del lote es suficientemente grande, la distribucion X puede ser aproximada por la
distribucion binomial, es decir,
Hipergeometrica multivariante
p1, ..., pn, donde , es decir, la proporción de bolas de color i-ésimo (i= 1, 2,..,n) en la
primera extracción.
NOTA: Si las extracciones se hiciesen con reposición entonces se trataría de una distribución
multinomial.
para con
y (i = 1, 2,..., n).
Además, igual que en la distribución anterior, hay que tener en cuenta que existe una relación
lineal entre las variables componentes, X1+ X2+ ...+ Xn = m, por lo que, una de las variables,
por ejemplo Xn, se puede poner como combinación lineal del resto, Xn=m-X1- X2- ...- Xn-1.
Por tanto, el fenómeno que describe la variable (X1, X2, ..., Xn) queda igualmente descrito por
una variable de una dimensión menor, (X1, X2, ..., Xn-1), sin que esta pérdida de dimensión
suponga una pérdida de información.
Además, cada una de las n variables, Xi, que forman una hipergeométrica H(N,m,p1,...,pn)
siguen distribuciones hipergeométricas univariantes H(N,m,pi), es decir, las distribuciones
marginales de una hipergeométrica multivariante son hipergeométricas, por tanto, la esperanza y
la varianza de cada una de estas variables es, E[Xi]=m·pi y Var(Xi)=mpi(1-pi)(N-m)/(N-1).
Además la covarianza entre dos cualesquiera de sus componentes es,
donde
16
Distribución Geométrica
La distribución de probabilidad del número X del ensayo de Bernoulli necesaria para obtener
un éxito, contenido en el conjunto { 1, 2, 3,...} o
Cual de éstas es la que uno llama "la" distribución geométrica, es una cuestión de convención y
conveniencia.
para x = 1, 2, 3,.... Equivalentemente, la probabilidad de que haya x fallos antes del primer éxito
es para x = 0, 1, 2, 3,....
De todas estas distribuciones de probabilidad contenidas en {1, 2, 3,... } con un valor esperado
dado μ, la distribución geométrica X con parámetro p = 1/μ es la de mayor entropía. La
distribución geométrica del número y de fallos antes del primer éxito es infinitamente divisible,
18
esto es, para cualquier entero positivo n, existen variables aleatorias independientes Y 1,...,
Yndistribuidas idénticamente la suma de las cuales tiene la misma distribución que tiene Y. Estas
no serán geométricamente distribuidas a menos que n = 1.
Las probabilidades p y q son constantes en todas las pruebas, por tanto , las pruebas ,son
independientes (si se trata de un proceso de "extracción" éste se llevará a , cabo con devolución
del individuo extraído) .
La función de cuantía P(x) hará corresponder a cada valor de X la probabilidad de obtener el
primer éxito precisamente en la X-sima prueba. Esto es , P(X) será la probabilidad del suceso
obtener X-1 resultados "no A" y un éxito o resultado A en la prueba número X teniendo en
cuenta que todas las pruebas son independientes y que conocemos sus probabilidades tendremos:
dado que se trata de sucesos independientes y conocemos las probabilidades
19
Función de distribución
En base a la función de cuantía se puede expresar la función de distribución de la siguiente
manera.
Distribución multinomial
20
Hay ensayos o pruebas independientes. • Cada ensayo resulta en alguno de los 𝑘posibles
resultados mutuamente excluyentes. • En cada ensayo, estos 𝑘 resultados ocurren con
probabilidades 𝑝1, … , 𝑝 𝑘. 𝑖=0 𝑘 𝑝𝑖 = 1 𝑛
Si los eventos E1, E2, . . . , EK pueden ocurrir con probabilidades p1, p2, . . . , pK,
respectivamente, entonces la probabilidad de que E1, E2, . . . , EK ocurran X1, X2, . . . , XK
veces, respectivamente, es
Distribución de Poisson
Es una distribución que se basa en el conteo de las veces que se presenta un evento dentro de un
área de oportunidad dada. El área de oportunidad es una unidad continua o intervalo de tiempo,
volumen o área en donde se puede presentar más de un evento.”
Esta distribución es una de las más importantes distribuciones de variable discreta. Sus
principales aplicaciones hacen referencia a la modelización de situaciones en las que nos interesa
determinar el número de hechos de cierto tipo que se pueden producir en un intervalo de tiempo o
de espacio, bajo presupuestos de aleatoriedad y ciertas circunstancias restrictivas. Otro de sus
usos frecuentes es la consideración límite de procesos dicotómicos reiterados un gran número de
veces si la probabilidad de obtener un éxito es muy pequeña.
23
· Se observa la realización de hechos de cierto tipo durante un cierto periodo de tiempo o a lo
largo de un espacio de observación
· Los hechos a observar tienen naturaleza aleatoria ; pueden producirse o no de una manera no
determinística.
cabe esperar que se produzcan en un intervalo unitario (media de la distribución); y que también
coincide con la varianza de la distribución.
Por otro lado es evidente que se trata de un modelo discreto y que el campo de variación de la
Se puede demostrar que una binomial cuya n (número de experimentos) es muy grande y su p
(probabilidad) tiende a 0, es decir, un suceso raro. Se aproxima como una Poisson con λ=np
Suponga que se desea encontrar la función de probabilidad de la variable aleatoria X que indica
número de accidentes ocurridos en una semana.
Si se verifica que
Las probabilidades p y q son constantes en todas las pruebas. Todas las pruebas son
independientes. Si se trata de un experimento de extracción éste se llevará cabo con
devolución del individuo extraído, a no ser que se trate de una población en la que el número
de individuos tenga de carácter infinito.
dado que las pruebas son independientes y conocemos que P(A)= p y P(no A)= q
que sería la probabilidad de x si el suceso fuera precisamente con los resultados en ese orden.
Dado que pueden darse otros órdenes, en concreto formas u órdenes distintos. La
función de cuantía de la distribución binomial negativa quedará como:
29
La fórmula anterior no es difícil de deducir. Piensa que para esta situación estamos seguros de
que el k-ésimo intento es un éxito y que en los k-1 intentos anteriores se deben redistribuir los
anteriores r-1 éxitos.
La distribución geométrica sería un caso particular de binomial negativa cuando r = 1.
Los parámetros media, varianza y desviación típica asociados a esta distribución serían:
EJEMPLO 1
Para tratar a un paciente de una afección de pulmón, han de ser operados en operaciones
independientes sus 5 lóbulos pulmonares. La técnica a utilizar es tal que si todo va bien, lo que
ocurre con probabilidad de 7/11, el lóbulo queda definitivamente sano, pero si no es así se deberá
esperar el tiempo suficiente para intentarlo posteriormente de nuevo. Se practicará la cirugía
hasta que 4 de sus 5 lóbulos funcionen correctamente. ¿Cuál es el valor de intervenciones que se
espera que deba padecer el paciente? ¿Cuál es la probabilidad de que se necesiten 10
intervenciones?
Este es un ejemplo claro de experimento aleatorio regido por una ley binomial negativa, ya que
se realizan intervenciones hasta que se obtengan 4 lóbulos sanos, y éste es el criterio que se
utiliza para detener el proceso. Identificando los parámetros se tiene que si X= Número de
operaciones hasta obtener r=4 con resultado positivo,
30
EJEMPLO 2:
Se sabe que la probabilidad de que un niño expuesto a una enfermedad contagiosa la contraiga es
de 0,4. Calcula la probabilidad de que el décimo niño estudiado sea el tercero en contraer la
enfermedad.
Podemos enfocar el problema como una binomial negativa de parámetros X = 10, k=3 y p=0,4
El primer modelo probabilístico que se estudia es el uniforme discreto, que consiste en distribuir
a partes iguales la masa de probabilidad entre un número finito de valores.
Sea una variable aleatoria uniforme discreta, que toma los valores . La función
de cuantía viene dada por la siguiente expresión
Es una distribución muy sencilla que asigna probabilidades iguales a un conjunto finito de puntos
del espacio.
Modeliza fenómenos en los que tenemos un conjunto de n sucesos posibles, cada uno de los
cuales con la misma probabilidad de ocurrir. Si aleatorizamos de forma que cada uno de éstos
sucesos se corresponda con un número natural del 1 al n obtendremos una distribución uniforme.
Tendremos un único parámetro ; n
31
Su función de cuantía definida para los valores de x ={ 1, 2, , n} vendrá dada por la constante:
P(x) = l /n para x ={ 1, 2, , n}
Su función de distribución vendrá dada por
Se lanza un par de dados. Se define la variable aleatoria como la suma de las puntuaciones
obtenidas. Hallar la función de probabilidad, la esperanza matemática y la varianza
32
Se lanza un par de dados. Se define la variable aleatoria como la suma de las puntuaciones
obtenidas. Hallar la función de probabilidad, la esperanza matemática y la varianza
33
Un jugador lanza un dado corriente. Si sale o número primo, gana tantos cientos de euros como
marca el dado, pero si no sale número primo, pierde tantos cientos de euros como marca el dado.
Determinar la función de probabilidad y la esperanza matemática del juego
Un jugador lanza un dado corriente. Si sale o número primo, gana tantos cientos de euros como
marca el dado, pero si no sale número primo, pierde tantos cientos de euros como marca el dado.
Determinar la función de probabilidad y la esperanza matemática del juego
34
35
36
37
38
39
8.1 DistribuciÃ3n uniforme discreta. (s. f.). epv. Recuperado 7 de noviembre de 2020, de
https://carleos.epv.uniovi.es/%7Ecarleos/docencia/teloydisren/descriptiva+probabilidad/l
_edyp/lib_edyp_html/node46.html
hipergeometrica-por-la-binomial/?
frame=d914fd2125b0a8267ef994745d465a5d9e74d172
40
de 2020, de https://prezi.com/36ykuckoahqf/aproximacion-de-binomial-a-poisson/
https://cdigital.uv.mx/bitstream/handle/123456789/47475/ChimalBernalRocio.pdf?
sequence=1&isAllowed=y
%20de%20probabilidad/binegativa.htm
https://www.uv.es/ceaces/base/modelos%20de%20probabilidad/geometrica.htm
Distribución hipergeométrica - Minitab. (s. f.). (C) Minitab, LLC. All rights Reserved. 2019.
mx/minitab/18/help-and-how-to/probability-distributions-and-random-data/supporting-
topics/distributions/hypergeometric-distribution/
2020, de https://prezi.com/ebfpilzc2iki/distribucion-uniforme-discreta/
de 2020, de http://www5.uva.es/estadmed/probvar/d_multivar/dnvar6.htm
https://www.uv.es/ceaces/base/modelos%20de%20probabilidad/hipergeometrica.htm
Didáctico - Superprof.
https://www.superprof.es/apuntes/escolar/matematicas/probabilidades/distribucion-
binomial/problemas-y-ejercicios-de-la-distribucion-binomial.html
https://www.uv.es/ceaces/base/modelos%20de%20probabilidad/uniformedis.htm
https://www.ugr.es/~bioestad/_private/Tema_4_color.pdf
https://economipedia.com/definiciones/distribucion-binomial.html
2020, de https://es.slideshare.net/alexanderfloresvalencia/distribucion-hipergeometrica-
28097904
Variable aleatoria discreta Bachillerato. (s. f.). José R. Galo Sánchez. Recuperado 7 de
noviembre de 2020, de
https://proyectodescartes.org/iCartesiLibri/materiales_didacticos/EstadisticaProbabilidadI
nferencia/VAdiscreta/4_4DistribucionBinomialNegativa.html
42