TAREA 8B APROXIMACIÓN NORMAL A LA BINOMIAL
Con muestras pequeñas podemos obtener toda la distribución de probabilidades de una
variable X con una distribución binomial desarrollando el binomio (q + p) n, también podemos
obtener la distribución de probabilidades con la fórmula para calcular f(x) = P(X = x).
Para efectuar inferencias es necesario calcular probabilidades en intervalos, para muestras
grandes es muy latoso calcular probabilidades en intervalos para la binomial, antes de las
computadoras se usaba tablas de la binomial, y actualmente hay programas como Excel que
nos permiten obtener las probabilidades para la binomial, aunque las muestras sean muy
grandes.
Como la distribución binomial se aproxima a una distribución normal con una media μ = np,
y con una varianza σ² = npq cuando la muestra es grande, también podemos usar la
distribución normal para calcular probabilidades con la distribución binomial.
Una regla práctica sostiene que cuando tanto np como nq son mayores que cinco, la
aproximación es aceptable y buena si son mayores que 15.
Una mejor aproximación se obtiene usando la corrección por continuidad, que consiste en
considerar que cada valor exacto x de la variable X es un dato redondeado que puede ser igual
a cualquier valor en el intervalo entre los valores x – 0.5 y x + 0.5.
EJEMPLO
La variable X: el número de hijos machos de una cerda con 10 lechones tiene una
distribución binomial, ya que la muestra se obtiene sin reemplazo de una población muy
grande.
Los parámetros son n = 10 (el número de hijos), y p = 50 % = 50 ÷ 100 = 0.5 la probabilidad
de obtener un macho en cada uno de los 10 hijos, q = 1 – p = 1 – 0.5 = 0.5 es la probabilidad
de obtener una hembra en cada uno de los 10 hijos.
La probabilidad de que al elegir al azar y sin reemplazo una hembra con 10 hijos, tenga 8
hijos machos y dos hijas hembras (la proporción de hembras en la población, con ocho hijos
machos y dos hembras): P(MMMMMMMMHH) = P(X = 8) = f(8), se puede obtener con la
fórmula de la binomial:
f(8) = 10C8(0.5)²(0.5)8 = 45(0.5)10 = 45(0.0009765625) = 0.04394531
De cada millón de hembras con 10 hijos 43,945 tienen 8 hijos machos y dos hembras.
Como la muestra es pequeña, toda la distribución de probabilidades se puede obtener con
el binomio (q + p)n = (0.5 + 0.5)10.
La proporción de hembras con 10 hijos con 8 hijos machos o menos, es la probabilidad de
que X sea igual o menor que ocho:
P(X ≤ 8) = F(8) = f(0) + f(1) + f(2) + f(3) + f(4) + f(5) + f(6) + f(7) + f(8)
Para calcularla nos falta obtener ocho probabilidades más con la fórmula, o desarrollar el
binomio hasta el noveno término, es más fácil ver F(8) = 0.989257813 en Excel utilizando la
función: DISTR.BINOM.N(x,n,p,ACUMULADO) = DISTR.BINOM.N(8,10,0.5,ACUMULADO).
P(X > 8) = 1 – P(X ≤ 8) =1 – F(8) = 1 – 0.9893 = 0.0107
Para obtener P(X = 8) = f(8) necesitamos ver en Excel: F(7) = 0.9453125
P(X ≤ 7) = F(7) = f(0) + f(1) + f(2) + f(3) + f(4) + f(5) + f(6) + f(7)
Como F(8) = F(7) + f(8) podemos obtener f(8) = F(8) – F(7) = 0.9893 – 0.9453 = 0.0440
La diferencia con la probabilidad calculada utilizando f(x) es solo por error de redondeo.
Aunque la muestra es pequeña, podemos obtener aproximaciones con la distribución
normal, pues np = 10(0.5) = 5 y nq = 10(0.5) = 5 están en el límite para utilizarlas.
En la normal todo depende de sus parámetros, la media y la varianza de X.
Como X es binomial, μ = np = 10(0.5) = 5 y σ² = npq = 10(0.5)(0.5) = 2.5
La desviación estándar σ = √2.5 = 1.5811
La aproximación mejora tomando en cuenta la corrección por continuidad, debido a que la
normal es una distribución para variables continuas P(X = 8) = 0
Para calcular las aproximaciones con la normal, debemos considerar que 8 no es un valor
exacto sino un valor en el intervalo entre 8 – 0.5 = 7.5 y 8 + 0.5 = 8.5
F(8) = P(X ≤ 8) = P(X ≤ 8.5) = 0.9866 utilizando DISTR.NORM.N(x,μ,σ,VERDADERO)
Con x = 8.5, μ = 5, σ = 1.5811, y VERDADERO
La aproximación es buena a dos decimales, ya que con la binomial F(8) = 0.9893
La aproximación y la probabilidad correcta son 0.99 si las redondeamos a dos decimales.
La aproximación mejora si las muestras son más grandes:
Se sembraron en una parcela 300 semillas (la muestra) de un híbrido obtenido de la cruza
entre dos variedades de chícharo (la población), una variedad con semilla lisa (la característica
dominante) y la otra con semilla arrugada (la característica recesiva).
Como la población es muy grande, la variable aleatoria X: el número de plantas con semilla
lisa en la muestra tiene una distribución binomial con n = 300 y p = 0.75 (por las leyes de
Mendel).
La proporción poblacional de plantas con la semilla lisa es: p = 3 / 4 = 0.75 = 75 %
La proporción de plantas con semilla arrugada es: q = 1 – p = 1 – 0.75 = 0.25 = 25 %
Como np = 300(0.75) = 225 y nq = 300(0.25) = 75 y los dos productos son mucho mayores
que 15, la aproximación normal a la binomial sería muy buena.
Para obtener aproximaciones con la distribución normal, se necesitan sus parámetros, la
media μ = np = 300(0.75) = 225 y la varianza σ² = npq = 300(0.75)(0.25) = 56.25
También necesitamos la desviación estándar σ = √56.25 = 7.5
Una aproximación a la probabilidad de obtener en la muestra menos de 235 plantas con
semilla lisa (y más de 65 plantas con semilla rugosa), es:
P(X < 235) = P(X ≤ 234.5) = F(234.5) = 0.8974
Utilizando DISTR.NORM.N(x,μ,σ,VERDADERO)
Con x = 234.5, μ = 225, σ = 7.5, y VERDADERO.