UNIVERSIDAD TECNOLOGICA DE CANCUN ASIGNATURA: ESTADÍSTICA INDUSTRIAL
ELABORO: RENE ROMERO 2016
DISTRIBUCION DE PROBABILIDAD
Una población en estadística es el conjunto de todas las observaciones en las
que estamos interesados. Se llama tamaño de la población al número (N), de
individuos que la componen, siendo cada posible observación un individuo; así
pues, las poblaciones pueden ser finitas e infinitas.
Cada observación en una población es un valor de una variable aleatoria que
denotaremos por X, con una función de probabilidad o densidad
determinada f(x). Normalmente, se denomina a las poblaciones con el nombre
de la distribución de la variable; es decir, hablaremos de poblaciones normales,
binomiales, etc.
Para estudiar una población existen dos posibilidades. Una de ellas consiste en
estudiar todos sus elementos y sacar conclusiones; la otra consiste en estudiar
sólo una parte de ellos, una muestra, elegidos de tal forma que nos digan algo
sobre la totalidad de las observaciones de la población. El mejor método ser el
primero, cuando es posible, lo cual sólo ocurre en las poblaciones finitas y
razonablemente pequeñas; en el caso de poblaciones muy grandes o infinitas
será muy difícil o imposible realizar un estudio total. En este caso
necesitaremos tomar una muestra y nos surgirá el problema de cómo hacer
para que la muestra nos diga algo sobre el conjunto de la población.
VARIABLES ALEATORIAS DISCRETAS Y
SUS DISTRIBUCIONES DE PROBABILIDAD
Objetivo. Identificar y aplicar el concepto de distribución de probabilidad al
cálculo de probabilidades de un evento aleatorio
En temas anteriores las variables se definieron como características que
cambian o varían con el tiempo y/o para diferentes personas u objetos bajo
consideración. Las variables cuantitativas generan datos numéricos, en tanto
que las variables cualitativas (cualidades), generan datos categóricos o de
atributos. No obstante, incluso las variables cualitativas pueden generar datos
UNIVERSIDAD TECNOLOGICA DE CANCUN ASIGNATURA: ESTADÍSTICA INDUSTRIAL
ELABORO: RENE ROMERO 2016
numéricos si las categorías son codificadas numéricamente para formar una
escala. Por ejemplo, si se lanza al aire una sola moneda, el resultado
cualitativo podría registrarse como “0” si es cara (sol), o como “1” si es cruz
(águila).
Una variable x valuada numéricamente varía o cambia, dependiendo del
resultado particular del experimento que se mida. Por ejemplo, suponga que se
tira un dado y se mide x, el número observado en la cara superior. La variable
x puede tomar cualquiera de seis valores: 1, 2, 3, 4, 5, 6, dependiendo del
resultado aleatorio del experimento. Por esta razón, la variable x se conoce
como variable aleatoria.
Definición Una variable x es variable aleatoria si el valor que toma,
correspondiente al resultado de un experimento, es una probabilidad o evento
aleatorio. Es decir que el resultado de cada experimento es resultado del azar
Ejemplos de variable aleatoria:
a. En un juego de dados, el evento de “x es un par”
b. De la producción de tornillos, “x tiene al menos un defecto”
Las variables aleatorias cuantitativas se clasifican ya sea como discretas o
como continuas, de acuerdo con los valores que x pueda tomar. Es importante
distinguir entre variables aleatorias discretas y continuas, porque se usan
técnicas diferentes para describir sus distribuciones. Para comprender este
concepto nos concentramos en variables aleatorias discretas que solo pueden
tomar valores enteros y un numero finito se ellos
Definición: La distribución de probabilidad para una variable aleatoria discreta es
una fórmula, tabla o gráfica que da los posibles valores de x, y la probabilidad P(x)
asociada con cada valor de x.
Iniciaremos por definir lo siguiente:
LOS REQUISITOS PARA UNA DISTRIBUCIÓN DE PROBABILIDAD DISCRETA
a . 0 ≤ P ( x )≤ 1
b . ∑ P ( x ) =1
Construyendo la distribución de probabilidad
Ejemplo: PARTAMOS DE UN SENCILLO EXPERIMENTO.
Lance al aire dos monedas y sea el evento “x igual al número de soles
observadas” (es fácil ver que el experimento puede tener varias
opciones).
Encuentre la distribución de probabilidad para ese evento:
Solución. Los eventos simples para este experimento con sus
respectivas probabilidades se muestran en la tabla siguiente:
UNIVERSIDAD TECNOLOGICA DE CANCUN ASIGNATURA: ESTADÍSTICA INDUSTRIAL
ELABORO: RENE ROMERO 2016
Evento simple Moneda 1 Moneda 2 P(E) x
E1 Sol Sol ¼ 2
E2 Sol Águila ¼ 1
E3 Águila Sol ¼ 1
E4 Águila Águila ¼ 0
Como:
E1 =HH resulta en dos soles, (X=2)
E2, E3 = este evento simple resulta en obtener un sol, (x = 1)
E4= en este evento no se obtiene un sol (x=0)
Las probabilidades de x aparecen en la tabla siguiente
X Eventos simples en x P(x)
0 E4 ¼
1 E2, E3 1/2
2 E1 ¼
Elabore el gráfico de la distribución de las probabilidades (histograma y poligonal)
P P
0.6
0.5
0.5
0.4
0.3
0.25 0.25 0.2
0.1
0
0 1 2 0 0.5 1 1.5 2 2.5
La segunda gráfica muestra la forma usual (una curva normal o tambien llamada
gaussiana), de una distribución de probabilidades, es importante mencionar que
para obtener una distribución “aproximada” de probabilidad, el experimento debe
repetirse un número muy grande (infinito).
La media y desviación estándar para una variable aleatoria discreta.
Definición. Sea x una variable aleatoria discreta con distribución de probabilidad
p(x). El valor esperado o tambien llamada media ( µ), de la variable x se calcula
con la fórmula:
μ= E ( x )=Σ x p(x )
UNIVERSIDAD TECNOLOGICA DE CANCUN ASIGNATURA: ESTADÍSTICA INDUSTRIAL
ELABORO: RENE ROMERO 2016
Definición Sea x una variable aleatoria discreta con distribución de probabilidad
p(x) y media esperada μ. La varianza de x denotada por σ 2, se obtiene por la
expresión siguiente:
σ 2=E ( x−μ )2=∑ ( x−μ)2 p( x )
Definición. La desviación estándar de un conjunto de datos es una medida
de cuánto se desvían los datos de su media y toma en consideración el
valor de cada [Link] desviación estándar σ de una variable aleatoria x es igual
a la raíz cuadrada de su varianza:
σ =√ σ 2
Llamaremos intervalo de confianza a la expresion: μ ± nσ
Por ejemplo: μ ±2 σ llamado “intervalo dos sigma” (reúne al 95.4 % de la
población).
Este valor lo asigna el diseñador del estudio estadístico pudiendo ser mayor como:
μ ±3 σ llamado “intervalo tres sigma” (reúne al 99.6%). Y asi podemos ir
aumetando el intervalo de confianza. Explicar este concepto mediante una gráfica
gaussiana
Ejercicio.
Una tienda de electrónica vende un modelo particular de computadora portátil.
Hay sólo cuatro computadoras en existencia y la gerente se pregunta cuál será la
demanda de hoy para este modelo particular. Ella se entera en el departamento de
marketing de que la distribución de probabilidad para x, la demanda diaria para
la laptop, es como se muestra en la tabla.
Encuentre la media, varianza y desviación estándar de x.
¿Es probable que cinco o más clientes deseen comprar una laptop hoy, considere
un intervalo de confianza del 95.4% (dos sigmas)?
x 0 1 2 3 4 5
P(x) 0,1 0,40 0,20 0,15 0,10 0,05
A continuación se presenta la tabla de cálculos de este problema
UNIVERSIDAD TECNOLOGICA DE CANCUN ASIGNATURA: ESTADÍSTICA INDUSTRIAL
ELABORO: RENE ROMERO 2016
x p(x) x*p(x) ሺ࢞ െ ࣆሻ ሺ࢞ െࣆሻ כሺ࢞ሻ
0 0,1 0 3,61 0,361
1 0,4 0,4 0,81 0,324
2 0,2 0,4 0,01 0,002
3 0,15 0,45 1,21 0,1815
4 0,1 0,4 4,41 0,441
5 0,05 0,25 9,61 0,4805
totales 1 1,9 1,79
distribuciones de [Link]
Interpretación de resultados:
μ=1,90 σ 2=1,79 σ= √1,79=1.34
p(x)
0.45
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
0 1 2 3 4 5 6
La gráfica de la distribución de probabilidad se muestra en la figura anterior.
Como la distribución tiene más o menos la forma de montículo, aproximadamente
95% de todas las mediciones deben estar a no más de dos desviaciones estándar de
la media, es decir,
De acuerdo con el intervalo de confianza: μ ±2 σ = 1.90± 2 ( 1.34 ) ≅ 95.4 %
Observe que esperar que 5 clientes compren una laptop queda en el límite
del intervalo de confianza (95.4% establecido al inicio), por lo que es
probable que ocurra esa venta. Con esta información ¿Qué decisión deberá
tomar la gerente de la tienda?
UNIVERSIDAD TECNOLOGICA DE CANCUN ASIGNATURA: ESTADÍSTICA INDUSTRIAL
ELABORO: RENE ROMERO 2016
DISTRIBUCIONES DE PROBABILIDAD DISCRETAS
DISTRIBUCIÓN BINOMIAL
La distribución Binomial es un caso particular de probabilidad de variable aleatoria discreta, y
por sus aplicaciones, es posiblemente la más importante.
Esta distribución corresponde a la realización de un experimento aleatorio que cumple con las
siguientes condiciones:
Definición. Se llama experimento binomial a aquel que cumple las siguientes caracteristicas:
1. El experimento consiste en n intentos idénticos.
2. Cada intento resulta en uno de dos resultados. El resultado uno se llama éxito E, y el otro
se llama fracaso, F.
3. La probabilidad de éxito en un solo intento es igual a p y es igual de un intento a otro. La
probabilidad de fracaso es igual a (1 - p) = q.
4. Los intentos son independientes.
5. Estamos interesados en x, el número de éxitos observado durante los n intentos,
para x = 0, 1, 2, …, n
Todo experimento que tenga estas características se dice que sigue el modelo
de la distribución Binomial o distribución de Bernoulli.
En general, si se tienen n ensayos Bernoulli con probabilidad de éxito p y de
fracaso q, entonces la distribución de probabilidad que la modela es la
distribución de probabilidad binomial y su regla de correspondencia es:
n!
P ( X=k )= p k q n−k
k ! ( n−k ) !
Siendo:
P(x) = probabilidad de ocurrencia del evento
p = probabilidad de éxito del evento (en un intento)
q = es la probabilidad del fracaso del evento (en un intento), es igual a (1-p)
k= ocurrencia del evento o éxitos deseados
n = número de intentos
UNIVERSIDAD TECNOLOGICA DE CANCUN ASIGNATURA: ESTADÍSTICA INDUSTRIAL
ELABORO: RENE ROMERO 2016
MEDIA Y DESVIACION ESTANDAR PARA LA VARIABLE ALEATORIA BINOMIAL
Para esta distribución de probabilidad la media y la desviación estándar se
calculan con las formulas siguientes:
Media; μ=np
Varianza: σ 2=npq
Desviación estándar: σ =√ npq
Ejemplo.
1. ¿Cuál es la probabilidad de obtener exactamente 2 caras al lanzar una
misma moneda 6 veces?
2. ¿Cuál es la probabilidad de una variable binomial de observar 2 éxitos
en una secuencia de 10 intentos, si p(x) = 0,16?
3. Calcule las probabilidades del ejemplo anterior trace la grafica de la
distribución de probabilidad de este experimento
x p(x) x*p(x) ሺ࢞ െࣆሻ ሺ࢞ െࣆሻ כሺ࢞ሻ
0
1
2
3
4
5
6
7
8
9
10
11
totales
Calcule la media y la desviación estándar
Represente estos datos en la gráfica poligonal
4. Para el mismo problema 2 use p(x) = 0,05 y repita lo indicado en el
problema 3
5. En un tiempo largo, se ha observado que un jugador profesional de
baloncesto puede hacer un tiro libre en un intento determinado con
probabilidad igual a 0.8. Suponga que él lanza cuatro tiros libres.
a. ¿Cuál es la probabilidad de que enceste exactamente dos tiros
libres?
b. ¿Cuál es la probabilidad de que enceste al menos un tipro libre?
6. Calcule para este jugador de baloncesto para n=5, y p = 0,6 para hallar
las probabilidades de:
a. Exactamente tres tiros
b. Tres o más éxitos
UNIVERSIDAD TECNOLOGICA DE CANCUN ASIGNATURA: ESTADÍSTICA INDUSTRIAL
ELABORO: RENE ROMERO 2016
7. Se probó un régimen formado por una dosis diaria de Vitamina C
para determinar su efectividad para prevenir el resfriado común.
Diez personas que estuvieron siguiendo el régimen prescrito fueron
observadas por un año. Si la probabilidad de pasar el invierno sin un
resfriado es de 0.5, cuando cuando no se sigue el tratamiento.
Calcule la probabilidad de que 8 o mas pacientes no enfermen de
resfriado en este experimento
Distribución de densidad y acumulativa
La función acumulativa de distribución da las mismas probabilidades que
aparecen en las tablas de la probabilidad binomial. A continuación se
muestra
UNIVERSIDAD TECNOLOGICA DE CANCUN ASIGNATURA: ESTADÍSTICA INDUSTRIAL
ELABORO: RENE ROMERO 2016
funcion de funcion
densidad de acumulativa de
prob distribucion FUNCION DE DENSIDAD Y ACUMULATIVA
k= x p(x) P(x) 1,2000
n 5 0 0,0102 0,0102
1,0000
p 0,6 1 0,0768 0,0870
2 0,2304 0,3174 0,8000
3 0,3456 0,6630
4 0,2592 0,9222 0,6000
5 0,0778 1,0000 0,4000
0,2000
0,0000
0 1 2 3 4 5 6
p(x) P(x)
Cuando en una distribución binomial se realiza el experimento un numero
“n” muy elevado de veces y la probabilidad de éxito de “p” en cada ensayo
es reducida es recomendable aplicar el modelo de la distribución de
Poisson
DISTRIBUCION DE POISSON
La distribución de POISSON es también un caso particular de
probabilidad de variable aleatoria discreta, el cual debe su nombre a
Siméon Denis Poisson (1781-1840), un francés que la desarrolló a partir
de los estudios que realizó durante la última etapa de su vida.
Es útil cuando tratamos con cantidades de ocurrencia de un evento a lo
largo de un intervalo de tiempo o espacio especificado.
Esta distribución se utiliza para describir ciertos procesos.
Características:
UNIVERSIDAD TECNOLOGICA DE CANCUN ASIGNATURA: ESTADÍSTICA INDUSTRIAL
ELABORO: RENE ROMERO 2016
En este tipo de experimentos los éxitos buscados son expresados por
unidad de área, tiempo, pieza, etc:
- # de defectos de una tela por m2
- # de aviones que aterrizan en un aeropuerto por día, hora, minuto, etc.
- # de bacterias por cm2 de cultivo
- # de llamadas telefónicas a un conmutador por hora, minuto, etc, etc.
- # de llegadas de embarcaciones a un puerto por día, mes, etc, etc.
Para determinar la probabilidad de que ocurran x éxitos por unidad de
tiempo, área, o producto, la fórmula a utilizar sería:
λ x e−λ
P ( x , λ)=
x!
Donde P(x) = probabilidad de que ocurran x éxitos cuando el promedio de
ocurrencia de ellos es λ (Letra griega lambda)
λ=media o promedio de exitos por unidad de tiempo ,área o producto
e = 2.7182818…, base de los logaritmos naturales o neperianos
x = variable que denota el numero de éxitos que se desea que ocurra
la distribución de probabilidad de Poisson da una aproximación fácil y precisa a
probabilidades binomiales cuando n es grande y λ= np es pequeña de
preferencia np¿ 7
Ejemplo.
1. Suponga que una compañía de seguros de vida asegura las vidas de 5000
hombres de 42 años de edad. Si estudios actuariales muestran que la
probabilidad de que cualquier hombre de 42 años muera en un año determinado
es .001, encuentre la probabilidad exacta de que la compañía tendrá que pagar x
=4 reclamaciones durante un año determinado
a. Utilice la distribución binomial para resolver este problema
b. Utilice la distribución de Poisson
2. Si un banco recibe en promedio 6 cheques sin fondo por día, ¿Cuáles
son las probabilidades de que reciba (observe que se cumple la
condición np¿ 7)
a. cuatro cheques sin fondo en un día dado (0,13385262)
b. 10 cheques sin fondos (e= 2.718281828)(sol. 4,13%)?
Ejercicios.
1. Considere una variable de Poisson con media de λ=1.5, complete la
tabla de probabilidades siguiente:
X 0 1 2 3 4 5 6 7
p(x)
a. Encuentre la tabla estadística para esta variable
b. Calcule la media esperada
c. La desviación estándar
d. Grafica
UNIVERSIDAD TECNOLOGICA DE CANCUN ASIGNATURA: ESTADÍSTICA INDUSTRIAL
ELABORO: RENE ROMERO 2016
2. Utilizando los datos del problema anterior, llene los espacios de la tabla
siguiente:
problema Lista de Encuentre la
valores de x probabilidad
3 o menos
3 o más
Mas de 3 4,5,6,7 P(x¿ 3 ¿ 1-P(x≤ 3 ¿
Menos de 3
Entre 2 y4
(inclusive)
Exactamente
3
3. El número promedio de accidentes de tránsito en cierto crucero de carretera es dos por
semana. Suponga que el número de accidentes sigue una distribución de Poisson con λ= 2.
a. Encuentre la probabilidad de que no haya accidentes en este crucero de carretera
durante un periodo de 1 semana.
b. Encuentre la probabilidad de que a lo sumo haya tres accidentes en esta sección de
carretera durante un periodo de 2 semanas