ESTADÍSTICA Y
PROBABILIDAD
DISTRIBUCIONES DE
PROBABILIDAD CONTINUA:
• NORMAL
• EXPONENCIAL
DISTRIBUCIONES DE PROBABILIDAD PARA VARIABLES
ALEATORIAS CONTINUAS
Las variables aleatorias continuas (estaturas y pesos, lapso de vida útil de un producto
en particular o un error experimental de laboratorio) pueden tomar infinitos valores
correspondientes a los puntos en un intervalo de una recta. Si se trata de asignar una
probabilidad positiva a cada uno de estos innumerables valores, las probabilidades ya no
sumarán 1, como cuando se trata de variables aleatorias discretas. Por tanto, se debe usar
un método diferente para generar la distribución de probabilidad para una variable
aleatoria continua.
Cuando una variable aleatoria x es discreta, se asigna una probabilidad positiva a cada
uno de los valores que x pueda tomar y obtener la distribución de probabilidad para x.
La suma de todas las probabilidades asociada con los diferentes valores de x es 1, pero
no todos los experimentos resultan en variables aleatorias que sean discretas.
2
Por ejemplo si se tiene un conjunto de mediciones en una variable aleatoria continua y se crea
un histograma de frecuencia relativa para describir su distribución. Para un pequeño número
de mediciones, se usa un pequeño número de clases; entonces, a medida que se recolecten más
y más mediciones, se usan más clases y se reduce el ancho de clase. El perfil del histograma
cambiará ligeramente, casi todo el tiempo haciéndose cada vez menos irregular,
como se muestra en la figura
Esta curva suave describe la distribución
de probabilidad de la variable aleatoria
continua.
3
Una variable aleatoria continua puede tomar cualquiera de un número infinito de
valores de la recta real, en forma semejante al número infinito de granos de arena en
una playa.
La distribución de probabilidad se crea al distribuir una unidad de probabilidad a lo
largo de la recta, igual que como se puede distribuir un puñado de arena.
La probabilidad, es decir granos de arena o de mediciones, se apilarán en ciertos
lugares y el resultado es la distribución de probabilidad
La profundidad o densidad de la probabilidad, que varía con x, se describe por una fórmula
matemática f(x), llamada distribución de probabilidad o función
de densidad de probabilidad para la variable aleatoria x. 4
• El área bajo una distribución continua de probabilidad es igual a 1.
• La probabilidad de que x caiga en un intervalo particular, por
ejemplo, de a a b, es igual al área bajo la curva entre los dos puntos
a y b.
Considere la probabilidad de que x sea igual a algún valor en particular,
por ejemplo a. Como no hay área arriba de un solo punto, por ejemplo,
x=a, en la distribución de probabilidad para una variable aleatoria
continua, nuestra definición implica que la probabilidad es 0.
5
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
La distribución normal (en ocasiones llamada distribución gaussiana) es
la distribución continua que se utiliza más comúnmente en estadística,
es un modelo que aproxima el valor de una variable aleatoria a una
situación ideal, dependiendo de la media y la desviación típica.
6
La gráfica de una distribución normal de probabilidad con media µ y desviación estándar σ se
muestran en la figura. La media µ localiza el centro de la distribución, y la distribución es simétrica
alrededor de su media µ. Como el área total bajo la distribución normal de probabilidad es igual a 1,
la simetría implica que el área a la derecha de µ es .5 y el área a la izquierda de μ es también .5.
La forma de la distribución está determinada por σ, la desviación estándar de la población.
Como se puede observar en la figura, los valores grandes de σ reducen la altura de la curva y
aumentan la dispersión; los valores pequeños de σ aumentan la altura de la curva y reducen
7
ÁREAS TABULADAS DE LA DISTRIBUCIÓN
NORMAL DE PROBABILIDAD
Para hallar la probabilidad de que una variable aleatoria normal x se encuentre en el
intervalo de a a b, necesitamos hallar el área bajo la curva normal entre los puntos a y
b. No obstante, hay un número infinitamente grande de distribuciones normales, uno
para cada media y desviación estándar diferentes. Una tabla separada de áreas para
cada una de estas curvas es obviamente impráctica; en cambio, usamos un
procedimiento de estandarización que nos permite usar la misma tabla para todas las
distribuciones normales.
8
La variable aleatoria normal estándar
Una variable aleatoria normal x está estandarizada al expresar su valor como el número
de desviaciones estándar (σ) que se encuentran a la izquierda o a la derecha de su media
μ. Éste es realmente sólo un cambio en las unidades de medida que usamos, ¡como si
midiéramos en pulgadas en lugar de centímetros! La variable aleatoria normal
estandarizada, z, se define como
9
La distribución de probabilidad para z, ilustrada en la figura, se denomina distribución
normal estandarizada porque su media es 0 y su desviación estándar es 1. Los valores de z
del lado izquierdo de la curva son negativos, en tanto que los del lado derecho son
positivos. El área bajo la curva normal estándar a la izquierda de un valor especificado de z,
por ejemplo z0, es la probabilidad P(z≤ z0).
10
Encuentre P(z ≤ 1.63). Esta probabilidad corresponde al área a la izquierda de un punto
z =1.63 desviaciones estándar a la derecha de la media
11
Encuentre P(z ≥ –.5). Esta probabilidad corresponde al área a la derecha de un punto
z= –0.5 de desviación estándar a la izquierda de la media
12
Encuentre P(–0.5 ≤ z ≤ 1.0). Esta probabilidad es el área entre z = –0.5 y z =1.0, como se muestra en la
figura 6.10.
13
14
Cálculo de probabilidades para una variable aleatoria
normal general
La mayoría de las veces, las probabilidades en las que estamos interesados contienen x, una
variable aleatoria normal con media μ y desviación estándar σ. Entonces se debe estandarizar el
intervalo de interés escribiéndolo como el intervalo equivalente en términos de z, la variable
aleatoria normal estándar. Una vez hecho esto, la probabilidad de interés es el área que se
encuentra usando la distribución estándar normal de probabilidad.
Sea x una variable aleatoria normalmente distribuida con una media de 10 y una desviación estándar
de 2. Encuentre la probabilidad de que x se encuentre entre 11 y 13.6.
Nota: recuerde estandarizar la variable x en términos de z
15
Estudios realizados demuestran que el uso de gasolina
para autos compactos vendidos en Estados Unidos está
normalmente distribuido, con una media de 35.5 millas
por galón (mpg) y una desviación estándar de 4.5 mpg.
¿Qué porcentaje de compactos recorre 40 mpg o más?
16
En una ciudad se estima que la temperatura máxima en el mes de
junio sigue una distribución normal, con media y desviación
típica . Calcular el número de días del mes en los que se espera
alcanzar máximas entre y .
17
Encuentre las siguientes probabilidades para la variable aleatoria
normal estándar z:
18
DISTRIBUCIÓN DE PROBABILIDAD EXPONENCIAL
Esta distribución de probabilidad continua describe los tiempos entre eventos que ocurren en
secuencia. Las acciones suceden independientemente a un ritmo constante por unidad o duración
de tiempo. Como el tiempo nunca es negativo, una variable aleatoria exponencial será siempre
positiva. La distribución exponencial suele describir situaciones como:
• Los tiempos de servicio en un sistema (cuánto tiempo toma atender a un cliente).
• El tiempo entre “entradas” en un sitio web.
• El tiempo de vida de un componente eléctrico.
• El tiempo que transcurre hasta que la siguiente llamada telefónica llega a un centro de servicio al
cliente.
La distribución de probabilidad exponencial tiene un sesgo positivo. En esta característica difiere de
las distribuciones uniforme y normal, que son simétricas.
19
Otra característica de la distribución exponencial es su estrecha relación con la distribución de Poisson, una
distribución de probabilidad discreta que tiene también un solo parámetro.
FUNCIÓN DE DISTRIBUCIÓN DE PROBABILIDAD EXPONENCIAL
parámetro de “ritmo” λ
Tanto la media como la desviación estándar son las recíprocas del parámetro de ritmo.
1
𝜇=
𝜆
1
𝜎2 = 20
𝜆2
Las órdenes para pedidos de medicamentos por receta llegan a una farmacia virtual de
acuerdo con una distribución de probabilidad exponencial, a una media de una cada 20
segundos.
Encuentre la probabilidad de que la siguiente orden llegue en menos de 5 segundos, en
más de 40 segundos, o entre 5 y 40 segundos.
21
Los tiempos de espera para recibir la comida después de hacer el
pedido en la tienda Subway local siguen una distribución
exponencial con una media de 60 segundos. Calcule la probabilidad
de que un cliente espere:
a) Menos de 30 segundos.
b) Más de 120 segundos.
c) Entre 45 y 75 segundos.
d ) ¿Cincuenta por ciento de los clientes espera menos de cuántos
segundos? ¿Cuál es la mediana?
22
Compton Computers desea establecer una garantía mínima de tiempo de vida para su
nueva unidad de fuente de poder. Las pruebas de calidad muestran que el tiempo de falla
sigue una distribución exponencial con una media de 4 000 horas. Compton quiere un
periodo de garantía en cuyo transcurso sólo falle 5% de las fuentes de poder. ¿Qué valor
debe establecer para el periodo de garantía?
23
El tiempo de vida de los televisores de plasma y LCD sigue una
distribución exponencial con una media de 100 000 horas. Calcule la
probabilidad de que un televisor:
24