UNIVERSIDAD DE GUAYAQUIL
Facultad: CIENCIAS MATEMÁTICAS Y FÍSICAS
Carrera: TECNOLOGÍA DE LA INFORMACIÓN
Asignatura: ESTADÍSTICA II
Ing. Jessica Plúas Burgos
Unidad #:1
Variables aleatorias, distribución de probabilidades y distribución muestral.
Objetivo:
Fijar el numero de elementos de un espacio muestral asociados a un experimentos, adicionalmente poder calcular
la probabilidad de cualquier evento asociado a un espacio muestral, como también conocer los diferentes tipos de
variables continuas discretas, manejo de tablas, distribuciones multivariantes e identificar la distribución de
probabilidad de funciones de variables aleatorios por diferentes métodos.
1.1 Variables aleatorias discretas y continuas 1.4 Distribución Muestral
1.2 Distribución de variables aleatoria discretas: 1.5 Análisis de los tipos de distribuciones muéstrales
1.2.1 binominal 1.5.1 Introducción a las distribuciones muéstrales
1.2.2 Poisson 1.5.2 Distribución muestral de media
1.2.3 Hipergeométrica. 1.5.3 Distribución muestral de proporciones
1.3 Distribución de variables aleatorias continuas: 1.5.4 Distribución muestral de diferencia de medias
1.3.1 uniforme Continua. 1.5.5 Distribución muestral de diferencia de proporciones
1.3.2 Exponencial 1.5.6 Distribución muestral ( Chi Square)
1.3.3 Normal 1.5.7 Distribución
1.3.4 T de Student
Variables aleatorias discretas y continuas
Objetivo:
Proporcionar un marco teórico y conceptual para modelar y comprender la incertidumbre en
situaciones en las que las observaciones o resultados pueden variar de manera aleatoria.
Variable aleatoria
• Una variable aleatoria en estadísticas y probabilidad que se utiliza para modelar y
estudiar eventos o fenómenos cuyos resultados pueden variar de manera aleatoria o
incierta.
• Es una función que asigna un valor numérico a cada resultado posible de un
experimento o evento aleatorio.
Variable aleatoria
Una variable aleatoria es aquella (casi siempre representada por x) que tiene un solo valor numérico
determinado por el azar, para cada resultado de un procedimiento.
Existen dos tipos principales de variables aleatorias:
• Variable Aleatoria Discreta.
• Variable Aleatoria Continua.
Tipos de variable aleatoria
Variable aleatoria
Variable Aleatoria Discreta:
Una variable aleatoria discreta toma valores específicos y aislados de un conjunto contable de resultados
posibles. Estos valores suelen estar separados y no pueden tomar valores intermedios, es decir, tiene un
número finito de valores o un número de valores contable, donde “contable” se refiere al hecho de que podría
haber un número infinito de valores, pero que pueden asociarse con un proceso de conteo. ejemplos:
• número de caras que aparecen al lanzar un dado.
• número de personas en una familia.
Variable aleatoria
Variable Aleatoria Continua:
Una variable aleatoria continua tiene un número infinito de valores, y esos valores pueden asociarse con
mediciones en una escala continua, de manera que no existan huecos o interrupciones.
Se utilizan para describir y cuantificar la incertidumbre en eventos y fenómenos, y se representan mediante
letras mayúsculas, como X o Y. Para cada valor posible de la variable aleatoria, se asigna una probabilidad
correspondiente que representa la probabilidad de que ese valor ocurra.
Variable aleatoria
Ejemplos de variables aleatorias discretas y continuas:
• Sea x = número de huevos que una gallina pone en un día. Ésta es una variable aleatoria discreta
porque sus únicos valores posibles son 0 o 1 o 2.
• El conteo del número de estudiantes de estadística que asisten a una clase es un número entero y,
por lo tanto, una variable aleatoria discreta.
• Sea x = cantidad de leche que produce una vaca en un día. Ésta es una variable aleatoria continua, ya
que puede tomar cualquier valor en un tramo continuo. En un solo día, una vaca produce una
cantidad de leche cuyo valor puede ser cualquiera entre 0 galones y 5 galones. Es posible obtener
4.123456 galones, ya que la vaca no está restringida a las cantidades discretas de 0, 1, 2, 3, 4 o 5
galones.
• La medida del voltaje de una batería de un detector de humo puede ser cualquier valor entre 0 y 9
volts. Por lo tanto, se trata de una variable aleatoria continua.
Distribución de variables aleatoria discretas
Objetivo:
• Describir el comportamiento de una variable aleatoria discreta.
Distribución de variables aleatoria discretas
La distribución de variables aleatorias discretas se refiere a la forma en que se distribuyen las probabilidades
de los diferentes valores que puede tomar una variable aleatoria discreta en un experimento o fenómeno
específico. Las variables aleatorias discretas son aquellas que pueden tomar un conjunto finito o numerable
de valores, y cada valor tiene una probabilidad asignada.
Distribución de variables aleatoria discretas
Algunas de las distribuciones de variables aleatorias discretas más comunes incluyen:
• Distribución Uniforme Discreta.
• Distribución Binomial.
• Distribución Geométrica.
• Distribución de Poisson.
• Distribución Hipergeométrica.
• Distribución de Multinomial.
• Distribución de Hipergeométrica Negativa.
Distribución de variables aleatoria discretas
1. Distribución Uniforme Discreta. Describe el comportamiento de una variable discreta que puede tomar
n valores distintos con la misma probabilidad cada uno de ellos. En esta distribución, todos los valores
posibles tienen la misma probabilidad de ocurrir. Un ejemplo es el lanzamiento de un dado, cuando se
observa el número obtenido tras el lanzamiento de un dado perfecto, los valores posibles siguen una
distribución uniforme discreta en {1, 2, 3, 4, 5, 6}, y la probabilidad de cada cara es 1/6.
Valores:
k: a, a+1, a+2, ..., b, números enteros.
Parámetros:
a: mínimo, a entero
b: máximo, b entero con a < b
Distribución de variables aleatoria discretas
Ejemplo Distribución Uniforme Discreta:
El temario de un examen para un proceso selectivo contiene 50 temas, de los cuales se elegirá uno por
sorteo. Si una persona no ha estudiado los 15 últimos temas ¿cuál es la probabilidad de que salga un tema
que haya estudiado?
La probabilidad de que se seleccione un tema estudiado se puede calcular de la siguiente manera:
Probabilidad (Tema Estudiado) = (Número de Temas Estudiados) / (Total de Temas Posibles)
Número de Temas Estudiados = 50 - 15 = 35
Probabilidad (Tema Estudiado) = 35 / 50
Probabilidad (Tema Estudiado) = 7/10
La probabilidad de que salga el tema estudiado es del 70%
Distribución de variables aleatoria discretas
2. Distribución de Bernoulli: Se utiliza para modelar eventos binarios, donde hay dos resultados posibles,
generalmente etiquetados como éxito (1) o fracaso (0). Ejemplos incluyen lanzar una moneda o el éxito o
fracaso de una prueba. Supongamos que un jugador de dardos tiene una probabilidad del 0.2 (20%) de
acertar en el centro de la diana en un solo lanzamiento. Modelaremos este escenario con una variable
aleatoria discreta de Bernoulli, donde:
• Éxito (acertar en el centro) se denota como "1".
• Fracaso (no acertar en el centro) se denota como "0"
p = 0.2 (la probabilidad de éxito) y q = 1 - p = 1 - 0.2 = 0.8 (la probabilidad de fracaso)
La probabilidad de que el jugador acierte en el centro (éxito) en un solo lanzamiento se representa como P(X
= 1), donde X es la variable aleatoria de Bernoulli.
P(X = 1) = p
Sustituyendo p por su valor conocido:
P(X = 1) = 0.2 20%
Distribución de variables aleatoria discretas
3. Distribución Geométrica. Permite calcular la probabilidad de que tenga que realizarse un número k de
repeticiones antes de obtener un éxito por primera vez; esta probabilidad decrece a medida que
aumenta k con lo que la función de masa de probabilidad es siempre decreciente. Modela el número de
ensayos necesarios para obtener el primer éxito en una secuencia de ensayos independientes de
Bernoulli hasta que ocurra un éxito, se utiliza en la distribución de tiempos de espera, de manera que si
los ensayos se realizan a intervalos regulares de tiempo, esta variable aleatoria proporciona el tiempo
transcurrido hasta el primer éxito.
Fórmula : P(X = n) = (1 - p)^(n - 1) * p
Distribución de variables aleatoria discretas
Ejemplo:
La probabilidad de que cierto examen médico dé lugar a una reacción “positiva” es igual a 0,8, ¿cuál es la
probabilidad de que ocurran menos de 5 reacciones “negativas” antes de la primera positiva?
La variable aleatoria “número de reacciones negativas antes de la primera positiva” sigue una distribución
geométrica con parámetro p = 0,8.
Para calcular esta probabilidad, podemos usar la Distribución Geométrica de la siguiente manera:
P(X < 5) = P(X = 1) + P(X = 2) + P(X = 3) + P(X = 4)
Donde:
P(X < 5) es la probabilidad de que ocurran menos de 5 reacciones "negativas" antes de la primera "positiva".
P(X = n) es la probabilidad de que el primer éxito ocurra en el intento número "n".
Distribución de variables aleatoria discretas
Ejemplo:
Usaremos la fórmula de la Distribución Geométrica:
P(X = n) = (1 - p)^(n - 1) * p
Para cada valor de "n" de 1 a 4, calcularemos la probabilidad y luego sumaremos los resultados.
P(X = 1) = (1 - 0.8)^(1 - 1) * 0.8 = 0.8
P(X = 2) = (1 - 0.8)^(2 - 1) * 0.8 = 0.8 * 0.2 = 0.16
P(X = 3) = (1 - 0.8)^(3 - 1) * 0.8 = 0.8 * 0.2^2 = 0.032
P(X = 4) = (1 - 0.8)^(4 - 1) * 0.8 = 0.8 * 0.2^3 = 0.0064
Ahora sumamos estas probabilidades:
P(X < 5) = 0.8 + 0.16 + 0.032 + 0.0064 = 1.0
Distribución de variables aleatoria discretas
4. Distribución Hipergeométrica. Suele aparecer en procesos muestrales sin reemplazo, en los que se
investiga la presencia o ausencia de cierta característica. Modela la probabilidad de obtener un número
específico de éxitos en una muestra sin reemplazo de una población finita. Se utiliza en problemas de
muestreo, como la selección de elementos defectuosos en una línea de producción. esta distribución es
la equivalente a la binomial, pero cuando el muestreo se hace sin reemplazo, de forma que la
probabilidad de éxito no permanece constante a lo largo de las n pruebas, a diferencia de la distribución
binomial. La función de probabilidad de la Distribución Hipergeométrica se calcula de la siguiente
manera:
Distribución de variables aleatoria discretas
Ejemplo:
Se sabe que el 7% de los útiles quirúrgicos en un lote de 100 no cumplen ciertas especificaciones de calidad.
Tomada una muestra al azar de 10 unidades sin reemplazo, interesa conocer la probabilidad de que no más
de dos sean defectuosas.
El número de útiles defectuosos en el lote es R = 0,07x100 = 7. Para un tamaño muestral de n= 10, la
probabilidad buscada es P{número de defectuosos ≤ 2}.
Primero: identifiquemos los parámetros de la distribución hipergeométrica:
N: El tamaño total del lote de útiles quirúrgicos, que es igual a 100.
R: El número de útiles defectuosos en el lote, que es igual al 7% de 100, es decir, R = 0.07 * 100 = 7.
n: El tamaño de la muestra que se selecciona sin reemplazo, que es igual a 10.
Distribución de variables aleatoria discretas
Ejemplo:
Podemos calcular esta probabilidad utilizando la distribución hipergeométrica. La fórmula de la distribución
hipergeométrica es:
Donde:
P(X = k) es la probabilidad de obtener exactamente k útiles defectuosos en la muestra de tamaño n.
representa el coeficiente binomial para elegir k útiles defectuosos de R posibles en el lote.
es el coeficiente binomial para elegir n - k útiles no defectuosos de N - R posibles en el lote.
es el coeficiente binomial para elegir n útiles de N posibles en la muestra.
Distribución de variables aleatoria discretas
Distribución de variables aleatoria discretas
Distribución de variables aleatoria discretas
Distribución de variables aleatoria discretas
Ahora, sumamos estas probabilidades:
Por lo tanto, la probabilidad de que no más de dos de los 10 útiles seleccionados sean defectuosos es
aproximadamente igual a 0.98.
Distribución de variables aleatoria discretas
5. Distribución Poison. La Distribución de Poisson es una distribución de probabilidad discreta que se utiliza
para modelar la ocurrencia de eventos raros o inusuales en un intervalo de tiempo o espacio, es útil para
describir eventos en los que la probabilidad de ocurrencia es baja pero constante. Las características clave de
la Distribución de Poisson son las siguientes:
• Eventos raros y discretos: Se aplica a eventos que ocurren de manera discreta en el tiempo o el espacio,
(número de llamadas telefónicas a un centro de atención al cliente en una hora, el número de
accidentes de tráfico en una intersección en un día).
• Parámetro de tasa (λ): El parámetro de tasa, denotado como "λ" (lambda), representa el número
promedio de eventos que se espera que ocurran en el intervalo de tiempo o espacio dado.
• Eventos independientes: Se asume que los eventos son independientes, es decir, la ocurrencia de un
evento no afecta la ocurrencia de otro.
Distribución de variables aleatoria discretas
Requisitos de la distribución de Poisson
• La variable aleatoria x es el número de veces que ocurre un suceso durante un intervalo.
• Las ocurrencias deben ser aleatorias.
• Las ocurrencias deben ser independientes entre sí.
• Las ocurrencias deben estar uniformemente distribuidas dentro del intervalo empleado.
Parámetros de la distribución de Poisson
• La media es µ.
• La desviación estándar es
Distribución de variables aleatoria discretas
La fórmula de probabilidad de la Distribución de Poisson es:
• P(X=k) es la probabilidad de que ocurran exactamente k eventos en el intervalo de tiempo o espacio.
• "e" es la base del logaritmo natural (aproximadamente igual a 2.71828).
• "λ" es el parámetro de tasa que representa el número promedio de eventos en el intervalo.
• "k" es el número de eventos que estamos interesados en un momento dado.
Distribución de variables aleatoria discretas
Ejercicio:
Bombas de la Segunda Guerra Mundial Al analizar los impactos de las bombas V-1 en la Segunda Guerra Mundial, el
sur de Londres se subdividió en 576 regiones, cada una con área de 0.25 km2. En total, 535 bombas impactaron el
área combinada de 576 regiones.
a. Si se selecciona al azar una región, calcule la probabilidad de que haya sido impactada exactamente en dos
ocasiones.
b. Con base en la probabilidad calculada en el inciso a), ¿cuántas de las 576 regiones se esperaría que fueran
impactadas exactamente dos veces?
Distribución de variables aleatoria discretas
Aplicamos la distribución de Poisson, ya que estamos tratando con las ocurrencias de un suceso (impactos de bombas)
dentro de un intervalo (una región con una área de 0.25 km2). El número medio de impactos por
región es:
Puesto que buscamos la probabilidad de exactamente dos impactos en una región, x = 2, y utilizamos la fórmula 5-9 de
la siguiente manera:
La probabilidad de que una región particular sea impactada exactamente dos veces es P(2) 0.170.
b. Puesto que existe una probabilidad de 0.170 de que una región sea impactada exactamente dos veces, esperamos
que entre las 576 regiones, el número de regiones impactadas exactamente dos veces sea 576 * 0.170= 97.9.