Estadistica II
Estadistica II
Objetivo:
Fijar el numero de elementos de un espacio muestral asociados a un experimentos, adicionalmente poder calcular
la probabilidad de cualquier evento asociado a un espacio muestral, como también conocer los diferentes tipos de
variables continuas discretas, manejo de tablas, distribuciones multivariantes e identificar la distribución de
probabilidad de funciones de variables aleatorios por diferentes métodos.
Objetivo:
Una variable aleatoria es aquella (casi siempre representada por x) que tiene un solo valor numérico
determinado por el azar, para cada resultado de un procedimiento.
Una variable aleatoria discreta toma valores específicos y aislados de un conjunto contable de resultados
posibles. Estos valores suelen estar separados y no pueden tomar valores intermedios, es decir, tiene un
número finito de valores o un número de valores contable, donde “contable” se refiere al hecho de que podría
haber un número infinito de valores, pero que pueden asociarse con un proceso de conteo. ejemplos:
Una variable aleatoria continua tiene un número infinito de valores, y esos valores pueden asociarse con
mediciones en una escala continua, de manera que no existan huecos o interrupciones.
• Sea x = número de huevos que una gallina pone en un día. Ésta es una variable aleatoria discreta
porque sus únicos valores posibles son 0 o 1 o 2.
• El conteo del número de estudiantes de estadística que asisten a una clase es un número entero y,
por lo tanto, una variable aleatoria discreta.
• Sea x = cantidad de leche que produce una vaca en un día. Ésta es una variable aleatoria continua, ya
que puede tomar cualquier valor en un tramo continuo. En un solo día, una vaca produce una
cantidad de leche cuyo valor puede ser cualquiera entre 0 galones y 5 galones. Es posible obtener
4.123456 galones, ya que la vaca no está restringida a las cantidades discretas de 0, 1, 2, 3, 4 o 5
galones.
• La medida del voltaje de una batería de un detector de humo puede ser cualquier valor entre 0 y 9
volts. Por lo tanto, se trata de una variable aleatoria continua.
Distribución de variables aleatoria discretas
Objetivo:
La distribución de variables aleatorias discretas se refiere a la forma en que se distribuyen las probabilidades
de los diferentes valores que puede tomar una variable aleatoria discreta en un experimento o fenómeno
específico. Las variables aleatorias discretas son aquellas que pueden tomar un conjunto finito o numerable
de valores, y cada valor tiene una probabilidad asignada.
Distribución de variables aleatoria discretas
1. Distribución Uniforme Discreta. Describe el comportamiento de una variable discreta que puede tomar
n valores distintos con la misma probabilidad cada uno de ellos. En esta distribución, todos los valores
posibles tienen la misma probabilidad de ocurrir. Un ejemplo es el lanzamiento de un dado, cuando se
observa el número obtenido tras el lanzamiento de un dado perfecto, los valores posibles siguen una
distribución uniforme discreta en {1, 2, 3, 4, 5, 6}, y la probabilidad de cada cara es 1/6.
Valores:
k: a, a+1, a+2, ..., b, números enteros.
Parámetros:
a: mínimo, a entero
b: máximo, b entero con a < b
Distribución de variables aleatoria discretas
2. Distribución de Bernoulli: Se utiliza para modelar eventos binarios, donde hay dos resultados posibles,
generalmente etiquetados como éxito (1) o fracaso (0). Ejemplos incluyen lanzar una moneda o el éxito o
fracaso de una prueba. Supongamos que un jugador de dardos tiene una probabilidad del 0.2 (20%) de
acertar en el centro de la diana en un solo lanzamiento. Modelaremos este escenario con una variable
aleatoria discreta de Bernoulli, donde:
• Éxito (acertar en el centro) se denota como "1".
• Fracaso (no acertar en el centro) se denota como "0"
p = 0.2 (la probabilidad de éxito) y q = 1 - p = 1 - 0.2 = 0.8 (la probabilidad de fracaso)
La probabilidad de que el jugador acierte en el centro (éxito) en un solo lanzamiento se representa como P(X
= 1), donde X es la variable aleatoria de Bernoulli.
P(X = 1) = p
Sustituyendo p por su valor conocido:
P(X = 1) = 0.2 20%
Distribución de variables aleatoria discretas
3. Distribución Geométrica. Permite calcular la probabilidad de que tenga que realizarse un número k de
repeticiones antes de obtener un éxito por primera vez; esta probabilidad decrece a medida que
aumenta k con lo que la función de masa de probabilidad es siempre decreciente. Modela el número de
ensayos necesarios para obtener el primer éxito en una secuencia de ensayos independientes de
Bernoulli hasta que ocurra un éxito, se utiliza en la distribución de tiempos de espera, de manera que si
los ensayos se realizan a intervalos regulares de tiempo, esta variable aleatoria proporciona el tiempo
transcurrido hasta el primer éxito.
Fórmula : P(X = n) = (1 - p)^(n - 1) * p
Distribución de variables aleatoria discretas
Ejemplo:
La probabilidad de que cierto examen médico dé lugar a una reacción “positiva” es igual a 0,8, ¿cuál es la
probabilidad de que ocurran menos de 5 reacciones “negativas” antes de la primera positiva?
La variable aleatoria “número de reacciones negativas antes de la primera positiva” sigue una distribución
geométrica con parámetro p = 0,8.
Para calcular esta probabilidad, podemos usar la Distribución Geométrica de la siguiente manera:
P(X < 5) = P(X = 1) + P(X = 2) + P(X = 3) + P(X = 4)
Donde:
P(X < 5) es la probabilidad de que ocurran menos de 5 reacciones "negativas" antes de la primera "positiva".
P(X = n) es la probabilidad de que el primer éxito ocurra en el intento número "n".
Distribución de variables aleatoria discretas
Ejemplo:
Usaremos la fórmula de la Distribución Geométrica:
P(X = n) = (1 - p)^(n - 1) * p
Para cada valor de "n" de 1 a 4, calcularemos la probabilidad y luego sumaremos los resultados.
P(X = 1) = (1 - 0.8)^(1 - 1) * 0.8 = 0.8
P(X = 2) = (1 - 0.8)^(2 - 1) * 0.8 = 0.8 * 0.2 = 0.16
P(X = 3) = (1 - 0.8)^(3 - 1) * 0.8 = 0.8 * 0.2^2 = 0.032
P(X = 4) = (1 - 0.8)^(4 - 1) * 0.8 = 0.8 * 0.2^3 = 0.0064
Ahora sumamos estas probabilidades:
4. Distribución Hipergeométrica. Suele aparecer en procesos muestrales sin reemplazo, en los que se
investiga la presencia o ausencia de cierta característica. Modela la probabilidad de obtener un número
específico de éxitos en una muestra sin reemplazo de una población finita. Se utiliza en problemas de
muestreo, como la selección de elementos defectuosos en una línea de producción. esta distribución es
la equivalente a la binomial, pero cuando el muestreo se hace sin reemplazo, de forma que la
probabilidad de éxito no permanece constante a lo largo de las n pruebas, a diferencia de la distribución
binomial. La función de probabilidad de la Distribución Hipergeométrica se calcula de la siguiente
manera:
Distribución de variables aleatoria discretas
Ejemplo:
Se sabe que el 7% de los útiles quirúrgicos en un lote de 100 no cumplen ciertas especificaciones de calidad.
Tomada una muestra al azar de 10 unidades sin reemplazo, interesa conocer la probabilidad de que no más
de dos sean defectuosas.
El número de útiles defectuosos en el lote es R = 0,07x100 = 7. Para un tamaño muestral de n= 10, la
probabilidad buscada es P{número de defectuosos ≤ 2}.
Ejemplo:
Podemos calcular esta probabilidad utilizando la distribución hipergeométrica. La fórmula de la distribución
hipergeométrica es:
Donde:
P(X = k) es la probabilidad de obtener exactamente k útiles defectuosos en la muestra de tamaño n.
representa el coeficiente binomial para elegir k útiles defectuosos de R posibles en el lote.
es el coeficiente binomial para elegir n - k útiles no defectuosos de N - R posibles en el lote.
es el coeficiente binomial para elegir n útiles de N posibles en la muestra.
Distribución de variables aleatoria discretas
Distribución de variables aleatoria discretas
Distribución de variables aleatoria discretas
Distribución de variables aleatoria discretas
Por lo tanto, la probabilidad de que no más de dos de los 10 útiles seleccionados sean defectuosos es
aproximadamente igual a 0.98.
Distribución de variables aleatoria discretas
5. Distribución Poison. La Distribución de Poisson es una distribución de probabilidad discreta que se utiliza
para modelar la ocurrencia de eventos raros o inusuales en un intervalo de tiempo o espacio, es útil para
describir eventos en los que la probabilidad de ocurrencia es baja pero constante. Las características clave de
la Distribución de Poisson son las siguientes:
• Eventos raros y discretos: Se aplica a eventos que ocurren de manera discreta en el tiempo o el espacio,
(número de llamadas telefónicas a un centro de atención al cliente en una hora, el número de
accidentes de tráfico en una intersección en un día).
• Parámetro de tasa (λ): El parámetro de tasa, denotado como "λ" (lambda), representa el número
promedio de eventos que se espera que ocurran en el intervalo de tiempo o espacio dado.
• Eventos independientes: Se asume que los eventos son independientes, es decir, la ocurrencia de un
evento no afecta la ocurrencia de otro.
Distribución de variables aleatoria discretas
Ejercicio:
Bombas de la Segunda Guerra Mundial Al analizar los impactos de las bombas V-1 en la Segunda Guerra Mundial, el
sur de Londres se subdividió en 576 regiones, cada una con área de 0.25 km2. En total, 535 bombas impactaron el
área combinada de 576 regiones.
a. Si se selecciona al azar una región, calcule la probabilidad de que haya sido impactada exactamente en dos
ocasiones.
b. Con base en la probabilidad calculada en el inciso a), ¿cuántas de las 576 regiones se esperaría que fueran
impactadas exactamente dos veces?
Distribución de variables aleatoria discretas
Aplicamos la distribución de Poisson, ya que estamos tratando con las ocurrencias de un suceso (impactos de bombas)
dentro de un intervalo (una región con una área de 0.25 km2). El número medio de impactos por
región es:
Puesto que buscamos la probabilidad de exactamente dos impactos en una región, x = 2, y utilizamos la fórmula 5-9 de
la siguiente manera:
La probabilidad de que una región particular sea impactada exactamente dos veces es P(2) 0.170.
b. Puesto que existe una probabilidad de 0.170 de que una región sea impactada exactamente dos veces, esperamos
que entre las 576 regiones, el número de regiones impactadas exactamente dos veces sea 576 * 0.170= 97.9.
Distribución de variables aleatorias continuas
Objetivo:
Comprender y modelar eventos y fenómenos en los que las observaciones pueden tomar valores en un rango
continuo.
Distribución de variables aleatorias continuas
La Distribución de Variables Aleatorias Continuas se refiere a un tipo de distribución de probabilidad que describe
eventos o resultados en los cuales la variable aleatoria puede tomar un valor dentro de un rango continuo. A
diferencia de las variables aleatorias discretas, que solo pueden tomar valores específicos, las variables aleatorias
continuas pueden tomar cualquier valor dentro de un intervalo dado. Ejemplos altura de las personas, el tiempo que
lleva completar una tarea, la temperatura en un día determinado, la velocidad de un objeto en movimiento, entre
otros.
Características clave de la Distribución de Variables Aleatorias Continuas:
Valores Continuos: Las variables aleatorias continuas pueden tomar valores en un rango continuo, lo que significa
que existen infinitas posibilidades de resultados en ese rango.
Distribución de variables aleatorias continuas
Función de Densidad de Probabilidad (PDF): En lugar de proporcionar una probabilidad exacta para cada valor
individual, se utiliza una función de densidad de probabilidad que describe cómo se distribuyen las probabilidades
dentro del rango. Esta función es representada por una curva continua.
Área bajo la Curva: La probabilidad de que la variable aleatoria caiga dentro de un intervalo específico se calcula
encontrando el área bajo la curva de la función de densidad de probabilidad dentro de ese intervalo.
No hay saltos o brechas: A diferencia de las variables aleatorias discretas, que pueden tener saltos discretos en sus
valores, las variables aleatorias continuas no tienen discontinuidades en sus valores.
Distribución de variables aleatorias continuas
• Probabilidad Constante: La probabilidad de que la variable aleatoria caiga en cualquier subintervalo dentro del
rango es constante y se distribuye de manera uniforme en todo el intervalo. Esto significa que la función de
densidad de probabilidad (PDF) es una línea recta horizontal.
• Probabilidad Total Igual a 1: La suma de todas las probabilidades en el rango completo es igual a 1. Esto garantiza
que todos los valores posibles dentro del rango tengan una probabilidad total de 1.
Ejemplos:
• El resultado de tirar un dado de seis caras, donde cada número tiene la misma probabilidad.
• El tiempo que toma llegar al trabajo en un intervalo de tiempo fijo, si se supone que el tráfico es igualmente
probable en cualquier momento dentro del intervalo.
Distribución de variables aleatorias continuas
Donde:
• f(x) es la función de densidad de probabilidad (PDF).
• a es el valor mínimo del rango.
• b es el valor máximo del rango.
Distribución de variables aleatorias continuas
Ejercicio de distribución uniforme continua:
Se tiene que el grosor del borde de un componente de avión está uniformemente distribuido entre 1.05 y 3.95
milímetros. Se desea obtener la función de distribución acumulada del grosor del borde.
Solución:
La función de densidad de probabilidad de la distribución uniforme continua está dada por:
f(x) = si a <= x <= b
Distribución Exponencial
La distribución exponencial es una distribución de probabilidad continua que se utiliza para modelar el tiempo entre
eventos que ocurren de manera aleatoria y que no tienen una tendencia a agruparse. Esta distribución se caracteriza
por tener una tasa de ocurrencia constante y se utiliza en una variedad de campos, como la estadística, la teoría de
colas, la ingeniería, la economía y la ciencia. Características clave de la Distribución Exponencial:
• Variable de Tiempo: La Distribución Exponencial se utiliza para modelar la variable de tiempo, es decir, el tiempo
que debe transcurrir hasta que ocurra un evento, como la espera entre llegadas de clientes a un mostrador de
atención al cliente.
Distribución de variables aleatorias continuas
• Tasa de Ocurrencia (λ): La Distribución Exponencial se caracteriza por un parámetro llamado tasa de ocurrencia
(λ, lambda). La tasa de ocurrencia representa el número promedio de eventos que ocurren por unidad de tiempo.
Cuanto mayor sea λ, más rápido ocurre el evento.
• Probabilidad de Espera: La probabilidad de que el tiempo de espera hasta que ocurra el evento sea mayor o igual
a un valor específico se puede calcular utilizando la función de supervivencia exponencial.
• Sin Memoria: Una característica interesante de la Distribución Exponencial es que tiene la propiedad de falta de
memoria. Esto significa que la probabilidad de que el evento ocurra en el futuro no depende de cuánto tiempo ya
ha transcurrido desde el inicio.
Distribución de variables aleatorias continuas
Donde:
Para encontrar la probabilidad de que un cliente tenga que esperar más de 3 minutos para ser atendido, se puede
calcular la probabilidad complementaria de que tenga que esperar menos o igual a 3 minutos:
P(X <= 3) = F(3) = 1 - e^(-0.5*3) = 0.7769
P(X > 3) = 1 - P(X <= 3) = 1 - 0.7769 = 0.2231
Por lo tanto, la probabilidad de que un cliente tenga que esperar más de 3 minutos para ser atendido es de 0.2231 o
22.31%.
Distribución de variables aleatorias continuas
Distribución Normal
La distribución normal, también conocida como distribución gaussiana, es una distribución de probabilidad continua
que se utiliza para modelar variables aleatorias que tienen una distribución simétrica alrededor de su media. Es
esencial en una amplia gama de aplicaciones debido a sus propiedades matemáticas y su capacidad para modelar
una variedad de fenómenos en la vida real. Características clave de la Distribución Normal:
• Forma de Campana: La Distribución Normal tiene una forma de campana simétrica, lo que significa que es
simétrica en torno a su media. La mayoría de los valores se concentran cerca de la media, y la distribución se
extiende hacia ambos lados de la media.
Distribución de variables aleatorias continuas
• Media y Desviación Estándar: La Distribución Normal está completamente definida por dos parámetros: la media
μ) y la desviación estándar (σ). La media indica el valor central alrededor del cual se agrupan los datos, y la
desviación estándar mide la dispersión de los datos.
• Teorema del Límite Central: Uno de los conceptos más importantes en estadísticas, el Teorema del Límite
Central, establece que, a medida que el tamaño de la muestra aumenta, la distribución de la media muestral de
una población se aproxima a una Distribución Normal, independientemente de la forma de la distribución
poblacional original.
• 68-95-99.7 Rule: Esta regla empírica establece que aproximadamente el 68% de los datos se encuentran dentro
de una desviación estándar de la media, el 95% dentro de dos desviaciones estándar y el 99.7% dentro de tres
desviaciones estándar.
Distribución de variables aleatorias continuas
• Uso en Inferencia Estadística: La Distribución Normal se utiliza para calcular intervalos de confianza y realizar
pruebas de hipótesis en estadísticas. Esto es fundamental en la toma de decisiones basada en datos.
• Modelado de Fenómenos Naturales: Muchos fenómenos naturales, como la altura de las personas, el peso de
los objetos, la temperatura y los errores de medición, se pueden modelar de manera efectiva con una
Distribución Normal.
• Simetría y Asimetría: Mientras que la Distribución Normal es simétrica, existen otras distribuciones que se
derivan de ella, como la Distribución Normal estándar y la Distribución Normal sesgada, que pueden tener
asimetría.
Distribución de variables aleatorias continuas
Donde:
• f(x) es la función de densidad de probabilidad.
• μ es la media.
• σ es la desviación estándar.
• π es la constante matemática "pi."
• e es la base del logaritmo natural.
Distribución de variables aleatorias continuas
Ejercicio:
Se supone que el nivel de colesterol de los enfermos de un hospital sigue una distribución normal con una media de
179,1 mg/dL y una desviación estándar de 28,2 mg/dL.
• ¿Cuál es el porcentaje de enfermos con un nivel de colesterol inferior a 169 mg/dL?
• ¿Cuál será el valor del nivel de colesterol a partir del cual se encuentra el 10% de los enfermos del hospital con
los niveles más altos?
• Representar la función de densidad.
Para resolver este ejercicio, utilizaremos la Distribución Normal con la media (μ) y la desviación estándar (σ)
proporcionadas.
Media (μ) = 179,1 mg/dL
Desviación estándar (σ) = 28,2 mg/dL
Distribución de variables aleatorias continuas
1. ¿Cuál es el porcentaje de enfermos con un nivel de colesterol inferior a 169 mg/dL?
Para calcular el porcentaje de enfermos con un nivel de colesterol inferior a 169 mg/dL, se debe calcular la
puntuación z correspondiente a este valor utilizando la fórmula:
Z = (X - μ) / σ
Donde X es el valor del nivel de colesterol que se desea calcular. En este caso, X = 169 mg/dL.
Z = (169 - 179,1) / 28,2 = -0,36
Ahora, utilizamos una tabla Z o un software estadístico para encontrar el área bajo la curva de la distribución normal
estándar a la izquierda de Z=−0.36. En una tabla Z, esto corresponderá al valor de probabilidad acumulada
P(Z<−0.36). Usando una tabla Z o una calculadora estadística, encontramos que P(Z<−0.36)≈0.36
P(Z<−0.3589)≈0.36.
Entonces, aproximadamente el 36% de los enfermos tienen un nivel de colesterol inferior a 169mg/Dl.
Distribución de variables aleatorias continuas
2. ¿Cuál será el valor del nivel de colesterol a partir del cual se encuentra el 10% de los enfermos del hospital con
los niveles más altos?
Para calcular el valor del nivel de colesterol a partir del cual se encuentra el 10% de los enfermos del hospital con los
niveles más altos, se debe buscar en la tabla de la distribución normal estándar el valor correspondiente a la
probabilidad de 0,10.
En la tabla se encuentra que el valor correspondiente a una probabilidad de 0,10 es de -1,28. Entonces, se utiliza la
fórmula de la puntuación z para despejar el valor de X:
Z = (X - μ) / σ
-1,28 = (X - 179,1) / 28,2
X - 179,1 = 1,28 * 28,2
X = 215,8 mg/dL
Por lo tanto, el valor del nivel de colesterol a partir del cual se encuentra el 10% de los enfermos del hospital con los
niveles más altos es de 215,8 mg/dL.
Distribución de variables aleatorias continuas
3. Representar la función de densidad: La función de densidad de la Distribución Normal se expresa como:
En este caso, la media (μ) es de 179,1 mg/dL y la desviación estándar (σ) es de 28,2 mg/dL. Entonces, la función de
densidad es:
f(x) = (1 / (28,2 * sqrt(2π))) * e^(-((x - 179,1)^2) / (2 * 28,2^2))
Distribución de variables aleatorias continuas
Distribución T de Student
Conocida como la Distribución de Student, es una distribución de probabilidad que se utiliza en estadísticas para
realizar inferencias sobre medias cuando el tamaño de la muestra es pequeño y la desviación estándar de la
población es desconocida. Características clave de la Distribución T de Student:
• Forma de la Distribución: La Distribución T de Student tiene forma de campana y es simétrica alrededor de cero,
similar a la Distribución Normal. Sin embargo, su forma puede variar en función del número de grados de
libertad.
• Parámetro Importante: El parámetro más importante en la Distribución T es el número de grados de libertad (n),
que se representa comúnmente con la letra griega ν (nu). Los grados de libertad están relacionados con el
tamaño de la muestra y afectan la forma de la distribución. Cuantos más grados de libertad, la Distribución T se
asemeja más a la Distribución Normal.
Distribución de variables aleatorias continuas
La Distribución T de Student tiene una forma de campana y su densidad de probabilidad se describe mediante esta
fórmula. El valor de ν (número de grados de libertad) determina la forma exacta de la distribución. Cuanto mayor es
ν, más se asemeja la Distribución T a la Distribución Normal.
Distribución de variables aleatorias continuas
La fórmula para la Distribución T de Student, que se utiliza para calcular la función de densidad de probabilidad
(PDF), es la siguiente:
• x es la media muestral.
• μ es la media poblacional (valor hipotético que se compara con la media muestral en una prueba de hipótesis o
se utiliza en un intervalo de confianza).
• s es la desviación estándar muestral.
• n es el tamaño de la muestra.
Distribución de variables aleatorias continuas
Ejercicio:
La distribución t de Student se aproxima a la normal a medida que aumentan los grados de libertad.
1. Calcular, para una distribución N(0,1), el punto que deja a la derecha una cola de probabilidad 0,05.
2. Calcular, para una distribución t de Student, la probabilidad de que la variable tome un valor a la derecha de ese
punto. Tomar como grados de libertad sucesivamente n = 10 y n = 150.
Objetivo:
Proporcionar una base para realizar inferencias sobre la población a partir de una
muestra de datos.
Distribución Muestral
• Representa la Variabilidad Muestral: Muestra cómo varían las estadísticas de muestra cuando se toman
múltiples muestras de la misma población. Esta variabilidad se debe al azar inherente en el proceso de
muestreo.
• Tamaño de la Muestra: La forma y las propiedades de la distribución muestral dependen del tamaño de la
muestra. A medida que el tamaño de la muestra aumenta, la distribución muestral tiende a aproximarse a una
distribución normal, independientemente de la forma de la población subyacente (teorema del límite central).
Distribución Muestral
• Teorema del Límite Central: El teorema del límite central establece que, para muestras lo suficientemente
grandes, la distribución de la media muestral se aproxima a una distribución normal, sin importar la forma de
la población original. Este teorema es fundamental en estadísticas y permite realizar inferencias sobre la
población basadas en la distribución normal.
• Uso en Estadísticas Inferenciales: La distribución muestral es esencial para realizar inferencias sobre
poblaciones a partir de muestras. Se utiliza en la construcción de intervalos de confianza y en pruebas de
hipótesis para estimar parámetros poblacionales y tomar decisiones basadas en datos.
• Tipos de Estadísticas Muestrales: La distribución muestral puede aplicarse a una variedad de estadísticas de
muestra, como la media muestral, la proporción muestral, la desviación estándar muestral, entre otras. Cada
tipo de estadística de muestra tendrá su propia distribución muestral.
Tipos de distribución muestral
Existen varios tipos de distribuciones muestrales, y la elección del tipo de distribución muestral depende de la
estadística de muestra que estés utilizando. Los tipos de distribuciones muestrales más comunes incluyen:
1. Distribución Muestral de la Media (Distribución de la Media Muestral): Esta es una de las distribuciones
muestrales más importantes. Se aplica cuando calculas la media de muestras repetidas de una población. La
distribución de la media muestral se aproxima a una distribución normal a medida que aumenta el tamaño de
la muestra, según el teorema del límite central.
• Aplicación: Utilizada para estimar la media poblacional a partir de muestras.
• Importancia: Fundamental en inferencia estadística, especialmente en pruebas de hipótesis y
construcción de intervalos de confianza.
• Teorema del Límite Central: A medida que aumenta el tamaño de la muestra, la distribución de la media
muestral se aproxima a una distribución normal, lo que facilita las inferencias sobre la media poblacional.
Tipos de distribución muestral
6. Distribución Muestral de la Diferencia de Medias (Emparejadas): Esta distribución muestral se aplica cuando
estás comparando las medias de dos muestras emparejadas o dependientes. Se utiliza en pruebas de
diferencia de medias emparejadas, como la prueba t de Student emparejada.
• Aplicación: Utilizada para comparar las medias de dos muestras emparejadas o dependientes.
• Importancia: Es crucial en pruebas de diferencia de medias emparejadas, que evalúan cambios antes y
después de una intervención.
7. Distribución Muestral de la Mediana: En ocasiones, es importante considerar la mediana en lugar de la
media. La distribución muestral de la mediana se utiliza cuando se estiman propiedades de la mediana
poblacional a partir de muestras.
• Aplicación: Utilizada para estimar propiedades de la mediana poblacional a partir de muestras.
• Importancia: Útil cuando la media no es una medida adecuada de tendencia central o cuando se trabaja
con datos no normales.
Tipos de distribución muestral
8. Distribución Muestral del Rango: La distribución muestral del rango se utiliza para estimar propiedades del
rango poblacional a partir de muestras.
• Aplicación: Aplicada en la estimación de propiedades del rango poblacional a partir de muestras.
• Importancia: Es relevante cuando se analiza la variabilidad de los datos y se considera el rango como una
medida de dispersión.
Los diferentes tipos de distribuciones muestrales se utilizan en diversas situaciones de inferencia estadística para
estimar parámetros poblacionales, realizar comparaciones entre grupos y evaluar cambios en variables de interés.
La elección del tipo de distribución muestral depende de la estadística de muestra que se esté utilizando y de la
naturaleza de los datos y la pregunta de investigación. Cada tipo de distribución muestral tiene sus propias
características y aplicaciones específicas.
Introducción a las distribuciones muéstrales
• Teorema del Límite Central: El teorema del límite central establece que, a medida
que el tamaño de la muestra aumenta, la distribución de la media muestral se aproxima
a una distribución normal, independientemente de la forma de la población original. Esto
es fundamental en la estadística y permite realizar inferencias sobre la población
utilizando distribuciones normales.
• Tipos de Distribuciones Muestrales: Existen varios tipos de distribuciones
muestrales, como la distribución muestral de la media, la de la proporción, la de la
diferencia de medias, la de la diferencia de proporciones, entre otras. Cada tipo de
distribución muestral se utiliza en contextos específicos y depende de la estadística de
muestra que estés calculando.
• Uso en Inferencia Estadística: Las distribuciones muestrales se utilizan en inferencia
estadística para estimar parámetros desconocidos de la población, realizar pruebas de
hipótesis sobre afirmaciones poblacionales y construir intervalos de confianza que
Distribución muestral de media
Objetivo:
• Inferencia y Toma de Decisiones: Esta distribución es fundamental para la toma de decisiones basadas en
datos. Permite a los analistas de datos realizar inferencias sobre la población y tomar decisiones informadas
sobre cuestiones de investigación, negocios y políticas públicas.
Distribución muestral de media
• Z es la puntuación Z (valor crítico) que se utiliza para realizar cálculos y determinar probabilidades en una
distribución normal estándar.
• X es la media muestral.
• μ es la media poblacional (o media verdadera de la población completa).
• σ es la desviación estándar poblacional.
• n es el tamaño de la muestra.
Distribución muestral de media
Ejercicio:
Supongamos que se está investigando la altura de una población de estudiantes de una universidad. La población
completa tiene 1,000 estudiantes. Se quiere estimar la altura promedio de estos estudiantes a partir de una
muestra de 50 estudiantes. Se sabe que la desviación estándar de la altura en la población completa es de 5 cm.
Utiliza la Distribución Muestral de la Media para responder a las siguientes preguntas:
• ¿Cuál es la probabilidad de que la media muestral de altura sea menor de 170 cm?
• ¿Cuál es la probabilidad de que la media muestral de altura esté entre 168 cm y 172 cm?
• ¿Cuál es el valor de la media muestral de altura que deja una cola de probabilidad del 5% a la derecha?
Distribución muestral de media
1. ¿Cuál es la probabilidad de que la media muestral de altura sea menor de 170 cm? Se debe calcular el
valor Z usando la fórmula de Z:
2. ¿Cuál es la probabilidad de que la media muestral de altura esté entre 168 cm y 172 cm? Para calcular la
probabilidad de que la media muestral de altura esté entre 168 cm y 172 cm utilizando la Distribución
Muestral de la Media:
2. ¿Cuál es la probabilidad de que la media muestral de altura esté entre 168 cm y 172 cm? Para calcular la
probabilidad de que la media muestral de altura esté entre 168 cm y 172 cm utilizando la Distribución
Muestral de la Media:
3) ¿ Cuál es el valor de la media muestral de altura que deja una cola de probabilidad del 5% a la derecha?
Para encontrar el valor de la media muestral de altura que deja una cola de probabilidad del 5% a la derecha,
puedes seguir estos pasos utilizando la Distribución Muestral de la Media:
Identificar los datos del problema:
• Calcular la desviación estándar de la media muestral (σX) Usamos la fórmula para la desviación estándar de la
media muestral:
• Calcular el valor Z para dejar una cola de probabilidad del 5% a la derecha: Se debe encontrar el valor Z
correspondiente al percentil 95. Es decir, buscar el valor Z tal que el 5% de las medias muestrales estén a la
derecha de ese valor. Esto se hace consultando la tabla Z estándar o utilizando una calculadora estadística.
Distribución muestral de media