16/12/2024
RESUMEN
ESTADÍSTICA II
CONTENIDO
Unidad 1. La medición de la incertidumbre a partir de la teoría de la probabilidad
Unidad 2. Modelos de probabilidad discretos
Unidad 3. Modelos de probabilidad continuos
Unidad 4. Inferencia estadística
Unidad 5. Teoría de la estimación (Intervalos de confianza)
Unidad 6. Teoría de la contrastación de hipótesis estadísticas
16/12/2024
Unidad 1. La medición de la incertidumbre a partir de la teoría de la probabilidad
DISTRIBUCIÓN DE PROBABILIDADES
Una variable aleatoria tendrá una distribución de probabilidad asociada Dónde diferentes valores de
la variable están en el eje horizontal y las probabilidades relativas de los posibles valores de la
variable (el espacio de la muestra) se encuentran en el eje vertical.
Representarse Tabla
Distribución de
Gráfica
probabilidades
Formula
16/12/2024
DISTRIBUCIÓN DE PROBABILIDADES
Binomial
Distribución de probabilidad de
variables discretas
Poisson
Normal
Distribución de probabilidad de
variables continuas t de student
Chi - cuadrada
F de Fisher
DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES DISCRETAS
Binomial con dos posibles resultados
16/12/2024
DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES DISCRETAS
DISTRIBUCIÓN BINOMIAL
La distribución binomial se deriva de un Cuando en un proceso aleatorio o experimento, llamado ensayo
procedimiento conocido como ensayo de puede tener solo dos posibles resultados mutuamente
Bernoulli. excluyentes, se llama ensayo de Bernoulli
Proceso de Bernoulli, condiciones
1. En c/ensayo ocurre uno de dos posibles resultados, mutuamente
excluyentes. Uno de los resultados se denota arbitrariamente como éxito y el
otro como fracaso.
2. La probabilidad de un éxito es denotado por p, permanece constante de un
ensayo a otro, y la probabilidad de fracaso 1 – p, se denota como q.
3. Los ensayos son independientes, es decir, el resultado de un ensayo en
particular no es afectado por el resultado de otro ensayo.
DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES DISCRETAS
DISTRIBUCIÓN BINOMIAL
El objetivo principal de una distribución binomial es calcular la probabilidad de que un
evento ocurra un número específico de veces en un número fijo de ensayos, bajo las
condiciones definidas anteriormente.
Los cálculos de probabilidad se pueden obtener a través de la fórmula o a través de la tabla binomial
16/12/2024
DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES DISCRETAS
DISTRIBUCIÓN BINOMIAL
Ejemplo: En una empresa dedicada a la venta de software empresarial, se sabe que el 40% de los
clientes potenciales contactados muestran interés inicial en adquirir el producto. Si un equipo de
ventas contacta a una muestra aleatoria de 10 clientes potenciales:
La probabilidad de tener exactamente k=4 éxitos
(clientes interesados) en n=10 ensayos, con p=0.40, es:
x = 4, n = 10, p = 0,3
𝑃 𝑥 = 4 = 0,633 − 0,382 = 0,251
DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES DISCRETAS
DISTRIBUCIÓN BINOMIAL
Tabla binomial
16/12/2024
DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES DISCRETAS
DISTRIBUCIÓN POISSON
¿Como se distribuyen los eventos en el espacio o tiempo?
Una distribución de Poisson describe variables representando el número de
ocurrencias de un evento particular en un intervalo de tiempo o espacio.
Supuestos
1. Los éxitos ocurren de manera independiente
2. Los éxitos ocurren con igual probabilidad en cada punto del tiempo o espacio
DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES DISCRETAS
DISTRIBUCIÓN POISSON
La distribución de Poisson está descrita por Característica de la distribución de Poisson
Si x es el número de ocurrencias de algún evento La media y la varianza son iguales
aleatorio en un intervalo de espacio o tiempo (o
algún volumen de materia) la probabilidad de que x
ocurra esta dada por:
X = o, 1, 2, 3 ….
Valor promedio del número de
ocurrencias de eventos en cada muestra
(o intervalo de tiempo)
Bajos valores de
16/12/2024
DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES DISCRETAS
DISTRIBUCIÓN POISSON
Ejemplo,
En una fábrica de zapatos, se sabe que el número promedio de defectos en las suelas de los zapatos producidos
en una hora es de 3. Supón que el número de defectos sigue una distribución de Poisson. ¿Cuál es la probabilidad
de que en la siguiente hora se produzcan 2 defectos o menos?
=3 P(X≤2)=?
𝑃 𝑥 ≤ 2 = 0,0498 + 0,1494 + 0,2240
𝑃 𝑥 ≤ 2 = 0,4232
3 𝑒 3 𝑒 3 𝑒
𝑃 𝑥≤2 = + +
0! 1! 2!
16/12/2024
DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES DISCRETAS
DISTRIBUCIÓN HIPERGEOMÉTRICA
La distribución hipergeométrica describe la probabilidad de obtener exactamente x éxitos en
una muestra de tamaño n, extraída sin reemplazo de una población de tamaño N que contiene r
éxitos.
La distribución de probabilidad hipergeométrica está estrechamente relacionada con la
distribución binomial. Pero difieren en dos puntos:
Distribución
Distribución binomial
hipergeométrica
• Ensayos • Ensayos no son
independientes independientes
• Prob. de éxito no • Prob. de éxito varía
varia entre ensayos de ensayo a ensayo
DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES DISCRETAS
DISTRIBUCIÓN HIPERGEOMÉTRICA
POBLACIÓN MUESTRA
En la notación usual en la ÉXITO
distribución hipergeométrica, r x
FRACASOS N-r n-x
r: número de elementos N n
considerados como éxitos en de la
población total
N: tamaño de la población
N – r: número de elementos
considerados fracasos en la
población total
16/12/2024
DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES DISCRETAS
DISTRIBUCIÓN HIPERGEOMÉTRICA
Una empresa tiene 20 empleados, de los cuales 8 son hombres y 12 son mujeres. Se seleccionan al
azar 5 empleados para una encuesta. ¿Cuál es la probabilidad de que se seleccionen exactamente 3
hombres?
POBLACIÓN MUESTRA
N=20 (total de empleados) ÉXITO
𝑟=8 (hombres) r =8 x=3
𝑛=5 (tamaño de la muestra) FRACASOS N – r = 20 - 8 n – x = 5-3
𝑥=3 (número de hombres que queremos seleccionar)
N = 20 n=5
56𝑥66 3696
𝑃 𝑋=3 = = = 0,238
15504 15504
La probabilidad de que se seleccionen
exactamente 3 hombres es aproximadamente
0,238 o 23,8%
DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES CONTINUAS
Normal Chi - cuadrada
t de student
F de Fisher
16/12/2024
DISTRIBUCIÓN NORMAL
Formula de la distribución Normal
Media de la
distribución
Cualquier número real: -α a + α
Varianza
Constantes
Media: cualquier valor real Número infinito de
Varianza: cualquier valor positivo distribuciones
DISTRIBUCIÓN NORMAL
La distribución normal y las tablas estadísticas
Distribución Normal Estándar
=0y=1
Variable que tiene una
distribución estándar
16/12/2024
Áreas bajo la curva normal
ESTADÍSTICA INFERENCIAL
La inferencia estadística es el procedimiento por medio del cual se llega a conclusiones acerca de
una población con base en la información que se obtiene a partir de una muestra seleccionada
de esa población.
Una Población (N) es
todos los individuos o Estadísticos:
características
unidades de interés, POBLACIÓN MUESTRA
medidas de las
mientras que una
Muestra (n) es sub- muestras
juego de unidades
tomados desde la N (Poblaciones)
población.
n (muestra)
16/12/2024
ESTADÍSTICA INFERENCIAL
Estadística
Promedios,
Proporciones, Estimar
Parámetros
Medidas de variación,
Medidas de relación verdad Aproximación de la verdad
Parámetro es una cantidad describiendo a una población mientras que
un Estimador es una cantidad relacionada al parámetro, pero calculada
desde la muestra.
Estimación es el proceso de inferir sobre una cantidad desconocida de
una población usando datos de una muestra
ESTADÍSTICA INFERENCIAL
Propiedades de un buen muestreo
Estimación Parámetro por azar
MUESTRA
Esta diferencia aleatoria de la verdad = Error de Muestreo”
Objetivo del muestreo: minimizar el error muestral y sesgo en los estimadores.
Error muestral es la Sesgo (por selección) tendencia
diferencia entre la sistemática inherente a un
estimación y el método de muestreo que da
parámetro de la estimaciones de un parámetro
población dada por el que son en promedio menores
azar . (sesgo negativo) o mayores (sesgo
positivo) que el parámetro real.
16/12/2024
Muestreo al azar
La suposición común es que los datos son obtenidos de muestras al azar
Tipo de muestreo
Muestreo aleatorio simple Muestreo por conglomerados. La
población se divide en subconjuntos
Muestreo sin reemplazo (conglomerados), que son
seleccionados aleatoriamente.
Muestreo con reemplazo
Muestreo estratificado: La población Muestreo sistemático: Consiste en
se divide en subconjuntos (estratos), seleccionar un elemento al comienzo
en cada uno de los cuales se lleva a de una lista de la población y luego se
cabo el muestreo de elementos. selecciona cada un número fijo de
posiciones el resto de elementos.
DISTRIBUCIONES MUESTRALES
Cuando se selecciona una muestra aleatoria de una población,
las medidas numéricas descriptivas que se calculen de la
muestra se denominan estadísticas
La distribución muestral de una estadística Las estadísticas varían o cambian para cada
es la distribución de probabilidad para los muestra aleatoria diferente que se escoja;
posibles valores de la estadística, que resulta esto es, son variables aleatorias.
cuando muestras aleatorias de tamaño n se
sacan repetidamente de la población.
Las distribuciones de probabilidad para
estadísticas se llaman distribuciones
muestrales
16/12/2024
DISTRIBUCIONES MUESTRALES
Estadísticas
Distribución muestral de la media
n=5 S2 S
n=5
S2 S
n=5 S2 S
n=5 S2 S
Estadística Parámetro Estimador
Media 𝑋 Ejemplo, costo promedio de artículos de un inventario
Desviación estándar S
DISTRIBUCIÓN DE LA MEDIA DE LA MUESTRA
Muestreo a partir de una población que sigue una distribución normal
Cuando el muestreo se realiza a partir de una población que sigue una distribución normal, la distribución de la media
de la muestra tiene las siguientes propiedades:
Distribución de probabilidad Distribución de probabilidad
de la variable x de la media muestral
16/12/2024
DISTRIBUCIÓN DE LA MEDIA DE LA MUESTRA
Muestreo a partir de una población que NO sigue una distribución normal
Teorema del límite central: incluso si las poblaciones muestrales no son normales, las
distribuciones muestrales de esas estadísticas serán aproximadamente normales cuando
el tamaño muestral n es grande.
Teorema del límite central
INFERENCIA ESTADÍSTICA
Estimación estadística: Estimar o predecir el valor del parámetro (Intervalos
de confianza)
Limita el valor de un parámetro de Población
Inferencia
Estadística ¿Qué tan grande es el efecto?"
Prueba de hipótesis: Tomar una decisión acerca del valor de un parámetro,
con base en alguna idea preconcebida acerca de cuál podría ser su valor.
Pregunta si el parámetro difiere de una expectativa “nula”
¿Hay algún efecto?
16/12/2024
INFERENCIA ESTADÍSTICA
Estimación estadística
Estimadores Parámetros
Estima
Estima
Estima
Un estimador es una regla, generalmente expresada como fórmula, que nos dice cómo calcular una
estimación basada en información de la muestra.
INFERENCIA ESTADÍSTICA
Estimación estadística
DISTRIBUCIÓN MUESTRAL
La desviación estándar de una distribución muestral de un estimador es llamado Error Estándar
16/12/2024
INFERENCIA ESTADÍSTICA 95% de valores posibles
INTERVALOS DE CONFIANZA
𝝁 = 𝝁𝑿
Aproximadamente 95 % de
estos intervalos tendría
centros que caen dentro del
intervalo ±2𝜎 en torno a
INFERENCIA ESTADÍSTICA
INTERVALOS DE CONFIANZA
¿Como se construye un intervalo de confianza?
estimador ± (coeficiente de confiabilidad) x (error estándar)
Error estándar
Estimador
Coeficiente de confiabilidad
Z 1,96, = 0,975
Coeficiente (o nivel) de confianza
Existe 95% de confianza de que la media
Intervalo de confianza para poblacional esté dentro de este intervalo
Nota: algunos 1-/2
16/12/2024
INFERENCIA ESTADÍSTICA
PRUEBAS DE HIPÓTESIS Hipótesis de Investigación
Tipos de hipótesis
Hipótesis estadísticas
Hipótesis de Investigación: es la conjetura o suposición que motiva la investigación
Hipótesis nula: predeterminada
Hipótesis Estadísticas: Se
Afirmaciones claras
establecen de tal forma que
de dos hipótesis
pueden ser evaluadas por medio
sobre cantidad
de técnicas estadísticas Hipótesis Alternativa: todas las demás
poblacional
adecuadas posibilidades
INFERENCIA ESTADÍSTICA
PRUEBAS DE HIPÓTESIS
Tipos de Hipótesis
Hipótesis nula
Hipótesis de no Generalmente, el parámetro de población de interés es cero
diferencia ej.: sin efecto, sin preferencia, sin correlación o sin diferencia).
Ho = Hipótesis nula
Hipótesis alternativa
Proposición que se creerá cierta si los datos de la muestra llevan al rechazo de la
hipótesis nula.
Ha
Hipótesis alternativa = Hipótesis de Investigación
16/12/2024
INFERENCIA ESTADÍSTICA
PRUEBAS DE HIPÓTESIS
Rechazar o No Rechazar la Hipótesis Nula
Hipótesis nula: es la única declaración que se prueba con los datos
DATOS
Inconsistentes con Ho
Consistentes con Ho
Rechazamos Ho y aceptamos la Ha
No la rechazamos
“Ha es soportada por los datos”
“No se puede decir que se acepta”
INFERENCIA ESTADÍSTICA
PRUEBAS DE HIPÓTESIS
Reglas para establecer la hipótesis estadística
El indicador de igualdad debe aparecer en la hipótesis nula , o
Ho: = 50 Ha: 50
La conclusión a la que se desea o espera llegar como resultado de la prueba generalmente se usa
como hipótesis alternativa
La hipótesis nula debe contener una proposición de igualdad
La hipótesis nula es la que debe ser comprobada
Las hipótesis nula y alternativa son complementarias
16/12/2024
INFERENCIA ESTADÍSTICA
PRUEBAS DE HIPÓTESIS
La estadística de prueba es una cantidad calculada desde los datos que es
Estadística de Prueba usada para evaluar cuan compatible son los datos con el resultado
esperado bajo la hipótesis nula.
La distribución nula
La distribución nula es la distribución de muestreo de resultados para una estadística de
prueba bajo el supuesto de que la hipótesis nula es verdadera.
Cuantificando la incertidumbre: Valor de p (p-value)
Calculamos el valor de probabilidad para la estadística de prueba desde la distribución nula.-
INFERENCIA ESTADÍSTICA
PRUEBAS DE HIPÓTESIS
Cuantificando la incertidumbre: Valor de p (p-value)
Calculamos el valor de probabilidad para la estadística de prueba desde la distribución
nula.
Ho: = 50
Ha: 50
16/12/2024
INFERENCIA ESTADÍSTICA
PRUEBAS DE HIPÓTESIS
Significancia estadística
Que hacemos con el p-value?
Como decidimos si el valor de p es grande o pequeño ?
Convección en biología Limite entre P-value peq o no peq = 0,05
Rechazo Ho No se puede rechazar Ho
INFERENCIA ESTADÍSTICA
PRUEBAS DE HIPÓTESIS
Conclusión
Suponga
Ho: = 50
Ha: 50
Resultado 1.
Probabilidad del estadístico de Prueba cae en la región de No Rechazo.
Interpretación: los datos no son consistentes para apoyar la Ha, o No se puede rechazar la Ho
Resultado 2.
Probabilidad del estadístico de prueba cae en la Región de rechazo.
Interpretación: los datos son consistentes con la Ho. Se rechaza la Ho.
16/12/2024
INFERENCIA ESTADÍSTICA
PRUEBAS DE HIPÓTESIS
Prueba de Hipótesis
¿Por qué no puedo decir que acepto Ho?
Realidad
Decisión Ho cierta Ho falsa
= 0,01
Rechazar Ho Error tipo I Correcto Disminuye
No rechazar Ho Correcto Error tipo II
INFERENCIA ESTADÍSTICA
Parámetro que Características de los INTERVALO DE CONFIANZA PRUEBA DE HIPÓTESIS
se quiere estimar datos estimador ± (coeficiente de confiabilidad) x
(error estándar)
Media de una La distribución de la El coeficiente de confiabilidad es Z Dos colas
población variable en la población es Ho: = valor X
normal. Ha: valor X,
La varianza poblacional es Estadístico de Prueba Z
conocida
16/12/2024
INFERENCIA ESTADÍSTICA
Parámetro que Características de los INTERVALO DE CONFIANZA PRUEBA DE HIPÓTESIS
se quiere estimar datos estimador ± (coeficiente de confiabilidad) x
(error estándar)
Media de una La distribución de la El coeficiente de confiabilidad es t, Dos colas
población variable en la población es Ho: = valor X
normal. Ha: valor X,
La varianza poblacional es Estadístico de Prueba t
Desconocida
Si la muestra es peq. Pq con muestra grande
podría aproximar a Z
INFERENCIA ESTADÍSTICA
Parámetro que Características de los PRUEBA DE HIPÓTESIS
se quiere estimar datos
Media de dos La distribución de las Dos colas
poblaciones variables en las Ho: 1 - 2 = 0
poblaciones normal. Ha: 1 - 2 0
Las varianzas poblacional Estadístico de Prueba t,
son Desconocidas
Caso 1: Muestras Independientes
Se supone Varianzas Iguales
Aquí se asume que las Varianzas poblacionales son Iguales y se usa la
varianza pool
Se hace una estimación conjunta de la varianza
Se calcula el error estándar con la varianza pool
16/12/2024
INFERENCIA ESTADÍSTICA
Parámetro que se quiere Características de los datos PRUEBA DE HIPÓTESIS
estimar
Media de dos poblaciones La distribución de las Dos colas
variables en las Ho: d = 0
poblaciones normal. Ha: Ha: d 0
Las varianzas poblacional Estadístico de Prueba t,
son Desconocidas
Caso 2: Muestras Pareadas
Se calcula diferencia dato a dato y luego se calcula una
media de las diferencias, igual se calcula el error
estándar
INFERENCIA ESTADÍSTICA
Parámetro que Características de los Objetivo PRUEBA DE HIPÓTESIS
se quiere estimar datos
Pruebas Chi- Datos de frecuencia o Prueba de Bondad de Ho: La variable x sigue una dist z
Cuadrado conteos Ajuste H1: La variable x no sigue dist. Z
Evaluar si los datos de Estadístico de prueba:
una muestra son
compatibles con cierta
distribución (Normal,
Poisso)
16/12/2024
Parámetro que Características de los Objetivo PRUEBA DE HIPÓTESIS
se quiere estimar datos
Pruebas Chi- Datos de frecuenci o Prueba de Ho: La variable criterio 1 y la variable criterio 2 son
Cuadrado conteos Independencia independiente.
Evaluar si dos variables Ha: La variable criterio 1 y la variable criterio 2 no
están relacionadas son independientes.
Estadístico de prueba: