0% encontró este documento útil (0 votos)
24 vistas25 páginas

Distribución de Probabilidades en Estadística

El documento es un resumen de un curso de Estadística II que abarca temas como la medición de la incertidumbre, modelos de probabilidad discretos y continuos, inferencia estadística, teoría de la estimación y contrastación de hipótesis. Se presentan distribuciones de probabilidad como la binomial, Poisson y normal, así como conceptos de muestreo y estimación. Además, se discuten intervalos de confianza y pruebas de hipótesis en el contexto de la estadística inferencial.

Cargado por

olivia deslandes
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
24 vistas25 páginas

Distribución de Probabilidades en Estadística

El documento es un resumen de un curso de Estadística II que abarca temas como la medición de la incertidumbre, modelos de probabilidad discretos y continuos, inferencia estadística, teoría de la estimación y contrastación de hipótesis. Se presentan distribuciones de probabilidad como la binomial, Poisson y normal, así como conceptos de muestreo y estimación. Además, se discuten intervalos de confianza y pruebas de hipótesis en el contexto de la estadística inferencial.

Cargado por

olivia deslandes
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

16/12/2024

RESUMEN
ESTADÍSTICA II

CONTENIDO

Unidad 1. La medición de la incertidumbre a partir de la teoría de la probabilidad


Unidad 2. Modelos de probabilidad discretos
Unidad 3. Modelos de probabilidad continuos
Unidad 4. Inferencia estadística
Unidad 5. Teoría de la estimación (Intervalos de confianza)
Unidad 6. Teoría de la contrastación de hipótesis estadísticas
16/12/2024

Unidad 1. La medición de la incertidumbre a partir de la teoría de la probabilidad

DISTRIBUCIÓN DE PROBABILIDADES

Una variable aleatoria tendrá una distribución de probabilidad asociada Dónde diferentes valores de
la variable están en el eje horizontal y las probabilidades relativas de los posibles valores de la
variable (el espacio de la muestra) se encuentran en el eje vertical.

Representarse Tabla
Distribución de
Gráfica
probabilidades
Formula
16/12/2024

DISTRIBUCIÓN DE PROBABILIDADES

Binomial
Distribución de probabilidad de
variables discretas
Poisson

Normal
Distribución de probabilidad de
variables continuas t de student

Chi - cuadrada

F de Fisher

DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES DISCRETAS

Binomial con dos posibles resultados


16/12/2024

DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES DISCRETAS


DISTRIBUCIÓN BINOMIAL

La distribución binomial se deriva de un Cuando en un proceso aleatorio o experimento, llamado ensayo


procedimiento conocido como ensayo de puede tener solo dos posibles resultados mutuamente
Bernoulli. excluyentes, se llama ensayo de Bernoulli

Proceso de Bernoulli, condiciones


1. En c/ensayo ocurre uno de dos posibles resultados, mutuamente
excluyentes. Uno de los resultados se denota arbitrariamente como éxito y el
otro como fracaso.

2. La probabilidad de un éxito es denotado por p, permanece constante de un


ensayo a otro, y la probabilidad de fracaso 1 – p, se denota como q.

3. Los ensayos son independientes, es decir, el resultado de un ensayo en


particular no es afectado por el resultado de otro ensayo.

DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES DISCRETAS

DISTRIBUCIÓN BINOMIAL

El objetivo principal de una distribución binomial es calcular la probabilidad de que un


evento ocurra un número específico de veces en un número fijo de ensayos, bajo las
condiciones definidas anteriormente.

Los cálculos de probabilidad se pueden obtener a través de la fórmula o a través de la tabla binomial
16/12/2024

DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES DISCRETAS


DISTRIBUCIÓN BINOMIAL

Ejemplo: En una empresa dedicada a la venta de software empresarial, se sabe que el 40% de los
clientes potenciales contactados muestran interés inicial en adquirir el producto. Si un equipo de
ventas contacta a una muestra aleatoria de 10 clientes potenciales:

La probabilidad de tener exactamente k=4 éxitos


(clientes interesados) en n=10 ensayos, con p=0.40, es:
x = 4, n = 10, p = 0,3

𝑃 𝑥 = 4 = 0,633 − 0,382 = 0,251

DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES DISCRETAS


DISTRIBUCIÓN BINOMIAL
Tabla binomial
16/12/2024

DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES DISCRETAS


DISTRIBUCIÓN POISSON

¿Como se distribuyen los eventos en el espacio o tiempo?

Una distribución de Poisson describe variables representando el número de


ocurrencias de un evento particular en un intervalo de tiempo o espacio.

Supuestos
1. Los éxitos ocurren de manera independiente
2. Los éxitos ocurren con igual probabilidad en cada punto del tiempo o espacio

DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES DISCRETAS


DISTRIBUCIÓN POISSON
La distribución de Poisson está descrita por Característica de la distribución de Poisson

Si x es el número de ocurrencias de algún evento La media y la varianza son iguales


aleatorio en un intervalo de espacio o tiempo (o
algún volumen de materia) la probabilidad de que x
ocurra esta dada por:

X = o, 1, 2, 3 ….

Valor promedio del número de


ocurrencias de eventos en cada muestra
(o intervalo de tiempo)

Bajos valores de 
16/12/2024

DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES DISCRETAS


DISTRIBUCIÓN POISSON
Ejemplo,

En una fábrica de zapatos, se sabe que el número promedio de defectos en las suelas de los zapatos producidos
en una hora es de 3. Supón que el número de defectos sigue una distribución de Poisson. ¿Cuál es la probabilidad
de que en la siguiente hora se produzcan 2 defectos o menos?

=3 P(X≤2)=?
𝑃 𝑥 ≤ 2 = 0,0498 + 0,1494 + 0,2240

𝑃 𝑥 ≤ 2 = 0,4232
3 𝑒 3 𝑒 3 𝑒
𝑃 𝑥≤2 = + +
0! 1! 2!
16/12/2024

DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES DISCRETAS


DISTRIBUCIÓN HIPERGEOMÉTRICA

La distribución hipergeométrica describe la probabilidad de obtener exactamente x éxitos en


una muestra de tamaño n, extraída sin reemplazo de una población de tamaño N que contiene r
éxitos.

La distribución de probabilidad hipergeométrica está estrechamente relacionada con la


distribución binomial. Pero difieren en dos puntos:

Distribución
Distribución binomial
hipergeométrica

• Ensayos • Ensayos no son


independientes independientes

• Prob. de éxito no • Prob. de éxito varía


varia entre ensayos de ensayo a ensayo

DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES DISCRETAS


DISTRIBUCIÓN HIPERGEOMÉTRICA
POBLACIÓN MUESTRA
En la notación usual en la ÉXITO
distribución hipergeométrica, r x
FRACASOS N-r n-x
r: número de elementos N n
considerados como éxitos en de la
población total

N: tamaño de la población

N – r: número de elementos
considerados fracasos en la
población total
16/12/2024

DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES DISCRETAS


DISTRIBUCIÓN HIPERGEOMÉTRICA
Una empresa tiene 20 empleados, de los cuales 8 son hombres y 12 son mujeres. Se seleccionan al
azar 5 empleados para una encuesta. ¿Cuál es la probabilidad de que se seleccionen exactamente 3
hombres?

POBLACIÓN MUESTRA
N=20 (total de empleados) ÉXITO
𝑟=8 (hombres) r =8 x=3
𝑛=5 (tamaño de la muestra) FRACASOS N – r = 20 - 8 n – x = 5-3
𝑥=3 (número de hombres que queremos seleccionar)
N = 20 n=5

56𝑥66 3696
𝑃 𝑋=3 = = = 0,238
15504 15504
La probabilidad de que se seleccionen
exactamente 3 hombres es aproximadamente
0,238 o 23,8%

DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES CONTINUAS


Normal Chi - cuadrada

t de student
F de Fisher
16/12/2024

DISTRIBUCIÓN NORMAL

Formula de la distribución Normal

Media de la
distribución
Cualquier número real: -α a + α
Varianza
Constantes

Media: cualquier valor real Número infinito de


Varianza: cualquier valor positivo distribuciones

DISTRIBUCIÓN NORMAL
La distribución normal y las tablas estadísticas

Distribución Normal Estándar

=0y=1

Variable que tiene una


distribución estándar
16/12/2024

Áreas bajo la curva normal

ESTADÍSTICA INFERENCIAL

La inferencia estadística es el procedimiento por medio del cual se llega a conclusiones acerca de
una población con base en la información que se obtiene a partir de una muestra seleccionada
de esa población.

Una Población (N) es


todos los individuos o Estadísticos:
características
unidades de interés, POBLACIÓN MUESTRA
medidas de las
mientras que una
Muestra (n) es sub- muestras
juego de unidades
tomados desde la N (Poblaciones)
población.
n (muestra)
16/12/2024

ESTADÍSTICA INFERENCIAL

Estadística
Promedios,
Proporciones, Estimar
Parámetros
Medidas de variación,
Medidas de relación verdad Aproximación de la verdad

Parámetro es una cantidad describiendo a una población mientras que


un Estimador es una cantidad relacionada al parámetro, pero calculada
desde la muestra.

Estimación es el proceso de inferir sobre una cantidad desconocida de


una población usando datos de una muestra

ESTADÍSTICA INFERENCIAL

Propiedades de un buen muestreo

Estimación  Parámetro por azar


MUESTRA
Esta diferencia aleatoria de la verdad = Error de Muestreo”

Objetivo del muestreo: minimizar el error muestral y sesgo en los estimadores.

Error muestral es la Sesgo (por selección) tendencia


diferencia entre la sistemática inherente a un
estimación y el método de muestreo que da
parámetro de la estimaciones de un parámetro
población dada por el que son en promedio menores
azar . (sesgo negativo) o mayores (sesgo
positivo) que el parámetro real.
16/12/2024

Muestreo al azar
La suposición común es que los datos son obtenidos de muestras al azar

Tipo de muestreo

Muestreo aleatorio simple Muestreo por conglomerados. La


población se divide en subconjuntos
Muestreo sin reemplazo (conglomerados), que son
seleccionados aleatoriamente.

Muestreo con reemplazo

Muestreo estratificado: La población Muestreo sistemático: Consiste en


se divide en subconjuntos (estratos), seleccionar un elemento al comienzo
en cada uno de los cuales se lleva a de una lista de la población y luego se
cabo el muestreo de elementos. selecciona cada un número fijo de
posiciones el resto de elementos.

DISTRIBUCIONES MUESTRALES

Cuando se selecciona una muestra aleatoria de una población,


las medidas numéricas descriptivas que se calculen de la
muestra se denominan estadísticas

La distribución muestral de una estadística Las estadísticas varían o cambian para cada
es la distribución de probabilidad para los muestra aleatoria diferente que se escoja;
posibles valores de la estadística, que resulta esto es, son variables aleatorias.
cuando muestras aleatorias de tamaño n se
sacan repetidamente de la población.

Las distribuciones de probabilidad para


estadísticas se llaman distribuciones
muestrales
16/12/2024

DISTRIBUCIONES MUESTRALES

Estadísticas
Distribución muestral de la media
n=5 S2 S

n=5
S2 S

n=5 S2 S

n=5 S2 S

Estadística Parámetro Estimador


Media  𝑋 Ejemplo, costo promedio de artículos de un inventario
Desviación estándar  S

DISTRIBUCIÓN DE LA MEDIA DE LA MUESTRA


Muestreo a partir de una población que sigue una distribución normal

Cuando el muestreo se realiza a partir de una población que sigue una distribución normal, la distribución de la media
de la muestra tiene las siguientes propiedades:

Distribución de probabilidad Distribución de probabilidad


de la variable x de la media muestral
16/12/2024

DISTRIBUCIÓN DE LA MEDIA DE LA MUESTRA

Muestreo a partir de una población que NO sigue una distribución normal

Teorema del límite central: incluso si las poblaciones muestrales no son normales, las
distribuciones muestrales de esas estadísticas serán aproximadamente normales cuando
el tamaño muestral n es grande.
Teorema del límite central

INFERENCIA ESTADÍSTICA

Estimación estadística: Estimar o predecir el valor del parámetro (Intervalos


de confianza)

Limita el valor de un parámetro de Población


Inferencia
Estadística ¿Qué tan grande es el efecto?"

Prueba de hipótesis: Tomar una decisión acerca del valor de un parámetro,


con base en alguna idea preconcebida acerca de cuál podría ser su valor.

Pregunta si el parámetro difiere de una expectativa “nula”


¿Hay algún efecto?
16/12/2024

INFERENCIA ESTADÍSTICA

Estimación estadística

Estimadores Parámetros
Estima

Estima

Estima

Un estimador es una regla, generalmente expresada como fórmula, que nos dice cómo calcular una
estimación basada en información de la muestra.

INFERENCIA ESTADÍSTICA

Estimación estadística
DISTRIBUCIÓN MUESTRAL


La desviación estándar de una distribución muestral de un estimador es llamado Error Estándar
16/12/2024

INFERENCIA ESTADÍSTICA 95% de valores posibles

INTERVALOS DE CONFIANZA

𝝁 = 𝝁𝑿

Aproximadamente 95 % de
estos intervalos tendría
centros que caen dentro del
intervalo ±2𝜎 en torno a 

INFERENCIA ESTADÍSTICA
INTERVALOS DE CONFIANZA
¿Como se construye un intervalo de confianza?

estimador ± (coeficiente de confiabilidad) x (error estándar)


Error estándar

Estimador

Coeficiente de confiabilidad
Z 1,96, = 0,975
Coeficiente (o nivel) de confianza
Existe 95% de confianza de que la media
Intervalo de confianza para poblacional esté dentro de este intervalo

Nota: algunos 1-/2


16/12/2024

INFERENCIA ESTADÍSTICA
PRUEBAS DE HIPÓTESIS Hipótesis de Investigación
Tipos de hipótesis
Hipótesis estadísticas

Hipótesis de Investigación: es la conjetura o suposición que motiva la investigación

Hipótesis nula: predeterminada


Hipótesis Estadísticas: Se
Afirmaciones claras
establecen de tal forma que
de dos hipótesis
pueden ser evaluadas por medio
sobre cantidad
de técnicas estadísticas Hipótesis Alternativa: todas las demás
poblacional
adecuadas posibilidades

INFERENCIA ESTADÍSTICA
PRUEBAS DE HIPÓTESIS
Tipos de Hipótesis
Hipótesis nula
Hipótesis de no Generalmente, el parámetro de población de interés es cero
diferencia ej.: sin efecto, sin preferencia, sin correlación o sin diferencia).

Ho = Hipótesis nula
Hipótesis alternativa
Proposición que se creerá cierta si los datos de la muestra llevan al rechazo de la
hipótesis nula.

Ha
Hipótesis alternativa = Hipótesis de Investigación
16/12/2024

INFERENCIA ESTADÍSTICA
PRUEBAS DE HIPÓTESIS

Rechazar o No Rechazar la Hipótesis Nula


Hipótesis nula: es la única declaración que se prueba con los datos
DATOS
Inconsistentes con Ho
Consistentes con Ho

Rechazamos Ho y aceptamos la Ha
No la rechazamos
“Ha es soportada por los datos”
“No se puede decir que se acepta”

INFERENCIA ESTADÍSTICA
PRUEBAS DE HIPÓTESIS

Reglas para establecer la hipótesis estadística

El indicador de igualdad debe aparecer en la hipótesis nula ,  o 


Ho:  = 50 Ha:   50

La conclusión a la que se desea o espera llegar como resultado de la prueba generalmente se usa
como hipótesis alternativa

La hipótesis nula debe contener una proposición de igualdad

La hipótesis nula es la que debe ser comprobada

Las hipótesis nula y alternativa son complementarias


16/12/2024

INFERENCIA ESTADÍSTICA
PRUEBAS DE HIPÓTESIS
La estadística de prueba es una cantidad calculada desde los datos que es
Estadística de Prueba usada para evaluar cuan compatible son los datos con el resultado
esperado bajo la hipótesis nula.

La distribución nula

La distribución nula es la distribución de muestreo de resultados para una estadística de


prueba bajo el supuesto de que la hipótesis nula es verdadera.

Cuantificando la incertidumbre: Valor de p (p-value)

Calculamos el valor de probabilidad para la estadística de prueba desde la distribución nula.-

INFERENCIA ESTADÍSTICA
PRUEBAS DE HIPÓTESIS

Cuantificando la incertidumbre: Valor de p (p-value)


Calculamos el valor de probabilidad para la estadística de prueba desde la distribución
nula.
Ho:  = 50
Ha:   50
16/12/2024

INFERENCIA ESTADÍSTICA
PRUEBAS DE HIPÓTESIS

Significancia estadística
Que hacemos con el p-value?
Como decidimos si el valor de p es grande o pequeño ?

Convección en biología Limite entre P-value peq o no peq = 0,05

Rechazo Ho No se puede rechazar Ho

INFERENCIA ESTADÍSTICA
PRUEBAS DE HIPÓTESIS
Conclusión
Suponga
Ho:  = 50
Ha:   50

Resultado 1.

Probabilidad del estadístico de Prueba cae en la región de No Rechazo.

Interpretación: los datos no son consistentes para apoyar la Ha, o No se puede rechazar la Ho

Resultado 2.

Probabilidad del estadístico de prueba cae en la Región de rechazo.

Interpretación: los datos son consistentes con la Ho. Se rechaza la Ho.


16/12/2024

INFERENCIA ESTADÍSTICA
PRUEBAS DE HIPÓTESIS

Prueba de Hipótesis

¿Por qué no puedo decir que acepto Ho?


Realidad
Decisión Ho cierta Ho falsa
 = 0,01
Rechazar Ho Error tipo I Correcto Disminuye
No rechazar Ho Correcto Error tipo II 

INFERENCIA ESTADÍSTICA

Parámetro que Características de los INTERVALO DE CONFIANZA PRUEBA DE HIPÓTESIS


se quiere estimar datos estimador ± (coeficiente de confiabilidad) x
(error estándar)
Media de una La distribución de la El coeficiente de confiabilidad es Z Dos colas
población variable en la población es Ho:  = valor X
normal. Ha:   valor X,
La varianza poblacional es Estadístico de Prueba Z
conocida
16/12/2024

INFERENCIA ESTADÍSTICA

Parámetro que Características de los INTERVALO DE CONFIANZA PRUEBA DE HIPÓTESIS


se quiere estimar datos estimador ± (coeficiente de confiabilidad) x
(error estándar)
Media de una La distribución de la El coeficiente de confiabilidad es t, Dos colas
población variable en la población es Ho:  = valor X
normal. Ha:   valor X,
La varianza poblacional es Estadístico de Prueba t
Desconocida
Si la muestra es peq. Pq con muestra grande
podría aproximar a Z

INFERENCIA ESTADÍSTICA
Parámetro que Características de los PRUEBA DE HIPÓTESIS
se quiere estimar datos
Media de dos La distribución de las Dos colas
poblaciones variables en las Ho: 1 - 2 = 0
poblaciones normal. Ha: 1 - 2  0
Las varianzas poblacional Estadístico de Prueba t,
son Desconocidas
Caso 1: Muestras Independientes
Se supone Varianzas Iguales
Aquí se asume que las Varianzas poblacionales son Iguales y se usa la
varianza pool
Se hace una estimación conjunta de la varianza

Se calcula el error estándar con la varianza pool


16/12/2024

INFERENCIA ESTADÍSTICA

Parámetro que se quiere Características de los datos PRUEBA DE HIPÓTESIS


estimar
Media de dos poblaciones La distribución de las Dos colas
variables en las Ho: d = 0
poblaciones normal. Ha: Ha: d  0
Las varianzas poblacional Estadístico de Prueba t,
son Desconocidas
Caso 2: Muestras Pareadas
Se calcula diferencia dato a dato y luego se calcula una
media de las diferencias, igual se calcula el error
estándar

INFERENCIA ESTADÍSTICA
Parámetro que Características de los Objetivo PRUEBA DE HIPÓTESIS
se quiere estimar datos
Pruebas Chi- Datos de frecuencia o Prueba de Bondad de Ho: La variable x sigue una dist z
Cuadrado conteos Ajuste H1: La variable x no sigue dist. Z
Evaluar si los datos de Estadístico de prueba:
una muestra son
compatibles con cierta
distribución (Normal,
Poisso)
16/12/2024

Parámetro que Características de los Objetivo PRUEBA DE HIPÓTESIS


se quiere estimar datos
Pruebas Chi- Datos de frecuenci o Prueba de Ho: La variable criterio 1 y la variable criterio 2 son
Cuadrado conteos Independencia independiente.

Evaluar si dos variables Ha: La variable criterio 1 y la variable criterio 2 no


están relacionadas son independientes.

Estadístico de prueba:

También podría gustarte