TEMA 3: INFERENCIA EN UNA POBLACIÓN.
La inferencia consiste en generalizar a la población lo observado en la muestra.
Básicamente vamos a estimar la media de la población μ. Para ello es evidente que si tenemos
una muestra podemos utilizar la media de la muestra ( x ¿como estimador de la media de la
población.
La pregunta es: ¿Cómo es de buena esta estimación?
Este tema básicamente nos indica como calcular el error que podemos cometer al estimar μ
por x .
Para medir lo fiable que es la media muestral como estimulador de la media de la población,
podríamos considerar diversas muestras y calcular para cada una su media y preguntarnos si
son parecidos o no.
Muestra 1 X 1
¿ES X UNA BUENA ESTIMACIÓN DE μ?
Nota de Muestra 2
alumnos. σ : Desviación típica población.
Muestra 3 X 3
Por una propiedad matemática sabemos que el conjunto de las medias de las diferentes
σ
muestras sigue una distribución normal con media μ y con la desviación típica .
√n
Como no sabemos cuánto vale σ , podemos reemplazarla por s.
Podemos interpretar esta desviación típica como una medida del error que cometemos al
estimar μ por x . Por ello la llamamos: ERROR ESTANDAR O TÍPICO.
Cuanto más pequeño es el error típico mejor aproxima la media de la muestra a la media de la
población.
[ SE x=
S
√n ]
S
En la fórmula cuando la n es grande, como está en el denominador el error es pequeño,
√n
es decir, la estimación es buena.
Estimación por intervalos.
A partir de la propiedad matemática que nos dice que las medias muestrales siguen una
distribución normal, podemos construir un intervalo en el que probablemente se encuentre la
media de la población.
[ x−1.96
σ
√n
, x +1.96
σ
√n ]
La media de la población probablemente pertenece a este intervalo.
Este intervalo no se puede calcular directamente porque el valor de σ es desconocido. Si lo
reemplazamos por ‘s’ (desviación típica de la muestra), hemos de cambiar también el factor
1.96 por un valor que llamaremos ‘t’ para que se mantenga la propiedad de que la media de la
población probablemente está en el intervalo.
Al intervalo resultante de estas sustituciones lo llamamos: INTERVALO DE CONFIANZA.
Desviación típica
[ x−t
s
√n
, x+ t
s
√n ]
Media muestra Tamaño muestra
Para calcular el valor de la ‘t’, tenemos que establecer el nivel de confianza con el que
queremos trabajar, habitualmente será el 95% pero también podemos trabajar al 90% o al
99%. Cuánto mayor queramos que sea el nivel de confianza, más amplio saldrá el intervalo.
El intervalo de confianza nos da dos valores entre los que probablemente se encuentra la
media de la población μ . Tenemos la confianza de que μ está en el intervalo, pero no tenemos
la seguridad total. Si queremos una confianza muy alta el valor de ‘t’ saldrá grande y por lo
tanto el intervalo saldrá amplio.
Si nos conformamos con una confianza menor, el intervalo será más estrecho y por tanto más
útil.
Cuando el intervalo de confianza sale muy amplio, se puede deber a que la ‘s’ es grande, la ‘t’
es grande o la ‘n’ es pequeña. Por eso siempre recomendamos tomar la ‘n’ lo mayor posible.
Contrastes de hipótesis.
En la primera parte del tema hemos calculado un IC que nos dice aproximadamente el valor de
la media de la población μ. En esta segunda parte vamos a contestar a una pregunta concreta:
¿Vale la media, μ, un determinado valor? El contraste de hipótesis permite contestar sí o no a
esta pregunta.
En el ejemplo de la página 3 queremos saber si tras la aplicación de la nueva ley el promedio
de las condenas (de todas) es 50 o ha cambiado. ¿ μ=50 ?
Esta pregunta en lenguaje estadístico se expresa de la siguiente manera:
{ H 0=50 → Hipótesis nula
H 1 ≠ 50 → Hipótesis alternativa
Contraste bilateral o bidireccional.
¿ μ=50 ?
H1 H1
50
H0
Hay ocasiones en las que nos preguntamos si específicamente la media es mayor que un
determinado valor o menor que un determinado valor, a esto lo llamamos:
Contraste unilateral o unidireccional.
{ H 0=50
H 1 >50
H1
50
H0
1. Calcular el estadístico t s ¿Es grande?
[ t s=
x −μ 0
SE ]
2. Calculamos la probabilidad de obtener t s si H 0es cierta. P-VALOR.
- Si p-valor es menor que 0.05 RECHAZAMOS H 0
- Si p-valor es mayor o igual que 0.05 NOS LO CREEMOS.
El estadístico t s mide la distancia entre la media de la muestra, x , y el valor del contraste, μ0 ,
relativo al SE.
Si t ses grande indica que la media muestral es muy diferente de μ0 y rechazaríamos la
hipótesis nula.
Para determinar si t s es grande o pequeño se calcula un valor de probabilidad (p-valor), si es
menor que 0.05 indica que t s es grande y que rechazaríamos la hipótesis nula.
En la hoja 9 de los apuntes podemos ver que para hacer los ejercicios solo tenemos que aplicar
dos pasos:
1. Calcular t s .
2. Calcular el p-valor.
Si p-valor < 0.05 rechazamos Hipótesis nula, si no lo es la damos por buena.
La función del Excel para calcular el p-valor se llama: DISTR.T
Tenemos que especificar 3 parámetros:
1. El valor del estadístico t s
2. Grados de libertad= tamaño de la muestra n-1
3. Toma el valor 2 si el contraste es bilateral y toma el valor 1 si el contraste es
unilateral.
Para finalizar vamos a ver cómo realizar un contraste unilateral también llamado direccional o
de una cola.
En el ejemplo de la página 13 preguntan si la media de la población es menor que 80, nivel
normal de glucosa.
{ H 0=80
H 1 <80
El primer paso es comprobar la direccionalidad, esto sencillamente quiere decir que
comprobemos si la media de la muestra cumple H 1. Si la respuesta es:
- SÍ: Aplicamos los dos pasos del contraste de hipótesis de dos colas.
- NO: Finalizamos el test dando H 0 por buena.
EXCEL TEMA 3.
Para poder aplicar todos los pasos, los datos tienen que tener una distribución normal, por
tanto tenemos que comprobarlo representado un histograma que tendrá que tener la forma
de una campana de Gauss.
Problema 1.
Valor media del flujo respiratorio: 0.8
1. ¿Es o no un problema de inferencia? Sí, porque estamos buscando determinar que les
pasa a todos los que han estado en su misma situación, no solo los trabajadores.
2. Pregunta: ¿La media del flujo respiratorio de toda la población es menor que 0.8?
Sí No
Los trabajadores Los trabajadores
tienen razón no tienen razón
{ H 0 → μ=0.8
H 1 → μ<0.8
1. Comprobar direccionalidad.
Análisis de datos Estadística descriptiva Resumen estadística.
2. Calcular la t.
[ ]
x−μ 0 0.77−0.8
t= =
s 0.02
√n
3. Al calcular el p-valor, mediante DISTR.T (t, n-1 (grados de libertad), colas) ts ha de ser
positivo.
4. HISTOGRAMA DISTRIBUCIÓN NORMAL DE LOS DATOS. No.
Problema 2. Me pueden preguntar por la media y hago
intervalo de confianza.
Inferencia
Me pueden preguntar si la media podría ser o una que me han dado.
Donde puedo hacer contraste de hipótesis de una o dos colas.
Se trata de una pregunta de inferencia porque me pide la media de la población.
{ H 0 → μ=15
H 1 → μ ≠ 15
Es un contraste de hipótesis bidireccional, de dos colas.
¿Se podría hacer de otra forma?
Los contrastes de hipótesis de dos colas se pueden hacer con intervalo de confianza si la
media está dentro del intervalo.
{ H 0 → μ=0.8
H 1 → μ<0.8
1 COLA
{ H 0 → μ=0.8
H 1 → μ ≠ 0.8
2 COLAS