E INFERENCIAL
Parte de la estadística que comprende los métodos y procedimientos para deducir
propiedades de una población a partir de una pequeña parte de la misma.
Concepto
La inferencia estadística o estadística inferencial es una parte de la Estadística que
comprende los métodos y procedimientos para deducir propiedades (hacer
inferencias) de una población, a partir de una pequeña parte de la misma (muestra).
También permite comparar muestras de diferentes poblaciones.
Generalmente comprende las pruebas de estimación, puntual o por intervalos de
confianza, y las pruebas de hipótesis, paramétricas, como la de la media, diferencias
de medias, proporciones, etc., y las no paramétricas, como la prueba de chi-cuadrado.
En la Estadística también se realizán análisis de correlación y regresión, series
cronológicas, análisis de variaza, etc.
Planteamiento del problema
Suele iniciarse con una fijación de objetivos o algunas preguntas como ¿cuál será la
media de esta población respecto a tal característica?, ¿se parecen estas dos
poblaciones?, ¿hay alguna relación entre...?
En el planteamiento se definen con precisión la población, la característica a estudiar,
las variables, etcétera.
Se analizan también en este punto los medios de los que se dispone y el
procedimiento a seguir.
Elaboración de un modelo
Se establece un modelo teórico de comportamiento de la variable de estudio. En
ocasiones no es posible diseñar el modelo hasta realizar un estudio previo. Los
posibles modelos son distribuciones de probabilidad.
Extracción de la muestra
Se usa alguna técnica de muestreo o un diseño experimental para obtener
información de una pequeña parte de la población.
Tratamiento de los datos
En esta fase se eliminan posibles errores, se depura la muestra, se tabulan los datos
y se calculan los valores que serán necesarios en pasos posteriores, como la media
muestral, la varianza muestral, etc. Los métodos de esta etapa están definidos por la
Estadística Descriptiva.
Estimación de los parámetros
Con determinadas técnicas se realiza una predicción sobre cuáles podrían ser los
parámetros de la población.
Contraste de hipótesis
Los contrastes de hipótesis son técnicas que permiten simplificar el modelo
matemático bajo análisis. Frecuentemente el contraste de hipótesis recurre al uso de
estadísticos muestrales.
Conclusiones
Se critica el modelo y se hace un balance. Las conclusiones obtenidas en este punto
pueden servir para tomar decisiones o hacer predicciones.
El estudio puede comenzar de nuevo a partir de este momento, en un proceso cíclico
que permite conocer cada vez mejor la población y características de estudio.
La Es tad ís tica in feren cial o In feren cia es tad ís tica es tudia
cómo s acar conclus iones generales para toda la población a partir
del es tudio de una mues tra, y el grado de fiabilid ad o
s ignificación de los res ultados obtenidos .
Muestreo probabilístico
Cons is te en elegir una mues tra de una población al azar.
P odemos dis tinguir varios tip os d e mu es treo :
Muestreo aleatorio simple
P ara obtener una mues tra, s e numeran los elementos de la
población y s e s eleccionan al azar los n elementos que contiene
la mues tra.
Muestreo aleatorio sistemático
S e elige un individuo al azar y a partir de él, a intervalos
cons tantes , se eligen los demás has ta completar la mues tra.
P or ejemplo s i tenemos una población formada por 100
elementos y queremos extraer una mues tra de 25 elementos , en
primer lugar debemos es tablecer el intervalo de s elección que
s erá igual a 100/25 = 4. A continuación elegimos el elemen to de
arranque, tomando aleator iam ente un número entre el 1 y el 4, y a
partir de él obtenemos los res tantes elementos de la mues tra.
2, 6, 10, 14,..., 98
Muestreo aleatorio estratificado
S e divide la población en clas es o es tratos y s e es coge,
aleatoria mente, un número de individuos de cada es trato
proporcional al número de componentes de cada es trato.
En una fábrica que cons ta de 600 trabajador es queremos
tomar una mues tra de 20. S abemos que hay 200 trabajadores en la
s ección A, 150 en la B, 150 en la C y 100 en la D.
Un mues treo puede hacers e con o s in repos ición, y la
población de partida puede s er infinita o finita.
En tod o n u es tro es tud io vamos a limitarn os a u n a
p ob lación d e p artid a in fin ita o a mu es treo con rep os ición .
S i cons ideremos todas las pos ibles mues tras de tamaño n en
una población, para cada mues tra podemos calcular
un es tad ís tico (med ia, d es viación típ ica, p rop orción , ...) que
variará de una a otra.
As í obtenemos una dis tribución del es tadís tico que s e
llama d is trib u ción mu es tral .
Teorema central del límite
S i una población tiene media μ y des viación típica σ, y
tomamos mues tras de tamaño n (n> 30, ó cualquier tamaño s i la
población es "normal"), las medias de es tas mues tras s iguen
aproximadamen te la dis tribución:
Estimación de parámetros
Es el procedimi ento utili zado para conocer las
caracterís t icas de un parámetro poblacional, a partir del
conocimiento de la mues tra.
Con una mues tra aleatoria, de tamaño n, podemos efectuar
una es timación de un valor de un parámetro de la población; pero
también neces itamos precis ar un:
Intervalo de confianza
S e llama as í a un intervalo en el que s abemos que es tá un
parámetro, con un nivel de confianza es pecífico.
Nivel de confianza
P robabilidad de que el parámetro a es timar s e encuentre en
el intervalo de confianza.
El n ivel d e con fian za (p ) s e des igna mediante 1 − α .
Error de estimación admisible
Que es tará relacion ado con el radio del intervalo de
confianza.
Estimación de la media de una población
El in tervalo d e con fian za , para la media de una población,
con un n ivel d e con fian za d e 1 − α , s iendo x la media de una
mues tra de tamaño n y σ la des viación típica de la población, es :
El error máximo d e es timación es :
Cuanto mayor sea el tamañ o de la mues tra, n, men or es el
error .
Cuanto mayor sea el n ivel d e con fian za , 1-α , mayor es el
error .
Tamañ o d e la mu es tra
S i au men tamos el n ivel d e con fian za , au men ta el tamañ o
d e la mu es tra .
S i d is minu imos el error , tenemos que au men tar el tamañ o
d e la mu es tra .
El tiempo que tardan las cajeras de un s upermercado en
cobrar a los clientes s igue una ley normal con media des conocida
y des viación típica 0,5 minutos . P ara una mues tra aleator ia de 25
clientes s e obtuvo un tiempo medio de 5,2 minutos .
1. Calcula el intervalo de confianza al nivel del 95% para el
tiempo medio que s e tarda en cobrar a los clientes .
2. Indica el tamaño mues tral neces ario para es timar dicho
tiempo medio con un el error de ± 0,5 minutos y un nivel de
confianza del 95%.
n ≥ 4
Estimación de una proporción
S i en una p ob lación , una determinada caracterís ti ca s e
pres enta en una proporción p , la proporción p ' , de individuos
con dicha caracterís t ica en las mu es tras de tamaño n, s e
dis tribuirán s egún:
In tervalo d e con fian za p ara u n a p rop orción
El error máximo d e es timación es :
En una fábrica de componentes electrónicos , la proporción
de componentes finales defectuos os era del 20%. Tras una s erie
de operaciones e invers iones des tinadas a mejorar el rendimiento
s e analizó una mues tra aleatori a de 500 componentes ,
encontrándos e que 90 de ellos eran defectuos os . ¿Q ué nivel de
confianza debe adoptars e para aceptar que el rendimiento no ha
sufrido variaciones ?
p = 0.2 q = 1 - p = 0.8 p' = 90/ 500 = 0.18
E = 0.2 - 0.18 = 0.02
P (1 - z α / 2 < 1.12) = 0.86861 - 0.8686 = 0.1314
0.8686 - 0.1314 = 0.737
N ivel d e con fian za: 73.72%
Contraste de hipótesis
Hipótesis estadísticas
Un tes t es tad ís tico es un procedimien to para, a partir de una
mues tra aleatoria y s ignificativa, extraer con clu s ion es que
permitan acep tar o rech azar un a h ip ótes is previamen te emitid a
sobre el valor de un parámetro des conocido de una población.
La hipótes is emitida s e des igna por H 0 y s e llama hipótes is
nula .
La hipótes is contraria s e des igna por H 1 y s e llama hipótes is
alternativ a .
Contrastes de hipótesis
1. Enu n ciar la h ip ótes is nu la H 0 y la altern ativa H 1 .
Bilateral H0=k H1 ≠ k
H0≥ k H1 < k
Unilateral
H0 ≤k H1> k
2. A p artir d e u n n ivel d e con fian za 1 − α o el d e
s ign ificación α . D eterminar:
El valor z α / 2 (b ilaterales ), o b ien z α (un ilateral es )
La zon a d e acep tación d el parámetro mu es tral (x o p ' ).
3. Calcu lar: x o p ', a p artir d e la mu es tra.
4. S i el valor d el p arámetro mu es tral es tá d en tro d e la
zon a d e la acep tación , s e acep ta la h ip ótes is con un n ivel d e
s ign ificación α. S i n o, s e rech aza .
Contraste bilateral
S e pres enta cuando la hipótes is nula es del tipo H 0 : μ = k (o
bien H 0 : p = k ) y la hipótes is alternat iva, por tanto, es del
tipo H 1 : μ≠ k (o bien H 1 : p ≠ k ).
El n ivel d e s ign ificación α s e con cen tra en d os partes (o
colas ) s imétricas res p ecto d e la med ia.
La región d e acep tación en es te cas o no es más que el
corres pondiente intervalo de probabilidad para x o p' , es decir:
o bien:
S e s abe que la des viación típica de las notas de cierto
examen de M atemáti cas es 2,4. P ara una mues tra de 36
es tudiantes s e obtuvo una nota media de 5,6. ¿S irven es tos datos
para confirmar la hipótes is de que la nota media del examen fue
de 6, con un nivel de confianza del 95%?
1. Enunciamos las hipótes is nula y alterna tiva :
H 0 : μ = 6 La nota media no ha variado.
H 1 : μ ≠ 6 La nota media ha variado.
2. Zona de aceptación
P ara α = 0.05 , le corres ponde un valor crítico : z α / 2 = 1.96 .
D eterminamos el intervalo de confianza para la media:
(6-1,96 · 0,4 ; 6+1,96 · 0,4) = (5,22 ; 6,78)
3. V erificación.
V alor obtenido de la media de la mues tra: 5,6 .
4. D ecis ión
A cep tamos la h ip ótes is n u la H 0 , con un nivel de
s ignificación del 5%.
Contraste unilateral
Cas o 1
La h ip ótes is n u la es del tipo H 0 : μ ≥ k (o bien H 0 : p ≥ k ).
La h ip ótes is altern ativa , por tanto, es del tipo H 1 : μ < k (o
bien H 1 : p < k ).
Valores críticos
1−α α z α
0.90 0.10 1.28
0.95 0.05 1.645
0.99 0.01 2.33
El nivel de s ignificación α s e concentra en una parte o cola.
La región de aceptac ión en es te cas o s erá:
o bien:
Un s ociólogo ha pronos ticado, que en una determinada
ciudad, el nivel de abs tención en las próximas elecciones s erá del
40% como mínimo. S e elige al azar una mues tra aleator ia de 200
individuos , con derecho a voto, 75 de los cuales es tarían
dis pues tos a votar. Determinar con un nivel de s ignificac ión del
1%, s i s e puede admitir el pronós tico.
1. Enunciamos las hipótes is nula y alterna tiva :
H 0 : μ ≥ 0.40 La abs tención s erá como mínimo del 40%.
H 1 : μ < 0.40 La abs tención s erá como máximo del 40%;
2. Zona de aceptación
P ara α = 0.01 , le corres ponde un valor crítico : z α = 2.33 .
D eterminamos el intervalo de confianza para la media:
3. V erificación.
4. D ecis ión
A cep tamos la h ip ótes is n u la H 0 . P odemos afirmar, con un
nivel de s ignificación del 1%, que la La abs tención s erá como
mínimo del 40%.
Cas o 2
La hipótes is nula es del tipo H 0 : μ ≤ k (o bien H 0 : p ≤ k ).
La hipótes is alternat iva, por tanto, es del tipo H 1 : μ > k (o
bien H 1 : p > k ).
El nivel de s ignificación α s e concentra en la otra parte o
cola.
La región de aceptac ión en es te cas o s erá:
o bien:
Un informe indica que el precio medio del billete de avión
entre Canarias y M adrid es , como máximo, de 120 € con una
des viación típica de 40 €. S e toma una mues tra de 100 viajeros y
s e obtiene que la media de los precios de s us billet es es de 128
€.
¿S e puede aceptar, con un nivel de s ignificac ión igual a 0,1,
la afirmac ión de partida?
1. Enunciamos las hipótes is nula y alterna tiva :
H 0 : μ ≤ 120
H 1 : μ > 120
2. Zona de aceptación
P ara α = 0.1 , le corres ponde un valor crítico : z α = 1.28 .
D eterminamos el intervalo de confianza:
3. V erificación.
V alor obtenido de la media de la mues tra: 128 € .
4. D ecis ión
No acep tamos la h ip ótes is n u la H 0 . Con un nivel de
s ignificación del 10%.
Errores de tipo I y tipo II
Error d e tip o I . S e comete cuando la h ip ótes is nu la es
verd ad era y, como cons ecuencia del contras te, s e rech aza .
Error d e tip o II . S e comete cuando la h ip ótes is n u la es
fals a y, como cons ecuencia del contras te s e acep ta .
H0 Verdadera Falsa
Aceptar Decisón correcta Decisión incorrecta:
Probabilidad = 1 − α ERROR DE TIPO II
ERROR DE TIPO I
Rechazar D ecis ión correcta
Probabilidad = α
La p rob ab ilid ad de cometer Error d e tip o I es el n ivel d e
s ign ificación α .
La probabilidad de cometer Error d e tip o II depende del
verdadero valor del parámetro. S e hace tan to men or cu an to
mayor s ea n .
Tema
Estadística
Estadíst. descriptiva
Estad. bidimensional
Estadística inferencial
Contraste bilateral
Contrastes hipótesis
Contraste unilateral
Errores
Estimación
Estimación media
Muestreo
Muest. estratificado
Muestreo simple
Muestreo sistemático
Nivel confianza
Teo. central límite
Valores críticos
Sitio
Inicio
Aritmética
Álgebra
Geometría
Cálculo
Estadística
Trigonometría
Enlaces
Ejercicios I
Ejercicios II