INFERENCIA
ESTADÍSTICA
(conceptos básicos)
ES UNA PARTE DE LA ESTADÍSTICA, QUE COMPRENDE UN
CONJUNTO DE MÉTODOS Y PROCEDIMIENTOS PARA DEDUCIR
DETERMINADOS VALORES (hacer inferencias) RESPECTO DE UNA
POBLACIÓN, A PARTIR DE UNA PEQUEÑA PARTE DE LA MISMA
(muestra aleatoria).
Por lo tanto…
“la razón de ser de la inferencia
estadística, en general, es la falta de
conocimientos sobre las características
estadísticas de la población”...
los temas más importantes asociados a la
“inferencia estadística” son:
“la estimación” y “la prueba de hipótesis”
de esas características poblacionales.
Recordando...
PARÁMETRO
Valor fijo que caracteriza estadísticamente a una población…
Son valores que permiten describir las características
estadísticas principales de la población …
En general SON DESCONOCIDOS…
El concepto primario de la Estadística inferencial, entonces
será estimar el valor de esos Parámetros, a través de
técnicas estadísticas que se denominan estimaciones:
puntuales o por intervalos.
CONCEPTOS BÁSICOS
ESTIMACIÓN (DE PARÁMETROS):
Aproximación estadística del valor de
parámetros poblacionales (generalmente
desconocidos) mediante el empleo de
estadísticas muestrales…
ESTIMACIÓN
PUNTUAL
ESTIMACIÓN PUNTUAL
Si a partir de las observaciones de una
muestra (como ya dijimos, debe ser
probabilística), se calcula un sólo valor como
estimación de un parámetro de la población
desconocido, el procedimiento se denomina
estimación puntual…
PROPIEDADES PRINCIPALES DE LOS ESTIMADORES…
Insesgamiento:
Un estimador es insesgado, si en la distribución muestral del estimador tiene un valor
esperado, que es igual al valor del parámetro que se desea estimar.
Consistencia :
Generalmente un estimador no entrega valores idénticos al valor del parámetro…
La variabilidad de todas las diferencias entre la estimación y el valor verdadero del
parámetro estimado define la "Varianza de Muestreo" y la raíz cuadrada de ésta se
denomina el "Error de Muestreo“…
La propiedad de Consistencia, indica que si aumentamos el tamaño de la muestra el
“Error de Muestreo” tiende a disminuir, teóricamente hasta adoptar valor cero si el tamaño
de la muestra es igual al de la población.
Eficiencia:
También llamado estimador "Insesgado de Varianza Mínima“, la cual establece que si
hay dos o más que son estimadores insesgados, es preferible aquel cuya Varianza de
Muestreo (o Error de Muestreo) es menor. Se dice que este último es más eficiente.
ESTIMACIÓN PUNTUAL …
Si a partir de las observaciones de una muestra (como ya dijimos, ésta debe ser probabilística), se calcula
un sólo valor como estimación de un parámetro de la población desconocido, el procedimiento se
denomina estimación puntual.
EJEMPLO:
Se desea estimar el sueldo medio de TODOS los egresados (al 1er año) de Cont.Auditores,
a nivel nacional, considerando datos muestrales (m.a.) de todas la Univ-País …
Entonces, “X”, será la variable aleatoria que indica los sueldos muestrales
obtenidos desde consulta a los egresados que han sido seleccionados
aleatoriamente…
El promedio muestral de esos sueldos, por ejemplo M$1.100.- por mes, será
entonces “un estimador puntual” del parámetro poblacional.
De la misma forma, la Varianza muestral (o D.E.), será un estimador de la
Varianza (o D.E.) poblacional… (alumnos deben plantear ejs.)
También , una determinada proporción muestral , será un estimador de esa misma
proporción en la corresp. Población estadística… (alumnos deben plantear ejs.)
ESTIMACIÓN POR INTERVALOS …
Dado que con las estimaciones puntuales, no hay certeza que el valor
muestral sea “igual” al valor poblacional, conviene contar con otras
alternativas de estimación a través de RANGOS DE VALORES …
Por lo tanto, la “Estimación por intervalos” es aquel tipo de
estimación que calcula un intervalo acotado por dos cantidades
numéricas que delimitan la inclusión del verdadero parámetro
poblacional…considerando un nivel de probabilidad dado.
Tales cantidades, son estadísticas calculadas a partir de la muestra
aleatoria que sirven como base para la estimación…considerando el
supuesto estadístico, en general, que la variable principal tenga una
distribución de prob.Normal.
INTERVALO DE CONFIANZA PARA LA MEDIA
POBLACIONAL (con varianza conocida)
Se tiene una población N(,) de la que se
desconoce y se desea estimar a partir de la media
obtenida de una muestra de tamaño n…
Para encontrar el intervalo de confianza, debemos
partir con “algo” visto anteriormente…,
Se sabe que la distribución muestral de medias
tiene una distribución de prob…
N ( , )
n
Intervalo de confianza para la media poblacional...
Primeramente fijaremos una determinada probabilidad de ocurrencia para
que el intervalo contenga al verdadero valor del parámetro…
A lo anterior, llamaremos NIVEL DE CONFIANZA, que es una medida
estadística probabilística del “grado de confiabilidad” para el intervalo
que encontraremos…
Por ej. Si definimos un “Nivel de confianza” del 95%, significa que si
tomamos 100 muestras, deberíamos esperar que en 95 de ellas el
intervalo encontrado contendrá al parámetro poblacional…
De otro modo…solo en 5 de esas muestras se generarán intervalos
erróneos…
Los niveles de confianza, más usados, desde una perspectiva práctica son: 90% - 95% - 99%
Intervalo de confianza para la media poblacional...
EL INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL, SERÁ:
(basado en la media muestral (estimador puntual) y varianza poblacional conocida)
__
__
( x zZ/ 2 , x zZ/ 2 )
n. n
NOTA: cuando se desconoce la varianza poblacional , de manera similar la fórmula anterior se ajusta con los valores de la
distribución t-student y la varianza (o DE) muestral …
TAMAÑOS DE MUESTRA...
La estimación del tamaño de la muestra "n" es un tema relevante para la
Inferencia estadística, tanto para estimar un determinado parámetro
poblacional o para la comprobación de hipótesis…
En el caso de estimación de parámetros, se puede relacionar con “la
precisión” requerida para la estimación del parámetro. Tal precisión se mide,
con lo que llamaremos el “error de estimación (E)”)…
Los pasos principales, entonces, para la determinación del tamaño de
muestra en el contexto de la estimación de parámetros son los siguientes:
a. Debe haber algún enunciado acerca de lo que se espera de la muestra.
Dicho enunciado generalmente se establece respecto a la precisión (error
de estimación, denominado también “E” deseado)…
b. Se debe encontrar alguna ecuación que relacione: el “n” buscado con la
precisión deseada (error de estimación ”E”)…
TAMAÑOS DE MUESTRA...
Dado lo anterior, y desarrollando corresp. ecuación finalmente obtenemos como fórmula general …
NOTA: cuando se desconoce la varianza poblacional , la fórmula anterior se ajusta con los valores de la distribución t-student y la
varianza (o DE) muestral…
Casos…
Suponga que los vuelos de una empresa de aviación
tienen una duración aprox, que se distribuye de forma
normal con una desviación estándar de 40 horas. Si en
muestras aleatorias de 30 vuelos, se tiene una duración
promedio de 780 horas; encuentre un intervalo de
confianza del 96% para la media de la población de
todos los vuelos de esta Cía.
casos...
En un estudio previo para investigar el costo de arrendar automóviles por
día en la RM , se encontró que el costo medio del arriendo diario de un
automóvil era aproximadamente 55 (mil pesos), y donde también se
obtuvo una dispersión (medida como DE) de $9.650. Suponga que la
organización que realizó dicho estudio necesita realizar un nuevo estudio,
con mayor profundidad, para estimar la media poblacional del arriendo por
día de automóviles en la RM. Antes de iniciar este nuevo estudio, se llegó
a un acuerdo respecto que la media poblacional del costo de arriendo por
día debe estimarse con un margen de error de 2 (mil pesos) y que se
desea, además, un nivel de 95% de confianza.
Encuentre el tamaño muestral necesario para llevar adelante dicho nuevo
estudio.
casos…
Suponga que se extrae una muestra aleatoria de 144 niños y adolescentes,
midiendo la variable Estatura (en cm) y presentando una media muestral
de 160 cm. Considere que dicha variable proviene de una población
normal con varianza de 100 cm2, respecto de lo cual se requieren los sgtes
cálculos estadísticos:
a) Un intervalo de confianza del 90% para la media poblacional.
b) Asumiendo que se quiere tener una confianza del 95% por ciento, que
su estimación se encuentre solo a una diferencia de 1,2 cm más o
menos de la verdadera media poblacional, ¿cuántas observaciones
adicionales deberían tomarse para que se cumpla esta condición?
casos…
La estatura de las personas (H y M) que pertenecen a una determinada empresa
con presencia en todas las regiones del País, proviene de una Población con
distrib. de prob.Normal cuya media es desconocida y que, por estudios anteriores,
se sabe que la varianza poblacional es de 25 cm2. Suponga que se ha tomado una
muestra aleatoria y, también considere (con un nivel de confianza del 95%), que se
ha construido un intervalo con amplitud de 2,45 cm…
a) Encuentre el tamaño de la muestra aleatoria ejecutada.
b) Determine los límites del I.C. encontrado, asumiendo que la muestra arrojó
una estatura media de 170 cm en la medición de los participantes.
Intervalo de confianza para la media poblacional...
Considerando se desconoce la Varianza poblacional …
De manera similar al anterior, pero en este caso usaremos la
D.E. muestral para estimar el valor de la D.E.poblacional…
Además, el valor de Z se reemplaza por el valor de una nueva
variable , denominada t- student ; que se obtiene de la tabla de
probabilidades dada a continuación ….
Tabla
t-student…
casos…
Suponga que se realizó un estudio para estimar el saldo medio en las tarjetas de crédito de
una cierta casa comercial, para la población de familias de adultos mayores de la RM. En la
tabla sgte se presentan los saldos en dichas tarjetas de crédito (en pesos) para una muestra
aleatoria de 70 familias.
a.- Encuentre una estimación puntual para, por lo menos, dos parámetros de la población.
b.- Encuentre una estimación del 95% y también otra del 99% de confianza para el saldo
medio (en pesos) de todas las familias de adultos mayores de la RM.
DISTRIBUCIÓN MUESTRAL DE PROPORCIONES
En varias ocasiones, también se plantea estimar una proporción (o porcentaje)...
Por ej. Proporción (o porcentaje) de arts defectuosos…,
Porcentaje de pers con teléfono celular …
Porcentaje (o proporción) de pers que piensan votar por un det candidadato …etc
En estos casos, la distribución muestral de proporciones es la que nos permitirá efectuar
esas estimaciones…
De la perspectiva metodológica, esto es similar a lo que se hizo anteriormente (con la
distribución muestral de la media); La diferencia que ahora nos interesará estimar,
naturalmente, las correspondientes proporciones poblacionales…
En esta situación, la variable aleatoria toma solamente dos valores diferentes (éxito o
fracaso), es decir, la variable principal sigue una distribución Binomial …
Para el caso que el tamaño de muestra sea lo suficientemente grande…esta distribución
Binomial (n, p), tal como hemos aprendido en temáticas anteriores, se aproxima también a
una distribución de probabilidad Normal …,
Continuación ...
•Al igual que la distribución muestral de medias…
•En este caso, para muestras de tamaño n>=30, la
distribución muestral de “las corresp.proporciones”
tambien sigue una distribución Normal,
pq
con las características…. N ( p, )
n
•donde p es la proporción de una de las variables principales
que se estudia para la población y q = 1 - p.
I.C. para PROPORCIONES...
De la misma forma que el procedimiento para encontrar I.C. para la media
poblacional…,
Cuando la proporción “p” de la población es desconocida, se aproxima
mediante el valor muestral (p´), más o menos un det. margen de error,
particularmente válido cuando la muestra es grande … (aseguramos
distrib.Normal)
Entonces para un nivel de confianza (1-), se tiene que el
I.C. para la “proporción poblacional” será :
p' q' p' q'
( p' z / 2 , p' z / 2 )
n n
TAMAÑOS DE MUESTRA... (cuando se trabajan proporciones)
z 2 . ´ ´
En la práctica, p´ se determina mediante alguno de los métodos siguientes:
1. Utilizar alguna proporción poblacional conocida o de una muestra previa de las mismas
unidades o de unidades similares.
2. Utilizar un estudio piloto y elegir una muestra preliminar. La proporción muestral de esta
muestra se usa como valor de p´.-
3. Si no aplica ninguna de las alternativas anteriores, emplear como valor para p ´ = 0,50.-
Casos …
Se selecciona una muestra aleatoria de 600 familias de
la RM, a quienes se les pregunta si tienen o no un
computador en casa. Suponga que contestaron
afirmativamente 240 familias. Se requiere la obtención
de un intervalo de confianza al nivel del 95% para la
proporción real de familias de la población analizada
que poseen un computador en casa.
Casos …
Un estudio realizado en las regiones que cuenta con mayor cantidad de alumnos de E.M. en
el País, encuestó, a través de muestreo aleatorio, a 900 alumnos(as) para conocer su opinión
acerca de algunos aspectos relevantes de la J.E.C. En dicho estudio se encontró que 396 de
ellos(as) estaban satisfechos, por ej., con los horarios de salida después de las 16:30 hrs.
Encuentre:
a) Un estimador puntual para la proporción poblacional de alumnos(as) satisfechos(as) con
los horarios de salida.
b) Un intervalo de confianza del 95%, también para esa proporción poblacional y su
correspondiente interpretación.
c) De qué tamaño debería ser una nueva muestra si se desea que, para la estimación de la
proporción poblacional, el margen de error sea sólo de un 2,5%. (use también para este
caso nivel de confianza de 95%)
I.C. para la DIFERENCIA DE MEDIAS (considerando 2 poblaciones con distrib.de prob.“normal”)
1er caso:
Poblaciones
independientes…
dado (z)
dado (z)
z
I.C. para la DIFERENCIA DE MEDIAS (considerando 2 poblaciones con distrib.de prob.“normal”)
1er caso:
Poblaciones dado
independientes…
(pero iguales)
donde …
I.C. para la DIFERENCIA DE MEDIAS (considerando 2 poblaciones con distrib.de prob.“normal”)
2do caso:
Poblaciones
dependientes…
(muestras pareadas)