ESTADÍSTICA INFERENCIAL 1
Introducción.
En muchas investigaciones se está interesado en estudiar una o más poblaciones, las cuales
pueden ser caracterizadas por algunos parámetros, es por ello que en múltiples estudios
estadísticos se centra la atención sobre dichos parámetros.
Por ejemplo, supongamos que se desea conocer el ingreso $$ promedio de los habitantes del
Municipio Moroleón del Estado Guanajuato, en dicho caso el parámetro es la media
poblacional μ.
Obtener el valor del parámetro en general es difícil, porque para ello sería necesario tener toda la
información de la población, por ejemplo, el valor de μ puede ser calculado si contamos con el
salario de todos los habitantes de la región en estudio, pero evidentemente eso no es posible, bien
sea porque no disponemos del tiempo o del dinero necesario para recoger la información.
En tales situaciones se recomienda seleccionar una muestra aleatoria de dicha población y a
partir de esos datos calcular el simil de la muestra en la población, conocido como
estadístico, el cual nos da información sobre el valor del parámetro.
En nuestro ejemplo, seleccionamos una muestra aleatoria de trabajadores de la región en estudio,
a quienes se les tomaría el sueldo mensual, y a partir de dichos datos se calcula la media muestral,
el cual como veremos es el mejor estadístico para estimar la media poblacional μ. Este
procedimiento se conoce como Inferencia Estadística.
EL OBJETIVO básico de la inferencia estadística es hacer inferencias o sacar conclusiones sobre
la población a partir de la información contenida en una muestra aleatoria de la población.
Las inferencias sobre el valor de un parámetro poblacional se pueden obtener básicamente de dos
maneras: a partir de estimación o bien a partir de la prueba de hipótesis.
En la estimación, basta seleccionar un estadístico muestral cuyo valor se utilizará como estimador
del valor del parámetro poblacional.
En la prueba de hipótesis, se hace una hipótesis sobre el valor del parámetro y se utiliza la
información proporcionada por la muestra para decidir si la hipótesis se acepta o no.
Página 1
ESTADÍSTICA INFERENCIAL 1
2.1 Conceptos básicos.
1. DEFINICIONES E IDEAS PREVIAS
En el ámbito científico, la estadística, en general, y la estadística inferencial, en particular, es el
camino que hay que recorrer para llegar de una pregunta a la respuesta adecuada. Así, la
estadística no es más que un argumento para defender nuestras ideas.
¿Cuándo es necesaria la estadística inferencial?
Cuando queremos hacer alguna afirmación
sobre más elementos de los que vamos a medir.
La estadística inferencial es la que permite dar ese salto de los resultados obtenidos para un grupo
a la totalidad.
Población: un conjunto de elementos que comparten al menos una característica bien
definida.
Muestra: es un subconjunto de elementos extraídos de una población.
Variable: Característica de los elementos de una población que puede tomar diversos
valores (al menos, dos).
Datos: Valores obtenidos al medir una variable en una muestra.
Estadístico: Es un valor numérico que expresa una característica de una muestra.
Formalmente, un estadístico es una función definida sobre una variable.
Parámetro: Es un valor numérico que expresa una característica de una población.
2. EL AZAR Y LA PROBABILIDAD
Resulta de aplicar la probabilidad a los estadísticos que ya conocemos por la estadística descriptiva.
Los resultados de esa aplicación vendrán expresados, en lenguaje probabilístico.
3. EL MUESTREO
Para extraer conclusiones de una población a partir de una muestra, es vital que la muestra sea
representativa.
Hay dos tipos de muestreo:
probabilístico (se conoce, o puede calcularse, la probabilidad de cada elemento, por tanto, de
cada muestra posible) y
no probabilístico (se desconoce o no interesa la probabilidad de cada elemento; el investigador
selecciona aquella muestra que considera más representativa o que le resulta más fácil).
Página 2
ESTADÍSTICA INFERENCIAL 1
4. TEORIA DEL MUESTREO
Uno de los propósitos es estimar las características poblacionales desconocidas, examinando la
información obtenida de una muestra, de una población.
5. Errores en el Muestreo
Cuando se utilizan valores muestrales, estadísticos o parámetros, pueden ocurrir dos tipos
generales de errores:
1. error muestral
se refiere a la variación natural existente entre muestras tomadas de la misma población. Cualquier
medida conlleva algún error.
Si se usa la media para medir, estimar, la media poblacional , entonces la media muestral, como
medida, conlleva algún error. Por ejemplo, supongamos que se ha obtenido una muestra aleatoria
de tamaño 25 de una población con media = 15: si la media de la muestra es x=12, entonces
a la diferencia observada x- = -3 se le denomina el error muestral.
Una media muestral x puede pensarse como la suma de dos cantidades, la media poblacional
y el error muestral; si e denota el error muestral, entonces: X = + e
2. errores no muestrales
Son los errores que surgen al tomar las muestras y no pueden clasificarse como errores muestrales.
a) sesgo de las muestras es un tipo de error no muestral puede suprimirse, o minimizarse,
usando la aleatorización.
b) La aleatorización se refiere a cualquier proceso de selección de una muestra de la población
en el que la selección es imparcial o no está sesgada; una muestra elegida con
procedimientos aleatorios se llama muestra aleatoria.
6. Media
La distribución muestral de la Media depende de varias circunstancias como la distribución de la
población de la que se extrae las muestras:
1) La población se distribuye según el modelo Normal. La distribución de Medias muestrales
sigue el modelo Normal, con parámetros y sigma donde sigma al cuadrado y n son la
Varianza de la distribución poblacional y el tamaño de la muestra respectivamente.
2) La población no sigue la distribución Normal. En este caso la distribución de Medias
muestrales se acerca al modelo Normal (con los mismos parámetros que hemos visto al
apartado a) cuanto mayor sea el tamaño de la muestra.
Página 3
ESTADÍSTICA INFERENCIAL 1
Algunas características de la distribución muestral de la Media
1) La variación de la distribución muestral es menor cuanto mayor sea n (tamaño de la muestra)
siempre que la Varianza de la población sea la misma.
Explicación: La fórmula de la Varianza de la distribución muestral de la Media es:
cuanto mayor es el denominador (n), más pequeño es el valor del término a la izquierda del "igual".
Ejemplo
A continuación se presenta las Varianzas y los Histogramas de tres distribuciones muestrales de la
Media (número de muestras=100) en que los tamaños de las muestras son n=25, n= 100 y n=1000.
n=25 n=100 n=1000
Varianza= 0.43 Varianza= 0.11 Varianza= 0.01
Los valores de la Varianza de la distribución de Medias muestrales son inferiores y la dispersión
observada en los Histogramas (ver en el eje horizontal que la amplitud de la variable disminuye)
cuanto mayor es n.
2) Cuando la distribución de Medias muestrales aproxima la distribución Normal, podemos
obtener probabilidades de las Medias muestrales.
Ejemplo
Si obtenemos una Media muestral igual a 6, y sabemos que la distribución muestral es Normal (5,2)
el 5 es la media y el 2 la Desviación Típica de la distribución muestral, la probabilidad de obtener
puntuaciones iguales o inferiores a 6 es
Página 4
ESTADÍSTICA INFERENCIAL 1
La probabilidad de obtener valores iguales o inferiores a 0.5 en una distribución Normal es 0.69
(consultar tablas o funciones de probabilidad de la distribución Normal).
7. Proporción
La distribución de p aproxima la distribución Normal con parámetros
si el producto np es mayor que 5.
Ejemplo
La distribución muestral de la proporción de "suspenso" en un muestreo aleatorio en que el número
de muestras es igual a 10,000 el tamaño de la muestra es igual a 20 y la probabilidad de obtener
"suspenso" es igual 0.3 es
A recordar
Muestra: Subconjunto de la población.
Distribución muestral: Distribución del estadístico obtenido en las muestras.
Parámetro: Característica de la población.
N: Tamaño de la población.
n: Tamaño de la muestra.
Página 5
ESTADÍSTICA INFERENCIAL 1
Diferenciación de los símbolos de la muestra, población y distribución muestral:
Página 6