Inferencia Estadística
1
Definiciones y conceptos
• Teorías de Muestras
Distribuciones muestrales
• Estimación de parámetros
Puntuales - Intervalos
• Tests de Hipótesis
Grandes muestras
Pequeñas muestras
Parámetro
Es una medida de resumen de una característica observada en la
población.
El promedio de edad de todos los egresados de universidades del
Paraguay en cierto periodo de años (µ)
La variabilidad de la edad de estos estudiantes egresados con
respecto a su media (2)
La proporción de mujeres egresadas en la población mencionada (P)
Notemos que µ, 2, P, son medidas de resúmenes de ciertas
características de interés de la población estudiada, son por lo tanto
parámetros
Estadístico
Es una medida de resumen de una característica observada en la
muestra.
Tomamos una muestra de 20 egresados de universidades de Paraguay
en el periodo de 2010 a 2013. De la muestra calculamos:
El promedio de edad de los egresados (𝑥)
La variabilidad de la edad de los egresados con respecto al promedio
(s2)
La proporción de mujeres que egresan (p)
Notemos que 𝑥, s2 y p son medidas calculadas con los datos de la
muestra, por lo tanto son estadísticos
Como los parámetros son generalmente desconocidos, el cálculo de los
estadísticos muestrales nos permite determinar estimaciones de los
verdaderos valores de las medidas poblaciones
Distribuciones muestrales
1. Distribución de la media muestral
Supongamos que tomamos varias muestras de una población, los
promedios para cada muestra no necesariamente serían iguales, y lo más
probable es que varíen de una muestra a otra.
Imaginemos que cada una de las muestras tomadas consta de 10 mujeres
de 25 años de edad residentes en todo el Paraguay. Al calcular la estatura
media y la desviación estándar correspondiente a cada una de estas
muestras, veríamos que la media (𝑥) y la desviación (s) de cada muestra
serían diferentes.
6
Si agrupamos las medias de cada muestra en un conjunto y
establecemos una distribución de probabilidades para ellas, formamos
una Distribución Muestral de Medias que tiene su propia media (µx) y su
desviación estándar (𝜎x)
7
De este último conjunto obtenemos la media y la desviación estándar y lo
simbolizaremos de la siguiente forma
𝜇𝑥 = media de la distribución muestral de medias
𝜎𝑥 = desviación estándar de la distribución muestral = error muestral
Convengamos que cuando trabajamos con muestras de tamaño mayor
a 30 o bien muestras de cualquier tamaño de una distribución normal, la
distribución muestral de medias tiende a una distribución normal con 𝜇
= 𝜇𝑥 y 𝜎 = 𝜎𝑥 , entonces la fórmula que utilizaremos para la
estandarización es:
𝜎 Si la población es infinita
𝜎𝑥 = (desconocida) o el muestreo
𝑥 − 𝜇𝑥 𝑥
𝑛 se realiza con reemplazo
𝑍= 𝜇𝑥 =
𝜎𝑥 𝑛
𝜎 𝑁−𝑛 Si la población es finita o el
𝜇𝑥 = 𝜇 𝜎𝑥 = . muestreo se realiza sin
𝑛 𝑁−1 reemplazo
Ejemplo 1:
Las estaturas de los estudiantes de colegios capitalinos se distribuye
aproximadamente en forma normal con una media de 170,5 cm y una desviación
estándar de 8,4 cm. Si se extraen muestras de tamaño 36, ¿cuál es la probabilidad
de que la estatura de los estudiantes esté por debajo de 167 cm?
Datos Cálculo Aux. 167 − 170,5
𝑧= = −2,5
𝜇𝑥 = 𝜇 1,4
𝜇 = 170,5
𝜎 = 8,4 𝜇𝑥 = 170,5
n = 36 𝜎
𝜎𝑥 =
x = 167 𝑛
8,4
𝑥 − 𝜇𝑥 𝜎𝑥 =
𝑍= 36
𝜎𝑥 𝑃 𝑥 < 167 = 0,5 − 0,4938
𝜎𝑥 = 1,4 𝑃 𝑥 < 167 = 0,0062
La probabilidad de que la estatura promedio sea menor que 167 cm es de 0,0062
Ejemplo 2:
Una facultad de la ciudad capital tiene 800 nuevos alumnos recién egresados de la Educación
Media. El Departamento Académico de la institución emitió un informe sobre la calificación promedio
de los estudiantes ingresantes en su último año de secundaria, donde se evidencia que la
calificación tiene una distribución aproximada normal con media de 3,5 y desviación estándar de 2,5.
Si tomamos una muestra de 40 alumnos, ¿cuál es la probabilidad de que el promedio de
calificaciones sea menor que 2,8?
Datos Cálculo Aux. 2,8 − 3,5
𝑧= = −1,82
0,385
𝜇 = 3,5 𝜇𝑥 = 𝜇
𝜎 = 2,5 𝜇𝑥 = 3,5
n = 40
N = 800 𝜎 𝑁−𝑛
𝜎𝑥 = .
x = 2,8 𝑛 𝑁−1
𝑥 − 𝜇𝑥 2,5 800 − 40
𝑍= 𝜎𝑥 = .
𝜎𝑥 40 800 − 1 𝑃 𝑥 < 2.8 = 0,5 − 0,4656
𝜎𝑥 = 0.385 𝑃 𝑥 < 2.8 = 0,0344
La probabilidad de que la calificación promedio sea menor a 2,8 es de 0,0344
2. Distribución muestral de proporciones
Existen ocasiones en que no estamos interesados en el promedio, sino
que queremos investigar la proporción de estudiantes que ingresaron a la
Universidad Nacional en su primer intento, o la proporción de estudiantes
aplazados de una ciudad en cierta materia, etc., para este tipo de variables
la distribución muestral de proporciones es la adecuada.
Esta distribución se genera de igual manera que la distribución muestral de
medias, a excepción de que al extraer las muestras, de cada una de ellas
se calcula el estadístico proporción (p)
número de observaciones de interés (éxito)
p x
n tamaño de la muestra 11
𝜇𝑝 = media de la distribución muestral de proporciones
𝜎𝑝 = desviación estándar de la distribución muestral = error muestral
Y para calcular la probabilidad del comportamiento de la proporción en
la muestra utilizaremos las siguientes fórmulas para estandarizar:
Si la población es infinita
𝑃(1 − 𝑃)
𝑝−𝑃 𝜇𝑝 = 𝑃 𝜎𝑝 =
𝑛
(desconocida) o el muestreo
se realiza con reemplazo
𝑍=
𝜎𝑝
Si la población es finita o el
𝑃(1 − 𝑃) 𝑁 − 𝑛 muestreo se realiza sin
𝜎𝑥 = .
𝑛 𝑁−1 reemplazo
Ejemplo 3:
Se ha determinado que el 75% de los estudiantes de la Universidad Nacional de
Asunción fuman cigarrillos frecuentemente. Si tomamos una muestra de 100
estudiantes, ¿cuál es la probabilidad de que la proporción de la muestra de gente
que fuma cigarrillos sea menor que 0,65?
Datos Cálculo Aux. 0.65 − 0.75
𝑧= = −2,31
0.0433
𝑃 = 0.75 𝑃(1 − 𝑃)
𝑝 = 0.65 𝜎𝑝 =
𝑛
n = 100
0.75(1 − 0.75)
𝑝−𝑃 𝜎𝑝 =
100
𝑍=
𝜎𝑝
𝜎𝑝 = 0.0433
𝑃 𝑝 < 0.65 = 0,5 − 0,4896
𝑃 𝑝 < 0.65 = 0,0104
La probabilidad de que la proporción de la muestra de gente que fuma sea menor
que 0,65 es 0.0104
Ejemplo 4:
Se sabe que la verdadera proporción de artículos defectuosos fabricados por una
empresa de modas es de 5%, sabiendo esto encuentre la probabilidad de que en
una muestra aleatoria de tamaño 70, tenga más del 2% pero menos del 6% de
artículos defectuosos.
Datos Cálculo Aux.
0.02 − 0.05
𝑃 = 0.05 𝑃(1 − 𝑃) 𝑧1 = = −1.15
𝜎𝑝 = 0.026
𝑝 = 0.02 y 0.06 𝑛
n = 70 0.06 − 0.05
𝑧2 = = 0.38
0.05(1 − 0.05) 0.026
𝑝−𝑃 𝜎𝑝 =
70
𝑍=
𝜎𝑝
𝜎𝑝 = 0.026
𝑃 0.02 < 𝑝 < 0.05 = 0.3749 + 0.1480
𝑃 0.02 < 𝑝 < 0.05 = 0.5229
La probabilidad de que la proporción de artículos defectuosos sea más de 2% pero menos
de 6% es de 0,5229
3. Distribución muestral de diferencias de
medias
Ahora supongamos que tenemos dos poblaciones distintas, cada una de
ellas con medias 𝜇1 y 𝜇2 , y desviaciones estándar 𝜎1 y 𝜎2 respectivamente.
De la primera población extraemos una muestra de tamaño 𝑛1 y calculamos
la media muestral x1 , de la segunda población tomamos una muestra de
tamaño 𝑛2 y también calculamos la media muestral x2.
Al conjunto de todas esas diferencias entre medias llamaremos
Distribución muestral de la diferencia de medias, donde el estadístico es
x1 x 2
16
𝑥1 - 𝑥2 = distribución muestral de la diferencia de medias
𝜇1 − 𝜇2 = diferencia de medias de la población
Y para calcular la probabilidad del comportamiento de la diferencia de
las medias en la muestra utilizaremos las siguientes fórmulas para
estandarizar:
(𝑥1 − 𝑥2 ) − (𝜇1 −𝜇2 ) 𝜎12 𝜎22
𝑍= 𝜎𝑥1 − 𝑥2 = +
𝜎𝑥1 − 𝑥2 𝑛1 𝑛2
Ejemplo 5:
La empresa A vende mensualmente insumos de oficina por un valor medio de $1.500
y una desviación típica de $200, mientras que las ventas de otra empresa B tienen un
valor medio de $1200 con una desviación típica de $110. Sí se toman al azar 120
ventas mensuales de cada empresa, ¿cuál es la probabilidad de que las ventas que
proceden de la empresa A tengan un valor medio que sea al menos de $ 250 más
que las de la empresa B?
Datos Cálculo Aux.
𝐴 = 𝑃𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 1 250 − (1500 − 1200)
𝜎12 𝜎22 𝑍= = −2.40
𝜇1 = 1500 𝑦 𝜎1 = 200 𝜎𝑥1− 𝑥2 = + 20.83
𝑛1 𝑛2
𝐵 = 𝑃𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 2
𝜇2 = 1200 𝑦 𝜎2 = 110
2002 1102
𝑛1 = 𝑛2 = 120 𝜎𝑥1− 𝑥2 = +
120 120
(𝒙𝟏 − 𝒙𝟐 ) − (𝝁𝟏 −𝝁𝟐 )
𝒁= 𝜎𝑥1 − 𝑥2 = 20.83
𝝈𝒙𝟏 − 𝒙𝟐
𝑃 𝑥1 − 𝑥2 > 250 = 0.5 + 0.4918
𝑃 𝑥1 − 𝑥2 > 250 = 0.9918
La probabilidad de que venta promedio de la empresa A supere en por lo menos
$ 250 a las ventas medias de la empresa B es de 0,9918
4. Distribución muestral de diferencias de
proporciones
Supongamos que tenemos dos poblaciones distintitas, cada una de ellas
con proporciones P1 y P2
De la primera población extraemos una muestra de tamaño n1 y calculamos
la proporción muestral p1, de la segunda población tomamos una muestra
de tamaño n2 y también calculamos la proporción muestral p2. Luego
calculamos la diferencia entre las proporciones muestrales p1 – p2 y se
repite la experiencia con todo par de muestras extraídas, donde una es de
la primera población y otra de la segunda.
El conjunto de todas esas diferencias entre proporciones halladas, forman
la Distribución muestral de la diferencia de proporciones, donde el
estadístico es p1-p2 20
𝑝1 - 𝑝2 = distribución muestral de la diferencia de proporciones
𝜇1 − 𝜇2 = diferencia de medias de la población
Y para calcular la probabilidad del comportamiento de la diferencia de
las proporciones en la muestra utilizaremos las siguientes fórmulas
para estandarizar:
(𝑝1 − 𝑝2 ) − (𝑃1 −𝑃2 )
𝑍=
𝜎𝑝1−𝑝2
𝑃1 (1 − 𝑃1 ) 𝑃2 (1 − 𝑃2 )
𝜎𝑝1−𝑝2 = +
𝑛1 𝑛2
Ejemplo 6:
Un laboratorio químico de Paraguay, ha descubierto ciertas substancias para reducir de
peso en poco tiempo para suplantar a los medicamentos ya existentes. La proporción de
personas en las cuales las substancias resultan efectivas, es 0.7, mientras que los
medicamentos existentes actualmente son efectivos al 60% . A una muestra aleatoria de
100 personas se les suministró la substancia nueva, mientras que el medicamento
antiguo fue utilizado en una muestra de 150.¿Cuál es la probabilidad de observar un
valor p1- p2 menor al 5%?
Datos Cálculo Aux.
𝑃𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 1 𝑃1 (1 − 𝑃1 ) 𝑃2 (1 − 𝑃2 )
𝑃1 = 0.7 𝑦 𝑛1 = 100 𝜎𝑝1−𝑝2 = +
𝑛1 𝑛2
𝑃𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 2
0.7(1 − 0.7) 0.6(1 − 0.6)
𝑃2 = 0.6 𝑦 𝑛2 = 150 𝜎𝑝1−𝑝2 = +
100 150
(𝑝1 − 𝑝2 ) − (𝑃1 −𝑃2 )
𝑍= 𝜎𝑝1−𝑝2 = 0.0608
𝜎𝑝1−𝑝2
0.05 − (0.7 − 0.6)
𝑍= = −0.82
0.0608
𝑃 𝑝1 − 𝑝2 < 0.05 = 0.5 − 0.2939
𝑃 𝑝1 − 𝑝2 < 0.05 = 0.2061
La probabilidad de p1 - p2 sea menor que 5% es de 0,2061