0% encontró este documento útil (0 votos)
78 vistas33 páginas

Tipos y Métodos de Muestreo Estadístico

Este documento trata sobre conceptos básicos de muestreo y estimación estadística. Explica la diferencia entre población y muestra, y cómo los parámetros de una población pueden estimarse a partir de estadísticos calculados en una muestra. También introduce distribuciones como la normal, binomial y χ2 que son útiles para realizar inferencias estadísticas sobre una población basadas en una muestra.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
78 vistas33 páginas

Tipos y Métodos de Muestreo Estadístico

Este documento trata sobre conceptos básicos de muestreo y estimación estadística. Explica la diferencia entre población y muestra, y cómo los parámetros de una población pueden estimarse a partir de estadísticos calculados en una muestra. También introduce distribuciones como la normal, binomial y χ2 que son útiles para realizar inferencias estadísticas sobre una población basadas en una muestra.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Tema 5

Muestreo
Población y muestra
Población
Conjunto de datos sobre el que queremos obtener
conclusiones.

Lo que nos gustaría estudiar

Muestra
Subconjunto de datos en el que hacemos las observaciones.
• Representativo
• Suficientemente grande

Encuesta electoral
Parámetros y estadísticos
Parámetros Estadísticos

Afecta a… Población Muestra

Valores constantes Valores calculados


Características
y desconocidos de una muestra

Media 𝜇 𝑥

Desviación típica 𝜎 𝑠

Proporción 𝑝 𝑝

Otros parámetros 𝜃 𝜃
Inferencia
Inferencia
Llegar a conclusiones sobre una población
a partir de datos de una muestra.
Es decir, estimar parámetros a partir de estadísticos.

Conclusiones inciertas
Al basarnos en una muestra de los datos, no vamos a estar
nunca seguros al 100% de lo que pasa en la población.
Siempre vamos a concluir en términos de la probabilidad
de que un parámetro esté en un intervalo.
Ejercicio
Queremos ver qué va a pasar en las próximas elecciones.
Por ello, realizamos una encuesta a varias personas.
El 30% de ellas nos dice que va a votar a un partido.
¿Podemos concluir que el día de las elecciones
ese partido se llevará el 30% de los votos?
Ejercicio
Queremos ver qué va a pasar en las próximas elecciones.
Por ello, realizamos una encuesta a varias personas.
El 30% de ellas nos dice que va a votar a un partido.
¿Podemos concluir que el día de las elecciones
ese partido se llevará el 30% de los votos?

25% 30% 35%

⋯ 95% ⋯
Estamos seguros al 95% de que la gente que le votará
estará entre un 25% y un 35%
Cuanta más grande sea la muestra, menor la incertidumbre.
Muestra aleatoria
Aleatoriedad
Antes de tomar la muestra, cada uno de
los elementos muestrales es de carácter aleatorio.
Cada observación 𝑥𝑖 es una variable aleatoria
que sigue la misma distribución que la población.
Todas las muestras son independientes entre sí.

Consideración ex post
Una vez extraída la muestra, ya tendrá unos valores
concretos, por lo que ya no tendrá un carácter aleatorio.
Muestreo Aleatorio Simple (MAS)
Aleatoriedad
Se eligen los individuos de la muestra de forma que
todos los individuos de la población tienen
la misma probabilidad de ser seleccionados.
Se puede elegir la muestra por ordenador.

Dificultades
Normalmente no es fácil llevarlo a cabo.
En general, supondremos que la muestra ha sido elegida
usando MAS, aunque en realidad se haya usado otra.
Otros tipos de muestreo
Tipos de muestreo
• Muestreo aleatorio simple: todos los individuos tienen la
misma probabilidad de ser elegidos.
• Muestreo sistemático: tomamos la muestra preguntando
a uno de cada 𝑘 individuos.
• Muestreo por conglomerados: estudiamos sólo una
parte de la población si creemos que representa al total.
• Muestreo estratificado: dividimos la población en grupos
(sexo, regiones, edad…) con diferentes tamaños.
 La muestra puede ser proporcional al tamaño de cada
grupo o podemos estudiar cada grupo por separado.
Posibles sesgos
• Sesgo de oportunidad: elegir a las primeras personas que
podamos o a los que se ofrezcan voluntarios.
• Sesgo de no-respuesta: la encuesta pierde su poder de
predicción si el porcentaje de no repuesta es alto.
• Sesgo del entrevistador: la presencia del entrevistador
puede alterar las respuestas. También si reacciona a las
respuestas o si tiene que explicar las preguntas.
• Sesgo de conformidad (decir sí a todo), de características
impostadas (por participar en un estudio), de valores
extremos (en una escala de 1 a 5, responder siempre
unos y cincos), de apoyo (a la organización que realiza la
encuesta), de contexto (si se realiza en grupo), …
Estadísticos
Media muestral
𝑛
𝑖=1 𝑥𝑖
𝑥=
𝑛

Cuasi-varianza y cuasi-desviación típica


𝑛 2
𝑖=1𝑥𝑖 − 𝑥
𝑠𝑥 2 = 𝑠𝑥 = 𝑠𝑥 2
𝑛−1
Se divide entre 𝑛 − 1 en vez de 𝑛

Los estadísticos también son variables aleatorias


(no sabemos cuánto valdrá 𝑥 antes de tomar la muestra).
Ejemplo
Tenemos una urna con 4 bolas, cada una con un número.

3 7

11 15

Nosotros desconocemos el contenido de la urna.


Tomamos muestras de dos bolas con remplazamiento.

Primera muestra:
3 11 Media: 7 Varianza: 16
Segunda muestra:
3 7 Media: 5 Varianza: 4
Ejemplo
Escribimos en una tabla todos los posibles resultados
de la muestra de 2 bolas con reemplazamiento:

Muestra Media Varianza Muestra Media Varianza


(3,3) 3 0 (11,3) 7 16
(3,7) 5 4 (11,7) 9 4
(3,11) 7 16 (11,11) 11 0
(3,15) 9 36 (11,15) 13 4
(7,3) 5 4 (15,3) 9 36
(7,7) 7 0 (15,7) 11 16
(7,11) 9 4 (15,11) 13 4
(7,15) 11 16 (15,15) 15 0
Ejemplo
Observamos que los valores de la media muestral son:
3, 5, 7, 9, 5, 7, 9, 11, 7, 9, 11, 13, 9, 11, 13, 15

La variable aleatoria media muestral


sigue una distribución normal.
Estimación de la media muestral
Población
Si la población sigue una distribución normal:
𝑋~𝑁 𝜇, 𝜎 2

Muestra
Cada elemento de la muestra 𝑥𝑖 sigue
la misma distribución que la población:
𝑥𝑖 ~𝑁 𝜇, 𝜎 2
La media muestral será:
𝑛
𝑖=1 𝑥𝑖
𝑥=
𝑛
Estimación de la media muestral
𝑥𝑖 ~𝑁 𝜇, 𝜎 2
Esperanza
𝑛 𝑛
𝑖=1 𝑥𝑖 1 1
𝐸 𝑥 =𝐸 = ∙𝐸 𝑥𝑖 = ∙ 𝑛 ∙ 𝜇 = 𝜇
𝑛 𝑛 𝑛
𝑖=1

Varianza
𝑛 𝑛 2
𝑖=1 𝑥𝑖 1 1 𝜎
𝑉 𝑥 =𝑉 = 2∙𝑉 𝑥𝑖 = 2 ∙ 𝑛 ∙ 𝜎 2 =
𝑛 𝑛 𝑛 𝑛
𝑖=1

𝑉 𝑘 ∙ 𝑋 = 𝑘 2 ∙ 𝑉[𝑋]
Estimación de la media muestral

Conclusión
𝜎2
Si 𝑋~𝑁 𝜇, 𝜎 2 ⟹ 𝑥 ~𝑁 𝜇,
𝑛

𝑥−𝜇
~𝑁 0, 1
𝜎2
𝑛
Estimación de la proporción muestral
Población
La proporción 𝑝 de los datos cumple cierto hecho.

Muestra
Cada elemento de la muestra 𝑝𝑖 sigue
una distribución de Bernoulli con probabilidad 𝑝.
𝑝𝑖 ~𝐵𝑒𝑟𝑛𝑜𝑢𝑙𝑙𝑖 𝑝
La proporción muestral será:
𝑛
𝑖=1 𝑝𝑖
𝑝=
𝑛
Estimación de la proporción muestral
𝑝𝑖 ~𝐵𝑒𝑟𝑛𝑜𝑢𝑙𝑙𝑖 𝑝
Esperanza
𝑛 𝑛
𝑖=1 𝑝𝑖 1 1
𝐸 𝑝 =𝐸 = ∙𝐸 𝑝𝑖 = ∙ 𝑛 ∙ 𝑝 = 𝑝
𝑛 𝑛 𝑛
𝑖=1

Varianza
𝑛 𝑛
𝑖=1 𝑝𝑖 1 1 𝑝∙𝑞
𝑉 𝑝 =𝑉 = 2∙𝑉 𝑝𝑖 = 2 ∙ 𝑛 ∙ 𝑝 ∙ 𝑞 =
𝑛 𝑛 𝑛 𝑛
𝑖=1

𝑉 𝑘 ∙ 𝑋 = 𝑘 2 ∙ 𝑉[𝑋]
Estimación de la proporción muestral

Conclusión
Si la población tiene 𝑝∙𝑞
⟹ 𝑝~𝑁 𝑝,
probabilidad 𝑝 𝑛

𝑝−𝑝
~𝑁 0, 1
𝑝∙𝑞
𝑛
Distribuciones
Distribuciones en inferencia

Existe una serie de distribuciones que no tienen aplicación


práctica fuera del ámbito de la inferencia estadística.
• 𝝌𝟐 de Pearson
• 𝒕 de student
• 𝑭 de Snedecor
En la práctica las usaremos cuando desconozcamos la
varianza de la población. En su lugar, tendremos que utilizar
la cuasi-varianza muestral.
2
Distribución 𝜒 de Pearson
Definición
𝑋𝑖 ~𝑁 0, 1
Si ⟹ 𝑌~𝜒𝑛2
𝑌 = 𝑋1 2 + ⋯ + 𝑋𝑛 2

𝑛 grados de libertad

Teorema de Fisher
Proporciona la relación entre la varianza poblacional
y la cuasi-varianza muestral (la población sigue una normal):
𝑛 − 1 ∙ 𝑠 2
𝜒𝑛2 =
𝜎2
Nos permitirá estimar 𝜎 2 en función de 𝑠 2
2
Distribución 𝜒 de Pearson
0.16
n=5
0.14
n=10
0.12
n=30
0.1
0.08
0.06
0.04
0.02
0
-0.02 0 5 10 15 20 25 30 35 40 45 50

Propiedades
𝐸 𝑌 =𝑛 0 𝑛<2
𝑀𝑜𝑑𝑎 𝑌 =
𝑉 𝑌 = 2𝑛 𝑛−2 𝑛 ≥2

Pico de la distribución
Distribución 𝑡 de Student
Definición
𝑋~𝑁 0, 1 𝑋
Si ⟹ 𝑇= ~𝑡𝑛
𝑌~𝜒𝑛2 𝑌
𝑛
𝑛 grados de libertad
Varianza poblacional desconocida
Es parecida a la normal tipificada 𝑍,
pero con un valor de 𝜎 desconocido (población normal):
𝑥−𝜇 𝑥−𝜇
𝑍= 𝑡𝑛−1 =
𝜎2 𝑠2
𝑛 𝑛

𝑛 − 1 grados de libertad
Distribución 𝑡 de Student
0.4
n=1
n=5
0.3
n=30
Z
0.2

0.1

0
-5 -4 -3 -2 -1 0 1 2 3 4 5

Al desconocer 𝜎, hay más dispersión que en 𝑍.


Cuando 𝑛 es grande 𝑛 > 30 , es equivalente a 𝑍.

𝑛
𝐸 𝑇 =0 𝑉𝑇 = ,𝑛 > 2
𝑛−2
Distribución 𝐹 de Snedecor
Definición

𝑋~𝜒𝑛2 𝑋
Si ⟹ 𝐹 = 𝑛 ~𝐹 𝑛, 𝑚
2 𝑌
𝑌~𝜒𝑚 𝑚
𝑛 y 𝑚 grados de libertad

Cociente de varianzas
Nos servirá para comparar las varianzas
de dos distribuciones normales
a partir de sus cuasi-varianzas muestrales:
𝑠1 2 𝑠2 2
/ ~𝐹 𝑛1 − 1, 𝑛2 − 1
𝜎1 2 𝜎2 2
Distribución 𝐹 de Snedecor
n=10, m=10
1 n=30, m=10
n=10, m=30
n=30, m=30
0.5

0
0 1 2 3

Propiedades
𝑛
𝐸𝐹 = ,𝑛 > 2
𝑛−2 1
𝐹𝛼 𝑚, 𝑛 =
2𝑛2 ∙ 𝑚 + 𝑛 − 2 𝐹1−𝛼 𝑛, 𝑚
𝑉𝐹 = 2
,𝑛 > 4
𝑚∙ 𝑛−2 ∙ 𝑛−4
Suma y resta
de variables
Suma y resta de medias muestrales
𝑋1 ~𝑁 𝜇1 , 𝜎1 2
𝑋2 ~𝑁 𝜇2 , 𝜎2 2

Suma y resta
𝜎1 2 𝜎2 2
𝑥1 ± 𝑥2 ~𝑁 𝜇1 ± 𝜇2 , +
𝑛1 𝑛2

Las varianzas siempre se suman

𝑥1 ± 𝑥2 − 𝜇1 ± 𝜇2
~𝑁 0, 1 = 𝑍
𝜎12 𝜎 2
+ 2
𝑛1 𝑛2
Suma y resta de proporciones muestrales
𝑝1 ∙ 𝑞1 𝑝2 ∙ 𝑞2
𝑝1 ~𝑁 𝑝1 , 𝑝2 ~𝑁 𝑝2 ,
𝑛1 𝑛2

Suma y resta
𝑝1 ∙ 𝑞1 𝑝2 ∙ 𝑞2
𝑝1 ± 𝑝2 ~𝑁 𝑝1 ± 𝑝2 , +
𝑛1 𝑛2

Las varianzas siempre se suman

𝑝1 ± 𝑝2 − 𝑝1 ± 𝑝2
~𝑁 0, 1 = 𝑍
𝑝1 ∙ 𝑞1 𝑝2 ∙ 𝑞2
+
𝑛1 𝑛2
Varianzas poblacionales desconocidas
𝑋1 ~𝑁 𝜇1 , 𝜎1 2 𝜎1 y 𝜎2 desconocidas y
𝑋2 ~𝑁 𝜇2 , 𝜎2 2 no podemos asumir 𝜎1 = 𝜎2

Suma y resta
𝑥1 ± 𝑥2 − 𝜇1 ± 𝜇2
~𝑡𝑘
2
𝑠1 𝑠2 2
+
𝑛1 𝑛2

𝑠1 2
𝑠 2 2
+ 2
𝑛1 𝑛2
𝑘= 2 2
𝑠1 2 𝑠2 2
𝑛1 𝑛
+ 2
𝑛1 − 1 𝑛2 − 1
Varianzas poblacionales desconocidas
𝑋1 ~𝑁 𝜇1 , 𝜎1 2 𝜎1 y 𝜎2 desconocidas y
𝑋2 ~𝑁 𝜇2 , 𝜎2 2 sí podemos asumir 𝜎1 = 𝜎2

Suma y resta
𝑥1 ± 𝑥2 − 𝜇1 ± 𝜇2
~𝑡𝑛1 +𝑛2 −2
1 1
𝑠𝑐 ∙ +
𝑛1 𝑛2

𝑛1 − 1 ∙ 𝑠1 2 + 𝑛2 − 1 ∙ 𝑠2 2
𝑠𝑐 2 =
𝑛1 − 1 + 𝑛2 − 1
Cuasi-varianza muestral conjunta

También podría gustarte