0% encontró este documento útil (0 votos)
132 vistas5 páginas

Muestreo Y Distribuciones Muestrales

Este documento describe conceptos básicos sobre muestreo y distribuciones muestrales. Explica que una muestra debe ser representativa de la población cuando no es posible realizar un censo completo. Describe diferentes tipos de muestreo como probabilístico y no probabilístico. También cubre conceptos como la distribución muestral de la media, la diferencia de medias muestrales y el teorema del límite central.

Cargado por

Bill Malba Tahan
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
132 vistas5 páginas

Muestreo Y Distribuciones Muestrales

Este documento describe conceptos básicos sobre muestreo y distribuciones muestrales. Explica que una muestra debe ser representativa de la población cuando no es posible realizar un censo completo. Describe diferentes tipos de muestreo como probabilístico y no probabilístico. También cubre conceptos como la distribución muestral de la media, la diferencia de medias muestrales y el teorema del límite central.

Cargado por

Bill Malba Tahan
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

MUESTREO Y DISTRIBUCIONES MUESTRALES

Cuando no es posible realizar un censo, se selecciona una muestra, que debe ser una parte representativa de
la población; se entiende por muestreo como una herramienta de la investigación científica.
¿Para qué sirve una muestra?
Podemos inferir usando una muestra. Entonces estaremos interesados en cómo extraer una muestra, que es
el objetivo de nuestro estudio en esta parte.
L a carcterística de la población puede estar representada por una variable aleatoria. Si este es el caso
tenemos información sobre la función de probabilidad en el caso discreto o sobre la función de densidad de
probabilidad en el caso continuo, de la variable aleatoria en cuestion y no tendriamos la necesidad de
seleccionar una muestra; porque toda información deseada seria obtenida a traves de la distribucion de
probabilidad. Pero esto no siempre ocurre, porque la información con respecto a la variable aleatoria en
estudio es parcial o mas bien desconocida.
Podemos admitir por ejemplo que el promedio de notas de los estudiantes de estadística, tiene distribución
normal, pero desconocemos los parámetros que lo caracterizan como es la media, la varianza; en otros casos
podemos tener una idea de la media y varianza, pero desconocemos la forma de la gráfica de la función de
densidad. O lo que es mas frecuente no tenemos información ni sobre los parámetros de la curva.
En estos casos necesitamos ayuda de una muestra , para formarnos una idea sobre el comportamiento de la
característica de la población en que estamos interesados. Podemos darnos cuenta que necesitamos como
sacar una muestra para hacer un estudio
La teoria de muestreo es el estudio de la relación que existe entre una población y las muestras que se
obtienen de esa población; también sirve para determinar si las diferencias que se observan entre dos
muestras se deben a variaciones casuales o si son diferencias realmente significativas, etc.
TIPOS DE MUESTREO
Existen diferentes criterios de clasificación:
1) Métodos de muestreo probabilístico.- se basan en el principio de equiprobabilidad, todas las posibles
muestras de tamaño “n” tienen la misma probabilidad de ser seleccionados
2) Métodos de muetreo no probabilísticos.- no todos los sujetos de la población tienen la misma
probabilidad de ser elegidos. En generla se selecciona a los sujetos siguiendo determinados criterios
procurando, en la medida de lo posible, que la muestra sea representativa
Dentro del muestreo probabilístico tenemos la muestra aleatoria simple (m. a.), que es la mas importante y
describimos acontinuación
Muestreo aleatorio simple.- es el tipo de muestreo mas importante y simple, en él se basan todos los demas.
Para obtener los elementos de la muestra se numeran los elementos de la población y se selecciona al azar
los elementos que debe contener la muestra. Todos los elementos tienen la misma probabilidad de ser
elegidos. Una de las formas mas sencillas de seleccionar una muestra aleatoria simple de una población finita
puede ser por medio de una tabla de dígitos aleatorios.
EJEMPLO 1 seleccionar aleatoriamente cinco expedientes para un estudio. Los expedientes tienen
numeración de 4 dígitos
Solución: Podemos enumerar ordenando de 0001-8000. De ellos debemos escoger 5 números aleatorios con
4 dígitos entre 0001 a 8000, para ello podemos usar tabla de números aleatorios, donde se busca un punto
inicial (i,j) y se completa los cinco números. Tambien podemos enumerar los números en papelitos y
colocarlos en una urna y despues extraer los números de la urna para que sean los elementos de la muestra.
1. DISTRIBUCION MUESTRAL DE LA MEDIA
Si el estadístico de que se trata es la media muestral, a la distribución que se obtiene se le llama distribución
muestral de medias o distribución muestral de la media. De igual manera se puede obtener distribuciones
muestrales de la varianza o desviación estándar, distribucion muestral de proporciones, distribución muestral
de la mediana, etc.
Si el muestreo se hace sin reemplazamiento en una población finita y si el orden en que se sacan las

muestras no tiene importancia, el número de muestras posibles está dado por (nk)
EJERCICIO 1 Supongamos que la población es P = {1, 2, 3, 4}. Las muestras de tamaño 2 se muestran en la
tabla que sigue, la variable aleatoria x́ , tiene su distribución de probabilidad. calcular su valor esperado y su
varianza, tanto de la muestra con reposición y sin reposición

1 2 3 4
1 (1,1) (1,2) (1,3) (1,4)
x́=1 x́ =1.5 x́ =2 x́ =2.5
2
S= S2= S 2
S2
2 (2,1) (2,2) (2,3) (2,4)
x́=¿ 1.5 x́ =2 x́ =2.5 x́ =3
S2= S2 S2= S2=
3 (3,1) (3,2) (3,3) (3,4)
x́=¿ x́=¿ x́ = x́=¿
S2 S2= S2= S2=
4 (4,1) (4,2) (4,3) (4,4)
x́ = x́ = x́ = x́=¿
S2= S2 S2= S2=
Consideramos ahora el caso de un muestreo sin reemplazamiento. Las posibles muestras aparecen por
encima y por debajo de la diagonal principal de la tabla. No se incluyen las muestras que aparecen en la
diagonal, puesto que éstas no son posibles si el muestreo es sin reemplazamiento

Teorema 1 Si x́ es la media aritmética de una muestra aleatoria de tamano “n” extraída con reemplazo de un
σ 2x
universo con función de probabilidad dada, entonces: μ x́ =μx , 2
σ x́ = . Si el muestreo se hace sin
n
σ 2 N −n N−n
reemplazamiento la media μ x́es igual a la media poblacional y la varianza σ 2x́ = ( ) . El factor ( ) se
n N −1 N−1
denomina, factor de corrección.
Una regla de uso muy frecuente establece que el factor de corrección de población finita se puede pasar por
alto cuando n/N es menor o igual a 0.05, esto es, cuando la muestra contiene el 5% o menos de la población
Generalmente a la desviación estándar de la distribución muestral de un estadístico se le llama error estándar
Teorema 2 (del límite central) Cuando se selecciona muestras aleatorias simples de tamaño “n” de una
población, la distribución de muestreo de la media muestral x́ puede aproximarse mediante una distribución
σ
normal a medida que el tamaño de la muestra se hace grande con media µ y desviación estándar
√n
EJEMPLO 2 Suponga que se selecciona una muestra aleatoria de n=25 observaciones de entre una
´población que está distribuida normalmente, con media 106 y desviación estándar de 12. Encuentre la
probabilidad de que x́ exceda de 110

Solución: Debemos calcular P( x́ ˃ 110), normalizando x́ , se obtiene z=1.67, es decir P(z ˃ 1.67) que es
0.0474
EJERCICIO 2 una empresa emplea 1500 personas. La cantidad promedio gastada, durante 6 meses, en
servicios médicos personales por empleado fue 25.75 soles y la desviación estándar de 5.25 soles. ¿cuál es
la probabilidad de que una muestra aleatoria de 100 empleados arroje una media comprendida entre 25 y 27
soles?
Solución: Se pide calcular P(25≤ x́ ≤27)

2. DISTRIBUCION MUESTRAL DE LA DIFERENCIA DE MEDIAS


Cuando en una investigación el interés es en dos poblaciones, a menudo se desea comparar medias
muestrales, concretamente la diferencia entre dos medias poblacionales, es decir deseamos conocer la
naturaleza de la distribución muestral del estadístico (ӯ1- ӯ2), siendo las muestras independientes.
Respecto a la media y la desviación estándar de esta variable denotas por µӯ1- ӯ2, y σӯ1- ӯ2 tenemos:

σ 21 σ 22
μ ý − ý =¿ μ
1 2 ý 1 −μ ý =μ1− μ2¿
2
,
1 2
2
σ ý −´y =√ σ + σ =
ý 1
2
ý 2 +
n 1 n2 √
En el caso que la población es pequeña y el muestreo es sin remplazamiento, entonces debemos tomar en
cuenta el teorema (1)
EJEMPLO 3 Se identificaron dos poblaciones de alumnos del quinto año de secundaria de un colegio. La
variable de interés en una investigación consistía en los puntajes obtenidos en una prueba de matemáticas
que se realizaron en las dos poblaciones de estudiantes. Los investigadores tienen conocimiento que los
puntajes de las dos ´poblaciones estaban distribuidas normalmente con las siguientes medias y varianzas:
μ1=50 , σ 21 =40 , μ2=40 , σ 22=60 respectivamente. Una muestra aleatoria de n1=10 se saca de la población 1, y
una de tamaño n2= 12 de la población 2. ¿cuál es la probabilidad de que la diferencia entre las medias
muestrales esté entre 5 y 15?

Solución: Por lo que las poblaciones tienen distribuciones normal, tendremos que x́ 1−x́ 2 sigue una
2 σ 21 σ 22 40 60
distribución normal, con media 50-40=10, es decir μ x́ −μ x́ =10 , σ x́ −x́ = + = + =9
1 2 1 2
n 1 n2 10 12

Necesitamos calcular P(5< x́ 1− x́ 2 <15), en efecto:

5−10 x́ 1−x́ 2−μ 15−10


= < ↔−1.67 < z<1.67 → P (−1.67< z <1.67 )=0.9050
3 σ 2x́ − x́ 3 1 2

Nota 1.- Cuando no se conoce la varianza población, también es posible hacer inferencia estadística,
x́−μ
t=
considerando la variable aleatoria s denominada t de Student, con (n-1) grados de libertad
√n
DISTRIBUCION MUESTRAL DE PROPORCIONES
Si en una población de interés queremos estudiar un rasgo o característica en particular, que puede
clasificarse cada miembro de la población en función a que tenga o no, ese rasgo, entonces se trata de
averiguar la proporción de miembros con cierta característica, en este caso la población tiene una distribución
binomial. Sea el parámetro  proporción de la población que tiene el rasgo o cierta característica o
preferencia, etc. Si x de los individuos muestreadas tienen esta característica, entonces la proporción
x
muestral que lo denotamos por ^p= se puede usar para estimar la proporción poblacional . Para
n
simplicidad también denotaremos a la proporción muestral con p (minúscula) en lugar de ^p.
Así como podemos aproximar la distribución de probabilidad de x́ con la distribución normal cuando el tamaño
muestral “n” es grande, podemos hacer con la distribución muestral de ^p . la aproximación será adecuada si
np˃5 y nq˃5.
La media y la varianza de la proporción de éxitos ^p= p= x/n, es

( nx )= 1n ( nP )=P
μ p= E

x 1 P(1−P)
σ =var ( ) = var ( x )( npq )=
2
p
n n 2
n
EJEMPLO 4 En las elecciones presidenciales del Perú-2016 de la segunda vuelta, el 40% están apoyando
al partido de PPK. Si se toma una muestra aleatoria de 10 votantes, ¿cuál es la probabilidad de que la
proporción de votantes a favor de PPK sea exactamente 0.60?
Solución: Tenemos que n=10, P=40, debemos calcular P(p=0.60), en efecto

P ( ^p =0.60 ) =P ( nx = 106 )=P ( x=6 )=(106)(0.40) (0.60) =0.1115


6 4

4. DISTRIBUCION MUESTRAL DE LA DIFERENCIA DE DOS PROPORCIONES


La distribución muestral de la diferencia entre dos proporciones muestrales p1 y p2, donde p1 se calcula a
partir de todas las muestras aleatorias simples de tamaño n1, que se pueden extraer de una población con
parámetro P1; y p2 se calcula a partir de todas las muestras de tamaño n2, que se pueden extraer de una
población con parámetro P2, tiene una media µp1-p2= µp1-µp2=P1-P2 y una desviación estándar
P1 (1−P1 ) P2 (1−P2 )
σ p −p =
1 2
√ n1
+
n2
Si n1 y n2 son grandes, la distribución muestral de la variable aleatoria (p1 - p2) se aproxima a la distribución
normal
EJEMPLO 5 Dos facultades de la UNSA, X e Y difieren en el porcentaje de estudiantes aprobados en el
curso de razonamiento matemático (RM), de tal forma que en la facultad X el porcentaje de aprobados en
dicha asignatura es del 65% mientras que en la facultad Y es del 45%. Si se seleccionan muestras
aleatorias simples de 45, 35 respectivamente para aplicar una evaluación de dicha asignatura. Calcular la
probabilidad de la proporción de estudiantes en la facultad X supere a dicha proporción muestral en la
facultad Y en más de 0.30 puntos. Podemos tomar la notación p= ^p, cuando no hay confusión
Solución: Tenemos que las proporciones respectivas son PX= 0.65, PY=0.40, entonces la variable
aleatoria muestral (Px - Py) tiene una distribución con media µX-Y=0.65-0.45=0.17 y desviación estándar
(0.65)( 0.35) (0.48)(0.52) 0.2275 0.2496
σ A −B =
√ 45
+
35
=
√ 45
+
35
=√ 0.0121=0.11

0.3−0.17 0.13
Para calcular P(pA - PB ˃ 0.3), normalizamos 0.3, en efecto z= = =1.18
0.11 0.11
Luego P(z˃1.18) = 0.119
5. DISTRIBUCION MUESTRAL DE LA VARIANZA MUESTRAL
En un muestreo de una población normalmente distribuida, considerar la distribución modificada de s2 es
de mucha importancia, donde se aplica la distribución denominada Chi-cuadrada denotada por χ2
EJERCICIO 3 En las muestras de tamaño dos de la población P= {1, 2, 3, 4}, (tabla del ejercicio 1)
encuentre la distribución muestral de la varianza, si el muestreo es sin remplazamiento
EJEMPLO 6 Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones tomada de una
población normal con varianza σ2=9, tenga una varianza muestral entre 4.071 y 15.10125
Solución: Buscamos P(4.075 ≤ s2 ≤ 15.10125), para ello hacemos que aparezca χ2 , con grado de libertad
es n-1=24, en efecto:

2 24 ( 4.075 ) 24 s2 14 ( 15.10125 ) 2
4.075 ≤ s ≤ 15.10125 ↔ ≤ ≤ ↔10.852 ≤ χ ≤ 40.27
9 9 9
Ahora buscamos P(10.856 ≤ χ 2≤ 40.27) = 0.97, en la tabla
EJERCICIO 4 De la distribución muestral de varianzas del ejercicio (3), calcular P(s2≤0.25)

[Link]

También podría gustarte