0% encontró este documento útil (0 votos)
14 vistas12 páginas

Estadistica II

El documento aborda la distribución de muestreo de la media, explicando conceptos clave como población, muestra, estadísticos y parámetros. Se detalla cómo se generan distribuciones de medias muestrales a partir de muestras, destacando la importancia del teorema del límite central y el error estándar. Además, se menciona la necesidad de un factor de corrección en poblaciones finitas y se introduce la distribución muestral para la proporción.

Cargado por

Juan Russo
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

Temas abordados

  • distribución discreta,
  • frecuencias relativas,
  • distribución de frecuencias,
  • proporciones muestrales,
  • distribución normal,
  • combinaciones,
  • valores estadísticos,
  • métodos de análisis,
  • histograma,
  • análisis probabilístico
0% encontró este documento útil (0 votos)
14 vistas12 páginas

Estadistica II

El documento aborda la distribución de muestreo de la media, explicando conceptos clave como población, muestra, estadísticos y parámetros. Se detalla cómo se generan distribuciones de medias muestrales a partir de muestras, destacando la importancia del teorema del límite central y el error estándar. Además, se menciona la necesidad de un factor de corrección en poblaciones finitas y se introduce la distribución muestral para la proporción.

Cargado por

Juan Russo
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

Temas abordados

  • distribución discreta,
  • frecuencias relativas,
  • distribución de frecuencias,
  • proporciones muestrales,
  • distribución normal,
  • combinaciones,
  • valores estadísticos,
  • métodos de análisis,
  • histograma,
  • análisis probabilístico

ESTADISTICA II

M1L1

Distribución de muestreo de la media

Población y muestra: la población es el conjunto de todas las unidades de estudio (individuos)


que cumplen con una característica o atributo observable que es de interés para la
investigación. Pueden ser personas, animales, cosas o hechos seleccionados según un criterio.
Se pueden medir o contar. El criterio de selección está dado por el objetivo de la investigación.

Una muestra estará constituida por una porción de la población. Por lo tanto, es un
subconjunto de ella. Cada uno de los elementos que forman parte de la muestra también se
denomina unidad de observación. La muestra debe representar a la población.

Estadísticos y parámetros: los estudios sobre una muestra permiten determinar valores
denominados estimadores o valores estadísticos. Ellos permiten efectuar una correcta
estimación sobre los valores de la población.

Los valores en estudio que en la muestra toman el nombre de estadísticos en la población se


denominan parámetros.

Ej: El salario promedio obtenido en la muestra se denomina estadístico, mientras que el salario
promedio de toda la población docente constituye el parámetro.

Bondad: margen de seguridad con el que se realiza la inferencia de acuerdo con los estudios
realizados sobre la o las muestras.

Estadística inferencial: es el conjunto de métodos y técnicas que permiten determinar, de una


muestra debidamente representativa de una población, los valores estadísticos, a fin de poder
inferir sobre los parámetros poblacionales con un cierto grado de bondad.

Es el conjunto de métodos que hacen posible la estimación de una característica de la


población o la toma de una decisión referente a una población basándose solo en los
resultados de una muestra

Definición de distribución de muestreo de la media

Los parámetros poblacionales más usuales en la estimación son:

a) la media.

b) el desvío estándar.

c) la proporción de los elementos de la población que cumplen con determinada característica.

La media de la muestra nos permite inferir sobre la media poblacional, mientras que el desvío
estándar o la proporción de los elementos con la característica en estudio de la muestra nos
permite inferir sobre el comportamiento de los parámetros poblacionales.

Distribución de muestreo de la media: es el fundamento de la estimación estadística y a la vez


uno de los temas centrales de esta lectura.

Una distribución de probabilidad de todas las medias posibles de las muestras es una
distribución de las medias de las muestras. Los especialistas en estadística la conocen como
distribución de muestreo de la media.
Ejemplo teórico:

Consideremos una población infinita o finita con un N lo suficientemente grande que implique
que una muestra extraída sin reposición no modificará las probabilidades que tienen otras
muestras de ser elegidas.

La población en estudio tiene una media µ y un desvío estándar σ.

De esa población se extraen todas las muestras posibles de un mismo tamaño n en cada una de
ellas.

De cada muestra se calcula la media ▁x y la desviación estándar s.

Esquema del proceso de obtención de una distribución de muestreo para la media

La figura muestra cómo llegar a la distribución de muestreo de la media a partir del cálculo de
la media y la desviación estándar de cada una de las muestras.

Si consideramos ahora las medias de todas esas muestras y generamos con ellas una
distribución, obtendríamos lo que denominaremos una distribución de medias, distribución
de muestreo de las medias o distribución de probabilidad de las medias muestrales.

 A cada media muestral, se la considera como variable aleatoria, pues es el resultado


numérico de un experimento aleatorio. El experimento es tomar muestras aleatorias
de una población y calcular la media de cada muestra.
Esto nos permite confeccionar una tabla de distribución de frecuencias e incluso un
gráfico con todas las medias de todas las muestras posibles tomadas de la población.
Esta distribución se denomina distribución de muestreo de la media.
 Podrá observarse que la distribución de medias muestrales tendrá una forma
aproximadamente normal, independientemente de la forma original de la población
(haya sido normal o no).
 Como toda distribución de variables aleatorias, esta distribución tendrá una media
que, en este caso, puede calcularse como la medida de todas las medias y también un
valor esperado
 Al desvío estándar de esta distribución de medias muestrales, se lo denomina error
muestral estándar. Cuanto más pequeño sea este valor, menor será el error que se
cometa cuando se infiera sobre la media poblacional a través de la media de una
muestra.
 Podemos obtener una distribución de muestreo para la proporción, con base en la
proporción en que una característica se encuentra en todas las muestras posibles
tomadas de la población.

Error estándar o error muestral estándar

La desviación estándar de la distribución de las medias muestrales es lo mismo que el error


estándar de la media.

El error estándar de la muestra es distinto a la desviación estándar de la población.

El error estándar indica qué tan dispersas (separadas) están las medias de las muestras entre
sí. El término error estándar se utiliza para explicar que la variabilidad de los estadísticos
calculados en las muestras proviene de un error de muestreo. Este error es debido a la
aleatoriedad de las muestras.

Características de la distribución de muestreo de la media a partir de un caso

Ejemplo

una empresa de ventas que cuenta con cinco vendedores a los que designaremos como A, B, C,
D y E. Sus salarios mensuales son $40 000, $40 000, $50 000, $60 000 y $60 000,
respectivamente. Dichos salarios constituirán la población en estudio. En este caso, dicha
población es finita y consta de solo 5 elementos.

Etapa 1: calcular los parámetros de la población

Volcaremos los datos del ejemplo 2 en una tabla y calcularemos los siguientes parámetros: la
media poblacional µ, la varianza poblacional Var(x) o (σ 2 ) y la desviación poblacional σ

El salario promedio será

Varianza: Var(x)
Desvio estándar:

Nota: esta es una situación ideal de una población muy pequeña, por eso, no se considera N-1
en el denominador para la varianza y la desviación estándar (no se trata de una muestra).

También, podemos resumir los datos en una tabla de distribución de frecuencias para poder
luego ver la forma de la distribución de la población

Etapa 2: seleccionar de la población todas las muestras posibles de tamaño 2

Consideremos de esta población todas las muestras posibles de dos elementos en cada una de
ellas. Tenemos que formar grupos de 2 personas tomadas de un grupo de 5.

No importa si una persona está en más de un grupo. Lo que diferencia un grupo de otro es que
por lo menos hay una persona distinta.

Tampoco importa en qué orden se nombran los grupos. Estamos hablando de las
combinaciones de 5 elementos tomados de dos en dos.

Necesitamos calcular . Como aprendimos a calcular mediante calculadora científica o


mediante su fórmula, es igual a 10 grupos de personas.

En la tabla 3, se escriben todos los posibles grupos de vendedores combinándolos de a 2. Se


calculan los promedios de sueldos de cada muestra.

Etapa 3: distribución de medias muestrales de tamaño 2


Con las medias de todas las muestras podemos generar una nueva distribución que
denominaremos distribución de medias muestrales de tamaño 2 o distribución de muestreo de
la media.

Primero se ordenan los valores de la variable de menor a mayor y luego se cuentan las veces
que se repite (fi).

en la tabla 4 se muestra la distribución de las frecuencias absolutas de la variable aleatoria. En


este caso, la variable aleatoria es el promedio de los 2 sueldos correspondientes a los dos
vendedores que forman cada muestra.

Tabla 4: Tabla de distribución de frecuencias para las muestras de vendedores tomados de a 2.

Etapa 4: calcular los estadísticos de la distribución de medias muestrales de la etapa 3.

Los estadísticos convenientes a calcular según el caso que estamos analizando son los
siguientes.

La media de la distribución muestral:

La desviación estándar de las medias muestrales o error estándar.

Varianza: Var(x) =

Desviación estándar:

Además, nos interesa calcular la probabilidad de ocurrencia de las medias muestrales, ya que la
probabilidad de ocurrencia de las medias muestrales viene dada por las frecuencias relativas.
Así, la probabilidad de que una muestra de tamaño 2, tomada de esa población, proporcione
un promedio salarial de $50 000 es de P (x = 50 000) = 0,4.

Resumen:

Conclusiones parciales 1

Podemos decir que, si de la población se extraen todas las muestras posibles de tamaño 2 y de
cada una de ellas se determina su media, la distribución generada con las medias de todas las
muestras presenta las siguientes características.

1. La media de la distribución de las medias de todas las muestras posibles de la


población de tamaño (n = 2) es igual a la media de la población.
2. El desvío estándar de dicha distribución, también denominado como error muestral
estándar, es menor que el desvío estándar poblacional.
3. Mientras que la población presenta un diagrama de frecuencias bimodal, en este caso
el correspondiente a la distribución de las medias muestrales tiende a ser normal.

Etapa 5: seleccionar de la población todas las muestras posibles de tamaño n = 3

Regresemos a la población y consideremos ahora todas las muestras posibles de tres


elementos en cada una de ellas (n = 3). El número de muestras posibles estará dado por las
combinaciones de 5 tomadas de 3 en 3

C n:r = n! / (r! * (n-r)!)

Muestras de 3 personas tomadas de la población de 5 en el ejemplo 2 con sus promedios de


sueldo
Etapa 6: distribución de medias muestrales de tamaño n = 3

Con las medias de todas las muestras, podemos generar una nueva distribución que
denominaremos distribución de medias muestrales de tamaño 3 o distribución de muestreo de
la media.

rimero se ordenan los valores de la variable de menor a mayor y luego se cuentan las veces que
se repite (fi).

Histograma

Si en lugar de escribir en el eje vertical las frecuencias absolutas pusiéramos las frecuencias
relativas, estaríamos hablando de una distribución de probabilidades tal como estudiamos en
el módulo 3. Si se tratase de una población más grande que la tomada en el ejemplo 2 y la
variable aleatoria fuera continua, el polígono se suaviza. Observamos que esta curva va
tomando forma acampanada. También se cambió la escala del eje vertical por las frecuencias
relativas para observar mejor la distribución de probabilidades.

Etapa 7: calcular los estadísticos de la distribución de medias muestrales de la etapa 6

 La media de la distribución muestral: $50.000


 La desviación estándar de las medias muestrales o error estándar:

Varianza: Var(x) =

Desviación estándar:
Conclusiones parciales 2

La media de la distribución de las medias de todas las muestras posibles de n = 3 elementos


cada una de ellas es igual a la media de la población, lo que también ocurría en el caso de n =
2.

1. La distribución tiende a adquirir las características propias de una distribución normal.


2. El desvío estándar de la distribución es menor que el desvío estándar poblacional. El
desvío estándar de la distribución muestral de n = 3 es menor que el desvío estándar
de la distribución muestral de n = 2, es decir, a medida que el número de elementos
que componen la muestra aumenta, disminuye la dispersión de la distribución
muestral.

Conclusiones generales

En la tabla 7, se resumen los estadísticos media, error estándar y rango de las muestras
tomadas según el tamaño, n = 2 y n = 3.

Tabla 7: Resumen de los estadísticos calculados

Del análisis del ejemplo 2 y la tabla 7, podemos extraer las siguientes conclusiones.

1. La distribución de las medias muestrales para n grande tiene forma normal.


1. Cuando la población es grande y está normalmente distribuida, la distribución de
las medias muestrales será normal.
2. Cuando la población no está distribuida normalmente, la distribución de las medias
muestrales se aproximará a una distribución normal si el tamaño de la muestra es
suficientemente grande (30 o más elementos).
2. La distribución de las medias muestrales tiene una media igual a la media poblacional:
x̿=μ.
3. La desviación estándar de las distribuciones de las medias muestrales, denominado
error estándar, está dado por la expresión:

Las conclusiones extraídas del análisis realizado con las distribuciones de las medias muestrales
a medida que se aumenta el tamaño de la muestra nos llevan al enunciado del teorema
fundamental de la estadística inferencial: el teorema del límite central.

Teorema del límite central

Si de una población de media μ y desviación estándar σ se extraen todas las muestras posibles
del mismo número de elementos n en cada una de ellas y de cada muestra obtenemos su
media , la distribución de todas esas medias tendrá una distribución del tipo normal,
independientemente del tipo de distribución que sea la población, con una media x̿ igual a la
media poblacional μ y un desvío estándar menor al desvío estándar poblacional, el cual es

denominado error muestral estándar. Su valor es igual a

(cociente entre el desvío estándar poblacional sobre la raíz cuadrada de n: tamaño de


muestra).

Factor de corrección para poblaciones finitas Poblaciones infinitas y finitas.

Ya hablamos de poblaciones infinitas, pero en términos generales se trata de comparar la


población con la muestra.

La población se considera infinita cuando el tamaño de la muestra es menor al 5 % del tamaño


de la población: n < 0,05 N

La población es finita cuando el tamaño de la muestra es mayor o igual al 5 % del tamaño de la


población: n ≥ 0,05 N

Factor de corrección

Si estamos frente a una población finita, es necesario introducir un factor de corrección para
poblaciones finitas. Para el cálculo del error estándar, sería lo siguiente.

La fórmula de cálculo para el error estándar en caso de que la población sea finita es:

Aplicación del teorema del límite central al caso del ejemplo 2

1. El error estándar a partir de la distribución de medias muestrales, cuando n = 2, nos


dio (ver tabla 7): $5477,23.
2. El error estándar por teorema del límite central, aplicando en este caso el factor de
corrección para poblaciones finitas, sería (ver etapa 1 del ejemplo 2)

Los errores estándar en ambos casos dan iguales. Por tanto, el teorema del límite central nos
permite extraer una muestra representativa de una población e inferir a partir de los
estadísticos (la media y la desviación estándar, en este caso) los parámetros poblacionales
correspondientes, con un cierto grado de error manejable.
Estandarización:

 Para una distribución normal:

 En el caso de una distribución de medias muestrales:

 Entonces,

Distribución de muestreo para la proporción.

¿Qué es una distribución muestral para la proporción?

En muchas oportunidades, es necesario determinar una proporción en una población. Por


ejemplo:

 Porcentaje o proporción de votantes que se estima que votarán en la próxima elección


por un cierto candidato.
 Porcentajes de alumnos del nivel primario que no terminan el ciclo.
 Porcentaje de niños de una determinada edad que estén vacunados contra el
sarampión, entre otros ejemplos.

Se trata ahora de extraer una muestra, calcular la proporción de la característica de interés en


dicha muestra y analizar qué sucede en la población con esa característica, basándonos en los
datos muestrales.

La fórmula para calcular la proporción muestral es:

x: número de elementos de la muestra que poseen la característica de interés.

n: tamaño de la muestra.

La proporción muestral es una variable aleatoria y su distribución de probabilidad se

conoce como distribución muestral de .

Características de la distribución muestral de la proporción


Al igual que en la distribución de medias, para determinar cuán cerca está la proporción de una

muestra de la proporción poblacional p, se necesita saber cuáles son las propiedades de

la distribución muestral de :

 el valor esperado de .

 La desviación estándar de .

 La forma de la distribución muestral de .

Valor esperado o media de la distribución muestral de la proporción .

El valor esperado de es la media de todos los posibles valores. A su vez, es igual a la


proporción poblacional p.

Desviación estándar de la proporción muestral .

También es llamado error estándar de la proporción. Al igual que en la distribución de medias


muestrales, diferenciaremos entre poblaciones infinitas y finitas.

 Error estándar de la proporción para poblaciones infinitas:


p: proporción en que se encuentra la característica en estudio dentro de la población.
q = 1 – p. n: tamaño de la muestra.
 Error estándar de la proporción para poblaciones finitas:

Solo se le agrega el factor de corrección.

Forma de la distribución muestral de la proporción

 Conocemos entonces la media y la desviación estándar de la distribución muestral de

. Ahora nos queda por analizar la forma de esa distribución muestral.

 La fórmula para calcular la proporción muestral es .


 sabemos que x es una variable aleatoria binomial que indica el número de los
elementos de la muestra que tienen la característica de interés. Recuerda que la
muestra fue tomada en forma aleatoria de una población grande.
Los eventos se consideran independientes y como n es una constante, la probabilidad
de x/n es la misma que la probabilidad de x, lo que significa que la distribución
muestral de también es una distribución de probabilidad discreta y la probabilidad
de cada x/n es la misma que la probabilidad de x.
 Recuerda que una distribución binomial se aproxima mediante una distribución
normal, siempre que el tamaño de la muestra sea lo suficientemente grande para
satisfacer las siguientes condiciones. n.p ≥ 5 y n.q ≥ 5

La proporción y el teorema del límite central

 La proporción se encuentra en una población como un nuevo parámetro, el cual se


determinará en la mayoría de los casos con una inferencia a través del estadístico
correspondiente de una muestra.
 El valor práctico de la distribución muestral de es que permite obtener información
probabilística acerca de la diferencia entre la proporción muestral y la proporción
poblacional.

Para la obtención y análisis del estadístico tendremos presente que el teorema del límite
central puede ser aplicado para las proporciones. Por lo tanto, si de una población con una
proporción p (de los elementos con la característica en estudio) se extraen todas las muestras
posibles del mismo tamaño y de cada muestra se determina la proporción, con las
proporciones de todas las muestras posibles se genera una distribución de proporciones
muestrales que será normal, ajustándose a las pautas ya mencionadas de las medias
muestrales.

La media de esa distribución de proporciones será igual a la proporción de la población y el


desvío estándar de la distribución de proporciones muestrales será igual a

M1L2

Estadística inferencial: el objetivo final era el de inferir algo acerca de una población a partir de
la información adquirida de una muestra. La inferencia, entonces, se hace a través de
estimadores.

También podría gustarte