Unidad 4
Unidad 4
UNIDAD Nº 4
MUESTREO. ESTIMACIÓN DE PARÁMETROS
1. INTRODUCCIÓN
Con frecuencia la investigación estadística se centra en una población de tal magnitud que, por
motivos prácticos, económicos y de tiempo, sólo es posible incluir en la investigación, algunos de sus
miembros. La finalidad de Estadística, en estos casos, es hacer inferencia acerca de una población con
base en la información contenida en una muestra.
Dos factores afectan la cantidad de información contenida en la muestra, y por lo tanto incide en la
precisión de los resultados. El primero es el tamaño de la muestra seleccionada de la población. El
segundo es la variación en los datos; la variación frecuentemente puede ser controlada por el método de
selección de la muestra.
En la primera parte de esta materia se han desarrollado metodologías que permiten efectuar una
adecuada exploración de los datos, etapa fundamental en el comienzo de cualquier análisis estadístico.
También se han presentado conceptos importantes respecto del muestreo.
En esta unidad se inicia el análisis confirmatorio de datos, ligado a la Estadística Inferencial, que
comprende una serie de técnicas de uso imprescindible para tomar decisiones con respecto a la cuestión
planteada al comienzo del análisis de datos.
El objetivo más importante de la Estadística es obtener una inferencia con respecto a la población
basándose en la información contenida en una muestra. Como las poblaciones se describen mediante
medidas numéricas denominadas parámetros, el objetivo de la mayoría de las investigaciones
estadísticas es deducir una inferencia con respecto a uno o más parámetros de la población.
Es necesario destacar aquí que las decisiones tomadas ante la situación de incertidumbre que
implica inferir de casos particulares a la generalidad, deben estar respaldadas por la objetividad que
garantiza la aplicación del método científico.
De este modo, los resultados obtenidos en situaciones experimentales, serán idealizados de
acuerdo a un modelo probabilístico conveniente, permitiendo medir en términos de probabilidad la
incertidumbre que trae aparejada la generalización de los resultados. En otras palabras, se podrá medir
y comunicar el “error” que se puede cometer o la confianza que se deposita en las decisiones.
Aplicar cualquier metodología estadística inferencial sin estudiar a fondo el cumplimiento de los
supuestos en los cuales ella está basada, lleva irremediablemente a conclusiones erróneas.
Los cálculos pueden realizarse con un software de cálculo o estadístico, mientras que la
responsabilidad insoslayable del trabajo estadístico radica en la elección de la metodología adecuada
para analizar los datos y en la correcta interpretación de los resultados.
2. MUESTREO
Es un procedimiento mediante el cual, se trata de obtener una muestra que resulte representativa
de la población a la que pertenece, con el fin de que se pueda realizar una buena inferencia.
Lo primero que se debe hacer es delimitar la población que va a ser estudiada y sobre el cual se
pretende generalizar los resultados. Por lo tanto, se debe responder a las siguientes preguntas:
¿De qué grupo de individuos (población en estudio) se desea sacar una muestra?
¿Cuántos individuos se necesita tener en esta muestra?
¿Cómo se seleccionarán los individuos?
La población de estudio debe estar claramente definida, por ejemplo, según edad, sexo, residencia
u otra variable de interés. Y una población de estudio puede constar no sólo de personas, sino también
de instituciones, hogares, etc.
Se debe distinguir dos tipos de poblaciones:
Población objeto: es la población de la cual se quiere obtener la información.
Población muestreada: es la población conocida.
En algunos casos estas dos poblaciones coinciden.
Al delimitar la población, luego se debe tener en cuenta que la muestra que se desea obtener debe
ser representativa de la población. Será representativa cuando el comportamiento o las características de
la población aparecen reflejadas en la muestra. Para interpretar dicha condición, se da el siguiente
concepto:
Muestra aleatoria: se obtiene de manera tal que todos los elementos de la población, de la cual
proviene, tienen una probabilidad conocida de ser seleccionados.
Los términos al azar y aleatorios denotan un tipo de procedimiento mecánico relacionado con la
probabilidad y con la selección de elementos, pero no logra esclarecer el tipo de muestra y el
procedimiento de muestreo.
Población finita
Cuando la población es finita, el tamaño de la muestra se calcula con la siguiente fórmula:
𝑧 22 𝑁 𝑁−𝑛
𝑛 = (𝑁−1) 𝐸2 +𝑧 2 2 , donde el error muestral es: 𝐸 = 𝑧 √ 𝑁−1
√𝑛
Población infinita
Cuando la población es infinita, el tamaño de la muestra se calcula con la siguiente fórmula:
𝑧 22
𝑛= , donde el error muestral es: 𝐸 = 𝑧
𝐸2 √𝑛
Por ejemplo, el valor crítico para el nivel de confianza de 95% se encuentra así:
95
𝑁𝐶 = 95% ⇒ = 0,95 = 1 − 𝛼
100
⇒ 𝛼 = 1 − 0,95 = 0,0
𝛼 0,05
⇒ = = 0,025 = 𝑃 (𝑧) ⇒ 𝑧 = ±1,96
2 2
Otro ejemplo, el valor crítico para el nivel de confianza de 90% se encuentra así:
90
𝑁𝐶 = 90% ⇒ 100 = 0,9 = 1 − 𝛼
⇒ 𝛼 = 1 − 0,9 = 0,1
𝛼 0,1
⇒ = = 0,05 = 𝑃 (𝑧) ⇒ 𝑧 = ±1,64
2 2
Marco de muestreo: Consiste en la totalidad de las unidades en las que se puede dividir a la
totalidad de la población. Ejemplo: la población es alumnos de un IES, entonces se pueden tomar como
unidades a las carreras que se dictan en ese IES.
Unidad de muestreo: Es la unidad que se selecciona del marco de muestreo. Puede o no ser igual
a la unidad de observación. Ejemplo: Unidad de muestreo pueden ser las postas sanitarias y la unidad de
observación los niños menores de 5 años atendidos en las postas.
En consecuencia: La muestra es un conjunto de unidades de observación.
Por lo explicado, se presenta a continuación los tipos de muestreos probabilísticos más frecuentes,
las muestras que se obtienen tienen muchas ventajas, la principal es que puede medirse el tamaño de
error en las predicciones. Por lo que el principal objetivo en el diseño de una muestra probabilística es el
de reducir al mínimo este error al que se le llama error estándar.
Para una muestra probabilística se necesita principalmente dos cosas: determinar el tamaño de la
muestra (n) v seleccionar los elementos que forman la muestra.
Para lo primero, se la fórmula, para lo segundo se necesita de un marco de selección adecuado y
de un procedimiento que permita la aleatoriedad en la selección.
En el M.A.S. no es permitida la doble inclusión de una misma unidad en la muestra. Esto significa
que la muestra debe estar constituida por n unidades diferentes.
Ventajas
Igual probabilidad de inclusión de todos los individuos en la muestra
Permite la generalización
Tiende a reflejar todas las características del universo, esto es, cuando el tamaño de la
muestra crece, ésta se hace cada vez más representativa de la población
Desventajas
Necesita un listado completo de todas las unidades que componen la población
Supone un tamaño de muestra mayor que otros diseños para obtener un mismo nivel de
confianza
El costo para obtener la información de las unidades de análisis crece con la dispersión
espacial de las mismas
Aplicaciones
Se presentan algunos ejemplos en los que es aplicado el MAS.
Ciencias sociales: Estimar la proporción de votantes registrados que apoyan alguna propuesta
política popular, o estimar el número promedio de personas votantes por familia.
Ciencias físicas: Considerar un experimento de laboratorio, tal como medir la resistencia de tensión
de un alambre. Aquí la población es meramente conceptual y su media representa la resistencia promedio
del alambre de un tipo determinado.
Educación: Determinar la proporción de estudiantes en la universidad que están a favor del cambio
del sistema semestral al trimestral.
Salud: Proporción elevada de abandono de controles de pacientes hipertensos en consultorios en
una ciudad Y.
Se supone una población de 50.000 individuos, una vez hecho el listado y determinado el tamaño
de la muestra (ejemplo 1000 unidades de observación), se procede así:
50000
Se calcula k, e este caso es 𝑘 = = 50
1000
Se selecciona al azar un número comprendido entre 01 y k, a esta primera unidad de
muestreo seleccionada se la denomina unidad de arranque (en el ejemplo de 01 a 50)
A partir de ese número se selecciona las unidades siguientes, sumándole a la unidad de
arranque k, 2k, 3k, etc., hasta obtener el tamaño de muestra deseado. Supóngase que el número
seleccionado sea el 15, entonces se extraen los individuos 15, 65, 115, 165, 215, ... (es decir cada 50
individuos)
Completar el tamaño de la muestra (en el ejemplo hasta obtener 1000 unidades de
observación)
Ventajas
las ventajas técnicas son similares a las del muestreo aleatorio simple, obteniéndose mucha
más representatividad de la población con el muestreo sistemático.
Tiene una gran ventaja económica ya que facilita la selección de la muestra.
Desventajas
Cuando la población presenta variaciones periódicas (variaciones cíclicas) en la ordenación
de sus elementos el muestreo sistemático no es aconsejable.
No es conveniente cuando la población está ordenada de acuerdo a algún criterio.
El muestreo sistemático es presentado como una alternativa para el M.A.S. y es más fácil de llevar
a cabo y, por lo tanto, está menos expuesto que el M.A.S. a los errores del estimador. Y proporciona más
información que el M.A.S. por unidad de costo. Para elegir entre estos dos tipos de muestreo se debe
considerar el tipo de población que se investiga.
Aplicación
Un ejemplo en el que se aplicó este procedimiento es:
En el Ministerio de Salud están interesados en el número total de personas que son atendidos en
un Hospital, durante un periodo de 180 días. Puesto que el control de atención de cada día lleva tiempo,
y con la finalidad de contar con la información lo antes posible, las autoridades del ministerio deciden
obtener estos datos cada décimo día registrado, en los últimos 180 días. Se obtiene así una muestra
sistemática de 1 en 10.
Nótese que la estratificación es llevada a cabo usando el conocimiento de una variable auxiliar,
como se indicó en el ejemplo.
Una vez definidos los estratos, es posible diferenciar dos tipos de muestras estratificadas:
Muestra estratificada proporcional
Muestra estratificada no proporcional
La muestra estratificada proporcional es aquella en la cual la fracción de muestreo es igual para
cada estrato, si existen diferencias en las fracciones de muestreo, se llama a ésta no proporcional.
La fracción de muestreo para el muestreo proporcional es:
𝑛
𝑓=
𝑁
Para el muestreo no proporcional se fija un tamaño de muestra para cada estrato, sin ser
proporcional a la población.
Una vez determinada la proporción o el tamaño de muestra (para el no proporcional), se seleccionan
las muestras, dentro de cada estrato, según el procedimiento del muestreo aleatorio simple.
Ventajas
La muestra es más homogénea, garantizando la representatividad
Elimina los errores en la estimación que son producto de diferencias entre estratos
Desventajas
Supone el conocimiento previo de las características de la población, a partir de las cuales
se estratifica
Son de costo más elevado que las aleatorias simples, en dinero y en tiempo
Exigen tratamientos estadísticos de cálculo más complejo
La muestra estratificada proporcional algunas veces puede no proveer de un número
suficiente de casos para análisis comparativos Inter-estratos
Aplicación
Un ejemplo en el que se aplicó este procedimiento es:
Atención de salud en adultos mayores en zonas urbanas y zonas rurales, por lo que el marco de
muestreo debe dividirse en dos (residentes en áreas urbanas y residentes en áreas rurales). Luego la
muestra aleatoria de tamaño predeterminado tendrá que obtenerse a partir de cada estrato (grupo).
Ventajas
La ventaja principal es la concentración de las unidades en áreas, representando una
economía en términos de costos y tiempo.
Las ofrecidas en los muestreos antes mencionados
Desventajas
Exige tratamientos estadísticos algo complejos.
En comparación al muestreo aleatorio simple y al estratificado, representa pérdida de
precisión.
Aplicación
Un ejemplo en el que se aplicó este procedimiento es:
En un estudio de los conocimientos, actitudes y prácticas relacionados con la planificación familiar
en localidades rurales de la región oeste de Catamarca, se construye una lista de todas las localidades
rurales. En base de la lista, se selecciona una muestra aleatoria de localidades rurales y se entrevista a
todos los adultos de las localidades seleccionadas.
Aplicaciones
Un ejemplo en el que se aplicó este procedimiento es:
En un estudio sobre la utilización de letrinas con pozo negro en un departamento, se efectúa una
visita a 50 domicilios para entrevistar a los miembros de la familia, así como para hacer observaciones
sobre las clases y limpiezas de las letrinas. El departamento está constituida por seis divisiones
administrativas y en cada división hay de 6 a 9 localidades.
En este caso se debe efectuar muestreos en varias etapas, una para seleccionar las divisiones
administrativas de los departamentos y luego se deben seleccionar las localidades de las divisiones, y
por último los domicilios de las localidades que serán visitados.
Muestreo estratificado: cuando es posible estratificar la población, se lo debe hacer, puesto que
ello homogeniza la muestra y los cálculos resultan más representativos.
Muestreo sistemático: debe ser utilizado únicamente en aquellos casos en que resulte imposible
o demasiado costoso aplicar una muestra aleatoria simple.
Estas muestras tienen poco valor en término de estimaciones, pues no es posible a partir de ellas
calcular el error de estimación de los parámetros.
Las muestras no probabilísticas, las cuales se llaman también dirigidas, suponen un procedimiento
de selección informal y un poco arbitrario.
2.3.10. Discrecional
A criterio del investigador los individuos son elegidos sobre lo que él cree que pueden aportar al
estudio.
3. ESTIMACIÓN
Estadístico
En la práctica, casi siempre se trabaja con muestras. Las medidas calculadas a partir de
observaciones muestrales, se llaman estadísticos muestrales. Es decir que un estadístico es una medida
que se calcula teniendo en cuenta solamente los elementos que integran una muestra determinada. Por
ejemplo la media muestral que se simboliza con 𝑥̅ , o la varianza muestral que se simboliza S2.
Cuando en una investigación se trabajó con una muestra, los estadísticos muestrales se utilizan
para estimar los parámetros poblaciones.
El proceso por medio del cual se establecen relaciones entre los estadísticos muestrales y los
parámetros poblacionales es el objeto de la inferencia estadística.
Error Estándar
La desviación estándar de una distribución, en el muestreo de un estadístico, es frecuentemente
llamada el error estándar del estadístico.
Por ejemplo, la desviación estándar de las medias de todas la muestras posibles del mismo tamaño,
extraídas de una población, es llamada el error estándar de la media. De la misma manera, la desviación
estándar de las proporciones de todas las muestras posibles del mismo tamaño, extraídas de una
población, es llamada el error estándar de la proporción.
La diferencia entre los términos "desviación estándar" y "error de estándar" es que la primera se
refiere a los valores originales, mientras que la última está relacionada con valores calculados. Un
estadístico es un valor calculado, obtenido con los elementos incluidos en una muestra.
1,95 2,15 1,83 2,04 2,02 1,80 1,85 2,05 1,99 1,95
xi x i
1,95 2,15 1,83 2,04 2,02 1,80 1,85 2,05 1,99 1,95 19,63
x i 1
i 1
1,963
n 10 10 10
x 1,96 1,96
Como es una estimación puntual, se establece que la estatura promedio de los jugadores de
baloncesto de esta liga es aproximadamente 1.96 metros.
216 212 218 217 211 217 215 211 209 214
Con un nivel de confianza de 95% determinar la velocidad de lectura promedio de todos los
estudiantes de la misma escuela.
Se calcula la media aritmética de la muestra de 10 estudiantes:
10
x 216 212 218 217 211 217 215 211 209 214 2140
i
x i 1
214
10 10 10
Se calcula la desviación estándar de la muestra de 10 estudiantes:
10
x x
2
S
2 i 1
i
216 214 212 214 218 214 217 214 211 214
2 2 2 2 2
10 10
217 2142 215 2142 211 2142 209 2142 214 2142
10
2 2 4 3 3 3 12 3 5 0 2
2 2 2 2 2 2 2 2
10
4 4 16 9 9 9 1 9 25 0 86
8,6
10
S 8,6 2,9 ; x 214 ; n 10
Nivel de confianza: 95%, entonces 1 0,95 0,05
Entonces el valor crítico es: 0,05 0,025 t 9; 0975 2,262
2
S 8,6 S 8,6
x t 9,1 2 214 2,262 208 x t n 1,1 2 214 2,262 220
n 10 n 10
P208 220 0,95 , es decir que hay un 95% de probabilidad de que la velocidad de lectura
promedio de todos los estudiantes de la misma escuela este entre 208 y 220.
Ejemplo: Considerando los datos del Ejemplo anterior, encontrar en el intervalo de confianza de
Unidad Nº4 Página 12
IES ESTANISLAO MALDONES PROFESORADODE EDUCACIÓN SECUNDARIA EN MATEMÁTICA
ESTADÍSTICA - Prof. Lucía Micaela Cuello Año Lectivo 2021
Entonces: P 4,6 2 23,3 0,9
Ejemplo: Una encuesta de 100 alumnos, escogidos al azar de todos los alumnos de la Facultad
de Ciencias Exactas, indicó que el 65% utiliza Internet para sus estudios. Encontrar los límites de
confianza del 99%.
p 0,65 ; n 100 ; Nivel de confianza: 99%, entonces 1 0,99 0,01
0,01 0,005 z 2,58
2
p1 p 0,651 0,65
pz 0,65 2,58 0,65 0,123 0,53
n 100
p1 p 0,651 0,65
pz 0,65 2,58 0,65 0,123 0,77
n 100
El intervalo para el nivel de confianza 99% es 0,53 P 0,77 . Es decir que la proporción de
alumnos de la Facultad de Ciencias Exactas que utiliza Internet para sus estudios está entre el 53% y
77%.
En el siguiente cuadro se presenta una síntesis de lo necesario para determinar intervalos de
confianza para media, varianza y proporción poblacional.
Características Valor
Parámetro Estadístico Probabilidad Intervalo de confianza
de la población crítico
MEDIA
𝜎 𝜎
(Muestras x z 𝑃 (𝑥̅ − 𝑧 ≤ 𝜇 ≤ 𝑥̅ + 𝑧 )=1−𝛼
grandes)
2 √𝑛 √𝑛
y
2 (𝑛 − 1 )𝑆 2 (𝑛 − 1) 𝑆 2
2
S 2
2n 1 𝑃( ≤ 𝜎2 ≤ )=1−𝛼
VARIANZA
2(𝑛−1, 2(𝑛−1,
1 𝛼⁄ )
2 1−𝛼⁄2)
2
𝑝(1 − 𝑝) 𝑝(1 − 𝑝)
PROPORCIÓN P p z 𝑃 (𝑝 − 𝑧√ ≤ 𝑃 ≤ 𝑝 + 𝑧√ ) =1−𝛼
2 𝑛 𝑛
MEDIA
𝑆 𝑆
(Muestras x t n1 1 𝑃 (𝑥̅ − 𝑡(𝑛−1, 𝛼
1− 2 ) ≤ 𝜇 ≤ 𝑥̅ + 𝑡(𝑛−1, 𝛼
1− 2 ) ) =1−𝛼
2 √𝑛 √𝑛
chicas)