0% encontró este documento útil (0 votos)
48 vistas13 páginas

Unidad 4

La unidad se centra en el muestreo y la estimación de parámetros en estadística, abordando la importancia de seleccionar muestras representativas para hacer inferencias sobre poblaciones. Se discuten los factores que afectan la precisión de los resultados, como el tamaño de la muestra y la variación en los datos, así como los métodos de muestreo probabilístico y no probabilístico. Además, se presentan fórmulas para calcular el tamaño de la muestra y el error muestral, destacando la necesidad de un marco de muestreo adecuado y la correcta interpretación de los resultados.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
48 vistas13 páginas

Unidad 4

La unidad se centra en el muestreo y la estimación de parámetros en estadística, abordando la importancia de seleccionar muestras representativas para hacer inferencias sobre poblaciones. Se discuten los factores que afectan la precisión de los resultados, como el tamaño de la muestra y la variación en los datos, así como los métodos de muestreo probabilístico y no probabilístico. Además, se presentan fórmulas para calcular el tamaño de la muestra y el error muestral, destacando la necesidad de un marco de muestreo adecuado y la correcta interpretación de los resultados.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

IES ESTANISLAO MALDONES PROFESORADODE EDUCACIÓN SECUNDARIA EN MATEMÁTICA

ESTADÍSTICA - Prof. Lucía Micaela Cuello Año Lectivo 2021

UNIDAD Nº 4
MUESTREO. ESTIMACIÓN DE PARÁMETROS

1. INTRODUCCIÓN
Con frecuencia la investigación estadística se centra en una población de tal magnitud que, por
motivos prácticos, económicos y de tiempo, sólo es posible incluir en la investigación, algunos de sus
miembros. La finalidad de Estadística, en estos casos, es hacer inferencia acerca de una población con
base en la información contenida en una muestra.
Dos factores afectan la cantidad de información contenida en la muestra, y por lo tanto incide en la
precisión de los resultados. El primero es el tamaño de la muestra seleccionada de la población. El
segundo es la variación en los datos; la variación frecuentemente puede ser controlada por el método de
selección de la muestra.
En la primera parte de esta materia se han desarrollado metodologías que permiten efectuar una
adecuada exploración de los datos, etapa fundamental en el comienzo de cualquier análisis estadístico.
También se han presentado conceptos importantes respecto del muestreo.
En esta unidad se inicia el análisis confirmatorio de datos, ligado a la Estadística Inferencial, que
comprende una serie de técnicas de uso imprescindible para tomar decisiones con respecto a la cuestión
planteada al comienzo del análisis de datos.
El objetivo más importante de la Estadística es obtener una inferencia con respecto a la población
basándose en la información contenida en una muestra. Como las poblaciones se describen mediante
medidas numéricas denominadas parámetros, el objetivo de la mayoría de las investigaciones
estadísticas es deducir una inferencia con respecto a uno o más parámetros de la población.
Es necesario destacar aquí que las decisiones tomadas ante la situación de incertidumbre que
implica inferir de casos particulares a la generalidad, deben estar respaldadas por la objetividad que
garantiza la aplicación del método científico.
De este modo, los resultados obtenidos en situaciones experimentales, serán idealizados de
acuerdo a un modelo probabilístico conveniente, permitiendo medir en términos de probabilidad la
incertidumbre que trae aparejada la generalización de los resultados. En otras palabras, se podrá medir
y comunicar el “error” que se puede cometer o la confianza que se deposita en las decisiones.
Aplicar cualquier metodología estadística inferencial sin estudiar a fondo el cumplimiento de los
supuestos en los cuales ella está basada, lleva irremediablemente a conclusiones erróneas.
Los cálculos pueden realizarse con un software de cálculo o estadístico, mientras que la
responsabilidad insoslayable del trabajo estadístico radica en la elección de la metodología adecuada
para analizar los datos y en la correcta interpretación de los resultados.

2. MUESTREO
Es un procedimiento mediante el cual, se trata de obtener una muestra que resulte representativa
de la población a la que pertenece, con el fin de que se pueda realizar una buena inferencia.
Lo primero que se debe hacer es delimitar la población que va a ser estudiada y sobre el cual se
pretende generalizar los resultados. Por lo tanto, se debe responder a las siguientes preguntas:
 ¿De qué grupo de individuos (población en estudio) se desea sacar una muestra?
 ¿Cuántos individuos se necesita tener en esta muestra?
 ¿Cómo se seleccionarán los individuos?
La población de estudio debe estar claramente definida, por ejemplo, según edad, sexo, residencia
u otra variable de interés. Y una población de estudio puede constar no sólo de personas, sino también
de instituciones, hogares, etc.
Se debe distinguir dos tipos de poblaciones:
Población objeto: es la población de la cual se quiere obtener la información.
Población muestreada: es la población conocida.
En algunos casos estas dos poblaciones coinciden.

Unidad Nº4 Página 1


IES ESTANISLAO MALDONES PROFESORADODE EDUCACIÓN SECUNDARIA EN MATEMÁTICA
ESTADÍSTICA - Prof. Lucía Micaela Cuello Año Lectivo 2021

Al delimitar la población, luego se debe tener en cuenta que la muestra que se desea obtener debe
ser representativa de la población. Será representativa cuando el comportamiento o las características de
la población aparecen reflejadas en la muestra. Para interpretar dicha condición, se da el siguiente
concepto:
Muestra aleatoria: se obtiene de manera tal que todos los elementos de la población, de la cual
proviene, tienen una probabilidad conocida de ser seleccionados.
Los términos al azar y aleatorios denotan un tipo de procedimiento mecánico relacionado con la
probabilidad y con la selección de elementos, pero no logra esclarecer el tipo de muestra y el
procedimiento de muestreo.

2.1. Tamaño de la muestra


Cuando se selecciona una muestra aleatoria, uno debe preguntarse cuál es el número de unidades
de observación que se necesita para conformar una muestra (𝑛) que asegure un error muestral pequeño,
dado que la población es aproximadamente de 𝑁 elementos; o a veces no se conoce la cantidad de
individuos de la población.
El procedimiento a seguir para determinar el tamaño de una muestra se desarrolla a continuación.
Al trabajar con una muestra se obtienen resultados aproximados de la población, la diferencia entre
el valor real de la población y el valor que se obtiene de la muestra se llama error muestral, lo que se
pretende es que este error sea lo menos significativo posible, es decir se debe tratar de que este error
sea un valor lo más pequeño posible.
Generalmente el error muestral es determinado por el investigador, a veces esta impuesto; de
acuerdo al error que se determinó es que se calcula el tamaño de la muestra. En algunas investigaciones
se decide, sin hacer ningún cálculo el tamaño de la muestra, esto es por cuestiones que hacen a la
economía o a la agilidad del trabajo; en estos casos se debe calcular el error muestral que se comete rá
con el tamaño de muestra decido.
A continuación, se presentan las fórmulas que se utilizan para el cálculo del tamaño de la muestra
o para determinar el error a cometer con un tamaño de muestra predeterminado.

Población finita
Cuando la población es finita, el tamaño de la muestra se calcula con la siguiente fórmula:
𝑧 22 𝑁  𝑁−𝑛
𝑛 = (𝑁−1) 𝐸2 +𝑧 2 2 , donde el error muestral es: 𝐸 = 𝑧 √ 𝑁−1
√𝑛

Población infinita
Cuando la población es infinita, el tamaño de la muestra se calcula con la siguiente fórmula:
𝑧 22 
𝑛= , donde el error muestral es: 𝐸 = 𝑧
𝐸2 √𝑛

𝜎 2 es la varianza de la población, que puede conocerse por estudios anteriores o se lo calcula


tomando una muestra piloto.

Cálculo del valor crítico Z


El número z que aparece en las fórmulas se llama valor crítico, el procedimiento para determinar su
valor se indica a continuación.
 Se determina el nivel de confianza y se lo expresa como un valor de probabilidad, esto es:
𝑃
Nivel de confianza = 𝑃% ⇒ 100 = 1 − 𝛼
𝑃
 Se calcula α, que es el margen de error, esto es: 𝛼 = 1 −
100
 Se divide al margen de error en 2 y se busca en la tabla de la distribución normal el valor de
𝛼
z que le corresponde, es decir 2 = 𝑃(𝑧)

Unidad Nº4 Página 2


IES ESTANISLAO MALDONES PROFESORADODE EDUCACIÓN SECUNDARIA EN MATEMÁTICA
ESTADÍSTICA - Prof. Lucía Micaela Cuello Año Lectivo 2021

Por ejemplo, el valor crítico para el nivel de confianza de 95% se encuentra así:
95
𝑁𝐶 = 95% ⇒ = 0,95 = 1 − 𝛼
100
⇒ 𝛼 = 1 − 0,95 = 0,0
𝛼 0,05
⇒ = = 0,025 = 𝑃 (𝑧) ⇒ 𝑧 = ±1,96
2 2
Otro ejemplo, el valor crítico para el nivel de confianza de 90% se encuentra así:
90
𝑁𝐶 = 90% ⇒ 100 = 0,9 = 1 − 𝛼
⇒ 𝛼 = 1 − 0,9 = 0,1
𝛼 0,1
⇒ = = 0,05 = 𝑃 (𝑧) ⇒ 𝑧 = ±1,64
2 2

2.2. Elementos del muestreo


Unidad de observación: Es aquella unidad de la cual se desea obtener información. Ejemplo:
personas, animales, objetos, pacientes.

Marco de muestreo: Consiste en la totalidad de las unidades en las que se puede dividir a la
totalidad de la población. Ejemplo: la población es alumnos de un IES, entonces se pueden tomar como
unidades a las carreras que se dictan en ese IES.

Unidad de muestreo: Es la unidad que se selecciona del marco de muestreo. Puede o no ser igual
a la unidad de observación. Ejemplo: Unidad de muestreo pueden ser las postas sanitarias y la unidad de
observación los niños menores de 5 años atendidos en las postas.
En consecuencia: La muestra es un conjunto de unidades de observación.

Procedimiento de selección: El procedimiento de selección para obtener una muestra depende,


entre otros de:
 Los objetivos del estudio
 De las características de la población
 Del comportamiento de la variable que se investiga
 De la disponibilidad de recursos

2.3. Tipos de muestreo


Un aspecto importante que influye en la selección del método de muestreo más apropiado es la
disponibilidad del marco de muestreo, es decir una lista de todas las unidades que constituyen la
población de estudio. Pues de la disposición de él, será posible obtener una muestra de unidades de
observación de forma que se conozca la probabilidad correspondiente a las diversas unidades de la
población. Caso contrario no se puede hablar de probabilidades. En consecuencia, los métodos de
muestreo pueden ser Probabilístico y No probabilístico.

Métodos de muestreo probabilístico


Un Muestreo es Probabilístico cuando todos los elementos que componen la población tienen una
probabilidad conocida de ser incluidos en la muestra.
Las muestras probabilísticas son esenciales en los diseños de investigación por encuestas en donde
se pretende hacer estimaciones de variables en la población, estas variables se miden con instrumentos
de medición y se estudian con pruebas estadísticas para el análisis de datos, en donde se presupone que
la muestra es probabilística.
Si la población es homogénea, cualquier muestra proporciona el mismo resultado y el procedimiento
de selección carece de importancia. Pero cuando el universo es heterogéneo como sucede en la mayoría
de los casos, el procedimiento mediante el cual se obtiene la muestra es decisivo y se hace necesario
utilizar un procedimiento que nos indique cuántas unidades de observación tomar, y cómo seleccionarlas
de modo de obtener conclusiones válidas para el total.

Unidad Nº4 Página 3


IES ESTANISLAO MALDONES PROFESORADODE EDUCACIÓN SECUNDARIA EN MATEMÁTICA
ESTADÍSTICA - Prof. Lucía Micaela Cuello Año Lectivo 2021

Por lo explicado, se presenta a continuación los tipos de muestreos probabilísticos más frecuentes,
las muestras que se obtienen tienen muchas ventajas, la principal es que puede medirse el tamaño de
error en las predicciones. Por lo que el principal objetivo en el diseño de una muestra probabilística es el
de reducir al mínimo este error al que se le llama error estándar.
Para una muestra probabilística se necesita principalmente dos cosas: determinar el tamaño de la
muestra (n) v seleccionar los elementos que forman la muestra.
Para lo primero, se la fórmula, para lo segundo se necesita de un marco de selección adecuado y
de un procedimiento que permita la aleatoriedad en la selección.

2.3.1. Muestreo aleatorio simple (MAS)


En el muestreo aleatorio simple al azar, todas las muestras y todos los elementos tienen la misma
probabilidad de ser seleccionados. Esa probabilidad es conocida y diferente de cero y de uno.
La probabilidad para un individuo, de ser extraído de la población para la muestra, resulta de:
1
𝑝= 𝐷𝑜𝑛𝑑𝑒 𝑁 𝑒𝑠 𝑒𝑙 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛
𝑁
Esta probabilidad es la misma para cada individuo.
El muestreo aleatorio simple es el más sencillo, y sirve de base para los restantes.

El procedimiento a seguir en el MAS es el siguiente:


1) Se enumeran a todos los individuos que componen la población en forma correlativa de
"1" a "N" (marco de muestreo)
2) Se determina el tamaño de la muestra
3) Se selecciona aleatoriamente las unidades de observación. Esta selección puede ser por
sorteo o utilizando un listado de números aleatorios de cualquier de números aleatorios, o bien se usa la
función ran de una calculadora o también se usa la función muestra del Excel, u otro procedimiento que
asegure igual probabilidad de selección

En el M.A.S. no es permitida la doble inclusión de una misma unidad en la muestra. Esto significa
que la muestra debe estar constituida por n unidades diferentes.

Ventajas
 Igual probabilidad de inclusión de todos los individuos en la muestra
 Permite la generalización
 Tiende a reflejar todas las características del universo, esto es, cuando el tamaño de la
muestra crece, ésta se hace cada vez más representativa de la población

Desventajas
 Necesita un listado completo de todas las unidades que componen la población
 Supone un tamaño de muestra mayor que otros diseños para obtener un mismo nivel de
confianza
 El costo para obtener la información de las unidades de análisis crece con la dispersión
espacial de las mismas

Aplicaciones
Se presentan algunos ejemplos en los que es aplicado el MAS.
Ciencias sociales: Estimar la proporción de votantes registrados que apoyan alguna propuesta
política popular, o estimar el número promedio de personas votantes por familia.
Ciencias físicas: Considerar un experimento de laboratorio, tal como medir la resistencia de tensión
de un alambre. Aquí la población es meramente conceptual y su media representa la resistencia promedio
del alambre de un tipo determinado.
Educación: Determinar la proporción de estudiantes en la universidad que están a favor del cambio
del sistema semestral al trimestral.
Salud: Proporción elevada de abandono de controles de pacientes hipertensos en consultorios en
una ciudad Y.

Unidad Nº4 Página 4


IES ESTANISLAO MALDONES PROFESORADODE EDUCACIÓN SECUNDARIA EN MATEMÁTICA
ESTADÍSTICA - Prof. Lucía Micaela Cuello Año Lectivo 2021

2.3.2. Muestreo sistemático


Es muy similar al muestreo aleatorio simple. Se debe confeccionar un listado de todos los elementos
de la población, la diferencia estriba en el método para la selección de los casos. Es el procedimiento
más aplicado por su sencillez y rapidez. Su característica es la selección de unidades tomando una de
cada k individuos, siendo k el espaciamiento de muestreo, dado por la expresión:
𝑁
𝑘= 𝐷𝑜𝑛𝑑𝑒 𝑁 𝑒𝑠 𝑒𝑙 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 𝑦 𝑛 𝑒𝑙 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
𝑛
No se puede seleccionar exactamente a k cuando el tamaño de la población es desconocido.

Se supone una población de 50.000 individuos, una vez hecho el listado y determinado el tamaño
de la muestra (ejemplo 1000 unidades de observación), se procede así:
50000
 Se calcula k, e este caso es 𝑘 = = 50
1000
 Se selecciona al azar un número comprendido entre 01 y k, a esta primera unidad de
muestreo seleccionada se la denomina unidad de arranque (en el ejemplo de 01 a 50)
 A partir de ese número se selecciona las unidades siguientes, sumándole a la unidad de
arranque k, 2k, 3k, etc., hasta obtener el tamaño de muestra deseado. Supóngase que el número
seleccionado sea el 15, entonces se extraen los individuos 15, 65, 115, 165, 215, ... (es decir cada 50
individuos)
 Completar el tamaño de la muestra (en el ejemplo hasta obtener 1000 unidades de
observación)

Ventajas
 las ventajas técnicas son similares a las del muestreo aleatorio simple, obteniéndose mucha
más representatividad de la población con el muestreo sistemático.
 Tiene una gran ventaja económica ya que facilita la selección de la muestra.

Desventajas
 Cuando la población presenta variaciones periódicas (variaciones cíclicas) en la ordenación
de sus elementos el muestreo sistemático no es aconsejable.
 No es conveniente cuando la población está ordenada de acuerdo a algún criterio.
El muestreo sistemático es presentado como una alternativa para el M.A.S. y es más fácil de llevar
a cabo y, por lo tanto, está menos expuesto que el M.A.S. a los errores del estimador. Y proporciona más
información que el M.A.S. por unidad de costo. Para elegir entre estos dos tipos de muestreo se debe
considerar el tipo de población que se investiga.

Aplicación
Un ejemplo en el que se aplicó este procedimiento es:
En el Ministerio de Salud están interesados en el número total de personas que son atendidos en
un Hospital, durante un periodo de 180 días. Puesto que el control de atención de cada día lleva tiempo,
y con la finalidad de contar con la información lo antes posible, las autoridades del ministerio deciden
obtener estos datos cada décimo día registrado, en los últimos 180 días. Se obtiene así una muestra
sistemática de 1 en 10.

2.3.3. Muestreo estratificado


Este tipo de muestra es conveniente cuando la población puede ser dividida en categorías, estratos
o grupos diferentes o heterogéneos, que tienen un interés analítico.
Una manera de evitar la influencia de esta heterogeneidad en los resultados es agrupar los
individuos más o menos semejantes en subpoblaciones y muestrear cada una de las subpoblaciones
como si se tratara de poblaciones independientes. Los distintos grupos formados se denominan estratos.
La ventaja que ofrece la estratificación es que mediante ella se logra una mayor homogeneización de la
muestra final.
Por ejemplo: se puede estratificar una población según sexo, edad, estrato socioeconómico, nivel
ocupacional, etc.

Unidad Nº4 Página 5


IES ESTANISLAO MALDONES PROFESORADODE EDUCACIÓN SECUNDARIA EN MATEMÁTICA
ESTADÍSTICA - Prof. Lucía Micaela Cuello Año Lectivo 2021

Nótese que la estratificación es llevada a cabo usando el conocimiento de una variable auxiliar,
como se indicó en el ejemplo.
Una vez definidos los estratos, es posible diferenciar dos tipos de muestras estratificadas:
 Muestra estratificada proporcional
 Muestra estratificada no proporcional
La muestra estratificada proporcional es aquella en la cual la fracción de muestreo es igual para
cada estrato, si existen diferencias en las fracciones de muestreo, se llama a ésta no proporcional.
La fracción de muestreo para el muestreo proporcional es:
𝑛
𝑓=
𝑁
Para el muestreo no proporcional se fija un tamaño de muestra para cada estrato, sin ser
proporcional a la población.
Una vez determinada la proporción o el tamaño de muestra (para el no proporcional), se seleccionan
las muestras, dentro de cada estrato, según el procedimiento del muestreo aleatorio simple.

Ventajas
 La muestra es más homogénea, garantizando la representatividad
 Elimina los errores en la estimación que son producto de diferencias entre estratos

Desventajas
 Supone el conocimiento previo de las características de la población, a partir de las cuales
se estratifica
 Son de costo más elevado que las aleatorias simples, en dinero y en tiempo
 Exigen tratamientos estadísticos de cálculo más complejo
 La muestra estratificada proporcional algunas veces puede no proveer de un número
suficiente de casos para análisis comparativos Inter-estratos

Aplicación
Un ejemplo en el que se aplicó este procedimiento es:
Atención de salud en adultos mayores en zonas urbanas y zonas rurales, por lo que el marco de
muestreo debe dividirse en dos (residentes en áreas urbanas y residentes en áreas rurales). Luego la
muestra aleatoria de tamaño predeterminado tendrá que obtenerse a partir de cada estrato (grupo).

2.3.4. Muestreo por conglomerado


En términos generales, el investigador considera el muestreo por conglomerado en aquellos casos
en los cuales la población a estudiar está dispersa a lo largo de áreas geográficas extensas, donde los
costos para alcanzar las unidades resultan ser muy elevados.
El muestreo por conglomerado es un diseño efectivo para obtener una cantidad específica de
información al costo mínimo, bajo las siguientes condiciones:
 No se encuentra disponible o es muy costoso un buen marco que liste los elementos de la
población, mientras que se puede lograr fácilmente un marco que liste los conglomerados
 El costo por obtener observaciones se incrementa con la distancia que separa los elementos
Procedimiento para la selección de la muestra:
 Se divide la población en conglomerados (grupos) lo más homogéneo que sea posible
 Se selecciona al azar una proporción determinada de conglomerados
 Se selecciona todas las unidades dentro de estos conglomerados obteniéndose la muestra
de un escalón o de una sola etapa

Ventajas
 La ventaja principal es la concentración de las unidades en áreas, representando una
economía en términos de costos y tiempo.
 Las ofrecidas en los muestreos antes mencionados

Unidad Nº4 Página 6


IES ESTANISLAO MALDONES PROFESORADODE EDUCACIÓN SECUNDARIA EN MATEMÁTICA
ESTADÍSTICA - Prof. Lucía Micaela Cuello Año Lectivo 2021

Desventajas
 Exige tratamientos estadísticos algo complejos.
 En comparación al muestreo aleatorio simple y al estratificado, representa pérdida de
precisión.

Aplicación
Un ejemplo en el que se aplicó este procedimiento es:
En un estudio de los conocimientos, actitudes y prácticas relacionados con la planificación familiar
en localidades rurales de la región oeste de Catamarca, se construye una lista de todas las localidades
rurales. En base de la lista, se selecciona una muestra aleatoria de localidades rurales y se entrevista a
todos los adultos de las localidades seleccionadas.

2.3.5. Muestreo por etapas múltiples


En poblaciones grandes y diversas, el muestreo puede realizarse en dos ó más etapas. Este es
frecuentemente el caso de los estudios de base comunitaria, en los cuales las personas que han de
entrevistarse proceden de diversas localidades y las localidades han de seleccionarse en distintas zonas
o departamentos.

Aplicaciones
Un ejemplo en el que se aplicó este procedimiento es:
En un estudio sobre la utilización de letrinas con pozo negro en un departamento, se efectúa una
visita a 50 domicilios para entrevistar a los miembros de la familia, así como para hacer observaciones
sobre las clases y limpiezas de las letrinas. El departamento está constituida por seis divisiones
administrativas y en cada división hay de 6 a 9 localidades.
En este caso se debe efectuar muestreos en varias etapas, una para seleccionar las divisiones
administrativas de los departamentos y luego se deben seleccionar las localidades de las divisiones, y
por último los domicilios de las localidades que serán visitados.

2.3.6. Criterios de selección del muestreo apropiado

Muestreo aleatorio simple: cuando la cantidad de casos es abundante, en términos generales


debe ser preferida al resto de las otros muestreos. Particularmente cuando no se conoce lo suficiente
sobre los parámetros poblacionales. Y se aplica cuando la población es uniforme.

Muestreo estratificado: cuando es posible estratificar la población, se lo debe hacer, puesto que
ello homogeniza la muestra y los cálculos resultan más representativos.

Muestreo por Conglomerado: si bien tiene algunas limitaciones en término de inferencia,


representa muchas veces la única alternativa, cuando los recursos disponibles son escasos.

Muestreo sistemático: debe ser utilizado únicamente en aquellos casos en que resulte imposible
o demasiado costoso aplicar una muestra aleatoria simple.

Unidad Nº4 Página 7


IES ESTANISLAO MALDONES PROFESORADODE EDUCACIÓN SECUNDARIA EN MATEMÁTICA
ESTADÍSTICA - Prof. Lucía Micaela Cuello Año Lectivo 2021

Métodos de muestreo no probabilísticos


Un Muestreo es No Probabilístico cuando la selección de los elementos de la muestra no es
aleatoria, es decir no depende de la probabilidad, sino de causas relacionadas con las características del
investigador o de quien obtiene la muestra.
Aquí el procedimiento no es aleatorio, ni en base a fórmulas de probabilidad, sino que depende del
proceso de toma de decisiones de una persona o grupos de personas, y desde luego, las muestras
seleccionas por decisiones subjetivas tienden a estar sesgadas.

Estos métodos son:


 Muestreo casual
 Muestreo intencional o de conveniencia
 Muestreo por cuotas

Estas muestras tienen poco valor en término de estimaciones, pues no es posible a partir de ellas
calcular el error de estimación de los parámetros.
Las muestras no probabilísticas, las cuales se llaman también dirigidas, suponen un procedimiento
de selección informal y un poco arbitrario.

2.3.7. Muestreo por cuotas


También denominado en ocasiones “accidental”. Se asienta generalmente sobre la base de buen
conocimiento de los estratos de la población y/o de los individuos más representativos o “adecuados”
para los fines de la investigación. Mantiene por lo tanto semejanzas con el muestreo aleatorio
estratificado, pero no tiene el carácter de aleatoriedad.
En este tipo de muestreo se fijan unas “cuotas” que consisten en un número de individuos que
reúnen unas determinadas condiciones, por ejemplo 20 individuos de 20 a 45 años, de sexo femenino y
residentes en Barrio Parque américa, de la Capital de Catamarca. Una vez determinada la cuota se eligen
los primeros que se encuentren que cumplan esas características.

2.3.8. Muestras Intencionales o de conveniencia


Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras
“representativas” mediante la inclusión en la muestra de grupos supuestamente típicos. Es muy frecuente
su utilización en sondeos preelectorales de zonas que en anteriores votaciones han marcado tendencia
de voto.
También puede ser que el investigador directa e intencionalmente los individuos de la población. El
caso más frecuente de este procedimiento es utilizar como muestra los individuos a los que se tiene fácil
acceso.

2.3.9. Bola de nieve


Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y así hasta conseguir
una muestra suficiente. Este tipo de muestreo se emplea frecuentemente cuando se hacen estudios
poblaciones marginales, por ejemplo delincuentes, sectas, determinado tipo de enfermos, etc.

2.3.10. Discrecional
A criterio del investigador los individuos son elegidos sobre lo que él cree que pueden aportar al
estudio.

Unidad Nº4 Página 8


IES ESTANISLAO MALDONES PROFESORADODE EDUCACIÓN SECUNDARIA EN MATEMÁTICA
ESTADÍSTICA - Prof. Lucía Micaela Cuello Año Lectivo 2021

3. ESTIMACIÓN

3.1. Conceptos básicos


Para comprender el proceso de estimación se deben tener claro el lenguaje utilizado, es decir se
deben comprender conceptos muy utilizados, algunas de estas definiciones ya se vieron, pero lo mismo
se las presenta a continuación.
Parámetro
Es una medida poblacional que se calcula teniendo en cuenta todos los elementos que componen
una población. Por ejemplo la media poblacional, que se simboliza con la letra griega , o la varianza
poblacional, que se simboliza con 2.
Los parámetros poblacionales son generalmente imposibles de calcular, entonces se los estima en
base a las medidas muestrales.

Estadístico
En la práctica, casi siempre se trabaja con muestras. Las medidas calculadas a partir de
observaciones muestrales, se llaman estadísticos muestrales. Es decir que un estadístico es una medida
que se calcula teniendo en cuenta solamente los elementos que integran una muestra determinada. Por
ejemplo la media muestral que se simboliza con 𝑥̅ , o la varianza muestral que se simboliza S2.
Cuando en una investigación se trabajó con una muestra, los estadísticos muestrales se utilizan
para estimar los parámetros poblaciones.
El proceso por medio del cual se establecen relaciones entre los estadísticos muestrales y los
parámetros poblacionales es el objeto de la inferencia estadística.

Error Estándar
La desviación estándar de una distribución, en el muestreo de un estadístico, es frecuentemente
llamada el error estándar del estadístico.
Por ejemplo, la desviación estándar de las medias de todas la muestras posibles del mismo tamaño,
extraídas de una población, es llamada el error estándar de la media. De la misma manera, la desviación
estándar de las proporciones de todas las muestras posibles del mismo tamaño, extraídas de una
población, es llamada el error estándar de la proporción.
La diferencia entre los términos "desviación estándar" y "error de estándar" es que la primera se
refiere a los valores originales, mientras que la última está relacionada con valores calculados. Un
estadístico es un valor calculado, obtenido con los elementos incluidos en una muestra.

Error muestral o error de muestreo


La diferencia entre el resultado obtenido de una muestra (un estadístico) y el resultado que se
debería haber obtenido de la población (el parámetro correspondiente) se llama el error muestral o error
de muestreo.
Un error de muestreo usualmente ocurre cuando no se lleva a cabo la encuesta completa de la
población, sino que se toma una muestra para estimar las características de la población. El error muestral
es medido por el error estadístico, en términos de probabilidad, bajo la curva normal. El resultado de la
media indica la precisión de la estimación de la población basada en el estudio de la muestra. Mientras
más pequeño es el error muestral, mayor es la precisión de la estimación.
Deberá hacerse notar que los errores cometidos en una encuesta por muestreo, tales como
respuestas inconsistentes, incompletas o no determinadas, no son considerados como errores
muéstrales. Los errores no muéstrales pueden también ocurrir en una encuesta completa de la población.

Unidad Nº4 Página 9


IES ESTANISLAO MALDONES PROFESORADODE EDUCACIÓN SECUNDARIA EN MATEMÁTICA
ESTADÍSTICA - Prof. Lucía Micaela Cuello Año Lectivo 2021

3.2. Estimación de parámetros


La estimación es el proceso que permite el cálculo estimado del valor de un parámetro en base al
estadístico correspondiente. Es decir que la estimación es la aplicación de la inferencia estadística a partir
de los valores observados en la muestra estudiada para la generalización a la población.
En una estimación de parámetros debe conocerse:
 Variabilidad de la distribución poblacional, si no se conoce, puede obtenerse una aproximación
en los datos aportados por la literatura científica o en un estudio piloto
 Precisión con que se desea obtener la estimación
 Nivel de confianza deseado, es la probabilidad de precisión de la estimación. Se expresa en
porcentaje y habitualmente se fija en el 95%, que corresponde a un valor alfa de 0,05

Estimador: definición y propiedades


Un estimador es una regla que establece como calcular la estimación basándose en la información
de una muestra. Generalmente se expresa mediante una fórmula.
Un buen estimador debe ser:
 Insesgado: Un estimador insesgado es aquel para el cual la media de la distribución
muestral es el parámetro estimado. La media muestral es un estimador insesgado de la media
poblacional
 Eficiente: La eficiencia se refiere al tamaño de error estándar del estadístico. Si se
compara dos estadísticos de una muestra del mismo tamaño y se trata de decidir cuál de ellos es
un estimador más eficiente, se escoge el que tiene el menor error estándar
 Consistente: Un estadístico es un estimador consistente de un parámetro de población, si
al aumentar el tamaño de la muestra se tiene casi la certeza de que el valor del estadístico se
aproxima bastante al valor del parámetro de la población
 Suficiente: Un estimador es suficiente si utiliza una cantidad de la información contenida
de la muestra que ningún otro estimador podría extraer información adicional de la muestra sobre
el parámetro de la población que se está estimando

3.3. Métodos de estimación


Los métodos de estimación básicamente son dos: Estimación puntual y Estimación por intervalos
de confianza.

3.3.1. Estimación puntual


El objetivo de la estimación puntual es obtener valores aproximados de parámetros poblacionales.
Consiste en considerar que el parámetro poblacional es aproximadamente igual al estimador. Se
determina un valor único para estimar el parámetro.
Ejemplo: Los siguientes datos corresponden a una muestra aleatoria de las estaturas de jugadores
de baloncesto de una liga local:

1,95 2,15 1,83 2,04 2,02 1,80 1,85 2,05 1,99 1,95

Se va a realizar una estimación puntual de la estatura promedio de los jugadores de baloncesto de


esta liga. Para ello se calcula la media aritmética de la muestra de 10 basquetbolistas:
n 10

 xi x i
1,95  2,15  1,83  2,04  2,02  1,80  1,85  2,05  1,99  1,95 19,63
x i 1
 i 1
   1,963
n 10 10 10
x  1,96    1,96
Como es una estimación puntual, se establece que la estatura promedio de los jugadores de
baloncesto de esta liga es aproximadamente 1.96 metros.

Unidad Nº4 Página 10


IES ESTANISLAO MALDONES PROFESORADODE EDUCACIÓN SECUNDARIA EN MATEMÁTICA
ESTADÍSTICA - Prof. Lucía Micaela Cuello Año Lectivo 2021

3.3.2. Estimación por intervalos de confianza


La estimación puntual, al estimar un parámetro a través de un único valor no es muy conveniente,
pues con ella no se puede determinar el error de muestreo, ni la precisión de la estimación, ni la confianza
que merece tal estimación.
Hay otro método para hacer una estimación mucho más precisa, la estimación por intervalos de
confianza.
Al procedimiento de encontrar un intervalo de valores dentro del cual se espera que se encuentre
un parámetro poblacional es conocido como estimación por intervalos de confianza.
El nivel de confianza es la probabilidad de que el parámetro poblacional se encuentre dentro del
intervalo. Los niveles de confianza más ampliamente usados son 0.95 y 0.99, sin embargo puede usarse
cualquier probabilidad cercana a 1.
Para entender mejor el concepto de intervalo de confianza vamos a suponer que seleccionamos
100 muestras de una población y calculamos la media de las muestras e intervalos de confianza del 95%
para cada muestra. Descubriremos que cerca de 95 de los 100 intervalos de confianza contienen la media
poblacional.

Pasos para construir un intervalo de confianza


El procedimiento que se sigue para encontrar un intervalo de confianza para un parámetro es el
siguiente:
1. Calcular los estadísticos de la muestra
2. Determinar el error estándar
3. Establecer el nivel de confianza, que es la probabilidad de que el parámetro a estimar se
encuentre en el intervalo de confianza. Los valores que se suelen utilizar para el nivel de confianza
son el 90%, 95%, 99% y 99,9%
4. Determinar el valor crítico
5. Calcular el error de estimación
6. Determinar los límites del intervalo de confianza e interpretar

Intervalo de confianza de la media



El intervalo de confianza para la media es x  E, x  E  donde E  z es el error
n
muestral y los límites de confianza son x  E  xE.
 
Es decir que: P x  E    x  E  1  

O bien: hay una probabilidad de 1   de que   x  E, x  E 
Ejemplo: Se aplicó una prueba especial de aptitud a 58 estudiantes de primer año de una escuela.
En los resultados se encontró una calificación media de 82 y una varianza de 49. Establecer el intervalo
de confianza de 90% para la calificación media de todos los estudiantes de la escuela.
n  58, x  82
 2  49    49  7
Nivel de confianza: 90%, entonces   1  0,9  0,1

Entonces el valor crítico es:   0,1   0,05  z  1,64
2
7
E  1,64  1,51  x  E  82  1,51  80,49    x  E  82  1,51  83,51
58
P80    84  0,90 , es decir que hay un 90% de probabilidad de que la calificación media
de todos los estudiantes de la escuela es entre 80 y 84.

Unidad Nº4 Página 11


IES ESTANISLAO MALDONES PROFESORADODE EDUCACIÓN SECUNDARIA EN MATEMÁTICA
ESTADÍSTICA - Prof. Lucía Micaela Cuello Año Lectivo 2021

Intervalo de confianza de la media para muestras chicas y  desconocido


En estos casos, dado que no se conoce la varianza poblacional, no se puede utilizar la distribución
normal estándar para calcular el valor crítico, para estimar por intervalos el parámetro media se recurre a
la distribución t de Student. En intervalo de confianza es:
S S  S S 
x  t n1,1  2    x  t n1,1 2     x  t n1,  2 , x  t n1,1 2 
n n  n n
 S S 
Es decir: P x  t n1,1 2    x  t n1,1 2   1
 n n

Ejemplo: A continuación se presenta la velocidad de lectura de 10 estudiantes de una escuela,


antes de una estrategia, implementada por un profesor, para aumentar la velocidad:

216 212 218 217 211 217 215 211 209 214

Con un nivel de confianza de 95% determinar la velocidad de lectura promedio de todos los
estudiantes de la misma escuela.
Se calcula la media aritmética de la muestra de 10 estudiantes:
10

x 216  212  218  217  211  217  215  211  209  214 2140
i
x i 1
   214
10 10 10
Se calcula la desviación estándar de la muestra de 10 estudiantes:
10

 x  x
2

S 
2 i 1
i

216  214  212  214  218  214  217  214  211  214
2 2 2 2 2

10 10


217  2142  215  2142  211  2142  209  2142  214  2142 
10
2   2   4  3   3  3  12   3   5  0 2
2 2 2 2 2 2 2 2
 
10
4  4  16  9  9  9  1  9  25  0 86
   8,6
10
S  8,6  2,9 ; x  214 ; n  10
Nivel de confianza: 95%, entonces   1  0,95  0,05

Entonces el valor crítico es:   0,05   0,025  t 9; 0975  2,262
2
S 8,6 S 8,6
x  t 9,1  2  214  2,262  208  x  t n 1,1 2  214  2,262  220
n 10 n 10
P208    220  0,95 , es decir que hay un 95% de probabilidad de que la velocidad de lectura
promedio de todos los estudiantes de la misma escuela este entre 208 y 220.

Intervalo de confianza de la varianza


n  1S 2   2  n  1S 2   2   n  1S 2 , n  1S 2  donde  2 y  2n 1,  
   n 1, 1 
 n 1,  
2
 n 1, 1 
2
  n 1,  
2
 n 1, 1  
2
2 2
2 2  2 2 

son valores de la distribución chi cuadrado

Ejemplo: Considerando los datos del Ejemplo anterior, encontrar en el intervalo de confianza de
Unidad Nº4 Página 12
IES ESTANISLAO MALDONES PROFESORADODE EDUCACIÓN SECUNDARIA EN MATEMÁTICA
ESTADÍSTICA - Prof. Lucía Micaela Cuello Año Lectivo 2021

la varianza de la población de los estudiantes de la escuela, establecer el nivel de confianza 90%.


S 2  8,6 ; n  10 ; Nivel de confianza: 90%, entonces   1  0,9  0,1

  0,1   0,05   92; 0,95  3,325   92; 0.05  16,919
2
n  1S 2

10  1 8,6  4;57 
n  1S 2  10  1 8,6  23,27
 2n11  16,919  2n1  3,325
2 2


Entonces: P 4,6   2  23,3  0,9 

Intervalo de confianza de la proporción


p1  p  p1  p   p1  p  p1  p  
pz  P pz  P   p  z , pz 

n n  n n 

Ejemplo: Una encuesta de 100 alumnos, escogidos al azar de todos los alumnos de la Facultad
de Ciencias Exactas, indicó que el 65% utiliza Internet para sus estudios. Encontrar los límites de
confianza del 99%.
p  0,65 ; n  100 ; Nivel de confianza: 99%, entonces   1  0,99  0,01

  0,01   0,005  z  2,58
2
p1  p  0,651  0,65
pz  0,65  2,58  0,65  0,123  0,53
n 100
p1  p  0,651  0,65
pz  0,65  2,58  0,65  0,123  0,77
n 100
El intervalo para el nivel de confianza 99% es 0,53  P  0,77 . Es decir que la proporción de
alumnos de la Facultad de Ciencias Exactas que utiliza Internet para sus estudios está entre el 53% y
77%.
En el siguiente cuadro se presenta una síntesis de lo necesario para determinar intervalos de
confianza para media, varianza y proporción poblacional.

Características Valor
Parámetro Estadístico Probabilidad Intervalo de confianza
de la población crítico
MEDIA
  𝜎 𝜎
(Muestras x z 𝑃 (𝑥̅ − 𝑧 ≤ 𝜇 ≤ 𝑥̅ + 𝑧 )=1−𝛼
grandes)
2 √𝑛 √𝑛

y
2 (𝑛 − 1 )𝑆 2 (𝑛 − 1) 𝑆 2
 2
S 2
 2n 1 𝑃( ≤ 𝜎2 ≤ )=1−𝛼
VARIANZA
 2(𝑛−1, 2(𝑛−1,
1 𝛼⁄ )
2 1−𝛼⁄2)
2
 𝑝(1 − 𝑝) 𝑝(1 − 𝑝)
PROPORCIÓN P p z 𝑃 (𝑝 − 𝑧√ ≤ 𝑃 ≤ 𝑝 + 𝑧√ ) =1−𝛼
2 𝑛 𝑛

MEDIA
  𝑆 𝑆
(Muestras x t n1 1 𝑃 (𝑥̅ − 𝑡(𝑛−1, 𝛼
1− 2 ) ≤ 𝜇 ≤ 𝑥̅ + 𝑡(𝑛−1, 𝛼
1− 2 ) ) =1−𝛼
2 √𝑛 √𝑛
chicas)

Unidad Nº4 Página 13

También podría gustarte