0% encontró este documento útil (0 votos)
58 vistas9 páginas

Selección de Muestras en Estadística Inferencial

Este documento describe cómo seleccionar una muestra aleatoria simple de una población finita. Explica que una muestra aleatoria simple garantiza que cada muestra posible tenga la misma probabilidad de ser seleccionada. Luego, detalla el proceso de asignar números aleatorios a cada elemento de la población y seleccionar la muestra correspondiente a los números aleatorios más pequeños. Finalmente, aplica este método para seleccionar una muestra aleatoria simple de 30 empleados de una población de 2,500 empleados de una empresa.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
58 vistas9 páginas

Selección de Muestras en Estadística Inferencial

Este documento describe cómo seleccionar una muestra aleatoria simple de una población finita. Explica que una muestra aleatoria simple garantiza que cada muestra posible tenga la misma probabilidad de ser seleccionada. Luego, detalla el proceso de asignar números aleatorios a cada elemento de la población y seleccionar la muestra correspondiente a los números aleatorios más pequeños. Finalmente, aplica este método para seleccionar una muestra aleatoria simple de 30 empleados de una población de 2,500 empleados de una empresa.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Maestría en Administración

Universidad Autónoma de Occidente

UNIVERSIDAD AUTÓNOMA DE OCCIDENTE


UNIDAD REGIONAL LOS MOCHIS

MAESTRÍA EN ADMINISTRACIÓN
Modalidad Virtual

Curso:
Modelos Cuantitativos Empresariales

Eje Temático III.- Estadística Inferencial


Tema: 03.1.- Seleccionando una muestra
Maestría en Administración
Universidad Autónoma de Occidente

Introducción
A la hora de recopilar datos, normalmente queremos conocer algunas características de la
población, la recopilación de todos los elementos de interés, de los que estamos recopilando
esos datos. Para conocer con certeza alguna característica de una población, debemos
recopilar datos de cada elemento de la población de interés; tal esfuerzo se conoce como
censo. Sin embargo, existen muchas dificultades potenciales asociadas con la realización de
un censo:
• Un censo puede resultar caro; si los recursos son limitados, es posible que no sea
factible realizar un censo.
• Un censo puede llevar mucho tiempo; si es necesario recopilar los datos rápidamente,
es posible que un censo no sea adecuado.
• Un censo puede inducir a error; si la población cambia rápidamente, cuando se
complete un censo, los datos pueden estar obsoletos.
• Un censo puede ser innecesario; Si no se requiere información perfecta sobre las
características de la población de interés, un censo puede resultar excesivo.
• Un censo puede no ser práctico; si las observaciones son destructivas, realizar un
censo destruiría la población de interés.
Para superar las posibles dificultades asociadas con la realización de un censo, podemos
decidir tomar una muestra (un subconjunto de la población) y, posteriormente, utilizar los
datos de la muestra que recopilamos para hacer inferencias y responder preguntas de
investigación sobre la población de interés.
Por lo tanto, el objetivo del muestreo es recopilar datos de un subconjunto de la población
que sea lo más similar posible a toda la población para que lo que aprendamos de los datos
simples refleje con precisión lo que queremos entender sobre toda la población. Cuando
usamos los datos de muestra que hemos recopilado para hacer estimaciones o sacar
conclusiones sobre una o más características de una población (el valor de uno o más
parámetros), estamos usando el proceso de inferencia estadística.
Selección de una muestra
Al director de personal de Electronics Associates, Inc. (EAI) se le ha asignado la tarea de
desarrollar un perfil de los 2,500 empleados de la empresa. Las características a identificar
incluyen el salario medio anual de los empleados y la proporción de empleados que han
completado el programa de formación en gestión de la empresa. Utilizando los 2,500
empleados como población para este estudio, podemos encontrar el salario anual y el estado
del programa de capacitación para cada individuo consultando los registros de personal de la
empresa. El conjunto de datos que contiene esta información para los 2,500 empleados de la
población se encuentra en el archivo EAI. Un factor medible que define una característica de
una población, proceso o sistema se llama parámetro. Para EAI, nos interesan el salario medio
anual de la población 𝜇, la desviación estándar de la población de los salarios anuales 𝜎 y la
proporción de la población 𝑝 de empleados que completaron el programa de capacitación.
Maestría en Administración
Universidad Autónoma de Occidente

Utilizando los datos de EAI, calculamos la media de la población y la desviación estándar de


la población para los datos de salario anual.
𝑀𝑒𝑑𝑖𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙: 𝜇 = $51,800
𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟 𝑑𝑒 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛: 𝜎 = $4,000
Los datos del estado del programa de formación muestran que 1,500 de los 2,500 empleados
completaron el programa de formación. Si p denota la proporción de la población que
completó el programa de capacitación, vemos que p=1,500 / 2,500=0.60. El salario medio
anual de la población (𝜇 = 51,800), la desviación estándar poblacional del salario anual (𝜎 =
$ 4,000) y la proporción de la población que completó el programa de capacitación (p=0.60)
son parámetros de la población de empleados de EAI. Ahora suponga que la información
necesaria sobre todos los empleados de EAI no estuviera disponible en la base de datos de la
empresa. La pregunta que debemos considerar es cómo el director de personal de la empresa
puede obtener estimaciones de los parámetros de población utilizando una muestra de
empleados en lugar de los 2500 empleados de la población. Suponga que se utilizará una
muestra de 30 empleados. Claramente, el tiempo y el costo de desarrollar un perfil serían
sustancialmente menores para 30 empleados que para toda la población. Si el director de
personal pudiera estar seguro de que una muestra de 30 empleados proporcionaría
información adecuada sobre la población de 2500 empleados, sería preferible trabajar con
una muestra que trabajar con toda la población. Exploremos la posibilidad de utilizar una
muestra para el estudio de EAI considerando primero cómo podemos identificar una muestra
de 30 empleados.
Muestreo de una población finita
Los estadísticos recomiendan seleccionar una muestra probabilística al tomar muestras de
una población finita porque una muestra probabilística le permite hacer inferencias
estadísticas válidas sobre la población. El tipo más simple de muestra probabilística es
aquella en la que cada muestra de tamaño n tiene la misma probabilidad de ser seleccionada.
Se llama muestra aleatoria simple. Una muestra aleatoria simple de tamaño n de una
población finita de tamaño N se define como sigue.
MUESTRA ALEATORIA SIMPLE (POBLACIÓN FINITA)
Una muestra aleatoria simple de tamaño n de una población finita de tamaño N es una
muestra seleccionada de modo que cada muestra posible de tamaño n tenga la misma
probabilidad de ser seleccionada.

Los procedimientos utilizados para seleccionar una muestra aleatoria simple de una
población finita se basan en el uso de números aleatorios. Podemos usar la función
ALEATORIO de Excel para generar un número aleatorio entre 0 y 1 ingresando la fórmula
= ALEATORIO() en cualquier celda de una hoja de trabajo. El número generado se denomina
número aleatorio porque el procedimiento matemático utilizado por la función ALEATORIO
garantiza que todo número entre 0 y 1 tiene la misma probabilidad de ser seleccionado.
Maestría en Administración
Universidad Autónoma de Occidente

Veamos cómo se pueden usar estos números aleatorios para seleccionar una muestra aleatoria
simple.
Nuestro procedimiento para seleccionar una muestra aleatoria simple de tamaño n de una
población de tamaño N implica dos pasos.
• Paso 1. Asigne un número aleatorio a cada elemento de la población.
• Paso 2. Seleccione los n elementos correspondientes a los n números aleatorios más
pequeños.
Dado que cada conjunto de n elementos de la población tiene la misma probabilidad de que
se le asignen los n números aleatorios más pequeños, cada conjunto de n elementos tiene la
misma probabilidad de ser seleccionado para la muestra. Si seleccionamos la muestra usando
este procedimiento de dos pasos, toda muestra de tamaño n tiene la misma probabilidad de
ser seleccionada; por tanto, la muestra seleccionada satisface la definición de muestra
aleatoria simple.
Consideremos el proceso de seleccionar una muestra aleatoria simple de 30 empleados de
EAI de una población de 2500. Comenzamos generando 2500 números aleatorios, uno para
cada empleado de la población. Luego seleccionamos 30 empleados correspondientes a los
30 números aleatorios más pequeños como nuestra muestra. Consulte la Figura 6.1 mientras
describimos los pasos involucrados.
• Paso 1. En la celda D1, ingrese el texto Números aleatorios
• Paso 2. En las celdas D2: D2501, ingrese la fórmula =ALEATORIO ()
• Paso 3. Seleccione el rango de celdas D2: D2501
• Paso 4. En la pestaña Inicio de la cinta:
o Haga clic en Copiar en el grupo Portapapeles.
o Haga clic en la flecha debajo de Pegar en el grupo Portapapeles.
Cuando aparece la ventana de pegar, haga clic en Valores en el área
Pegar valores
o Presione la tecla Esc
• Paso 5. Seleccione las celdas A1: D2501
• Paso 6. En la pestaña Datos de la cinta, haga clic en Ordenar en el grupo Ordenar y
filtrar
• Paso 7. Cuando aparezca el cuadro de diálogo Ordenar:
o Seleccione la casilla de verificación de Mis datos tienen
encabezados
o En el primer menú desplegable Ordenar por, seleccione
Números aleatorios
o Haga clic en Aceptar
Después de completar estos pasos obtenemos una hoja de trabajo como la que se muestra a
la derecha en la Figura 6.1. Los empleados enumerados en las filas 2 a 31 son los que
corresponden a los 30 números aleatorios más pequeños que se generaron. Por tanto, este
Maestría en Administración
Universidad Autónoma de Occidente

grupo de 30 empleados es una muestra aleatoria simple. Tenga en cuenta que los números
aleatorios que se muestran a la derecha en la Figura 6.1 están en orden ascendente y que los
empleados no están en su orden original. Por ejemplo, el empleado 770 de la población está
asociado con el número aleatorio más pequeño y es el primer elemento de la muestra, y el
empleado 147 población se ha incluido como la observación 24 en la muestra (fila 25 de la
hoja de trabajo a la derecha).
Figura 6.1. Uso de Excel para seleccionar una muestra aleatoria simple

Muestreo de una población infinita


A veces queremos seleccionar una muestra de una población, pero la población es
infinitamente grande o los elementos de la población se generan mediante un proceso
continuo para el que no hay límite en la cantidad de elementos que se pueden generar. Por lo
tanto, no es posible desarrollar una lista de todos los elementos de la población. Este se
considera el caso de población infinita. Con una población infinita, no podemos seleccionar
una muestra aleatoria simple porque no podemos construir un marco que consta de todos los
elementos. En el caso de la población infinita, los estadísticos recomiendan seleccionar lo
que se llama una muestra aleatoria.
Maestría en Administración
Universidad Autónoma de Occidente

MUESTRA ALEATORIA (POBLACIÓN INFINITA)Una muestra aleatoria de tamaño n de


una población infinita es una muestra seleccionada de modo que se satisfagan las siguientes
condiciones.
1. Cada elemento seleccionado proviene de la misma población.
2. Cada elemento se selecciona de forma independiente.
Se debe tener cuidado y juicio al implementar el proceso de selección para obtener una
muestra aleatoria de una población infinita. Cada caso puede requerir un procedimiento de
selección diferente. Consideremos dos ejemplos para ver qué queremos decir con las
condiciones: (1) Cada elemento seleccionado proviene de la misma población, y (2) cada
elemento se selecciona de forma independiente.
Una aplicación de control de calidad común implica un proceso de producción para el que
no hay límite en el número de elementos que se pueden producir. La población conceptual
de la que estamos muestreando son todos los elementos que podrían producirse (no solo los
que se producen) por el proceso de producción en curso. Debido a que no podemos
desarrollar una lista de todos los elementos que podrían producirse, la población se considera
infinita. Para ser más específicos, consideremos una línea de producción diseñada para llenar
cajas con cereal de desayuno hasta un peso medio de 24 onzas por caja. Un inspector de
control de calidad selecciona periódicamente muestras de 12 cajas llenas por este proceso
para determinar si el proceso está funcionando correctamente o si, quizás, un mal
funcionamiento de la máquina ha provocado que el proceso comience a llenar las cajas de
forma insuficiente o excesiva.
Con una operación de producción como esta, la mayor preocupación al seleccionar una
muestra aleatoria es asegurarse de que se cumpla la condición 1, los elementos muestreados
se seleccionan de la misma población. Para garantizar que se cumpla esta condición, las
casillas deben seleccionarse aproximadamente en el mismo momento. De esta manera, el
inspector evita la posibilidad de seleccionar algunas cajas cuando el proceso está funcionando
correctamente y otras cajas cuando el proceso no está funcionando correctamente y está
llenando insuficientemente o sobrellenando las cajas. Con un proceso de producción como
este, la segunda condición, cada elemento se selecciona de forma independiente, se satisface
diseñando el proceso de producción para que cada caja de cereal se llene de forma
independiente.
Con esta suposición, el inspector de control de calidad solo debe preocuparse por satisfacer
la misma condición de población.
Como otro ejemplo de selección de una muestra aleatoria de una población infinita, considere
la población de clientes que llegan a un restaurante de comida rápida. Suponga que se le pide
a un empleado que seleccione y entreviste a una muestra de clientes para desarrollar un perfil
de los clientes que visitan el restaurante. El proceso de llegada de clientes está en curso y no
hay forma de obtener una lista de todos los clientes de la población. Entonces, a efectos
prácticos, la población para este proceso en curso se considera infinita. Siempre que se diseñe
Maestría en Administración
Universidad Autónoma de Occidente

un procedimiento de muestreo de modo que todos los elementos de la muestra sean clientes
del restaurante y sean seleccionados de forma independiente, se obtendrá una muestra
aleatoria. En este caso, el empleado que recolecta la muestra debe seleccionar la muestra de
las personas que ingresan al restaurante y realizan una compra para asegurarse de que se
cumpla la misma condición de población. Si, por ejemplo, la persona seleccionada para la
muestra es alguien que entró al restaurante solo para usar el baño, esa persona no sería un
cliente y se violaría la misma condición de población. Entonces, siempre que el entrevistador
seleccione la muestra de personas que realizan una compra en el restaurante, se cumple la
condición 1. Asegurarse de que los clientes se seleccionen de forma independiente puede ser
más difícil.
El propósito de la segunda condición del procedimiento de selección de muestra aleatoria
(cada elemento se selecciona de forma independiente) es evitar el sesgo de selección. En este
caso, se produciría un sesgo de selección si el entrevistador tuviera la libertad de seleccionar
clientes para la muestra de forma arbitraria. El entrevistador puede sentirse más cómodo
seleccionando clientes de un grupo de edad en particular y puede evitar clientes de otros
grupos de edad. El sesgo de selección también ocurriría si el entrevistador seleccionara un
grupo de cinco clientes que ingresaran juntos al restaurante y les pidiera a todos que
participaran en la muestra. Es probable que tal grupo de clientes exhiba características
similares, lo que podría proporcionar información engañosa sobre la población de clientes.
El sesgo de selección como este puede evitarse asegurándose de que la selección de un cliente
en particular no influya en la selección de ningún otro cliente. En otras palabras, los
elementos (clientes) se seleccionan de forma independiente.
McDonald's, una cadena de restaurantes de comida rápida, implementó un procedimiento de
muestreo aleatorio para esta situación. El procedimiento de muestreo se basó en el hecho de
que algunos clientes presentaron cupones de descuento. Siempre que un cliente presentaba
un cupón de descuento, se le pedía al siguiente cliente atendido que completara un
cuestionario de perfil de cliente. Debido a que los clientes que llegaban presentaban cupones
de descuento al azar e independientemente de otros clientes, este procedimiento de muestreo
aseguró que los clientes fueran seleccionados de forma independiente. Como resultado, la
muestra satisfizo los requisitos de una muestra aleatoria de una población infinita.
Las situaciones que involucran el muestreo de una población infinita generalmente se asocian
con un proceso que opera en el tiempo. Los ejemplos incluyen piezas que se fabrican en una
línea de producción, pruebas experimentales repetidas en un laboratorio, transacciones que
ocurren en un banco, llamadas telefónicas que llegan a un centro de soporte técnico y clientes
que ingresan a una tienda minorista. En cada caso, la situación puede verse como un proceso
que genera elementos a partir de una población infinita.
Siempre que los elementos muestreados se seleccionen de la misma población y se
seleccionen de forma independiente, la muestra se considera una muestra aleatoria de una
población infinita.
Maestría en Administración
Universidad Autónoma de Occidente

Estimación puntual
Ahora que hemos descrito cómo seleccionar una muestra aleatoria simple, volvamos al
problema de EAI. En la Tabla 6.1 se muestra una muestra aleatoria simple de 30 empleados
y los datos correspondientes sobre salario anual y participación en programas de capacitación
gerencial. La notación x1, x2, etc. se utiliza para denotar el salario anual del primer empleado
de la muestra, el salario anual del segundo empleado de la muestra, etc. La participación en
el programa de formación en gestión se indica con Sí en la columna del programa de
formación en gestión.
Para estimar el valor de un parámetro de población, calculamos una característica
correspondiente de la muestra, denominada estadística de muestra. Por ejemplo, para estimar
la media poblacional 𝜇 y la desviación estándar poblacional 𝜎 para el salario anual de los
empleados de EAI, usamos los datos de la Tabla 6.1 para calcular las estadísticas de muestra
correspondientes: la media muestral y la desviación estándar muestral.
La media muestral es

y la desviación estándar de la muestra es


Maestría en Administración
Universidad Autónoma de Occidente

Para estimar p, la proporción de empleados en la población que completaron el programa de


capacitación gerencial, usamos la proporción muestral correspondiente 𝑝̅ . Sea x el número
de empleados de la muestra que completaron el programa de capacitación gerencial. Los
datos de la tabla 6.1 muestran que x=19. Por lo tanto, con un tamaño de muestra de n=30, la
proporción de la muestra es:

Al realizar los cálculos anteriores, realizamos el procedimiento estadístico llamado


estimación puntual. Nos referimos a la media muestral 𝑥̅ como el estimador puntual de la
media poblacional 𝜇 la desviación estándar muestral 𝑠 como el estimador puntual de la
desviación estándar poblacional 𝑠, y la proporción muestral 𝑝̅ como el estimador puntual de
la proporción poblacional p. El valor numérico obtenido para 𝑥̅ , s o p se llama estimación
puntual. Por lo tanto, para la muestra aleatoria simple de 30 empleados de EAI que se muestra
en la tabla 6.1, $51,814 es la estimación puntual de 𝜇, $ 3,348 es la estimación puntual de s
y 0.63 es la estimación puntual de p. La Tabla 6.2 resume los resultados de la muestra y
compara las estimaciones puntuales con los valores reales de los parámetros de población.
Como se desprende de la tabla 6.2, las estimaciones puntuales difieren algo de los valores de
los parámetros de población correspondientes. Esta diferencia es de esperar porque se está
utilizando una muestra, y no un censo de toda la población, para desarrollar las estimaciones
puntuales.
Tabla 6.2. Resumen de estimaciones puntuales obtenidas de una muestra aleatoria simple
de 30 empleados de EAI
Valor de
Parámetro de población parámetro Estimador de puntos Punto estimado

µ=Población salario medio


anual $51,800 𝑥̅ =Muestra de salario medio anual $51,814
𝜎 =Desviación estándar de
la población para el salario s=Desviación estándar muestral del
anual $4,000 salario anual $3,348
p=Proporción de la
población que completó el 𝑝̅ =Proporción de la muestra que ha
programa de formación en completado el programa de
gestión 0.6 formación en gestión 0.63

También podría gustarte