0% encontró este documento útil (0 votos)
32 vistas28 páginas

Muestreo y Probabilidades en Estadística

Estadistica

Cargado por

202247831
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
32 vistas28 páginas

Muestreo y Probabilidades en Estadística

Estadistica

Cargado por

202247831
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

UNIVERSIDAD SAN CARLOS DE GUATEMALA,

CENTRO UNIVERSITARIO DE SAN MARCOS.

NOMBRE:
Karen Beatriz Escobar Quiquivix

Carné:
202247831

Carrera:
Contaduría Pública y Auditoria

Curso:
Estadística

Docente:
Gustavo Ixcott

Ciclo Escolar
2024
INTRODUCCIÓN

Se denomina muestreo al proceso por el que generamos las muestras. Una muestra
es una parte (un subconjunto) de la población, y se desea que la muestra sea lo
más representativa posible de la población de la que procede. Sin embargo, por
muy cuidadosa que sea la selección de la muestra difícilmente será una
representación exacta de la población. Esto significa que su tendencia central,
variabilidad, etc., aproximarán las de la población, pero habrá cierta diferencia, que
interesa sea lo menor posible. Un concepto clave de muestreo es el de
representatividad: Los procedimientos de muestreo tienen por objeto generar
muestras lo más representativas posible de las poblaciones dados los objetivos de
la investigación y las circunstancias que afectan al muestreo.

Desde un punto de vista aplicado, se denomina muestreo el proceso de selección


de la muestra o muestras a utilizar para la investigación. Esto supone generar una
o pocas muestras. Actualmente es de interés la selección de muestras para la
simulación informática de los procesos de muestreo, particularmente para la
obtención de distribuciones muestrales. En estos casos el número de muestras
generadas puede ser muy grande (10.000, 80.000, o más) y el procedimiento de
muestreo se realiza informáticamente y con procedimientos específicos.
OBJETIVOS

GENERAL:

 Estudiar las relaciones existentes entre la distribución de una variable en la


población blanco y las distribución de ésta variable en la muestra a estudio.

ESPECIFICOS:
 El objetivo de la elaboración y la aplicación de encuestas es la recopilación
de datos suficientes para inferir sobre una población. Normalmente las
encuestas se usan para investigar sobre más de una variable, ya que
procedimiento no es sencillo en la mayoría de los casos.
INVESTIGACION

UNIDAD 3
PROBABILIDADES Y DISTRIBUCIÓN DE PROBABILIDAD
La distribución de probabilidad es una herramienta fundamental para la prospectiva,
puesto que con ella es posible diseñar un escenario de acontecimientos futuros
considerando las tendencias actuales de diversos fenómenos.
Las características más importantes a considerar en una distribución de
probabilidad son:

 La probabilidad de un resultado específico está entre cero y uno.


 La suma de las probabilidades de todos los resultados mutuamente excluyentes
es 1.

Toda distribución de probabilidad se genera por una variable (debido a que puede
tomar diferentes valores) aleatoria x (porque el valor que se toma es completamente
al azar), y puede ser de dos tipos:
1. Variable aleatoria discreta (x)
Solo puede tomar valores representados por números enteros y un número finito de
ellos. Por ejemplo:
X variable que nos define el número de alumnos aprobados en el curso de historia
universal en un grupo de 30 alumnos (1, 2 ,3 y así sucesivamente ó los 30).
2. Propiedades de una variable aleatoria discreta (X)
Las probabilidades que se relacionan con cada uno de los valores que toma x deben
ser mayores o iguales a cero y menores o iguales a 1:
P (xi) < 1
La sumatoria de las probabilidades asociadas a cada uno de los valores que toma
x debe ser igual a 1:
E p (xi) = 1
Ejemplo de variable aleatoria discreta: Al lanzar una moneda se puede obtener solo
dos resultados: cara (50%) o sello (50%).

En la siguiente tabla vemos los posibles resultados de lanzar dos veces una
moneda:
Si realizamos la tabla de distribución del número posible de caras que se obtiene al
lanzar una moneda dos veces, obtendremos:

Variable aleatoria continua (x)


Esta puede tomar tanto valores expresados en números enteros como fraccionarios
y un número infinito de ellos dentro de un mismo intervalo. Por ejemplo:
x es la variable que nos define la concentración en gramos de oro de algunas
muestras de mineral (7.4 gr, 6.1, 1.9, 23.3, 12.7, 8.1, 9.5, 11.8, ... n)
Propiedades de una variable aleatoria discreta (X)
Las probabilidades vinculadas a cada uno de los valores que toma x deben ser
mayores o iguales a cero. Dicho de otro modo: la función de densidad de
probabilidad deberá tomar solo valores mayores o iguales a cero.
El área definida bajo la función de densidad de probabilidad deberá ser de 1.
Esperanza matemática o valor esperado
El valor esperado de una variable aleatoria X es el promedio ponderado de todos
los valores posibles.

La esperanza matemática o valor esperado de una variable aleatoria se origina en


los juegos de azar, debido a que los apostadores deseaban saber su esperanza de
ganar repetidamente un juego. Por lo tanto, el valor esperado representa la cantidad
de dinero promedio que el jugador está dispuesto a ganar o perder después de un
número grande de apuestas.

PROBABIIDAD EN INVESTIGACION
¿Qué es la probabilidad?
El término probabilidad proviene de lo probable, o sea, de aquello que es más
posible que ocurra, y se entiende como el mayor o menor grado de posibilidad
de que un evento aleatorio ocurra, expresado en una cifra entre 1 (posibilidad
total) y 0 (imposibilidad absoluta), o bien en porcentajes entre el 100% o el 0%,
respectivamente.

Para obtener la probabilidad de un suceso, generalmente se determina


la frecuencia con la que ocurre (en experimentos aleatorios bajo condiciones
estables), y se procede a realizar cálculos teóricos.
Para ello se sigue lo establecido por la Teoría de la probabilidad, una rama de
las matemáticas dedicada al estudio de la probabilidad. Esta disciplina es
largamente empleada por otras ciencias
naturales y sociales como disciplina auxiliar, ya que les permite manejar
escenarios posibles en base a generalizaciones.

El origen de la probabilidad reside en la necesidad del ser humano de


anticiparse a los hechos, y de predecir en cierta medida el futuro. Así, en su
empeño por percibir patrones y conexiones en la realidad, se enfrentó
constantemente al azar, o sea, a lo que carece de orden.

Las primeras consideraciones formales sobre esta materia provienen del siglo XVII,
específicamente de la correspondencia entre Pierre de Fermat y Blaise Pascal en
1654, o de los estudios de Christiaan Huygens en 1657 y de la Kybeia de Juan
Caramuel en 1649, texto hoy en día perdido.

Puede servirte: Polígono de frecuencias

Tipos de probabilidad
Existen los siguientes tipos de probabilidad:

 Frecuencial. Aquella que determina la cantidad de veces que un fenómeno


puede ocurrir, considerando un número determinado de oportunidades, a través
de la experimentación.
 Matemática. Pertenece al ámbito de la aritmética, y aspira al cálculo en cifras
de la probabilidad de que determinados eventos aleatorios tengan lugar, a partir
de la lógica formal y no de su experimentación.
 Binomial. Aquella en la que se estudia el éxito o fracaso de un evento, o
cualquier otro tipo de escenario probable que tenga dos posibles resultados
únicamente.
 Objetiva. Se denomina así a toda probabilidad en la que conocemos de
antemano la frecuencia de un evento, y simplemente se dan a conocer los casos
probables de que ocurra dicho evento.
 Subjetiva. Contrapuesta a la matemática, se sustenta en ciertas eventualidades
que permiten inferir la probabilidad de un evento, aunque alejada de una
probabilidad certera o calculable. De allí su subjetividad.
 Hipergeométrica. Aquella que se obtiene gracias a técnicas de muestreo,
creando grupos de eventos según su aparición.
 Lógica. La que posee como rasgo característico que establece la posibilidad de
ocurrencia de un hecho a partir de las leyes de la lógica inductiva.
 Condicionada. Aquella que se emplea para comprender la causalidad entre dos
hechos distintos, cuando puede determinarse la ocurrencia de uno tras la
ocurrencia del otro.
Ejemplos de probabilidad
En meteorología, la probabilidad se calcula considerando múltiples condicionantes.
La probabilidad se halla continuamente a nuestro alrededor. Los ejemplos más
obvios de ella tienen que ver con juegos de azar: los dados, por ejemplo. Es posible
determinar la frecuencia de aparición de cada cara, a partir de una serie continua
de lanzamientos del dado. O también puede hacerse con la lotería, aunque ello
exige cálculos tan enormes que, virtualmente, los hace imposibles de predecir.

También lidiamos con la probabilidad cuando consultamos el pronóstico del


tiempo, y se nos advierte un cierto porcentaje de probabilidad de lluvia.
Dependiendo de la cifra, será más o menos probable que llueva, pero podría ocurrir
que no suceda, dado que se trata de una predicción, no de una certeza.

Fórmula para calcular la probabilidad


El cálculo de las probabilidades se lleva a cabo según la fórmula siguiente:

Probabilidad = Casos favorables / casos posibles x 100 (para llevarlo a


porcentaje)

Así, por ejemplo, podemos calcular la probabilidad de que una moneda salga cara
en un único lanzamiento, pensando que sólo puede salir una cara (1) de las dos que
hay (2), esto es, 1 / 2 x 100 = 50% de probabilidad.

En cambio, si decidimos calcular cuántas veces saldrá la misma cara en dos


lanzamientos seguidos, deberemos pensar que el caso favorable (cara y cara o sello
y sello) es uno entre cuatro posibilidades de resultado (cara y cara, cara y sello,
sello y cara, sello y sello). Por ende, 1 / 4 x 100 = 25% de probabilidad.

Aplicaciones de la probabilidad
El cálculo de la probabilidad tiene numerosas aplicaciones en la vida cotidiana,
como son:

 El análisis de riesgo empresarial. Según el cual se estiman las posibilidades


de caída de precio de las acciones bursátiles, y se intenta predecir la
conveniencia o no de la inversión en una u otra empresa.
 El análisis estadístico de la conducta. De importancia para la sociología,
emplea la probabilidad para evaluar la posible conducta de la población, y así
predecir tendencias de pensamiento o de opinión. Es común verlo en las
campañas electorales.
 La determinación de garantías y seguros. Procesos en los que se evalúa la
probabilidad de avería de los productos o la fiabilidad de un servicio (o de un
asegurado, por ejemplo), para así saber cuánto tiempo de garantía conviene
ofrecer, o a quiénes conviene asegurar y por cuánto.
 En la ubicación de partículas subatómicas. Según el Principio de
Incertidumbre de Heisenberg, el cual establece que no podemos saber dónde
está una partícula subatómica en un momento determinado y al mismo tiempo a
qué velocidad se mueve, de modo que los cálculos en la materia se realizan
normalmente en términos probabilísticos: existe X por ciento de probabilidades
de que la partícula esté allí.
 En la investigación biomédica. Se calculan porcentajes de éxito y de fracaso
de las drogas médicas o de las vacunas, para así saber si son fiables o no, y si
conviene o no producirlas en masa, o a qué porcentaje de la población podrán
causarle determinados efectos secundarios.

LA PROBABILIDAD DE UN EVENTO.

¿Qué es probabilidad del evento?

La probabilidad del evento es la probabilidad de que ocurra un resultado o evento


específico. Lo opuesto de un evento es un no evento. La probabilidad del evento
también se conoce como probabilidad pronosticada. La probabilidad del evento
estima la probabilidad de que ocurra un evento, como sacar un as de un mazo de
cartas o producir una pieza no conforme. La probabilidad de un evento varía de 0
(imposible) a 1 (seguro).

Cada ejecución en un experimento se denomina ensayo. Por ejemplo, si lanza una


moneda al aire 10 veces y registra el número de caras, realiza 10 ensayos del
experimento. Si los ensayos son independientes e igual de probables, usted puede
estimar la probabilidad del evento dividiendo el número de eventos entre el número
total de ensayos. Por ejemplo, si obtiene 6 caras en 10 lanzamientos de moneda, la
probabilidad estimada del evento (obtener caras) es:

Número de eventos ÷ Número de ensayos = 6 ÷ 10 = 0.6

Una probabilidad de evento acumulada estima la probabilidad de que ocurra un


conjunto de eventos (por ejemplo, la probabilidad de obtener 4 o menos al lanzar un
dado, lo cual representa la suma de la probabilidad de obtener 1, 2, 3 y 4).

Calcular las probabilidades del evento para la regresión logística binaria

En la regresión logística binaria, una variable de respuesta solo tiene dos valores
posibles, como la presencia o ausencia de una enfermedad específica. Usted puede
ingresar datos de respuesta binaria en Minitab indicando columnas para el número
de eventos y el número de ensayos. La probabilidad del evento es la probabilidad
de que la respuesta para un patrón específico de factores o covariables sea 1 o un
evento (por ejemplo, la probabilidad de que una mujer mayor de 50 años desarrolle
diabetes de tipo 2).

 Calcular valores que existen en los datos de muestra


a. Elija Estadísticas > Regresión > Regresión logística
binaria > Ajustar modelo logístico binario.
b. En Respuesta, ingrese la respuesta. En Predictores continuos,
ingrese los términos. En Predictores categóricos, ingrese los
factores.
c. Haga clic en Almacenamiento y marque Ajustes (probabilidades
del evento). Haga clic en Aceptar en cada cuadro de diálogo.
 Calcular valores para nuevas observaciones
a. Elija Estadísticas > Regresión > Regresión logística
binaria > Ajustar modelo logístico binario.
b. En Respuesta, ingrese la respuesta. En Predictores continuos,
ingrese los términos. En Predictores categóricos, ingrese los
factores. Haga clic en Aceptar.
c. Elija Estadísticas > Regresión > Regresión logística
binaria > Predecir.
d. Ingrese valores individuales o una columna en la que estén
almacenados los valores, para cada predictor incluido en el modelo.
e. Haga clic en Aceptar.

Calcular las probabilidades del evento para regresión logística ordinal y nominal

En la regresión logística ordinal y nominal, una variable de respuesta puede tener


tres o más categorías. La probabilidad del evento es la probabilidad de que un
patrón específico de factores o covariables tenga una categoría específica de
respuesta. La probabilidad acumulada de eventos es la probabilidad de que la
respuesta para un patrón específico de factores o covariables esté en la categoría
k o inferior, para cada k posible, donde k es igual a las categorías de respuesta,
1…k.
 Calcular valores que existen en los datos de muestra
a. Elija Estadísticas > Regresión > Regresión logística
ordinal o Estadísticas > Regresión > Regresión logística
nominal. Los siguientes pasos son iguales para ambos análisis.
b. En Respuesta, ingrese la respuesta. En Modelo, ingrese los
predictores. En Predictores categóricos (opcional), ingrese los
factores.
c. Haga clic en Almacenamiento.
d. En Ingrese el número de eventos, ingrese el número de valores
distintos de la variable de respuesta. A continuación,
marque Probabilidades del evento.
e. Haga clic en Aceptar en cada cuadro de diálogo.

Minitab almacena las probabilidades del evento en las siguientes columnas


disponibles en la hoja de trabajo. El nombre predeterminado de las columnas
comienza con EPROB, seguido de un número.

 Calcular valores para nuevas observaciones


a. Elija Estadísticas > Regresión > Regresión logística
ordinal o Estadísticas > Regresión > Regresión logística
nominal. Los siguientes pasos son iguales para ambos análisis.
b. En Respuesta, ingrese la respuesta. En Modelo, ingrese los
predictores. En Predictores categóricos (opcional), ingrese los
factores.
c. Haga clic en Almacenamiento y marque Coeficientes. Haga clic
en Aceptar en cada cuadro de diálogo.
d. En la hoja de trabajo, escriba los valores para los cuales desea
calcular las probabilidades del evento en las columnas
correspondientes de predictores directamente debajo de los datos
existentes. Debe escribir un valor en la columna de respuesta para
cada fila adicional de datos que ingrese, pero el valor de la respuesta
no afectará los resultados.
e. Elija Estadísticas > Regresión > Regresión logística
ordinal o Estadísticas > Regresión > Regresión logística
nominal.
f. Haga clic en Opciones.
g. Elija Estimaciones para modelo de validación e ingrese COEF1.
Haga clic en Aceptar.
h. Haga clic en Almacenamiento.
i. En Ingrese el número de eventos, ingrese el número de valores
distintos de la variable de respuesta.
j. Marque Probabilidades del evento. Desmarque Coeficientes. Haga
clic en Aceptar en cada cuadro de diálogo.

REGLAS DE LA PROBABILIDAD

Al calcular la probabilidad, hay que tener en cuenta dos reglas para determinar si
dos eventos son independientes o dependientes y si son mutuamente excluyentes
o no.

 La regla de multiplicación
 Si A y B son dos eventos definidos en un espacio muestral,
entonces P(A∩B)=P(B)P(A|B)P(A∩B)=P(B)P(A|B). Podemos pensar que el
símbolo de intersección sustituye a la palabra "y".
 Esta regla también puede escribirse
como: P(A∣∣B)=P(A∩B)P(B)P(A|B)=P(A∩B)P(B)
 Esta ecuación se lee como la probabilidad de A dado que B es igual a la
probabilidad de A y B dividido entre la probabilidad de B.
 Si A y B son independientes, entonces P(A|B)=P(A)P(A|B)=P(A).
Entonces P(A∩B)=P(A|B)P(B)P(A∩B)=P(A|B)P(B) se convierte
en P(A∩B)=P(A)(B)P(A∩B)=P(A)(B) porque
el P(A|B)=P(A)P(A|B)=P(A) si A y B son independientes.
 Una forma fácil de recordar la regla de la multiplicación es que la palabra "y"
significa que el evento tiene que satisfacer dos condiciones. Por ejemplo, el
nombre extraído de la lista de la clase debe ser tanto una mujer como un
estudiante de segundo año. Es más difícil satisfacer dos condiciones que una
sola y, por supuesto, cuando multiplicamos fracciones el resultado es
siempre menor. Esto refleja la creciente dificultad de satisfacer dos
condiciones.
 La regla de adición
 Si A y B están definidos en un espacio muestral,
entonces P(A∪B)=P(A)+P(B)–P(A∩B)P(A∪B)=P(A)+P(B)–P(A∩B).
Podemos pensar que el símbolo de la unión sustituye a la palabra "o". La
razón por la que restamos la intersección de A y B es para no contar dos
veces los elementos que están en A y B.
 Si A y B se excluyen mutuamente, entonces P(A∩B)=0P(A∩B)=0.
Entonces P(A∪B)=P(A)+P(B)–P(A∩B)P(A∪B)=P(A)+P(B)–P(A∩B) se
convierte en P(A∪B)=P(A)+P(B)P(A∪B)=P(A)+P(B).

En estadística y probabilidad se llama distribución normal, distribución de


Gauss, distribución gaussiana, distribución de Laplace-Gauss o normalidad
estadística a una de las distribuciones de probabilidad de variable continua que
con más frecuencia aparece en estadística y en la teoría de probabilidades. 1

La gráfica de su función de densidad tiene una forma acampanada y es simétrica


respecto de un determinado parámetro estadístico. Esta curva se conoce
como campana de Gauss y es el gráfico de una función gaussiana.2

La importancia de esta distribución radica en que permite modelar numerosos


fenómenos naturales, sociales y psicológicos.3 Mientras que los mecanismos que
subyacen a gran parte de este tipo de fenómenos son desconocidos, por la enorme
cantidad de variables incontrolables que en ellos intervienen, el uso del modelo
normal puede justificarse asumiendo que cada observación se obtiene como la
suma de unas pocas causas independientes.

De hecho, la estadística descriptiva solo permite describir un fenómeno, sin


explicación alguna. Para la explicación causal es preciso el diseño experimental, de
ahí que al uso de la estadística en psicología y sociología sea conocido
como método correlacional.

La distribución normal también es importante por su relación con la estimación


por mínimos cuadrados, uno de los métodos de estimación más simples y antiguos.

Algunos ejemplos de variables asociadas a fenómenos naturales que siguen el


modelo de la normal son:

 caracteres morfológicos de individuos como la estatura;


 caracteres fisiológicos como el efecto de un fármaco;
 caracteres sociológicos como el consumo de cierto producto por un mismo
grupo de individuos;
 caracteres psicológicos como el cociente intelectual;
 nivel de ruido en telecomunicaciones;
 errores cometidos al medir ciertas magnitudes;
 etc.
La distribución normal también aparece en muchas áreas de la propia estadística.
Por ejemplo, la distribución muestral de las medias muestrales es
aproximadamente normal, cuando la distribución de la población de la cual se extrae
la muestra no es normal.4 Además, la distribución normal maximiza la entropía entre
todas las distribuciones con media y varianza conocidas, lo cual la convierte en la
elección natural de la distribución subyacente a una lista de datos resumidos en
términos de media muestral y varianza. La distribución normal es la más extendida
en estadística y muchos tests estadísticos están basados en una "normalidad" más
o menos justificada de la variable aleatoria bajo estudio.

En probabilidad, la distribución normal aparece como el límite de varias


distribuciones de probabilidad continuas y discretas.

UNIDAD 4

INTRODUCCIÓN AL MUESTREO ESTADÍSTICO

Se denomina muestreo al proceso por el que generamos las muestras. Una muestra
es una parte (un subconjunto) de la población, y se desea que la muestra sea lo
más representativa posible de la población de la que procede. Sin embargo, por
muy cuidadosa que sea la selección de la muestra difícilmente será una
representación exacta de la población. Esto significa que su tendencia central,
variabilidad, etc., aproximarán las de la población, pero habrá cierta diferencia, que
interesa sea lo menor posible. Un concepto clave de muestreo es el
de representatividad: Los procedimientos de muestreo tienen por objeto generar
muestras lo más representativas posible de las poblaciones dados los objetivos de
la investigación y las circunstancias que afectan al muestreo.

Desde un punto de vista aplicado, se denomina muestreo el proceso de selección


de la muestra o muestras a utilizar para la investigación. Esto supone generar una
o pocas muestras. Actualmente es de interés la selección de muestras para la
simulación informática de los procesos de muestreo, particularmente para la
obtención de distribuciones muestrales. En estos casos el número de muestras
generadas puede ser muy grande (10.000, 80.000, o más) y el procedimiento de
muestreo se realiza informáticamente y con procedimientos específicos.

Desde un punto de vista teórico, el concepto de muestreo es fundamental para la


Inferencia Estadística. El hecho de que las muestras no sean exactamente
representativas de las poblaciones significa que las inferencias presentan cierto
margen de incertidumbre. Para cuantificarlo y definir técnicas inferenciales es
necesario conocer cómo se comportan los estadísticos obtenidos en las muestras,
esto es, cómo son las distribuciones muestrales de los estadísticos habitualmente
utilizados para la inferencia.

Las muestras singulares generadas para investigación con sujetos suelen utilizarse
para obtener algunos estadísticos (Media, proporción, cuasivarianza, etc.) con los
que se realiza el proceso de inferencia. En cambio, las muestras simuladas por
ordenador suelen ser utilizadas para obtener distribuciones muestrales y realizar
inferencia. Esto es de interés cuando se dan circunstancias especiales que no
aconsejan utilizar los procedimientos habituales. Las distribuciones muestrales son
las distribuciones de estadísticos de muestras que pertenecen a la misma población.
Por ejemplo, la distribución muestral de la Media es la distribución de las Medias de
muestras de un mismo tamaño extraídas de la misma población.
Ejemplo

Sea un curso con 40 estudiantes (el número de datos es pequeño para facilitar la
comprensión del ejemplo). Queremos conocer la Media de las puntuaciones del
curso, pero por diversas razones no tenemos acceso a todos los datos (que se
denomina población). Pero supongamos que podemos seleccionar cinco
puntuaciones aleatoriamente y obtener la Media de la muestra. Si repetimos el
proceso y generamos más muestras tendremos más Medias muestrales y podremos
ver cómo se distribuyen:

La Media de los datos seleccionados aleatoriamente (son las señaladas en negrita)


es:

Si repetimos el procedimiento 25 veces generamos 25 muestras. Las Medias de


cada muestra son:

El Histograma de la distribución de las Medias de las 25 muestras es

con 100 muestras,


y con 1000 muestras

La forma del Histograma se acerca a la del modelo Normal cuanto mayor es el


número de muestras. Esta es una característica de la distribución muestral de
Medias que permite conocer si la media obtenida en la muestra es muy diferente a
la media de la población, dado que tenemos la siguiente información:

a) La distribución de Medias muestrales es Normal.

b) La Media y Desviación Típica de la distribución de Medias muestrales son 4.7 y


1.52 (Nota: La diferencia entre la Media de la distribución muestral y la Media de la
población se debe a que la muestra es pequeña).

e) Por tanto, sabemos lo siguiente:

* El 95% (aproximadamente) de las Medias muestrales obtenidas en el muestreo


del ejemplo tienen valores entre 1.7 y 7.7

* El valor obtenido (4.2) está entre ambos límites, que definen el conjunto de valores
que obtenemos al hacer un muestreo aleatorio con muestras de 5 datos de la
población del ejemplo.

* Como conclusión, vemos que 4.2 es un valor esperable cuando efectuamos un


muestreo aleatorio con muestras de 5 datos. Diremos que la diferencia observada
respeto de la Media del curso es explicada por el azar (ya que la selección de las
muestras ha sido aleatoria y asumimos que no han influido otros factores).
Distribución muestral
A partir de las muestras seleccionadas de una población pueden construirse
variables aleatorias alternativas, de cuyo análisis se desprenden interesantes
propiedades estadísticas. Las dos formas más comunes de estas variables
corresponden a las distribuciones muestrales de las medias y de las proporciones.

Distribución muestral de las medias

Dada una población constituida por un número n de elementos, cuya media


aritmética es m y donde la desviación típica viene dada s, pueden formarse
n2 muestras con reemplazamiento distintas, formadas por dos elementos de la
población.
Para cada una de estas muestras es posible una media muestral, que
denotaremos con el símbolo . Un ejemplo de la tabla de muestras de tamaño 2,
tomada de la población {1, 3, 5}, con sus medias aritméticas reflejadas, sería:

A partir de la variable estadística original x de la población se puede construir una


nueva variable estadística , que tendría como valores las medias de las muestras
tomadas de la población. La media aritmética de esta distribución muestral de las
medias se denota por , y su desviación típica por .

Parámetros de la distribución muestral de las medias de tamaño 2

Establecida una distribución muestral de las medias de tamaño 2, su esperanza


matemática adopta el valor siguiente:

siendo m la media aritmética de la población, la media aritmética de cada


muestra, la media aritmética de todas las medias, E [x] la esperanza matemática
de la variable aleatoria x (para la población) y E [ ] la esperanza matemática de la
variable aleatoria (para la distribución muestral de las medias).
Por su parte, los valores de la varianza y la desviación típica de esta distribución
muestral de tamaño 2 son:
donde s es la desviación típica de la población, la desviación típica de la
distribución muestral, V [x] la varianza de la variable x (población) y V [ ] la varianza
de la variable (distribución muestral de las medias).

Distribución muestral de las medias de tamaño n

En una distribución muestral de las medias, la variable aleatoria media


muestral sigue una ley normal descrita como N (m,s/Ön).

Parámetros estadísticos de una distribución muestral de las medias de tamaño n:

Distribución muestral de las proporciones

Sea una población formada por n elementos, de los cuales algunos poseen una
determinada característica y otros no (llamaremos p a la proporción de los
elementos que poseen la característica, y q = 1 - p a la de los restantes elementos).
Entonces, es posible extraer muestras de la población de manera que a cada una
se asocie como valor la proporción de la característica analizada.
Por ejemplo, en la población {1, 2, 3}, la característica par tiene un valor p = 1 / 3,
mientras que la impar es q = 2 / 3. Mediante la tabla siguiente de muestras se
construye una nueva distribución muestral de las proporciones.
Muestra 1,1 1,2 1,3 2,1 2,2 2,3 3,1 3,2 3,3

Proporción f/n 0 0,5 0 0,5 0 0,5 0 0,5 0

Parámetros estadísticos de una distribución muestral de las proporciones de


tamaño n:

Una distribución muestral de las proporciones se comporta como una distribución


normal descrita por los parámetros N
En la sección Series, Medwave publica artículos relacionados con el desarrollo y
discusión de herramientas metodológicas para la investigación clínica, la gestión en
salud, la gesión de la calidad y otros temas de interés. En esta edición se presentan
dos artículos que forman parte del programa de formación en Medicina Basada en
Evidencias que se dicta por e-Campus de Medwave. El artículo siguiente pertenece
a la Serie "Estadística Aplicada a la Investigación en Salud".

Definiciones

El campo de la inferencia estadística trata básicamente de predicciones y


generalizaciones. Por ejemplo, se puede afirmar, basándose en opiniones
recogidas por medio de una encuesta, que en las próximas elecciones
presidenciales el candidato de gobierno obtendrá 60% de los votos. Para hacer esta
afirmación fue necesario determinar el porcentaje de votos favorables en una
muestra seleccionada de la población. Al porcentaje obtenido de esta forma se le
llama “estadístico” o “estadígrafo”.

A partir de este valor se puede estimar el porcentaje real de votos que dicho
candidato obtendrá el día de la elección. Este porcentaje real proviene del universo
de votantes o población y se le llama parámetro. En general, cualquiera de las
medidas de resumen -promedio, desviación estándar, porcentaje, tasa- se
considera “estadístico” si proviene de la muestra, y “parámetro” si proviene del
universo o población.

La inferencia estadística entrega las herramientas para realizar afirmaciones acerca


de un parámetro de la población, basándose en el valor del respectivo estadístico
proveniente de una muestra. Para realizar estas inferencias es necesario conocer,
previamente, la distribución de probabilidad del estadístico. A la distribución de
probabilidad de un estadístico se le llama “distribución muestral”.

Podemos tomar una muestra, calcular en ella un estadístico (promedio o porcentaje,


por ejemplo) y luego hacer afirmaciones respecto del correspondiente parámetro.
Esto se conoce con el nombre de estimación de parámetros, y se puede hacer de
dos formas:
 Estimación puntual: consiste en asumir que el parámetro tiene el mismo
valor que el estadístico en la muestra.
 Estimación por intervalos: se asigna al parámetro un conjunto de posibles
valores que están comprendidos en un intervalo asociado a una cierta
probabilidad de ocurrencia. También se llaman “intervalos de confianza”
debido a que la probabilidad asociada a ellos es la confianza de los mismos.
Así, diremos que un intervalo de 99% de confianza es más confiable que uno
de 95%. También se define la confianza de la estimación como la
probabilidad de acertar con el intervalo.

La estimación que tiene valor estadístico para promedio o media y para el porcentaje
de la población es esta última, que explicaremos a continuación.

Estimación de la media de la población

Explicaremos este punto con el siguiente ejemplo: queremos estimar el número de


hijos promedio que tienen las mujeres de una población determinada. Con este
objeto se seleccionó, por muestreo aleatorio simple, una muestra de 20 mujeres a
quienes se entrevistó, obteniendo como resultado un promedio de 3,2 hijos y una
desviación estándar de 0,8. Con estos resultados podríamos hacer una estimación
puntual y decir que la población de interés tiene en promedio 3,2 hijos. Pero esta
estimación tiene el inconveniente de que se desconoce el error que se está
cometiendo.

Si a esta estimación le asignamos un error, que llamaremos E, podríamos decir que


el promedio de hijos de la población está ubicado dentro de un intervalo de
estimación que tiene como límite inferior 3,2 - E y como límite superior 3,2 + E. De
este modo, le asignamos al resultado un intervalo de estimación. Si además le
damos a este intervalo una probabilidad de ocurrencia de los valores comprendidos
en él, habremos construido un intervalo de confianza para el promedio de hijos de
nuestra población de mujeres.

Entonces, generalizando lo que se explicó para la variable “promedio de hijos”,


podemos decir que:

Un intervalo de confianza para estimar el promedio de la población está constituido


por los siguientes elementos: el promedio de la muestra y el error de estimación.
El elemento esencial en la construcción del intervalo de estimación es el error.
¿Cómo se obtiene el error en la construcción de un intervalo para el
promedio?

Desarrollando la fórmula siguiente:

Está compuesta por la desviación estándar de la muestra (S), el tamaño de la


muestra (n) y, aquí aparece un elemento nuevo, t –Student-, que corresponde a una
distribución de probabilidad muy similar a la distribución normal.

En la tabla de t los valores se buscan en función de dos cosas:

 la probabilidad que hemos elegido para nuestro intervalo, y


 los “grados de libertad” que se calculan restando 1 al tamaño de la muestra
(n).

En nuestro ejemplo elegimos una confianza de 95% que, asociada a los 19 grados
de libertad (n-1), nos conduce a un valor de tabla t de Student igual a 2,093. Ya
veremos en forma detallada el uso práctico de la tabla t, recordemos por ahora el
valor de “t” encontrado porque lo utilizaremos para la construcción del intervalo.

Volviendo a la fórmula para calcular el error, vemos entonces que el error está
compuesto por tres elementos:

 El valor t que se obtiene de la tabla t de Student.


 La desviación estándar de la muestra.
 El tamaño de la muestra.

Volviendo a nuestro ejemplo, calculemos el error. Recordemos que deseamos


conocer el número promedio de hijos que tienen las mujeres en esa población y
que, estudiando una muestra de 20 mujeres, el resultado fue un promedio de 3,2
hijos y una desviación estándar de 0,8.

¿Cuáles son, entonces, los elementos que nos permitirán calcular el error de
nuestra estimación?
El valor t que obtuvimos de la tabla t de Student t = 2,093
La desviación estándar de la muestra S = 0,8
El tamaño de la muestra n = 20

Reemplazando esos valores en la fórmula obtendremos el error, que es:

Intervalo de estimación

Construiremos ahora el intervalo de estimación, sumando y restando al promedio,


el error. De esta manera el límite inferior será: promedio - E; y el límite superior:
promedio + E.

Límite inferior (a) = 3,2 - 0,37 = 2,83


Límite superior (b) = 3,2 + 0,37 = 3,57

De este modo se consigue un intervalo (2,83; 3,57) que nos permite estimar, con
95% de confianza, que el promedio de hijos en la población de mujeres está entre
2,83 y 3,57.

En resumen, los pasos en la construcción de un intervalo de confianza para la


estimación del promedio son:

 Obtener una muestra aleatoria.


 Calcular promedio y desviación estándar muestral.
 Elegir la confianza del intervalo (95% ó 99%).
 Obtener el valor de t en tabla.
 Calcular el error de estimación.
 Calcular los límites del intervalo (a y b).

De estos 6 puntos, ya hemos tratado los puntos 1, 2, 5 y 6.

Sólo haremos un comentario sobre el punto 3: la elección de la confianza. Lo decide


el investigador y se podría elegir cualquier valor, pero por lo general se usa 95% ó
99%. La elección de uno u otro dependerá de la confianza y la precisión que
necesitemos para nuestra estimación, ya que si el intervalo es más grande, la
precisión será menor; por lo tanto, un intervalo de 99% tiene mayor confianza y
menor precisión que uno de 95%.

Cómo buscar un valor en la Tabla t de Student

El primer paso es calcular los grados de libertad (gl) restando 1 al tamaño de la


muestra: gl = n-1

El segundo paso es elegir la confianza del intervalo. Elijamos un 95%.

Tercero, buscar el valor de t. Como la distribución es simétrica, un intervalo de 95%


(0,95) al centro de la curva deja necesariamente 2,5% (0,025) en cada extremo de
la curva. El valor que buscamos deja sobre sí a 2,5% de los sujetos, ó 0,025 si
trabajamos sobre base 1, que es como están los valores en las tablas (véase
gráfico).

En la primera fila de la tabla aparece el símbolo alfa, que indica la probabilidad,


debemos buscar allí un t con alfa 0,025. De allí hacia abajo, en toda la columna, se
encuentran los valores de t asociados a 0,025 de probabilidad. Luego buscamos en
la primera columna los grados de libertad (n-1). En el cruce de la fila de los grados
de libertad con la columna de la probabilidad está el valor de t que nos interesa.

En nuestro ejemplo el tamaño de muestra es de 20 sujetos, por lo tanto tenemos 19


grados de libertad. Entonces buscaremos en la tabla un valor de t para 0,025 de
probabilidad y con 19 grados de libertad. Encontramos t = 2,093.

Al realizar la investigación, casi nunca es posible estudiar a toda la población que


te interesa. Esta es la razón por la que los investigadores utilizan diversos tipos de
muestreo cuando pretenden recopilar datos y responder las preguntas de
investigación.

Una muestra es un subconjunto de la población que está siendo estudiada.


Representa la mayor población y se utiliza para sacar conclusiones de esa
población. Es una técnica de investigación ampliamente utilizada en las ciencias
sociales como una manera de recopilar información sin tener que medir a toda la
población.

En este artículo te presentaremos cuáles son los diferentes tipos de muestreo que
existen, en qué consisten y cuándo es conveniente usar uno u otro.

Contenido

1. Clasificación de los tipos de muestreo


2. Tipos de muestreo no probabilístico
1. Muestreo por conveniencia
2. Muestreo deliberado, crítico o por juicio

3. Muestreo por cuotas


3. Tipos de muestreo probabilístico
0. Muestreo aleatorio simple
1. Muestreo sistemático
2. Muestreo estratificado
3. Muestreo por conglomerados
4. Conclusión

Clasificación de los tipos de muestreo

En la investigación existen dos técnicas principales de muestreo: las que están


basadas en la probabilidad y las que no. Vamos a analizar los diferentes tipos de
muestreo que puedes crear utilizando ambas técnicas para una
eficiente recolección de datos de tu próxima investigación.

 Tipos de muestreo no probabilístico

El muestreo no probabilístico es una técnica de muestreo donde las muestras se


recogen por medio de un proceso que no les brinda a todos los individuos de la
población las mismas oportunidades de ser seleccionados.

Aunque seleccionar algunos de estos métodos podría resultar en datos sesgados o


en una capacidad limitada para hacer conclusiones generales basadas en los
hallazgos, también existen algunas situaciones en las que seleccionar este tipo de
técnica de muestreo es la mejor opción para cierta pregunta de investigación o para
una etapa de la investigación.

Existen 4 tipos de muestreo que puedes crear de esta manera.

1. Muestreo por conveniencia

El muestreo por conveniencia es el que se basa en los sujetos disponibles, como


detener a las personas en la esquina de la calle mientras pasan por ahí, es un
método de muestreo, aunque es extremadamente riesgoso y debe realizarse con
cautela.

Este método, también conocido como un método basado en los sujetos disponibles,
no le permite al investigador tener control sobre la representatividad de la muestra.

Sin embargo, es útil si el investigador quiere estudiar las características de las


personas que pasan por la esquina de una calle en un momento determinado, por
ejemplo, o si el tiempo y los recursos son limitados de tal forma que la investigación
no sería posible de otra manera.

Por esta razón, un muestreo de conveniencia está entre los tipos de muestreo que
comúnmente se utilizan en las fases iniciales o fase piloto de la investigación,
antes de que se lance un proyecto de investigación más grande.

Aunque este método puede resultar útil, el investigador no podrá utilizar los
resultados de una muestra de conveniencia para generalizar una población más
amplia.

2. Muestreo deliberado, crítico o por juicio

El muestreo deliberado, crítico o por juicio es aquel que se selecciona con base en
el conocimiento de una población o propósito del estudio.

Por ejemplo, cuando sociólogos quieren estudiar los efectos emocionales y


psicológicos a largo plazo de la terminación de un embarazo, se puede crear una
muestra que incluya solamente a mujeres que se habían sometido a un aborto.

En este caso, los investigadores pueden utilizar una muestra intencional porque los
entrevistados cumplen con una descripción o propósito específico que es necesario
para realizar la investigación.
3. Muestreo Bola de Nieve

Es adecuado utilizar un muestreo bola de nieve cuando los miembros de una


población son difíciles de localizar, como las personas sin hogar, trabajadores
migrantes o inmigrantes indocumentados.

Una muestra de bola de nieve es aquella en la que el investigador recopila datos


sobre los pocos miembros de la población objetivo que puede localizar, y luego les
pide que le proporcionen la información necesaria para localizar a otros miembros
que conozcan de esa población.

Por ejemplo, si un investigador quiere entrevistar a inmigrantes indocumentados de


México, podría entrevistar a algunos indocumentados que conozca o pueda
localizar, y luego dependerá de esos sujetos para que lo ayuden a localizar a más
individuos indocumentados.

Este proceso continúa hasta que el investigador tenga todas las entrevistas que
necesita o hasta que se hayan agotado todos los contactos.

Esta técnica es útil cuando se estudia un tema sensible en el que la gente podría no
hablar abiertamente, o si hablar sobre los temas investigados podría poner en
peligro su seguridad. Una recomendación de un amigo o conocido de que el
investigador es confiable funciona para aumentar el tamaño de la muestra.

Te puede interesar también: Ejemplo de encuestas por muestreo

4. Muestreo por Cuotas

El muestreo por cuotas es aquel en la que las unidades son seleccionadas en una
muestra partiendo de las características predeterminadas, de modo que la muestra
total tenga la misma distribución de características que se supone que existen en la
población que está siendo estudiada.

Por ejemplo, si eres un investigador que está realizando una muestra por cuota
nacional, podrías necesitar saber qué proporción de la población es masculina y
qué proporción es femenina.

Así como también qué proporciones de los miembros de cada género pertenecen a
las diferentes categorías de edad, raza o étnicas, educativas, entre otras. Después,
el investigador recogería una muestra con las mismas proporciones que la población
nacional.
Te invito a leer: ¿Qué es una Muestra Representativa de la Población Nacional?

Tipos de muestreo probabilístico

El muestreo probabilístico es una técnica en la cual las muestras son recogidas


mediante un proceso que le brinda a todos los individuos de la población la misma
oportunidad de ser seleccionados.

Muchos consideran que este es metodológicamente el enfoque más riguroso para


el muestreo, ya que elimina los sesgos sociales que podrían moldear la muestra de
investigación. Sin embargo, en última instancia la técnica de muestreo que elijas
debe ser la que te permita responder mejor a tu pregunta de investigación.

Vamos a analizar los 4 tipos de muestreo probabilístico.

1. Muestreo aleatorio simple

El muestreo aleatorio simple es el método de muestreo básico utilizado en métodos


estadísticos y cálculos.

Para recopilar una muestra aleatoria simple, a cada unidad de la población objetivo
se le asigna un número. Luego se genera un conjunto de números aleatorios y las
unidades que tienen esos números son incluidas en la muestra.

Por ejemplo, supongamos que tienes una población de 1,000 personas y quieres
seleccionar una muestra aleatoria simple de 50 personas. Primero, cada persona
está numerada del 1 al 1,000.

Luego, generas una lista de 50 números aleatorios, generalmente con un programa


informático, y los individuos que tienen asignados estos números son los que vas a
incluir en la muestra.

Cuando se estudia a las personas, está técnica funciona mejor con una
población homogénea, que no sean muy diferentes en edad, raza, escolaridad o
clase, ya que con una población heterogénea se corre el riesgo de crear una
muestra sesgada si no se toman en cuenta las diferencias demográficas.

2. Muestreo sistemático

El muestreo sistemático es aquel en el que los elementos de la población se ponen


en una lista y luego cada enésimo elemento de la lista se selecciona
sistemáticamente para su inclusión en la muestra.
Por ejemplo, si la población de estudio contenía 2,000 estudiantes de una
secundaria y el investigador quería una muestra de 100 estudiantes, los estudiantes
se colocarían en forma de lista y luego cada veinteavo estudiante sería seleccionado
para ser incluido en la muestra.

Para garantizar que no haya ningún sesgo humano en este método, el investigador
debe seleccionar aleatoriamente al primer individuo. Esto es técnicamente
llamado una muestra sistemática con un inicio aleatorio.

3. Muestreo estratificado

El muestreo estratificado es una técnica de muestreo en la que el investigador divide


a toda la población objetivo en diferentes subgrupos o estratos, y luego selecciona
aleatoriamente a los sujetos finales de los diferentes estratos de forma proporcional.

Este tipo de muestreo se utiliza cuando el investigador quiere resaltar subgrupos


específicos dentro de una población.

Por ejemplo, para obtener una muestra estratificada de estudiantes universitarios,


el investigador primero tendría que organizar a la población por grado universitario
y luego seleccionar el número adecuado de estudiantes de primer, segundo, tercer
y último año.

Esto aseguraría que el investigador tenga cantidades adecuadas de sujetos de cada


grado en la muestra final.

4. Muestreo por conglomerados

El muestreo por conglomerados puede ser utilizado cuando es imposible o


impráctico elaborar una lista exhaustiva de los elementos que constituyen a la
población objetivo. Sin embargo, generalmente los elementos de la población ya
están agrupados en subpoblaciones y las listas de esas subpoblaciones ya existen
o pueden ser creadas.

Por ejemplo, supongamos que la población objetivo de un estudio eran los


miembros de iglesias en Guatemala. No existe una lista de los miembros de las
iglesias en el país.

Sin embargo, el investigador podría elaborar una lista de iglesias ubicadas en


Guatemala, seleccionar una muestra de iglesias y luego conseguir listas de los
miembros de esas iglesias.

Esta calculadora de muestra te será de gran utilidad.


Conclusión

Todos los que han trabajado en un proyecto de investigación saben que los
recursos son limitados: el tiempo, el dinero y las personas nunca son ilimitados.
Por eso, la mayoría de los proyectos pretenden recoger datos de una muestra de
personas, en lugar de hacerlo de toda la población (el censo es una de las pocas
excepciones).

En cualquier caso, el tipo de muestreo que se elija permitirá recopilar datos más
ricos que si te contactaras con todos los miembros de una población. Encontrar a
los participantes que se adaptan al propósito de un proyecto es crucial, ya que
permite a los investigadores recopilar datos de alta calidad.

También podría gustarte