0% encontró este documento útil (0 votos)
130 vistas10 páginas

Población y Muestra en Investigación

Este documento presenta conceptos fundamentales sobre población, muestra y universo. Explica que una población se refiere a un conjunto de datos numéricos, mientras que una muestra es un subconjunto de datos extraídos de una población. También aclara que un universo puede ser hipotético y referirse a todos los posibles datos que podrían obtenerse bajo ciertas condiciones. Ilustra estos conceptos con ejemplos como mediciones de altura humana, resultados de análisis de productos químicos y salarios de traba

Cargado por

0333231031
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
130 vistas10 páginas

Población y Muestra en Investigación

Este documento presenta conceptos fundamentales sobre población, muestra y universo. Explica que una población se refiere a un conjunto de datos numéricos, mientras que una muestra es un subconjunto de datos extraídos de una población. También aclara que un universo puede ser hipotético y referirse a todos los posibles datos que podrían obtenerse bajo ciertas condiciones. Ilustra estos conceptos con ejemplos como mediciones de altura humana, resultados de análisis de productos químicos y salarios de traba

Cargado por

0333231031
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

UNJFSC-FIISI-E.P.

Ingeniería Informática METODOLOGIA DE LA INVESTIGACION 1

UNIVERSIDAD NACIONAL
JOSE FAUSTINO SANCHEZ CARRION
FACULTAD DE INGENIERIA INDUSTRIAL, SISTEMAS E INFORMÁTICA
Escuela Académico Profesional de Ingeniería Informática

Módulo de aprendizaje:

METODOLOGIA DE LA INVESTIGACION

Sesión 08:

DETERMINACION DE LA
POBLACION Y LA MUESTRA
Dirigido a:
Estudiantes del cuarto ciclo

Docente:
MAG. VICTOR LUIS SILVA TOLEDO
[email protected]
Reg. CIP 26724

HUACHO – PERU

2020
Mag. Víctor Silva Toledo
UNJFSC-FIISI-E.P. Ingeniería Informática METODOLOGIA DE LA INVESTIGACION 2

CONTENIDO
Pág.
PRESENTACION 03

INTRODUCCION 04

CAPITULO 01. – FUNDAMENTOS BASICOS 05

CAPITULO 02.- LA INVESTIGACION 07

CAPITULO 03.- EL METODO CIENTÍFICO 15

CAPITULO 04.- EL PLANTEAMIENTO DEL PROBLEMA 16

CAPITULO 05. - EL MARCO TEORICO 19

CAPITULO 06. - LAS HIPOTESIS 22

CAPITULO 07. – LAS VARIABLES 26

CAPITULO 08. – POBLACION Y MUESTRA 31

CAPITULO 09. – RECOPILACION Y ANALISIS DE DATOS 32

CAPITULO 10. – EL PROCESO DE SOLUCION DE PROBLEMAS 33

CAPITULO 11. – LOS PROCESOS DE INVESTIGACIÓN 34

REFERENCIAS BIBLIOGRAFICAS 39

ANEXO 1: MEMORIA DE LA VIDA DE UN INGENIERO 40

Mag. Víctor Silva Toledo


UNJFSC-FIISI-E.P. Ingeniería Informática METODOLOGIA DE LA INVESTIGACION 3

Conceptos Fundamentales
En la práctica es necesario trabajar con procesos que generan un número muy grande de datos o resultados
numéricos, es decir, espacios muestrales con un número infinito o muy grande de elementos. Cuando
tenemos un conjunto muy grande de datos numéricos para analizar decimos que tenemos un Universo o
Población de observaciones.

29 26 26 31 32
30 27 28 25 29
32 30 29 27 28
30 30 31 31 30
30 31 27 31 28
29 32 33 33 34
31 29 30

Población

Cada dato numérico es un elemento de la población o universo. Una Muestra es un subconjunto pequeño
de observaciones extraídas de un universo o población:

29 26 26 31 32
30 27 28 25 29 Extraemos un dato de
32 30 29 27 28 la Población
30 30 31 31 30
30 31 27 31 28
29 32 33 33 34 30
31 29 30

Población

La Estadística trabaja con poblaciones de datos y con muestras extraídas de las mismas.
Los conceptos de población y muestra, a veces, resultan ambiguos en su aplicación práctica. Por
ejemplo, supongamos que en una ciudad de 5000 habitantes se realiza un censo médico en el cual se
mide el peso, la altura y se relevan otros datos de todos los habitantes de la ciudad. Alguien podría referirse

Mag. Víctor Silva Toledo


UNJFSC-FIISI-E.P. Ingeniería Informática METODOLOGIA DE LA INVESTIGACION 4

al universo o población censada teniendo in mente el conjunto de los habitantes de la ciudad. Pero cuando
hablamos en términos estadísticos, nos referimos a poblaciones o universos de datos.

Por ejemplo, el conjunto de todas las mediciones de altura (de los habitantes de la ciudad) es un conjunto
de datos y por lo tanto constituye una población de datos desde el punto de vista estadístico. Otra población
de datos son los pesos medidos (de los habitantes de la ciudad). Pero la población de habitantes, es decir,
las personas que habitan la ciudad no son la población a la que nos estamos refiriendo desde el punto de
vista estadístico.
Supongamos que en una empresa se fabrica un lote muy grande, digamos 10 toneladas de un producto
químico, y un técnico debe controlar la calidad del mismo.

El técnico toma una pequeña porción, por ejemplo, 100 gramos y dirá que tomó una muestra del producto
para analizar en el laboratorio. Hasta el momento, la muestra no fue analizada y por lo tanto no tenemos
ningún dato numérico.

Cuando el laboratorio efectúa algún ensayo en la muestra y obtiene un resultado numérico, recién ahí
tenemos un dato que puede ser analizado desde el punto de vista estadístico. Vamos a suponer
hipotéticamente que el técnico continúa sacando otras muestras del producto, hasta agotar el lote y cada
una es ensayada en el laboratorio, el cual nos da los resultados. Como teníamos 10 ton. De producto y las
muestras son aproximadamente de 100 gr., el técnico seguramente extraerá alrededor de 100000 muestras
y el laboratorio nos entregará alrededor de 100000 resultados. Este conjunto de datos numéricos es nuestro
universo o población de datos.

Si nosotros tomamos al azar 10 de esos resultados, podemos decir que tenemos una muestra de 10
elementos de ese universo o población. No debemos confundir esta muestra (Desde el punto de vista
estadístico) con la muestra de material que extrajo el técnico para ser analizada en laboratorio.

Mag. Víctor Silva Toledo


UNJFSC-FIISI-E.P. Ingeniería Informática METODOLOGIA DE LA INVESTIGACION 5

Ahora bien, nuestro universo o población de datos a veces no existe en la realidad, sino que es un concepto
o abstracción que utilizamos para referirnos al universo o población que hipotéticamente podría existir.

Veamos el ejemplo anterior. Supongamos que el técnico toma solamente 5 muestras y las envía para
analizar al laboratorio. El laboratorio nos enviará sólo 5 resultados, y nosotros diremos que tenemos una
muestra de datos extraída del universo o población de datos total. Y estamos pensando en el universo o
población que tendríamos si se hubieran extraído y analizado las 100000 muestras de material.

Muchas veces resulta difícil imaginarse cuál es el universo del cual extrajimos los datos. Supongamos que
tenemos una máquina que produce piezas de plástico en serie y un técnico toma 5 piezas sucesivas y les
mide la altura con un calibre. Tenemos, entonces, 5 resultados, es decir una muestra de 5 elementos. ¿Cuál
es el universo al cual pertenece esa muestra de datos?

Debemos imaginar lo siguiente: Si la máquina continuara trabajando en las mismas condiciones (Es decir,
a la misma velocidad, con las mismas materias primas, a la misma temperatura, manejada por el mismo
operario, etc.) ... y a cada pieza que produce se le mide la altura tendríamos un conjunto muy grande de
resultados numéricos.
Ese conjunto muy grande de resultados numéricos que no existe, pero que podría obtenerse en esas
condiciones es el universo o población del cual extrajimos la muestra de 5 observaciones.
Veamos otro ejemplo. Supongamos que el sindicato de la industria textil desea saber cual es el sueldo
promedio que gana un operario en esa industria. Entonces, encarga una encuesta a una empresa
especializada, que entrevista a 20 operarios de la industria textil y averigua sus salarios. Estos datos son
una muestra de 20 observaciones del universo o población formado por los salarios de todos los operarios
de la industria textil del país.
Aunque el encuestador no disponga de esos datos, sabemos que existen miles de operarios que ganan un
salario determinado y por lo tanto podemos hablar de un universo o población cuyos elementos son los
salarios de los operarios de la industria textil en el país.
Además, esa población de datos es seguramente diferente de la población de salarios de los operarios de
la industria textil chilena o brasileña (Usando una misma moneda de referencia).
¿Qué representa una Población de datos? El análisis estadístico de una población o universo de datos
tiene como objetivo final descubrir las características y propiedades de aquello que generó los datos.
Por ejemplo, se tiene una población de escolares (Población física, población humana) y se les mide la
altura. El conjunto de datos de altura constituye una población o universo estadístico. El análisis de estos
datos de altura (Universo estadístico) sirve para caracterizar y estudiar a la población de estudiantes (Que
no es una Población estadística).
Supongamos que un instituto dedicado a estudios económicos ha realizado una encuesta de ingresos en
el país. El universo de datos generados por la encuesta sirve a los fines de caracterizar a la población física,
a la población real del país, desde un punto de vista económico.

Mag. Víctor Silva Toledo


UNJFSC-FIISI-E.P. Ingeniería Informática METODOLOGIA DE LA INVESTIGACION 6

Salarios (U.S.$)
800
1250
950
2150
1780
1340
1500
2100

Población Real Población Estadística

Un ingeniero controla un proceso industrial, que genera a diario muchos lotes de un producto (Población
de lotes). Para cada lote se mide una característica de calidad, obteniéndose una gran cantidad de
resultados numéricos (Población de datos).

PRODUCTO TOMA DE
MUESTRA

RESULTADOS MEDICION
NUMERICOS

El ingeniero realiza esta tarea no porque esté interesado en jugar con números, sino porque a través de los
datos numéricos obtenidos se puede evaluar el comportamiento del proceso, que es lo que realmente le
interesa.
Entonces, es importante destacar que detrás de un universo o población de datos se encuentra una
población física subyacente, formada por elementos de la realidad que nos rodea, de la cual, a través de
algún tipo de medición, se obtuvieron los datos numéricos.
Es esa población física subyacente (Elementos de la realidad, seres humanos, lotes de material, etc.) la
que deseamos estudiar y caracterizar por medio del análisis estadístico de los datos obtenidos.
La población estadística está representando, entonces, una población física o natural formada por
elementos de la realidad, con respecto a una característica o propiedad de esa población física.
Es muy importante, al utilizar métodos estadísticos, no confundir la población física, formada por elementos
de la realidad que estamos estudiando, con la población o universo de datos generados a partir de la
primera. De aquí en adelante, cuando utilicemos los términos población o universo sin otro aditamento nos
estaremos refiriendo a población o universo de datos numéricos (También llamados observaciones o
mediciones o valores).

Mag. Víctor Silva Toledo


UNJFSC-FIISI-E.P. Ingeniería Informática METODOLOGIA DE LA INVESTIGACION 7

La Distribución de Frecuencias
Vimos que una Población o Universo de datos es un conjunto muy grande de números. Estos números
pueden estar en un gran listado
o puede ser un conjunto hipotético, es decir, podemos imaginar los números, pero no los tenemos
realmente. Una gran tabla de números ordenados al azar prácticamente no nos muestra información acerca
de la población de datos. Suponiendo que disponemos de los datos del universo, ¿cómo podemos clasificar
y ordenar los números para obtener más información acerca de ese universo de datos?
Una forma sería escribir los números desde el menor hasta el mayor y colocar encima de cada uno tantas
cruces o cuadraditos como veces que figure repetido en la población:

24
25 X
29 26 26 31 32 26 X X
30 27 28 25 29 27 X X X
32 30 29 27 28 28 X X X
30 30 31 31 30 29 X X X X X
30 31 27 31 28 30 X X X X X X X
29 32 33 33 34 31 X X X X X X
31 29 30 32 X X X
33 X X
34 X
35
Población
El número de veces que aparece repetido cada dato es la frecuencia de dicho valor. La representación
gráfica que hemos visto se denomina Distribución de Frecuencias de la población.
La representación gráfica nos permite ver información que antes no aparecía tan evidente. Por ejemplo, sin
hacer ningún cálculo nos damos cuenta donde está aproximadamente el promedio de la población:

24
29 26 26 31 25 X
26 X X
32 30 27 28 25
27 X X X
29 32 30 29
28 X X X
27 28 30 30
29 X X X X X
31 31 30 30 31
30 X X X X X X X
27 31 28 29 31 X X X X X X
32 33 33 34 Promedio
32 X X X
31 29 30 33 X X
34 X
Población 35

También nos muestra cuales son los valores máximo y mínimo de la población, es decir, el rango:

Mag. Víctor Silva Toledo


UNJFSC-FIISI-E.P. Ingeniería Informática METODOLOGIA DE LA INVESTIGACION 8

24
25 X
29 26 26 31 26 X X
32 30 27 28 25 27 X X X
29 32 30 29 28 X X X

Rango
27 28 30 30 29 X X X X X
31 31 30 30 31 30 X X X X X X X
27 31 28 29 31 X X X X X X
32 33 33 34 32 X X X
31 29 30 33 X X
34 X
35

En el caso anterior, los datos de la población son números enteros.


Cuando los números no son enteros o cuando tenemos un número muy grande de datos, se divide el rango
total en subintervalos y se cuenta el número de valores que cae dentro de cada subintervalo.
Vamos a suponer, ahora, que tenemos una cierta población de N = 500 datos, por ejemplo el peso de
varones adultos de 40 años. Una manera de caracterizar esta población es construir una distribución de
frecuencias o gráfico de frecuencias. Para ello seguimos los pasos siguientes:
1) Tomamos nota del valor máximo y el valor mínimo de la serie de datos que estamos considerando.
2) Subdividimos el intervalo entre el máximo y el mínimo en algún número de intervalos (15 ó 20) más
pequeños iguales entre sí.
3) Contamos el número de datos que encontramos dentro de cada intervalo (Frecuencia). Por ejemplo,
supongamos que en el intervalo i hay n observaciones (∑ni= N).
4) Para construir el gráfico, colocamos en el eje de abscisas (Horizontal) los intervalos y levantamos en
cada intervalo un rectángulo de altura proporcional al número ni de datos dentro del mismo
Si hacemos el área del rectángulo levantado sobre el intervalo i−ésimo igual a la frecuencia relativa ni/N, el
área total bajo el histograma será igual a la unidad:

Área Total= ∑ Ai = ∑ ni = ∑ ni = N = 1
N N N
Obtenemos así una representación gráfica (Llamada también histograma) que nos muestra la distribución
de frecuencias de la población:

Mag. Víctor Silva Toledo


UNJFSC-FIISI-E.P. Ingeniería Informática METODOLOGIA DE LA INVESTIGACION 9

Porcentaje
35
30
25
20
15
10
5
0
3 4 5 6 7 8 9
Número de días de vida de la herramienta
Esta distribución de frecuencias nos muestra las características de una población, por ejemplo, si hay
resultados que son más frecuentes que otros. Nos muestra si los valores están ubicados alrededor de un
valor central, si están muy dispersos o poco dispersos. Podemos observar que fracción de todas las
mediciones cae, por ejemplo, entre 70 y 80 Kg. (Zona rayada en el gráfico):

Porcentaje
35
30
25
20
15
10
5
0
3 4 5 6 7 8 9
Número de días de vida de la herramienta

Si elegimos una persona del grupo y la pesamos, el resultado es un dato que pertenece a la población de
datos representada en el gráfico. Decimos, entonces, que estamos extrayendo un dato de la población de
datos. Pero hay distintas maneras de elegir la persona, es decir, distintas maneras de realizar la extracción
del dato.

Mag. Víctor Silva Toledo


UNJFSC-FIISI-E.P. Ingeniería Informática METODOLOGIA DE LA INVESTIGACION 10

Si nos paramos frente al grupo y elegimos una persona, estaremos seleccionando al más gordo, al más
flaco o al más alto (y por lo tanto pesa más que otros), de acuerdo a criterios subjetivos que no podemos
evitar.
En cambio, si escribimos los nombres de todas las personas en una etiqueta, metemos todas las etiquetas
en una caja y luego le pedimos a alguien que retire una etiqueta, la selección no estará influida por nuestra
subjetividad. En este caso, decimos que la extracción es aleatoria.
Una extracción aleatoria es aquella en que cada miembro de la población tiene la misma posibilidad de ser
elegido. Supongamos que realizamos una extracción aleatoria de la población antedicha y obtenemos el
valor y.
Entonces:
1) La probabilidad P(y<70) de que y sea menor que 70 K. es igual al área del histograma a la izquierda de
70 K.
2) La probabilidad P(y>70) de que y sea mayor que 70 K. es igual al área del histograma a la derecha de
70 K.
3) La probabilidad P(y>70, y<80) de que y sea mayor que 70 K. pero menor que 80 K. es igual al área del
histograma entre 70 y 80 K.

Mag. Víctor Silva Toledo

También podría gustarte