RECOLECCIÓN DE DATOS
ELEMENTOS BÁSICOS DEL TRABAJO ESTADÍSTICO
INVESTIGACIÓN PROBLEMA DE POBLACIÓN (1) MUESTRA n OBJETIVOS
INVESTIGACIÓN
VARIABLES (2)
DATOS (3)
BASE DE DATOS
La recolección de datos constituye la primera fase de un trabajo estadístico, proporciona la
materia prima para el proceso estadístico. La calidad de los resultados del análisis estadístico.
La calidad de los resultados del análisis estadístico dependerá de la calidad de los datos que se
recolecten, por lo que esta actividad deberá planearse y ejecutarse de manera adecuada.
Es el momento en el cual el investigador se pone en contacto con los objetivos o elementos
sometidos a estudio, con el propósito de obtener los datos o respuestas de las variables
consideradas.
Previamente a este proceso, es importante analizar los objetivos del estudio, precisar las
variables e identificar las fuentes de datos, a fin de definir que datos hay que recopilar y cómo
hacer esta tarea.
La formulación del problema y del marco teórico, la definición de las hipótesis y de los
objetivos de la investigación permiten especificar los tipos de información y las variables que
son requeridas.
La recolección de datos, se puede realizar mediante dos modalidades:
a) La técnica de investigación documental o bibliográfica.
b) La técnica de trabajo de campo, que se realiza de dos maneras:
La observación y la exploración en el terreno, que consiste en el contacto
directo del investigador con el objeto de estudio.
La encuesta en su modalidad de cuestionario y la entrevista, que consiste en el
acopio de testimonios orales y escritos de personas vivas.
La recolección de datos es uno de los aspectos principales de la investigación.
La determinación de la selección y elaboración de las técnicas e instrumentos de recolección de
datos adecuados a un cierto estudio deberá considerar los siguientes aspectos:
A) El nivel o tipo de la investigación
B) De los objetivos del trabajo
C) De la naturaleza del trabajo: retrospectivo y prospectivo
D) Del ámbito de la investigación: Población o muestra
ELEMENTOS DE UN DATO:
LA UNIDAD DE ANÁLISIS: Es el objeto de estudio, de observación sea este una persona en
suceso o una cosa.
LA VARIABLE: Característica propiedad que se desea observar en la unidad de análisis.
EL VALOR: Es el resultado de la observación realizada acerca de una variable en una unidad
de análisis.
Ejemplo
Si se aplica un cuestionario de encuesta a un alumno “A” de una muestra de 500
alumnos de la Escuela de Ing. Civil de la “USP” y que su respuesta a una pregunta
sobre su peso exacto en kg es 55kg.
En este ejemplo se tiene: Que los elementos del dato son: Unidad de observación;
alumno “A” de la Escuela de Ing. Civil de la “USP”, variable: peso y valor: 55kg.
TIPOS DE DATOS:
Pueden ser
A) CUANTITATIVOS: Representan la cantidad o el monto de algo, por ejemplo: la
producción mensual de arroz, el consumo mensual de luz, la resistencia a la compresión
de probetas, el resultado obtenido en un examen, etc.
B) CUALITATIVOS: Son aquellos que pueden ser puestos en CATEGORÍAS, pero, no
en forma de cantidad y se describen contando el número de unidades de análisis
(observaciones) en cada categoría, por ejemplo, el estado civil de un trabajador, el lugar
de procedencia de un alumno, etc.
RAZONES PORQUE SE RECOLECTAN DATOS:
A) Constituyen una etapa imprescindible dentro del proceso de la investigación científica
B) Ayudan en la formulación de alternativas de acción en el proceso de análisis y toma de
decisiones.
C) Permiten medir el desempeño en un servicio, proceso de producción o proceso de
experimentación.
D) Permiten la construcción de sistemas de información estadística.
E) Sondeos o estudio exploratorios.
FUENTES DE INFORMACIÓN:
Es el lugar, la institución, instrumentos, la persona donde están los datos que se necesitan para
la investigación. Pueden ser:
A) FUENTES DE DATOS INTERNOS: Es la información estadística recopilada por la
empresa o la institución de los resultados de su propia gestión. Por ejemplo, reportes de
las oficinas de planificación, reportes de operaciones, reportes de las oficinas de
planificación, reportes especiales, etc.
B) FUENTES DE DATOS EXTERNOS: Es la información elaborada por institutos de
investigación, públicas o privada o dependencias especializadas, generalmente
requeridas a nivel naciones sectores.
C) FUENTES PRIMARIAS: Es la información estadística que se obtiene directamente de
la unidad de análisis (observación).
Por ejemplo: los resultados de los censos de la población y vivienda, los resultados de
las diferentes encuestas nacionales que periódicamente realiza el “Instituto Nacional de
Estadística e Informática (INEI), los resultados de las encuestas que se realizan como
parte de las diferentes investigaciones científicas, etc.
D) FUENTES DE SECUNDARIAS: Es la información estadística elaborada a base de
datos de fuente primaria, por otros investigadores o instituciones externas.
MÉTODOS O TÉCNICAS DE RECOLECCIÓN DE DATOS:
1. Definición: Son procedimientos que tienen una propia metodología, cuya aplicación
permite recolectar los datos que son necesarios para ejecutar una investigación.
2. Instrumento de recolección de datos: Son los documentos o formatos que de manera
operativa permiten la aplicación de los métodos de recolección de datos existentes.
Es decir, cada método o técnica tiene su propio tipo de instrumento.
PRINCIPALES MÉTODOS O TÉCNICAS DE RECOLECCIÓN DE DATOS
Método o Nivel de Naturaleza de la Ámbito de la
técnica Instrumento investigación investigación investigación
Descripción Población (censo)
Explicación o muestra
Encuesta Cuestionario Prospectiva
grande(n≥30)
Correlación
Descripción
Entrevista Guía de
Explicación
entrevista Prospectiva Muestra pequeña
Correlación
(n<30)
Observación de Guía de Descripción
campo no observación de Prospectiva Muestra pequeña
Explicación
experimental campo (n<30)
Correlación
Muestras:
Guía de Experimental -dos grupos de
Observación observación o -Cuasi estudio
experimental ficha de experimental Prospectivo -grupo control
registro de -grupo
datos -Pre - experimental
experimental -un solo grupo
Análisis
documentario Guía de Descriptivo Retrospectivo Muestras
y archivo registro Explicativo
NOTA
A) NIVEL DE INVESTIGACIÓN: Es el rigor o profundidad a la cual puede llegar una
investigación científica, tenemos:
- NIVEL DESCRIPTIVO: describe y evalúa las características de una realidad, sin
modificar nada, se evalúan variables.
- NIVEL EXPLICATIVO: Busca determinar las causas o factores que originaron una
situación problemática, se evalúan y controlan las variables a través de la relación causal:
y=f(x).
x: Variable independiente
y: “ dependiente
-NIVEL CORRELACIONAL: Busca determinar el grado de relación entre las variables que
intervienen en una relación causal. Se evalúan y controlan variables a través de la relación
causal: y=f(x).
-NIVEL EXPERIMENTAL: Busca innovar, transformar una realidad en base a la
modificación de la composición de variable independiente (x) en una relación causal: y=f(x).
Hay control y manipulación de variables. Pueden ser:
- CUASI-EXPERIMENTAL: Existen 2 grupos de estudio: grupo control y grupo
experimental (en donde se realiza la manipulación de la variable independiente x).
- PRE- EXPERIMENTAL: Cuando se considera a un solo grupo de estudio, en donde
se realiza evaluaciónes: antes y después del proceso.
B) NATURALEZA DE LA INVESTIGACIÓN:
Se refiere en base al tiempo como se ha recolectado los datos, obtenido la información, en el
tratamiento de una investigación correspondiente. Puede ser:
- RETROSPECTIVA: Cuando la información ya existe, es decir el fenómeno de estudio
ya ocurrió.
- PROSPESTIVA: Cuando la información todavía no existe, recién el investigador va a
determinar y administrar la información que se necesita.
TRABAJO GRUPAL: PRESENTACIÓN DE INFORMES Y EXPOSICIÓN
Considerando los métodos o técnicas de recolección de datos indicados en el cuadro
anterior, realizar lo siguiente:
Para cada método o técnica de recolección, indicar:
- Definición
- Aplicaciones
- Ventajas de su aplicación
- Desventajas de su aplicación
- Identificar el instrumento de recolección de datos que le corresponde
Para cada instrumento de recolección de datos identificado, indicar:
- Definición
- Características
- Aplicaciones
- Procedimiento de construcción
- Elaboración del diseño de la estructura de cada instrumento (formato), en base a un
ejemplo de trabajo de investigación que Ud. Podría plantear.
ORGANIZACIÓN DE LA INFORMACIÓN
Una vez recolectado los datos, el paso siguiente consiste en organizarlos y ordenarlos
adecuadamente, en base a los criterios siguientes:
a) Revisión de la información obtenida en los formatos de los instrumentos referentes a los
métodos de recolección de datos aplicados.
b) Depuración de los instrumentos de recolección aplicados que no cumplen con las
condiciones de calidad, como, por ejemplo: los que están en blanco, incompletos,
incongruencias entra las respuestas registradas, etc.
c) Elaboración de una base de datos que busque resumir los resultados obtenidos, teniendo
en cuenta a las variables de estudio
d) Codificación de los valores y categorías de las variables de estudio, lo cual permita
facilitar su procesamiento posterior.
Para lo cual deberá tenerse en cuenta lo siguiente:
i) CUANDO LA VARIABLE ES CUALITATIVA:
Ordenar las categorías de la variable cualitativa, asignándole un código a cada
una de ellas. Por ejemplo:
ESTADO CIVIL CÓDIGO
CASADO (a) 01
DIVORCIADO (a) 02
SOLTERO (a) 03
VIUDO (a) 04
ii) Cuando la variable es cuantitativa:
Se realiza ordenando de acuerdo a la magnitud de sus valores, en forma
ascendente o descendente.
Ejemplo:
Supongamos que se registra las mediciones de la longitud de los diámetros de
30 tubos de acero en pulgadas:
6.1 17.1 15.0 27.6 2.9
10.4 24.5 8.4 38.5 44.8
6.4 30.8 1.0 3.8 41.6
3.8 40.1 3.8 19.6
20.4 26.3 14.6 15.7
19.7 31.8 44.7 39.6
36.5 44.7 50.3 3.8
Ordenando en forma ascendente, se tiene:
Unidades de análisis: tubos de acero
Variable: Longitud de los diámetros en pulgadas.
Clase de variable: Variable cuantitativa continua.
X i : Longitud CÓDIGO X i CÓDIGO Xi CÓDIGO Xi CÓDIGO Xi CÓDIGO
1.0 (01) 10.4 (07) 19. (13) 36. (19) 44. (25)
7 5 8
2.9 (02) 14.6 (08) 20. (14) 18. (20) 50. (26)
4 5 3
3.8 (03) 15.0 (09) 24. (15) 39. (21)
5 6
6.1 (04) 15.7 (10) 26. (16) 40. (22)
3 1
6.4 (05) 17.1 (11) 30. (17) 41. (23)
8 6
8.4 (06) 19.6 (12) 31. (18) 44. (24)
8 7
Conclusiones:
1) RANGO (R): R= Valor máximo-Valor mínimo.
R= 50.3-1.0=49.3 pulgadas.
2) VALOR MÁS FRECUENTE: X i =3.8 pulgadas .
Frecuencia de 3.8 = 4
3) CLASE DE VARIABLE: Variable cuantitativa continua.
PRESENTACIÓN DE LA INFORMACIÓN
Una vez obtenido y organizado los datos que se necesitan, seguidamente debe pasarse a la fase
de la presentación adecuada y ordenada de los mismos con un determinado criterio, de tal
manera que facilite su comprensión y su posterior análisis.
FORMAS DE PRESENTACIÓN DE LA INFORMACIÓN:
La información puede presentarse adecuadamente de 2 formas:
a) Mediante tablas de distribución de frecuencias
b) Mediante gráficos estadísticos.
TABLAS DE DISTRIBUCIÓN DE FRECUENCIAS
1) DEFINICIÓN: Constituye una representación que busca clasificar de manera
sistemática, ordenada y resumida a una información en grupos, categorías o intervalos
de clase.
Cuando se dispone de un gran número de datos referentes a una característica en
estudio, resulta más económico, clasificar y distribuir estos datos en categorías, clases o
grupos.
2) OPERACIONES PARA CONSTRUIR UNA TABLA DE DISTRIBUCIÓN DE
FRECUENCIAS:
A) LA CLASIFICACIÓN: Que consiste en determinar las categorías, los distintos
valores que toman las variables o los intervalos de clase.
B) LA TABULACIÓN: Consiste en distribuir los elementos de la población en la
respectiva categoría o intervalo de la variable.
FRECUENCIA: Número de veces que se repite cada valor distinto o categorías de
las variables.
3) DISTRIBUCIONES UNIDIMENSIONALES: Cuando se estudia una sola variable.
Ejemplo:
X i : Edad de n personas
Xi : X1 , … , Xn
DistribuciónUnidimensional
4) TIPOS DE TABLAS DE DISTRIBUCIÓN DE FRECUENCIAS:
1° Variable cuantitativa y tiene varios valores diferentes o es continua ⇒ intervalos de
clase.
2° Variable cuantitativa y tiene pocos valores diferentes ⇒ sin intervalos.
3° Variable cualitativa.
5) ELEMENTOS DE UNA TABLA DE DISTRIBUCIÓN DE FRECUENCIAS
(DISEÑO):
Tomando como base el 1° tipo; se tiene:
VARIABLE Xi fi Fi hi Hi hi (%) H i (%)
(unidad)
A: [a-b] X1 f1 F 1=f 1 h1 H 1=h 1 h1 H 1=h 1
B: [c-d] X2 f2 F2 h2 H2 h2 H2
. . . . . . . .
. . . . . . . .
. . . . . . . .
M: [ ] Xm fm F m=n hm H m =1 h m1 H m =100
TOTAL n 1.0 100%
TITULO: …….
Encabeza
miento
FUENTE: ………….
COLUMNA
PROCEDIMIENTO:
MATRIZ
1° RANGO (R): Tamaño de la información: R= Valor máximo- Valor mínimo
Donde: R es grande: R¿2 dígitos
R es pequeño: R ≤ 2 dígitos
2° NÚMERO DE INTERVALOS (m): Determinar en cuantos intervalos se clasificaría la
información:
Regla de Sturgess: m=1+3.3 log n
m deberá redondearse por exceso si R es grande
m deberá redondearse por defecto si R es pequeño.
3° AMPLITUD INTERVALICA (c): Tamaño de cada intervalo.
R
C=
m
“C deberá ser redondeado siempre por exceso, de acuerdo a la unidad de medida de la
información”.
EJEMPLOS:
SEA: X i Unidad de medida de la información =1
10 20 8 12 7
Supongamos que: C=3.49 ⇒ c=4
5 4 15 8 18
- - - - -
- - - - - C deberá ser como son los datos.
SEA: X i Unidad de medida de medida de la información=0.1
10.3 8.4 17.3 6.4 Supongamos que: C=4.32 ⇒C=4.4
9.6 2.5 15.3 20.4
- - - -
- - - -
4° FRECUENCIAS: Número de veces que se repite cada valor distinto de la variable en cada
intervalo de clase. Pueden ser:
A) FRECUENCIAS ABSOLUTAS SIMPLES ( f ¿¿ i) :¿ Número de elementos que
pertenecen a cada intervalo.
0 ≤ f i <n
m
∑ f i=f 1 +f 2+ …+f m=n
i=1
B) FRECUENCIAS ABSOLUTAS ACUMULADAS F i: Se obtienen sumando
acumulativamente las f i, partiendo de:
F 1=f 1
F 2=f 1 + f2
.
.
.
F m=f 1+ f 2 +…+ f m =n
F m=n
C) FRECUENCIAS RELATIVAS SIMPLES ¿ ¿ Proporción de elementos que le
corresponden a cada intervalo con respecto a n, donde:
fi
hi =
n
0 ≤ hi <1
m
∑ hi=h1 +h 2+ …+hm =1
i=1
D) FRECUENCIAS RELATIVAS ACUMULADAS( H ¿¿ i) ¿: Se obtienen de 2 maneras:
i) Sumando acumulativamente las hi :
Esto es: H 1=h 1
H 2=h 1+ h2
.
.
.
H m =h1 +h2 +…+ hm=1
ii) Mediante:
Fi
H i=
n
E) FRECUENCIA PORCENTUALES:
i) FRECUENCIAS PORCENTUALES SIMPLES:
fi
hi ( % )=hi x 100= x 100
n
m
∑ hi ( % )=100 %
i=1
ii) FRECUENCIAS PORCENTUALES ACUMULADAS:
Fi
H i ( % ) =H i x 100= x 100
n
5°) MARCAS DE CLASE( X i ): Puntos medios de cada intervalo de clase. Ejemplos:
Si:
a+b
A=[ a , b ] ⇒ X i=
2
a+b
B=[ a , b ] ⇒ X i =
2
Son los valores representativos de cada intervalo.
TÍTULO: Enunciado breve y preciso, que debe contener los siguientes componentes:
Unidades de análisis: Elementos objeto de estudio.
Variable: Característica de estudio.
Antes del nombre de la variable deberá ir la palabra: “según” o la palabra “por”.
Lugar o espacio: Donde se desarrollará el estudio.
Tiempo: Para lo cual es vigente la información.
FUENTE: Es el lugar, medio o instrumento de donde se obtuvieron los datos.
INTERVALOS DE CLASE
1) Definición: Subconjuntos de cada intervalo.
2) Clases:
A) Intervalos cerrados: Cuando se consideran los extremos:
[ a , b ]={ xϵ R / a ≤ x ≤b }
B) Intervalos abiertos: Cuando no se consideran los extremos:
(a , b)={xϵ R /a< x <b }
C) Intervalos semiabiertos a la derecha: Cuando no se considera al extremo de la
derecha:
a , b ¿={xϵ R/a ≤ x< b }
D) Intervalos semiabiertos a la izquierda: Cuando no se considera al extremo de la
izquierda.
[ a , b ]={ xϵ R /a< x ≤ b }
INTERVALOS CERRADOS
Sea:
A=[a , b]
Límite inferior Límite superior
Se tiene: Límite superior= Límite inferior+ C- Unidad de medida de la información.
⇒ C= Límite superior- Límite inferior+ Unidad de medida de la información
INTERVALOS SEMIABIERTOS A LA DERECHA
Sea:
B=[a , b]
Límite inferior Límite superior
Se tiene: Límite superior= Límite Inferior + C
⇒ C= Límite superior-Límite inferior - Unidad de medida de la información.
Ejemplos:
1) Se tienen los datos referentes a la producción mensual (T.M) de harina de pescado de 30
fábricas (2019) del Perú:
50 62 93 87 57
65 63 78 95 58
70 60 75 55 85
76 77 84 91 93
94 92 65 80 85
80 58 52 64 70
Fuente: Ministerio de Industria y Turismo.
a) Construir una tabla de distribución de frecuencias adecuada.
b) Interpretar los resultados de la tabla
c) Interpretar los resultados: f 4 , F 4 , h 4 (%) , H 4 (%), X 3
a) Análisis:
Unidad de análisis: Fábricas del Perú
Variable: Producción mensual (T.M)
-Clase de variable: V. Cuantitativa discreta (presenta varios valores diferentes).
Unidad de medida de la información=1
1° tipo) ⇒ intervalos
PROCEDIMIENTO:
1º) RANGO(R):
R= VALOR MÁXIMO – VALOR MÍNIMO
R= 94 – 50 = 44 T.M.
Rango pequeño
2º) NÚMERO DE INTERVALOS (m):
Regla de Sturgess:
n=30
m= 1+ 3.3 log n
m=1 + 3.3 log 30
m= 5.87
m= 5
Como R es pequeño →
3º) AMPLITUD INTERVÁLICA (C ):
C= R/m
c= 44/5 = 8.8
→
c= 9
DISTRIBUCIÓN DE FÁBRICAS DEL PERÚ, SEGÚN PRODUCCIÓN MENSUAL
(T.M) DE HARINA DE PESCADO; AÑO 2019
PRODUCCIÓ
N MENSUAL Xi fi Fi hi Hi hi (%) Hi (%)
[50 – 59] Xi=54.5 fi=6 Fi=6 hi=0.20 Hi=0.20 20 20
[59 – 68] X₂=63.5 f₂=6 F₂=12 h₂=0.20 H₂=0.40 20 70
[68 – 77] X₃=72.5 f₃=4 F₃=16 h₃=0.13 H₃=0.53 13 53
[77—85] X₄=81,5 f₄=8 F₄=24 h₄=0.27 H₄=0.80 27 80
[86 – 95] X₅=90,5 f₅=6 F₅=30 h₅=0.20 H₅=1.00 20 100
TOTAL n=30 1.00 100%
Fuente: Ministerio de Industria y Turismo
b) Interpretación:
- Los resultados de la tabla construida nos indica que en el año 2019 predominan
las fábricas del Perú (27%) que registraron una producción mensual de 77 hasta
menos de 86 T.M respectivamente.
- Asimismo, destacamos que un 20% de fábricas del Perú tuvieron la mayor
producción mensual de harina de pescado comprendida de 86 hasta menos de 95
T.M.
- Por otro lado, el mismo porcentaje de fábricas (20%) del Perú registraron la
menos producción mensual de harina de pescado comprendida de 50 hasta
menos de 59 T.M.
- En general, podemos señalar que más de la mitad de las fábricas del Perú (53%)
registraron una producción por debajo del promedio, comprendido de 50 hasta
menos de 77 T.M.
c) Interpretación:
f 4=8: Significa que 8 fábricas del Perú en el año 2019 tuvieron una producción
mensual de harina de pescado de 8 T.M.
F 4=24: Significa que 24 fábricas del Perú en el año 2019 tuvieron una
producción mensual de harina de pescado de 50 hasta menos de 86 T.M.
h 4 (%) = 27%:
H 4 (%) = 80%:
X 3 = 72.5:
Suponga que tienen los pesos de 50 lingotes de acero producidos por Siderperú, la
muestra fue obtenida de la producción mensual y las unidades están dadas en kg.
94.3 93.0 95.5 95.3 92.4 94.4 92.8 93.2 93.6 95.5
92.9 93.6 95.7 93.8 94.8 93.4 92.7 91.6 93.6 93.7
94.2 95.7 94.7 94.3 92.7 94.5 96.2 95.4 93.7 91.9
94.7 92.7 95.0 93.0 92.7 93.7 92.7 93.3 94.6 96.4
94.1 93.7 94.2 93.7 94.0 93.9 93.6 94.6 92.3 94.4
Fuente: Oficina de producción. Empresa Siderperú
A) Constar una tabla de distribución de frecuencias adecuadas
B) Interpretar los resultados de la tabla elaborada
Análisis:
- Unidad de análisis: lingotes de acero producidos por Siderperú.
- Variable: Producción mensual (kg).
-Clase de variable: variable cuantitativa continua, presenta varios valores
diferentes.
Unidad de medida de la información = 0,1
1º CASO) INTERVALOS
PROCEDIMIENTO:
1º) Rango (n):
R= 96.4 – 91.6
R= 4.8 kg
R pequeño
2º) Número de intervalos (m)
m= 1+3.3 log50 n=50
m= 6.61
m= 6; por ser R pequeño
3º) Amplitud interválica (C)
C= 4x8/6
C= 0.8
TABLA N°02
DISTRIBUCIÓN DE LINGOTES DE ACERO PRODUCIDOS
MENSUALMENTE POR SIDERPERÚ, SEGÚN PESOS (KG)
Producción Xi fi Fi hi Hi hi (%) Hi (%)
mensual (kg)
[a,b]
[91.6 – 92.3] X 1 =91.92 f 1=3 F 1=3 h1=0.06 H 1=0.0 h1=6 H 1=6
f2 6
[92.4 – 93,1] X 2=¿ 92.75¿ =10 F 2=1 h2 =0.20 h2 =20 H 2=26
3 H 2=0.2
[93,2 – 93,9] X 3 =93.55 f 3=14 h3 =0.28 6 h3 =28 H 3=54
F 3=2
[94,0 – 94,7] X 4=94.35 f 4=13 7 h 4=0.26 H 3=0.5 h 4=26 H 4 =80
4
[94,8 – 95,5] X 5 =95.15 f 5= 6 F 4=4 h5 =0.12 h5 =12 H 5=92
0 H 4 =0.8
[95.6 – 96,4] X 6 =96.0 f 6=4 h6 =0.08 0 h6 =8 H 6=10
F 5=4 0
6 H 5=0.9
2
F 6=5
0 H 6=1.0
0
TOTAL n= 50 1.00 100%
FUENTE: Oficina de Producción. Empresa SiderPerú.
b) INTERPRETACIÓN:
-En esta tabla podemos destacar que predominan los lingotes de acero producidos
durante la producción mensual por la Empresa SiderPerú(28%) cuyos pesos están
comprendidos de 93.2 hasta 93.9 kg inclusive.
-Asimismo, identificamos una cantidad importante de lingotes de acero (26%)
producidos durante la producción mensual por la Empresa SiderPerú (26%), cuyos
pesos están comprendidos de 94.0 hasta 94.7 kg inclusive.
-Identificamos de igual manera que solamente el 8% de lingotes de acero producidos
durante la producción mensual por la empresa SiderPerú registraron los mayores pesos,
los cuales se encuentran comprendidos de 95.6 hasta 96.4 kg inclusive.
-Por otro lado, el 6% de lingotes de acero producidos semanalmente por SiderPerú,
registraron los menores pesos de dicha producción, siendo sus pesos comprendidos de
91.6 hasta 92.3 kg inclusive.
3) Se tiene información referente al número de columnas de 30 viviendas de “Los
Pinos-Chimbote” Año 2019:
4 7 6 5 7 6 4 5
5 4 4 5 7 4 5 4
6 6 7 4 6 4 6
4 4 4 6 4 5 7
Fuente: Encuesta por muestra
a) Construir una tabla de distribución de ciencias adecuada
b) Interpretar los resultados de la tabla elaborada
4) La nacionalidad de los participantes en un Congreso Internacional de Ingeniería Civil
Año 2015 fueron las siguientes:
C; B; P; E; P
P; V; C; B; P
P; C; E; P; B
P; C; V; P; V
Donde:
B: boliviano, C= colombiano, E= ecuatoriano
P= peruano, V= venezolano
a) Construir una tabla de distribución de Frecuencia adecuada.
b) Interpretar los resultados de la tabla elaborada.
REPRESENTACIONES GRÁFICAS
1) Definición: Permiten visualizar mejor y apreciar en una forma más objetiva y
rápida, la información contenida en una tabla de distribución de frecuencias.
Para elaborar una representación gráfica primero la información deberá estar
clasificada en una tabla de distribución de frecuencias.
2) Aplicación de representantes gráficas en un proceso de investigación
científica:
Considerando que las distribuciones de frecuencias tienen muchas formas de ser
representadas gráficamente, entonces para elegir el gráfico o gráficos adecuados
y al aplicarlos en un proceso de investigación científica, se deberá tener en
cuenta los siguientes criterios:
-De los objetivos que tiene la investigación.
-Del nivel de investigación y
-Del tipo de variable.
3) Elementos de la estructura (diseño) de las representaciones gráficas:
a) Título: Enunciado breve y preciso, mayormente se ubica en la parte inferior
del gráfico. Mayormente es similar al título de la tabla de distribución de
frecuencias.
b) Cuerpo: Es la figura en sí del gráfico, que algunas pueden ser elaboradas,
tomando como base el sistema de coordenadas y otras a la longitud de una
circunferencia.
c) Fuente: Es el lugar medio, instrumento que facilita obtener la información.
Mayormente es la misma que la tabla de distribución de frecuencias.
d) Leyenda: Descripción de los niveles o categorías de una variable que no
aparece descrita directamente en la representación gráfica.
4) Recomendaciones para elaborar las representaciones gráficas:
a) Forma: Rectangular y estética
b) Tamaño: Adecuado, usando escalas de medición adecuadas.
Longitud baja: 3/4 longitud de la
altura Longitud 0
de medición: Grados
sexagesimales
Longitud: cm, pulg, dm, etc de
medición
ALTURA 0
(Escala)
5) FORMAS O TIPOS
DE REPRESENTACIONES
GRÁFICAS: Tenemos:
Base (Escala)
A) PARA VARIABLES CUANTITATIVAS: Tenemos:
- Gráfico de bastones
- Histograma de frecuencias
- Polígono de frecuencia
- Ojivas
B) PARA VARIABLES CUALITATIVAS: Tenemos:
- Gráfico de barras
- Gráfico de sectores circulares
C) PARA VARIABLES RELACIONADAS CON EL TIEMPO: Tenemos:
- Gráfico polar
- Gráfico de serie de tiempo
- Diagrama de Gantt
GRÁFICO DE BASTONES
- Definición: Conjunto de segmentos perpendiculares al eje X de un sistema de
coordenadas, con una magnitud directamente proporcional a las frecuencias.
- Aplicación: Cuando se tiene una variable cuantitativa discreta clasificada sin
intervalos.
Procedimiento de construcción:
A) Ubicar en el Eje X de un sistema de coordenadas los valores de la variable Xi, y
en el Eje Y las frecuencias absolutas simples (fi) o las frecuencias porcentuales
simple (hi%).
B) Ubicar en el sistema los puntos (Xi, fi).
C) Trazar segmentos perpendiculares a partir de cada valor de la variable Xi,
generándose los bastones respectivos.
EJEMPLO:
Tomándose la información de la tabla Nº3, se construirá un gráfico de bastones.
GRÁFICO Nº1
DISTRIBUCIÓN(%) DE VIVIENDAS SEGÚN NÚMERO DE COLUMNAS-LOS
PINOS-CHIMBOTE
hi%
40
30
23
20
17
10
Xi: Número
4 5 6 7 de columnas
Columna1 Columna2 Columna3 Columna5
Fuente: Encuesta por muestreo
Interpretación:
- Del gráfico elaborado se puede apreciar que predominan las viviendas (40&)
que cuentan con 4 columnas, lo que representan las viviendas con el número de
columnas de la distribución.
- Asímismo observamos que un importante porcentaje de viviendas (23%)
cuentan en su estructura con 6 columnas.
- También destacamos que solamente el 17% de viviendas en “Los Pinos-
Chimbote” cuentan con el mayor número de columnas (7).
- En forma general, no todas las viviendas de “Los Pinos-Chimbote” presentan un
número de columnas semejante.
HISTOGRAMA DE FRECUENCIAS
1. Definición: Conjunto de rectángulos juntos o superpuestos, que tienen como
base la longitud de cada intervalo y por altura las frecuencias absolutas simples
(fi) o porcentuales simples (hi%).
2. Aplicación: Cuando la variable es cuantitativa está clasificada en intervalos.
3. Clases:
-Histograma de frecuencias absolutas simples (fi).
-Histograma de frecuencias porcentuales simples (hi%).
4. Procedimiento de construcción:
-Ubicar en el eje X del sistema de coordenadas los límites de cada intervalo y en el eje
Y, las frecuencias absolutas simples (fi) o las frecuencias porcentuales simples (hi%), en
base a una escala adecuada.
-Ubicar en el sistema los puntos (Ii, fi) o (Ii, hi%), donde: Ii, los límites de cada
intervalo.
-A partir de cada punto ubicado anteriormente trazar una horizontal del tamaño de cada
intervalo y de los extremos de la misma bajar segmentos verticales sobre los límites de
cada intervalo, formándose de esta manera los rectángulos respectivos.
Ejemplo:
Tomando como base la información de la tabla de distribución de frecuencias Nº 01, se
construirá un histograma de frecuencias porcentuales simples (hi%).
27%
20%
20% 20%
13%
95
Fuente: Ministerio de Industrias y
Turismo
INTERPRETACIÓN:
- En este gráfico destacamos que predominan las fábricas del Perú (27%), que en
el año 2019 registraron una producción mensual de harina de pescado de 77
hasta menos de 86 T.M respectivamente.
- Se identifica de igual manera que solamente el 20% de fábricas del Perú en el
año 2019 registraron la mayor producción mensual de harina de pescado, lo cual
estuvo comprendido de 86 hasta menos de 95 T.M.
- Por otro lado, encontramos también que solamente el 20% de fábricas del Perú
en el año 2019 evidenciaron la menor producción mensual de harina de pescado,
la cual está comprendida de 50 hasta menos de 59 T.M.
- El menor porcentaje (13%) de fábricas del Perú registraron una producción
mensual de harina de pescado de 68 hasta menos de 77 T.M. respectivamente.
POLÍGONO DE FRECUENCIA
1) Definición: Consiste en una línea poligonal cerrada en un sistema de
coordenadas.
2) Aplicación: Cuando se tiene una variable cuantitativa clasificada con intervalos
o sin intervalos.
3) Clases:
- Polígono de frecuencias absolutas simples (fi).
- Polígono de frecuencias porcentuales simples (hi%).
4) Procedimiento de construcción:
- Determinar dos intervalos adicionales en la distribución con frecuencia cero.
- Determinar en la distribución las marcas de clase (puntos medios) de cada
intervalo.
- Ubicar en el Eje X del sistema de coordenadas las marcas de clase (Xi) de cada
intervalo incluyendo los de los intervalos adicionales y en el Eje y, las
frecuencias absolutas simples (fi) o las frecuencias porcentuales simples (hi%).
- Colocar en el sistema los puntos: (Xi, fi) o (Xi, hi%).
- Unir los puntos ubicados anteriormente mediante segmentos de recta,
incluyendo a los intervalos adicionales, formándose de esta manera la línea
poligonal cerrada.
EJEMPLO:
GRÁFICO Nº03
Distribución(%) de fábricas del Perú, según producción mensual
(T.M) de harina de pescado: Año 2019
30
25
20
15
10
0
44.5 54.5 63.5 72.5 81.5 90.5 99.5
Serie 3
Tomando de igual manera como base la información de la tabla de distribución de
frecuencias Nº01, se construirá de igual manera un polígono de frecuencias porcentuales
simples (hi%).
Fuente: Ministerio de Industria y Producción mensual de turismo
27
17
INTERPRETACIÓN:
- En este gráfico destacamos que predominan las fábricas del Perú (27%) que en
el año 2019 tuvieron una producción mensual promedio de harina de pescado de
81. 5 T.M respectivamente.
- Asimismo, se visualiza que el 20% de las fábricas del Perú en el año 2019
registraron la mayor producción mensual promedio de harina de pescado
equivalente a 90.5 T.M.
- De igual manera se reporta que el 20% de fábrica del Perú en el año 2019
registraron la menor producción mensual promedio de harina de pescado
equivalente a 54.5 T.M.
- Asimismo, tenemos que el menor porcentaje (13%) de fábricas del Perú
registraron una producción mensual promedio de 54.5 T.M respectivamente.