La estadística se preocupa de la ordenación y sistematización de datos, para poder apoyar el
proceso de toma de decisiones; La forma en que se ordenan los datos varía de acuerdo al tipo de
variable de que se trata. Estudiaremos a continuación la ordenación de datos de una variable.
TABULACIÓN DE DATOS ESTADÍSTICOS
Al aplicar las encuestas o acudir a una base de datos para obtener la información, es posible que
a simple vista se dificulte la interpretación por la cantidad de datos que pudieron ser generados en
el proceso investigativo. Por esta razón, es conveniente agrupar los datos y construir tablas que
faciliten la interpretación.
La tabulación de datos es el proceso mediante el cual se toman los diferentes valores o atributos
de la variable y se ubican en una columna, según el criterio de ordenación definido por el
investigador, y al frente de cada valor o atributo se coloca la frecuencia.
Cuando se trata de variables cualitativas, para la tabulación de datos se recomienda seguir un
patrón con orden cronológico, alfabético o con nivel jerárquico y, posteriormente, se realiza el
conteo; por ejemplo, si el interés es conocer el nivel de escolaridad de un grupo de personas, se
ordena de la siguiente manera.
Para la tabulación de datos que corresponden a la variable cuantitativa discreta se emplean
escalas numéricas y se ordena en forma creciente; por ejemplo, si se consulta por el número de
hijos de un grupo de personas, estos deben ordenarse de forma creciente.
Cuando los datos son numerosos o corresponden a la variable cuantitativa continua, la
ordenación en forma creciente ya no es funcional y, por lo tanto, se deben agrupar los datos en
intervalos, mediante el siguiente procedimiento: calcular rango o recorrido, número de intervalos
o clases, amplitud del intervalo de clase, límites de los intervalos y tabulación.
Distribución de frecuencias
Una distribución de frecuencia es una tabla donde se rigen datos y sus diferentes frecuencias, es
decir, la frecuencia absoluta, la relativa, la absoluta acumulado y la relativa acumulada.
Una distribución de frecuencia en las que se indican la frecuencia absoluta y la frecuencia
relativa, se puede realizar tanto para variables cualitativa como para variables cuantitativa.
Frecuencia absoluta (f). Es la cantidad de veces que se presenta un dato en una encuesta o
estudio.
Frecuencia relativa (h). Es el cociente entre la frecuencia absoluta de cada dato (f) y el total de
datos (n), es decir, h = f/n.
Amplitud (A). Es el ancho del intervalo
Marca de clase (xi). Es el punto medio del intervalo y es la suma de los limites dividido entre dos.
Estadísticas de variable cualitativa o una discreta con pocas clases
Para estudiar la agrupación en el caso de las variables, analicemos el siguiente ejemplo.
Preocupada por las metas planteadas por el nuevo Gobierno, la ministra de salud se decide a
investigar el número de pacientes diarios que atiende la atención primaria en la actualidad. Para
ello, la ministra solicita al jefe de la Dirección Regional Sur del Ministerio, le entregue la
información con respecto a las atenciones básicas que presta el Hospital Sótero del Río. El
funcionario le despacha la siguiente información:
40 42 45 38 45 41 42 45 42 41 39 37 35 40 43 40
44 35 42 41 37 38 37 42 41 39 43 45 45 37 40
41 43 35 45
El total de observaciones de la variable es de 35, y se simboliza con la letra n; en el ejemplo n =
35
Tal como fueron enviados los datos, no prestan mucha utilidad para efectos de poder tomar las
decisiones necesarias, que permitan eliminar las colas en los consultorios.
Es necesario ordenar la información. Cada uno de los números escritos en la tabla representa el
número de pacientes atendidos en un día cualquiera, o sea, representan un valor para la variable,
siendo el total 35 (35 días). Cada una de las 35 observaciones será designada por xi ( X
minúscula), de tal manera que x1 debe leerse como la “i-ésima” observación de la variable X. En
el ejemplo x1=40, lo que quiere decir que el primer día de observación se atendió a 40 pacientes.
Paralelamente, estas observaciones están presentadas sin ninguna ordenación de precedencia.
Disponerlas de menor a mayor será el siguiente paso:
35 35 35 37 37 37 37 38 38 39 39 40 40 40 40 41 41 41 41 41 42 42 42 42 42 43 43 43 44 45 45
45 45 45 45
Ordenados los datos, es fácil formular las siguientes conclusiones:
La variable asume un total de 9 valores
El menor valor es 35 y el mayor 45
Cada uno de los valores que adopta la variable recibe el nombre de clase, y se denota m; en este
caso m=9, por haber nueve valores distintos de la variable. Sin embargo, todavía se pueden
disponer los datos de mejor manera; para ello
construiremos el cuadro de distribución de frecuencias para esta variable.
Valores de la Frecuencias Frecuencias absolutas Frecuencias relativas
variable (Xi) absolutas (fi) acumuladas (Fi) (hi)
35 3 3 3/35 = 0,0857
36 0 3 0/35 = 0
37 4 7 4/35 = 0,1143
38 2 9 2/35 = 0,0571
39 2 11 2/35 = 0,0571
40 4 15 4/35 = 0,1143
41 5 20 5/35 = 0,1429
42 5 25 5/35 = 0,1429
43 3 28 3/35 = 0,0857
44 1 29 1/35 = 0,0286
45 6 35 6/35 = 0,1714
Total 35 35/35 = 1
La primera columna de esta tabla contiene los valores que adopta la variable o clases; si bien es
cierto en ninguno de los 35 días se atendieron 36 pacientes, para efectos de la correcta
tabulación la tabla debe contener esta clase.
La segunda columna de la tabla recibe el nombre de frecuencias absolutas; Estas frecuencias
corresponden a las repeticiones que tiene cada valor de la variable para el ejemplo. La frecuencia
absoluta de la primera clase es de 3.
Lo anterior debe interpretarse como que “durante 3 días se atendió a 35 pacientes”; La
nomenclatura de frecuencia absoluta es ni. Como el lector deberá suponer, la suma de todas las
frecuencias absolutas debe ser igual al número de observaciones n.
Otra pregunta que suele surgir, al analizar datos, es cuantas de las observaciones son menores o
mayores que un determinado valor de la variable; para ello se calcula la columna de frecuencias
absolutas acumuladas. La frecuencia absoluta acumulada de una clase determinada se calcula
sumándole a su frecuencia absoluta, las frecuencias absolutas de todas las clases anteriores. En
el ejemplo, la frecuencia absoluta acumulada de la 4º clase es 9, y que proviene de la suma de su
frecuencia (2) absoluta más todas las anteriores (3, 0, 4).
Si a la ministra de salud le interesara saber en cuantos días se atendió al menos a 40 pacientes,
sólo debe remitirse a la tabla y observar la frecuencia absoluta acumulada de ese valor de la
variable, en el ejemplo es 15.
Por otro lado, en el marco de una investigación, muchas veces es mejor presentar la información
en términos porcentuales. Para ello se calcula la tercera columna, la que recibe el nombre de
columna de frecuencias relativas. La frecuencia relativa expresa porcentualmente, la
importancia de cada clase en relación con el total de las observaciones de la variable; cada
frecuencia relativa se calcula utilizando la siguiente fórmula:
Así, se puede afirmar que 8,57% de los días el consultorio atiende 35 consultas.
Ejemplo 1: los siguientes datos corresponden a las temperaturas máximas (en °c) observadas y
registradas en Bogotá D. C., durante los primeros 10 días del año.
18 21 20 19 18 19 20 19 19
Elabora la distribución de frecuencia de estos datos.
Solución:
Temperatur
a máxima f h
(°c)
18 2 2/10 = 0,2
19 5 5/10 = 0,5
20 2 2/10 = 0,2
21 1 1/10 = 0,1
Total 10 1
La distribución de frecuencias indica que la temperatura que más se presentó durante estos días
fue de 19 °C, ya que se fue su frecuencia absoluta 5. Es decir, se registró en 5 de los 10 días.
Datos agrupados
Cuando se tiene una gran cantidad de datos recolectados de una variable cuantitativa y además
la frecuencia absoluta de cada dato es pequeña, es conveniente analizar la variable como datos
agrupados en intervalos de igual tamaño. A estos intervalos se les denomina intervalos de clase.
Para elaborar una distribución de frecuencia con intervalos de clase, es necesario encontrar:
a) Rango: corresponde a la diferencia entre el dato mayor y el dato menor. Se denota con la
letra R
b) Numero de intervalos:
Un estándar
Método de sturguess
M=1+3.3log(n) se aproxima al entero siguiente
Por conveniencia.
la persona es autónoma en definir el número de intervalos. Sin embargo, la mejor manera
es designar el número de clases de la tabla de distribución, de acuerdo con el siguiente
método:
n: número de casos de la K: número de intervalos o de clases recomendables para la tabla
muestra de distribución
n < 50 De 5 a 7 intervalos
De 50 a 100 datos De 6 a 10 intervalos
De 100 a 250 De 7 a 12 intervalos
Mayor a 250 De 10 a 20 intervalos
Amplitud: La amplitud se calcula redondeando el cociente del rango entre el número de clases
(R/K) a la unidad más pequeña (u) inmediata superior en la que se encuentran los datos brutos.
Amplitud = R/K donde R es el rango y K el número de clases.
se aproxima dependiendo de la naturaleza de los números.
Límites de los intervalos
Al construir los intervalos, cada uno de ellos está determinado por dos extremos: límite inferior
(linf) y límite superior (lsup). Para el primer intervalo, el límite inferior es igual al número menor Li
y el límite superior de este intervalo se conforma sumando la amplitud (A) al límite inferior. El
segundo intervalo parte del límite superior del primer intervalo y se le suma la amplitud para
obtener el límite superior. Este proceso se repite para el total de intervalos en los cuales se
agrupó el conjunto de datos.
Luego de construir los intervalos, se procede al conteo o frecuencia de la información, ubicando
cada dato en el intervalo al cual corresponde
Ejemplo A continuación, se presenta un fichero de datos que representa las edades de 30
alumnos de una clase de spinning.
Vamos a construir la tabla de distribución de frecuencias para estos 30 alumnos.
Distribución de Frecuencias
32 38 26 29 32 41 28 31 45 36
45 35 40 30 31 40 37 33 28 30
30 41 39 38 33 35 31 36 37 32
Se va construir una tabla de distribución de frecuencias siguiendo los siguientes pasos:
1. Cálculo del rango
2. Designación del número de clases
3. Cálculo de la amplitud
4. Cálculo de los límites de clase
5. Contabilización y Frecuencia Absoluta
1. Cálculo del Rango de una Variable
El rango es la diferencia entre el valor de mayor magnitud y el de menor magnitud.
De los datos en bruto, se busca el valor de mayor magnitud (abreviado, VM) y el de menor
magnitud (abreviado, Vm).
Con ellos se calcula el rango, con arreglo a la siguiente fórmula:
Fórmula para el Cálculo del Rango
Rango = VM –Vm
Del conjunto de datos en bruto, se busca el valor de mayor magnitud (VM) y el de menor
magnitud (Vm). Con
ellos se calcula el rango, con arreglo a la siguiente fórmula:
Rango = VM -Vm = 45 - 26 = 19
1. Designación del Número de Clases
Utilizando método por conveniencia, podremos observar que n = 30 es menor que 50 y se nos
recomienda, de acuerdo a la tabla, que tomemos de 5 a 7 clases, por lo tanto, K = 5 sería una
buena asignación.
2. Cálculo de la Amplitud del Intervalo
La amplitud se calcula redondeando el cociente del rango entre el número de clases (R/K) a la
unidad más
pequeña (u) inmediata superior en la que se encuentran los datos brutos.
Fórmula para el Cálculo de la Amplitud
Amplitud = R/K donde R es el rango y K el número de clases.
Como los datos de nuestro ejemplo están en enteros, la unidad más pequeña es un entero u = 1,
de tal manera
que la amplitud será la siguiente: R/K = 19/5 = 3.8
Este valor, al redondearlo al entero inmediato superior, será igual a 4. Es decir, Respuesta:
Amplitud: A = 4.
3. Cálculo de los Límites de Clase
Límites de la Primera Clase
Límites de la Segunda Clase
Límites de la Tercera Clase
Límites de la Cuarta Clase
Límites de la Quinta Clase
Límites de Todas las Clases
4. Cálculo de los Recuentos y Frecuencia Absoluta
El recuento es la asignación de cada dato en la clase que le corresponde. La frecuencia absoluta
es el número de datos que se encuentran ubicados en cada clase.
La diferencia fundamental radica en que dada la gran cantidad de valores que adopta una
variable continua, es prudente definir intervalos para efectos prácticos. De otra manera, y dada la
naturaleza de las variables continuas, esta tabla podría tener infinitas clases
1. Ejemplo: En la oficina de un diario, el tiempo que se tardan en imprimir la primera plana fue registrado
durante 50 días. A continuación, se transcriben los datos, aproximados a décimas de minuto:
19 19,5 19,5 19,7 19,8 19,9 20,1 20,3 20,7 20,7 20,7 20,9 20,9 20,9 20,9
21,1 21,2 21,3 21,5 21,6 21,8 21,9 22 22,2 22,5 22,7 22,8 22,8 22,8
22,9 23,1 23,3 23,6 23,6 23,7 23,8 23,8 23,8 23,9 23,9 24,1 24,1 24,2
24,2 24,2 24,3 25 25 25,1 25,3
a. Construya con los datos una tabla de distribución de frecuencia con amplitud igual a 0.9.
Primero se ordenan los números de menor a mayor
Escogemos el número de menor valor Mínimo =19 ese será el límite inferior
Luego se le suma la amplitud que era de 0.9 según el ejercicio
Limite superior = 19 + 0.9 =19.9
Para los demás limites se les suma la amplitud a cada limite inferior que me va quedando, es
decir
Para la marca de clase (xi) se suman los limites y se divide entre dos
Para la frecuencia absoluta (fi)
Del 19 al 19.9 están los números en amarillo hay 6
Del 19.9 al 20.8 los números en verde hay 5
Del 20.8 al 21.7 los números en azul hay 9
Del 21.7 al 22.6 los números en fucsia hay 5
Del 22.6 al 23.5 los números en rojo hay 7
Del 23.5 al 24.4 los números en gris hay 14
Del 24.4 al 25.3 los números en café hay 4
Para la frecuencia absoluta acumulada (Fi) se suman las frecuencias absolutas hasta
alcanzar el intervalo por donde vamos y así hasta alcanzar la totalidad de los datos
Para las frecuencias absolutas es el cociente entre la frecuencia absoluta y el total de los datos
m linf lsup xi fi Fi hi Hi
1 19 19,9 (19+19.9)÷2=19.45 6 6 6*100÷50 6*100÷50
2 19,9 19,9+0.9=20.8 (19.9+20.8)÷2=20.35 5 6+5=11 5*100÷50 11*100÷50
3 20,8 20,8+0.9=21.7 (20.8+21.7)÷2=21.25 9 6+5+9=20 9*100÷50 20*100÷50
4 21,7 21.7+0.9=22.6 (21.7+22.6)÷2=22.15 5 6+5+9+5=25 5*100÷50 25*100÷50
5 22,6 22.6+0.9=23,5 (22.6+23.5)÷2=23.05 7 6+5+9+5+7=32 7*100÷50 32*100÷50
6 23,5 23.5+0.9=24,4 (23.5+24.4)÷2=23.95 14 6+5+9+5+7+14=46 14*100÷50 46*100÷50
7 24,4 24.4+0.9=25,3 (24.4+25.3)÷2=24.85 4 6+5+9+5+7+14=50 4*100÷50 50*100÷50
Total 50 50*100÷50 50
m linf lsup xi fi Fi hi Hi
1 19 19,9 19,45 6 6 12% 12%
2 19,9 20,8 20,35 5 11 10% 22%
3 20,8 21,7 21,25 9 20 18% 40%
4 21,7 22,6 22,15 5 25 10% 50%
5 22,6 23,5 23,05 7 32 14% 64%
6 23,5 24,4 23,95 14 46 28% 92%
7 24,4 25,3 24,85 4 50 8% 100%
Total 50 100%
Ejercicio
1. Suponga que usted es el estadístico oficial y le han pedido que recoja y organice datos relativos. Su
interés principal a partir de los valores. Ha obtenido estos datos de un estudio para conocer la aceptación
de la nueva mega tienda ¨Vendo¨ ubicada en la ciudad de Sincelejo se eligió una muestra de 35 clientes
para conocer sus impresiones y ha reflejado esta información:
TABLA DE FRECUENCIAS Y GRAFICOS USADOS
EN LA ORGANIZACIÓN DE DATOS
Como parte de un estudio para conocer la aceptación de la nueva mega tienda ¨Vendo¨
ubicada en la ciudad de Sincelejo se eligió una muestra de 35 clientes para conocer sus
impresiones. Los resultados son los siguientes:
ingreso número de forma de
cliente Razón de visita gasto semanal
mensual hijos pago
1 Oferta 66 1200 2 Efectivo
2 Guardería 72,5 1500 1 Crédito
3 Tarjeta 79,1 2100 3 Crédito
4 Oferta 82,7 2000 3 Efectivo
5 Guardería 55,3 1500 1 Efectivo
6 Parking 100,1 2200 2 Crédito
7 Aire 35,3 1450 3 Efectivo
8 Tarjeta 60,4 1310 1 Crédito
9 Aire 57,2 1150 2 Efectivo
10 Parking 140 2320 0 Crédito
11 Tarjeta 69,1 1350 2 Efectivo
12 Parking 73,1 1640 1 Crédito
13 Guardería 75,3 1680 3 Crédito
14 Aire 30 1100 0 Efectivo
15 Parking 95,2 1850 2 Efectivo
16 Guardería 65,3 1410 1 Efectivo
17 Tarjeta 68 1580 3 Crédito
18 Parking 115,3 2110 0 Efectivo
19 Parking 130,2 2180 2 Crédito
20 Aire 48,4 1640 3 Crédito
21 Guardería 86 1840 2 Crédito
22 Parking 102,2 1950 3 Efectivo
23 Oferta 50,1 1230 2 Efectivo
24 Tarjeta 101,2 2000 2 Crédito
25 Parking 102,2 2810 3 Crédito
26 Oferta 58,1 1530 4 Efectivo
27 Tarjeta 90,3 1980 2 Crédito
28 Parking 119,1 2900 4 Crédito
29 Oferta 125,1 2680 3 Efectivo
30 Tarjeta 70,2 1970 2 Crédito
31 Parking 118,4 2560 3 Crédito
32 Oferta 110,1 2180 4 Crédito
33 Tarjeta 84,3 1980 3 Efectivo
34 Oferta 77,2 2050 2 Crédito
35 Oferta 104,2 2500 4 Crédito
a. Construir la tabla de distribución de frecuencias.