UNIVERSIDAD NACIONAL EXPERIMENTAL DE GUAYANA
VICERRECTORADO ACADÉMICO
COORDINACIÓN GENERAL DE PREGRADO
PROYECTO DE CARRERA CIENCIAS FISCALES
PROYECTOS DE CARRERAS TURISMO- ALOJAMINTO TURISTICO-GSTIÓN DE ALOJAMIENTO TURISTICO
UNIDAD CURRICULAR ESTADISTICA Y PROBABILIDAD
LAPSO 2024-II
GUIA #2
DISTRIBUCIÓN DE FRECUENCIA
Según Hernández, Fernández y Baptista (2006), la distribución de frecuencias facilita
la exposición ordenada de la totalidad de las observaciones, de una o varias variables
estadísticas, mediante el recuento de apariciones de cada aspecto evaluado expresado en
números absolutos y porcentajes tomando como referencia la totalidad de la población.
TIPOS DE FRECUENCIA
Frecuencia Absoluta: Es el número de veces que aparece un valor o un dato en un
conjunto de datos. Se representa por fi.
La suma las frecuencias absolutas es igual al número total de datos, que se representa por
N.
f1 + f2 + f3 +…+ fn = N
De forma resumida se expresa así: ∑
Frecuencia Absoluta Acumulada: Es la suma de las frecuencias absolutas de todos los
valores inferiores o iguales a un valor considerado. Se representa por Fi.
Frecuencia relativa: Es la proporción de veces que aparece un valor o un dato en relación
con el total de datos. Se calcula dividiendo la frecuencia absoluta entre el número total de
datos. Se pude expresar en tantos por cientos y se representa por hi
La suma de las frecuencias relativas es igual a 1
Frecuencia Relativa Acumulada: Es el cociente entre la frecuencia acumulada de un
determinado valor y el número total de datos. Se representa por Hi.
TABLA DE FRECUENCIA
Es una herramienta que organiza datos numéricos o categóricos, mostrando la
frecuencia (o número de veces) con la que aparece cada valor o categoría.
TIPOS DE TABLAS DE FRECUENCIA
Tabla de frecuencias simple: Muestra la frecuencia de cada valor individual.
Ejemplo 1: En una encuesta de presupuesto familiar, se obtuvo la siguiente
información respecto al n° de hijos en 2 familias.
Variable Discreta x = n° de hijos
Los datos son los siguientes:
3, 1, 2, 0, 3, 2, 1, 1, 3, 3, 2, 4, 2, 2, 0, 2, 1, 3, 4, 2, 3
x1, x2 x21
Se puede observar que la variable X toma valores entre 0 y 4, es decir, existen en
este grupo 5 categorías o clases.
Se cuenta el número de familias en cada categoría y se construye la tabla.
Tabla 1
Categoría Frec. Absoluta Frec. Absoluta Frec. Relativa Frec. Relativa
Xi fi Acum. hi Acum.
Fi Hi
0 f1 = 2 f1 = 2 f1/n = 0.095 h1 = 0.095
1 f2 = 4 f1 + f2 = 6 f2/n = 0.190 h1 + h2 = 0.286
2 f3 = 7 f1 + f2 + f3 = 13 f3/n = 0.333 h1 + h2 + h3 = 0.619
3 f4 = 6 f1 +.......+ f4 = 19 f4/n = 0.285 h1 +......+ h4 = 0.904
4 f5 = 2 f1 +.......+ f5 = 21 f5/n = 0,095 h1 +......+ h5 = 1,000
TOTAL N=21 1
N = tamaño de la muestra
Xi = valor de la variable en el individuo i
fi = frecuencia absoluta: nº de veces que se repite la variable en la categoría i
Fi = frecuencia absoluta acumulada. Indica el nº de individuos hasta la categoría i
hi =frecuencia relativa. Porcentaje de la categoría respecto del total, se obtiene dividiendo
la frecuencia de la clase por el tamaño de la muestra.
Hi = frecuencia relativa acumulada. Porcentaje acumulado
En la tabla de frecuencia se pueden observar algunos detalles importantes:
i) N es la suma de la columna fi, es decir, siempre debe dar como resultado el tamaño de
la muestra.
ii) En la columna de frecuencia absoluta acumulada se van sumando los valores de la
columna fi, por lo tanto el último valor debe ser igual a N.
iii) La columna frecuencia relativa (hi) representa en % de familias en cada categoría. Por
ejemplo, en las categorías con 3 hijos a un 28.5% de familias. Esta columna debe sumar 1.
iv) La Hi acumula los valores de la frecuencia relativa, por lo tanto el último valor debe ser
1. Ejemplo H4: el 90.4% de las familias encuestadas tienen a los más 3 hijos.
Tabla de frecuencias agrupada en Intervalos: Se emplea si las variables toman un
número grande de valores o la variable es continua. Se agrupa los datos o valores en
intervalos que tengan la misma amplitud denominados clases (k). A cada clase se le asigna
su frecuencia correspondiente.
Número de Intervalos de Clases: Debe ser lo suficientemente grande para mostrar
la variabilidad de los datos, pero no tan grande que la tabla o el gráfico sean difíciles de
leer. Se recomienda que sea mayor que 5 y menor que 18. Una regla común es utilizar la
regla de Sturges, que sugiere un número de intervalos (k) en función del tamaño de la
muestra (N), fórmula: k = 1 + 3.322 * log10(N).
Rango: Es la diferencia entre el valor máximo (Xmáx) y el valor mínimo (Xmín) de
todo el conjunto de valores estadísticos.
Límites de Clases: Cada clase está limitada por el límite inferior (Yi-1) de la clase y el
límite superior de la clase (Yi+1).
Amplitud de Clases o Amplitud de Intervalo: Es la diferencia entre límite superior e
inferior de la clase. Se Calcula c = rango / k.
Marca de Clases: Es el punto medio de cada intervalo y es el valor que representa a
todo el intervalo para el cálculo de algunos parámetros. Se calcula como el promedio
entre el límite inferior y el límite superior del intervalo Yi = Yi+1 - Yi-1/2
Ejemplo 2: En una encuesta a 40 personas respecto a sus salarios quincenales en
dólares se obtuvo la siguiente información:
90 62 102 85 92 106 110 95 105 112
108 86 110 68 118 99 98 74 91 80
100 79 93 93 104 77 106 98 73 95
91 83 67 119 108 115 74 88 85 80
Variable Continua X = Salarios quincenales
Se efectúan previamente los siguientes pasos:
i) Identificar el tamaño de la muestra. N = 40
ii) Buscar el valor mínimo y el valor máximo Xmín = 62 Xmáx = 119.
iii) Calcular el rango, restar Xmáx – Xmín = 119 – 62 = 57.
iv) Calcular la cantidad de intervalos utilizando la regla de Sturges: k = 1 + 3.322 x log
(40) = 6.322 usamos k ≈ 6
v) Calcular la amplitud de cada intervalo c = rango / k = 57 / 6 = 9.5 ≈ 10,
vi) Construir la tabla, formando los intervalos de clases considerando que el límite
inferior de una clase pertenece al intervalo, pero el límite superior no pertenece a
ese intervalo, se cuenta en el siguiente intervalo.
Tabla 2.
Intervalos Marca Frec. Frec. Absoluta Frec. Relativa Frec. Relativa
Yi-1 – Yi+1 de Clase Absoluta Acum. hi Acum.
Yi fi Fi Hi
60 - 70 65 f1 =3 f1 = 3 f1/n = 0,075 h1 = 0,075
70 - 80 75 f2 =5 f1 + f2 = 8 f2/n = 0,125 h1 + h2 = 0,20
80 - 90 85 f3 =7 f1 + f2 + f3 = 15 f3/n = 0,175 h1 + h2 + h3 = 0,375
90 - 100 95 f4 =11 f1 +.......+ f4 = 26 f4/n = 0,275 h1 +......+ h4 = 0,62
100 - 110 105 f5 = 8 f1 +.......+ f5 = 34 f5/n = 0,20 h1 +......+ h5 = 0.85
110 - 120 115 f 6 =6 f1 +.......+ f6 = 40 f6/n = 0,15 h1 +......+ h6 = 1,00
TOTAL N=40 1
El resto de las columnas se forman de la misma manera que la tabla 1.
N = tamaño de la muestra
Xi = valor de la variable en el individuo i
fi = frecuencia absoluta: nº de veces que se repite la variable en la categoría i
Fi = frecuencia absoluta acumulada. Indica el nº de individuos hasta la categoría i
hi =frecuencia relativa. Porcentaje de la categoría respecto del total, se obtiene dividiendo
la frecuencia de la clase por el tamaño de la muestra.
Hi = frecuencia relativa acumulada. Porcentaje acumulado
Yi = marca de clase: su valor es igual a la mitad de la suma de los límites inferior y superior
del intervalo de clase. En todos los análisis estadísticos su supone que el valor de la marca
de una clase es el valor que corresponde asignar a cada uno de los elementos ubicados en
ese intervalo.
C = amplitud del intervalo: la diferencia entre los límites reales de un intervalo.
Yi-1 = límite inferior del intervalo
Yi+1 = límite superior del intervalo
Resuelve los siguientes ejercicios de Distribución de Frecuencia
1. En una encuesta realizada a 25 turistas que visitaron un determinado destino, se
les preguntó sobre el número de noches que se hospedaron en el hotel. Los resultados
fueron los siguientes: 2, 3, 5, 4, 2, 2, 3, 4, 6, 2, 3, 1, 2, 4, 3, 2, 5, 3, 2, 1, 3, 4, 2, 3, 5
a) ¿Qué tipo de datos son estos?
b) Construye una tabla de frecuencias correspondiente.
c) ¿Cuál es la duración de estancia más común entre los turistas encuestados en el
hotel, y cuántos de ellos se hospedaron por esa cantidad de noches?
2. Una consultora fiscal ha realizado una encuesta a 30 empresas de un
determinado sector sobre el número de declaraciones de impuestos que presentaron de
forma electrónica en el último año. Los resultados fueron los siguientes: 5, 3, 2, 4, 5, 5, 3, 2,
4, 6, 5, 3, 2, 4, 5, 3, 1, 2, 4, 5, 5, 3, 2, 4, 5, 5, 3, 2, 4, 5
a) ¿Qué tipo de datos son estos?
b) Construye una tabla de frecuencias correspondiente.
3. Una agencia de viajes está analizando las edades de los turistas que contrataron
paquetes de viaje a un destino exótico durante el último año. Han recopilado los
siguientes datos de 80 turistas:
28, 35, 42, 51, 39, 60, 44, 33, 49, 56,
36, 27, 43, 50, 34, 59, 46, 52, 30, 40,
54, 61, 23, 39, 48, 57, 32, 46, 51, 35,
63, 40, 55, 38, 21, 49, 53, 37, 62, 42,
31, 50, 47, 59, 36, 28, 45, 56, 33, 60,
41, 54, 34, 29, 43, 58, 30, 27, 44, 33,
60, 40, 52, 36, 21, 49, 54, 35, 62, 42,
65, 38, 51, 25, 22, 44, 58, 37, 69, 40
a) ¿Qué tipo de datos son estos?
b) Construye una tabla de frecuencias correspondiente.
4. Una consultora fiscal está analizando el número de clientes que atendieron 80
pequeñas empresas durante el último mes. Los datos recopilados son los siguientes:
15, 22, 35, 18, 41, 28, 52, 31, 16, 25,
38, 21 45, 33, 55, 26, 19, 32, 48, 29,
12, 36, 42, 23, 51, 39, 17, 27, 46, 34,
58, 24, 14, 30, 40, 20, 49, 37, 53, 27,
11, 33, 47, 28, 56, 22, 13, 31, 43, 25,
27, 46, 34, 58, 24, 14, 30, 40, 20, 49,
35, 41, 21, 50, 38, 57, 26, 19, 32, 41
28, 56, 22, 13, 31, 43, 25, 54, 54, 18
a) ¿Qué tipo de datos son estos?
b) Construye una tabla de frecuencias correspondiente.
5. Dada la siguiente tabla de frecuencias:
Clases fi
9 – 12 2
12 – 15 1
15 – 18 2
18 – 21 5
21 – 24 8
24 – 27 11
27 – 30 7
30 – 33 4
33 – 36 5
36 – 39 2
a) Determine las marcas de clases y la amplitud de las clases.
b) Determine las frecuencias absolutas acumuladas.
c) Determine las frecuencias relativas.
d) Determine las frecuencias relativas acumuladas.
GRÁFICOS
Son las representaciones visuales de los datos que nos permiten comprender y
analizar información de manera más rápida y efectiva.
Tipos de gráficos
Existen diversos tipos de gráficos, cada uno con sus propias características y
aplicaciones. Los más comunes son:
- Circulares
- Barras
- Histogramas
- Polígonos
Circulares: También conocidos como gráficos de sectores, torta, pastel entre otros,
es una forma visual de representar datos que muestran las proporciones de diferentes
partes en relación con un todo. Permite representar todo tipo de variables, pero es
frecuentemente utilizado para variables cualitativas.
Los datos se representan en un círculo, de modo que el ángulo de cada sector es
proporcional a la frecuencia absoluta correspondiente. Para calcular el ángulo se utiliza la
siguiente fórmula:
Dónde:
N = Tamaño de la muestra
fi = Frecuencia absoluta
Para calcular los porcentajes
Ejemplo 3:
En el siguiente cuadro se muestra la cantidad de clientes (ficticia) que poseen
algunos bancos de Venezuela.
Banco Número de Clientes (en miles)
Nacional de Crédito (BNC) 850
Banco de Venezuela 1200
Mercantil 980
Provincial 720
Banesco 1100
Al sumar los números de clientes obtenemos el tamaño de la muestra N = 4850,
sustituimos este valor en la fórmula del ángulo y calculamos los grados que le
corresponden a cada banco, esta sumatoria debe ser igual a 360°, seguidamente
aplicamos la fórmula para calcular el porcentaje, , esta sumatoria
debe ser igual al 100%, sin embargo, en ocasiones puede generar un resultado de 101,
102, 103 lo cual es permitido porque se utilizan aproximaciones. En ambos cálculos se
coloca el resultado aproximado.
Tabla 3.
Banco Número de Clientes Grados %
(en miles) fi
Nacional de Crédito (BNC) 850 360/4850 x 850 = 100/4850 x 850
63,1° =18 %
Banco de Venezuela 1200 360/4850 x 1200= 100/4850 x 1200
89,1° =25%
Mercantil 980 360/4850 x 980= 100/4850 x 980
73° =20 %
Provincial 720 360/4850 x 720= 100/4850 x 720
53° =15 %
Banesco 1100 360/4850 x 1100= 100/4850 x
82° 1100=23 %
Total 4850 360° 101%
Se dibuja un círculo y con ayuda de un transportador se trazan los grados
correspondientes para cada banco, luego se le asigna porcentaje y un color diferente a
cada uno.
Número de Clientes (en miles) de Bancos en Venezuela
Banesco (BNC)
23% 18%
Banco de
Provincial
Venezuela
15%
25%
Mercantil
20%
Barras: Es un procedimiento gráfico para representar los datos nominales u
ordinales. Se construye sobre el sistema de ejes cartesianos, en el eje de las abscisas (x) se
colocan los valores de la variable y sobre el eje de ordenadas (y) las frecuencias absolutas
relativas o acumuladas.
Los datos se representan mediante barras de una altura proporcional a la
frecuencia. El ancho de la barra es arbitrario.
Ejemplo 4: Considerando la tabla de frecuencia del ejemplo 1:
Variable Discreta x = n° de hijos
Tabla 1
Categoría Frec. Absoluta
Xi fi
0 2
1 4
2 7
3 6
4 2
TOTAL N=21
Número de Hijos
Histogramas: Es una representación gráfica de una variable en forma de barra, se
utiliza para variables continuas o discretas con un gran número de datos que se han
agrupado en intervalos de clases.
Se construye sobre el sistema de ejes cartesianos, en el eje de las abscisas (x) se
identifica la variable en estudio y sobre el eje de ordenadas (y) se grafica la frecuencia
absoluta o la frecuencia relativa.
Consiste en una serie de rectángulos que tienen por base la amplitud del intervalo
y por altura la frecuencia absoluta.
Ejemplo 5: En la siguiente tabla se muestra el peso de 65 personas:
Intervalos Marca Frec. Frec. Absoluta
Yi-1 – Yi+1 de Clase Absoluta Acum.
Yi fi Fi
50 - 60 55 8 8
60 - 70 65 10 18
70 - 80 75 16 34
80 - 90 85 14 48
90 - 100 95 10 58
100 - 110 105 5 63
110 - 120 115 2 65
TOTAL N=65
Histograma de Peso en Kilogramos (fi)
Histograma de Frecuencia Acumulada: Si se representan las frecuencias
acumuladas de una tabla de datos agrupados del ejemplo 5 se obtiene el siguiente
histograma:
Intervalos Marca Frec. Frec. Absoluta
Yi-1 – Yi+1 de Clase Absoluta Acum.
Yi fi Fi
50 - 60 55 8 8
60 - 70 65 10 18
70 - 80 75 16 34
80 - 90 85 14 48
90 - 100 95 10 58
100 - 110 105 5 63
110 - 120 115 2 65
TOTAL N=65
Histograma de Peso en Kilogramos (Fi)
60
50
40
30
20
10
Polígonos: Es un gráfico utilizado en estadística para comparar entre sí datos de una
o más variables. Suele construirse a partir de un histograma, y se compone de dos ejes y
una serie de puntos conectados entre sí mediante líneas rectas.
Se grafica uniendo la punta superior de cada barra por segmentos de recta. Para que
el polígono quede cerrado se considera un punto en la recta horizontal, antes y después
de los segmentos trazados.
También se puede graficar trazando los puntos que representan las frecuencias y
uniéndolos mediante segmentos.
Polígono para Datos No Agrupados
Ejemplo 6: Realice el gráfico de polígono con los datos que se muestran en la
siguiente tabla correspondientes a la cantidad de personas que asisten a Cines Unidos en
(ficticio) durante una semana:
Número de Personas
Día de la semana
fi
Lunes 300
Martes 450
Miércoles 350
Jueves 600
Viernes 800
Sábado 1200
Domingo 1000
TOTAL N = 4700
Polígono Cantidad de Personas que asisten a Cines Unidos en una semana (fi)
En el gráfico podemos observar que el día con mayor asistencia es el sábado.
Si queremos conocer el porcentaje de mayor asistencia se aplica la siguiente fórmula
, sustituyendo la frecuencia absoluta del día con mayor
asistencia.
%= 100/4700 x 1200 = 25,53%
El Sábado representa el 25.53% de la asistencia total a Cines Unidos durante la
semana.
Polígono para Datos Agrupados: Se toma la marca de clase que coincide con el
punto medio de cada rectángulo en un histograma.
Ejemplo 7: Considerando la tabla de frecuencia del ejemplo 5:
Peso de 65 personas:
Intervalos Marca Frec. Frec. Absoluta
Yi-1 – Yi+1 de Clase Absoluta Acum.
Yi fi Fi
50 - 60 55 8 8
60 - 70 65 10 18
70 - 80 75 16 34
80 - 90 85 14 48
90 - 100 95 10 58
100 - 110 105 5 63
110 - 120 115 2 65
TOTAL N=65
Polígono de Peso en Kilogramos (fi)
Resuelve los siguientes ejercicios de Gráficos.
6. Una agencia de viajes ha registrado el número de turistas que visitaron diferentes
destinos turísticos durante el último año. Los datos se muestran a continuación:
Destino Turístico Número de Turistas
Isla de Margarita 850
Parque Nacional Canaima 600
Los Roques 450
Mérida 700
Morrocoy 500
a) Construir un diagrama circular que represente la distribución de turistas por destino
turístico.
b) Interpretar el diagrama: ¿Cuál es el destino turístico más visitado? ¿Qué porcentaje de
turistas visitó Los Roques?
7. El Servicio Nacional Integrado de Administración Tributaria (SENIAT) ha publicado un
informe sobre la recaudación de impuestos en Venezuela durante el último trimestre. Los datos se
muestran a continuación, expresados en millones de bolívares:
Tipo de Impuesto Recaudación en Millones
Impuesto sobre la Renta (ISLR) 120.000
Impuesto al Valor Agregado (IVA) 180.000
Impuesto sobre Sucesiones y Donaciones 15.000
Impuesto sobre Actividades Económicas (IAE) 90.000
Otros impuestos 45.000
a) Construir un diagrama circular que represente la distribución de la recaudación de
impuestos por tipo.
b) Interpretar el diagrama: ¿Cuál es el tipo de impuesto que genera la mayor recaudación?
¿Qué porcentaje de la recaudación total corresponde al impuesto sobre sucesiones y donaciones?
8. Realiza los gráficos de barras a los ejercicios 1 y 2 de distribución de frecuencias.
9. Realiza los gráficos de histogramas de frecuencia absoluta y acumulada en los ejercicios
3, 4 y 5 de distribución de frecuencias.
10. Realiza los gráficos de polígonos a los ejercicios 3, 4 y 5 de distribución de frecuencias.
11.Investiga 5 herramientas informáticas actuales para realizar gráficas.