Universidad San Pedro Facultad de Ingeniería
II. DISTRIBUCIÓN DE FRECUENCIAS
Nos permite representar la información en forma sistemática y ordenada obteniendo datos importantes
como porcentajes, frecuencias simples, acumuladas, promedios, etc.
Es necesario que el número de datos sea de 30 o más a fin de construir una distribución de frecuencia.
INTERVALOS: ( Yi-1 – Yi )
Se utiliza para variables cualitativas y son de tres tipos:
A.- Intervalos Cerrado: [ Yi-1 – Yi ]
Incluye a los límites extremos, ejemplo:
[ 18 - 20 ] : Número de alumnos entre 18 y 20 años inclusive.
B.- Intervalo Semiabierto o semicerrado: [ Yi-1 – Yi ) , ( Yi-1 – Yi ]
Incluye a uno de los límites exteriores, ejemplo:
[ 18 - 23 ) : Número de alumnos entre 18 y 30 años sin considerar los de 23 años.
( 23 - 30 ] :
C.- Intervalos Abiertos: ( Yi-1 – Yi )
No incluye los valores extremos, ejemplo:
( 15 - 20 ) : se toma edades: 16, 17, 18, 19
( 20 - 25 ) : se toma edades: 21, 22, 23, 24
MARCA DE CLASE O PUNTO MEDIO ( yi )
Se define como la semi suma de los dos límites de cada intervalo. Ejemplo:
18+24
[ 18 – 24 ] : 𝑦1 = = 21
2
23+31
[ 23 – 31 ] : 𝑦2 = = 27
2
12
Universidad San Pedro Facultad de Ingeniería
Una vez recopilados los datos estos deben ser ordenados ó clasificados en tablas. Cuando se dispone
de un gran número de datos se debe distribuirlos en clases o categorías y determinar el número de
observaciones pertenecientes a cada clase, que es la frecuencia de clase.
Una distribución de frecuencias es un arreglo de los valores observados x1 , x2 , .....,xk de la variable
x con sus respectivas frecuencias, en una tabla de la forma:
Tabla 1.1.
Valor de x fi Fi hi Hi
x1 f1 F1 h1 H1
x2 f2 F2 h2 H2
xk fk Fk n hk Hk
TOTAL k k
i 1
fi n h
i 1
i 1
Donde se utilizan los siguientes términos:
1. Frecuencia Absoluta Simple ( fi ).- También llamado simplemente frecuencia absoluta, es el
número de veces que aparece repetido la variable de interés o el valor o cualidad ( xi ), en cada
intervalo y se cumple que:
f1 f 2 f 3 ....... f k n
𝒌
En notación sumatoria: ∑ 𝒇𝒊 = 𝒏
𝒊=𝟏
1. Frecuencia Absoluta Acumulada ( Fi ).- es la que resulta de sumar sucesivamente las
frecuencias absolutas simples, así tenemos:
F1 f1
F2 f1 f 2
F3 f1 f 2 f 3
Fi f1 f 2 f 3 .... f i , i 1, 2, 3, ....., n
𝐅𝐢 = ∑ 𝐟𝐢
𝐢=𝟏
13
Universidad San Pedro Facultad de Ingeniería
2. Frecuencia Relativa Simple ( hi ).- Es el cociente entre la frecuencia absoluta simple y el número
de observaciones realizadas ( n ). Sus valores son números reales que oscilan entre 0 y 1. La
suma de todas las frecuencia relativas es igual a 1. Se denota por:
𝒇𝒊 𝒇𝒊
𝒉𝒊 = ; 0 ≤ hi ≤ 1 𝒉𝒊 % = 𝒙 𝟏𝟎𝟎
𝒏 𝒏
3. Frecuencia Relativa Acumulada ( Hi ).- es igual al cociente entre la frecuencia absoluta
acumulada y el número de observaciones realizadas ( n ), o también es la que resulta de sumar
sucesivamente las frecuencias relativas simples. Se denota por:
H 1 h1
H 2 h1 h2
𝑭𝒊 𝑭𝒊
H 3 h1 h2 h3 ó 𝑯𝒊 = 𝑯𝒊 % = 𝒙 𝟏𝟎𝟎
𝒏 𝒏
H i h1 h2 h3 .... hi
2.1. TABLA DE DISTRIBUCIÓN DE FRECUENCIAS DE VARIABLES CUANTITATIVAS CONTINUAS.
Son aquellas que se utilizan para agrupar datos cuantitativos continuos mediante intervalos de
frecuencias llamados intervalos de clase. Para construir la tabla con intervalos de clase se debe
seguir los siguientes pasos:
1. Rango (R).-
Llamado también “recorrido de los datos”, es la diferencia entre el valor máximo y el valor mínimo
de la variable.
Consideremos las siguientes variables y1 , y2 , y3 , ......, yn , entonces:
𝑹 = 𝒀𝒎𝒂𝒙 − 𝒀𝒎𝒊𝒏
Ejemplo: Supongamos que las alturas de un objeto de interés en una investigación en cm, son
las siguientes:
64 73 68 68 76 70 62 67 71 69
68 60 65 68 66 68 67 71 66 72
Luego el rango de estos datos es: R = 76 – 60 = 16
14
Universidad San Pedro Facultad de Ingeniería
2. Número de intervalos de clase ( m ).-
Consiste en dividir el rango en un número conveniente de intervalos de clase, generalmente del
mismo tamaño. El número de intervalos depende principalmente del número de observaciones,
sin embargo es recomendable que no sea menor que 5 ni mayor de 15 intervalos. Para
determinar el número de intervalos usaremos la fórmula de Sturge:
𝐦 = 𝟏 + 𝟑. 𝟑𝟐 𝐋𝐨𝐠(𝐧)
Cuando los resultados para obtener m son números decimales, entonces se redondeará al
entero inmediato.
Ejemplo: Si n = 40 entonces m = 1 + 3.32 Log 40 = 6.32, redondeando m = 6 o 7
Si n = 100 entonces m = 1+3.32Log 100 = 7.64, redondeando m = 8
3. Amplitud Interválica ( C ).-
Es el tamaño o longitud que deben tener los intervalos; se recomienda tener intervalos del mismo
tamaño. Como regla general para determinar esta amplitud se dividirá el Rango entre el número
de intervalos de clase.
𝐑
𝐂=
𝐦
R ' R
Si “ C ” no es exacto, se determinará un nuevo rango: R´ = C.m y calculamos d
2
Luego los nuevos valores mínimos y máximos serán: Ymin – d y Ymax + d
Ejemplo:
Sea Ymin 34 , Ymax 82 y m 5 , entonces:
48 50 48
R 82 34 48 y c 9.6 10 ; entonces R' 10(5) 50 , d 1
5 2
Luego los nuevos valores mínimos y máximos serán: 34 1 33 y 82 1 83
4. Marca de clase ( yi ).-
Es una medida ponderativa que va a representar al intervalo de datos. Es la semisuma entre el
límite superior y el límite inferior del intervalo de clase.
LI LS
Sea el intervalo LI LS entonces yi
2
15
Universidad San Pedro Facultad de Ingeniería
EJEMPLO 01:
En una Institución Educativa, 50 estudiantes han sido examinados por una prueba de aptitud. La
escala es de 0 a 100. Las calificaciones individuales se presentan a continuación:
60 32 85 52 65 77 84 65 57 74
71 81 35 50 35 64 74 47 68 54
80 41 61 91 55 73 59 53 45 77
41 78 55 48 69 85 67 69 76 60
94 36 100 66 73 42 65 94 89 88
Construir la correspondiente tabla de distribución de frecuencias.
a) Ordenar en forma Creciente los datos.
b) R = 100 – 32 = 68
c) Como n 50 entonces m = 1 + 3.32 Log (50) = 6.64 7 , Redondeando m 7
68
d) c 9.7 redondeando c = 10
7
70 68
e) Entonces R' 10(7) 70 y d 1
2
f) Luego los nuevos valores mínimos y máximos serán:
Valor Mínimo: 32 1 31 y
Valor Máximo: 100 1 101
16
Universidad San Pedro Facultad de Ingeniería
TABLA DE DISTRIB. DE FREC. DE PUNTAJES DE APTITUD DE 50 ESTUDIANTES
Intervalos Xi fi Fi hi Hi
36 4 4 0.08 0.08
46 7 11 0.14 0.22
56 9 20 0.18 0.4
66 10 30 0.2 0.6
76 10 40 0.2 0.8
86 6 46 0.12 0.92
96 4 50 0.08 1
TOTAL n = 50 1.00
EJEMPLO 02:
Las notas del primer examen de Estadística y Probabilidad I de los alumnos de Ingeniería
Industrial, III ciclo de la Universidad San Pedro, son:
13 11 14 13 11 10 15 11
07 11 11 12 05 12 10 11
11 12 12 10 11 11 05
07 13 10 11 09 13 15
10 13 11 19 09 11 12
Determine:
a. La Construcción de la tabla de frecuencias con intervalos cerrados
b. ¿Qué porcentaje de alumnos tienen notas desaprobatorias?
c. ¿Cuántos alumnos aprobaron el primer examen de Estadística General?
d. ¿Qué porcentaje de alumnos tienen notas entre 11 y 16
SOLUCIÓN:
a) 1. Ordenar los Datos
17
Universidad San Pedro Facultad de Ingeniería
2. Rango ( R ) : 𝑹 = 𝒀𝒎𝒂𝒙 − 𝒀𝒎𝒊𝒏
3. Numero de Intervalos ( m ) : 𝐦 = 𝟏 + 𝟑. 𝟑𝟐 𝐋𝐨𝐠(𝐧)
𝐑
4. Amplitud Interválica ( c ): 𝐜=𝐦
5. Cuadro de frecuencias:
Intervalos Xi fi Fi h i% Hi%
36 4 4 0.08 0.08
46 7 11 0.14 0.22
56 9 20 0.18 0.4
66 10 30 0.2 0.6
76 10 40 0.2 0.8
TOTAL n = 37 100
b) ..…………………………………………………………………………………………………
……………………………………………………………………………………………………
c) ……………………………………………………………………………………………………
……………………………………………………………………………………………………
d) ……………………………………………………………………………………………………
……………………………………………………………………………………………………
18
Universidad San Pedro Facultad de Ingeniería
PRACTICA DIRIGIDA Nº 02
Desarrollar los siguientes Ejercicios
1. Se realizó una encuesta a 40 estudiantes del quinto año de secundaria del Colegio “Señor de la Vida”
de Nuevo Chimbote sobre sus cursos, una de las preguntas fue la siguiente:
¿Cuál es el curso que has encontrado más interesante?
A. Algebra B. Botánica C. Comunicación D. Deporte
Sus respuestas fueron las siguientes:
D D D D D
D B C C A
A C A B D
D B B D D
A B A A A
A D B A A
D B A A D
C D D D B
a) ¿Qué tipo de variable es?
b) Clasificar los datos en una tabla de frecuencias
c) Interpretar f 3 ; F2 ; H 3 ;
2. Los siguientes datos corresponden a las edades de 30 profesores del colegio “Señor de la Vida” de
Nuevo Chimbote.
54 38 30 31 28 44
36 33 26 24 35 50
42 49 29 33 42 41
34 40 35 34 52 27
35 25 24 49 22 46
a) Organice los datos en una Tabla de distribución de frecuencias según las edades.
b) Interpretar: f 2 ; F3 ; h4 ; H 4
3. Antes de las últimas elecciones generales, una encuesta realizada sobre la intención de voto de
colectivo de 45 personas, dio los siguientes resultados
PP PSOE IU PP PSOE UV PP UV PSOE
IU PP IU PP UV PP PP PSOE UV
PSOE PP PSOE UV PP UV UV PSOE SP
IU PP PSOE IU PP IU UV UV PP
PSOE UV PP PSOE PP IU SP IU PP
Se pide:
a) Confeccionar una tabla de frecuencias que recoja esta información
b) ¿Qué porcentaje de votantes espera tener cada formación política?
c) Interpretar f 2 ; F3 ; H 2
19
Universidad San Pedro Facultad de Ingeniería
4. Considera los siguientes datos obtenidos por el conteo de errores de 60 libros de inglés traducidos
por un profesor de la universidad “San Pedro”
82 54 90 60 58 61
79 63 82 65 63 66
76 66 78 67 67 68
73 68 75 68 68 69
70 69 72 70 69 70
69 71 70 72 71 73
68 74 69 75 74 76
66 76 68 78 77 78
62 80 65 81 80 82
52 83 61 88 85 90
a) Organice los datos en una Tabla de distribución de frecuencias.
b) Interpretar: f 4 ; F5 ; h5 ; H 2
5. Los siguientes datos pertenecen a la distribución de la producción de papas (en toneladas) en 40
zonas del país
y1 20 ; f 2 f 5 2 ; y5 100 ; f1 4 ; f 3 20
Si se sabe que la distribución es simétrica y presenta 5 intervalos de clase con amplitud constante.
Construya una tabla de frecuencias.
Tm. papas
LI LS yi fi Fi hi Hi
6. Realizando una prueba para el estudio del cáncer a 150 personas, se obtuvo la siguiente tabla
según la edad de los enfermos:
Edad [ 10 -18 > [ 18 – 26 > [ 26 – 34 > [ 34 – 42 > [ 42 – 50 ]
N° de enfermos 15 22 48 40 25
a) ¿Cuántos pacientes tienen al menos 34 años?
b) ¿Cuántos pacientes tienen edades entre 20 y 45 años de edad?
c) ¿Qué porcentaje de pacientes tienen una edad superior a 30 años?
d) Calcular la edad mínima y máxima del 30% central de los individuos
7. La tabla siguiente se refiere a los tiempos (en minutos) que permanecieron en la cafetería 96 alumnos.
Completa la tabla y responde las siguientes preguntas:
Tiempo de
permanencia
[ 10 – 20 ) [ 20 – 30 ) [ 30 – 40 ) [ 40 – 50 ) [ 50 – 60 ) [ 60 – 70 ) [ 70 – 80 ]
en la cafetería
(minutos)
fi 3 14 29 16 10 2
hi
20
Universidad San Pedro Facultad de Ingeniería
a) ¿Qué porcentaje de alumnos permaneció en la cafetería al menos 18 minutos pero no más de
45 minutos?
b) ¿Qué porcentaje de alumnos permaneció en la cafetería menos de 35 minutos?
c) ¿Como máximo, qué tiempo permaneció en la cafetería el 20% de alumnos que menos tiempo
estuvo en la cafetería?
d) ¿Cómo mínimo, qué tiempo permaneció en la cafetería el 20% de alumnos que más tiempo
estuvo en la cafetería?
e) ¿Cuál fue el tiempo de permanencia en la cafetería del 80% central de la distribución?
8. Si las marcas de clase de una distribución de frecuencias de pesos de estudiantes son 128, 137, 146,
155, 164, 173 y 182 kg.
a) Hallar la anchura del intervalo de clase
b) Hallar los límites de clase
9. Se toma una muestra de llegadas de aviones a un gran aeropuerto para estudiar el problema de los
retrasos en vuelos. La tabla recoge el número de minutos de retraso ( x ) en una muestra de 100
vuelos. Completa la tabla y responde las siguientes preguntas:
Minutos de
retraso yi fi Fi hi Hi
[ 10 - 20 ) 29
[ 20 - 30 ) 23
[ 30 - 40 ) 17
[ 40 - 50 ) 14
[ 50 - 60 )
[ 60 - 70 ] 6
a) ¿Qué porcentaje de vuelos se retrasan no menos de 20 minutos pero menos de una hora?
b) ¿Qué porcentaje de vuelos tienen por lo menos 15 minutos de retraso?
c) ¿Qué porcentaje de vuelos tienen por lo menos 15 minutos pero no más de 55 minutos de
retraso?
d) ¿Qué porcentaje de vuelos tienen no menos de 12 minutos ni más de 42 minutos de retraso?
e) ¿Cómo máximo cuántos minutos de retraso tienen los vuelos que constituyen el 10% de todos
los vuelos que menos se retrasan?
f) ¿Cómo mínimo cuántos minutos de retraso tienen los vuelos que constituyen el 20% de todos
los vuelos que más se retrasan?
10. De una tabla de distribución de frecuencias de 6 intervalos de amplitud constante 100, se tiene la
siguiente información:
Y2 550 , H1 h6 0.04 , h2 0.14 , H 4 0.76 , h5 0.20 y H 3 h2 0.26 .
Reconstruir la tabla de distribución de frecuencias si el número total de datos fue de 300
21