Universidad San Pedro Facultad de Ingeniería
II. DISTRIBUCIÓN DE FRECUENCIAS
Nos permite representar la información en forma sistemática y ordenada obteniendo datos
importantes como porcentajes, frecuencias simples, acumuladas, promedios, etc.
Es necesario que el número de datos sea de 30 o más a fin de construir una distribución de
frecuencia.
INTERVALOS: ( Yi-1 – Yi )
Se utiliza para variables cualitativas y son de tres tipos:
A.- Intervalos Cerrado: [ Yi-1 – Yi ]
Incluye a los límites extremos, ejemplo:
[ 18 - 20 ] : Número de alumnos entre 18 y 20 años inclusive.
B.- Intervalo Semiabierto o semicerrado: [ Yi-1 – Yi ) , ( Yi-1 – Yi ]
Incluye a uno de los límites exteriores, ejemplo:
[ 18 - 23 ) : Número de alumnos entre 18 y 30 años sin considerar los de 23 años.
( 23 - 30 ] :
C.- Intervalos Abiertos: ( Yi-1 – Yi )
No incluye los valores extremos, ejemplo:
( 15 - 20 ) : se toma edades: 16, 17, 18, 19
( 20 - 25 ) : se toma edades: 21, 22, 23, 24
MARCA DE CLASE O PUNTO MEDIO ( yi )
Se define como la semi suma de los dos límites de cada intervalo. Ejemplo:
18+24
[ 18 – 24 ] : y 1= =21
2
23+31
[ 23 – 31 ] : y 2= =27
2
12
Universidad San Pedro Facultad de Ingeniería
Una vez recopilados los datos estos deben ser ordenados ó clasificados en tablas. Cuando se
dispone de un gran número de datos se debe distribuirlos en clases o categorías y determinar el
número de observaciones pertenecientes a cada clase, que es la frecuencia de clase.
Una distribución de frecuencias es un arreglo de los valores observados
x1 , x2 , .....,xk de la variable
x con sus respectivas frecuencias, en una tabla de la forma:
Tabla 1.1.
Valor de x fi Fi hi Hi
x1 f1 F1 h1 H1
x2 f2 F2 h2 H2
xk fk Fk n hk Hk
TOTAL k k
f
i 1
i n h
i 1
i 1
Donde se utilizan los siguientes términos:
1. Frecuencia Absoluta Simple ( fi ).- También llamado simplemente frecuencia absoluta, es el
número de veces que aparece repetido la variable de interés o el valor o cualidad (
xi ), en cada
intervalo y se cumple que:
f1 f 2 f 3 ....... f k n
En notación sumatoria: ∑ f i=n
i=1
1. Frecuencia Absoluta Acumulada ( Fi ).- es la que resulta de sumar sucesivamente las
frecuencias absolutas simples, así tenemos:
F1 f1
F2 f1 f 2
F3 f1 f 2 f 3
Fi f1 f 2 f 3 .... f i , i 1, 2, 3, ....., n
n
F i= ∑ f i
i=1
13
Universidad San Pedro Facultad de Ingeniería
2. Frecuencia Relativa Simple (
hi ).- Es el cociente entre la frecuencia absoluta simple y el
número de observaciones realizadas ( n ). Sus valores son números reales que oscilan entre
0 y 1. La suma de todas las frecuencia relativas es igual a 1. Se denota por:
fi fi
hi = ; 0 ≤ hi ≤ 1 hi %= x 100
n n
3. Frecuencia Relativa Acumulada ( Hi ).- es igual al cociente entre la frecuencia absoluta
acumulada y el número de observaciones realizadas ( n ), o también es la que resulta de
sumar sucesivamente las frecuencias relativas simples. Se denota por:
H 1 h1
H 2 h1 h2
H 3 h1 h2 h3 Fi Fi
H i= H i %= x 100
n n
H i h1 h2 h3 .... hi ó
2.1. TABLA DE DISTRIBUCIÓN DE FRECUENCIAS DE VARIABLES CUANTITATIVAS
CONTINUAS.
Son aquellas que se utilizan para agrupar datos cuantitativos continuos mediante intervalos de
frecuencias llamados intervalos de clase. Para construir la tabla con intervalos de clase se debe
seguir los siguientes pasos:
1. Rango (R).-
Llamado también “recorrido de los datos”, es la diferencia entre el valor máximo y el valor
mínimo de la variable.
Consideremos las siguientes variables
y1 , y2 , y3 , ......, yn , entonces:
R=Y max−Y min
Ejemplo: Supongamos que las alturas de un objeto de interés en una investigación en cm, son
las siguientes:
64 73 68 68 76 70 62 67 71 69
68 60 65 68 66 68 67 71 66 72
Luego el rango de estos datos es: R = 76 – 60 = 16
14
Universidad San Pedro Facultad de Ingeniería
2. Número de intervalos de clase ( m ).-
Consiste en dividir el rango en un número conveniente de intervalos de clase, generalmente del
mismo tamaño. El número de intervalos depende principalmente del número de observaciones,
sin embargo es recomendable que no sea menor que 5 ni mayor de 15 intervalos. Para
determinar el número de intervalos usaremos la fórmula de Sturge:
m=1+3.32 log( n)
Cuando los resultados para obtener m son números decimales, entonces se redondeará al
entero inmediato.
Ejemplo: Si n = 40 entonces m = 1 + 3.32 Log 40 = 6.32, redondeando m = 6 o 7
Si n = 100 entonces m = 1+3.32Log 100 = 7.64, redondeando m = 8
3. Amplitud Interválica ( C ).-
Es el tamaño o longitud que deben tener los intervalos; se recomienda tener intervalos del
mismo tamaño. Como regla general para determinar esta amplitud se dividirá el Rango entre el
número de intervalos de clase.
R
C=
m
R ' R
d
Si “ C ” no es exacto, se determinará un nuevo rango: R´ = C.m y calculamos 2
Luego los nuevos valores mínimos y máximos serán: Ymin – d y Ymax + d
Ejemplo:
Sea
Ymin 34 ,
Ymax 82 y m5 , entonces:
48 50 48
c 9.6 10 d 1
R 82 34 48 y 5 ; entonces
R '
10(5) 50 , 2
Luego los nuevos valores mínimos y máximos serán: 34 1 33 y 82 1 83
4. Marca de clase (
yi ).-
Es una medida ponderativa que va a representar al intervalo de datos. Es la semisuma entre el
límite superior y el límite inferior del intervalo de clase.
15
Universidad San Pedro Facultad de Ingeniería
LI LS
yi
Sea el intervalo
LI LS
entonces 2
EJEMPLO 01:
En una Institución Educativa, 50 estudiantes han sido examinados por una prueba de aptitud. La
escala es de 0 a 100. Las calificaciones individuales se presentan a continuación:
60 32 85 52 65 77 84 65 57 74
71 81 35 50 35 64 74 47 68 54
80 41 61 91 55 73 59 53 45 77
41 78 55 48 69 85 67 69 76 60
94 36 100 66 73 42 65 94 89 88
Construir la correspondiente tabla de distribución de frecuencias.
a) Ordenar en forma Creciente los datos.
b) R = 100 – 32 = 68
n 50 entonces m = 1 + 3.32 Log (50) = 6.64 7 , Redondeando m7
c) Como
68
c 9.7
d) 7 redondeando c = 10
70 68
d 1
e) Entonces R' 10(7) 70 y 2
f) Luego los nuevos valores mínimos y máximos serán:
Valor Mínimo: 32 1 31 y
16
Universidad San Pedro Facultad de Ingeniería
Valor Máximo: 100 1 101
TABLA DE DISTRIB. DE FREC. DE PUNTAJES DE APTITUD DE 50 ESTUDIANTES
Intervalos Xi fi Fi hi Hi
36 4 4 0.08 0.08
46 7 11 0.14 0.22
56 9 20 0.18 0.4
66 10 30 0.2 0.6
76 10 40 0.2 0.8
86 6 46 0.12 0.92
96 4 50 0.08 1
TOTAL n = 50 1.00
EJEMPLO 02:
Las notas del primer examen de Estadística y Probabilidad I de los alumnos de Ingeniería
Industrial, III ciclo de la Universidad San Pedro, son:
13 11 14 13 11 10 15 11
07 11 11 12 05 12 10 11
11 12 12 10 11 11 05
07 13 10 11 09 13 15
10 13 11 19 09 11 12
Determine:
a. La Construcción de la tabla de frecuencias con intervalos cerrados
b. ¿Qué porcentaje de alumnos tienen notas desaprobatorias?
c. ¿Cuántos alumnos aprobaron el primer examen de Estadística General?
d. ¿Qué porcentaje de alumnos tienen notas entre 11 y 16
SOLUCIÓN:
a) 1. Ordenar los Datos
05 09 10 11 11 12 13 15
05 10 11 11 11 12 13 19
07 10 11 11 11 12 13
07 10 11 11 12 13 14
09 10 11 11 12 13 15
2. Rango ( R ) : R=Y max−Y min
19 – 5 14
17
Universidad San Pedro Facultad de Ingeniería
3. Numero de Intervalos ( m ) : m=1+3.32 log( n)
R
4. Amplitud Interválica ( c ): c=
m
5. Cuadro de frecuencias:
Intervalos
Xi fi Fi hi% Hi%
05 - 07 6 04 4 10.81 10.81
08 - 10 9 07 11 18.91 29.72
11 - 13 12 22 33 59.45 89.18
14 - 16 15 03 36 8.10 92.27
17 - 19 18 01 37 2.70 100
TOTAL n = 37 100
b) ..…………………………………………………………………………………………………
……………………………………………………………………………………………………
c) ……………………………………………………………………………………………………
……………………………………………………………………………………………………
d) ……………………………………………………………………………………………………
……………………………………………………………………………………………………
PRACTICA DIRIGIDA Nº 02
Desarrollar los siguientes Ejercicios
1. Se realizó una encuesta a 40 estudiantes del quinto año de secundaria del Colegio “Señor de la Vida”
de Nuevo Chimbote sobre sus cursos, una de las preguntas fue la siguiente:
¿Cuál es el curso que has encontrado más interesante?
18
Universidad San Pedro Facultad de Ingeniería
A. Algebra B. Botánica C. Comunicación D. Deporte
Sus respuestas fueron las siguientes:
D D D D D
D B C C A
A C A B D
D B B D D
A B A A A
A D B A A
D B A A D
C D D D B
a) ¿Qué tipo de variable es?
b) Clasificar los datos en una tabla de frecuencias
c) Interpretar
f 3 ; F2 ; H 3 ;
2. Los siguientes datos corresponden a las edades de 30 profesores del colegio “Señor de la Vida” de
Nuevo Chimbote.
54 38 30 31 28 44
36 33 26 24 35 50
42 49 29 33 42 41
34 40 35 34 52 27
35 25 24 49 22 46
a) Organice los datos en una Tabla de distribución de frecuencias según las edades.
b) Interpretar:
f 2 ; F3 ; h4 ; H 4
3. Antes de las últimas elecciones generales, una encuesta realizada sobre la intención de voto de
colectivo de 45 personas, dio los siguientes resultados
PP PSOE IU PP PSOE UV PP UV PSOE
IU PP IU PP UV PP PP PSOE UV
PSOE PP PSOE UV PP UV UV PSOE SP
IU PP PSOE IU PP IU UV UV PP
PSOE UV PP PSOE PP IU SP IU PP
Se pide:
a) Confeccionar una tabla de frecuencias que recoja esta información
b) ¿Qué porcentaje de votantes espera tener cada formación política?
c) Interpretar
f 2 ; F3 ; H 2
4. Considera los siguientes datos obtenidos por el conteo de errores de 60 libros de inglés traducidos
por un profesor de la universidad “San Pedro”
82 54 90 60 58 61
79 63 82 65 63 66
76 66 78 67 67 68
73 68 75 68 68 69
70 69 72 70 69 70
69 71 70 72 71 73
68 74 69 75 74 76
66 76 68 78 77 78
19
Universidad San Pedro Facultad de Ingeniería
62 80 65 81 80 82
52 83 61 88 85 90
a) Organice los datos en una Tabla de distribución de frecuencias.
b) Interpretar:
f 4 ; F5 ; h5 ; H 2
5. Los siguientes datos pertenecen a la distribución de la producción de papas (en toneladas) en 40
zonas del país
y1 20 ; f2 f5 2
; 5
y 100
; 1 ;
f 4
3 f 20
Si se sabe que la distribución es simétrica y presenta 5 intervalos de clase con amplitud constante.
Construya una tabla de frecuencias.
Tm. papas
LI LS yi fi Fi hi Hi
6. Realizando una prueba para el estudio del cáncer a 150 personas, se obtuvo la siguiente tabla
según la edad de los enfermos:
Edad [ 10 -18 > [ 18 – 26 > [ 26 – 34 > [ 34 – 42 > [ 42 – 50 ]
N° de enfermos 15 22 48 40 25
a) ¿Cuántos pacientes tienen al menos 34 años?
b) ¿Cuántos pacientes tienen edades entre 20 y 45 años de edad?
c) ¿Qué porcentaje de pacientes tienen una edad superior a 30 años?
d) Calcular la edad mínima y máxima del 30% central de los individuos
7. La tabla siguiente se refiere a los tiempos (en minutos) que permanecieron en la cafetería 96
alumnos. Completa la tabla y responde las siguientes preguntas:
Tiempo de
permanencia
[ 10 – 20 ) [ 20 – 30 ) [ 30 – 40 ) [ 40 – 50 ) [ 50 – 60 ) [ 60 – 70 ) [ 70 – 80 ]
en la cafetería
(minutos)
fi 3 14 29 16 10 2
hi
a) ¿Qué porcentaje de alumnos permaneció en la cafetería al menos 18 minutos pero no más de
45 minutos?
b) ¿Qué porcentaje de alumnos permaneció en la cafetería menos de 35 minutos?
c) ¿Como máximo, qué tiempo permaneció en la cafetería el 20% de alumnos que menos tiempo
estuvo en la cafetería?
d) ¿Cómo mínimo, qué tiempo permaneció en la cafetería el 20% de alumnos que más tiempo
estuvo en la cafetería?
e) ¿Cuál fue el tiempo de permanencia en la cafetería del 80% central de la distribución?
20
Universidad San Pedro Facultad de Ingeniería
8. Si las marcas de clase de una distribución de frecuencias de pesos de estudiantes son 128, 137,
146, 155, 164, 173 y 182 kg.
a) Hallar la anchura del intervalo de clase
b) Hallar los límites de clase
9. Se toma una muestra de llegadas de aviones a un gran aeropuerto para estudiar el problema de los
retrasos en vuelos. La tabla recoge el número de minutos de retraso ( x ) en una muestra de 100
vuelos. Completa la tabla y responde las siguientes preguntas:
Minutos de
retraso yi fi Fi hi Hi
[ 10 - 20 ) 29
[ 20 - 30 ) 23
[ 30 - 40 ) 17
[ 40 - 50 ) 14
[ 50 - 60 )
[ 60 - 70 ] 6
a) ¿Qué porcentaje de vuelos se retrasan no menos de 20 minutos pero menos de
una hora?
b) ¿Qué porcentaje de vuelos tienen por lo menos 15 minutos de retraso?
c) ¿Qué porcentaje de vuelos tienen por lo menos 15 minutos pero no más de 55
minutos de retraso?
d) ¿Qué porcentaje de vuelos tienen no menos de 12 minutos ni más de 42 minutos
de retraso?
e) ¿Cómo máximo cuántos minutos de retraso tienen los vuelos que constituyen el
10% de todos los vuelos que menos se retrasan?
f) ¿Cómo mínimo cuántos minutos de retraso tienen los vuelos que constituyen el
20% de todos los vuelos que más se retrasan?
10. De una tabla de distribución de frecuencias de 6 intervalos de amplitud constante 100, se tiene la
siguiente información:
Y2 550 ,
H 1=h6 =0 . 04 ,
h2=0 . 14 ,
H 4 =0 . 76 ,
h5 =0 .20 y
H 3 h2 0.26 .
Reconstruir la tabla de distribución de frecuencias si el número total de datos fue de 300
21