• Identificar el papel de la estadística en el resumen,
organización, tabulación, graficas, exploración y
descripción de datos.
• Reconocer la importancia de cada una de las etapas
de Organización de datos, con el fin de ponerlas
posteriormente en la práctica
• Presentar los datos entregados en tablas de
frecuencias para datos agrupados y no agrupados.
DISTRIBUCIÓN
DE FRECUENCIAS
DESPUES DE LA RECOPILACION DE LOS DATOS,
ES NECESARIO,CLASIFICARLOS, RESUMIRLOS Y
PRESENTARLOS EN FORMA TAL, QUE FACILITEN
SU COMPRENSION Y SU POSTERIOR ANALISIS Y
UTILIZACION. PARA ELLO SE ORDENAN EN UNA
TABLA DE DISTRIBUCION DE FRECUENCIAS Y
LUEGO SE PRESENTARAN EN GRAFICOS.
TABLA DE DISTRIBUCIÓN
DE FRECUENCIAS
*PRESENTAN LA DISTRIBUCION DE UN CONJUNTO DE DATOS
DE ACUERDO AL TIPO DE VARIABLE QUE SE TENGA. EN ELLA
SE OBSERVA LA FRECUENCIA (NUMERO DE DATOS
OBSERVADOS EN CADA CLASE O INTERVALO)DESPUES DE
REALIZAR EL PROCESO DE CONTEO O TABULACION.
*UNO DE LOS USOS DE LAS TABLAS DE FRECUENCIAS ES PARA
CALCULAR ALGUNOS INDICADORES DE RESUMEN, COMO LOS
ESTADISTICOS.
EN EL PROCEDIMIENTO PARA CONSTRUIR TABLAS
DE FRECUENCIAS NOS REFERIREMOS SIEMPRE A
MUESTRAS.
TABLA DE FRECUENCIAS
PARA VARIABLES CUALITATIVAS
Ejemplo: DE UN ESTUDIO DE INVESTIGACION
REALIZADA EN FORMA ALEATORIA A 80 PERSONAS
DE 12 A 20 AÑOS SE REGISTRARON LOS PROGRAMAS
MAS VISTOS EN LA [Link] RESULTADOS FUERON:
variable PROGRAMAS Nº DE TELEVIDENTES
NOTICIEROS 17
SERIES 15
NOVELAS
18
frecuencias
DIBUJOS 16
CULTURALES 14
TOTAL 80
TABLA DE FRECUENCIAS PARA LA PREFERENCIA DE PROGRAMAS DE TV.
PROGRAMAS Frecuencia Absoluta (fi) Frecuencia Relativa (hi)
(número de televidentes)
NOTICIEROS 17 0.2125
SERIES 15 0.1875
NOVELAS 18 0.2250
DIBUJOS 16 0.2000
CULTURALES 14 0.1750
TOTAL n=80 1.0000
(1)La frecuencia absoluta f o 𝒏𝒊 , es el número de datos observados en cada
categoria o modalidad. La suma de todas las frecuencias absolutas es igual al total de
datos observados (n=80).
𝒏
(2)La frecuencia relativa 𝒇𝒓 𝒐 𝒇𝒊 se define por 𝒇𝒓 = 𝒊 , La suma de todas las
𝒏
frecuencias relativas es igual a uno.
(3)La frecuencia relativa se convierte en % multiplicandola por 100
(4)Las frecuencias relativas son conocidas como proporciones.
CON LA INFORMACION DE LA TABLA PODEMOS
REALIZAR ALGUNAS PREGUNTAS:
1.-¿CUANTAS PERSONAS PREFIEREN VER LOS
NOTICIEROS? RPTA. 17
2.-¿CUÁNTAS PERSONAS NO PREFIEREN VER EL
LOS NOTICIEROS? RPTA. 63
3.-¿QUÉ PORCENTAJE DE PERSONAS PREFIEREN VER
LAS SERIES? RPTA. 18.75%
4.-¿CUÁL ES EL PORCENTAJE DE PERSONAS QUE NO
PREFIEREN VER LAS SERIES? RPTA. 81.25%
GRAFICOS PARA VARIABLES CUALITATIVAS
LA INFORMACION OBTENIDA EN LA TABLA DE
FRECUENCIAS PUEDE SER MOSTRADA EN
GRAFICOS ADECUADOS.
DIAGRAMAS DE BARRAS
20
FRECUENCIA ABSOLUTA
15
10
0
NOTICIEROS SERIES NOVELAS DIBUJOS CULTURALES
PROGRAMAS
DIAGRAMA CIRCULAR O TIPO PASTEL
CULTURAL
NOTICIEROS
18% 21%
DIBUJOS
SERIES
20%
19%
NOVELAS
22%
LOS SECTORES CIRCULARES
QUE COMPRENDEN LA GRAFICA
CIRCULAR TIENEN ANGULO
CENTRAL DADO POR:
fr x 360º
fr:frecuencia relativa
TABLA DE FRECUENCIAS SIMPLES
PARA VARIABLES CUANTITATIVAS
DISCRETAS
•SE EMPLEAN PARA DATOS CUANTITATIVOS
DISCRETOS(VALORES ENTEROS).
• CUANDO SOLAMENTE SE PRESENTAN POCOS
DATOS DISTINTOS.
EJEMPLO: SE HA REALIZADO UNA ENCUESTA A 20
FAMILIAS PARA SABER EL NUMERO DE HIJOS QUE
TIENEN , Y SE HA OBTENIDO EL SIGUIENTE
RESULTADO:
3 7 7 6 7 4 5 1 4 5
5 9 4 2 4 6 7 4 7 6
CONSTRUYA UNA TABLA DE DISTRIBUCION
DE FRECUENCIAS.
TABLA DE FRECUENCIAS PARA EL NUMERO DE HIJOS POR FAMILIA
NºDE HIJOS TARJAS O CONTEO f fr
(NUMERO DE FAMILIAS)
1 / 1 0.05
2 / 1 0.05
3 / 1 0.05
4 //// 5 0.25
5 /// 3 0.15
6 /// 3 0.15
7 //// 5 0.25
8 0 0.00
9 / 1 0.05
TOTAL n = 20 1.00
GRAFICO DE LINEAS O BASTONES PARA
VARIABLES CUANTITATIVAS DISCRETAS
Frecuencia absoluta
6
5
No de familias
4
3
2
1
0
1 2 3 4 5 6 7 8 9
No de hijos
Frecuencias relativas
30
25
% de familias
20
15
10
5
0
1 2 3 4 5 6 7 8 9
No de hijos
TABLA DE FRECUENCIAS POR
INTERVALOS
VARIABLES CUANTITATIVAS CONTINUAS
Y TAMBIEN DISCRETAS
LA DISTRIBUCION DE FRECUENCIAS POR CLASE
O INTERVALOS SE USA CUANDO LA VARIABLE
ESTADISTICA ES CUANTITATIVA CONTINUA O
CUANDO EL NUMERO DE VALORES DISTINTOS
DE UNA VARIABLE DISCRETA ES MUY GRANDE
(GENERALMENTE MAS DE 20).
ESTRUCTURA DE UNA TABLA DE FRECUENCIAS
“VARIABLE” POR INTERVALOS
[Li , Ls > Xi f fr F Fr
k
Total n f i
i 1
Donde: [Li , Ls> : Intervalos o Clases Li : Limite Inferior
Xi : Marca de clase Ls : Limite Supeior
f : frecuencia absoluta
fr : frecuencia relativa
F : Frecuencia absoluta acumulada
Fr : Frecuencia relativa acumulada
CARACTERISTICAS
1.- LA FRECUENCIA ABSOLUTA (f) INDICA LA
CANTIDAD DE OBSERVACIONES QUE HAY
EN EL i-ESIMO INTERVALO.
2.- LA FRECUENCIA RELATIVA (fr) INDICA LA
FRACCION DE LAS OBSERVACIONES QUE
ESTAN EN EL i-ESIMO INTERVALO: fr= f/n
3.- F1= f1 F1= fr
F2= f1+ f2 F2= f1+ f2
Fk= f1+ f2+...+ fk Fk= f1+ f2+...+ fk
4.- EN TODA TABLA DE DISTRIBUCION DE
FRECUENCIAS POR INTERVALOS:
k
Fk n
k
ni n
i 1
f
i 1
r 1
5.- LA MARCA DE CLASE ES LA SEMISUMA DE
LOS LIMITES DE CLASE
L L
X
i
i s
2
6.- EL ANCHO DE CLASE “C” REPRESENTA LA
LONGITUD DEL INTERVALO: C = Ls – Li
GENERALMENTE ES CONSTANTE.
7.- CUANDO EL ANCHO DE CLASE ES CONSTANTE
ENTONCES LA DISTANCIA ENTRE LAS MARCAS
DE CLASE ES CONSTANTE E IGUAL A “C”.
PROCEDIMIENTO PARA LA CONSTRUCION DE
TABLAS DE FRECUENCIAS POR INTERVALOS
1) CALCULAR EL RANGO: R = Xmáx – Xmin
2) HALLAR EL NUMERO DE INTERVALOS “K”,MEDIANTE
LA FORMULA DE “STURGES”: K = 1+3.3 Log(n)
DONDE “n” ES EL NUMERO DE DATOS, Y “K” SE
REDONDEA A UN VALOR ENTERO (REDONDEO SIMPLE)
EJMS: si K=6.28 SE REDONDEA A 6
si K=6.5 SE REDONDEA A 7
3) DETERMINAR EL ANCHO DE CLASE:
A = R /K
DONDE A SE REDONDEA POR EXCESO, DE ACUERDO
AL NUMERO DE DECIMALES QUE TIENEN LOS DATOS.
El valor de A dependerá de la cantidad de lugares decimales de los datos originales,
que serán agrupados en la tabla de frecuencias:
Ejemplo de dato Ejemplo de Se
original valor de A redondea
calculado a:
15 (dato entero) 5.75 6
3.2 (dato con 1 decimal) 2.33782129 2.4
11.13 (dato con 2 decimales) 3.24920976 3.25
5.391 (dato con 3 decimales) 1.42135709 1.422
99.3489 (con 4 decimales) 9.2876405 9.2877
EJEMPLO 1. SI LA VARIABLE CUANTITATIVA ES DISCRETA
Se ha aplicado una encuesta a 40 centros educativos con el fin de
observar el número de niños que estudian en ellos, obteniendose:
42 58 79 86 98 120 134 120 59 62
85 89 76 110 104 78 84 96 90 75
120 130 122 95 82 94 108 79 105 115
102 80 56 78 84 66 69 78 84 98
construya una tabla de frecuencias adecuada.
PROCEDIMIENTO:
Rango: R= 134 - 42 = 92
Número de intervalos: K = 1 + 3.3 log 40 = 6,29
(fórmula de Sturges) redondeo simple a 6
Ancho de clase: C =92 / 6 = 15,33
redondeamos por exceso de decimales
a 16
Centros educativos
Número de niños (variable)
Intervalos Tarjas Xi f fr F Fr
o conteo
[42-58) 50 2 0.050 2 0.050
[58-74) 66 5 0.125 7 0.175
[74-90) 82 15 0.375 22 0.550
[90-106) 98 9 0.225 31 0.775
[106-122) 114 6 0.150 37 0.925
[122-138] 130 3 0.075 40 1.000
TOTAL n=40 1.000
EJEMPLO 2: SI LA VARIABLE CUANTITATIVA
ES CONTINUA.
En un comercio, se dispone de los datos de la venta semanal
(en miles de Pesos) para las últimas 30 semanas.
Construya una tabla de distribución de frecuencias.
14,6 12,8 13,9 15,3 14,2 15,6 14,2 13,4 13,8 14,5
15,2 14,4 12,9 12,4 13 15,5 15,6 15,8 15,7 15,8
13,9 14,2 14,9 13,1 12,2 14,1 15,1 15,7 13,4 13,2
PROCEDIMIENTO:
1. R= Xmax – X min = 15,8 – 12,2 = 3,6
2. Hallar K mediante Sturges:
K= 1 + 3,3 log (30) = 5,8745 aprox. 6 (redondeo simple)
3. Determinar el ancho de clase A:
A= 3,6 / 6 =0,6 (no se redondea, porque ya tiene un decimal
como los datos)
Número de semanas
Venta miles de soles (variable)
Intervalos Tarjas Xi F fr
F Fr
o conteo
[12,2-12,8> // 12,5 2 0,0667 2 0,0667
[12,8-13,4> ///// 13,1 5 0,1667 7 0,2334
[13,4-14,0> ///// 13,7 5 0,1667 12 0,4000
[14,0-14,6> ////// 14,3 6 0,2000 18 0,6000
[14,6-15,2> /// 14,9 3 0,1000 21 0,7000
[15,2-15,8] ////// /// 15,5 9 0,3000 30 1,0000
TOTAL n=30 1.0000
INTERPRETACIONES UTILIZANDO LA TABLA
DE FRECUENCIAS
1.- ¿Cuántas semanas tienen ventas entre 14,0 y 14,6 miles de pesos?
Rpta. f = 6 semanas.
2.- ¿Cuál es la proporción o el porcentaje del número de semanas
cuyas ventas se encuentran entre 12,8 y 13,4 miles de pesos?
Rpta. f2 = 0,1667 ó % = 16,67%
3.- ¿Cuántas semanas tienen ventas menores a 14,6 miles de pesos?
Rpta. F4 = 18 semanas
4.- ¿Cuál es la proporción o el porcentaje del número de semanas
cuyas ventas son menores a 15,2 miles de pesos?
Rpta. F5 = 0,70 ó % = 70%
LAS GRAFICAS EN UNA TABLA
DE FRECUENCIAS
Histograma de Frecuencias Absolutas
7
Frequencia Absoluta
0
12.2 12.8 13.4 14.0 14.6 15.2 15.8
Ventas
Histograma de Frecuencias Relativas (%)
30
25
Frequencia Relativa %
20
15
10
0
12.2 12.8 13.4 14.0 14.6 15.2 15.8
Ventas
Poligono de Frecuencias Absolutas
7
numero de semanas
0
12.5 13.1 13.7 14.3 14.9 15.5
Ventas
Polígono de frecuencias absolutas
10
Num. de semanas
8
6
4
2
0
12,5 13,1 13,7 14,3 14,9 15,5
ventas
Observación
•Los polígonos de frecuencia son especialmente
útiles para comparar las distribuciones de dos
grupos de datos diferentes, para ello es
conveniente trabajar en un mismo gráfico y
empleando los mismos intervalos.
•Importante: Si la cantidad de datos es muy
diferente en ambos grupos es preferible trabajar
con polígonos de frecuencia relativa.
OJIVA
UNA OJIVA ES LA REPRESENTACION GRAFICA DE
UNA DISTRIBUCION DE FRECUENCIAS ABSOLUTAS
ACUMULADAS O LAS FRECUENCIAS RELATIVAS
ACUMULADAS.
OJIVA “MENOR QUE” O ASCENDENTE
ES LA REPRESENTACION GRAFICA DE UNA
DISTRIBUCION DE FRECUENCIAS ABSOLUTAS
ACUMULADAS “MENOR QUE” O LAS FRECUENCIAS
RELATIVAS ACUMULADAS “MENOR QUE”.
Fi
DEL EJEMPLO1:
40 *
MENOR OJIVA MENOR QUE
Fi Hi
QUE 37 *
42 0 0
58 2 0.05 31 *
74 7 0.174 22 *
90 22 0.550
7 *
106 31 0.775
122 37 0.925 2 *
138 40 1.000 *
0 42 58 74 90 106 122 138
DIAGRAMAS DE TALLOS Y HOJAS
ES UNA TECNICA QUE SE USA PARA ORGANIZAR
LOS DATOS COMO PRIMER PASO EN UN ANALISIS
EXPLORATORIO DE DATOS.
OBJETIVOS:
REPRESENTACION VISUAL DE LA INFORMACION.
DESCRIBIR UN PATRON DE COMPORTAMIENTO
DE LOS DATOS, ES DECIR QUE DISTRIBUCION
PUEDEN SEGUIR LOS DATOS.
IDENTIFICAR SI HAY VALORES EXTREMOS O
DATOS ANORMALES O VALORES ATIPICOS.
PROCEDIMIENTO:
ORDENAR LOS DATOS DE LA VARIABLE EN
FORMA CRECIENTE.
TOMAR COMO TALLO LA PRIMERA O LAS DOS
PRIMERAS CIFRAS DEL DATO Y COMO HOJA
LA ULTIMA CIFRA. A CONTINUACION SEPARADOS
POR UNA LINEA VERTICAL SE COLOCAN LOS
TALLOS A LA IZQUIERDA Y LAS HOJAS A LA
DERECHA DEL TALLO CORRESPONDIENTE.
DE ESTA FORMA CADA TALLO SE REPRESENTA
UNA SOLA VEZ Y DEFINE UNA CLASE Y EL
NUMERO DE HOJAS REPRESENTA LA FRECUENCIA
DE LA CADA CLASE.
EJEMPLOS:
. PARA DATOS CON DOS CIFRAS, ESCRIBIR A LA IZQUIERDA DE
LA LINEA LA CIFRA DE LAS DECENAS, QUE FORMAN EL
TALLO, Y A LA DERECHA LAS UNIDADES QUE SERAN LAS
HOJAS. POR EJEMPLO ESCRIBIR 85:
TALLO HOJA
8 5
ESCRIBIR 329 COMO TALLO Y HOJA
TALLO HOJA
32 9
Para los siguientes datos, construya un diagrama tallos y hojas:
12, 15,18, 22,24, 26, 27, 31, 33, 33,35, 36, 42, 42, 45, 46, 50, 51, 53
LEAF UNIT = 1.0 ES LA UNIDAD DE HOJA,DICE DONDE
PONER EL PUNTO DECIMAL, EN EL
TALLO HOJAS EJEMPLO LEAF UNIT=1.0 ASI LA
PRIMERA OBSERVACION ES 12 ,SI LEAF
3 1 258 UNIT FUERA 0.10 SERIA 1.2, SI LEAF UNIT
FUERA 10 ENTONCES EL VALOR SERIA
120.
7 2 2467
(5) 3 13356 CENTRO DE LA DISTRIBUCION
7 4 2256 ¡OBSERVE QUE SE PARECE A UN
HISTOGRAMA VOLTEADO!
3 5 013