Ejemplo 1.1.2.
1:
Los siguientes datos corresponden a la estatura de una muestra de estudiantes
del Centro Educativo El Paraso, las estaturas estn dadas en centmetros y
redondeadas al centmetro ms prximo:
132,
146,
151,
138,
136,
146,
135,
139,
152,
147,
159,
169,
136, 147, 148, 158, 135, 145,
155, 162, 148, 156, 161, 160,
154, 160, 163, 134, 146, 155,
154, 165, 150, 162, 136, 146,
144, 142, 136, 149, 156, 145,
138, 154, 170, 143, 159, 164,
146,
136,
163,
149,
168,
155,
152,
165,
154,
148,
138,
156,
142,
149,
164,
154,
153,
160,
171,
138,
156,
138,
151,
156,
163,
142,
145,
144,
148,
164,
Hallemos el rango
Xmax = 171 (Valor mximo)
Xmin = 132 (Valor mnimo)
Entonces R = Xmax - Xmin = 171-132 = 39
Mediante la ecuacin m = k = 1 + 3.3 Log n, se determina n de intervalos o
clases (m = k).
m = 1 + 3.3 log 78 = 1 + 3.3 (1.9) = 1 + 6.2 = 7.2
C = R/m = 39/8 = 4,9
C=5
Com este valor hallamos El nuevo rango
Nuevo Rango = m x c = 8 x 5 = 40
Donde:
m = k = n de intervalos.
R = rango
C = Amplitud Intervlica
Como el nuevo rango es mayor que el rango inicial se con el objeto de cuadrar
los intervalos se debe restar o sumar la diferencia al valor mnimo y al mximo,
se recomienda distribuirlo equitativamente, en este ejemplo como la diferencia
es solamente una unidad (40-39 = 1)se lo sumaremos al valor mximo que es 171
entonces tendremos 171+1 = 172
Con esta informacin organizamos la tabla de frecuencias
Intervalos
Iniciales
Intervalos de
Clase
Marca de
Clase yr
(Estudi
antes)
fr
Frecuencia
acumulada
Fr
132 136
131,5 136,5
134
137 141
136,5 141,5
139
15
142 146
141,5 146,5
144
14
29
147 - 151
146,5 151,5
149
11
40
152 156
151,5 156,5
154
17
57
157 161
156,5 161,5
159
64
162 166
161,5 166,5
164
10
74
167 171
166,5 171,5
169
78
Sumas
78
Frecuencia Relativa Absoluta
Simple
Fraccin
(mi)
Decimal
Frecuencia Relativa Simple
Acumulada
Porce
Fraccin
ntual
9/78
0,12
6/78
14/78
0,08
0.18
11/78
0.14
17/78
0.22
7/78
0.09
10/78
0.13
4/78
0.05
78/78
12
%
8%
18
%
14
%
22
%
9%
13
%
5%
(Mi)
Decima
Porcent
ual
9/78
0.12
12%
15/78
29/78
0.19
0.3
7
0.51
19%
37%
0.7
3
0.8
2
0.9
5
1
73%
40/78
57/78
64/78
74/78
78/78
51%
82%
95%
100
%
10
0
Observen que la construccin de los intervalos iniciales empiezan desde el valor
mnimo de los datos (132) y se cuentan 5 de la amplitud hallada incluyendo el
nmero inicial, es decir, 132,133,134,135,136, el siguiente intervalo inicia en el
valor siguiente en nuestro ejemplo 137 y se continan contando cinco incluido el
primer valor del intervalo y as sucesivamente.
Ahora para los lmites reales lo que se hace es restar 0.5 al lmite inferior de
cada intervalo y sumar 0.5 al lmite superior ejemplo:
Intervalo inicial 132-137 luego; 132-0.5 = 131.5
136+0.5 =136.5 entonces lmites reales del
primer intervalo 131.5-136.5 si observamos de esta manera estamos asegurando
que todos los valores de los datos observados quedaran incluidos dentro de
algn intervalo.
En la siguiente columna se encuentran las marcas de clase yr que es el
resultado de sumar el lmite inferior con el superior de cada intervalo y dividir
entre dos ejemplo,
Marca de clase del primer intervalo (131.5+136.5)/2 = 134
Luego para completar la tabla lo que hay que hacer es contar los valores que
caen dentro de cada intervalo, as en nuestro ejemplo en el primer intervalo
caen 9 valores que estn resaltados con color amarillo en la lista de datos. Esta
es la frecuencia absoluta simple que se observa en la tabla y que se denota con
el smbolo fr
En la siguiente encontramos frecuencia absoluta acumulada simple que se
denota por Fr que no es ms que acumular las frecuencias simples anteriores,
por ejemplo la frecuencia acumulada para el intervalo 5 o sea F 5 = 57 que sale
de sumar las frecuencias absolutas simples 17+11+14+6+9, y que se interpreta
que 57 de los estudiantes observados miden 154 cm (que es la marca de clase d
este intervalo) o menos y as sucesivamente
En la siguiente columna esta la frecuencia relativa simple (mi) y esta expresada
de tres maneras en fraccin, decimal y porcentual.
Ejemplo en el intervalo 4 encontramos 11/78 es decir la frecuencia absoluta
simple de este intervalo sobre el total de datos y se interpreta como 11 de los
78 estudiantes miden 149 cm (marca de clase)
En decimal esta 0.14 que es el resultado de realizar la divisin 11/78 = 0.14 y en
porcentual solamente hay que multiplicar este decimal por 100. 0.14x100 = 100
%.
Para las frecuencias relativas acumuladas se trabaja igual que la anterior pero
teniendo en cuenta las frecuencias absolutas acumuladas Fi
MEDIDAS DE TENDENCIA CENTRAL.
Intervalo
s
Iniciales
132 136
137 141
142 146
147 - 151
152 156
Intervalos
de Clase
131,5
136,5
136,5
141,5
141,5
146,5
146,5
151,5
151,5
156,5
Marca
de
Clase
yr
(Est
udia
ntes
)
fr
134
139
15
144
14
29
149
11
40
154
17
57
Frecuen
cia
acumula
Frecuencia Relativa Absoluta
Simple (mi)
Fraccin
da
Fr
9/78
6/78
14/78
11/78
17/78
Frecuencia Relativa Simple
Acumulada
Decim
Porce
al
ntual
0,1
2
0,0
8
0.1
8
0.1
4
0.2
2
12
%
8%
18
%
14
%
22
%
Fraccin
9/78
15/78
29/78
40/78
57/78
(Mi)
Decim
Porce
al
ntual
0.1
2
0.1
9
0.3
7
0.5
1
0.7
3
12
%
19
%
37
%
51
%
73
%
fr* yr
1206
834
2016
1639
2618
157 161
162 166
167 171
156,5
161,5
161,5
166,5
166,5
171,5
Sumas
159
64
164
10
74
169
78
78
7/78
10/78
4/78
78/78
0.0
9
0.1
3
0.0
5
1
9%
64/78
13
%
5%
74/78
10
0
78/78
0.8
2
0.9
5
1
82
%
95
%
100
%
1113
1640
676
11742
Para hallar la media aritmtica o promedio multiplicamos yr por fr como se
observa en la tabla y se aplica la frmula
Entonces
m
__
y
i 1
fr
f
i 1
__ 11 .742
X
150,53 cm
78
y diremos que la media cae en el intervalo de clase
nmero 5 de (151,5 156,5)
MEDIANA
Para la mediana tomaremos el valor central de toda la distribucin, en este caso como son 78
datos es par se tomaran los valores que ocupan la posicin 39 y 40, si observamos las
frecuencias de los intervalos nos encontramos que las primeras 4 es decir, 9 + 6 + 14 + 11 =
40, es decir, que aqu ya caen los dos valores que necesitamos por lo tanto hablamos del
intervalo mediano = (146,5 151,5).
En este caso tambin nos podemos referir a la marca de clase de este intervalo como la
mediana es decir 149 cm
LA MODA
Para la moda solo necesitamos observar cual es el intervalo con mayor frecuencia, en este
caso es (151,5 156,5) que tiene frecuencia de 17 observaciones y diremos que este es el
intervalo modal, tambin nos podemos referir a la marca de clase de seste intervalo 154 cm
como la moda de la distribucin.
MEDIDAS DE DISPERSIN
Siguiendo con nuestro ejemplo completamos la tabla con algunos clculos tiles para
hallar las medidas de dispersin:
Se hace la resta de la marca de clase de cada
intervalo con la media aritmtica hallada
anteriormente
Ej: 134- 150.53 = -16.53, como es en valor absoluto
se escribe siempre positivos
DESVIACIN MEDIA
m
DM
f
i 1
__
* yr y
n
Intervalo
s
Iniciales
132 136
137 141
142 146
147 - 151
Intervalos
de Clase
131,5
136,5
136,5
141,5
141,5
146,5
146,5
151,5
Marca
de
Clase
yr
(Est
udia
ntes
)
fr
134
139
15
144
14
29
149
11
40
Frecuen
cia
fr* yr
yr - y
Yr* yr - y
1206
16.53
148.77
834
11.53
69.18
2016
6.53
91.42
1639
1.53
16.83
acumula
da
Fr
Con esta sumatoria se reemplaza en la
DM
frmula
653.06
8.372
78
5
6
7
8
151,5
156,5
156,5
157 161
161,5
161,5
162 166
166,5
166,5
167 171
171,5
Sumas
152 156
154
17
57
159
64
164
10
74
169
78
78
2618
3.47
58.99
1113
8.47
59.29
1640
13.47
134.7
676
18.47
73.88
11742
653.06
La desviacin media es la media aritmtica de las desviaciones en valor
absoluto, de cada uno de los datos de la variable respecto a la media.
LA VARIANZA: Para este clculo hallamos otros valores en la tabla usando siempre los
clculos anteriores para este caso usaremos los datos del valor absoluto, solo que esta
vez van elevados al cuadrado y en la siguiente columna se multiplica por la frecuencia de
cada intervalo.
Ejemplo: (134 -150.53)2 = 273.24 que es lo mismo que elevar el valor 16.53 hallado en
la tabla anterior y as sucesivamente y luego este valor se multiplica por 9 que es la
frecuencia as 273.24x9 = 2459.16
Aplicamos la siguiente frmula para
hallar
la varianza
m
__
2
f r (Yr Y )
7765.32
2
r 1
S
99.55
n
78
r
1
2
3
4
5
6
7
8
Intervalos
Iniciales
132 136
137 141
142 146
147 - 151
152 156
157 161
162 166
167 171
Intervalos
de Clase
131,5 136,5
136,5 141,5
141,5 146,5
146,5 151,5
151,5 156,5
156,5 161,5
161,5 166,5
166,5 171,5
Sumas
Marca
de
Clase
yr
134
139
144
149
154
159
164
169
(Estu
diant
es)
fr
9
6
14
11
17
7
10
4
78
Frecuenci
a
fr* yr
(Yr-
acumulada
Fr
9
15
29
40
57
64
74
78
__
1206
834
2016
1639
2618
1113
1640
676
11742
__
)2
273.24
132.94
42.64
2.34
12.04
71.74
181.44
341.14
fr(Yr-
)2
2459.16
797.64
Les recuerdo que ustedes pueden hacer
596.96
todo
25.74en una sola tabla solamente ir
agregando
columnas yo aqu las separe
204.68
simplemente para tratar de explicarlo
502.18
mejor.
1814.4
1364.56
7765.32
DESVIACIN TPICA
Solamente tenemos que hallar la raz cuadrada de la varianza.
As
S 99.55 9.97
cm
S S2
Para los dems conceptos les envi los siguientes ejemplos (son de m autora)
Ejemplo 2.2.1.
Los siguientes son los resultados de la prueba final de matemticas de los
estudiantes de grados sexto y sptimo del Colegio Alianza Pedaggica. Se
calific con puntos de 1 a 40.
31 32 26 16 15 19 30 24 14 10 32 26 19 32 18 27 30 36 23 14 12
21 18 28 34 28 24 32 33 14 12 16 20 26 31 16 35 26 23 17 31 30
18 17 24 32 29 29
Ordenemos la serie de datos y dividamos en cuatro partes iguales.
10,12,12,14,14,14,15,16,16,16,17,17,18,18,18,19,19,20,21,23,23,24,24,24,26,26,2
6,26,27,28,28,29,29,30,30,30,31,31,31,32,32,32,32,32,33,34,35,36
2.2.1 CUARTILES
Son los valores de la variable que divide el conjunto de datos ordenados en
cuatro partes iguales, cada una contiene el mismo nmero de observaciones, se
representan por Q1 , Q2 , Q3.
Para el clculo de los cuartiles se usara a N como smbolo del total de datos, independiente
SERIE ORDENADA DE DATOS
Q1
Q2
Q3
El primer cuartil, Q1 es el valor que corresponde al 25% de los datos. Q 1 es
el dato de la serie ordenada que ocupa el lugar N/4.
En el ejemplo el primer cuartil Q1 = 17,5 o sea que el 25 % de los
estudiantes obtuvieron una calificacin de 17,5 puntos o menos
El segundo cuartil Q2, tiene el 50 % de los datos inferiores a el. Q 2 es el
dato de la serie ordenada que ocupa el lugar N/2, y obviamente coincide
con la mediana.
En el ejemplo del segundo cuartil Q 2 corresponde a 25, significa que el
50% de los estudiantes alcanzaron una calificacin de 25 o menos.
El tercer cuartil, Q3, es el valor que separa el 75 % de los datos que
quedan por debajo de el. Q3 es el dato de la serie ordenada que ocupa el
lugar 3N/4.
En el ejemplo el tercer cuartil Q3 corresponde a 30,5 o sea que el 75 % de
los estudiantes obtuvieron una calificacin de 30,5 puntos o menos puntos.
Ejemplo [Link]:
Los siguientes datos corresponden a una encuesta realizada en 15 hogares del
barrio Comcaja de Yopal, sobre el nmero de llamadas telefnicas que realizan
aproximadamente durante un da:
13 10 8 15 6 9 12 11 10 15 9 5 14 12 18
Calcular los cuartiles. En este ejemplo tenemos un total de 15 observaciones, si
dividimos el total de datos por cuatro, obtenemos un nmero decimal, entonces
es necesario aproximar al entero siguiente.
15/4 = 3,75 se aproxima a 4 que es el entero siguiente.
Solucin:
Ordenamos los datos.
5 6 8 9 9 10 10 11 12 12 13 14 15 15 18
El lugar del Q1 es N/4 = 15/4 = 3,75; que se aproxima a 4
Luego tomamos el cuarto dato que corresponde a 9 = Q1
El lugar que corresponde al Q2 es N/2 = 15/2 = 7,5, que se aproxima a 8.
Entonces tomamos el octavo dato Q2 = 11
El lugar que corresponde a Q3 es 3N/4 = 45/4 = 11,25, tomamos el dato
decimosegundo que corresponde a 14 = Q3.
[Link] Rango intercuartil (Q):
El Rango Intercuartil es la diferencia entre el tercer cuartil y el primer cuartil
Q1
Q2
Q3
Q
Q = Q3 Q1
Para el ejemplo [Link]. tenemos:
Q = 14 9 = 5
[Link] Rango semiintercuartlico: Es la mitad del rango intercuartlico, se
denota por QD
Entonces:
QD
Q3 Q1
2
En el ejemplo [Link] tenemos:
QD
14 9
2,5
2
El Rango intercuartil y semiintercuartlico, a pesar que son medidas de
variabilidad ms adecuadas que el rango, presentan inconvenientes y por lo
tanto su uso no es frecuente, tales como:
No consideran todos los valores de la distribucin.
Los cuartiles no tienen propiedades algebraicas y por consiguiente no hay
tratamiento matemtico.
Si se conoce el rango intercuartil, no es posible ubicar con precisin una
observacin dentro de la distribucin.
2.2.2 Deciles: Si en lugar de dividir la distribucin en
4 partes iguales, se divide en 10 partes iguales, se
tienen 9 puntos de divisin.
D2
D3
D4
El primer decil D1, deja por debajo el 10% de los datos
de la serie y por encima el 90% de los mismos
El segundo decil D2, deja por debajo el 20% de los
datos de la serie y por encima el 80% de los mismos y
as sucesivamente.
Para el clculo de los deciles se procede as:
D5
D6
D7
D8
D9
El lugar que ocupa el primer decil D1, corresponde a
N/10.
El lugar que ocupa el segundo decil D2, corresponde a 2N/10.
El lugar que ocupa el quinto decil D5, corresponde a 5N/10 = N/2 y este coincide
con la mediana.
DATOS ORDENADOS
Los deciles se designan por:
D1, D2, ... D9.
D1
En el ejemplo 2.2.1, correspondiente al puntaje obtenido por los estudiantes de
los grados sexto y sptimo del Colegio Alianza Pedaggica en una prueba de
matemticas, tenemos:
N = 48
Al dividir en 10 partes iguales la serie de datos, tendramos que a cada parte le
correspondera 4.8 datos, lo cual no es posible; por lo tanto debemos aproximar
al nmero entero siguiente.
Calculemos el sexto decil:
D6 = 6N/10
D6 = 6(48)/10
D6 = 28,8 Dato, que se aproxima al dato 29 de la serie.
En este caso el dato que ocupa el lugar 29 es 27 puntos, y significa que el 60%
de los estudiantes obtuvieron 27 puntos o menos.
2.2.3 Percentiles: Son los valores de la variable que dividen a una serie ordenda
de datos en 100 partes iguales y se representan por:
P1, P2, P3,...,P99.
El primer percentil P1, deja por debajo el 1% de los datos de la serie y por
encima el 99%.
El segundo percentil P2, deja por debajo el 2% y por encima el 98% de los datos
de la serie, y as sucesivamente.
Se deduce que:
P25 = Q1
P50 = Q2 = Me = D5
P75 = Q3.
El lugar que ocupa el primer percentil corresponde a N/100
El lugar que ocupa el segundo percentil corresponde a 2N/100, y as
sucesivamente con los dems.
Ejemplo [Link]:
Con los datos del ejemplo 16 de la pgina 36, hallar los percentiles 10 y 90
P10 = (10x48)/100 = 480/100 = 4,8 dato que se aproxima a la observacin 5
de la serie ordenada de forma ascendente.
Entonces, P10 = 14 y significa que el 10% de los estudiantes
obtuvieron 14
o menos puntos.
P90 = (90x48)/100 = 4320/100 = 43,2 dato que se aproxima a 43, que en este
caso la observacin que ocupa el lugar 43 es 32 y significa que el 90% de los
estudiantes obtuvieron 32 o menos puntos.
La diferencia entre los percentiles nonagsimo y dcimo recibe el nombre de
recorrido interdecil.
P90 P10 = recorrido interdecil = D9 D1
El recorrido interdecil indica la dispersin
correspondientes a los percentiles 90 y 10.
entre
las
observaciones