Medidas de Tendencia Central y Dispersión
Medidas de Tendencia Central y Dispersión
EST - 503
APUNTES
UNIDAD II
ESTADÍSTICA DESCRIPTIVA
2
“La percepción, sin comprobación ni fundamento, no es garantía suficiente de
verdad.”
Bertrand Russell (1872-1970)
3
Después de haber aprendido en el capítulo anterior a construir tablas de
frecuencias y haber realizado alguna representación gráfica, el siguiente paso
para llevar a cabo un estudio preliminar de los datos recogidos es el cálculo de
santo tomas
diferentes magnitudes características de la distribución. Se definen entonces
diversas medidas que serán capaces de resumir toda la información recogida a
un pequeño número de valores. Estas medidas resumen van a permitir comparar
nuestra muestra con otras y dar una idea rápida de cómo se distribuyen los
datos. Es evidente que todas estas medidas solo pueden definirse para variables
cuantitativas.
4
santo tomas
5
MEDIDAS DE POSICIÓN O DE LOCALIZACIÓN
santo tomas
6
En la Unidad I, nos referimos a la clasificación, ordenación y
presentación de datos estadísticos, limitando el análisis de la
información a la interpretación porcentual de las distribuciones
de frecuencia.
santo tomas
de toda la información.
7
MEDIDAS DE TENDENCIA CENTRAL
santo tomas
Media aritmética de datos no agrupados:
8
Recordemos que la Frecuencia relativa, fr, se obtiene por la fórmula siguiente:
fr = fi / n
X=
Xi fi fr Xi * fi Xi * fr
1 6 0,30 6 0,30
santo tomas
2 7 0,35 14 0,70
3 4 0,20 12 0,60
4 2 0,10 8 0,40
5 1 0,05 5 0,25
Total 20 1,00 45 ∑ = 2,25
Aplicando la ecuación:
X=
45 / 20 = 2,25 O usando fr:
9
X= = 2,25
Ejercicio:
En un grupo de personas hemos preguntado por el número medio de días que
practican deporte a la semana. Las respuestas han sido las siguientes:
4 -2 -3- 1- 3 7 -1- 0 -3 -2
6- 2- 3 -3- 4 6- 3- 4- 3- 6
santo tomas
N= Número de observaciones.
10
Resultado:
xi fi fr xi *fí xi *fr
0 1 0,05 0 0
1 2 0,1 2 0,1
2 3 0,15 6 0,3
3 7 0,35 21 1,05
4 3 0,15 12 0,6
santo tomas
6 3 0,15 18 0,9
7 1 0,05 7 0,35
20 1 66 3,3
Utilizando XI y fi :
X=
X = 66/ 20 = 3,3
Utilizando XI y frecuencia
relativa fr :
X = 3,3
X=
11
Ejercicio
santo tomas
7- 5- 2- 4- 3 6 - 3 -6-3- 3
12
xi fi fr fa fr% fa%
2 2 0,1 2 10 10
3 5 0,25 7 25 35
4 3 0,15 10 15 50
5 4 0,2 14 20 70
6 3 0,15 17 15 85
7 3 0,15 20 15 100
20 1 100
santo tomas
xi fi fr x i * fi xi * fr
2 2 0,1 4 0,2
3 5 0,25 15 0,75
4 3 0,15 12 0,6
5 4 0,2 20 1
6 3 0,15 18 0,9
7 3 0,15 21 1,05
20 1 90 4,5
X = 4,5
Al preguntar a 20 familias sobre el número de días a la semana que van a
hacer la
1- 2 -2 -4- 6 1-6-1-2-3
santo tomas
5- 2- 6 -3 -1 4-1-6-1-2
xi fi
1 6
2 5
3 2
4 2
5 1
6 4
20
santo tomas
6 4 0,2 24 1,2
20 59 2,95
X = 59 / 20 = 2,95
X = 2,95
15
X=
PREGUNTA:
santo tomas
16
A la tabla de frecuencias de datos no agrupados, que posee las
santo tomas
columnas la variable x, frecuencia absoluta fi, frecuencia relativa
fr, frecuencia acumulada fa, para calcular la media se le deben
agregar dos columnas, una para el producto de xi x fi y otra para el
producto entre xi x fr, si se desea comprobar el resultado.
17
MEDIA ARITMÉTICA PARA DATOS AGRUPADOS.
La Media al igual para los datos no agrupados se define como el promedio de los
datos.
Vamos a utilizar el concepto ya aprendido de Marca de Clase o punto medio de un
intervalo. (Vi).
Como ya se explicó la Marca de Clase o punto medio de un Intervalo de clase viene
santo tomas
dado por la siguiente expresión:
Y como fr = fi / n
X=
Reemplazando se obtiene:
n
X=
Los elementos en esta fórmula son:
n= tamaño de la muestra.
18
Vi = Marca de clase o punto medio del intervalo i
fi = Frecuencia absoluta de intervalo i
fr= Frecuencia relativa.
Ejemplo:
Cálculo de la Media usando Vi,fi
23 29 26 26 676
30 36 33 11 363
santo tomas
37 43 40 3 120
44 50 47 4 188
51 57 54 2 108
∑ fi= 55 ∑ = 1626
X= 1.626
-------------------- = ------------------ = 29,6 años
n 55
19
Cálculo de la Media, usando, Vi, fr
santo tomas
30 - 36 33 11 0,2000 363 6,6000
37 43 40 3 0,0546 120 2,1840
44 - 50 47 4 0,0727 188 3,4169
51 - 57 54 2 0,0364 108 1,9656
55 1,0000 29,565
X = 29, 6 X=
20
Ejercicio: Calcular la media X usando Vi, fi y fr
Intervalos Frecuencia, fi
0-2 12
3-5 13
santo tomas
6-8 23
9 - 11 16
12 - 14 18
n = 82
21
EJEMPLO, Calcular la Media.
Intervalos Marca de clase, Vi Frecuencia Vi x fi
Absoluta, fi
0-2 1 12 12
3-5 4 13 52
6-8 7 23 161
santo tomas
9 - 11 10 16 160
12 - 14 13 18 234
∑ fi = n = 82 ∑ = 619
∑i n Vi x fi
X = ------------------
n
619
X =-------------- = 7,548
82 22
EJEMPLO. Calcular la Media.
santo tomas
23
Vi
fi x Vi
18
60
120
112
180
santo tomas
132
n =55 622
∑i n Vi x fi
X = ------------------
n
622 = 11,31
X =----------
55
24
Utilizar la tabla de frecuencias siguiente para calcular la altura media de 100
estudiantes:
Altura, in Frecuencia
fi
60 - 62 5
santo tomas
63 - 65 18
66 - 68 42
69 - 71 27
72 - 74 8
n=
25
Altura, in Frecuencia Marca de fi x Vi
fi clase Vi
60 - 62 5 61 305
santo tomas
63 - 65 18 64 1152
66 - 68 42 67 2814
69 - 71 27 70 1890
72 - 74 8 73 584
n = 100 ∑ 6.745
∑ fi x Vi* 6.745
X= =---------- = 67,45
n 100
santo tomas
27
RESPUESTA:
santo tomas
28
Media Gráficos.
6
5
4
3
santo tomas
2
1 Nota
1 2 3 4 5 6 7
Solución:
Para determinar el total de datos, debemos sumar las frecuencias. En este caso, el total
de datos es 16.
29
N° Alumnos
6
5
4
3
2
1 Nota
1 2 3 4 5 6 7
santo tomas
x = 1·1 + 2·2 + 3·1 + 4·5 + 5·3 + 6·2 + 7·2
16
x = 1 + 4 + 3 + 20 + 15 + 12 + 14
16
x = 69
16
x ≈ 4,3
30
Media geométrica
La media geométrica de una cantidad finita de números (digamos n números) es la raíz n-ésima del
producto de todos los números.
santo tomas
Por ejemplo, la media geométrica de 2 y 18 es
santo tomas
La media armónica resulta poco influida por la existencia de determinados valores mucho más grandes
que el conjunto de los otros, siendo en cambio sensible a valores mucho más pequeños que el conjunto.
La media armónica no está definida en el caso de la existencia en el conjunto de valores nulos.
32
Ejemplo
Supóngase que una familia realiza un viaje en automóvil a un
ciudad y cubre los primeros 100 km a 60 km/h, los siguientes
100 km a 70 km/h y los últimos 100 km a 80 km/h. Calcular, en
esas condiciones, la velocidad media realizada.
santo tomas
33
Media cuadrática
La media cuadrática es igual a la raíz cuadrada de la suma de los cuadrados de los valores dividida entre
el número de datos:
santo tomas
Esta media como medida de asociación tiene aplicaciones tanto en ciencias biológicas como en
medicina.
A veces la variable toma valores positivos y negativos, como ocurre, por ejemplo, en los errores de
medida.
En tal caso se puede estar interesado en obtener un promedio que no recoja los efectos del signo.
Este problema se resuelve, mediante la denominada media cuadrática.
Consiste en elevar al cuadrado todas las observaciones (así los signos negativos desaparecen), en
obtener después su media aritmética y en extraer, finalmente, la raíz cuadrada de dicha media para
volver a la unidad de medida original.
34
Media cuadrática
Xi X2i
2 4
5 25
5 25
20 400
20 400
30 900
30 900
30 900
14 196
50 2500
Media ponderada
Se denomina media ponderada de un conjunto de números al resultado de multiplicar cada uno de los
o: números por un valor particular para cada uno de ellos, llamado su peso, obteniendo a continuación la
suma de estos productos, y dividiéndo el resultado por la suma de los pesos.
Este "peso" depende de la importancia o significancia de cada uno de los valores.
Para una serie de datos
X = { x1, x2, ..., xn}
a la que corresponden los pesos
W = { w1, w2, ..., wn}
la media ponderada se calcula como:
santo tomas
Un ejemplo es la obtención de la media ponderada de las notas de una oposición en la que se asigna distinta importancia
(peso) a cada una de las pruebas de que consta el examen.
36
Ejemplo:
Si la asignatura A tiene un valor de 2 créditos y la asignatura B tiene un
valor de 3 créditos. Entonces, para un estudiante que haya obtenido una
calificación de 4 en la asignatura A y de 5 en la asignatura B, la nota
promedio ponderado está dada por:
santo tomas
37
Ejemplo Media Ponderada.
santo tomas
X= X1 x 0,25 + X2 x 0,10 + X3 x 0,15 + X4 x 0,50
Media aritmética.
X= 80/4
X= 20 Kg
38
Ejemplo Media Ponderada.
Un estudiante al final del semestre tiene las siguientes notas en Estadísticas, en cada una de las tres Unidades que
tiene el ramo. Con su respectiva ponderación.
Calcule la Media ponderada de notas que tiene el estudiante
para presentarse a exámen.
santo tomas
X =X1*w1+x2*w2+x3*w3
w1+w2+w3
X=4,0*0,25+4,5*0,25+5*0,5
0,25+0,25+0,50
X= 4,625
1
X= 4,63
39
Ejercicio 1:
santo tomas
Jueves 21
Viernes 20
Sábados 19
Domingo 19
18 1
19 2
santo tomas
20 1
21 2
22 1
∑fi = 7
santo tomas
50 1 50
51 3 153
52 5 260
53 9 477
54 12 648
55 10 550
56 5 280
57 3 171
58 2 116
∑fi = 50 ∑ xi*fi = 2.705
∑1 9 xi * fi 2705
X=--------------- =---------------- = 54,100 $/día *1000= 54.100 42
n 50
Ejemplo de Media aritmética en datos agrupados en Intervalos de Clase.
En este caso se toman como datos de la variable en estudio la Marca de clase
O punto medio del Intervalo de clase Vi.
santo tomas
100 ≤ X ˂ 200 150 4 600
43
∑1 7 xi * fi 44.800
X=--------------- =---------------- = 448 Kg/Cm2
n 100
santo tomas
44
LA MEDIA COMO PUNTO DE EQUILIBRIO
santo tomas
45
La mediana
La mediana de un conjunto de números ordenados en magnitud es el valor o
dato central, o la media de los dos valores centrales.
La MEDIANA. (Md)
Es la puntuación central de una serie de datos ordenados. Es la puntuación que deja por debajo
el 50% de los datos, y por encima el otro 50%. Es el dato que queda en el centro de la
santo tomas
distribución cuando los datos son ordenados de menor a mayor.
Cálculo:
1° Se calcula la posición de la Mediana: Posición (N + 1) / 2.
Ejemplo:
Serie: 3, 3, 5, 5, 7, 7, 7 Posición (N + 1) / 2 = ( 7 + 1) / 2 = 4
47
santo tomas
Md = ( 5 + 7) / 2 = 12 / 2 Md= 6
Donde:
Md = Mediana
48
CASO EN QUE LOS DATOS ESTÁN AGRUPADOS EN DISTRIBUCIÓN DE FRECUENCIAS
EN INTERVALOS O CLASES.
Método 1: Usando N/2, y la Frecuencia Acumulada, fa.
Cuando los datos están agrupados en una distribución de frecuencias, se utiliza la siguiente
fórmula:
Md = Li + [ (N / 2 - fai ) / fi ] * A
santo tomas
Donde:
Md = Mediana
Li = Límite inferior del intervalo dónde caiga la Mediana. Con frecuencia absoluta
mayor a N/ 2.
santo tomas
∑fi =N= 85
Md = Li + [ (N / 2 - fai ) / fi ] * A
1° Se calcula la posición; Posición= N/ 2 = 85 / 2 = 42,5
2° Se busca en la columna de la frecuencia acumulada, la posición 42,5 para determinar el Intervalo
en que cae la Mediana. Dicha posición cae en el tercer Intervalo con Límites 114 - 120. Dicho
intervalo contiene los datos desde el dato 34 al dato 56, y se desea ubicar el dato 42,5.
50
Luego Md = 114 + [ (42,5 – 33) / 23 ] * 7 = 116,89 Md = 116,89
Ejemplo: Calcular la Mediana de la tabla de datos agrupados:
Intervalo Marca Clase Frecuencia fi
Vi
16 - 22 19 9
23 - 29 26 26
30 - 36 33 11
37 43 40 3
santo tomas
44 - 50 47 4
51 - 57 54 2
55
Md = Li + [ (N / 2 - fai ) / fi ] * A
51
Donde:
Md = Mediana
Li = Límite inferior del intervalo dónde caiga la Mediana. Con frecuencia absoluta
mayor a N/ 2.
santo tomas
N= Número total de observaciones.
52
Solución:
Intervalo Marca Clase Frecuencia fi fa
X*
16 - 22 19 9 9
*23 - 29 26 26 35
santo tomas
30 - 36 33 11 46
37 43 40 3 49
44 - 50 47 4 53
51 - 57 54 2 55
55
N 55
= = 27,5
1.- Se calcula la posición:
2 2
53
2.- El intervalo es el 23 – 29 Li= 23
A= 29 – 23 + 1 = 7
santo tomas
Md = Li + [ (N / 2 - fai ) / fi ] * A
18,5
27,5 - 9
Md= 23+ ( ---------------------) *7 = 23 + (--------------- )* 7=
26 26
Md= 27,98
Ejemplo:
Utilizar la tabla de frecuencias siguiente para calcular la Mediana de dela tabla de
100 estudiantes:
Altura, in Frecuencia
fi
60 - 62 5
santo tomas
63 - 65 18
66 - 68 42
69 - 71 27
72 - 74 8
n =100
Md = Li + [ (N / 2 - fai ) / fi ] * A
55
Donde:
Md = Mediana
Li = Límite inferior del intervalo dónde caiga la Mediana. Con frecuencia absoluta
mayor a N/ 2.
santo tomas
N= Número total de observaciones.
56
Solución:
Altura, in Frecuencia Frecuencia
fi fa
60 - 62 5 5
63 - 65 18 23
*66 - 68 42 65 Md= 67,43
santo tomas
69 - 71 27 92
72 - 74 8 100
n =100
N 100
1.- Se calcula la posición: ------- = ------ = 50
2 2
A= 68– 66 + 1 = 3
57
Md = Li + [ (N / 2 - fai ) / fi ] * A
santo tomas
50 - 23
Md= 66+ ( ---------------------) *3 = 66 + 27/ 42 * 3= 66 + 0,643 * 3=
42
Md= 67,93
58
EJEMPLO. Calcular la Mediana.
santo tomas
Md = Li + [ (N / 2 - fai ) / fi ] * A
59
Intervalo Frecuencia fi Frecuencia
acumulada fa
0-4 9 9
4-8 10 19
*8 - 12 12 31
12 - 16 8 39
16 - 20 10 49
santo tomas
20 - 24 6 55
n = 55
A= Ls – Li
n/2 - fai
Md = Li + x A= A = 12 – 8
santo tomas
fi A=4
27,5 – 19,0
Md = 8 + x4=
12
Md = 8 + 0,708 x 4 =
Md = 8 + 2,83 = 10,83
Md = 10,83.
61
Método 2: Cálculo de la Mediana usando la Frecuencia Relativa acumulada, fra
(c).
Otra forma de cálculo de la Mediana de datos agrupados en Intervalos o Clases..
santo tomas
Cómo tratamos de encontrar un número tal que la mitad de las observaciones
sean mayores o iguales, y la otra mitad, sean menores o iguales que dicho
número, la Mediana Md, debe estar en una clase tal que la frecuencia
relativa acumulada fra hasta la clase que la precede inmediatamente sea
menor que 0,5, y la frecuencia relativa acumulada fra, hasta la clase que buscamos
sea mayor o igual a 0,5. A esta clase la llamaremos la clase de la Mediana, Md.
Paso 2. Calcúlese la Mediana mediante la fórmula:
(b – a)(0,5 – c)
Md = a + -----------------------
Dónde; d
a: Límite inferior de la clase de la mediana.
b: Límite superior de la clase de la mediana.
c: Frecuencia relativa acumulada hasta la clase que precede a la de la 62
mediana.
d: Frecuencia relativa de la clase de la mediana.
Ejemplo:
santo tomas
25,5 – 30,5 42 0,50602 0,54216
30,5 -35,5 21 0,25301 0,79517
35,5 – 40,5 7 0,08434 0,87951
40,5 – 45,5 3 0,03614 0,91565
45,5 – 50,5 2 0,02410 0,93975
50,5 – 55,5 2 0,02410 0,96385
55,5 – 60,5 2 0,02410 0,98795
60,5 – 65,5 1 0,01205 1,00000
63
Paso 1. Clase de la Mediana Me.
La frecuencia relativa acumulada fra, de la clase que la precede debe ser
menor a 0,5. ( fra = 0,0364 primer intervalo), y la frecuencia de la clase que
buscamos, o clase de la mediana debe ser mayor o igual a 0,5. Por lo tanto
el segundo intervalo 25,5 – 30,5 con fra de 0,54216, cumple con esta condición,
Siendo la clase de la mediana Me.
santo tomas
(b – a)(0,5 – c)
Me = a + -----------------------
d
Dónde;
a: Límite inferior de la clase de la mediana.(25,5)
b: Límite superior de la clase de la mediana. (30,5)
c: Frecuencia relativa acumulada hasta la clase que precede a la de la
mediana. (0,03614).
d: Frecuencia relativa de la clase de la mediana.(0,50602).
64
Luego:
a: 25,5
b: 30,5
c: 0,03614
d: 0,50602
(b – a)(0,5 – c)
santo tomas
Me = a + -----------------------
d
Me = 30,0834
65
Ejemplo: Calcular la Mediana, Me por el método de la frecuencia relativa acumulada:
Intervalos fi
100 - 106 12
107 - 113 21
114 - 120 23
121 - 127 17
santo tomas
128 - 134 12
(b – a)(0,5 – c)
Me = a + -----------------------
d
Dónde;
a: Límite inferior de la clase de la mediana.
b: Límite superior de la clase de la mediana.
c: Frecuencia relativa acumulada hasta la clase
que precede a la de la
mediana.
d: Frecuencia relativa de la clase de la
66
mediana.
Intervalos fi fr fra
100 - 106 12 0,1412 0,1412
107 - 113 21 0,2471 0,3883
*114 – 120 23 0,2706 0,6589
121 - 127 17 0,2000 0,8589
128 - 134 12 0,1411 1,0000
santo tomas
n=85
(b – a)(0,5 – c)
Me = a + -----------------------
d
Dónde;
a: Límite inferior de la clase de la mediana. (114)
b: Límite superior de la clase de la mediana. (120)
c: Frecuencia relativa acumulada hasta la clase que precede a la de la
mediana. (0,3883)
d: Frecuencia relativa de la clase de la mediana. (0,2706)
67
(120 – 114)(0,5 – 0,3883)
Me = 114 + --------------------------------------
0,2706
(6)(0,1117) 0,6702
Me = 114 + -------------------- =
0,2706 0,2706
santo tomas
Me = 114 + 2,4767
Me = 116,48
68
Ejemplo. Calcular la Mediana Me, por el método de la frecuencia relativa acumulada
Intervalo Frecuencia fi
16 - 22 9
23 - 29 26
30 - 36 11
37 43 3
santo tomas
44 - 50 4
51 - 57 2
55
(b – a)(0,5 – c)
Me = a + -----------------------
d
Dónde;
a: Límite inferior de la clase de la mediana.
b: Límite superior de la clase de la mediana.
c: Frecuencia relativa acumulada hasta la clase que precede a la de la
69
mediana.
d: Frecuencia relativa de la clase de la mediana. (
Intervalo Frecuencia fi fr fra
16 - 22 9 0,1636 0,1636
30 - 36 11 0,2000 0,8363
37 43 3 0,0546 0,8909
44 - 50 4 0,0727 0,9636
51 - 57 2 0,0364 1,0000
santo tomas
n=55
(b – a)(0,5 – c)
Md = a + -----------------------
d
Dónde;
a: Límite inferior de la clase de la mediana. (23)
b: Límite superior de la clase de la mediana. (29)
c: Frecuencia relativa acumulada hasta la clase que precede a la de la
mediana. (0,1636))
d: Frecuencia relativa de la clase de la mediana. (0,4727)
70
(b – a)(0,5 – c)
Md = a + -----------------------
d
santo tomas
0,4727 0,4727
Md = 23 + 4,27=
Md = 27,27
71
CASO DE CÁLCULO DE LA MEDIANA EN UNA TABLA DISTRIBUCIÓN
DE FRECUENCIAS SIMPLES (O datos no agrupados).
Cuando los datos recolectados han sido organizados en una tabla de frecuencias
simples, la mediana se obtiene buscando en la columna de frecuencias acumuladas
el valor que esté situado exactamente a la mitad, conforme a la fórmula anterior.
santo tomas
columna en la que se anoten las frecuencias acumuladas fa. Entonces, el número
total de datos recolectados N , (n) más
uno, dividido entre dos da el dato central dc :
n+1
dc = -----------
2
72
Ejemplo 1: Localizar la mediana del conjunto de calificaciones mostrado en la
siguiente tabla.
Solución: A la tabla original xi, fi se le añadió la columna de frecuencias
acumuladas fa :
n+1
dc = -----------
2
santo tomas
n= 117
117 +1
dc = -----------
2
dc= 59
Md
Me= 8
73
La máxima frecuencia acumulada, que es lo mismo que el número
total de datos nominales, es de 117. Es decir, la tabla corresponde
a las calificaciones de 117 alumnos.
El dato central respecto de los valores nominales es el valor nominal
5 (ver tabla de la derecha). Ese no es la mediana.
El valor central respecto de las frecuencias, no de los datos nominales
x, se obtiene sumando 1 al 117 y dividiéndolo entre dos, es decir,
santo tomas
que significa que el dato ordinal 59, el quincuagésimo noveno, es el que está
situado a la mitad de todos. Observando la columna de las frecuencias
acumuladas se ve que hasta la calificación 7, contadas desde el principio, van
apenas 49 alumnos, mientras que hasta la calificación 8 ya van 74. Esto significa
que dentro de la calificación 8 está el alumno número 59, que es el central. Por
lo tanto, la mediana es Md = 8.
74
El error más común que se comete a la hora de intentar localizar la mediana es
buscar el dato nominal x central en vez del dato ordinal, o sea, el error consiste
en buscar en la columna de los datos
nominales x el que está a la mitad y eso no es.
santo tomas
75
Solución: La tabla de la derecha es la tabla original a la que ya se le añadió la
columna de frecuencias acumuladas.
La máxima frecuencia acumulada, que es lo mismo que el número total
de datos nominales, es de 89. Es decir, la tabla corresponde a 89 datos
recolectados.
Los datos centrales respecto de los valores nominales, o sea desde la
tabla, son los valores nominales 800 y 900 (ver tabla de la derecha). Esos no son la
Mediana.
santo tomas
El valor central respecto de las frecuencias, no de los datos nominales x, se obtiene
sumando 1 al 89 y dividiéndolo entre dos, es decir,
que significa que el dato ordinal 45 (el que ocupa el lugar 45) es el que está situado a la mitad
de todos, o sea, hay 44 antes y 44 después de él. Observando la columna de las frecuencias
acumuladas se ve que hasta el dato nominal x = 600 , contados desde el principio, van 45
datos recolectados. Esto significa que de los 12 datos nominales x = 600 , justamente el
último de ellos ocupa el orden 45, que es el central. Por lo tanto, la mediana es Md = 600.
76
Dicho de otra forma: cuando se fueron ordenando uno por uno los datos nominales,
al contar el último correspondiente al valor x = 550, se llevaban hasta allí 33 datos
recolectados (ver tabla). Al continuar, el 34º (trigésimo cuarto) dato fue de valor x =
600, el 35º (trigésimo quinto) dato fue de valor x = 600, el 36º (trigésimo sexto)
dato fue de valor x = 600 , y así sucesivamente hasta el 45º (cuadragésimo quinto),
o sea 12 más
(que es la frecuencia del dato nominal x = 600 ) Eso significa que el 45º
(cuadragésimo quinto) dato correspondió al valor nominal x = 600.
santo tomas
Obsérvese que la mediana Md = 600 no es el que está situado a la mitad de la
columna de los datos nominales x.
77
Ejemplo 3: Localizar la mediana del conjunto de datos mostrado en la siguiente tabla
santo tomas
78
Solución:
Debe entenderse que la tabla original consta solamente de las dos primeras
columnas x y f. La que aparece a la izquierda es dicha tabla original a la que ya se
le añadió la columna de frecuencias
acumuladas.
La máxima frecuencia acumulada, que es lo mismo que el número total de datos
santo tomas
nominales, es de 574. Es decir, la tabla corresponde a 574 datos recolectados.
El valor central respecto de las frecuencias, no de los datos nominales x,
se obtiene sumando 1 al 574 y dividiéndolo entre dos, es decir,
que significa que tanto el dato ordinal 287 como el 288 (el que ocupa en orden el lugar
287 y el 288) son los que están situados a la mitad de todos. Observando la columna de las
frecuencias acumuladas se ve que dentro del conjunto de 112 datos recolectados con valor
nominal x = 48 , están los que ocupan el orden 287 y 288, de manera que en este caso no
hay conflicto para determinar la mediana y ésta es Md = 48. 79
Dicho de otra forma: cuando se fueron ordenando uno por uno los datos
recolectados, al contar el último dato nominal con valor x = 47,se llevaban en
ese momento 269 datos recolectados ordenados (ver tabla). Al continuar, el
270º (bicentésimo septuagésimo) dato fue de valor 48; el 271º (bicentésimo
septuagésimo primer) dato fue también de valor 48; el 272º (bicentésimo
septuagésimo segundo) dato fue también de valor 48, y así sucesivamente
hasta 112 más (Que es la frecuencia del dato nominal x= 48).
santo tomas
Eso significa que el 287º (bicentésimo octogésimo séptimo) dato, lo mismo que
el 288º (bicentésimo octogésimo octavo), correspondieron al valor nominal x =
48.
Obsérvese que la mediana Md = 48 no es el que está situado a la mitad de la
columna de los datos nominales x.
80
Ejemplo 4: Las edades de un grupo de 28 personas van de los 45 a los 58 años,
mostrado ya organizado en la siguiente tabla. Localizar la mediana de dicho
conjunto de datos.
santo tomas
81
Solución: Debe entenderse que la tabla original consta solamente de las dos
primeras columnas x (edades) y f .
La que aparece a la izquierda es dicha tabla original a la que ya se le
añadió la columna de frecuencias acumuladas.
La máxima frecuencia acumulada, que es lo mismo que el número total
de datos nominales, es de 28. Es decir, la tabla corresponde a 28 datos
recolectados.
El valor central respecto de las frecuencias, no de los datos nominales x , se obtiene
santo tomas
sumando 1 al número total de datos 28 y dividiéndolo entre dos, es decir,
dc
que significa que tanto el dato ordinal 14 (décimo cuarto) como el 15 (décimo quinto)
son los que están situados a la mitad de todos, ya que debe comprenderse que no existen
datos ordinales fraccionarios, sino solamente enteros, o sea, existe el 1er dato, el 2º dato,
el 3er dato, el 8º dato, el 19º dato, etc, pero no puede existir el 14.5º (el décimo cuarto
82
punto cinco) dato, si acaso el 14º (décimo cuarto) exactamente.
Observando la columna de las frecuencias acumuladas se ve que el 14º dato fue
el último correspondiente al dato nominal x = 49 , mientras que el 15º dato es el
primero que corresponde al dato nominal x = 50, por lo que se entra en el
conflicto de cuál de los dos ha de ser la mediana. En casos así, la media de ambos
se toma como la mediana,
es decir, la mediana es. Md = ( 49+50)/2 = 49.5.
santo tomas
83
Mediana en Gráficos.
Determinar la mediana a partir del siguiente gráfico:
N° Alumnos
6
5
4
santo tomas
3
2
1 Nota
1 2 3 4 5 6 7
Solución:
Para determinar el total de datos, debemos sumar las frecuencias. En este caso, el
total de datos es 16.
Posición:
n +1 = 16 + 1 8,5
2 2
Luego, los valores centrales están ubicados en las posiciones 8ª y 9ª. Ambos
corresponden a nota 4.
84
Por lo tanto, la mediana es 4.
C U E STI O NAR I O
1) ¿Qué es la mediana ?
2) ¿Cómo se simboliza la mediana ?
3) ¿Cuántas y cuáles columnas deben agregarse a la tabla original para localizar
santo tomas
la mediana en
una distribución de datos sin agrupar?
4) ¿Cuál es la confusión o error más frecuente que se tiene al intentar localizar
una mediana ?
5) ¿Puede haber más de una mediana en una distribución de frecuencias, así
como puede tener dos o más modas ?.
85
LA MODA
La moda, como su nombre lo indica, es el valor más común (de mayor frecuencia
dentro de una distribución. Una información puede tener una moda y se llama
unimodal, dos modas y se llama bimodal, o varias modas y llamarse multimodal.
Sin embargo puede ocurrir que la
información no posea moda.
santo tomas
86
santo tomas
87
La Moda Cuando los datos no están Agrupados en Intervalos
santo tomas
88
santo tomas
89
Ejemplos: De las dos tablas siguientes, localizar la moda de cada una de ellas.
santo tomas
90
santo tomas
91
santo tomas
92
santo tomas
93
Ejemplo:
santo tomas
3
1 Temperatura (º C)
8 10 12 15 18 21 25
94
santo tomas
CU E STIONARI O
1) ¿Qué es la moda ?
2) ¿Por qué una distribución de frecuencias puede tener más de una
moda y en cambio no puede
tener más que una media exactamente?
3) ¿Cómo se simboliza la moda?
4) ¿Cómo se obtiene la moda cuando los datos están organizados en
intervalos?
95
Medidas de Posición.
santo tomas
posición ya que, de todas maneras ocupan un
lugar dentro de la información.
Nos ocuparemos ahora de ciertos parámetros
posicionales muy útiles en la interpretación
porcentual de la información.
96
PERCENTILES. (Cuartiles, quintiles, deciles y centiles).
1.- CUARTILES
Las cuartillas o cuartiles son valores posicionales que dividen la información en
cuatro partes iguales, el primer cuartil deja el 25% de la información por debajo de
él, y el 75% por encima, el segundo cuartil, al igual que la mediana, divide la
información en dos partes iguales, y por último el tercer cuartil deja el 75% por
debajo de sí, y el 25% por encima.
Gráficamente:
santo tomas
97
santo tomas
= ------------ = ------ = 50
4 4 4
(2*100)/4 - 35
Q2= 400 + -------------------- X 100 Por lo tanto Q2 = Me
Deja 50% de los datos bajo, y 50%
33
Sobre él.
Li= 400
Fa(i-1)=35 Q2= 400 + 45,46 99
Q2= 445,46 Kg/Cm 2
fi= 33
A= 500-400=100 Q2= Md o (Me)
Calculemos ahora el tercer cuartil.(k=3 ; Q3).
santo tomas
El 75% de las baldosas posee una resistencia inferior a 538,88 Kg/Cm 2 y el 25%
Tiene una resistencia superior a ese dato.
100
Ejercicio:
Calcular los cuartiles Q1, Q2, y Q3 en la siguiente tabla de frecuencias:
santo tomas
101
Respuesta:
Frecuencia
Acumulada, fa
9
19 Q1
31 Q2
39
santo tomas
49 Q3
55
(k x n) (1 * 55)
-----= ----------- = 13,75
4 4
Q1= 4 + (13,75 – 9)
Cálculo de Q1
-------------- x 4 = 4 + 0,475 x 4 = 4 + 1,9
Li= 4 10
kxn/4)=13,75
fa(i-1)= 9 Q1= 5,9 102
fi= 10
A= 8-4= 4
El 25% de los datos es inferior a 5,9 y el 75% es Superior
Cálculo de Q2, k=2
k x n 2 x 55
------- = --------= 27,5
4 4
santo tomas
LI= 8
Kxn 27,5 - 19
------- = 27,5 Q2= 8 + ---------------- x 4
4
12
Fa (i-1)= 19
fi= 12
A= 12 -8 = 4 Q2= 8 + (8,5 / 12) x 4= 8 + 0,708 x4
santo tomas
LI= 16
Kxn (41,25 – 39)
------- = 41,25 Q3= 16 + ---------------- x 4 = 16 + (2,25/10)x 4
4
10
Fa (i-1)= 19
fi= 10
Q3 = 16 + 0,9 = 16,9
A= 20 -16= 4
104
Calcular Primer, segundo y tercer cuartil de la tabla siguiente:
Intervalo Frecuencia fi
16 - 22 9
23 - 29 26
30 - 36 11
37 43 3
santo tomas
44 - 50 4
51 - 57 2
n= 55
105
Solución
Intervalo Frecuencia fi Frecuencia Q
Acumulada, fa
16 - 22 9 9
23 - 29 26 35 Q1
y Q2
santo tomas
30 - 36 11 46 Q3
37 43 3 49
44 - 50 4 53
51 - 57 2 55
n= 55
Cálculo de Q1 k= 1
kxn 1 x 55
-------- = -------- = 13,75
Q1= 23 + (13,75 – 9)
4 4
-------------- x 7 = 23 + 0,183 x 7 = 23 + 1,28
106
26
A= 29-23+1=7 El 25% de los datos es inferior a 24,28
Q1= 24,28 y el 75% es superior.
Cálculo de Q2 k=2
kxn 2 x 55
-------- = -------- = 27,5
4 4
Q2= 23 + (27,5 – 9)
A=29-23+1=7
santo tomas
-------------- x 6 = 23 + 0,712 x 7 = 23 + 4,98
26
Cálculo de Q3 k=3
Q3= 30 + (41,25 – 35)
kxn 3 x 55 -------------- x 6 = 30 + 0,568 x 7 = 30 + 4,12
-------- = -------- = 41,25 11
4 4
Q3= 34,12.
107
El 75% de los datos es inferior a 34,12 y
El 25% es superior.
Rango entre Cuartiles.
santo tomas
108
2.- QUINTILES
santo tomas
109
Ejemplo:
santo tomas
Q2, Q3
Q4
kxn 2 x 100
-------- = ---------- = 40
5 5
Calculemos el segundo quintil Q2 k= 2
Q2= 400 + (40 – 35)
-------------- x 100 = 400 + 0,152 x 100 = 400 + 15,2= 415,2
110
33
Q2= 415,2 El 40% de las baldosas posee una resistencia menor a 415,2 y el 60%
superior a ese valor.
Calcule el tercer, y cuarto quintil para el ejemplo anterior.
santo tomas
Cálculo del Tercer quintil. Calculemos el segundo quintil Q3, k= 3
kxn 3 x 100
-------- = ---------- = 60 LI= 400
5 5
Q3= 400 + (60 – 35)
-------------- x 100 = 400 + 0,758 x 100 = 400 + 75,8= 475,8
33
Q3= 475,8 El 60% de las baldosas posee una resistencia menor a 475,8 y el 40%
superior a ese valor.
111
Cálculo del Cuarto quintil. Q4 k=4
kxn 4 x 100
Li= 500
santo tomas
-------- = ---------- = 80
5 5
El 80% de las baldosas posee una resistencia menor a 566,7 y el 20% superior a
ese valor.
112
3.- DECILES
santo tomas
113
4.- CENTILES
santo tomas
RESUMEN: En general para calcular cualquier percentil:
donde:
santo tomas
115
Cálculo de Percentiles en datos sin tabular o series numéricas.
En datos sin tabular:
• Primero se ordenan de menor a mayor los n datos.
• Calcular el valor A que marca la posición de percentil. A= (k x n) /(4, o 5, o 10,
o 100 según corresponda).
1. Si A es entero, entonces el percentil k corresponde al valor
Medio, (La suma de ambos dividida por 2), de las observaciones ubicadas en
santo tomas
las posiciones A y A+1.
2. Si A no es un entero, (Es un decimal), el percentil k corresponde a la
observación ubicada en la posición entera siguiente, es decir,
[A+1].
Ejemplos Percentiles:
• Determinar los percentiles 25 y 60 de los siguientes datos:
3, 5, 5, 8, 12, 15, 21, 23, 25, 26, 29, 35
• P25: A= 12 x 25 /100 = 3
Aquí, resulta un entero, por tanto el P25 corresponde al
promedio de las observaciones en las posiciones 3º y 4º, es
decir, P25= (5+8)/2 = 6.5
• P60: A = 12 x 60 / 100 = 7.2 116
En este caso A no es un entero, nos movemos al entero
siguiente. Es decir, P60 = 23 (observación en la 8ª posición).
CUESTIONARIO
santo tomas
117
santo tomas
Medidas de Dispersión
118
santo tomas
119
Medidas de Dispersión.
santo tomas
mediana que los valores de la serie de números 2: 49, 50,51; sin embargo, para la primera
información la media aritmética , se encuentra muy alejada de los valores extremos 5 y 95, cosa
que no ocurre con la segunda información que posee igual media aritmética y mediana, vemos
entonces que la primera información es mas heterogénea o dispersa que la segunda.
Para medir el grado de dispersión de una variable, se utilizan principalmente los siguientes
indicadores:
7.1 Rango o recorrido
7.2 Desviación media
7.3 Varianza y desviación típica o estándar
7.4 Coeficiente de variabilidad.
120
santo tomas
121
MEDIDAS DE DISPERSIÓN
Rango
santo tomas
Desviación Media
Varianza
Desviación estándar
Coeficiente de variación
122
RANGO O RECORRIDO.
Es la medida de dispersión mas sencilla ya que solo considera los dos valores
extremos de una colección de datos, sin embargo, su mayor utilización está en el
campo de la estadística no paramétrica.
R = Xmax – Xmin
santo tomas
En el ejemplo introductorio, vemos que el rango para la primera información es
R1=95-5=90,
123
Ejemplo.
Ante la pregunta sobre número de hijos por familia, una muestra de 12
hogares, marcó las siguientes respuestas:
2 1 2 4 1 3
2 3 2 0 5 1
santo tomas
Solución. Rango = 5 - 0 = 5
124
santo tomas
125
santo tomas
126
DESVIACIÓN MEDIA
La desviación media, mide la distancia absoluta promedio entre cada uno de los
datos, y el parámetro que caracteriza la información. Usualmente se considera la
desviación media con respecto a la media aritmética:
santo tomas
dispersión más usada es la desviación
media, también llamada con más precisión desviación media respecto a la media
aritmética. Se define ésta como la media aritmética de las diferencias absolutas,
entre los valores de la variable y la media aritmética de la muestra.
127
Hay que destacar la importancia de tomar valores absolutos de las desviaciones. Si
no se hiciese así unas desviaciones se anularían con otras, alcanzando finalmente la
desviación media un valor de 0.
∑ 1m │xi - Ẋ │
santo tomas
Ẋ =------------------------
n
128
santo tomas
Xi * fi
Xi*fi Ẋ=------------
50 n
153
2705
260 Ẋ=------------
50
477
648 Ẋ= 54,1
550
280 El promedio o media aritmética de
los sueldos es $54.100
171
129
116
2705
santo tomas
130
santo tomas
131
VARIANZA
El problema de los signos en la desviación media, es eludido tomando los valores
absolutos de las diferencias de los datos con respecto a la media aritmética. Ahora
bien, la varianza obvia los signos elevando las diferencias al cuadrado, lo cual resulta
ser más elegante, aparte de que
es supremamente útil en el ajuste de modelos estadísticos que generalmente conllevan
formas cuadráticas.
La varianza poblacional, es uno de los parámetros más importantes en estadística
santo tomas
paramétrica, se puede decir que, teniendo conocimiento de la varianza de una
población, se ha avanzado mucho en el conocimiento de la población misma.
Numéricamente definimos la varianza, como desviación cuadrática media de los datos
con respecto a la media aritmética:
En población Ẋ = µ y n= N
2 : Varianza
xi : Valor de la variable X
µ : Media aritmética de la información
fi : Frecuencia absoluta de la observación xi 132
N : Tamaño de la población.
m : Número de agrupamientos o intervalos
∑1m ( Xi - Xi )2
Varianza Muestral= S2 = -----------------------------
(n - 1)
2 : Varianza muestral
santo tomas
xi : Valor de la variable X
X : Media aritmética de la información de la muestra.
n: Tamaño de la muestra.
1 63 1,6 2,56
2 52 -9,4 88,36
santo tomas
3 78 16,6 275,56
4 49 -12,4 153,76
5 71 9,6 92,16
6 62 0,6 0,36
7 68 6,6 43,56
8 48 -13,4 179,56
9 56 -5,4 29,16
10 67 5,6 31,36
∑ 614 0 896,4
896,4
santo tomas
S = ----------- = 99,6 Kg2
2
10 - 1
Y su desviación estándar es:
S = √ 99,6 = 9,98 Kg
135
Varianza, en tablas de datos no agrupados, o distribución simple.
santo tomas
Población. (N).
La varianza muestral se representa por la letra S2.
La varianza poblacional se representa por la letra griega 2.
FORMULAS.
∑1m ( Xi - Xi )2 x fi
Varianza Muestral= S2 =-----------------------------
(n - 1)
∑1m ( Xi - µ )2 x fi
Varianza Poblacional = 2 = ------------------------------
N 136
Observación
Para N mayor que 30, no hay prácticamente diferencias entre usar N-1 y usar N.
La varianza siempre será mayor que cero. Mientras más se aproxima a cero, más
concentrados están los valores de la serie alrededor de la media. Por el contrario,
mientras mayor sea la varianza, más dispersos están.
Ejemplo
santo tomas
Solución 1.-
La primera de ellas sería no considerar que los datos se repiten, por lo que no
trabajamos en la frecuencia, fi en la fórmula, y ordenando los datos en el
orden de aparición, y no ascendente de menor a mayor.
137
Observaciones Xi Xi - Ẋ ( Xi - Ẋ )2
1 2 -0,167 0,0279
2 1 -1,167 1,3619
3 2 -0,167 0,0279
4 4 1,833 3,3560
5 1 -1,167 1,3619
6 3 0,833 0,6939
7 2 -0,167 0,0279
8 3 0,833 0,6939
santo tomas
9 2 -0,167 0,0279
10 0 -2,167 4,6959
11 5 2,833 8,0259
12 1 -1,167 1,3619
∑ 26 -0,004 21,6629
138
21,6629
S =-------------- = 1,9635
2
12 - 1
santo tomas
S = √ 1,9635 = 1,4012
139
SOLUCIÓN 2.
La segunda solución es considera los datos como una tabla de frecuencias simple, y
ordenar los datos considerando su frecuencia
Absoluta (fi).
∑1m ( Xi - Xi )2 x fi
Varianza Muestral= S2 =-----------------------------
(n - 1)
212413232051
santo tomas
Ordenamiento:
0 11 1 2 2 2 2 3 3 4 5
Variable, Xi Frecuencia, fi Xi * fi ( Xi - X) ( Xi - X)2 ( Xi - X)2 * fi
0 1 0 -2,167 4,696
4,696
1 3 3 -1,167 4,086
1,362
2 4 8 -0,167 0,112
0,028
3 2 6 0,833 1,388
0,694
4 1 4 1,833 3,360 3,360
140
5 1 5 2,833 8,026 8,026
∑ fi = n = 12 ∑ 26 ∑ 21,668
Cálculo de la Media Aritmética, X
∑ Xi * fi
26
Ẋ =--------------- =----------- = 2,167 = 2,17
n 12
santo tomas
Cálculo dela Varianza y Desviación Típica.
En este caso debe usarse (n-1), dado que n es menor que 30. 141
Si se usara sólo n, la Varianza seria 1,80.
Desviación estándar o Típica. (S O )
santo tomas
Luego: S=1,40.
142
santo tomas
143
Ejemplo de Varianza y desviación estándar de Tablas de frecuencia.:
a) Tabla frecuencias Simple:
santo tomas
∑2705
*∑xi*fi
Ẋ=-------------=54,1 144
n
Como los datos están expresados en miles de pesos y la varianza se encuentra en
forma cuadrática obtenemos una varianza de 3.210 pesos.
Sin embargo para una mejor comprensión debemos recurrir a la desviación típica
o estándar definida como la raíz cuadrada de la varianza:
santo tomas
145
b) Tabla de frecuencias agrupada en Intervalos de clase.
En este caso se utiliza la marca de clase Vi, para los cálculos.
En el caso delas baldosas:
santo tomas
300 - 400 350 21 7.350 - 98 201.684
146
X = ∑ Vi x fi = 44.800 = 448 Kg/ Cm 2
n 100
Cálculo de la desviación típica o estándar
S = √ S2 = √ ∑ ( Vi – X )2 x fi
santo tomas
n
147
COEFICIENTE DE VARIABILIDAD (CV)
santo tomas
148
EJERCICIOS DATOS AGRUPADOS EN INTERVALOS
Xi, Intervalos 0 -5 5 - 10 10 - 15 15 - 20 20 - 25 25 - 30
santo tomas
Fi, frecuencia 3 9 12 9 15 2
∑ (Vi – X)2 x fi
Desviación Típica muestral: S = √ --------------------------
n- 1
n tiende a infinito por lo que se puede usar n, en vez de (n -1), para datos
mayores que 30.
Cómo se trata de datos agrupados en intervalos, se utiliza Vi, en vez de Xi, tanto
para la Media, como para la desviación estándar.
149
X = ∑ Vi x fi =
n
Solución.
santo tomas
[0 – 5) 2,5 3 7,5 ( 2,5 – 15,5) =
-13 169 507
[5 – 10) 7,5 9 67,5 -8
64 576
[10 – 15) 12,5 12 150,0 -3
9 108
[15 – 20) 17,5 9 157,5 2
4 36
[20 – 25) 22,5 15 337,5 7
49 735
[25 - 30] 27,5 2 55,0 12
144 288
∑fi=n = 50 ∑ 775 ∑
∑ 2.250
775 150
X = ∑ Vi x fi = -----------= 15,5 X = 15,5
n 50
Desviación Típica muestral: S = √ ∑ (Vi – X)2 x fi
--------------------------
n- 1
santo tomas
=√-----------= √45,918 = 6,776 = 6,78
2.250
S
(50 -1)
Cómo n es mayor a 30, Si se divide por n=50 y no por n-1 igual a 49:
Se tiene s= 6,71. lo que implica un 1% de error entre ambas formas de
cálculo.
S 151
CV = -------- X 100 = ( 6,78 / 15,5 ) X100 = 43,74%
X
CUESTIONARIO
santo tomas
que posean diferente magnitud o diferente unidad de medida?
152