0% encontró este documento útil (0 votos)
72 vistas152 páginas

Medidas de Tendencia Central y Dispersión

Este documento presenta información sobre medidas de tendencia central y dispersión en estadística descriptiva. Explica cómo calcular la media aritmética para datos no agrupados y agrupados, incluyendo fórmulas y ejemplos numéricos. También define conceptos como variable, frecuencia absoluta y relativa, e introduce el cálculo de la media para datos agrupados usando la marca de clase. El objetivo es proporcionar una introducción a estas medidas estadísticas fundamentales para resumir conjuntos de datos.

Cargado por

KATHERIN
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPTX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
72 vistas152 páginas

Medidas de Tendencia Central y Dispersión

Este documento presenta información sobre medidas de tendencia central y dispersión en estadística descriptiva. Explica cómo calcular la media aritmética para datos no agrupados y agrupados, incluyendo fórmulas y ejemplos numéricos. También define conceptos como variable, frecuencia absoluta y relativa, e introduce el cálculo de la media para datos agrupados usando la marca de clase. El objetivo es proporcionar una introducción a estas medidas estadísticas fundamentales para resumir conjuntos de datos.

Cargado por

KATHERIN
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPTX, PDF, TXT o lee en línea desde Scribd

Instituto Santo Tomás

Técnico en Prevención de Riesgos

EST - 503

APUNTES
UNIDAD II
ESTADÍSTICA DESCRIPTIVA
2
“La percepción, sin comprobación ni fundamento, no es garantía suficiente de
verdad.”
Bertrand Russell (1872-1970)

Medidas de Tendencia Central


Y
Medidas de dispersión.

3
Después de haber aprendido en el capítulo anterior a construir tablas de
frecuencias y haber realizado alguna representación gráfica, el siguiente paso
para llevar a cabo un estudio preliminar de los datos recogidos es el cálculo de

santo tomas
diferentes magnitudes características de la distribución. Se definen entonces
diversas medidas que serán capaces de resumir toda la información recogida a
un pequeño número de valores. Estas medidas resumen van a permitir comparar
nuestra muestra con otras y dar una idea rápida de cómo se distribuyen los
datos. Es evidente que todas estas medidas solo pueden definirse para variables
cuantitativas.

4
santo tomas
5
MEDIDAS DE POSICIÓN O DE LOCALIZACIÓN

santo tomas
6
En la Unidad I, nos referimos a la clasificación, ordenación y
presentación de datos estadísticos, limitando el análisis de la
información a la interpretación porcentual de las distribuciones
de frecuencia.

El análisis estadístico propiamente dicho, parte de la búsqueda


de parámetros sobre los cuales pueda recaer la representación

santo tomas
de toda la información.

Las medidas de tendencia central, llamadas así porque


tienden a localizarse en el centro de la información, son de gran
importancia en el manejo de las técnicas estadísticas, sin
embargo, su interpretación no debe hacerse aisladamente de las
medidas de dispersión, ya que la representatibilidad de ellas está
asociada con el grado de concentración de la información.

7
MEDIDAS DE TENDENCIA CENTRAL

Entre las medidas características de una distribución destacan las


llamadas medidas de centralización, que nos indicarán el valor
promedio de los datos, o en torno a qué valor se distribuyen estos.

santo tomas
Media aritmética de datos no agrupados:

8
Recordemos que la Frecuencia relativa, fr, se obtiene por la fórmula siguiente:
fr = fi / n

Por lo tanto la Media se puede calculas con la siguiente expresión:

X=

Xi fi fr Xi * fi Xi * fr
1 6 0,30 6 0,30

santo tomas
2 7 0,35 14 0,70
3 4 0,20 12 0,60
4 2 0,10 8 0,40
5 1 0,05 5 0,25
Total 20 1,00 45 ∑ = 2,25

Aplicando la ecuación:

X=
45 / 20 = 2,25 O usando fr:
9

X= = 2,25
Ejercicio:
En un grupo de personas hemos preguntado por el número medio de días que
practican deporte a la semana. Las respuestas han sido las siguientes:
4 -2 -3- 1- 3 7 -1- 0 -3 -2
6- 2- 3 -3- 4 6- 3- 4- 3- 6

Xi= Variable. fi Frecuencia absoluta.


X=

santo tomas
N= Número de observaciones.

10
Resultado:

xi fi fr xi *fí xi *fr
0 1 0,05 0 0
1 2 0,1 2 0,1
2 3 0,15 6 0,3
3 7 0,35 21 1,05
4 3 0,15 12 0,6

santo tomas
6 3 0,15 18 0,9
7 1 0,05 7 0,35
         
20 1 66 3,3

Utilizando XI y fi :

X=

X = 66/ 20 = 3,3

Utilizando XI y frecuencia
relativa fr :

X = 3,3
X=
11
Ejercicio

Las notas obtenidas en un examen de matemáticas realizado en una clase de 4º


han sido las siguientes:
4- 5 -7- 5- 2 3- 7 -6 -4- 5

santo tomas
7- 5- 2- 4- 3 6 - 3 -6-3- 3

12
xi   fi fr fa fr% fa%
2   2 0,1 2 10 10
3   5 0,25 7 25 35
4   3 0,15 10 15 50
5   4 0,2 14 20 70
6   3 0,15 17 15 85
7   3 0,15 20 15 100
20 1   100  

santo tomas
xi   fi fr x i * fi xi * fr
2   2 0,1 4 0,2
3   5 0,25 15 0,75
4   3 0,15 12 0,6
5   4 0,2 20 1
6   3 0,15 18 0,9
7   3 0,15 21 1,05
20 1 90 4,5

Empleando la frecuencia absoluta fi: X=


X=90/
20 =
4,5
13
X=
Empleando la frecuencia relativa fr:

X = 4,5
Al preguntar a 20 familias sobre el número de días a la semana que van a
hacer la

compra, las respuestas han sido las siguientes:

1- 2 -2 -4- 6 1-6-1-2-3

santo tomas
5- 2- 6 -3 -1 4-1-6-1-2

xi fi
1 6
2 5
3 2
4 2
5 1
6 4
20

Calcula la Media aritmética usando fi y fr. 14


xi fi fr xi * fi xi * fr
1 6 0,3 6 0,3
2 5 0,25 10 0,5
3 2 0,1 6 0,3
4 2 0,1 8 0,4
5 1 0,05 5 0,25

santo tomas
6 4 0,2 24 1,2
20   59 2,95

Utilizando frecuencia absoluta fi: X=

X = 59 / 20 = 2,95

Utilizando la frecuencia relativa fr:

X = 2,95
15
X=
PREGUNTA:

santo tomas
16
A la tabla de frecuencias de datos no agrupados, que posee las

santo tomas
columnas la variable x, frecuencia absoluta fi, frecuencia relativa
fr, frecuencia acumulada fa, para calcular la media se le deben
agregar dos columnas, una para el producto de xi x fi y otra para el
producto entre xi x fr, si se desea comprobar el resultado.

17
MEDIA ARITMÉTICA PARA DATOS AGRUPADOS.

La Media al igual para los datos no agrupados se define como el promedio de los
datos.
Vamos a utilizar el concepto ya aprendido de Marca de Clase o punto medio de un
intervalo. (Vi).
Como ya se explicó la Marca de Clase o punto medio de un Intervalo de clase viene

santo tomas
dado por la siguiente expresión:

Marca de Clase (Vi) = (Límite Superior + Límite Inferior) / 2.


Luego la fórmula para calcular la Media en una tabla de datos agrupados viene dada
por la expresión siguiente:

Y como fr = fi / n
X=
Reemplazando se obtiene:
n
X=
Los elementos en esta fórmula son:
n= tamaño de la muestra.
18
Vi = Marca de clase o punto medio del intervalo i
fi = Frecuencia absoluta de intervalo i
fr= Frecuencia relativa.
Ejemplo:
Cálculo de la Media usando Vi,fi

Intervalo de Marca de Clase, Frecuencia, fi Vi * fi


Clase Vi
16 22 19 9 19*9= 171

23 29 26 26 676

30 36 33 11 363

santo tomas
37 43 40 3 120

44 50 47 4 188

51 57 54 2 108

∑ fi= 55 ∑ = 1626

X= 1.626
-------------------- = ------------------ = 29,6 años
n 55

19
Cálculo de la Media, usando, Vi, fr

Intervalo Marca Clase Frecuencia fi Frecuencia Vi x fi Vi x fr


V* Relativa fr

16 - 22 19 9 0,1636 171 3,1084


23 - 29 26 26 0,4727 676 12,2902

santo tomas
30 - 36 33 11 0,2000 363 6,6000
37 43 40 3 0,0546 120 2,1840
44 - 50 47 4 0,0727 188 3,4169
51 - 57 54 2 0,0364 108 1,9656
55 1,0000 29,565

X = 29, 6 X=

20
Ejercicio: Calcular la media X usando Vi, fi y fr

Intervalos Frecuencia, fi
0-2 12
3-5 13

santo tomas
6-8 23
9 - 11 16
12 - 14 18

n = 82

21
EJEMPLO, Calcular la Media.
Intervalos Marca de clase, Vi Frecuencia Vi x fi
Absoluta, fi
0-2 1 12 12

3-5 4 13 52

6-8 7 23 161

santo tomas
9 - 11 10 16 160

12 - 14 13 18 234

∑ fi = n = 82 ∑ = 619

∑i n Vi x fi
X = ------------------
n

619
X =-------------- = 7,548
82 22
EJEMPLO. Calcular la Media.

santo tomas
23
Vi
fi x Vi
18
60
120
112
180

santo tomas
132
n =55 622

∑i n Vi x fi
X = ------------------
n

622 = 11,31
X =----------
55

24
Utilizar la tabla de frecuencias siguiente para calcular la altura media de 100
estudiantes:

Altura, in Frecuencia
fi
60 - 62 5

santo tomas
63 - 65 18
66 - 68 42
69 - 71 27
72 - 74 8
n=

25
Altura, in Frecuencia Marca de fi x Vi
fi clase Vi
60 - 62 5 61 305

santo tomas
63 - 65 18 64 1152
66 - 68 42 67 2814
69 - 71 27 70 1890
72 - 74 8 73 584
n = 100 ∑ 6.745

∑ fi x Vi* 6.745
X= =---------- = 67,45
n 100

La altura media de los estudiantes es de 67,45 inch (171,3 cm) 26


PREGUNTA:

santo tomas
27
RESPUESTA:

santo tomas
28
Media Gráficos.

Determinar la media aritmética a partir del siguiente gráfico:


N° Alumnos

6
5
4
3

santo tomas
2
1 Nota
1 2 3 4 5 6 7

Solución:
Para determinar el total de datos, debemos sumar las frecuencias. En este caso, el total
de datos es 16.

Para determinar la media aritmética, debemos multiplicar cada dato por su


frecuencia, sumar estas cantidades y el resultado dividirlo por el total de datos (n).
Por lo tanto:

29
N° Alumnos

6
5
4
3
2
1 Nota
1 2 3 4 5 6 7

santo tomas
x = 1·1 + 2·2 + 3·1 + 4·5 + 5·3 + 6·2 + 7·2
16

x = 1 + 4 + 3 + 20 + 15 + 12 + 14
16
x = 69
16

x ≈ 4,3
30
Media geométrica
La media geométrica de una cantidad finita de números (digamos n números) es la raíz n-ésima del
producto de todos los números.

santo tomas
Por ejemplo, la media geométrica de 2 y 18 es

Otro ejemplo, la media de 1, 3 y 9 seria

Sólo es relevante la media geométrica si todos los números son positivos.


Si uno de ellos es 0, entonces el resultado es 0.
Si hay un número negativo (o una cantidad impar de ellos) entonces la media geométrica es, o
bien negativa o bien inexistente en los números reales. 31
En muchas ocasiones se utiliza su trasformación en el manejo estadístico de variables con
distribución no normal.
Media armónica
La media armónica , representada por H, de una cantidad finita de números es igual al recíproco, o
inverso, de la media aritmética de los recíprocos de dichos números
Así, dados los números a1,a2, ... , an, la media armónica será igual a:

santo tomas
La media armónica resulta poco influida por la existencia de determinados valores mucho más grandes
que el conjunto de los otros, siendo en cambio sensible a valores mucho más pequeños que el conjunto.
La media armónica no está definida en el caso de la existencia en el conjunto de valores nulos.

32
Ejemplo
Supóngase que una familia realiza un viaje en automóvil a un
ciudad y cubre los primeros 100 km a 60 km/h, los siguientes
100 km a 70 km/h y los últimos 100 km a 80 km/h. Calcular, en
esas condiciones, la velocidad media realizada.

santo tomas
33
Media cuadrática
La media cuadrática es igual a la raíz cuadrada de la suma de los cuadrados de los valores dividida entre
el número de datos:

santo tomas
Esta media como medida de asociación tiene aplicaciones tanto en ciencias biológicas como en
medicina.
A veces la variable toma valores positivos y negativos, como ocurre, por ejemplo, en los errores de
medida.
En tal caso se puede estar interesado en obtener un promedio que no recoja los efectos del signo.
Este problema se resuelve, mediante la denominada media cuadrática.
Consiste en elevar al cuadrado todas las observaciones (así los signos negativos desaparecen), en
obtener después su media aritmética y en extraer, finalmente, la raíz cuadrada de dicha media para
volver a la unidad de medida original.

34
Media cuadrática

2, 5, 5, 20, 20, 30, 30, 30, 14, 50

Xi X2i
2 4
5 25
5 25
20 400
20 400
30 900
30 900
30 900
14 196
50 2500
Media ponderada
Se denomina media ponderada de un conjunto de números al resultado de multiplicar cada uno de los
o: números por un valor particular para cada uno de ellos, llamado su peso, obteniendo a continuación la
suma de estos productos, y dividiéndo el resultado por la suma de los pesos.
Este "peso" depende de la importancia o significancia de cada uno de los valores.
Para una serie de datos
X = { x1, x2, ..., xn}
a la que corresponden los pesos
W = { w1, w2, ..., wn}
la media ponderada se calcula como:

santo tomas
Un ejemplo es la obtención de la media ponderada de las notas de una oposición en la que se asigna distinta importancia
(peso) a cada una de las pruebas de que consta el examen.

36
Ejemplo:
Si la asignatura A tiene un valor de 2 créditos y la asignatura B tiene un
valor de 3 créditos. Entonces, para un estudiante que haya obtenido una
calificación de 4 en la asignatura A y de 5 en la asignatura B, la nota
promedio ponderado está dada por:

santo tomas
37
Ejemplo Media Ponderada.

Una formulación con 4 ingredientes x1,x2, x3,x4


Ponderación en la formula
x1 10Kg 25%
x2 15 10%
x3 25 15%
x4 30 50%
80Kg
Calcular la Media Ponderada

santo tomas
X= X1 x 0,25 + X2 x 0,10 + X3 x 0,15 + X4 x 0,50

0,25 + 0,10 + 0,15 +0,50

X= 10 x 0,25 + 15 x 0,10 + 25 x 0,15 + 30 x 0,50

0,25 + 0,10 + 0,15 +0,50


X= 22,75

Media aritmética.
X= 80/4
X= 20 Kg

38
Ejemplo Media Ponderada.

Un estudiante al final del semestre tiene las siguientes notas en Estadísticas, en cada una de las tres Unidades que
tiene el ramo. Con su respectiva ponderación.
Calcule la Media ponderada de notas que tiene el estudiante
para presentarse a exámen.

Unidad Ponderación Notas


I 25% 4,0
II 25% 4,5
III 50% 5,0
100%

santo tomas
X =X1*w1+x2*w2+x3*w3
w1+w2+w3
X=4,0*0,25+4,5*0,25+5*0,5
0,25+0,25+0,50

X= 4,625
1
X= 4,63

39
Ejercicio 1:

Cantidad de cigarrillos consumida por un fumador en una semana


Día N° de Cigarrillos
Lunes 18
Martes 21
Miércoles 22

santo tomas
Jueves 21
Viernes 20
Sábados 19
Domingo 19

Entonces la Media Aritmética es:

x1 + x2 +x3 +x4 +x5 +x6+x7 = ∑i n Xi


X =-------------------------------------------= -----------
n n
40
18+21+22+21+20+19+19
X =--------------------------------------= 20 Cigarrillos/día
7
Cuando la variable está agrupada en una distribución de frecuencias simple, la
Media aritmética se calcula por la fórmula:

Cantidad Cigarrillos por día, Xi Frecuencia Absoluta, fi

18 1

19 2

santo tomas
20 1

21 2

22 1

∑fi = 7

x1 * f1 + x2 *f2 + x3 *f3 + x4 *f4+…+xn *fn


X =-------------------------------------------------------------= …∑i n xi * fi
n n
18 *1+19*2+20*1+21*2+22*1
X=---------------------------------------------= 20 cigarrillos /día 41
7
Ejercicio 2.

Cálculo de la Media Aritmética con frecuencia simple o dato no agrupados


en Intervalos.
Salario de 50 Operarias

Miles $ /día, Xi Frecuencia, fi Xi * fi

santo tomas
50 1 50
51 3 153
52 5 260
53 9 477
54 12 648
55 10 550
56 5 280
57 3 171
58 2 116
∑fi = 50 ∑ xi*fi = 2.705

∑1 9 xi * fi 2705
X=--------------- =---------------- = 54,100 $/día *1000= 54.100 42
n 50
Ejemplo de Media aritmética en datos agrupados en Intervalos de Clase.
En este caso se toman como datos de la variable en estudio la Marca de clase
O punto medio del Intervalo de clase Vi.

Cálculo de la Media Aritmética de la resistencia al rompimiento de 100


baldosas.
Resistencia Kg/cm2 Marca de clase, Frecuencia, fi Vi * fi
Vi

santo tomas
100 ≤ X ˂ 200 150 4 600

200 ≤ X ˂ 300 250 10 2500

300 ≤ X ˂ 400 350 21 7350

400 ≤ X ˂ 500 450 33 14.850

500 ≤ X ˂ 600 550 18 9.900

600 ≤ X ˂ 700 650 9 5.850

700 ≤ X ˂ 800 750 5 3.750

∑fi= 100 ∑ 44.800

43
∑1 7 xi * fi 44.800
X=--------------- =---------------- = 448 Kg/Cm2
n 100

La Resistencia promedio de las baldosas es 448 Kg/Cm 2

santo tomas
44
LA MEDIA COMO PUNTO DE EQUILIBRIO

santo tomas
45
La mediana
La mediana de un conjunto de números ordenados en magnitud es el valor o
dato central, o la media de los dos valores centrales.
La MEDIANA. (Md)

Otra medida de tendencia central, utilizada en estadísticas, es la Mediana, la cuál no se basa en


la magnitud de los datos, como la Media Aritmética, sino en la posición central que ocupa en el
orden de su magnitud, dividiendo la información en dos partes iguales, dejando igual número de
datos por encima y por debajo de ella.

Es la puntuación central de una serie de datos ordenados. Es la puntuación que deja por debajo
el 50% de los datos, y por encima el otro 50%. Es el dato que queda en el centro de la

santo tomas
distribución cuando los datos son ordenados de menor a mayor.

Mediana de una serie de datos con Número de observaciones N, Impar y Par .


1.- Caso serie de datos con N, Impar:

Cálculo:
1° Se calcula la posición de la Mediana: Posición (N + 1) / 2.

2° Se busca el valor que ocupa dicha posición. (Md)

Ejemplo:
Serie: 3, 3, 5, 5, 7, 7, 7 Posición (N + 1) / 2 = ( 7 + 1) / 2 = 4
47

Posición: cuarto N° Md=5


Serie: 3, 3, 5, 5, 7, 7, 7
2.- CASO DE SERIE DE DATOS CON N PAR.

En el caso de una serie de datos con número par de datos, se calcula la


posición, y después se realiza la semisuma de las dos posiciones más próximas
al centro.
Ejemplo:
Serie par de datos:
3, 3, 5, 5, 7, 7, 7, 8 Posición: (N + 1) / 2 = (8 + 1) / 2 = 4,5

santo tomas
Md = ( 5 + 7) / 2 = 12 / 2 Md= 6

Donde:
Md = Mediana

48
CASO EN QUE LOS DATOS ESTÁN AGRUPADOS EN DISTRIBUCIÓN DE FRECUENCIAS
EN INTERVALOS O CLASES.
Método 1: Usando N/2, y la Frecuencia Acumulada, fa.

Cuando los datos están agrupados en una distribución de frecuencias, se utiliza la siguiente
fórmula:

Md = Li + [ (N / 2 - fai ) / fi ] * A

santo tomas
Donde:
Md = Mediana

Li = Límite inferior del intervalo dónde caiga la Mediana. Con frecuencia absoluta
mayor a N/ 2.

N= Número total de observaciones.

fai =Frecuencia acumulada del intervalo anterior al intervalo dónde cae la


Mediana.

fi: Frecuencia absoluta del intervalo en el que cae la Mediana.


49
A= Amplitud o tamaño del intervalo en que cae la Mediana.
Ejemplo:
Sea la siguiente tabla de datos agrupados en Intervalos de clase:
Intervalos fi fa
100 - 106 12 12
107 - 113 21 33
*114 - 120 23 56
121 - 127 17 73
128 - 134 12 85

santo tomas
∑fi =N= 85

Md = Li + [ (N / 2 - fai ) / fi ] * A
1° Se calcula la posición; Posición= N/ 2 = 85 / 2 = 42,5
2° Se busca en la columna de la frecuencia acumulada, la posición 42,5 para determinar el Intervalo
en que cae la Mediana. Dicha posición cae en el tercer Intervalo con Límites 114 - 120. Dicho
intervalo contiene los datos desde el dato 34 al dato 56, y se desea ubicar el dato 42,5.

Luego Li= 114 fi= 23 fai= 33 y

A3 = Amplitud del Intervalo de la Mediana (Md).


A3= Ls3 – Li3 + 1 = 120 – 114 + 1 = 7 A3= 7 (Se suma 1 por que al construir el Intervalo a la
Amplitud se le quitó 1 unidad con la finalidad de que no coincidieran los límites Superior e
inferior). Cuando coinciden los límites no es necesario sumarle 1).

50
Luego Md = 114 + [ (42,5 – 33) / 23 ] * 7 = 116,89 Md = 116,89
Ejemplo: Calcular la Mediana de la tabla de datos agrupados:
Intervalo Marca Clase Frecuencia fi
Vi
16 - 22 19 9
23 - 29 26 26
30 - 36 33 11
37 43 40 3

santo tomas
44 - 50 47 4
51 - 57 54 2
55

Cuando los datos están agrupados en una distribución de frecuencias


En Intervalos se utiliza la fórmula siguiente:

Md = Li + [ (N / 2 - fai ) / fi ] * A

51
Donde:
Md = Mediana

Li = Límite inferior del intervalo dónde caiga la Mediana. Con frecuencia absoluta
mayor a N/ 2.

santo tomas
N= Número total de observaciones.

fai =Frecuencia acumulada del intervalo anterior al intervalo dónde cae la


Mediana.

fi: Frecuencia absoluta del intervalo en el que cae la Mediana.

A= Amplitud o tamaño del intervalo en que cae la Mediana.

52
Solución:
Intervalo Marca Clase Frecuencia fi fa
X*

16 - 22 19 9 9
*23 - 29 26 26 35

santo tomas
30 - 36 33 11 46
37 43 40 3 49
44 - 50 47 4 53
51 - 57 54 2 55
55

N 55
= = 27,5
1.- Se calcula la posición:
2 2

53
2.- El intervalo es el 23 – 29 Li= 23
A= 29 – 23 + 1 = 7

Fai= Frecuencia acumulada anterior del intervalo en que cae la Mediana.=9

Fi = frecuencia absoluta del intervalo en que cae la Mediana = 26

santo tomas
Md = Li + [ (N / 2 - fai ) / fi ] * A

18,5
27,5 - 9
Md= 23+ ( ---------------------) *7 = 23 + (--------------- )* 7=
26 26

Md= 23 + 0,712 * 7 = 23 + 4,98 = 27,98


54

Md= 27,98
Ejemplo:
Utilizar la tabla de frecuencias siguiente para calcular la Mediana de dela tabla de
100 estudiantes:
Altura, in Frecuencia
fi
60 - 62 5

santo tomas
63 - 65 18
66 - 68 42
69 - 71 27
72 - 74 8
n =100

Md = Li + [ (N / 2 - fai ) / fi ] * A

55
Donde:
Md = Mediana

Li = Límite inferior del intervalo dónde caiga la Mediana. Con frecuencia absoluta
mayor a N/ 2.

santo tomas
N= Número total de observaciones.

fai =Frecuencia acumulada del intervalo anterior al intervalo dónde cae la


Mediana.

fi: Frecuencia absoluta del intervalo en el que cae la Mediana.

A= Amplitud o tamaño del intervalo en que cae la Mediana.

56
Solución:
Altura, in Frecuencia Frecuencia
fi fa
60 - 62 5 5
63 - 65 18 23
*66 - 68 42 65 Md= 67,43

santo tomas
69 - 71 27 92
72 - 74 8 100
n =100

N 100
1.- Se calcula la posición: ------- = ------ = 50
2 2

2.- El intervalo es el 66 – 68 Li= 66

A= 68– 66 + 1 = 3
57

Fai= 23 Frecuencia acumulada anterior del intervalo en que cae la Mediana.


Fi = frecuencia absoluta del intervalo en que cae la Mediana = 42

Md = Li + [ (N / 2 - fai ) / fi ] * A

santo tomas
50 - 23
Md= 66+ ( ---------------------) *3 = 66 + 27/ 42 * 3= 66 + 0,643 * 3=
42

Md= 66 + 1,929= 67,929

Md= 67,93

58
EJEMPLO. Calcular la Mediana.

santo tomas
Md = Li + [ (N / 2 - fai ) / fi ] * A

59
Intervalo Frecuencia fi Frecuencia
acumulada fa
0-4 9 9
4-8 10 19
*8 - 12 12 31
12 - 16 8 39
16 - 20 10 49

santo tomas
20 - 24 6 55
n = 55

1.- Calcular la posición mediante n/ 2= 55/2= 27,5.

2.- Ubicar el intervalo de la Mediana, con el dato de posición n/2= 27,5.


Se realiza la ubicación mediante la revisión de los datos de la columna de
la frecuencia acumulada, comparándola con 27,5.
La Md no se encuentra en el primer intervalo, pues su frecuencia fa, es 9.
Tampoco se ubica en el segundo pues su frecuencia acumulada es 19.
Se ubica en el tercero pues 27,5 se encuentra entre19 y 31. 60
3.- Se trabaja ubicando o calculado los datos según la formula de Me.

A= Ls – Li
n/2 - fai
Md = Li + x A= A = 12 – 8

santo tomas
fi A=4

27,5 – 19,0
Md = 8 + x4=
12

Md = 8 + 0,708 x 4 =
Md = 8 + 2,83 = 10,83
Md = 10,83.

61
Método 2: Cálculo de la Mediana usando la Frecuencia Relativa acumulada, fra
(c).
Otra forma de cálculo de la Mediana de datos agrupados en Intervalos o Clases..

También puede calcularse la Mediana Me, utilizando la frecuencia relativa fr


y la frecuencia relativa acumulada fra.

Paso 1. Clase de la Mediana Md.

santo tomas
Cómo tratamos de encontrar un número tal que la mitad de las observaciones
sean mayores o iguales, y la otra mitad, sean menores o iguales que dicho
número, la Mediana Md, debe estar en una clase tal que la frecuencia
relativa acumulada fra hasta la clase que la precede inmediatamente sea
menor que 0,5, y la frecuencia relativa acumulada fra, hasta la clase que buscamos
sea mayor o igual a 0,5. A esta clase la llamaremos la clase de la Mediana, Md.
Paso 2. Calcúlese la Mediana mediante la fórmula:

(b – a)(0,5 – c)
Md = a + -----------------------
Dónde; d
a: Límite inferior de la clase de la mediana.
b: Límite superior de la clase de la mediana.
c: Frecuencia relativa acumulada hasta la clase que precede a la de la 62
mediana.
d: Frecuencia relativa de la clase de la mediana.
Ejemplo:

Intervalo Frecuencia fi Frecuencia Frecuencia


relativa fr acumulada
fra
20,5 – 25,5 3 0,03614 0,03614

santo tomas
25,5 – 30,5 42 0,50602 0,54216
30,5 -35,5 21 0,25301 0,79517
35,5 – 40,5 7 0,08434 0,87951
40,5 – 45,5 3 0,03614 0,91565
45,5 – 50,5 2 0,02410 0,93975
50,5 – 55,5 2 0,02410 0,96385
55,5 – 60,5 2 0,02410 0,98795
60,5 – 65,5 1 0,01205 1,00000

63
Paso 1. Clase de la Mediana Me.
La frecuencia relativa acumulada fra, de la clase que la precede debe ser
menor a 0,5. ( fra = 0,0364 primer intervalo), y la frecuencia de la clase que
buscamos, o clase de la mediana debe ser mayor o igual a 0,5. Por lo tanto
el segundo intervalo 25,5 – 30,5 con fra de 0,54216, cumple con esta condición,
Siendo la clase de la mediana Me.

Luego aplicando la fórmula:

santo tomas
(b – a)(0,5 – c)
Me = a + -----------------------
d

Dónde;
a: Límite inferior de la clase de la mediana.(25,5)
b: Límite superior de la clase de la mediana. (30,5)
c: Frecuencia relativa acumulada hasta la clase que precede a la de la
mediana. (0,03614).
d: Frecuencia relativa de la clase de la mediana.(0,50602).

64
Luego:
a: 25,5
b: 30,5
c: 0,03614
d: 0,50602

(b – a)(0,5 – c)

santo tomas
Me = a + -----------------------
d

(30,5 – 25,5)(0,5 – 0,03614)


Me = 25,5 + ---------------------------------------
0,50602

Me = 30,0834

65
Ejemplo: Calcular la Mediana, Me por el método de la frecuencia relativa acumulada:

Intervalos fi
100 - 106 12
107 - 113 21
114 - 120 23
121 - 127 17

santo tomas
128 - 134 12

(b – a)(0,5 – c)
Me = a + -----------------------
d
Dónde;
a: Límite inferior de la clase de la mediana.
b: Límite superior de la clase de la mediana.
c: Frecuencia relativa acumulada hasta la clase
que precede a la de la
mediana.
d: Frecuencia relativa de la clase de la
66
mediana.
Intervalos fi fr fra
100 - 106 12 0,1412 0,1412
107 - 113 21 0,2471 0,3883
*114 – 120 23 0,2706 0,6589
121 - 127 17 0,2000 0,8589
128 - 134 12 0,1411 1,0000

santo tomas
n=85

(b – a)(0,5 – c)
Me = a + -----------------------
d
Dónde;
a: Límite inferior de la clase de la mediana. (114)
b: Límite superior de la clase de la mediana. (120)
c: Frecuencia relativa acumulada hasta la clase que precede a la de la
mediana. (0,3883)
d: Frecuencia relativa de la clase de la mediana. (0,2706)

67
(120 – 114)(0,5 – 0,3883)
Me = 114 + --------------------------------------
0,2706

(6)(0,1117) 0,6702
Me = 114 + -------------------- =
0,2706 0,2706

santo tomas
Me = 114 + 2,4767

Me = 116,48

68
Ejemplo. Calcular la Mediana Me, por el método de la frecuencia relativa acumulada

Intervalo Frecuencia fi

16 - 22 9
23 - 29 26
30 - 36 11
37 43 3

santo tomas
44 - 50 4
51 - 57 2
55

(b – a)(0,5 – c)
Me = a + -----------------------
d
Dónde;
a: Límite inferior de la clase de la mediana.
b: Límite superior de la clase de la mediana.
c: Frecuencia relativa acumulada hasta la clase que precede a la de la
69
mediana.
d: Frecuencia relativa de la clase de la mediana. (
Intervalo Frecuencia fi fr fra
16 - 22 9 0,1636 0,1636

*23 - 29 26 0,4727 0,6363

30 - 36 11 0,2000 0,8363

37 43 3 0,0546 0,8909

44 - 50 4 0,0727 0,9636

51 - 57 2 0,0364 1,0000

santo tomas
n=55

(b – a)(0,5 – c)
Md = a + -----------------------
d
Dónde;
a: Límite inferior de la clase de la mediana. (23)
b: Límite superior de la clase de la mediana. (29)
c: Frecuencia relativa acumulada hasta la clase que precede a la de la
mediana. (0,1636))
d: Frecuencia relativa de la clase de la mediana. (0,4727)
70
(b – a)(0,5 – c)
Md = a + -----------------------
d

(29 – 23)(0,5 – 0,1636)


Md = 23 + --------------------------------
0,4727
(6)(0,3364) 2,0184
Md = 23 + --------------------------------=

santo tomas
0,4727 0,4727

Md = 23 + 4,27=

Md = 27,27

71
CASO DE CÁLCULO DE LA MEDIANA EN UNA TABLA DISTRIBUCIÓN
DE FRECUENCIAS SIMPLES (O datos no agrupados).
Cuando los datos recolectados han sido organizados en una tabla de frecuencias
simples, la mediana se obtiene buscando en la columna de frecuencias acumuladas
el valor que esté situado exactamente a la mitad, conforme a la fórmula anterior.

Para facilitar la localización de la mediana en una tabla, conviene agregarle una

santo tomas
columna en la que se anoten las frecuencias acumuladas fa. Entonces, el número
total de datos recolectados N , (n) más
uno, dividido entre dos da el dato central dc :

n+1
dc = -----------
2

Ese resultado se busca en la columna de las frecuencias acumuladas f a y al dato


nominal que le corresponda, es la mediana.Md

72
Ejemplo 1: Localizar la mediana del conjunto de calificaciones mostrado en la
siguiente tabla.
Solución: A la tabla original xi, fi se le añadió la columna de frecuencias
acumuladas fa :
n+1
dc = -----------
2

santo tomas
n= 117
117 +1
dc = -----------
2

dc= 59

Md
Me= 8
73
La máxima frecuencia acumulada, que es lo mismo que el número
total de datos nominales, es de 117. Es decir, la tabla corresponde
a las calificaciones de 117 alumnos.
El dato central respecto de los valores nominales es el valor nominal
5 (ver tabla de la derecha). Ese no es la mediana.
El valor central respecto de las frecuencias, no de los datos nominales
x, se obtiene sumando 1 al 117 y dividiéndolo entre dos, es decir,

santo tomas
que significa que el dato ordinal 59, el quincuagésimo noveno, es el que está
situado a la mitad de todos. Observando la columna de las frecuencias
acumuladas se ve que hasta la calificación 7, contadas desde el principio, van
apenas 49 alumnos, mientras que hasta la calificación 8 ya van 74. Esto significa
que dentro de la calificación 8 está el alumno número 59, que es el central. Por
lo tanto, la mediana es Md = 8.

74
El error más común que se comete a la hora de intentar localizar la mediana es
buscar el dato nominal x central en vez del dato ordinal, o sea, el error consiste
en buscar en la columna de los datos
nominales x el que está a la mitad y eso no es.

Ejemplo 2: Localizar la mediana del conjunto de datos mostrado en la


siguiente tabla.

santo tomas
75
Solución: La tabla de la derecha es la tabla original a la que ya se le añadió la
columna de frecuencias acumuladas.
La máxima frecuencia acumulada, que es lo mismo que el número total
de datos nominales, es de 89. Es decir, la tabla corresponde a 89 datos
recolectados.
Los datos centrales respecto de los valores nominales, o sea desde la
tabla, son los valores nominales 800 y 900 (ver tabla de la derecha). Esos no son la
Mediana.

santo tomas
El valor central respecto de las frecuencias, no de los datos nominales x, se obtiene
sumando 1 al 89 y dividiéndolo entre dos, es decir,

que significa que el dato ordinal 45 (el que ocupa el lugar 45) es el que está situado a la mitad
de todos, o sea, hay 44 antes y 44 después de él. Observando la columna de las frecuencias
acumuladas se ve que hasta el dato nominal x = 600 , contados desde el principio, van 45
datos recolectados. Esto significa que de los 12 datos nominales x = 600 , justamente el
último de ellos ocupa el orden 45, que es el central. Por lo tanto, la mediana es Md = 600.

76
Dicho de otra forma: cuando se fueron ordenando uno por uno los datos nominales,
al contar el último correspondiente al valor x = 550, se llevaban hasta allí 33 datos
recolectados (ver tabla). Al continuar, el 34º (trigésimo cuarto) dato fue de valor x =
600, el 35º (trigésimo quinto) dato fue de valor x = 600, el 36º (trigésimo sexto)
dato fue de valor x = 600 , y así sucesivamente hasta el 45º (cuadragésimo quinto),
o sea 12 más
(que es la frecuencia del dato nominal x = 600 ) Eso significa que el 45º
(cuadragésimo quinto) dato correspondió al valor nominal x = 600.

santo tomas
Obsérvese que la mediana Md = 600 no es el que está situado a la mitad de la
columna de los datos nominales x.

77
Ejemplo 3: Localizar la mediana del conjunto de datos mostrado en la siguiente tabla

santo tomas
78
Solución:
Debe entenderse que la tabla original consta solamente de las dos primeras
columnas x y f. La que aparece a la izquierda es dicha tabla original a la que ya se
le añadió la columna de frecuencias
acumuladas.
La máxima frecuencia acumulada, que es lo mismo que el número total de datos

santo tomas
nominales, es de 574. Es decir, la tabla corresponde a 574 datos recolectados.
El valor central respecto de las frecuencias, no de los datos nominales x,
se obtiene sumando 1 al 574 y dividiéndolo entre dos, es decir,

que significa que tanto el dato ordinal 287 como el 288 (el que ocupa en orden el lugar
287 y el 288) son los que están situados a la mitad de todos. Observando la columna de las
frecuencias acumuladas se ve que dentro del conjunto de 112 datos recolectados con valor
nominal x = 48 , están los que ocupan el orden 287 y 288, de manera que en este caso no
hay conflicto para determinar la mediana y ésta es Md = 48. 79
Dicho de otra forma: cuando se fueron ordenando uno por uno los datos
recolectados, al contar el último dato nominal con valor x = 47,se llevaban en
ese momento 269 datos recolectados ordenados (ver tabla). Al continuar, el
270º (bicentésimo septuagésimo) dato fue de valor 48; el 271º (bicentésimo
septuagésimo primer) dato fue también de valor 48; el 272º (bicentésimo
septuagésimo segundo) dato fue también de valor 48, y así sucesivamente
hasta 112 más (Que es la frecuencia del dato nominal x= 48).

santo tomas
Eso significa que el 287º (bicentésimo octogésimo séptimo) dato, lo mismo que
el 288º (bicentésimo octogésimo octavo), correspondieron al valor nominal x =
48.
Obsérvese que la mediana Md = 48 no es el que está situado a la mitad de la
columna de los datos nominales x.

80
Ejemplo 4: Las edades de un grupo de 28 personas van de los 45 a los 58 años,
mostrado ya organizado en la siguiente tabla. Localizar la mediana de dicho
conjunto de datos.

santo tomas
81
Solución: Debe entenderse que la tabla original consta solamente de las dos
primeras columnas x (edades) y f .
La que aparece a la izquierda es dicha tabla original a la que ya se le
añadió la columna de frecuencias acumuladas.
La máxima frecuencia acumulada, que es lo mismo que el número total
de datos nominales, es de 28. Es decir, la tabla corresponde a 28 datos
recolectados.
El valor central respecto de las frecuencias, no de los datos nominales x , se obtiene

santo tomas
sumando 1 al número total de datos 28 y dividiéndolo entre dos, es decir,

dc

que significa que tanto el dato ordinal 14 (décimo cuarto) como el 15 (décimo quinto)
son los que están situados a la mitad de todos, ya que debe comprenderse que no existen
datos ordinales fraccionarios, sino solamente enteros, o sea, existe el 1er dato, el 2º dato,
el 3er dato, el 8º dato, el 19º dato, etc, pero no puede existir el 14.5º (el décimo cuarto
82
punto cinco) dato, si acaso el 14º (décimo cuarto) exactamente.
Observando la columna de las frecuencias acumuladas se ve que el 14º dato fue
el último correspondiente al dato nominal x = 49 , mientras que el 15º dato es el
primero que corresponde al dato nominal x = 50, por lo que se entra en el
conflicto de cuál de los dos ha de ser la mediana. En casos así, la media de ambos
se toma como la mediana,
es decir, la mediana es. Md = ( 49+50)/2 = 49.5.

santo tomas
83
Mediana en Gráficos.
Determinar la mediana a partir del siguiente gráfico:

N° Alumnos

6
5
4

santo tomas
3
2
1 Nota
1 2 3 4 5 6 7

Solución:
Para determinar el total de datos, debemos sumar las frecuencias. En este caso, el
total de datos es 16.
Posición:
n +1 = 16 + 1 8,5
2 2
Luego, los valores centrales están ubicados en las posiciones 8ª y 9ª. Ambos
corresponden a nota 4.
84
Por lo tanto, la mediana es 4.
C U E STI O NAR I O

1) ¿Qué es la mediana ?
2) ¿Cómo se simboliza la mediana ?
3) ¿Cuántas y cuáles columnas deben agregarse a la tabla original para localizar

santo tomas
la mediana en
una distribución de datos sin agrupar?
4) ¿Cuál es la confusión o error más frecuente que se tiene al intentar localizar
una mediana ?
5) ¿Puede haber más de una mediana en una distribución de frecuencias, así
como puede tener dos o más modas ?.

85
LA MODA
La moda, como su nombre lo indica, es el valor más común (de mayor frecuencia
dentro de una distribución. Una información puede tener una moda y se llama
unimodal, dos modas y se llama bimodal, o varias modas y llamarse multimodal.
Sin embargo puede ocurrir que la
información no posea moda.

santo tomas
86
santo tomas
87
La Moda Cuando los datos no están Agrupados en Intervalos

santo tomas
88
santo tomas
89
Ejemplos: De las dos tablas siguientes, localizar la moda de cada una de ellas.

santo tomas
90
santo tomas
91
santo tomas
92
santo tomas
93
Ejemplo:

Frecuencia De acuerdo a la gráfica, la


6 Moda es 15.
5

santo tomas
3

1 Temperatura (º C)
8 10 12 15 18 21 25

La Moda, Mo es 15, pues posee la mayor frecuencia igual a 6.

94
santo tomas
CU E STIONARI O

1) ¿Qué es la moda ?
2) ¿Por qué una distribución de frecuencias puede tener más de una
moda y en cambio no puede
tener más que una media exactamente?
3) ¿Cómo se simboliza la moda?
4) ¿Cómo se obtiene la moda cuando los datos están organizados en
intervalos?

95
Medidas de Posición.

En las diapositivas anteriores, vimos lo


referente a las medidas de tendencia central,
las cuales, a su vez, son también medidas de

santo tomas
posición ya que, de todas maneras ocupan un
lugar dentro de la información.
Nos ocuparemos ahora de ciertos parámetros
posicionales muy útiles en la interpretación
porcentual de la información.

96
PERCENTILES. (Cuartiles, quintiles, deciles y centiles).
1.- CUARTILES
Las cuartillas o cuartiles son valores posicionales que dividen la información en
cuatro partes iguales, el primer cuartil deja el 25% de la información por debajo de
él, y el 75% por encima, el segundo cuartil, al igual que la mediana, divide la
información en dos partes iguales, y por último el tercer cuartil deja el 75% por
debajo de sí, y el 25% por encima.
Gráficamente:

santo tomas
97

A: Amplitud del intervalo


santo tomas
98
Cálculo del Segundo Quartil. (k= 2)

kxn 2 x 100 200

santo tomas
= ------------ = ------ = 50
4 4 4
(2*100)/4 - 35
Q2= 400 + -------------------- X 100 Por lo tanto Q2 = Me
Deja 50% de los datos bajo, y 50%
33
Sobre él.

Desde la tabla y columna de frecuencia acumulada se obtiene el intervalo


en que se ubica el dato 50, y es el intervalo cuatro (4), con fa, 68 el que
contiene el dato 50, con límites 400 – 500. Luego desde la fórmula y con la tabla,
Se obtienen los siguientes datos:

Li= 400
Fa(i-1)=35 Q2= 400 + 45,46 99
Q2= 445,46 Kg/Cm 2
fi= 33
A= 500-400=100 Q2= Md o (Me)
Calculemos ahora el tercer cuartil.(k=3 ; Q3).

santo tomas
El 75% de las baldosas posee una resistencia inferior a 538,88 Kg/Cm 2 y el 25%
Tiene una resistencia superior a ese dato.

100
Ejercicio:
Calcular los cuartiles Q1, Q2, y Q3 en la siguiente tabla de frecuencias:

santo tomas
101
Respuesta:
Frecuencia
Acumulada, fa

9
19 Q1
31 Q2
39

santo tomas
49 Q3
55

(k x n) (1 * 55)
-----= ----------- = 13,75
4 4

Q1= 4 + (13,75 – 9)
Cálculo de Q1
-------------- x 4 = 4 + 0,475 x 4 = 4 + 1,9
Li= 4 10
kxn/4)=13,75
fa(i-1)= 9 Q1= 5,9 102
fi= 10
A= 8-4= 4
El 25% de los datos es inferior a 5,9 y el 75% es Superior
Cálculo de Q2, k=2

k x n 2 x 55
------- = --------= 27,5
4 4

santo tomas
LI= 8
Kxn 27,5 - 19
------- = 27,5 Q2= 8 + ---------------- x 4
4
12
Fa (i-1)= 19
fi= 12
A= 12 -8 = 4 Q2= 8 + (8,5 / 12) x 4= 8 + 0,708 x4

Q2= 8 + 2,83 = 10,83

Q2= 10,83 = Me 103

El 50% de los datos es inferior a 10,83 y el 50% es superior.


Cálculo de Q3 k=3
k x n 3 x 55
------- = --------= 41,25
4 4

santo tomas
LI= 16
Kxn (41,25 – 39)
------- = 41,25 Q3= 16 + ---------------- x 4 = 16 + (2,25/10)x 4
4
10
Fa (i-1)= 19
fi= 10
Q3 = 16 + 0,9 = 16,9
A= 20 -16= 4

El 75% de los datos es inferior a 16,9 y el 25% es Superior.

104
Calcular Primer, segundo y tercer cuartil de la tabla siguiente:
Intervalo Frecuencia fi

16 - 22 9
23 - 29 26
30 - 36 11
37 43 3

santo tomas
44 - 50 4
51 - 57 2
n= 55

105
Solución
Intervalo Frecuencia fi Frecuencia Q
Acumulada, fa

16 - 22 9 9
23 - 29 26 35 Q1
y Q2

santo tomas
30 - 36 11 46 Q3
37 43 3 49
44 - 50 4 53
51 - 57 2 55
n= 55

Cálculo de Q1 k= 1
kxn 1 x 55
-------- = -------- = 13,75
Q1= 23 + (13,75 – 9)
4 4
-------------- x 7 = 23 + 0,183 x 7 = 23 + 1,28
106
26
A= 29-23+1=7 El 25% de los datos es inferior a 24,28
Q1= 24,28 y el 75% es superior.
Cálculo de Q2 k=2

kxn 2 x 55
-------- = -------- = 27,5
4 4

Q2= 23 + (27,5 – 9)
A=29-23+1=7

santo tomas
-------------- x 6 = 23 + 0,712 x 7 = 23 + 4,98
26

Q2= 27,98 El 50% de los datos es inferior a 27,98


y el 50% es superior.

Cálculo de Q3 k=3
Q3= 30 + (41,25 – 35)
kxn 3 x 55 -------------- x 6 = 30 + 0,568 x 7 = 30 + 4,12
-------- = -------- = 41,25 11
4 4
Q3= 34,12.
107
El 75% de los datos es inferior a 34,12 y
El 25% es superior.
Rango entre Cuartiles.

La diferencia entre el tercer cuartil (Q3) y el primer cuartil (Q1) se llama:


Rango entre cuartiles o Rango inter cuartiles, , denotado por RQ = Q3-Q1.
El rango entre cuartiles mide la variabilidad de la mitad central de los
datos.

santo tomas
108
2.- QUINTILES

Los quintiles o quintillas dividen la información en cinco partes iguales,


agrupándolas en porcentajes de 20, 40, 60, y 80 por ciento, en consecuencia debemos
calcular cuatro parámetros:
Gráficamente:

santo tomas
109
Ejemplo:

santo tomas
Q2, Q3
Q4

kxn 2 x 100
-------- = ---------- = 40
5 5
Calculemos el segundo quintil Q2 k= 2
Q2= 400 + (40 – 35)
-------------- x 100 = 400 + 0,152 x 100 = 400 + 15,2= 415,2
110
33
Q2= 415,2 El 40% de las baldosas posee una resistencia menor a 415,2 y el 60%
superior a ese valor.
Calcule el tercer, y cuarto quintil para el ejemplo anterior.

santo tomas
Cálculo del Tercer quintil. Calculemos el segundo quintil Q3, k= 3
kxn 3 x 100
-------- = ---------- = 60 LI= 400
5 5
Q3= 400 + (60 – 35)
-------------- x 100 = 400 + 0,758 x 100 = 400 + 75,8= 475,8
33
Q3= 475,8 El 60% de las baldosas posee una resistencia menor a 475,8 y el 40%
superior a ese valor.

111
Cálculo del Cuarto quintil. Q4 k=4

kxn 4 x 100
Li= 500

santo tomas
-------- = ---------- = 80
5 5

Q4= 500 + (80 – 68)


-------------- x 100 = 500 + 0,667 x 100 = 500 + 66,7= 566,7
18
Q4= 566,7

El 80% de las baldosas posee una resistencia menor a 566,7 y el 20% superior a
ese valor.

112
3.- DECILES

santo tomas
113
4.- CENTILES

santo tomas
RESUMEN: En general para calcular cualquier percentil:

donde:

r: Número de partes en que se divide la información


k: Orden del percentil k = 1,2,.....,r-1
114
En nuestro ejercicio, si el gerente de la fabrica de baldosas desea ofrecer un
garantía de resistencia mínima. Basado en la muestra que se ha obtenido, si no
quiere remplazar ninguna pieza, lógicamente debe afirmar que el producto resiste
100 o más Kg/Cm2. Pero si esta dispuesto a remplazar el 5% de su producción,
entonces:

santo tomas
115
Cálculo de Percentiles en datos sin tabular o series numéricas.
En datos sin tabular:
• Primero se ordenan de menor a mayor los n datos.
• Calcular el valor A que marca la posición de percentil. A= (k x n) /(4, o 5, o 10,
o 100 según corresponda).
1. Si A es entero, entonces el percentil k corresponde al valor
Medio, (La suma de ambos dividida por 2), de las observaciones ubicadas en

santo tomas
las posiciones A y A+1.
2. Si A no es un entero, (Es un decimal), el percentil k corresponde a la
observación ubicada en la posición entera siguiente, es decir,
[A+1].

Ejemplos Percentiles:
• Determinar los percentiles 25 y 60 de los siguientes datos:
3, 5, 5, 8, 12, 15, 21, 23, 25, 26, 29, 35
• P25: A= 12 x 25 /100 = 3
Aquí, resulta un entero, por tanto el P25 corresponde al
promedio de las observaciones en las posiciones 3º y 4º, es
decir, P25= (5+8)/2 = 6.5
• P60: A = 12 x 60 / 100 = 7.2 116
En este caso A no es un entero, nos movemos al entero
siguiente. Es decir, P60 = 23 (observación en la 8ª posición).
CUESTIONARIO

1. ¿ Para qué se utilizan los percentiles ?


2. ¿ En cuantas partes se divide la información con:
2.1 Los cuartiles
2.2 Los quintiles
2.3 Los deciles
2.4 Los centiles

santo tomas
117
santo tomas
Medidas de Dispersión

118
santo tomas
119
Medidas de Dispersión.

En el análisis estadístico no basta el cálculo e interpretación de las medidas de tendencia central o


de posición, ya que, por ejemplo, cuando pretendemos representar toda una información con la
media aritmética, no estamos siendo absolutamente fieles a la realidad, pues suelen existir datos
extremos inferiores y superiores a la media aritmética, los cuales, en honor
a la verdad, no están siendo bien representados por este parámetro.
En dos informaciones con igual media aritmética, no significa este hecho, que las distribuciones
sean exactamente iguales, por lo tanto, debemos analizar el grado de homogeneidad entre sus
datos. Por ejemplo, los valores dela Serie de números 1: 5, 50, 95 tiene igual media aritmética, y

santo tomas
mediana que los valores de la serie de números 2: 49, 50,51; sin embargo, para la primera
información la media aritmética , se encuentra muy alejada de los valores extremos 5 y 95, cosa
que no ocurre con la segunda información que posee igual media aritmética y mediana, vemos
entonces que la primera información es mas heterogénea o dispersa que la segunda.
Para medir el grado de dispersión de una variable, se utilizan principalmente los siguientes
indicadores:
7.1 Rango o recorrido
7.2 Desviación media
7.3 Varianza y desviación típica o estándar
7.4 Coeficiente de variabilidad.

120
santo tomas
121
MEDIDAS DE DISPERSIÓN

Existen diversas medidas estadísticas de dispersión, pero muchos autores


coinciden en que las principales son:

Rango

santo tomas
Desviación Media

Varianza

Desviación estándar

Coeficiente de variación

122
RANGO O RECORRIDO.
Es la medida de dispersión mas sencilla ya que solo considera los dos valores
extremos de una colección de datos, sin embargo, su mayor utilización está en el
campo de la estadística no paramétrica.
R = Xmax – Xmin

Xmax, Xmin son el máximo y el mínimo valor de la variable X, respectivamente.

santo tomas
En el ejemplo introductorio, vemos que el rango para la primera información es
R1=95-5=90,

mientras que R2=51-49=2, se hace pues manifiesta la gran dispersión de la


primera información contra la homogeneidad de la segunda.

123
Ejemplo.
Ante la pregunta sobre número de hijos por familia, una muestra de 12
hogares, marcó las siguientes respuestas:
2 1 2 4 1 3
2 3 2 0 5 1

Calcula el rango de la variable

santo tomas
Solución. Rango = 5 - 0 = 5

124
santo tomas
125
santo tomas
126
DESVIACIÓN MEDIA

La desviación media, mide la distancia absoluta promedio entre cada uno de los
datos, y el parámetro que caracteriza la información. Usualmente se considera la
desviación media con respecto a la media aritmética:

Otra manera de estimar la dispersión de los valores de la muestra es comparar cada


uno de estos con el valor de una medida de centralización. Una de las medidas de

santo tomas
dispersión más usada es la desviación
media, también llamada con más precisión desviación media respecto a la media
aritmética. Se define ésta como la media aritmética de las diferencias absolutas,
entre los valores de la variable y la media aritmética de la muestra.

127
Hay que destacar la importancia de tomar valores absolutos de las desviaciones. Si
no se hiciese así unas desviaciones se anularían con otras, alcanzando finalmente la
desviación media un valor de 0.

Evidentemente, en el caso de que la variable no tome valores repetidos, ni esté


agrupada en intervalos, la expresión anterior se simplifica a:

∑ 1m │xi - Ẋ │

santo tomas
Ẋ =------------------------
n

128
santo tomas
Xi * fi
Xi*fi Ẋ=------------
50 n
153
2705
260 Ẋ=------------
50
477
648 Ẋ= 54,1
550
280 El promedio o media aritmética de
los sueldos es $54.100
171
129
116
2705
santo tomas
130
santo tomas
131
VARIANZA
El problema de los signos en la desviación media, es eludido tomando los valores
absolutos de las diferencias de los datos con respecto a la media aritmética. Ahora
bien, la varianza obvia los signos elevando las diferencias al cuadrado, lo cual resulta
ser más elegante, aparte de que
es supremamente útil en el ajuste de modelos estadísticos que generalmente conllevan
formas cuadráticas.
La varianza poblacional, es uno de los parámetros más importantes en estadística

santo tomas
paramétrica, se puede decir que, teniendo conocimiento de la varianza de una
población, se ha avanzado mucho en el conocimiento de la población misma.
Numéricamente definimos la varianza, como desviación cuadrática media de los datos
con respecto a la media aritmética:

En población Ẋ = µ y n= N

2 : Varianza
xi : Valor de la variable X
µ : Media aritmética de la información
fi : Frecuencia absoluta de la observación xi 132
N : Tamaño de la población.
m : Número de agrupamientos o intervalos
∑1m ( Xi - Xi )2
Varianza Muestral= S2 = -----------------------------
(n - 1)

2 : Varianza muestral

santo tomas
xi : Valor de la variable X
X : Media aritmética de la información de la muestra.
n: Tamaño de la muestra.

DESVIACIÓN ESTÁNDAR O DESVIACIÓN TÍPICA.

Se define a la Desviación estándar (S o , según sea muestral o poblacional),


como la raíz cuadrada de la Varianza.
133
Estimación de la Varianza, en un conjunto de datos no agrupados en intervalos,
De frecuencia, o clases.
EJEMPLO.
Calcularemos la Varianza (S2), y la desviación estándar, para los pesos de 10
Individuos:
Observaciones Xi Xi - Ẋ ( Xi - Ẋ )2

1 63 1,6 2,56
2 52 -9,4 88,36

santo tomas
3 78 16,6 275,56
4 49 -12,4 153,76
5 71 9,6 92,16
6 62 0,6 0,36
7 68 6,6 43,56
8 48 -13,4 179,56
9 56 -5,4 29,16
10 67 5,6 31,36
∑ 614 0 896,4

La Media, se obtiene de la segunda columna n:


∑ Xi
Ẋ =----------=-----------
614 = 61,4
n 10 134
Para la Varianza S2 tenemos que:

896,4

santo tomas
S = ----------- = 99,6 Kg2
2

10 - 1
Y su desviación estándar es:

S = √ 99,6 = 9,98 Kg

Nótese que las unidades de la Varianza son Kg2 en cambio la de la


desviación estándar es Kg.

135
Varianza, en tablas de datos no agrupados, o distribución simple.

Mide la distancia existente entre cada valor de la variable y la Media


Aritmética. Se calcula como la sumatoria (∑), de las diferencias al cuadrado,
de cada valor de la variable (Xi), y la Media Aritmética. (µ o ×), multiplicadas
por número de veces, que se repite cada valor de la variable (fi).
La sumatoria obtenida se divide por el tamaño de la muestra (n) o de la

santo tomas
Población. (N).
La varianza muestral se representa por la letra S2.
La varianza poblacional se representa por la letra griega 2.
FORMULAS.

∑1m ( Xi - Xi )2 x fi
Varianza Muestral= S2 =-----------------------------
(n - 1)
∑1m ( Xi - µ )2 x fi
Varianza Poblacional = 2 = ------------------------------
N 136
Observación
Para N mayor que 30, no hay prácticamente diferencias entre usar N-1 y usar N.
La varianza siempre será mayor que cero. Mientras más se aproxima a cero, más
concentrados están los valores de la serie alrededor de la media. Por el contrario,
mientras mayor sea la varianza, más dispersos están.
Ejemplo

Calcule la varianza para los siguientes datos:


212413232051

santo tomas
Solución 1.-

Podrían haber dos métodos para la solución del problema.

La primera de ellas sería no considerar que los datos se repiten, por lo que no
trabajamos en la frecuencia, fi en la fórmula, y ordenando los datos en el
orden de aparición, y no ascendente de menor a mayor.

Lo cuál se expresaría así:

137
Observaciones Xi Xi - Ẋ ( Xi - Ẋ )2
1 2 -0,167 0,0279
2 1 -1,167 1,3619
3 2 -0,167 0,0279
4 4 1,833 3,3560
5 1 -1,167 1,3619
6 3 0,833 0,6939
7 2 -0,167 0,0279
8 3 0,833 0,6939

santo tomas
9 2 -0,167 0,0279
10 0 -2,167 4,6959
11 5 2,833 8,0259
12 1 -1,167 1,3619
∑ 26 -0,004 21,6629

La Media, se obtiene de la segunda columna:


∑ Xi 26
Ẋ =----------=----------- = 2,167
n 12

138
21,6629
S =-------------- = 1,9635
2

12 - 1

santo tomas
S = √ 1,9635 = 1,4012

139
SOLUCIÓN 2.
La segunda solución es considera los datos como una tabla de frecuencias simple, y
ordenar los datos considerando su frecuencia
Absoluta (fi).
∑1m ( Xi - Xi )2 x fi
Varianza Muestral= S2 =-----------------------------
(n - 1)
212413232051

santo tomas
Ordenamiento:

0 11 1 2 2 2 2 3 3 4 5
Variable, Xi Frecuencia, fi Xi * fi ( Xi - X) ( Xi - X)2 ( Xi - X)2 * fi

0 1 0 -2,167 4,696
4,696
1 3 3 -1,167 4,086
1,362
2 4 8 -0,167 0,112
0,028
3 2 6 0,833 1,388
0,694
4 1 4 1,833 3,360 3,360
140
5 1 5 2,833 8,026 8,026

∑ fi = n = 12 ∑ 26 ∑ 21,668
Cálculo de la Media Aritmética, X

∑ Xi * fi
26
Ẋ =--------------- =----------- = 2,167 = 2,17
n 12

santo tomas
Cálculo dela Varianza y Desviación Típica.

∑1m ( Xi - Xi )2 x fi 21,668 21,668


Varianza Muestral= S2 =----------------------------- =--------------- = -----------------
(n - 1) (12-1) 11

Varianza Muestral= S2 = 1,9698 = 1,97

En este caso debe usarse (n-1), dado que n es menor que 30. 141
Si se usara sólo n, la Varianza seria 1,80.
Desviación estándar o Típica. (S O )

Se obtiene al sacar la raíz cuadrada de la Varianza.


En el ejemplo:
Varianza = S2 = 1,97

Luego como la raíz de 1,97 es 1,40

santo tomas
Luego: S=1,40.

Cómo puede apreciarse, en ambos casos se obtienen resultados


Idénticos.

142
santo tomas
143
Ejemplo de Varianza y desviación estándar de Tablas de frecuencia.:
a) Tabla frecuencias Simple:

santo tomas
∑2705

*∑xi*fi
Ẋ=-------------=54,1 144
n
Como los datos están expresados en miles de pesos y la varianza se encuentra en
forma cuadrática obtenemos una varianza de 3.210 pesos.

DESVIACIÓN TÍPICA 0 ESTÁNDAR, S.

Sin embargo para una mejor comprensión debemos recurrir a la desviación típica
o estándar definida como la raíz cuadrada de la varianza:

santo tomas
145
b) Tabla de frecuencias agrupada en Intervalos de clase.
En este caso se utiliza la marca de clase Vi, para los cálculos.
En el caso delas baldosas:

Xi, Kg/cm2 Vi fi Vi x fi Vi - X (Vi - X)2 x fi

100 - 200 150 4 600 - 298 355.216

200 - 300 250 10 2.500 - 198 392.040

santo tomas
300 - 400 350 21 7.350 - 98 201.684

400 . 500 450 33 14.850 2 132

500 - 600 550 18 9.900 102 187.272

600 - 700 650 9 5.850 202 367.236

700 - 800 750 5 3.750 302 456.020

∑fi= n=100 ∑44.800 ∑ 1.959.600

Cálculo de la Media Aritmética, X

146
X = ∑ Vi x fi = 44.800 = 448 Kg/ Cm 2

n 100
Cálculo de la desviación típica o estándar

S = Desviación Típica o Estándar

S = √ S2 = √ ∑ ( Vi – X )2 x fi

santo tomas
n

S = √ 1.959.600 = √ 19.596 = 140 Kg / cm2


100

147
COEFICIENTE DE VARIABILIDAD (CV)

Generalmente interesa establecer comparaciones de la dispersión, entre diferentes


muestras que posean distintas magnitudes o unidades de medida.
El coeficiente de variabilidad tiene en cuenta el valor de la media aritmética, para
establecer un número relativo, que hace comparable el grado de dispersión entre dos
o mas variables, y se define como:

santo tomas
148
EJERCICIOS DATOS AGRUPADOS EN INTERVALOS

Hallar la Media Aritmética, la desviación típica, y el coeficiente de variación de la


siguiente distribución de edades:

Xi, Intervalos 0 -5 5 - 10 10 - 15 15 - 20 20 - 25 25 - 30

santo tomas
Fi, frecuencia 3 9 12 9 15 2

∑ (Vi – X)2 x fi
Desviación Típica muestral: S = √ --------------------------
n- 1

n tiende a infinito por lo que se puede usar n, en vez de (n -1), para datos
mayores que 30.
Cómo se trata de datos agrupados en intervalos, se utiliza Vi, en vez de Xi, tanto
para la Media, como para la desviación estándar.
149
X = ∑ Vi x fi =
n
Solución.

Se construye la tabla de distribución de frecuencias. Y se aplican las fórmulas.


Media X =?
Desviación S = ?

Xi Vi fi Vi x fi (Vi - X) (Vi - X)2 (Vi - X)2 x fi

santo tomas
[0 – 5) 2,5 3 7,5 ( 2,5 – 15,5) =
-13 169 507
[5 – 10) 7,5 9 67,5 -8
64 576
[10 – 15) 12,5 12 150,0 -3
9 108
[15 – 20) 17,5 9 157,5 2
4 36
[20 – 25) 22,5 15 337,5 7
49 735
[25 - 30] 27,5 2 55,0 12
144 288
∑fi=n = 50 ∑ 775 ∑
∑ 2.250

775 150
X = ∑ Vi x fi = -----------= 15,5 X = 15,5
n 50
Desviación Típica muestral: S = √ ∑ (Vi – X)2 x fi
--------------------------
n- 1

santo tomas
=√-----------= √45,918 = 6,776 = 6,78
2.250
S
(50 -1)

Cómo n es mayor a 30, Si se divide por n=50 y no por n-1 igual a 49:
Se tiene s= 6,71. lo que implica un 1% de error entre ambas formas de
cálculo.

S 151
CV = -------- X 100 = ( 6,78 / 15,5 ) X100 = 43,74%
X
CUESTIONARIO

1. ¿ Cuál es la utilidad de las medidas de dispersión?

2. ¿ Cuales son las principales medidas de dispersión?

3. ¿ Cuál es la medida adecuada para comparar la dispersión entre varias variables

santo tomas
que posean diferente magnitud o diferente unidad de medida?

152

También podría gustarte