1
Maestría en Administración
Curso: Fundamentos de
Análisis de Datos
Docente: Carmen Peláez
Sesión N°2: Estadística Descriptiva: Medidas
Numéricas
2024
2
MEDIDAS DE POSICIÓN
3
1. MEDIDAS DE POSICIÓN
1.1. MEDIA ARITMÉTICA
✔ Es la medida de localización más importante, llamada también
promedio de la variable. Es una de las medidas de tendencia
central, conocida como el punto de equilibrio de los datos ó
centro de gravedad.
✔ Para calcular la media aritmética se observa como se registra la
información: si los datos están ó no organizados en tablas de
frecuencias.
n
Datos no agrupados: x i
X = i 1
Con información muestral n
Xi : valores que toma la variable X
n : número de observaciones
4
1. MEDIDAS DE POSICIÓN
1.1. MEDIA ARITMÉTICA
1.1.1. PROPIEDADES DE LA MEDIA ARIRMÉTICA
✔ La media, para un grupo de datos es única.
✔ Para el cálculo se utiliza todas las observaciones disponibles.
✔ El valor de la media, se ve afectado por la presencia de valores
extremos; por ello pierde representatividad cuando hay
presencia de ellos entre los datos.
✔ La suma de los valores observados desviados respecto a su media
es cero.
5
1. MEDIDAS DE POSICIÓN
1.2. MEDIANA
✔ Es el valor central de un grupo de datos
ordenados de mayor a menor o
viceversa.
✔ Si el número de datos es impar, la
mediana está en el valor que
corresponde a la posición central.
✔ Ejemplo: Edades de 11 empleados de
cierta empresa (previamente ordenadas
de menor a mayor.
20, 23, 25, 28, 32, 38, 46, 47, 48, 49, 52
✔ La mediana correspondería al valor que
esta en la sexta posición 38.
6
1. MEDIDAS DE POSICIÓN
1.3. MODA
✔ Es el valor que ocurre con mayor
frecuencia.
✔ Si varios valores comparten la mayor
frecuencia de aparición, cada uno de
ellos es una moda.
✔ Ejemplo: Edades de 11 empleados de
cierta empresa (previamente
ordenadas de menor a mayor.
20, 23, 25, 28, 32, 38, 46, 47, 48, 49, 52
✔ La La moda es el número 32 (unimodal)
7
1. MEDIDAS DE POSICIÓN
1.4. POSICIONES RELATIVAS DE LA MEDIA, MEDIANA Y MODA
✔ La distribución de una variable puede ser determinada de acuerdo
al valor de las medidas de posición (centralidad), esta puede ser
simétrica o asimétrica positiva o asimétrica negativa.
8
MEDIDAS DE VARIABILIDAD
9
2. MEDIDAS DE VARIABILIDAD
2.1. MEDIDAS DE DISPERSIÓN O VARIACIÓN
✔ Las medidas de dispersión son útiles para
una mejor comprensión de la distribución de
un conjunto de datos de una variable de
interés y se complementa con las medidas de
tendencia central.
✔ Cuando se calcula se aprovecha el hecho, de
que si los datos son semejantes entre si,
están más cerca a la media aritmética,
entonces se dice que tienen poca
variabilidad ó que son homogéneos.
✔ Por el contrario si son muy diferentes
entre si, estarán muy dispersos respecto a
la media aritmética y se dice de ellos que
son muy variables o que son heterogéneos.
10
2. MEDIDAS DE VARIABILIDAD
2.1. MEDIDAS DE DISPERSIÓN O VARIACIÓN
2.1.1. RANGO
✔ El Rango de variación o recorrido de una serie de datos, esta
representado por la diferencia entre sus valores máximo y mínimo,
resultando ser la medida de variabilidad más sencilla y menos
confiable, ya que sólo usa dos datos para su cálculo.
R = Xmáx – Xmín
donde:
Xmáx : valor máximo
Xmín : valor mínimo
11
2. MEDIDAS DE VARIABILIDAD
2.1. MEDIDAS DE DISPERSIÓN O VARIACIÓN
2.1.2. VARIANZA
✔ La varianza ó variancia es una medida de variabilidad absoluta, que se
expresa en unidades al cuadrado y que utiliza todos los datos para su
cálculo (el cual se basa en las diferencias entre el valor de las
observaciones y su media).
✔ Se defina como el promedio de las desviaciones, elevadas al cuadrado,
de cada uno de los datos con respecto del promedio (media aritmética)
X
n n
i
2
i X
2
X
Cálculo: 2
S
2 i 1
i 1
X
Xi : i-ésima observación
n n
n : Número de datos
12
2. MEDIDAS DE VARIABILIDAD
2.1. MEDIDAS DE DISPERSIÓN O VARIACIÓN
2.1.3. DESVIACIÓN ESTÁNDAR
✔ La varianza se mide en unidades al cuadrado, por ejemplo si los datos
están expresados en metros, la varianza se medirá en metros al
cuadrado.
✔ Esto trae dificultades para su interpretación real. Es por ello que en
ocasiones se prefiere el uso de la Desviación Estándar, definida como
la raíz cuadrada (positiva) de la varianza.
✔ El valor numérico de la varianza y la desviación estándar cuantifican el
grado de dispersión absoluta de los datos de la variable en estudio,
con respecto a su media aritmétia, la primera en unidades al cuadrado
y la segunda en unidades reales. Por lo que a mayor variabilidad mayor
varianza.
Desviación Estándar : s s 2
13
2. MEDIDAS DE VARIABILIDAD
2.1. MEDIDAS DE DISPERSIÓN O VARIACIÓN
2.1.4. COEFICIENTE DE VARIACIÓN
✔ Esta medida de dispersión es muy útil cuando se quiere comparar el
grado de dispersión (homogeneidad o variabilidad) en dos conjuntos de
datos que tienen un promedio diferente y/o que tienen diferentes
unidades de medida.
✔ En general se considera lo siguiente:
Si CV < 25% implica baja dispersión
Si CV > 50% implica Alta dispersión
En otro caso se tiene Dispersión moderada
Cálculo:
S S
CV ( X ) CV ( X )% (100)
X X