MEDIDAS DE
POSICIÓN,
DISPERSIÓN Y FORMA
Unidad 2
UNIDAD N° 2
II – DESCRIPCION DE LOS DATOS
II.1- Introducción a las medidas descriptivas de datos. Medidas
de centralización y dispersión. Utilidad.
II.2- Media aritmética. Concepto. Características. Propiedades
matemáticas. Calculo. Medición de su
representatividad a través de las diferentes medidas de
dispersión.
II.3- Mediana. Concepto. Características. Calculo. Medición de
su representatividad a través del recorrido
intercuartílico.
II.4- Modo. Concepto. Características. Cálculo.
II.5- Medidas de localización. Utilidad. Tipos. Concepto. Calculo.
II.6- Medidas de forma: Simetría y kurtosis. Concepto. Índices
Medidas descriptivas
Son valores numéricos calculados a partir de un conjunto de datos ya
sea la población o la muestra
Centralización
Dispersión
Localización
Forma
Medidas de Tendencia Central
Media
Mediana
Modo
5
MEDIA ARITMETICA
a-9-8-8-7-8 µ=
Características
• Todo conjunto de datos de intervalo —o de nivel de razón— posee
una media
• Todos los valores se encuentran incluidos en el cálculo de la media.
• La media única
Propiedades matemáticas
➢σ 𝑥 − 𝑋ത = 0
➢σ 𝑥 − 𝑋ത 2 es menor que σ 𝑥 − 𝑐𝑢𝑎𝑙𝑞𝑢𝑖𝑒𝑟 𝑣𝑎𝑙𝑜𝑟 2
a-9-8-8-7-8 µ=
b-9-8-8-7-0 µ=
8
MEDIANA
9-8-8-7-11
7-8-8-9-11
7-8-8 - 9-11-13
8,5
MODO
El valor de la variable que aparece con mayor frecuencia.
7-8-8-9-11
Medidas de Dispersión
Rango o recorrido
Recorrido Intercuartilico
Varianza
Desviación estándar
Coeficiente de variación
12
Media aritmética y Variabilidad
MEDIA
ARITMETICA
Rango o Recorrido (R )
Varianza (S²) o σ²
Desviación Estándar Soσ
Coeficiente de Variación (CV)
Rango o Recorrido
R= valor mas alto – valor mas bajo
Rápido y fácil de calcular
Tiene en cuenta solo 2 datos
Se ve afectado por valores atípicos
VARIANZA
σ𝑛 𝑥 − ത
𝑋 2
𝑆 2
𝑖=1 𝑖
=
𝑛−1
σ𝑁 𝑥 −𝜇 2
𝜎 2
𝑖=1 𝑖
=
𝑁
DESVIACION ESTANDAR (TIPICA)
La desviación típica es la raíz cuadrada de la varianza.
σ𝑛 ത 2
𝑖=1 𝑥𝑖 −𝑋
S= 𝑆2 =
𝑛−1
σ𝑁
𝑖=1 𝑥𝑖 −𝜇
2
𝜎 = 𝜎2 =
𝑁
Recorrido Intercuartilico
𝑅𝐼 = 𝑄3 − 𝑄1
No se ve afectada por valores extremos o atípicos
No tiene en cuenta todos los datos
17
RECORRIDO INTERCUARTILICO Y CUARTILES
𝑅𝐼 = 𝑄3 − 𝑄1
Coeficiente de Variación
Dispersión expresada en valores
relativos
σ
CV = *100
µ
Media y varianza para Datos Agrupados
σ𝑘1 X𝑖 ∗ 𝑓𝑖 σ𝑘1 𝑥´ ∗ 𝑓𝑖
𝑥ҧ = 𝑥ҧ =
𝑛 𝑛
s² = Σ ( x' - )²*F
n-1
Medidas de localización
✓ Cuartiles: dividen los datos ordenados en cuatro partes
iguales.
✓ Quintiles: dividen los datos ordenados en cinco partes
iguales.
✓ Deciles: dividen los datos ordenados en diez partes
iguales.
✓ Percentiles: dividen los datos ordenados en cien partes
iguales.
CALCULO DE LOS CUARTILES (Q)
Orden: 1º 2º 3º 4º 5º 6º 7º 8º 9º 10º 11º
1–2–2–3–4–5–6–6–7–8–9
𝑛+1 ∗1
Orden del primer cuartil: = 3; el tercer dato se corresponde con el valor del cuartil primero o sea que su
4
valor sería “2”.
𝑛+1 ∗2
Orden del segundo cuartil: = 6; el sexto dato corresponde al valor del segundo cuartil, o sea que su valor
4
es “5”.
𝑛+1 ∗3
Orden del tercer cuartil: 4 = 9; el noveno dato corresponde al valor del tercer cuartil, o sea que su valor es
“7”. Por tanto el 75% de los datos son menores a 7 y el 25% restante es superior a 7.-
Diagramas de caja y bigotes (Box Plot)
Es una representación gráfica, basada en cuartiles, que ayuda a
presentar un conjunto de datos. Para construir un diagrama de caja,
sólo necesita cinco estadísticos: el valor mínimo, Q1(primer cuartil), la
mediana, Q3(tercer cuartil) y el valor máximo
Simetría
Forma que puede adquirir una distribución respecto al eje de
las abscisas. Comportamiento de los datos alrededor de la
media.
Distribución asimétrica (+) significa mayor Distribución asimétrica (-) significa mayor
concentración de datos a la izquierda de la concentración de datos a la derecha de la
media. media.
Distribución Simétrica: Media, mediana y modo coinciden.
8
8 7
8 7 6
6
6 5
5
4
4 4
3
3
2
2 2
1
1
0 0
0
2-4 4-6 6-8 8-10 10-12 2-4 4-6 6-8 8-10 10-12
2-4 4-6 6-8 8-10 10-12
Coeficientes de Asimetría
Pearson Bowley
𝑄3 −𝑄2 −(𝑄2 −𝑄1 )
𝐵= =
𝑄3 −𝑄1
ҧ
𝑥−𝑀𝑜 𝑄3 − 𝑀𝑑𝑛 − (𝑀𝑑𝑛 − 𝑄1 )
P= 𝑅𝐼
𝑠
B = 0 Simetría
P = 0 Simetría
B > 0 Asimetría Positiva
P > 0 Asimetría Positiva
B < 0 Asimetría Negativa
P < 0 Asimetría Negativa
Curtosis
Grado en que las observaciones están agrupadas en torno a la
media. Formación o deformación de una distribución respecto al
eje de las ordenadas.
Una curtosis positiva indica que las observaciones se concentran
más alrededor de la media. Una curtosis negativa indica que las
observaciones son más dispersas respecto a la media.
Datos sin Agrupar Datos Agrupados
σ𝑛1 𝑥𝑖 σ𝑘1 𝑥´ ∗ 𝑓𝑖
Media 𝑥ҧ = 𝑥ҧ =
𝑛 𝑛
Medidas de En un conjunto de datos la mediana es el valor que tiene la
𝑁
misma cantidad de valores por debajo y por encima de él. − 𝐶
Tendencia Mediana Deben ordenarse los datos de menor a mayor. Cuando los datos 𝑀𝑑𝑛 = 𝐿𝑖𝑛𝑓 + 2 ∗𝐼
𝐹𝑖
Central son pares, la mediana es el promedio de los dos datos centrales.
𝑑1
𝑀𝑜 = 𝐿𝑖𝑛𝑓 + ∗ 𝐼; 𝑑1 = 𝑓𝑚 − 𝑓𝑚−1 /𝑑2 =
Modo Es el valor que aparece con la mayor frecuencia. 𝑑1 +𝑑2
𝑓𝑚 − 𝑓𝑚+1
Deben ordenarse los datos de menor a mayor y hallar la posición
Medidas de
Estadístic Fráctiles que ocupa el fractil en la muestra ordenada. 𝑜𝑟𝑑𝑒𝑛 𝑑𝑒𝑙 𝑓𝑟𝑎𝑐𝑡𝑖𝑙 =
𝐹𝑖 = 𝐿𝑖𝑛𝑓 +
𝑁 ∗ 𝑓𝑟 − 𝐶
∗𝐼
Posición 𝑓𝑟 𝑓𝑖
as
𝑛+1
100
descriptiv Rango o Recorrido 𝑅 = 𝑉𝑚á𝑥 − 𝑉𝑚𝑖𝑛 𝑅 = 𝑉𝑚á𝑥 − 𝑉𝑚𝑖𝑛
as Rango
𝑅𝐼 = 𝑄3 − 𝑄1 𝑅𝐼 = 𝑄3 − 𝑄1
Intercuartílico
Medidas de σ𝑛1 (𝑥𝑖 − 𝑥)ҧ 2 σ𝑛1 (𝑥′ −𝑥)ҧ 2 𝑓𝑖
Varianza 𝑠2 = 𝑠2 =
Dispersión 𝑛−1 𝑛−1
Desviación Estándar 𝑠= 𝑠2 𝑠= 𝑠2
Coeficiente de 𝑠 𝑠
𝑐𝑣 = ∗ 100 𝑐𝑣 = ∗ 100
variación 𝑥ҧ 𝑥ҧ