Probabilidad y Estadística
U1. Estadística Descriptiva
MEDIDAS DE TENDENCIA
CENTRAL, LOCALIZACIÓN
Y DISPERSIÓN
Profesor: I.I. Johnnathan Fernando Gutiérrez Cruz
[Link]@[Link]
833 2800 500
1
Objetivo de la clase:
Comprender los conceptos de
media, mediana y moda,
cuartiles, deciles y percentiles
su importancia en la
estadística y su aplicación en
la toma de decisiones a partir
del análisis de datos.
Analicemos las
calificaciones en un
examen:
70,80,85,90,95,100,100
¿Cómo describirían el
desempeño del grupo?
Los conceptos de tendencia central permiten identificar un
valor representativo dentro de un conjunto de datos. Estos
son la media, mediana y moda, y se utilizan ampliamente en
la estadística para resumir información y facilitar la toma de
decisiones.
Media (Promedio)
Es el valor obtenido al sumar todos los datos y dividir el
resultado entre el número total de datos.
Fórmula:
Σ𝑋𝑖
𝑋=
𝑛
• Ejemplo:
Si las calificaciones de 5 alumnos en un examen son 80, 85,
90, 95, 100, la media se calcula así:
80 + 85 + 90 + 95 + 100
𝑋=
5
450
𝑋=
5
𝑋 = 90
Mediana
Es el valor central cuando los datos están ordenados de menor
a mayor. Si el número de datos es impar, es el valor en la
posición media; si es par, es el promedio de los dos valores
centrales.
• Ejemplo 1 (número impar de datos):
Datos: 12, 15, 18, 20, 25
Mediana = 18 (porque es el valor central).
• Ejemplo 2 (número par de datos):
Datos: 10, 12, 15, 18, 20, 25
Mediana = (15+18)/2=16.5
Moda
Es el valor que más veces se repite en un conjunto de datos.
Puede haber:
• Una moda (unimodal) si hay un solo valor con mayor
frecuencia.
• Dos modas (bimodal) si hay dos valores con la misma
frecuencia más alta.
• Multimodal si hay más de dos valores con la misma
frecuencia más alta.
• Sin moda si ningún valor se repite.
Ejemplo:
Datos: 3, 4, 5, 5, 6, 7, 7, 7, 8
Moda = 7 (porque aparece con más frecuencia).
Siendo el siguiente conjunto de datos:
12,15,20,20,22,24,25,30,30,30,35
Cálculo de medidas:
Media:
Mediana:
Moda:
Medidas de Localización
Las medidas de localización permiten dividir un conjunto de
datos ordenados en partes iguales, facilitando el análisis de la
distribución de los valores. Se utilizan en estudios estadísticos
para identificar valores clave dentro de un conjunto de datos.
Cuartiles (𝑸𝒌 )
Los cuartiles dividen un conjunto de datos ordenados en cuatro partes
iguales.
• Fórmulas para calcular los cuartiles:
𝑘(𝑛 + 1)
𝑄𝑘 = é𝑠𝑖𝑚𝑜 𝑑𝑎𝑡𝑜
4
Donde:
• 𝑘 = número del cuartil (1, 2 o 3)
• 𝑛 = cantidad total de datos
Interpretación de los cuartiles:
• 𝑄1 (Primer Cuartil): El 25% de los datos están por debajo de este valor.
• 𝑄2 (Mediana o Segundo Cuartil): El 50% de los datos están por debajo de
este valor.
• 𝑄3 (Tercer Cuartil): El 75% de los datos están por debajo de este valor.
Deciles (𝑫𝒌 )
Los deciles dividen los datos en diez partes iguales.
Fórmula para calcular los deciles:
𝑘(𝑛 + 1)
𝐷𝑘 = é𝑠𝑖𝑚𝑜 𝑑𝑎𝑡𝑜
10
• 𝑘 = número del decil (1 a 9)
• 𝑛 = cantidad total de datos
Interpretación de los deciles:
• 𝐷1 : El 10% de los datos están por debajo de este valor.
• 𝐷5 : Corresponde a la mediana (50% de los datos por debajo).
• 𝐷9 : El 90% de los datos están por debajo de este valor.
Percentiles (𝐏𝒌 )
Los percentiles dividen los datos en cien partes iguales y son muy
utilizados en pruebas estandarizadas, como exámenes académicos o
análisis de crecimiento infantil.
Fórmula para calcular los percentiles:
𝑘(𝑛 + 1)
𝑃𝑘 = é𝑠𝑖𝑚𝑜 𝑑𝑎𝑡𝑜
100
• 𝑘 = número del percentil (1 a 99)
• 𝑛 = cantidad total de datos
Interpretación de los deciles:
• 𝑃25 : Primer cuartil (Q1)
• 𝑃50 : Segundo cuartil (Q2 o Mediana)
• 𝑃75 : Tercer cuartil (Q3)
• 𝑃90 : El 90% de los datos están por debajo de este valor.
Conjunto de datos ordenado (edades de 12 personas):
10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32
Cálculo de cuartiles:
• Q1=
• Q2=
• Q3=
• Cálculo de percentil 90 (𝑃90 )
• 𝑃90 =
Conjunto de datos ordenado (edades de 12 personas):
10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32
Cálculo de cuartiles:
1(12+1) 13
• Q1= 𝑄1 = = =3.25 → Aproximamos al tercer dato: 14.
4 4
2(12+1) 26
• Q2= 𝑄2 = = =6.5 → Tomamos el promedio entre los valores 20 y 22:
4 4
20+22
𝑄2 = =21
2
2(12+1) 26
• Q3= 𝑄2 = = =9.75 → Aproximamos al noveno dato: 26.
4 4
• Cálculo de percentil 90 (P90P_{90}P90)
90(12+1) 90∗13 1170
• 𝑃90 = = = =11.7Buscamos el dato en la posición 11.7, que es
100 100 100
aproximadamente 30.
Interpretación:
• El 25% de las personas tienen 14 años o menos.
• El 50% tienen 21 años o menos (mediana).
• El 90% tienen 30 años o menos.
Si dos grupos de
estudiantes tienen la
misma calificación
promedio, ¿significa que
tienen el mismo
rendimiento académico?
Hay dos listas de
calificaciones:
Grupo A: 70, 72, 75, 78, 80
Grupo B: 50, 60, 75, 90, 100
¿En cuál grupo hay mayor
variabilidad?
Medidas de dispersión
Indican qué tan alejados están los datos del valor central
(media).
Se usan para evaluar consistencia y variabilidad en un
conjunto de datos.
Tipos de medidas de dispersión
Rango (R): Diferencia entre el valor máximo y el mínimo.
𝑅=𝑋max−𝑋min
Desviación media (DM): Promedio de las diferencias absolutas
entre cada dato y la media.
∑∣𝑋݅−x̅∣
𝐷𝑀=
݊
Varianza (𝜎2): Promedio de las diferencias cuadráticas entre
cada dato y la media.
∑(𝑋݅−x̅ ) 2
𝜎2 =
݊
Desviación estándar (𝜎): Raíz cuadrada de la varianza,
representa la dispersión en las mismas unidades que los
datos.
𝜎 = 𝜎2
Importancia de la desviación estándar:
• Valores altos → datos más dispersos.
• Valores bajos → datos más agrupados.
Conjunto de datos:
10,12,14,16,18
Rango:
Media:
Desviación media:
Varianza
Desviación estándar: