0% encontró este documento útil (0 votos)
22 vistas23 páginas

Pye 06

El documento aborda conceptos fundamentales de estadística descriptiva, incluyendo medidas de tendencia central como media, mediana y moda, así como medidas de localización y dispersión. Se explican fórmulas y ejemplos para calcular cuartiles, deciles y percentiles, además de la importancia de la desviación estándar en la evaluación de la variabilidad de los datos. Estos conceptos son esenciales para el análisis de datos y la toma de decisiones informadas.

Cargado por

4394
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
22 vistas23 páginas

Pye 06

El documento aborda conceptos fundamentales de estadística descriptiva, incluyendo medidas de tendencia central como media, mediana y moda, así como medidas de localización y dispersión. Se explican fórmulas y ejemplos para calcular cuartiles, deciles y percentiles, además de la importancia de la desviación estándar en la evaluación de la variabilidad de los datos. Estos conceptos son esenciales para el análisis de datos y la toma de decisiones informadas.

Cargado por

4394
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Probabilidad y Estadística

U1. Estadística Descriptiva


MEDIDAS DE TENDENCIA
CENTRAL, LOCALIZACIÓN
Y DISPERSIÓN
Profesor: I.I. Johnnathan Fernando Gutiérrez Cruz
[Link]@[Link]
833 2800 500

1
Objetivo de la clase:
Comprender los conceptos de
media, mediana y moda,
cuartiles, deciles y percentiles
su importancia en la
estadística y su aplicación en
la toma de decisiones a partir
del análisis de datos.
Analicemos las
calificaciones en un
examen:
70,80,85,90,95,100,100
¿Cómo describirían el
desempeño del grupo?
Los conceptos de tendencia central permiten identificar un
valor representativo dentro de un conjunto de datos. Estos
son la media, mediana y moda, y se utilizan ampliamente en
la estadística para resumir información y facilitar la toma de
decisiones.
Media (Promedio)
Es el valor obtenido al sumar todos los datos y dividir el
resultado entre el número total de datos.
Fórmula:
Σ𝑋𝑖
𝑋=
𝑛
• Ejemplo:
Si las calificaciones de 5 alumnos en un examen son 80, 85,
90, 95, 100, la media se calcula así:

80 + 85 + 90 + 95 + 100
𝑋=
5

450
𝑋=
5

𝑋 = 90
Mediana
Es el valor central cuando los datos están ordenados de menor
a mayor. Si el número de datos es impar, es el valor en la
posición media; si es par, es el promedio de los dos valores
centrales.
• Ejemplo 1 (número impar de datos):
Datos: 12, 15, 18, 20, 25
Mediana = 18 (porque es el valor central).
• Ejemplo 2 (número par de datos):
Datos: 10, 12, 15, 18, 20, 25
Mediana = (15+18)/2=16.5
Moda
Es el valor que más veces se repite en un conjunto de datos.
Puede haber:
• Una moda (unimodal) si hay un solo valor con mayor
frecuencia.
• Dos modas (bimodal) si hay dos valores con la misma
frecuencia más alta.
• Multimodal si hay más de dos valores con la misma
frecuencia más alta.
• Sin moda si ningún valor se repite.
Ejemplo:
Datos: 3, 4, 5, 5, 6, 7, 7, 7, 8
Moda = 7 (porque aparece con más frecuencia).
Siendo el siguiente conjunto de datos:
12,15,20,20,22,24,25,30,30,30,35
Cálculo de medidas:
Media:
Mediana:
Moda:
Medidas de Localización
Las medidas de localización permiten dividir un conjunto de
datos ordenados en partes iguales, facilitando el análisis de la
distribución de los valores. Se utilizan en estudios estadísticos
para identificar valores clave dentro de un conjunto de datos.
Cuartiles (𝑸𝒌 )
Los cuartiles dividen un conjunto de datos ordenados en cuatro partes
iguales.
• Fórmulas para calcular los cuartiles:
𝑘(𝑛 + 1)
𝑄𝑘 = é𝑠𝑖𝑚𝑜 𝑑𝑎𝑡𝑜
4
Donde:
• 𝑘 = número del cuartil (1, 2 o 3)
• 𝑛 = cantidad total de datos
Interpretación de los cuartiles:
• 𝑄1 ​ (Primer Cuartil): El 25% de los datos están por debajo de este valor.
• 𝑄2 (Mediana o Segundo Cuartil): El 50% de los datos están por debajo de
este valor.
• 𝑄3 ​ (Tercer Cuartil): El 75% de los datos están por debajo de este valor.
Deciles (𝑫𝒌 )
Los deciles dividen los datos en diez partes iguales.
Fórmula para calcular los deciles:
𝑘(𝑛 + 1)
𝐷𝑘 = é𝑠𝑖𝑚𝑜 𝑑𝑎𝑡𝑜
10
• 𝑘 = número del decil (1 a 9)
• 𝑛 = cantidad total de datos
Interpretación de los deciles:
• 𝐷1 : El 10% de los datos están por debajo de este valor.
• 𝐷5 : Corresponde a la mediana (50% de los datos por debajo).
• 𝐷9 : El 90% de los datos están por debajo de este valor.
Percentiles (𝐏𝒌 )
Los percentiles dividen los datos en cien partes iguales y son muy
utilizados en pruebas estandarizadas, como exámenes académicos o
análisis de crecimiento infantil.
Fórmula para calcular los percentiles:

𝑘(𝑛 + 1)
𝑃𝑘 = é𝑠𝑖𝑚𝑜 𝑑𝑎𝑡𝑜
100
• 𝑘 = número del percentil (1 a 99)
• 𝑛 = cantidad total de datos
Interpretación de los deciles:
• 𝑃25 : Primer cuartil (Q1)
• 𝑃50 : Segundo cuartil (Q2 o Mediana)
• 𝑃75 : Tercer cuartil (Q3)
• 𝑃90 : El 90% de los datos están por debajo de este valor.
Conjunto de datos ordenado (edades de 12 personas):
10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32

Cálculo de cuartiles:
• Q1=
• Q2=
• Q3=

• Cálculo de percentil 90 (𝑃90 ​)


• 𝑃90 =
Conjunto de datos ordenado (edades de 12 personas):
10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32

Cálculo de cuartiles:
1(12+1) 13
• Q1= 𝑄1 = = ​=3.25 → Aproximamos al tercer dato: 14.
4 4
2(12+1) 26
• Q2= 𝑄2 = = ​ ​=6.5 → Tomamos el promedio entre los valores 20 y 22:
4 4
20+22
𝑄2 = ​=21
2
2(12+1) 26
• Q3= 𝑄2 = = ​ ​=9.75 → Aproximamos al noveno dato: 26.
4 4

• Cálculo de percentil 90 (P90P_{90}P90​)


90(12+1) 90∗13 1170
• 𝑃90 = = = =11.7Buscamos el dato en la posición 11.7, que es
100 100 100
aproximadamente 30.
Interpretación:
• El 25% de las personas tienen 14 años o menos.
• El 50% tienen 21 años o menos (mediana).
• El 90% tienen 30 años o menos.
Si dos grupos de
estudiantes tienen la
misma calificación
promedio, ¿significa que
tienen el mismo
rendimiento académico?
Hay dos listas de
calificaciones:
Grupo A: 70, 72, 75, 78, 80
Grupo B: 50, 60, 75, 90, 100
¿En cuál grupo hay mayor
variabilidad?
Medidas de dispersión
Indican qué tan alejados están los datos del valor central
(media).
Se usan para evaluar consistencia y variabilidad en un
conjunto de datos.
Tipos de medidas de dispersión
Rango (R): Diferencia entre el valor máximo y el mínimo.
𝑅=𝑋max−𝑋min

Desviación media (DM): Promedio de las diferencias absolutas


entre cada dato y la media.
∑∣𝑋݅−x̅∣
𝐷𝑀=
݊
Varianza (𝜎2): Promedio de las diferencias cuadráticas entre
cada dato y la media.
∑(𝑋݅−x̅ ) 2
𝜎2 =
݊

Desviación estándar (𝜎): Raíz cuadrada de la varianza,


representa la dispersión en las mismas unidades que los
datos.
𝜎 = 𝜎2
Importancia de la desviación estándar:
• Valores altos → datos más dispersos.
• Valores bajos → datos más agrupados.
Conjunto de datos:
10,12,14,16,18
Rango:

Media:

Desviación media:

Varianza

Desviación estándar:

También podría gustarte