Formulario de Estadística Descriptiva
Medidas de Posición, Tendencia Central y de Dispersión, para un conjunto de 𝒏 elementos, valores: 𝒙𝟏 , 𝒙𝟐 , … , 𝒙𝒏
Para Datos Muestral
𝑥(𝑘) +𝑥(𝑘+1)
Cuantil 𝑝, 𝑞𝑝 , 𝑠𝑖 𝑘 𝑒𝑠 𝑒𝑛𝑡𝑒𝑟𝑜
𝑞𝑝 = { 2 donde 𝑘 = 𝑛𝑝 y 𝑘 ∗ es el entero inmediatamente superior a 𝑘
con 0 ≤ 𝑝 ≤ 1 𝑥(𝑘 ∗ ) , 𝑠𝑖 𝑘 𝑛𝑜 𝑒𝑠 𝑒𝑛𝑡𝑒𝑟𝑜
𝑥 𝑛+1 , 𝑠𝑖 𝑛 𝑒𝑠 𝑖𝑚𝑝𝑎𝑟
( )
2
Mediana 𝑚𝑒 = {
𝑥(𝑛) + 𝑥(𝑛+1) , 𝑠𝑖 𝑛 𝑒𝑠 𝑝𝑎𝑟
2 2
Moda 𝑚𝑜 = 𝑥𝑖 , si 𝑛𝑖 es máximo
𝑛 elementos, 𝑘 valores : 𝑥1 , 𝑥2 , … , 𝑥𝑘 , y 𝑘
𝑛
1 frecuencias: 𝑛1 , 𝑛2 , … , 𝑛𝑘
Media 𝑥̅ = ∑ 𝑥𝑖 𝑘
𝑛 1
𝑖=1 𝑥̅ = ∑ 𝑛𝑖 𝑥𝑖
𝑛
𝑖=1
𝑛 𝑛 𝑘 𝑛
1 1 1 1
Varianza 𝑆𝑋2 = ∑(𝑥𝑖 − 𝑥̅ )2 = {∑ 𝑥𝑖2 − 𝑛𝑥̅ 2 } 𝑆𝑋2 = ∑ 𝑛𝑖 (𝑥𝑖 − 𝑥̅ )2 = {∑ 𝑛𝑖 𝑥𝑖2 − 𝑛𝑥̅ 2 }
𝑛−1 𝑛−1 𝑛−1 𝑛−1
𝑖=1 𝑖=1 𝑖=1 𝑖=1
Desviación estándar 𝑆 = √𝑆𝑋2
Coeficiente de 𝑆𝑋
variación 𝑐𝑣𝑋 =
𝑥̅
Puntuación 𝑥𝑖 −𝑥̅
estandarizada
𝑧𝑖 = luego: 𝑧̅ = 0 y 𝑆𝑧2 = 1
𝑆𝑋
Estadísticas a partir de una tabla de distribución de frecuencias
𝑘
𝑃𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 𝑘, 𝑃𝑘 Identificamos el intervalo 𝑖, tal que: 𝐹𝑖−1 < ≤ 𝐹𝑖
100
𝑐𝑜𝑛: 𝐴 𝑘
0 ≤ 𝑘 ≤ 100 ⟹ 𝑃𝑘 = 𝐿𝑖 + ( − 𝐹𝑖−1 )
𝑓𝑖 100
Identificamos el intervalo 𝑖, tal que: 𝐹𝑖−1 < 0.50 ≤ 𝐹𝑖
Mediana 𝐴
⟹ 𝑚𝑒 = 𝐿𝑖 + (0.50 − 𝐹𝑖−1 )
𝑓𝑖
Identificamos el intervalo 𝑖, tal que: 𝑓𝑖 es la máxima
frecuencia
Moda
(𝑓𝑖 − 𝑓𝑖−1 )
⟹ 𝑚𝑜 = 𝐿𝑖 + 𝐴 [ ]
(𝑓𝑖 − 𝑓𝑖−1 ) + (𝑓𝑖 − 𝑓𝑖+1 )
donde:
𝑘
𝐿𝑖 = límite inferior del intervalo 𝑖
𝑓𝑖 = frecuencia relativa del intervalo 𝑖 Media 𝑥̅ = ∑ 𝑓𝑖 𝑚𝑖
𝑖=1
𝐹𝑖−1 = Frecuencia relativa acumulada del 𝑖 − 1
𝑘 𝑛
intervalo 𝑛 𝑛
Varianza 𝑆𝑋2 = ∑ 𝑓𝑖 (𝑚𝑖 − 𝑥̅ )2 = {∑ 𝑓𝑖 𝑚𝑖2 − 𝑛𝑥̅ 2 }
𝐴 = Amplitud del intervalo. 𝑛−1 𝑛−1
𝑖=1 𝑖=1
Desviación
estándar 𝑆 = √𝑆𝑋2
Diagrama de cajas
Primer cuartil: 𝑄1 = 𝑃25
Segundo cuartil = Mediana: 𝑄2 = 𝑃50
Tercer cuartil: 𝑄3 = 𝑃75
Rango intercuartil: 𝑅𝐼𝐶 = 𝑄3 − 𝑄1 = 𝑃75 – 𝑃25
Límites máximo y mínimo para valores extremos:
𝐿𝑖𝑛𝑓 = 𝑄1 – 1.5 𝑅𝐼𝐶 y 𝐿𝑠𝑢𝑝 = 𝑄3 + 1.5 𝑅𝐼𝐶
Indicadores de Forma
Pearson
Coeficiente de asimetría 𝑋̅ − 𝑄2
𝐴𝑠 = 3 ( )
𝑆𝑋
Propiedades de Media y Varianza para transformación de variables aleatorias
Combinación de V.A. Media Varianza
𝑌 = 𝑎 + 𝑏𝑋 𝑦̅ = 𝑎 + 𝑏 𝑥̅ 𝑆𝑌2 = 𝑏 2 𝑆𝑋2
Si 𝑿 y 𝒀 son variables independientes:
𝑊 = 𝑎𝑋 + 𝑏𝑌 𝑤
̅ = 𝑎 𝑥̅ + 𝑏 𝑦̅ 2
𝑆𝑊 = 𝑎2 𝑆𝑊
2
+ 𝑏 2 𝑆𝑌2
Propiedades de Media y Varianza para la unión de grupos distintos de unidades estadísticas
Si dos conjuntos de
Total de
Media Varianza
tamaño 𝑛1 y 𝑛2 , tienen unidades
medias ̅̅̅
𝑥1 y ̅̅̅
𝑥2 y 1 1 (𝑛1 − 1)𝑆12 + (𝑛2 − 1)𝑆22
varianzas 𝑆12 y 𝑆22 𝑛 = 𝑛1 + 𝑛2 𝑥̅ = (𝑛 ̅̅̅
𝑥 + 𝑛2 ̅̅̅)
𝑥2 𝑆2 = [ ]
𝑛 1 1 𝑛 − 1 +𝑛1 𝑥12 + 𝑛2 𝑥22 − 𝑛𝑥̅ 2
Relación lineal entre 2 variables 𝑿 y 𝒀
Para Datos Muestral
𝑛 elementos, valores: 𝑥1 , 𝑥2 , … , 𝑥𝑛 , 𝑦1 , 𝑦2 , … , 𝑦𝑛
1 1
Covarianza 𝑆𝑋𝑌 = ∑𝑛𝑖=1(𝑥𝑖 − 𝑋̅)(𝑦𝑖 − 𝑌̅ ) = (∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖 − 𝑛 𝑋̅ ̅𝑌)
𝑛−1 𝑛−1
Coeficiente de correlación 𝑆𝑋𝑌
𝐶𝑜𝑟𝑟(𝑋, 𝑌) = 𝑟 =
lineal de Pearson: 𝑆𝑋 𝑆𝑌
𝑆𝑌 𝑆𝑋𝑌
Regresión lineal 𝐿: 𝑌̂ = 𝑎 + 𝑏 𝑋, donde: 𝑏 = 𝑟 = 2 y 𝑎 = 𝑌̅ − 𝑏𝑋̅
𝑆𝑋 𝑆𝑋
Coeficiente de 𝑉𝑎𝑟(𝑌̂) 𝑆𝑌2̂
Determinación:
𝑅2 = = = 𝑟2
𝑉𝑎𝑟(𝑌) 𝑆𝑌2