Probabilidades y Estadística Universidad San Sebastian
Formulario de estadistica descriptiva
1. Medidas de tendencia central
Media aritmética:
• Datos no agrupados:
Pn
i=1 xi
x= ,
n
• Datos agrupados en clases individuales:
Pk
i=1 xi · n i
x=
n
• Datos agrupados en intervalos de clase:
Pk
i=1 mi · ni
x=
n
Donde k: nº de categorias o clases. mi : marca de clase de la categoria i.
Mediana: Divide a un conjunto de datos en 2 partes iguales.
• Datos no agrupados:
1) Ordenar los los datos de menor a mayor
2) La mediana es:
X( n+1 ) si n es impar
(
Me = 2
X( n ) +X( n +1)
2
2
2
si n es par
• Datos agrupados en clases individuales:
1) Determinar la posición de la mediana: n+1 2
2) Se identifica el valor de la frecuencia acumulada Ni que supera inmediatamente a la
posición de la mediana. Luego M e = xi
Probabilidades y Estadística Universidad San Sebastian
• Datos agrupados en intervalos de clase:
1) Determinar la posición de la mediana: n+1
2
y ubicar el intervalo mediano, cuya frecuen-
cia absoluta acumulada Ni supere inmediatamente a la posición de la mediana o puede
observar Fi .
2) Aplicar:
n
− Ni−1
2
M e = Linf + · Ci
ni
Donde:
Linf : Limite inferior de intervalo mediano
Ni−1 : Frecuencia acumulada anterior a la del intervalo mediano
ni : Frecuencia absoluta del intervalo mediano.
Ci : Amplitud del intervalo mediano.
Moda:
• Datos no agrupados:
La moda es el valor más comun o que más veces se repite en un conjunto de datos.
• Datos agrupados en clases individuales: La moda corresponde a la categoria o clase que
tiene mayor frecuencia absoluta.
• Datos agrupados en intervalos de clase:
na
M o = Linf + · Ci
na + nb
Donde:
na = ni − n(i−1)
nb = ni − n(i+1)
Ci : Amplitud del intervalo
Linf : Limite inferior de intervalo modal
ni : Frecuencia absoluta del intervalo modal
n(i−1) : Frecuencia absoluta anterior a la del intervalo modal.
n(i+1) : Frecuencia absoluta siguiente a la del intervalo modal.
2. Medidas de posición:
Cuartiles: Divide a un conjunto de datos en 4 partes iguales(Q1 , Q2 y Q3 )
Percentiles: Divide a un conjunto de datos en 100 partes iguales (P1 , P2 , · · · P99 )
Usando la fórmulas de percentiles puede calcular cuatiles, deciles o cualquier partición que
desee.
Probabilidades y Estadística Universidad San Sebastian
• Datos no agrupados
1) Se ordenanan los datos de menor a mayor
2) El percentil estará en la posición:
X( n·k ) , k = 1, 2, · · · 99
100
• Datos agrupados en clases individuales: Si la tabla de distribución de frecuencias es una
variable representada por valores o categorías, la posición del percentil estará representada
por el valor que concentre los porcentajes del 1 al 99% de las observaciones.
• Datos agrupados en intervalos de clase:
" #
nk
100
− Ni−1
Pk = Linf + · Ci
ni
Donde:
Linf : Límite inferior del intervalo cuantílico, que es aquel cuya frecuencia Ni es mayor o
supera inmediatamente al cuociente 100 nk
o se puede observar la frecuencia Fi .
Ni−1 : Frecuencia absoluta acumulada anterior a la del intervalo cuantílico. ni : Frecuencia
absoluta del intervalo cuantílico.
Ci : Amplitud del intervalo cuantílico.
3. Medidas de dispersión
• Varianza muestral:
– Datos no agrupados
Pn Pn
− x)2
i=1 (xi x2i − n · x2
2
S = o S2 = i=1
n−1 n−1
– Datos agrupados en clases individuales:
Pn Pn
2
i=1 (xi − x) · ni (x2 · ni ) − n · x2
2
S = o S = i=1 i
2
n−1 n−1
– Datos agrupados en intervalos de clase:
Pn Pn
2
i=1 (mi − x) · ni (m2 · ni ) − n · x2
2
S = o S = i=1 i
2
n−1 n−1
• Desviación estandar muestral: Corresponde a la raíz cuadrada de la varianza:
√
S = S2
Probabilidades y Estadística Universidad San Sebastian
• Coeficiente de variación: Se suele ocupar el coeficiente de variación para establecer rangos
de homogeneidad o heterogeneidad de los datos, estas medidas no son rangos estrictos y
sirven más que nada de indicador.
S
CV = · 100%
x
4. Modelos de regresión lineal simple
• Covarianza Pn
i=1 xi y i
cov(x, y) = −x·y
n
• Correlación
cov(x, y)
cor(x, y) =
Sx · Sy
Donde:
rP
x2i
Sx = − x2
rPn
yi2
Sy = − y2
n
• Recta de regresión estimada:
yb = βb0 + βb1 x
• Parámetros estimados:
βb0 = y − βb1 x
cov(x, y)
βb1 =
Sx2
5. Probabilidades
• P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
• P (A)c = 1 − P (A)
• P (A ∩ B) = P (A) + P (B) − P (A ∪ B)
• P (A ∩ B c ) = P (A) − P (A ∩ B)
• P (A ∩ B) = P (A) · P (B) , si A y B son independientes.
Probabilidades y Estadística Universidad San Sebastian
6. Probabilidades condicionales
• P (A/B) = P (A∩B)
P (B)
• P (A ∩ B) = P (A/B) · P (B)
• Teorema de probabilidad total:
n
X
P (B) = P (B/Ai )P (Ai )
i=1
• Teorema de Bayes
P (B/Ai )P (Ai )
P (Ai /B) =
P (B)