MEDIDAS DESCRIPTIVAS
Hay tres grandes
familias de indicadores
de descripcin de
datos
Medida
s
de
posicin
Medidas de
tendencia central
o promedios
MEDIA ARIMETICA
MEDIA GEOMETRICA
MEDIA ARMONICA
MEDIANA
Medidas de
localizacin
Medidas de
asimetra
Medidas de
dispersin o variacin
DESVIACION STANDARD
COEFICIENTE DE PEARSON
INDICE POR CUARTILES
CURTOSIS
RANGO, RANGO INTERCUARTIL
VARIANZA
COEF. DE VARIACION
MODA
CUANTILES
MEDIDAS DE POSICION
Las medidas de posicin reflejan la tendencia
central y la localizacin de los datos.
Las medidas de tendencia central, denominadas
tambin promedios, ubican el centro de los datos,
como la media aritmtica, la media geomtrica, la
media armnica y la mediana.
Las medidas de localizacin indican el lugar de los
datos ms frecuentes, como la moda, o de los
menos frecuentes, como los cuantiles.
MEDIDAS DE DISPERSION O
VARIACION
Con las medidas de Tendencia Central es posible
determinar el centro de una distribucin, pero no
indican que tan cercanos o lejanos estn los datos
de ese promedio.
La dispersin se calcula entonces para evaluar la
confiabilidad de ese promedio que se est
utilizando. Cuando la dispersin es pequea, los
datos estn concentrados alrededor de su promedio
y viceversa.
MEDIDAS DE TENDENCIA CENTRAL
MEDIA ARITMTICA
Es la suma de los valores observados de la
variable,
dividido
entre
el
nmero
de
observaciones.
Media aritmtica de datos no tabulados o media
aritmtica simple.
Se calcula utilizando la frmula:
10
x=
xi
i1
Ej.. Los siguientes datos corresponden a los
ingresos (en soles) de 10 trabajadores del
sector salud.
900, 800, 900, 1200, 950, 800, 700, 1300, 800,
1200
a) calcular
10 el ingreso promedio.
xi
i1
x=
n
= 900+800+. . .+ 1200 = 955
10
Es decir el ingreso promedio de los 10
trabajadores del sector salud es 955 soles.
Media aritmtica de datos tabulados
Media Para Variable Discreta (media
ponderada). k
fixi
i 1
x =
n
Ejemplo. Calcular el promedio de notas de 20
alumnos,
si 3 alumnos tienen 16, 4 alumnos
tienen 14, 8 alumnos tienen 13 y 5 tienen 11
k
x = fixi
= 3*16+ 4*14+8*13 + 5*11 =
13.15
n
20
i 1
Media aritmtica de datos tabulados por intervalos.
(Media Para Variable Continua).
La media aritmtica para datos agrupados en
intervalos se define como:
k
fix' i
x =
i 1
n
Ejemplo. Calcular el peso promedio de las personas de
una universidad en base a una muestra de 100.
PESOS
[Link]- MARCA DE
NAS
CLASE
f x Xi
[54-60>
20
57
1,140
[60-66>
29
63
1,827
[66-72>
28
69
1,932
[72-78]
23
75
1,725
Total=
6,624
n = 100
fix' i
i 1
6,624
100
66,24
El peso promedio de la poblacin se calcula en 66.24
Kilos.
Observar que si sacamos la media simple de los 100
datos, lo mas probable es que los resultados difieran.
Desventaja de la media aritmtica.
La media aritmtica depende de
todos los valores observados, y es
afectada por valores extremos. Ej:
a.- 5, 10, 8, 9
x1 = 8.00
b.- 5, 10, 8, 50
c.- 5, 10, 8, 0
x2 = 18.50
x3 = 5.75
LA MEDIANA
La mediana es el punto medio de los valores
despus de ordenarlos de menor a mayor o de
mayor a menor. Hay tantos valores por encima de
la mediana como por debajo de ella en la
ordenacin de los datos.
Su caracterstica particular es que depende del
nmero de datos observados y no de los valores
de esos datos.
Se puede aplicar a datos no tabulados y a datos
tabulados. Veremos solo el caso de los datos no
tabulados:
MEDIANA DE DATOS NO TABULADOS
Si n valores de alguna variable X son ordenados
en forma creciente:
X1 < X2 < X3 < ..............< Xn
Entonces si n es impar la mediana es X(n+1)/2
Y si n es par, la mediana es Xn/2 + X(n+2)/2
2
Ej 1: Hallar la mediana para: 40, 43, 39, 19, 44.
Ej 2: Hallar la mediana para: 3, 12, 16, 46, 39, 1.
MODA
La moda simple es el valor de la observacin que
aparece con mas frecuencia.
Es una medida menos importante que la mediana
debido a su ambigedad.
La moda tiene la desventaja que no siempre existe,
y si existe no siempre es nica.
Tambin se puede hallar moda para datos no
tabulados y moda para datos tabulados.
Ejemp. Moda de datos no tabulados:
Si tengo las siguientes edades en un grupo de 12
personas (35, 41, 31, 33, 34, 28, 31, 32, 34, 29, 33,
34) Cual es la moda simple?
RELACION ENTRE LA MEDIA, LA MEDIANA
Y LA MODA:
1.- Si la distribucin de frecuencias es simtrica:
X = Me = Mo
2.- Si la distribucin es asimtrica cola a la
derecha:
Mo < Me < X
3.- Si la distribucin es asimtrica cola a la
izquierda:
X < Me < Mo
1.- Si tenemos como valores de la variable x =1, 3,
3, 4, 5 y 7, que nos indican la cantidad de autos
vendidos diariamente, y el n es 6 das, hallar la:
X, Me y Mo de los datos:
X
= 3.8 (El promedio de autos vendidos
al da es 3.8)
Me = 3.5 (La mitad de los das vendo menos
de 3.5 autos y la mitad de das
vendo mas de 3.5 autos.
Mo = 3.0 (La mayora de los das vendo 3
autos).
MEDIDAS DE DISPERSION O
VARIACION
Con las medidas de Tendencia Central es posible
determinar el centro de una distribucin, pero no
indican que tan cercanos o lejanos estn los datos
de ese promedio.
La dispersin se calcula entonces para evaluar la
confiabilidad de ese promedio que se est
utilizando. Cuando la dispersin es pequea, los
datos estn concentrados alrededor de su promedio
y viceversa.
Si ponemos una empresa que comercializa arroz y
vamos a vender bolsas de un kilo, la mquina
llenadora y selladora de bolsas debe estar lo mas
ajustada posible a fin de que la varianza sea la
menor posible a pesar de que las bolsas tengan
como media un kilo. Es fcil imaginar lo rpido que
quebrara el negocio si muchas bolsas tuvieran 700
Grm, 800 Grm. y otras 1.2 Kg., o 1.3 Kg.
RANGO
Es la diferencia entre el valor mas alto y el menor
valor de una serie de datos.
R = Xmax - Xmin.
VARIANZA
Es una mediada que cuantifica el grado de dispersin
o variacin de los valores de una variable cuantitativa
con respecto a su media aritmtica. Se define como
la media aritmtica de los cuadrados de las
diferencias de los datos con respecto a su media
aritmtica. La varianza de una muestra se denota s 2,
2
mientras que la de una poblacin se denota
.
DESVIACION ESTANDAR
Es la raz cuadrada positiva de la Varianza, y se
denota como s cuando se saca de una muestra y
como
cuando se obtiene de una poblacin.
VARIANZA Y DESVIACIN ESTANDAR PARA
POBLACIN
Datos no tabulados
2
=
(Xi - )2
N
Datos tabulados
2
=
f i (Xi N
)2
(Xi N
)2
f i (Xi N
)2
VARIANZA Y DESVIACIN ESTANDAR PARA
MUESTRA
Datos no tabulados
S2=
(Xi - X )2
n-1
S=
(Xi - X )2
n-1
Datos tabulados
S2=
f i (Xi - X )
n-1
S=
f i (Xi - X )2
n-1
Ejemplo: (Datos no tabulados)
Determinar la Varianza y Desviacin Estndar de
los siguientes datos que corresponden a los
pesos en kilos de cinco pequeos chanchos que
posee un granjero:
5, 10, 8, 9 y 20
La media es:
= 10.4
Entonces la Varianza es:
2
= (5-10.4)2+(10-10.4)2+...+(20-10.4)2
5
2
= 129.2 / 5 = 25.84
Y la Desviacin Estndar es:
= 5.08
COEFICIENTE DE VARIACION
Es una medida de dispersin relativa que
proporciona una estimacin de la magnitud de las
desviaciones con respecto a la magnitud de la media
C.V. =
S
X
C.V. = S x 100%
X
Es til para comparar la variabilidad de dos o mas
series de datos que tengan distintas unidades de
medida y/o distintas medias aritmticas.
Ejemp.:
Las medidas tomadas con un micrmetro al
dimetro de una produccin de cojinetes, tienen una
media de 3.98 mm. y una desviacin estndar de
0.014 mm., mientras que las medidas tomadas a
otra muestra de resortes sin extender, tienen una
media de 1.59 pulgadas y una desviacin estndar
de 0.009 pulgadas. Qu grupo de objetos tiene una
mayor variabilidad?
C.V.1 = (0.014 / 3.98) x 100% = 0.35%
C.V.2 = (0.009 / 1.59) x 100% = 0.57%