0% encontró este documento útil (0 votos)
22 vistas32 páginas

Medidas de Resumen en Estadística

Este documento explica diferentes medidas de resumen o estadígrafos como la media, mediana y moda. Describe cómo calcular estas medidas para datos simples y agrupados, y sus ventajas y desventajas.

Cargado por

Rafael
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
22 vistas32 páginas

Medidas de Resumen en Estadística

Este documento explica diferentes medidas de resumen o estadígrafos como la media, mediana y moda. Describe cómo calcular estas medidas para datos simples y agrupados, y sus ventajas y desventajas.

Cargado por

Rafael
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Medidas de Resumen: Análisis e

interpretación de los resultados

93
MEDIDAS DE RESUMEN

Análisis e interpretación de los resultados

Se estudió los cuadros y gráficos estadísticos en la unidad anterior como


formas para ordenar y describir un conjunto de datos para tomar
decisiones. Sin embargo el análisis resulta incompleto, para esto se utiliza
ciertos indicadores.

Estos indicadores llamados medidas de resumen o ESTADÍGRAFOS


permiten hallar un solo valor numérico, el mismo que representa a toda la
población o muestra en estudio.

Los estadígrafos o medidas de resumen más importante son:

De tendencia central: media, mediana y la moda.


De posición: cuartiles, deciles y percentiles.
De dispersión: varianza, desviación estándar, y coeficiente de variación.
De forma: asimetría y el coeficiente de kurtosis.

3.1. MEDIDAS DE TENDENCIA CENTRAL

Son estadísticos que permiten hallar el valor numérico que indica el


"centro" de un conjunto de datos; señalando la característica que destaca
en la información.

3.1.1. La media o promedio aritmético ( x )


Es la más estable y se obtiene de acuerdo a lo siguiente:

a) Media aritmética para datos simples (en serie):

Proceso: Sumar todos los valores de la variable y dividir entre el número


de datos que se han sumado.

_
x
x= n
94
b) Media aritmética para datos agrupados: (en tablas):
Proceso: Sumar todos los valores de la variable o marca de clase
multiplicados por la frecuencia absoluta simple y dividir entre el número
de datos o la suma de las frecuencias absolutas simples.

x=
xf
f
Ventajas de la media aritmética:
- Es útil cuando los datos están distribuidos en forma normal o
simétrica.
- Es de gran estabilidad porque toma en cuanta todos los datos.
- Nos permite probar parámetros en inferencia estadística.

Desventajas de la media aritmética:


- Puede ser afectado por valores extremos.
- Cuando los datos agrupados tienen clases abiertas en los extremos, no
es recomendable calcular el promedio.

3.1.2. Mediana (Me)


Es el estadístico que representa el punto medio de los datos en el cual cae
el 50% de puntuaciones. Se obtiene de acuerdo a lo siguiente:
a) Mediana para datos simples (en serie):
Es el valor medio (cuando la serie es impar) o la semisuma de los dos
valores medios (cuando la serie es par); del conjunto de datos previamente
ordenados en forma creciente.
(*) La mediana se utiliza también en variables ordinales

95
Ej: Se tiene la siguiente información sobre el número de alumnos
repitentes por años de estudios de la carrera de contabilidad en la UPeU.

AÑOS fi 1 Fi 2
Primero 25 25
Segundo 14 39 Clase mediana.
Tercero 6 45
Cuarto 9 54
Quinto 2 56
Total 56

Proceso:
1. Se calcula la suma de las frecuencias absolutas simples entre 2 así:

f =
56
= 28
2 2
2. El valor inmediatamente superior o igual a 28 se busca en la columna
de la tabla que corresponde a la frecuencia absoluta acumulada F i (en
este ejemplo corresponde a 39, porque 25 es menor que 28).
3. Luego se observa la primera columna donde se encuentra la variable,
en la fila donde se observó el número 39, el valor de la variable que se
encuentra en esa fila corresponde a la mediana.
Me = Segundo.

Interpretación: La mitad de los estudiantes repitentes lo hacen como


máximo hasta segundo año, aproximadamente la otra mitad repiten
categorías superiores al segundo año.

b) Mediana para datos agrupados:


Cuando los datos se encuentran agrupados en una tabla de distribución de
frecuencias, la mediana se encuentra utilizando la siguiente fórmula:

1
fi : frecuencia absoluta simple
2
Fi : frecuencia absoluta acumulada.
96
n 
 − Fi −1 
Me = Linf + c  
2
fi

Donde
Linf : Limite inferior del intervalo que contiene a la mediana
c : Amplitud del intervalo
n : Número total de datos
Fi −1 : Frecuencia absoluta acumulada anterior a la clase mediana
fi : Frecuencia (o frecuencia absoluta) de la clase mediana.
n
Lugar de la Mediana, Me : .
2

Ventajas de la mediana:

- No está afectada por valores extremos, y por lo tanto es más


representativa que el promedio, cuando las series son poco simétricas.
- Es útil cuando los datos agrupados tienen clases abiertas en los
extremos (es decir no tiene límite inferior en la primera clase ni límite
superior en la última clase).
- Se aplica a variables que pertenecen a la escala ordinal.

3.1.3. La moda (Mo)


Nos indica el valor o cualidad que se repite con mayor frecuencia dentro
de una información. Se obtiene de acuerdo a lo siguiente:

a) Moda para datos simples (en serie):

Es el valor que más se repite en una serie.

(*) Es útil cuando la variable en estudio pertenece a la escala nominal.

97
Ejemplo:
Hallar la moda para la siguiente información que consiste en una muestra
de 100 consumidores según preferencia por tipos de panes Unión.

TIPOS DE CONSUMIDORES
PANES (fi)
Integral 25
Americano 20
Fibra 40
Hamburguesa 15
Total 100

Clase modal,
por ser el valor más frecuente (f =40)

Entonces, la moda será el valor que corresponde a la categoría de la


variable, en la clase o fila modal.
Mo = Fibra

Interpretación:
La mayoría de los consumidores de Productos Unión prefiere pan fibra.

b) Moda para datos agrupados:

En este caso la moda se halla mediante la fórmula:

 1 
Mo = Linf + c 

 1 +  2 
Donde
Linf : Limite inferior del intervalo que contiene a la moda
c : Amplitud del intervalo
con 1 = fi − fi −1 ; 2 = fi − fi +1

98
Ventajas de la moda:

- No está afectada por valores extremos.


- Puede usarse cuando los datos agrupados tienen clases abiertas en los
extremos.
- Se usa para variables que pertenecen a la escala nominal.

Desventajas de la moda:

- No es representativa a menos que la distribución contenga un gran


número de datos y exista significativa repetición de alguno de ellos.
- Muchas veces la serie no tiene moda porque ningún valor se repite, en
ese caso se dice que la información es unimodal.
- Cuando la serie tiene 2 modas, se dice que la información es bimodal,
y si tiene más de 2 modas, la información es multimodal. En estos
casos se hace difícil su interpretación y comparación, por lo tanto no se
considera una medida representativa

Ejemplo:
Correspondiente a datos simple (información en serie):

Los datos presentados corresponden a las edades de 8 alumnos del 1er año
de la Facultad de Ciencias Contables y Administrativas:

Edad :
Xi: 18, 20, 23, 17, 18, 19, 23, 18

Calcular la media, mediana y moda e interpretar sus resultados.

Solución:

Media

x=
 x = 18 + 20 + 23 + 17 + 18 + 19 + 23 + 18 = 156 = 19.5 = 20
n 8 8

Interpretación
La edad promedio de los alumnos del 1er año de la Facultad de Ciencias
99
Contables y Administrativas es de 20 años.

Mediana
Me: Es el valor medio (cuando la serie es impar) o la semisuma de los dos
valores medios (cuando la serie es par); del conjunto de datos previamente
ordenados en forma creciente.
En este caso la serie es par, por lo tanto se procede del siguiente modo:

1º Se ordena la serie
17, 18, 18, 18, 19, 20, 23, 23

2º Se particiona la serie por la mitad

17, 18, 18, 18, 19, 20, 23, 23

3º la mediana será la semisuma de los dos valores centrales, por ser la


serie par, es decir 8 datos.

18 + 19
Me = = 18.5 = 19
2
Interpretación:
La mitad de los de los alumnos del 1er año de la Facultad de Ciencias
Contables y Administrativas tiene como máximo 19 años,
aproximadamente la otra mitad tienen más de 19 años.

Moda
Es el valor que más se repite.
Así, en nuestra base de datos.

1º Se ordena la serie
17, 18, 18, 18, 19, 20, 23, 23

2º Se toma el valor que más se repite.

En nuestro ejemplo el 18 se repite 3 veces.

Mo = 18
100
Interpretación:
La mayoría de los alumnos del 1er año de la Facultad de Ciencias
Contables y Administrativas tiene de 20 años de edad.

Ejemplo:
Correspondiente a datos agrupados (información en tablas):
Considerando el ejemplo de distribución de frecuencias para datos
agrupados, en el cual estudiamos el cociente intelectual de 50 alumnos,
página 32
Hallaremos la media, mediana y moda para datos agrupados.

Tabla Nº 1

DISTRIBUCIÓN DE FRECUENCIAS DE LOS PUNTAJES DEL CI


DE 50 ESTUDIANTES DE LA UPeU
Límites de Xi fi Fi Xi fi Xi 2fi
clases
[88 – 94> 91 9 9 819 74529
[94 – 100> 97 6 15 582 56454
[100 – 106> 103 Mo 11 Me 26 1133 116699
[106 – 112> 109 5 31 545 59405
[112 – 118> 115 8 39 920 105800
[118 – 124> 121 3 42 363 43923
[124 – 130> 127 8 50 1016 129032
Total 50 5378 585842

Solución:

Observación: Las sumas de cada columna se encuentran en la fila que


corresponde al total (al final de las columnas).
La clase mediana se ubica con las frecuencias absolutas acumuladas.
La clase modal se ubica con las frecuencias absolutas simples.
Media:

101
x=
x fi i
=
819 + 582 + 1133 + 545 + 920 + 363 + 1016
f i 9 + 6 + 11 + 5 + 8 + 3 + 8
5378
= = 107.56 = 107
50
Interpretación:
El cociente de inteligencia promedio de los alumnos de la Universidad
Peruana Unión es de aproximadamente 107 puntos.

Mediana:

Proceso:
1. ubicamos la clase o fila mediana (intervalo que contenga la mediana):
Lugar de Me: n/2= 50/2= 25 (25 avo. lugar)
Analizando, la mediana se encuentra en la 4ta. Clase.

Este valor se ubica en la columna de las frecuencias acumuladas (F i)


correspondiente a la tabla de datos, considerando el inmediatamente mayor
o igual a 25.
En nuestro ejemplo corresponde a la cuarta fila, pues su frecuencia
acumulada es F4 = 31 y es el inmediatamente superior a 25.
La cuarta fila es la clase mediana y de allí se considera los datos que van a
ser reemplazados en la fórmula.

2. Utilizando la fórmula:
n 
 − Fi −1 
Me = Linf + c  
2
fi

Linf : Límite inferior del intervalo de la clase mediana = 100


n : Número total de datos = 50
Fi-1 : Frecuencia absoluta acumulada anterior a la clase mediana = 15
fi : Frecuencia absoluta simple de la clase mediana = 11

102
c : amplitud interválica: 6

La mediana será:

 50 
 − 15 
Me = 100 + 6   = 105.45
2
11

Interpretación:
La mitad de los estudiantes de la Universidad Peruana Unión tiene un
coeficiente de inteligencia máximo de 105 puntos, aproximadamente la
otra mitad tienen más de 105 puntos.

Moda

Proceso:
1. Se ubica la clase o fila modal (donde se encuentra la moda), ubicando
en la columna de las frecuencias absolutas simples (fi) el mayor valor.

En nuestro ejemplo el mayor valor de las frecuencias absolutas


simples es f3 = 11,

En nuestro ejemplo la clase modal o fila donde se encuentra la moda


es la tercera fila porque en ella se encuentra el mayor valor de las
frecuencias absolutas simples.

2. Utilizando la fórmula:

 1 
Mo = Linf + c 
 1 +  2 

hallando:
1 = fi − fi −1 = 11- 6= 5

103
2 = fi − fi +1 = 11-5= 6

 5 
Mo = 100 + 6   = 102.72
 5+6

Interpretación:
La mayoría de los estudiantes de la Universidad Peruana Unión tiene un
coeficiente de inteligencia de 103 puntos.

3.2. MEDIDAS DE POSICIÓN

Son estadígrafos que dividen a una serie de datos en cuatro, diez o cien
partes iguales.
Estas medidas son:
- Cuartiles
- Deciles
- Percentiles

3.2.1. Cuartiles (Qi )


Son estadígrafos que dividen a la información en cuatro partes iguales,
donde cada uno de ellos es el 25% de la información.

Esquemáticamente se tiene:

Q1 25%
Q2
25% Q3
25%
25%
total 100%

Los cuartiles se calculan con la fórmula siguiente:

104
 ( j )n 
 4 − Fi −1 
Q j = Linf + c  
 fi 
 

Donde:
j : 1,2 ó 3
Linf : Límite inferior del intervalo de la clase cuartílica
n : Número total de datos
Fi-1 : Frecuencia absoluta acumulada anterior a la clase cuartílica
fi : Frecuencia absoluta simple de la clase cuartílica
c : amplitud interválica

3.2.2. Deciles (Di )


Son estadígrafos que dividen a la información en diez partes iguales,
donde cada uno de ellos es el 10% de la información.

Esquemáticamente se tiene:

D1 10%
D2
10% D9
. . .
10%

10%

total 100%

Los deciles se calculan con la fórmula siguiente:

 ( j )n 
 10 − Fi −1 
D j = Linf + c  
 fi 
 

105
Donde:
j : 1,2, 3, … ó 9
Linf : Límite inferior del intervalo de la clase decílica.
n : Número total de datos.
Fi-1 : Frecuencia absoluta acumulada anterior a la clase decílica.
fi : Frecuencia absoluta simple de la clase decílica
c : Amplitud interválica.

3.2.3. Percentiles (Pi )


Son estadígrafos que dividen a la información en cien partes iguales,
donde cada uno de ellos es el 1% de la información.

Esquemáticamente se tiene:

P1 1%
P2
1% P99
. . .
1%
1%
total 100%

Los percentiles se calculan con la fórmula siguiente:

 ( j )n 
 100 − Fi −1 
Pj = Linf + c  
 fi 
 

Donde:
j : 1,2, 3, … ó 99
Linf : Límite inferior del intervalo de la clase percentílica.
n : Número total de datos.
Fi-1 : Frecuencia absoluta acumulada anterior a la clase Percentílica.
106
fi : Frecuencia absoluta simple de la clase percentílica.
c : Amplitud interválica.

Observación:
Generalmente se calculan las medidas de posición para datos agrupados,
pues se tiene una gran cantidad de información.

Ejemplo:
Correspondiente a datos agrupados (información en tablas)

Considerando el ejemplo de distribución de frecuencias para datos


agrupados, en el cual estudiamos el cociente intelectual de 50 alumnos.
Página 32
Hallaremos los cuartiles 1 y 3, los deciles 2 y 8 y los percentiles 10 y 90.

Tabla Nº 1

DISTRIBUCIÓN DE FRECUENCIAS DE LOS PUNTAJES DEL CI DE 50


ESTUDIANTES DE LA UPeU

Intervalo de clase Xi fi Fi
[88 – 94> 91 9 9 P10
[94 – 100> 97 6 15 Q1,D2
[100 – 106> 103 11 26
[106 – 112> 109 5 31
[112 – 118> 115 8 39 Q3,D8
[118 – 124> 121 3 42 P90
[124 – 130> 127 8 50
Total 50

Solución

Cuartil 1 (Q1)

Proceso.
1. Se ubica la clase o fila cuartílica (donde se encuentra el primer cuartil),
utilizando la siguiente fórmula, el valor i, se reemplaza de acuerdo a qué
cuartil se desea encontrar; ya sea el 1, 2 ó 3.

107
i f (1)50
= = 12.5
4 4

2. Este valor se ubica en la columna de las frecuencias acumuladas (F i)


correspondiente a la tabla de datos, considerando el inmediatamente mayor
o igual a 12.5.
En nuestro ejemplo corresponde a la segunda fila, pues su frecuencia
acumulada es F2 = 15 y es el inmediatamente superior a 12.5.

3. La segunda fila es la clase cuartílica y de allí se considera los datos que


van a ser reemplazados en la fórmula.

 ( j )n 
 4 − Fi −1 
Q j = Linf + c  
 fi 
 

Linf : Límite inferior del intervalo de la clase cuartílica = 94


n : número total de datos = 50
Fi-1 : Frecuencia absoluta acumulada anterior a la clase cuartílica = 9
fi : Frecuencia absoluta simple de la clase cuartílica = 6
c : amplitud interválica: = 6

Cuartil 1 será:

 (1)50 
 4 −9
Q1 = 94 + 6   = 97.5
 6 
 

Interpretación:
El 25% de los estudiantes de la Universidad Peruana Unión tiene un
coeficiente de inteligencia máximo de 98 puntos, aproximadamente el
75% restante tienen más de 98 puntos.

108
Cuartil 3 (Q3)

Proceso
1. Se ubica la clase o fila cuartílica (donde se encuentra el tercer cuartil),
utilizando la siguiente fórmula, el valor i, se reemplaza de acuerdo a
qué cuartil se desea encontrar; ya sea el 1, 2 ó 3.

j (n) (3)50
= = 37.5
4 4
2. Este valor se ubica en la columna de las frecuencias acumuladas (F i)
correspondiente a la tabla de datos, considerando el inmediatamente
mayor o igual a 37.5.

En nuestro ejemplo corresponde a la quinta fila, pues su frecuencia


acumulada es F5 = 39 y es el inmediatamente superior a 37.5.

3. La quinta fila es la clase cuartílica y de allí se considera los datos que


van a ser reemplazados en la fórmula.

Linf : Límite inferior del intervalo de la clase cuartílica = 112


n : número total de datos = 50
Fi-1 : Frecuencia absoluta acumulada anterior a la clase cuartílica = 31
fi : Frecuencia absoluta simple de la clase cuartílica = 8
c : Amplitud interválica: = 6

El cuartil 3 será:

 (3)(50) 
 4 − 31 
Q3 = 112 + 6   = 116.87
 8 
 

Interpretación:
El 75% de los estudiantes de la Universidad Peruana Unión tiene un

109
coeficiente de inteligencia máximo de 117 puntos, aproximadamente el
25% restante tienen más de 117 puntos.

Decil 2 (D2)

Proceso:
1. Se ubica la clase o fila decílica (donde se encuentra el segundo decil),
utilizando la siguiente fórmula, el valor i, se reemplaza de acuerdo a
qué decil se desea encontrar; ya sea el 1, 2, … , ó 9.

j (n) (2)50
= = 10
10 10
2. Este valor se ubica en la columna de las frecuencias acumuladas (F i)
correspondiente a la tabla de datos, considerando el inmediatamente
mayor o igual a 15.

En nuestro ejemplo corresponde a la segunda fila, pues su frecuencia


acumulada es F2 = 15 y es el inmediatamente superior a 10.

3. La segunda fila es la clase decílica y de allí se considera los datos que


van a ser reemplazados en la fórmula.

Li : Límite inferior del intervalo de la clase decílica = 94


n : número total de datos = 50
Fi-1 : Frecuencia absoluta acumulada anterior a la clase decílica = 9
fi : Frecuencia absoluta simple de la clase decílica = 6
c : Amplitud interválica: = 6

El decil 2 será:

 (2)(50) 
 10 − 9 
D2 = 94 + 6   = 95
 6 
 

110
Interpretación:
El 20% de los estudiantes de la Universidad Peruana Unión tiene un
coeficiente de inteligencia máximo de 95 puntos, aproximadamente el
80% restante tienen más de 95 puntos.

Percentil 10 (P10)

Proceso

1. Se ubica la clase o fila percentílica (donde se encuentra el percentil


10), utilizando la siguiente fórmula, el valor i, se reemplaza de acuerdo
a qué cuartil se desea encontrar; ya sea el 1, 2, …, ó 99.

j (n) (10)50
= =5
100 100
2. Este valor se ubica en la columna de las frecuencias acumuladas (Fi)
correspondiente a la tabla de datos, considerando el inmediatamente
mayor o igual a 5.

En nuestro ejemplo corresponde a la primera fila, pues su frecuencia


acumulada es F2 = 9 y es el inmediatamente superior a 5.

3. La primera fila es la clase percentílica y de allí se considera los datos


que van a ser remplazados en la fórmula.

Li : Límite inferior del intervalo de la clase percentílica = 88


n : Número total de datos = 50
Fi-1 : Frecuencia absoluta acumulada anterior a la clase Percentílica = 0
fi : Frecuencia absoluta simple de la clase percentílica = 9
c : Amplitud interválica: = 6

El percentil 10 será:

111
 (10)(50) 
 100 − 0 
P10 = 88 + 6   = 91.3
 9 
 

Interpretación:
El 10% de los estudiantes de la Universidad Peruana Unión tiene un
coeficiente de inteligencia máximo de 91.3 puntos, aproximadamente el
90% restante tienen más de 91.3 puntos.

112
4.1. MEDIDAS DE DISPERSIÓN

Son estadígrafos que cuantifican el grado de concentración o de dispersión


de los valores de la variable en torno a un promedio o valor central de la
distribución. Las medidas de dispersión se necesitan para dos propósitos
básicos:
a) Para verificar la confiabilidad de los promedios y
b) Para que sirva como base para el control de la variación de la misma.

Las principales medidas de dispersión o variabilidad son:


- Varianza
- Desviación estándar
- Coeficiente de variación

4.1.1. Varianza (s2 )


Es una medida que cuantifica el grado de dispersión o de variación de los
valores de una variable cuantitativa con respecto a su media aritmética.
Es el promedio de la suma de los cuadrados de las desviaciones de la
variable respecto a su media.
Cuando el resultado de la varianza es un valor grande, se dice que los datos
se encuentran bastantes dispersos o alejados de la media aritmética; si el
resultado es bastante pequeño los datos estarán bastante cercanos o
concentrados alrededor de la media aritmética.

Se obtiene de acuerdo a lo siguiente:

a) Varianza para datos simples (en serie):

s2 =
x 2
− n( x ) 2
n −1

Donde:
 x 2 = cada valor de la muestra se eleva al cuadrado luego se suma todos
los valores.
n = tamaño de la muestra. (número de datos).
x = media para datos simples.

113
b) Varianza para datos agrupados:

s 2
=
Y 2
f − n(Y )2
n −1
Donde:

Y 2
f = cada marca de clase elevado al cuadrado y multiplicado por su
frecuencia absoluta simple, luego se suman todos los valores.
n = tamaño de la muestra
Y = media para datos agrupados.

Observación: La varianza es una medida teórica; no tiene interpretación


práctica.

4.1.2. Desviación estándar (s )

Es la raíz cuadrada de la varianza. Esta medida tiene interpretación


práctica.

s = s2
Es uno de los estadísticos de mayor uso en el cual las unidades de la
variable ya no están elevados al cuadrado sino están en unidades
originales.

4.1.3. Coeficiente de variación (c.v. % )

Es el cociente de la desviación estándar y la media aritmética, expresado


en porcentaje. Así:

s
cv% = .100
x
- El coeficiente de variación se usa para saber si un conjunto de datos es
homogéneo o heterogéneo (concentrados o dispersos). Para esto se utiliza
el siguiente criterio:
114
Si C.V. < 0.33 Datos HOMOGENEOS
Si C.V. ≥ 0.33 Datos HETEROGENEOS

- El coeficiente de variación también se utiliza para comparar la


variabilidad de 2 ó más series de datos que tengan unidades de medidas
diferentes (por ejemplo, peso en kgs. y edad en años).

Si C.V.A. < C.V.B Los datos de la serie A presentan una menor


variabilidad con respecto a los datos de la serie B

Ejemplo:
Correspondiente a datos simples (información en serie):
Los datos presentados corresponden a las edades de 8 alumnos del 1er año
de la Facultad de Ciencias Contables y Administrativas:

Edad :
Xi: 18, 20, 23, 17, 18, 19, 23, 18

Calcular la varianza, desviación estándar y coeficiente de variación e


Interpretar sus resultados.

Solución:

La varianza (s2) :

Proceso:

x=
 x = 18 + 20 + 23 + 17 + 18 + 19 + 23 + 18 = 156 = 19.5
n 8 8

x 2
=182 + 202 + 232 + 17 2 + 182 + 192 + 232 + 182 = 3080

n = 8, pues hay 8 datos.

Entonces, la varianza es:

115
s2 =
x 2
− n( x ) 2
=
3080 − 8(19.5) 2
= 5.43
n −1 8 −1

• No tiene interpretación práctica, sólo se calcula para poder determinar


la desviación estándar.

La desviación estándar (s):

s = s 2 = 5.43 = 2.33 = 2

Interpretación:
Las edades de los alumnos del 1er año de la Facultad de Ciencias
Contables y Administrativas se dispersan respecto al valor central en
aproximadamente 2 años.

El coeficiente de variación (cv%):

s 2.33
cv% = .100 = .100 = 11.95% = 12%
x 19.5

Interpretación:

Como cv% es menor que el 30%, entonces la media es una medida


representativa del conjunto de datos.

Ejemplo:
Correspondiente a datos agrupados (información en tablas):

Considerando el ejemplo de distribución de frecuencias para datos


agrupados, en el cual estudiamos el cociente intelectual de 50 alumnos.
página 32

Hallaremos la varianza, desviación estándar y coeficiente de variación para

116
datos agrupados.

Tabla Nº 1

DISTRIBUCIÓN DE FRECUENCIAS DE LOS PUNTAJES DEL CI


DE 50 ESTUDIANTES DE LA UPeU
Límites de Xi fi Fi Xi fi Xi 2fi
clases
[88 – 94> 91 9 9 819 74529
[94 – 100> 97 6 15 582 56454
[100 – 106> 103 11 26 1133 116699
[106 – 112> 109 5 31 545 59405
[112 – 118> 115 8 39 920 105800
[118 – 124> 121 3 42 363 43923
[124 – 130> 127 8 50 1016 129032
Total 50 5378 585842

Solución:

La varianza (s2) :

Proceso:

Media

x=
x fi i
=
819 + 582 + 1133 + 545 + 920 + 363 + 1016
f i 9 + 6 + 11 + 5 + 8 + 3 + 8
5378
= = 107.56 = 107
50

117
x 2
f =912 (9) + 97 2 (6) + 1032 (11) + 1092 (5) + 1152 (8)
+1212 (3) + 1272 (8) = 585842

Entonces, la varianza es:

s2 =
x 2
f − n( x)2
=
585842-50(107.56)2
= 150.70
n −1 50 − 1

• No tiene interpretación práctica, sólo se calcula para poder determinar


la desviación estándar.

La desviación estándar (s):

s = s 2 = 150.70 = 12.27

Interpretación:
El cociente de inteligencia de los alumnos de la Universidad Peruana
Unión se dispersa respecto al valor central en aproximadamente 13 puntos.

El coeficiente de variación (cv%) :

s 12.27
cv% = .100 = .100 = 11.40% = 12%
x 107.56

Interpretación:
Como cv% es menor que el 30%, entonces la media es una medida
representativa del conjunto de datos.

4.2. MEDIDAS DE FORMA


Son aquellos que permiten identificar la distribución de la información.

118
4.2.1. Asimetría (As)
Permite identificar hacia dónde se acumula la información. Se obtiene
mediante la siguiente fórmula:

x − Mo Q3 + Q1 − 2Q2
As = o As =
s Q3 − Q1

Sí: As = 0 La distribución es simétrica


As > 0 La distribución es positiva
As < 0 La distribución es negativa

4.2.2. Coeficiente de Curtosis o apuntamiento (K)


Indica el grado de aplastamiento que tiene la distribución. De acuerdo a
ello se clasifican en: distribuciones platicúrticas (Fig.1), mesocúrticas
(Fig.2) y leptocúrticas (Fig.3).

PLATICURTICA MESOCURTICA
Fig.1 Fig.2

LEPTOCURTICA Fig.3

Para el grado de apuntamiento (deformación vertical) utilizaremos el


coeficiente denotado por:
119
Q3 − Q1
k=
2( P90 − P10 )

Donde: P90 = percentil 90; Q1 = primer cuartil


P10 = percentil 10; Q3 = tercer cuartil

Si k = 0,263, diremos que la curva correspondiente a la distribución de


frecuencias es mesocúrtica (tiene igual apuntamiento que la normal o
campana de Gauss).

si k < 0,263, diremos que la curva correspondiente a la distribución de


frecuencias es platicúrtica.

si k > 0,263, diremos que la curva correspondiente a la distribución de


frecuencias es leptocúrtica.

Ejemplo:
Correspondiente a datos agrupados (información en tablas):

Considerando el ejemplo de distribución de frecuencias para datos


agrupados, en el cual estudiamos el cociente intelectual de 50 alumnos.
página 32.
Hallaremos la asimetría y el coeficiente de Kurtosis para datos agrupados.

Tabla Nº 1

DISTRIBUCIÓN DE FRECUENCIAS DE LOS PUNTAJES DEL CI


DE 50 ESTUDIANTES DE LA UPeU

Intervalo de clase Xi fi Fi

120
[88 – 94> 91 9 9 P10
[94 – 100> 97 6 15 Q1,D2
[100 – 106> 103 11 26 Q2
[106 – 112> 109 5 31
[112 – 118> 115 8 39 Q3
[118 – 124> 121 3 42 D8
[124 – 130> 127 8 50 P90

Total 50

Solución

La Asimetría (As) :
Proceso:

Calcular los cuartiles 1, 2 y 3, como se hizo en el ejemplo de las medidas


de posición.

 (1)50 
 4 −9
Q1 = 94 + 6   = 97.5
 6 
 

 (2)(50) 
 4 − 15 
Q2 = 100 + 6   = 105.45
 11 
 

 (3)(50) 
 4 − 31 
Q3 = 112 + 6   = 116.87
 8 
 

Reemplazar en la fórmula de la asimetría, entonces la Asimetría es:

121
Q3 + Q1 − 2Q2 116.87 + 97.5 − 2(105.45)
As = = = 0.17
Q3 − Q1 116.87 − 97.5

Interpretación:
Como la asimetría tiende a cero, la información es simétrica.

El coeficiente de Kurtosis (k) :

Proceso:
Calcular los cuartiles 1 y 3 y los percentiles 10 y 90, como se hizo en el
ejemplo de las medidas de posición

 (1)50 
 4 −9
Q1 = 94 + 6   = 97.5
 6 
 

 (3)(50) 
 4 − 31 
Q3 = 112 + 6   = 116.87
 8 
 

 (10)(50) 
 100 − 0 
P10 = 88 + 6   = 91.3
 9 
 

122
 (90)(50) 
 100 − 42 
P90 = 124 + 6   = 126.25
 8 
 

Reemplazar en la fórmula de la asimetría, entonces el coeficiente de


kurtosis es:

Q3 − Q1 116.87 − 97.5
k= = = 0.27
2( P90 − P10 ) 2(126.25 − 91.3)

Interpretación
Como k es igual 0.27 y este número es mayor que 0.263, entonces, la
información es leptocúrtica.

123
124

También podría gustarte