0% encontró este documento útil (0 votos)
76 vistas12 páginas

Medidas de Dispersión

Estadística

Cargado por

grunchi3
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
76 vistas12 páginas

Medidas de Dispersión

Estadística

Cargado por

grunchi3
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

9 Objetivos:

MEDIDAS DE DISPERSIÓN

»» Conocer las medidas de dispersión para un conjunto


de datos.
»» Calcular las medidas de dispersión y su interpretación
para datos agrupados y sin agrupar.

Contenido:
9.1 Rango
9.2 Rango intercuartil
9.3 Varianza
9.4 Desviación estándar
9.5 Coeficiente de variación
9.6 Ejercicios de aplicación

96 elementos básicos de estadística descriptiva para el análisis de datos


9. medidas de dispersión

Además de las medidas de tendencia central que posibilitan la repre-


sentación del conjunto de datos por medio de un valor, es necesario
conocer la variabilidad o la dispersión que los datos pueden tener en
relación a una medida central.

En los análisis estadísticos, las medidas de dispersión que presentan


más representatividad son: rango, rango intercuartil, varianza, des-
viación estándar y coeficiente de variación (Posada y Buitrago, 2008).

9.1 Rango

El rango es considerado como la medida de dispersión más simple


para el análisis de los datos. No ofrece mucha información sobre
la variabilidad de los datos por estar basada sólo en los valores
extremos, razón por la cual debe ser usada como complemento de
otras medidas de dispersión. Para el cálculo del rango se utiliza la
siguiente ecuación:

Rango = valor máximo – valor mínimo

Por ejemplo, para los datos de la tabla 33, sobre la talla (en centíme-
tros) de un grupo de mujeres que asisten al gimnasio, el rango sería:

Rango = 175 – 150 = 25 cm.

Al interpretar el rango se deben relacionar los valores mínimo y


máximo; es decir, resaltar las cantidades entre las cuales se encuen-
tra el rango. Para el ejemplo mencionado anteriormente, la variación
de la talla de las mujeres que asisten al gimnasio es de 25 cm, la cual
oscila entre 150 y 175 cm. Si no se hace claridad que el rango está
entre los valores 150 y 175 cm, puede generar confusión debido a que
pueden existir muchos valores extremos con rango de 25 cm.

97
9.2 Rango intercuartil

El rango intercuartil (RIC) se denomina de esta manera porque es una


medida de dispersión que evita que los valores extremos influyan en
el conjunto de datos. Se calcula mediante la diferencia entre el cuartil
tres (Q3) y el cuartil uno (Q1). Es decir, el rango intercuartil corres-
ponde al rango del 50% ubicado en el centro de los datos. El RIC se
calcula por medio de la siguiente ecuación (Triola, 2000):

Rango intercuartil (RIC) = Q3 - Q1

Para la talla (en cm) de un grupo de mujeres que asisten al gimnasio,


presentada en la tabla 33, los cuartiles son Q1 = 159,4 cm y Q3 = 166
cm. Así, el rango intecuartil es:

RIC = 166 – 159,4 = 6,6 cm.

En este caso, el intervalo entre 159,4 y 166 cm se denomina mitad


central, es decir el 50% que contiene la información central; y 6,6
cm representa la dispersión media o rango intercuartil de la talla del
grupo de mujeres que asisten al gimnasio.

9.3 Varianza

La varianza es una medida de dispersión basada en la diferencia de


cada dato con la media aritmética. Posada y Buitrago (2008) plantean
que “la diferencia entre cada xi y el promedio ( para una muestra x
y µ para una población) se llama desviación respecto al promedio.
Para una muestra, la desviación respecto a la media se expresa como
( xi − x ) ; para una población es ( xi − µ ) ” (p. 86). Al sumar el total
de las desviaciones respecto al promedio, éste tiende a cero por la
compensación de las desviaciones positivas (cuando los datos están
por encima del promedio), con las desviaciones negativas (cuando
los datos están por debajo del promedio). De esta manera, no es
posible obtener efectivamente la desviación de los datos respecto
del promedio, por lo cual se hace necesario elevar cada desviación

98 elementos básicos de estadística descriptiva para el análisis de datos


al cuadrado, garantizando así que todas las desviaciones obtenidas
presenten cantidades positivas; el resultado entonces quedará en
unidades cuadradas.

Cuando se tiene la totalidad de los datos de la población, el prome-


dio de las desviaciones elevadas al cuadrado se denomina varianza
poblacional y se representa con la letra del alfabeto griego sigma ( σ 2 ).
Para una población con total de datos N y promedio µ , el parámetro
para la varianza se calcula mediante la siguiente ecuación:

i )

La varianza de la muestra (s2) tiene como objetivo convertirse en un


estimador de la variación para la población; por tal razón, se define
como la suma de las desviaciones elevadas al cuadrado, distribui-
das entre el tamaño de la muestra, menos uno. El estimador para la
varianza muestral se calcula mediante la siguiente ecuación:

Donde:
:media aritmética de la muestra

n :total de los datos de la muestra

:cada dato u observación de la variable X

En relación al denominador (n–1), Posada y Buitrago (2008, p. 94)


manifiestan que:

Si el denominador fuera n en lugar de (n–1), se obtendría el


promedio de los cuadrados de las diferencias con respecto a la
media. Sin embargo, se utiliza (n–1) debido a ciertas propiedades
matemáticas deseadas que tiene el estadístico s2, las cuales lo
hacen apropiado para hacer inferencias estadísticas. Al aumentar
el tamaño de la muestra, la diferencia entre n y (n–1) disminuye
cada vez más.

medidas de dispersión 99
Al calcular la varianza, los datos se elevan al cuadrado, por tanto, las
unidades con las cuales se midieron también se elevan al cuadrado,
imposibilitando la interpretación. En consecuencia, en la mayoría de
los análisis estadísticos se emplea la varianza como una medida que
permite comparar la dispersión entre dos o más variables, identifi-
cando la de mayor varianza como aquella que posee mayor disper-
sión o variabilidad. La importancia de la varianza está en que es una
medida transitoria para el cálculo de la desviación típica o estándar
de un conjunto de datos.

Por ejemplo, en la tabla 34 se presenta la puntuación de la evalua-


ción de desempeño de siete empleados del área de mercadeo de una
empresa. La puntuación es valorada en la escala de 1 a 5. Se requiere
conocer la varianza de la calificación de los empleados.

Tabla 34. Varianza para la evaluación de desempeño de siete empleados del área de mercadeo
aoksjdajsde una empresa

Empleado Calificación
( )
Media de la
muestra
Desviación
i −
Desviación al
cuadrado
1 3,5 3,6 -0,1 0,01

2 4,5 3,6 0,9 0,81

3 4,2 3,6 0,6 0,36

4 3,0 3,6 -0,6 0,36

5 2,7 3,6 -0,9 0,81

6 3,3 3,6 -0,3 0,09

7 4,0 3,6 0,4 0,16

Elaboración propia

Luego, la varianza será:

i −

100 elementos básicos de estadística descriptiva para el análisis de datos


Nótese que si se interpreta la varianza se estaría diciendo que la
variación en la calificación de desempeño de los empleados es de
0,43 puntos cuadrados, lo cual no es lógico. En este sentido, cobra
importancia la varianza como medida de transición para la desviación
típica o estándar.

Si los datos se agruparon en frecuencias o en intervalos, la varianza


puede ser calculada mediante las siguientes formulas:

Como parámetro para la población.

Como estimador para la muestra.

Donde:

x : media aritmética

n : total de datos de la muestra

N : total de datos de la población

xi : cada dato de la variable o marca de clase si es intervalo

ni : frecuencia absoluta
Para los datos del ejemplo de la estatura en centímetros de un grupo
de mujeres que asisten al gimnasio, presentados en la tabla 33, la
varianza sería (ver tabla 35):

medidas de dispersión 101


Tabla 35. Varianza para la estatura en centímetros de un grupo de mujeres que asisten al
gimnasio.
Nº. de
Intervalo
Intervalo
(Estatura en cm) ni
1 [150 – 155] 152,5 23.256,25 1 23.256,25

2 (155 – 160] 157,5 24.806,25 11 272.868,75

3 (160 – 165] 162,5 26.406,25 13 343.281,25

4 (165 – 170] 167,5 28.056,25 6 168.337,50

5 (170 – 175] 172,5 29.756,25 4 119.025,00

=
Elaboración propia

Al calcular el promedio de la estatura para las 34 mujeres se obtiene:


x = 162, 6 cm.

Luego, la varianza será:

9.4 Desviación estándar

La desviación estándar es considerada la medida de dispersión con


mayor representatividad para un conjunto de datos. Matemática-
mente se calcula como la raíz cuadrada positiva de la varianza, y se
denota por (s) cuando se estima para la muestra y por ( σ ) si se cal-
cula para la población:

La desviación estándar indica la distribución de los datos alrededor de


la media aritmética o promedio. Cuando la distribución de los datos
se aproxima a una forma de campana o es simétrica, como se ilustra
en la gráfica 11, la desviación estándar puede interpretarse mediante

102 elementos básicos de estadística descriptiva para el análisis de datos


la regla empírica, esta es: el 68% de los datos se agrupan alrededor de
la media, entre el intervalo y , el 95% entre y
, el 99,7% entre y (Triola, 2000). Para los análisis
estadísticos sólo se analiza la dispersión de los datos a partir de una
variación de la desviación alrededor de la media aritmética, es decir,
el intervalo que cubre aproximadamente el 68% de los datos, teniendo
en cuenta que la distribución de éstos debe ser simétrica.

Gráfica 11. Variación de la desviación estándar alrededor de la media aritmética.

Elaboración propia.

Retomando la información de la tabla 35 sobre la estatura en centí-


metros de un grupo de mujeres que asisten al gimnasio, la desviación
estándar sería:

cm.
Al interpretar la desviación estándar, significa que la estatura varía
28,6 cm alrededor de la media (162,6 cm). Por la regla empírica,
podría decirse que el 68% de las estaturas está dentro de una desvia-
ción estándar de la media, se estima que el 95% de las estaturas estará
entre y el 99,7% estará entre .

medidas de dispersión 103


Es importante resaltar que las medidas del rango, rango intercuartil,
varianza y desviación estándar nunca asumen valores negativos. La
relación de estas medidas con la dispersión es directa, es decir, si los
valores de las medidas son altos, la dispersión también será alta y
viceversa.

9.5 Coeficiente de variación

El coeficiente de variación (CV) es una medida que relaciona la desvia-


ción estándar con la media aritmética para determinar qué tan homo-
génea o dispersa es la información. Expresa el porcentaje que repre-
senta la desviación con relación a la media aritmética y se calcula por
medio de la siguiente ecuación:

Cuando se tiene una muestra, el coeficiente de variación puede ser


utilizado para calificar estadísticamente la calidad de las estimacio-
nes. Para ello se consideran los siguientes criterios (Departamento
Administrativo Nacional de Estadística, DANE, 2008, p. 5):

CV menor o igual al 7%, las estimaciones se consideran precisas.


CV entre el 8% y el 14%, las estimaciones tienen precisión aceptable.
CV entre el 15% y 20%, la precisión es regular.
CV mayor del 20% indica que la estimación es poco precisa.

Para el ejemplo de la tabla 35 sobre la talla de un grupo de mujeres


que asisten al gimnasio, la media aritmética fue 162,6 cm y la des-
viación estándar 28,6 cm. Al calcular el coeficiente de variación, se
obtiene:

104 elementos básicos de estadística descriptiva para el análisis de datos


Al interpretar los datos, es posible establecer que la desviación repre-
senta el 17,6% de la media. En términos del ejercicio, podría interpre-
tarse que los datos varían 17,6% alrededor de la media, lo cual intuye
que la precisión de estimación de los parámetros para esta población
es regular.

El coeficiente de variación, por ser una medida de dispersión rela-


tiva, se utiliza para comparar la variabilidad de distintas muestras o
poblaciones, aunque tengan unidades de medida diferentes (Triola,
2000). En el siguiente ejemplo se muestra esta situación:

Una persona desea realizar una inversión en un negocio que tenga


buena rentabilidad, para ello se le presentan dos proyectos con posi-
bilidades diferentes. El primer proyecto ha presentado utilidades pro-
medio en el último año de $150 millones y desviación de $50 millones.
En el mismo año, el promedio de utilidades para el segundo proyecto
fueron de $120 millones con una desviación estándar de $12 millo-
nes. ¿Cuál proyecto presenta más estabilidad para generar confianza
al inversionista?

Al analizar la desviación estándar, el primer proyecto es más varia-


ble que el segundo proyecto. Sin embargo, como el promedio de las
utilidades de los proyectos es diferente, se recomienda considerar la
variación de la utilidad con respecto al promedio, para observar la
estabilidad de ambos proyectos.

Los coeficientes de variación para los proyectos serían:

Primer proyecto:

Segundo proyecto:

medidas de dispersión 105


En consecuencia, en relación con la media, la utilidad del primer pro-
yecto es más variable que la del segundo. Por tanto, a pesar de pre-
sentar el segundo proyecto menor utilidad promedio, es más estable
que el primero, lo cual puede generar mayor confianza para el inver-
sionista.

9.6 Ejercicios de aplicación

Retomando el ejercicio de aplicación propuesto en el capítulo 8 sobre


la prueba de comprensión lectora para aspirantes de ingreso a la uni-
versidad para los programas de Odontología y Trabajo social, se tiene:

Aspirantes a Odontología

3,0 3,7 2,5 2,2 3,5 3,0


2,7 3,8 3,8 2,2 2,5 3,8
3,3 2,8 2,7 3,5 2,2 2,7
2,2 2,3 2,3 2,3 2,0 3,8
2,7 2,2 3,2 2,5 3,7 2,3
3,5 2,2 2,0 2,5 3,0 2,8
3,8 2,3 3,0 2,0 2,3 3,7
2,7 2,2 2,3 2,7 2,7 2,2
3,3 2,0 3,0 2,2 2,3 2,3
3,5 2,8 3,0 3,0 2,2 4,0

Aspirantes a Trabajo Social

3,8 3,5 2,7 2,2 3,0 2,0


3,5 3,7 2,0 3,8 2,0 2,5
2,7 2,0 2,7 3,8 2,3 3,2
3,7 3,3 3,3 2,2 2,3 2,5
2,0 2,7 3,0 3,8 3,3 3,8
2,7 2,3 2,2 3,5 3,5 2,5
2,5 2,7 3,2 3,3 2,3 2,2
2,3 3,0 3,5 3,5 2,2 2,7
2,2 2,7 2,5 3,8 2,7 2,2
2,3 2,5 2,7 2,7 2,2 3,8

106 elementos básicos de estadística descriptiva para el análisis de datos


1. Analizar la dispersión para cada uno de los programas
mediante el cálculo de las siguientes medidas: rango, ran-
go intercuartil, varianza y desviación estándar. Interpretar
los resultados.

2. Calcular el coeficiente de variación para cada uno de los


programas y compararlos, estableciendo los niveles de
dispersión en cada uno de ellos.

medidas de dispersión 107

También podría gustarte