0% encontró este documento útil (0 votos)
12 vistas10 páginas

Medidas de Dispersión

Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
12 vistas10 páginas

Medidas de Dispersión

Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

Medidas de dispersión

Las medidas de dispersión dan información sobre el grado de variabilidad de una variable
estadística. Esto se consigue a través de diferentes fórmulas que nos dan un valor
numérico para valorar el grado de dispersión. En otras palabras, las medidas de
dispersión son números que indican si una variable se mueve mucho, poco, más o menos
que otra.

Principales medidas de dispersión

Las medidas de dispersión más conocidas son: el rango, la varianza, la desviación típica y
el coeficiente de variación

A continuación veremos estas cuatro medidas.

Rango
El rango, en términos estadísticos, es una medida que nos ayuda a entender cuán
dispersos o variados son los datos dentro de un conjunto. Para calcularlo, simplemente
restamos el valor más pequeño del conjunto del valor más grande. Esta resta nos da una
cifra que representa la distancia total entre estos dos extremos.
Por ejemplo:
Si analizamos los ingresos en un grupo de personas y encontramos que el menor ingreso
es de 10 pesos y el mayor de 100 pesos, el rango de ingresos en este grupo es de 90
pesos. Esto nos da una idea rápida de la variabilidad de los ingresos dentro del grupo.
El rango es especialmente relevante en el ámbito financiero, ya que permite a los
analistas y a los inversores tener una noción rápida de cuánto pueden variar los precios o
valores financieros. Sin embargo, es importante recordar que el rango puede cambiar con
la inclusión de nuevos datos. Tomando el ejemplo del crecimiento del producto interior
bruto (PIB) de un país, si durante 20 años el PIB creció entre un 3% y un 5%, tenemos un
rango del 2%. Pero si el siguiente año el PIB cae un -1%, el nuevo rango se amplía a 6%,
reflejando una mayor variabilidad en el crecimiento económico a lo largo del tiempo.

Fórmula del rango

Para calcular el rango de una muestra o población estadística utilizaremos la siguiente


fórmula:

R = Máxx – Mínx

Donde

 R es el rango.
 Máx es el valor máximo de la muestra o población.
 Mín es el valor mínimo de la muestra o población estadística.
 x es la variable sobre la que se pretende calcular esta medida.
Para ello, no es necesario ordenar los valores de mayor a menor o viceversa. Si sabemos
cual son los números con mayor y menor valor, tan sólo tendremos que aplicar la fórmula.

Ejemplo de rango en estadística:

Supongamos que tenemos una empresa que produce microchips para luego venderlos a
las principales marcas de computadoras. Esta empresa encarga a un economista que
realice un estudio sobre la evolución de las ventas (últimos 4 años) para, posteriormente,
ofrecer consejos que mejoren los resultados empresariales. Entre otras muchas métricas,
se pide que se calcule el rango de producción de microchips. A continuación se muestra
la siguiente tabla de datos:

Mes 1 44.347 Mes 18 26.36 Mes 35 40.454


Mes 2 12.445 Mes 19 19.534 Mes 36 46.132
Mes 3 26.88 Mes 20 30.755 Mes 37 35.054
Mes 4 23.366 Mes 21 37.327 Mes 38 11.906
Mes 5 42.464 Mes 22 15.832 Mes 39 22.532
Mes 6 15.48 Mes 23 33.919 Mes 40 43.045
Mes 7 21.562 Mes 24 29.498 Mes 41 45.074
Mes 8 11.625 Mes 25 46.136 Mes 42 16.505
Mes 9 39.496 Mes 26 18.007 Mes 43 27.336
Mes 10 39.402 Mes 27 36.339 Mes 44 37.831
Mes 11 47.699 Mes 28 27.696 Mes 45 29.757
Mes 12 44.315 Mes 29 47.413 Mes 46 37.765
Mes 13 29.581 Mes 30 47.636 Mes 47 22.237
Mes 14 44.32 Mes 31 20.978 Mes 48 38.601
Mes 15 35.264 Mes 32 49.079 MÁXIMO 49.079
Mes 16 10.124 Mes 33 40.668 MÍNIMO 10.124
Mes 17 43.52 Mes 34 45.932 RANGO 38.955

El mes que más microchips produjo la empresa (MÁXIMO) fue el mes 32


con 49.079 microchips producidos. Por su parte, el momento que menos
microchips produjo tuvo lugar en el mes 16 con 10.124 microchips
producidos. Por tanto, el rango estadístico que es la diferencia (49.079-
10.124) se sitúa en 38.955.

¿Cómo se interpreta esto? Esto quiere decir, que durante los últimos 4
años la variación máxima que ha habido ha sido de 38.955 microchips
producidos. Gráficamente podemos verlo del siguiente modo:
El punto verde es el
máximo, el punto rojo el
mínimo y la línea
discontinua amarilla situada
a la derecha es la diferencia.
Esto es, el rango. El punto
verde es el máximo, el
punto rojo el mínimo y la
línea discontinua amarilla
situada a la derecha es la
diferencia. Esto es, el rango.

Varianza

VARIANZA
La varianza es una forma de entender cuánto se alejan algunos valores del promedio de
un grupo de ellos. Por ejemplo, imagina que tienes una lista de números que representan
los precios de algunos pisos de tu barrio. La varianza te ayuda a ver si los precios están
muy dispersos o no. Si todos están cerca del promedio, la varianza será baja, pero si
están muy esparcidos, la varianza será alta.

Antes de ver la fórmula de la varianza, debemos decir que la varianza en estadística es


muy importante. Ya que aunque se trata de una medida sencilla, puede aportar mucha
información sobre una variable en concreto.

Fórmula para calcular la varianza

La unidad de medida de la varianza será siempre la unidad de medida correspondiente a


los datos pero elevada al cuadrado. La varianza siempre es mayor o igual que cero. Al
elevarse los residuos al cuadrado es matemáticamente imposible que la varianza salga
negativa. Y de esa forma no puede ser menor que cero.

Donde

 X: variable sobre la que se pretenden calcular la varianza


 xi: observación número i de la variable X. i puede tomará valores entre 1 y n.
 n: número de observaciones.
 x̄ : Es la media de la variable X.

O lo que es lo mismo:
¿Por qué se elevan al cuadrado los residuos?

La razón por la que los residuos se elevan al cuadrado es sencilla. Si no se elevasen al


cuadrado, la suma de residuos sería cero. Es una propiedad de los residuos. Así pues
para evitarlo, tal como ocurre con la desviación típica se elevan al cuadrado. El resultado
es la unidad de medida en la que se miden los datos pero elevada al cuadrado.

Por ejemplo, si tuviésemos datos sobre los salarios de un conjunto de personas en euros,
el dato que arroja la varianza sería en euros cuadrados. Para que tenga sentido la
interpretación calcularíamos la desviación típica y pasaríamos el dato a euros.

1. Desviación -> (2-3) = -1


2. Desviación -> (4-3) = 1
3. Desviación -> (2-3) = -1
4. Desviación -> (4-3) = 1
5. Desviación -> (2-3) = -1
6. Desviación -> (4-3) = 1

Si sumamos todas las desviaciones el resultado es cero.

¿Qué diferencia existe entre la varianza y la desviación típica?

Una cuestión que se podría plantear, y con razón, sería la diferencia


entre varianza y desviación típica. En realidad, vienen a medir lo mismo.
La varianza es la desviación típica elevada al cuadrado. O al revés, la
desviación típica es la raíz cuadrada de la varianza.

La desviación típica se hace para poder trabajar en las unidades de


medida iniciales. Claro que, como es normal, uno puede preguntarse,
¿de qué sirve tener como concepto la varianza? Bien, aunque la
interpretación del valor que arroja no nos da demasiada información, su
cálculo es necesario para obtener el valor de otros parámetros.
Para calcular la covarianza necesitamos la varianza y no la desviación
típica, para calcular algunas matrices econométricas se utiliza la
varianza y no la desviación típica. Es una cuestión de comodidad a la
hora de trabajar con los datos en según qué cálculos.

Ejemplo de cálculo de la varianza

Vamos a acuñar una serie de datos sobre salarios. Tenemos cinco personas, cada uno
con un salario diferente:

Juan: 1.500 euros

Pepe: 1.200 euros

José: 1.700 euros

Miguel: 1.300 euros

Mateo: 1.800 euros

La media del salario, la cual necesitamos para nuestro cálculo, es de ((1.500 + 1.200 +
1.700 + 1.300 + 1.800) /5) 1.500 euros.

Dado que la fórmula de la varianza en su forma desglosada se formula como sigue:

Obtendremos que se debe calcular tal que:


El resultado es de 52.000 euros al cuadrado. Es importante recordar que siempre que
calculamos la varianza tenemos las unidades de medida al cuadrado. Para pasarlo a
euros, en este caso tendríamos que realizar la desviación típica. El resultado aproximado
sería de 228 euros. Esto quiere decir que, en media, la diferencia entre los salarios de las
distintas personas será de 228 euros.

Desviación Típica o Estándar


La desviación típica es una medida fundamental en estadística descriptiva y se utiliza para
calcular la variación o cuánto se alejan los datos individuales con respecto a la media.
Si la desviación es baja, están cerca de la media. Si el resultado es alto, estarán más
alejados de la media.

Para entender algo mejor qué es la desviación estándar, tienes que saber que es una
medida que nos dice cuánto se alejan algunos datos de su media. Por ejemplo, imagina
que tienes un bol de frutas y quieres saber si el tamaño de las manzanas es muy parecido
entre ellas o no. En este caso, la desviación estándar te diría si todas son muy parecidas,
o si algunas son mucho más grandes o más pequeñas que la media.

¿Y cómo saber si son muy parecidos los tamaños o no? Si la desviación es baja, los
datos estarán más cerca de la media. Por el contrario, si es alta, los datos serán más
diferentes.

Por tanto, la desviación estándar nos sirve para saber si un grupo de datos es más
parecido, o por el contrario son más dispersos entre ellos. Gracias a eso, se pueden
realizar análisis o tomar decisiones mejores y con mayor fundamento.

Para entender este concepto necesitamos analizar 2 conceptos fundamentales.

 Esperanza matemática, Media o promedio: Es el valor medio de tus datos,


obtenido sumando todos los valores y dividiéndolos por la cantidad de valores.
 Desviación: Representa cuánto se aleja cada valor de la media.

La base para entender su cálculo

Ahora, entendiendo estos dos conceptos la desviación típica se calculará de forma similar
a la media. Pero tomando como valores las desviaciones. Y aunque este razonamiento es
intuitivo y lógico tiene un fallo que vamos a comprobar con el siguiente gráfico.
En la imagen anterior tenemos 6 observaciones, es decir, N = 6. La media de las
observaciones está representa por la línea negra situada en el centro del gráfico y es 3.
Entenderemos por desviación, la diferencia que existe entre cualquiera de las
observaciones y la línea negra. Así pues, tenemos 6 desviaciones.

1. Desviación -> (2-3) = -1


2. Desviación -> (4-3) = 1
3. Desviación -> (2-3) = -1
4. Desviación -> (4-3) = 1
5. Desviación -> (2-3) = -1
6. Desviación -> (4-3) = 1

Como podemos ver si sumamos las 6 desviaciones y dividimos entre N (6 observaciones),


el resultado es cero. La lógica sería que la desviación media fuese de 1. Pero una
característica matemática de la media respecto a los valores que la forman es,
precisamente, que la suma de las desviaciones es cero. ¿Cómo arreglamos esto?
Elevando al cuadrado las desviaciones

Fórmulas para calcular la desviación típica

La primera es elevando al cuadrado las desviaciones, dividir entre el número total de


observaciones y por último hacer la raíz cuadrada para deshacer el elevado al cuadrado,
tal que:

Ejemplo de cálculo de la desviación estándar

Vamos a sustituir la fórmula con los datos anteriores.

Según la fórmula de la varianza (raíz cuadrada):


Tal como dictaba el cálculo intuitivo. La desviación estándar es de 1.

La relación de la desviación típica con la varianza

En definitiva la varianza no es más que la desviación estándar al cuadrado. O lo que viene


a ser lo mismo, la desviación típica es la raíz cuadrada de la varianza. Se relacionan de la
siguiente forma:

Tras esta imagen, queda claro que toda la fórmula que está dentro de la raíz cuadrada es
la varianza. La razón por la que es necesario entender que esa parte se conoce como
varianza es que se utiliza en otras fórmulas para calcular otras medidas. Así pues aunque
la desviación típica sea más intuitiva para interpretar resultados, es imperativo cómo se
calcula la varianza.

Coeficiente de variación
Nos permite comparar la dispersión de diferentes series de datos, independientemente de
sus unidades de medida, para ver cuál es más estable o tiene menos variación.

Dicho de una manera más sencilla, el coeficiente de variación es una herramienta


estadística que nos ayuda a entender qué tan dispersos están los datos en un grupo. Es
decir, qué tan alejados están unos de otros en relación a un punto central, que
usualmente es el promedio o media de esos datos.

Por ejemplo, imagina que tienes un conjunto de números que quieres analizar. Este
coeficiente te dice si estos números están muy esparcidos unos de otros o si están más
bien agrupados.

A veces, queremos comparar la dispersión entre dos grupos diferentes que tienen escalas
distintas, como comparar la estabilidad en los precios de dos productos diferentes. En
estos casos, el coeficiente de variación es especialmente útil porque nos permite hacer
estas comparaciones de manera justa, independientemente de las unidades de medida.

Es decir, nos informa al igual que otras medidas de dispersión, de si una variable se
mueve mucho, poco, más o menos que otra.

Fórmula del coeficiente de variación

Su cálculo se obtiene de dividir la desviación típica entre el valor absoluto de la media del
conjunto y por lo general se expresa en porcentaje para su mejor comprensión.

 X: variable sobre la que se pretenden calcular la varianza


 Sx: Desviación típica de la variable X.
 | x̄ |: Es la media de la variable X en valor absoluto con x̄ ≠ 0

El coeficiente de variación se puede ver expresado con las letras CV o r, dependiendo del
manual o la fuente utilizada. Su fórmula es la siguiente:

El coeficiente de variación se utiliza para comparar conjuntos de datos pertenecientes a


poblaciones distintas. Si atendemos a su fórmula, vemos que este tiene en cuenta el valor
de la media. Por lo tanto, el coeficiente de variación nos permite tener una medida de
dispersión que elimine las posibles distorsiones de las medias de dos o más poblaciones.

Ejemplos de uso del coeficiente de variación en lugar de la desviación típica

A continuación mostramos algunos ejemplos sobre esta medida de dispersión:


Comparación de conjuntos de datos de diferente dimensión

Se quiere comprar la dispersión entre la altura de 50 alumnos de una clase y su peso.


Para comparar la altura podríamos utilizar como unidad de medida metros y centímetros y
para el peso el kilogramo. Comparar estas dos distribuciones mediante la desviación
estándar, no tendría sentido dado que se pretenden medir dos variables cuantitativas
distintas (una medida de longitud y una de masa).

Comparar conjuntos con gran diferencia entre medias

Imaginemos por ejemplo que queremos medir el peso de los escarabajos y el de los
hipopótamos. El peso de los escarabajos se mide en gramos o miligramos y el peso de
los hipopótamos por lo general se mide en toneladas. Si para nuestra medición
convertimos el peso de los escarabajos a toneladas para que ambas poblaciones estén
en la misma escala, utilizar la desviación estándar como medida de dispersión no sería lo
adecuado. El peso medio de los escarabajos medido en toneladas sería tan pequeño, que
si utilizamos la desviación estándar, apenas habría dispersión en los datos. Esto sería un
error dado que el peso entre las diferentes especies de escarabajos puede variar de
manera considerable.

Ejemplo de cálculo del coeficiente de variación

Pensemos en una población de elefantes y otra de ratones. La población de elefantes


tiene un peso medio de 5.000 kilogramos y una desviación típica de 400 kilogramos. La
población de ratones tiene un peso medio de 15 gramos y una desviación típica de 5
gramos. Si comparáramos la dispersión de ambas poblaciones mediante la desviación
típica podríamos pensar que hay mayor dispersión para la población de elefantes que
para la de los ratones.

Sin embargo al calcular el coeficiente de variación para ambas poblaciones, nos daríamos
cuenta que es justo al contrario.

Elefantes: 400/5000=0,08
Ratones: 5/15=0,33

Si multiplicamos ambos datos por 100, tenemos que el coeficiente de variación para los
elefantes es de apenas un 8%, mientras que el de las ratones es de un 33%. Como
consecuencia de la diferencia entre las poblaciones y su peso medio, vemos que la
población con mayor dispersión, no es la que tiene una mayor desviación típica.

También podría gustarte