Tarea de Investigación: Medidas de Dispersión
Objetivo
teórico como práctico, utilizando un conjunto de datos. Comprender y aplicar las medidas de
dispersión: rango, varianza y desviación estándar, tanto desde un enfoque
1. Introducción Teórica
- Define qué son las medidas de Dispersión, su significado en estadística y su importancia en
el análisis de datos.
Las medidas de dispersión son como una lupa que nos permite ver más allá de los simples números
promedio. Nos dicen qué tan dispersos o juntos están los datos en relación a un valor central, que
generalmente es la media. Mientras que las medidas de tendencia central, como la media, mediana o
moda, nos dan una idea de dónde se concentran los datos, las medidas de dispersión nos ofrecen una
visión sobre la distancia o variabilidad de esos datos en torno a ese punto central.
¿Por qué esto es importante? Imagina que estás analizando dos conjuntos de datos y ambos tienen la
misma media. A primera vista, podrías pensar que son muy similares. Pero si te fijas en las medidas de
dispersión, podrías descubrir que uno de ellos tiene valores muy cercanos entre sí, mientras que el otro
tiene datos muy alejados. Esto es clave, porque en el mundo real, la variabilidad puede cambiar todo.
ejemplo
No solo te interesa saber cuánto es el rendimiento promedio que podrías obtener, sino también cuán
arriesgada es esa inversión. Si los rendimientos varían mucho, puede que te enfrentes a más
incertidumbre. Así que las medidas de dispersión te dan esa información adicional que completa la
imagen y te ayuda a tomar decisiones más informadas y acertadas.
Es como si las medidas de tendencia central te mostraran el camino principal, pero las medidas de
dispersión te permitieran ver qué tan accidentado o despejado está ese camino.
- Explica cada medida:
- Rango: diferencia entre el valor máximo y mínimo.
El rango es la forma más sencilla de medir la dispersión. Simplemente tomamos el valor más grande y
le restamos el valor más pequeño. Nos dice cuán separados están los extremos de los datos del valor
inicial a ultimo valor.
Ejemplo: Si tienes datos que van desde 3 hasta 15, el rango sería 15 - 3 = 12.
Limitación: Solo considera los valores extremos, por lo que no siempre refleja cómo están distribuidos
los demás dato
- Varianza: medida de la variabilidad que indica cuánto se dispersan los datos respecto a la
media.
La varianza mide cuánto varían los datos respecto a la media, pero en lugar de restar solo la media de
cada valor, eleva al cuadrado esa diferencia para evitar los negativos y luego calcula el promedio de
esas diferencias cuadradas.
Fórmula:
Para una población:
Para una muestra:
Ejemplo: Imagina que tienes varios datos alrededor de la media. Si la mayoría están lejos, la varianza
será alta. Si están cerca, la varianza será baja.
Limitación: Como se eleva al cuadrado, el resultado no es fácil de interpretar porque ya no está en las
mismas unidades que los datos originales.
- Desviación estándar: raíz cuadrada de la varianza, que proporciona una medida de dispersión en
las mismas unidades que los datos.
La varianza mide cuánto varían los datos respecto a la media, pero en lugar de restar solo la media de
cada valor, eleva al cuadrado esa diferencia para evitar los negativos y luego calcula el promedio de
esas diferencias cuadradas.
Para una población:
Para una muestra:
Ejemplo: Imagina que tienes varios datos alrededor de la media. Si la mayoría están lejos, la varianza
será alta. Si están cerca, la varianza será baja.
Limitación: Como se eleva al cuadrado, el resultado no es fácil de interpretar porque ya no está en las
mismas unidades que los datos originales.
2. Selección de un Conjunto de Datos
- Escoge un conjunto de datos real que contenga al menos 30 observaciones. Puede ser sobre un
tema de interés como el rendimiento académico, precios de productos, datos de salud, etc.
- Justifica brevemente la elección de tus datos.
Suposiciones de Precio por Año
Año 1: 100%
Año 2: 10% de aumento
Año 3: 5% de disminución
Año 4: 5% de disminución
Año 5: 2% de disminución
BYTE BOUTIQUE
C S P ( a A A A A A
o e r B ñ ñ ñ ñ ñ ñ
m r e s o o o o o o
p v c
)
o i i 2 3 4 5 6
n c o 1
e i e
n o r
t
e
Procesador Intel Core i5-12400 1500 1500 1650 1568 1490 1460
Placa madre ASUS B660M 800 800 880 836 794 775
Memoria RAM Corsair 16GB (2x8GB) 800 800 880 836 794 775
SSD Kingston A2000 500GB 700 700 770 731 695 681
HDD Seagate Barracuda 1TB 600 600 660 627 596 584
Tarjeta gráfica NVIDIA GTX 1660 Super 2500 2500 2750 2613 2482 2432
Fuente de alimentación EVGA 600W 400 400 440 418 397 389
Gabinete Cooler Master Q300L 350 350 385 366 348 342
Refrigeración Cooler Master Hyper 212 300 300 330 313 297 291
Monitor AOC 24” Full HD 1200 1200 1320 1254 1191 1167
Teclado mecánico Corsair K60 600 600 660 627 596 584
Ratón Logitech G502 500 500 550 523 497 487
Asesoría técnica (1 hora) 200 200 220 209 199 195
Instalación de software 150 150 165 157 149 146
Mantenimiento preventivo 300 300 330 313 297 291
Configuración de red 250 250 275 261 248 243
Actualización de hardware 400 400 440 418 397 389
Montaje de PC 250 250 275 261 248 243
Capacitación en software 350 350 385 366 348 342
Asesoría en compra de componentes 200 200 220 209 199 195
Soporte técnico remoto (1 hora) 150 150 165 157 149 146
Reemplazo de piezas 300 300 330 313 297 291
Limpieza de PC 100 100 110 105 100 98
Configuración de impresora 150 150 165 157 149 146
Asesoría en seguridad informática 300 300 330 313 297 291
Análisis de rendimiento 250 250 275 261 248 243
Optimización de sistema operativo 200 200 220 209 199 195
Instalación de antivirus 150 150 165 157 149 146
Recuperación de datos 400 400 440 418 397 389
Soporte en software de diseño 350 350 385 366 348 342
Capacitación en hardware 300 300 330 313 297 291
. 3. Cálculo de Medidas de Dispersión
C S P a A A A A A v d p v d d d d p r m
(
o e r B ñ ñ ñ ñ ñ ñ a e o a e e e e o a e
m r e s o o o o o o r b r s s b n d
p v c i l i m v m v l g i
)
o i i 2 3 4 5 6 a a a u i u i a o a
n c o 1 n c n e a e a c
e i e z i z s c s c i
n o r a o a t i t i o
t n r o r o n
e a n a n
1 Procesador Intel Core i5-12400 1500 1500 1650 1568 1490 1460 4020 4824 69,45502 63,4034699 190 1528
2 Placa madre ASUS B660M 800 800 880 836 794 775 1192,13889 1430,566667 37,82283 34,52736435 105 814,166667
3 Memoria RAM Corsair 16GB (2x8GB) 800 800 880 836 794 775 1192,13889 1430,566667 37,82283 34,52736435 105 814,166667
4 SSD Kingston A2000 500GB 700 700 770 731 695 681 876,472222 1051,766667 32,43095 29,60527355 89 712,833333
5 HDD Seagate Barracuda 1TB 600 600 660 627 596 584 642,138889 770,5666667 27,75908 25,34045952 76 611,166667
6 Tarjeta gráfica NVIDIA GTX 1660 Super 2500 2500 2750 2613 2482 2432 11238,1389 13485,76667 116,1282 106,0100886 318 2546,16667
7 Fuente de alimentación EVGA 600W 400 400 440 418 397 389 288,555556 346,2666667 18,60824 16,98692307 51 407,333333
8 Gabinete Cooler Master Q300L 350 350 385 366 348 342 211,472222 253,7666667 15,93006 14,54208452 43 356,833333
9 Refrigeración Cooler Master Hyper 212 300 300 330 313 297 291 166,472222 199,7666667 14,13388 12,90241149 39 305,166667
10 Monitor AOC 24” Full HD 1200 1200 1320 1254 1191 1167 2597 3116,4 55,82473 50,96076922 153 1222
11 Teclado mecánico Corsair K60 600 600 660 627 596 584 642,138889 770,5666667 27,75908 25,34045952 76 611,166667
12 Ratón Logitech G502 500 500 550 523 497 487 444,25 533,1 23,08896 21,07723891 63 509,5
13 Asesoría técnica (1 hora) 200 200 220 209 199 195 69,8055556 83,76666667 9,152413 8,354971906 25 203,833333
14 Instalación de software 150 150 165 157 149 146 40,4722222 48,56666667 6,968979 6,361778228 19 152,833333
15 Mantenimiento preventivo 300 300 330 313 297 291 166,472222 199,7666667 14,13388 12,90241149 39 305,166667
16 Configuración de red 250 250 275 261 248 243 112,916667 135,5 11,64045 10,62622542 32 254,5
17 Actualización de hardware 400 400 440 418 397 389 288,555556 346,2666667 18,60824 16,98692307 51 407,333333
18 Montaje de PC 250 250 275 261 248 243 112,916667 135,5 11,64045 10,62622542 32 254,5
19 Capacitación en software 350 350 385 366 348 342 211,472222 253,7666667 15,93006 14,54208452 43 356,833333
20 Asesoría en compra de componentes 200 200 220 209 199 195 69,8055556 83,76666667 9,152413 8,354971906 25 203,833333
21 Soporte técnico remoto (1 hora) 150 150 165 157 149 146 40,4722222 48,56666667 6,968979 6,361778228 19 152,833333
22 Reemplazo de piezas 300 300 330 313 297 291 166,472222 199,7666667 14,13388 12,90241149 39 305,166667
23 Limpieza de PC 100 100 110 105 100 98 16,8055556 20,16666667 4,490731 4,099457959 12 102,166667
24 Configuración de impresora 150 150 165 157 149 146 40,4722222 48,56666667 6,968979 6,361778228 19 152,833333
25 Asesoría en seguridad informática 300 300 330 313 297 291 166,472222 199,7666667 14,13388 12,90241149 39 305,166667
26 Análisis de rendimiento 250 250 275 261 248 243 112,916667 135,5 11,64045 10,62622542 32 254,5
27 Optimización de sistema operativo 200 200 220 209 199 195 69,8055556 83,76666667 9,152413 8,354971906 25 203,833333
28 Instalación de antivirus 150 150 165 157 149 146 40,4722222 48,56666667 6,968979 6,361778228 19 152,833333
29 Recuperación de datos 400 400 440 418 397 389 288,555556 346,2666667 18,60824 16,98692307 51 407,333333
30 Soporte en software de diseño 350 350 385 366 348 342 211,472222 253,7666667 15,93006 14,54208452 43 356,833333
31 Capacitación en hardware 300 300 330 313 297 291 166,472222 199,7666667 14,13388 12,90241149 39 305,166667
varianza poblacion 229901,145 229901,145 278180,385 251153,971 226632,947 217451,076 total 239291,4006
varianza muestra 237564,516 237564,516 287453,065 259525,77 234187,378 224699,445 total 240584,8677
media 483,870968 483,870968 532,258065 505,645161 480,387097 470,612903 total 492,7741935
rango 2400 2400 2640 2508 2382 -98 total 2652
desviacion muestra 487,405905 487,405905 536,146495 509,436718 483,929105 474,024731 total 490,4945134
desviacion de poblacion 479,480077 479,480077 527,428085 501,152642 476,059814 466,316498 total 489,1742027
Rango
El rango se calcula como la diferencia entre el valor máximo y el valor mínimo en el conjunto de
datos.
Valor máximo: 2,500 (Tarjeta gráfica NVIDIA GTX 1660 Super)
Valor mínimo: 100 (Limpieza de PC)
Cálculo del Rango: Rango=Valor máximo−Valor mínimo=2,500−100=2,400
Varianza
Para sacar la varianza hay que tener los datos
Media que es 1528
Variación de población
1500 1500 1650 1568 1490 1460
( 1500−1528 )2 + ( 1500−1528 )2+ (1650−1528 )2 + ( 1568−1528 )2+ ( 1490−1528 )2 + ( 1460−1528 )2
a 2=
6
2
a =4020
Variación de muestra
( 1500−1528 )2 + ( 1500−1528 )2+ (1650−1528 )2 + ( 1568−1528 )2+ ( 1490−1528 )2 + ( 1460−1528 )2
a 2=
6−1
2
a =4824
- Desviación estándar: Calcula la desviación estándar y comenta cómo se relaciona con la
varianza.
Sacando los resultados de las variaciones solo le ponemos la raíz para encontrar la desviación
población y muestra
Desviación población
a=√ 4020
a ≈ 63.40
Desviación de muestra
a=√ 4824
a ≈ 69.46
Formula de Excel
Media:
Fórmula: =PROMEDIO(rango_de_datos)
Varianza (Población):
Fórmula: =VAR.P(rango_de_datos)
Varianza (Muestra):
Fórmula: =VAR.S(rango_de_datos)
Desviación estándar (Población):
Fórmula: =DESVEST.P(rango_de_datos)
Desviación estándar (Muestra):
Fórmula: =DESVEST.S(rango_de_datos)
4. Interpretación de Resultados
- Analiza qué indican estas medidas sobre la dispersión de tus datos. Considera aspectos
como la uniformidad, la presencia de outliers, etc.
Las medidas de dispersión nos ayudan a entender cómo se distribuyen los datos en un conjunto. Aquí
hay algunos puntos clave a considerar:
Uniformidad: Si las medidas de dispersión (rango, varianza, desviación estándar) son bajas, esto
indica que los datos están bastante uniformes y cercanos a la media. Por ejemplo, si los precios de
productos en diferentes tiendas son muy similares, la varianza y la desviación estándar serán bajas,
sugiriendo poca variabilidad.
Presencia de Outliers: Los outliers son valores atípicos que se alejan significativamente del resto de
los datos. La presencia de outliers puede aumentar considerablemente la varianza y la desviación
estándar, ya que estos valores extremos influyen en el cálculo de la media y, por ende, en las
diferencias al cuadrado respecto a la media. Por ejemplo, si en un conjunto de datos de precios de
productos, la mayoría de los precios están entre $10 y $50, pero hay un producto que cuesta $200, este
valor atípico aumentará la varianza y la desviación estándar.
- Discute cómo las medidas de dispersión pueden influir en la interpretación de la media y
otras medidas de tendencia central.
Media: La media puede ser menos representativa en conjuntos de datos con alta dispersión. En estos
casos, la mediana puede ser una mejor medida de tendencia central, ya que no se ve tan afectada por
los outliers.
Mediana y Moda: Aunque la mediana y la moda son menos sensibles a la dispersión, conocer la
variabilidad de los datos ayuda a entender mejor la distribución completa. Por ejemplo, si la media y la
mediana son muy diferentes, esto puede indicar una distribución sesgada.
Decisiones Basadas en Datos: Las medidas de dispersión proporcionan contexto adicional que es
crucial para la toma de decisiones. Por ejemplo, en la evaluación de riesgos, una alta variabilidad puede
indicar mayor incertidumbre y, por lo tanto, mayor riesgo.