Medidas de Tendencia Central
Medidas de Tendencia Central
MEDIDAS DE
TENDENCIA
CENTRAL PARA
UN CONJUNTO
DE DATOS
AGRUPADOS
INDICE
1.4.2 Mediana.
1.4.3 Moda.
1.5.1 Rango.
1.5.3 Varianza.
Definición
Las medidas de tendencia central son medidas estadísticas
que pretenden resumir en un solo valor a u n conjunto de Si los datos se encuentran ordenados en una tabla
valores. Representan un centro en torno al cual se estadística diremos que se encuentran “agrupados” y si los
encuentra ubicado el conjunto de los datos. Las medidas datos no están en una tabla hablaremos de datos “no
de tendencia central más utilizadas son: media, mediana y agrupados”.
moda.
Son aquellos que están clasificados en función a un criterio, Constituyen el conjunto de datos que no han sido
mostrando una frecuencia para cada clase o grupo formado. clasificados y que son presentados en una tabla de datos
Se suelen usar datos agrupados cuando se trata de muestras en forma individual, es decir que no forman parte de un
de más de 20 datos. conjunto. De manera general constituye una cantidad de
elementos que es menor a 30 con muy poca o nula
El objetivo fundamental de agrupar los datos es que el repetición.
análisis de los mismos pueda ser más sencillo, de manera
que se pueda hacer una primera aproximación a los
resultados de forma rápida. Existen tres medidas comunes para identificar el centro de
un conjunto de datos: La Media, Mediana y Moda. En
cada caso, se ubican alrededor del punto en donde se
aglomeran los datos.
Ejemplo de datos agrupados
En la tabla podemos observar que, por ejemplo, 210 personas de la muestra tienen
ingresos mensuales de entre 2.500 y 3.500 eu ros.
Nombre Ingresos
listado:
I. Bibliografía
Westreicher, G. (10 de Diciembre de 2021). [Link]. Obtenido de
[Link]
Media
Es el valor que se obtiene con la suma de todos los datos entre el total de datos.
1.
Ejemplo:
Tenemos cuatro vasos con una bebida y cada vaso tiene un volumen diferente
cada uno, y debemos obtener la media del volumen contenido en los vasos.
.
x = V1+ V1+ V1+ V1
4
Vaso 1 = 200 ml
Vaso 2 = 175 ml
Vaso 3 = 125 ml
Vaso 4 = 255 ml.
.
x = 200 + 175 + 125+ 255 = 755 = 188.75 ml
4
.
X = 188.75 ml
2. Ejemplo:
Se compran 5 terrenos con diferentes áreas y precios cada uno, y debemos
obtener la media del área contienen los terrenos.
.
x = A1+ A2+ A3+ A4+A5
5
Terreno 1 = 200 mts2
Terreno 2 = 300 mts2
Terreno 3 = 350 mts2
Terreno 4 = 250 mts2.
Terreno 5 = 500 mts2
.
x = 200 + 300 + 350+ 250 + 500 = 1600 = 320 mts2
5. 5
.
X = 320 mts2
3. Ejemplo:
Se compran 5 terrenos con diferentes áreas y precios cada uno, y debemos
obtener la media del costo de los terrenos.
.
x = C1+ C2+ C3+ C4+C5
5
Terreno 1 = 200,000.00
Terreno 2 = 300,000.00
Terreno 3 = 175,000.00
Terreno 4 = 500,000.00
Terreno 5 = 1,000,000.00
.
x = 200,000 + 300,000 + 175,000+ 500,000 + 1,000,000
5
.
x = 2,675,000
5
.
X = 535,000
4. Ejercicio
Media
X=Σx
Dónde:
Ejemplo:
n
. n
X = Σi=1 x
Ejemplo: de media
Datos 5,7,6,4,3,8,7
5+7+6+4+3+8+7= 40
40/7 = 5.71
X = 5.71
MEDIA PONDERADA
1600
Xw= (2,175,000)
1,600
3. Ejemplo
En junio, un inversionista compro 300 acciones de Oracle. Una Compañía de
tecnología de la información a 20 dólares cada una.
En Agosto compro 400 acciones más a 25 dólares.
En Noviembre compro otras 400 acciones pero el precio bajo a 23 dólares. Por
titulo.
¿ Cual es el precio promedio ponderado con cada acción.
.
Xw= Σ(w • x)
Σw
W. X
Cantidad Precio
300. 20 dólares
400. 25 dólares
400. 23 dólares
. .
1,100. 1,100
4. Ejercicio
Se compran varios lotes de calcetines de la misma calidad a una empresa que
los produce, el primer lote de 5000 pares calcetines, por escasez de materia
prima lo compraron a 10.00 cada par el segundo lote 10000 pares lo compraron
a 5.00 por haber materia prima de sobra, y el tercer lote 4000 pares nuevamente
se estaba escaseando la materia prima a un precio de 8.00 pesos.
Datos
W x
Cantidad de Precio
Calcetines. Por par
5000. 10.00
10000. 5.00
4000. 8.00
.
Xw= (5000 • 10.00)+(10000•5.00)+(4000•8.00)
Xw= (50000)+(50000)+(32000)
19000
Xw = 132,000
19000
Bibliografía
[Link]
-[Link]
3 Si la serie tiene un número par de puntuaciones la mediana es la media entre las dos
puntuaciones centrales.
Fórmula y cálculo de la mediana para datos agrupados
2,4,12,6,8,14,16,10,18.
En primer lugar los ordenamos de menor a mayor con lo que tendríamos lo siguiente:
2,4,6,8,10,12,14,16,18.
Pues bien, el valor de la mediana, como indica la fórmula, es aquel que deje la misma
cantidad de valores tanto a un lado como a otro. ¿Cuántas observaciones tenemos? 9
observaciones. Calculamos la posición con la fórmula de la mediana correspondiente.
Mediana = 9+1 / 2 = 5
¿Qué quiere decir este 5? Nos dice que el valor de la mediana, se encuentra en la
observación cuya posición es la quinta.
Por lo tanto, la mediana de esta sería de datos sería el número 10, ya que está en la
posición quinta. Además, podemos comprobar cómo tanto a la izquierda del 5 hay 4
valores (2, 4, 6 y 8) y a la derecha del 10 hay otros 4 valores (12, 14, 16 y 18).
1,2,4,2,5,9,8,9.
1,2,2,4,6,8,9,9.
En este caso, la cantidad de observaciones es par. Por tanto, de tener en cuenta las
consideraciones para el número de observaciones par. La fórmula nos indica lo
siguiente:
[Link]
[Link]/apuntes/escolar/matematicas/estadistica/descriptiva/[Link]
[Link]
muy-importante-qu%C3%A9-ventajas-tiene-respecto-a-la-media
[Link]
en-una-empresa-931627764560
[Link]
1.4 MEDIDAS DE TENDENCIA CENTRAL PARA UN CONJUNTO DE
DATOS Y DATOS AGRUPADOS
1.4.3 MODA
Moda
En un polígono de
frecuencia la moda es el valor que se
corresponde al Una muestra Un grupo de datos tener una moda (bimodal) o más de
puede tener más es decir repite más veces puede no tener dos modas dos modas
valor de la variable en el conjunto de (unimodal),
que está bajo el de una moda. moda (multimodal).
datos inicial.
punto más alto del
gráfico.
Definición
La moda es el valor que tiene mayor frecuencia entre todos los datos agrupados; es
decir, es el valor que se repite más veces en el conjunto de datos inicial.
La moda de una distribución se define como el valor de la variable que más se repite.
En un polígono de frecuencia la moda corresponde al valor de la variable que está bajo
el punto más alto del gráfico. Una muestra puede tener más de una moda.
La moda es el dato que más se repite o el dato que ocurre con mayor frecuencia..
Un grupo de datos puede no tener moda, tener una moda (unimodal), dos modas
Formulas:
Cuando se tiene una cantidad de datos muy grande, para calcular la moda de los datos
agrupados se utiliza la siguiente fórmula:
Siendo:
Ai: amplitud
Mo = Li + (Ls-Li)*(frecuencia de Li – Frecuencia de L(i-1)) / ((frecuencia de Li –
Frecuencia de L(i-1)) + (frecuencia de Li –Frecuencia de L(i+1)))
Otra fórmula que se utiliza para obtener un valor aproximado a la moda es la siguiente:
Ejemplos:
• Ejemplo 1
SOLUCIÓN
marca 1.
Mo = Marca 1
Ni Lm Ls f Mc
1 [4 6) 2 5
2 [6 8) 4 7
3 [8 10 ) 4 9
4 [ 10 12 ) 5 11
5 [ 12 14 ] 5 13
Total 20
SOLUCIÓN
Las marcas de clase que más frecuencias tienen son 11 y 13, por tanto decimos
Mo1 = 11
Mo2 = 13
• Ejemplo 2:
multimodal, que más se repiten en una distribución; para el caso de datos agrupados
se
Li Ls Fi Fa
5.97 6.18 2 2
6.19 6.4 5 7
6.41 6.62 7 14
6.63 6.84 12 26
6.85 7.06 8 34
7.07 7.28 6 40
Se tiene una muestra con valores 20, 23, 24, 25, 25, 26 y 30.
Mo = 25 es unimodal
b) Se tiene una muestra con valores 20, 20, 23, 24, 25, 25, 26 y 30.
c) Se tiene una muestra con valores 20, 23, 24, 25, 25, 26, 30 y 30.
Total 32 250.4
Mo = 7.4
• Ejemplo 4:
, donde
i es el intervalo de clase.
Total 32 250.4
d1 = 9 – 4 = 4
d2 = 9 – 7 = 2
Mo = 6.95 + 0.59
Mo = 7.55 ≈ 7.6
Ventajas e inconvenientes:
- Su cálculo es sencillo.
- Es de fácil interpretación.
de tipo cualitativo.
BIBLIOGRAFÍAS:
Media
Ejemplo :
= 6.75
Mediana
Ejemplo 1 :
Ejemplo 2 :
Encuentre la mediana del conjunto {3, 10, 36, 255, 79, 24, 5, 8}.
Así, la mediana es 17
Moda
Ejemplo 1 :
Así, el 9 es la moda.
Ejemplo 2 :
En este caso, hay dos modas – el 5 y el 8 ambos aparecen dos veces, mientras que los
otros números solo aparecen una vez.
1.4.4. Relación entre media,mediana Y moda
Mediana Moda
Media
Recordemos que las medidas de dispersión sirven para determinar si los datos se
encuentran en torno a la media o si están muy dispersos. Para cuantificar la
dispersión, estudiaremos las medidas más conocidas: el rango, la desviación
media, la varianza, la desviación estándar y el coeficiente de variación.
B. Mapa conceptual
Rango
El rango es la diferencia entre el mas alto y el mas pequeño de los valores observados.
En forma de ecuación es:
R = Máxx – Mínx
• Es el rango.
• Max es el valor máximo de la muestra o población.
• Mín. es el valor mínimo de la muestra o población estadística.
• x es la variable sobre la que se pretende calcular esta medida.
Es fácil entender y encontrar el rango, pero su utilidad como medida de dispersión es
limitada. El rango sólo toma en cuenta los valores más alto y bajo de una distribución y
ninguna otra observación del conjunto de datos. Como resultado, ignora la naturaleza
de la variación entre todas las demás observaciones, y tiene una gran influencia de los
valores extremos. Debido a que sólo mide dos valores, el rango tiene muchas
posibilidades de cambiar drásticamente de una muestra a la siguiente en una población
dada, aunque los valores que caen entre el más alto y el más bajo sean bastante
parecidos. Recuerde también que las distribuciones de extremo abierto no tienen
rango, pues no existe un valor “más alto” o “más bajo” en la clase de extremo abierto.
No es necesario ordenar los valores de mayor a menor o viceversa. Si sabemos cual
son los números con mayor y menor valor, tan sólo tendremos que aplicar la fórmula.
En Excel, por ejemplo, podemos utilizar las funciones =MAX(rango de datos) y
MIN(rango de datos). A la celda que contiene MAX le restamos la celda que contiene
MIN y obtenemos el rango.
Vista la definición de rango en estadística, tenemos un ejemplo resuelto para que
veamos cómo se saca el rango de un conjunto de datos.
Ejemplo 1
Año Ventas
1 4239
2 6674
3 7714
4 4121
5 3991
6 6648
7 9048
8 5717
9 3623
10 3433
11 3156
12 8686
13 3805
14 6828
15 1895
16 7468
17 9947
18 8941
19 8065
20 8680
De modo que tenemos que usar la fórmula vista más arriba para hallar el rango de esta
muestra estadística.
El valor máximo del intervalo es 9947 unidades vendidas y el valor mínimo es 1895. Por lo
tanto, tenemos que restar estos dos valores para encontrar el rango del conjunto de datos:
R=9984-1895=8052
Esto significa que la variación máxima que se ha producido de las ventas durante estos
últimos años es de 8052 unidades. A continuación, puedes ver representados el rango.
el rango muestra la diferencia entre el valor máximo y el valor mínimo de un conjunto de
datos, por lo tanto, el rango es una medida que sirve para indicar la dispersión total de
un conjunto de datos.
1.5.2 Desviaciòn media.
Formula
1.5.2 Descripción
Desviación
media Desviación media
La desviación respecto a la media es la diferencia entre cada valor de la variable
estadística y la media aritmética.
Di = x - x
La desviación media es la media aritmética de los valores absolutos de las
desviaciones respecto a la media.
9, 3, 8, 8, 9, 8, 9, 18
Ejemplo
Calcular la desviación media de la distribución:
xi fi xi · f i |x - x| |x - x| · f i
[10, 15) 12.5 3 37.5 9.286 27.858
[15, 20) 17.5 5 87.5 4.286 21.43
[20, 25) 22.5 7 157.5 0.714 4.998
[25, 30) 27.5 4 110 5.714 22.856
[30, 35) 32.5 2 65 10.174 21.428
21 457.5 98.57
1. Ejemplo 1:
Solución:
Lo primero que haremos será calcular las marcas de clase xi. Recuerda que la marca
de clase es el punto medio del límite inferior y del límite superior de cada intervalo, su
fórmula es:
Agregamos una columna más a nuestra tabla para la marca de clase xi:
En la tabla, iremos buscando las expresiones que aparecen en la fórmula. Por ello,
agregamos una columna más a nuestra tabla, en la cual colocaremos los valores de xi
・fi.
Referencias
Contento Rubio Manuel Ricardo. (2019) Estadística con aplicación en R. Utadeo. Bogotá.
Ejercicio 1:
Solución 1:
Grupo 1:
De acuerdo a los datos del problema tenemos:
Datos = 50, 60, 70, 80, 90
Σxᵢ = 350
N=5
x̄ = 350/5 = 70
xi xi – x
̄ (xi – x̄)2
50 -20 400
60 -10 100
70 0 0
80 10 100
90 20 400
72 2 4
68 -2 4
70 0 0
74 4 16
66 -4 16
Ejercicio 2:
Solución 2:
Si bien ambas opciones tienen la misma tasa media de rendimiento en los últimos
5 años, es necesario determinar la variabilidad de dicha tasa. Para ello, la
desviación estándar es el indicador más frecuente para determinar el riesgo de u n
activo. En ese caso se calculará la desviación típica para ambas opciones:
Activo A:
De acuerdo a los datos del problema tenemos:
Datos = 11.3, 12.5, 13, 12, 12.2
Σxᵢ = 61
N=5
x̄ = 61/5 = 12.2
xi xi – x
̄ (xi – x̄)2
13 0.8 0.64
12 -0.2 0.04
12.2 0 0
Activo B:
De acuerdo a los datos del problema tenemos:
Datos = 9.4, 17.1, 13.3, 10, 11.2
Σxᵢ = 61
N=5
x̄ = 61/5 = 12.2
xi xi – x
̄ (xi – x̄)2
10 -2.2 4.84
11.2 -1 1
Ejercicio 3:
El tiempo (en segundos) que tardaron todos los empleados del área de producción
en realizar una tarea es:
23 35 14 37 28 45
12 40 27 13 26 25
37 20 29 49 40 13
27 16 40 20 13 66
Calcular la desviación estándar
Solución 3:
23 -5.9583 35.5013
35 6.0417 36.5021
14 -14.9583 223.7507
37 8.0417 64.6689
28 -0.9583 0.9183
45 16.0417 257.3361
12 -16.9583 287.5839
40 11.0417 121.9191
27 -1.9583 3.8349
13 -15.9583 254.6673
26 -2.9583 8.7515
25 -3.9583 15.6681
37 8.0417 64.6689
20 -8.9583 80.2511
29 0.0417 0.0017
49 20.0417 401.6697
40 11.0417 121.9191
13 -15.9583 254.6673
27 -1.9583 3.8349
16 -12.9583 167.9175
40 11.0417 121.9191
20 -8.9583 80.2511
13 -15.9583 254.6673
66 37.0417 1372.0875
Ejercicio 4:
85 -0.2667 0.0711
86 0.7333 0.5377
76 -9.2667 85.8717
81 -4.2667 18.2047
93 7.7333 59.8039
84 -1.2667 1.6045
99 13.7333 188.6035
71 -14.2667 203.5387
69 -16.2667 264.6055
93 7.7333 59.8039
85 -0.2667 0.0711
81 -4.2667 18.2047
87 1.7333 3.0043
89 3.7333 13.9375
1.5.3 Varianza
Donde
X: variable sobre la que se pretenden
calcular la varianza
Xi: observación número i de la variable
X. i puede tomará valores entre 1 y n.
FORMULA
N: número de observaciones.
X̄: Es la media de la variable X.
Ejemplos de Varianza:
Número de valores: 6
Calculamos la Varianza:
Número de valores: 6
Calculamos la Varianza:
Fuente: [Link]
Ejercicio 2:
N =5
X̄ = 1970/5 = 394
B. La desviación estándar o desviación típica es la
raíz cuadrada de la varianza.
Para simplificar el cálculo vamos o utilizar las siguientes expresiones que son
equivalentes a las anteriores.