1.
Realizar la búsqueda de bibliografía complementaria para el desarrollo del
taller.
2. Consultar:
a. ¿Qué son las medidas de tendencia central? ¿Cuáles son?1
Las medidas de tendencia central son parámetros estadísticos que informan sobre el
centro de la distribución de la muestra o población estadística.
Son valores que se ubican al centro de un conjunto de datos ordenados según su
magnitud. Generalmente se utilizan 4 de estos valores también
conocidos como estadigrafos, la media aritmética, la mediana, la moda y al rango
medio.
Entre las medidas de tendencia central podemos encontrarnos con las siguientes: media,
mediana y moda
1. Media
La media es el valor promedio de un conjunto de datos numéricos, calculada como la
suma del conjunto de valores dividida entre el número total de valores. A
continuación, se muestra la fórmula de la media aritmética:
1.1 Formula media aritmética
Ejemplo:
Donde x es el valor de la observación i, y N el número total de observaciones.
Supongamos que nuestras calificaciones en la escuela son:
Asignatura Nota
Matemáticas 7
Educación Física 8
Biología 5
Economía 10
N = número total de asignaturas = 4
Entonces aplicando la fórmula que acabamos de exponer, el resultado sería:
1
Economipedia, tomado de, https://economipedia.com/definiciones/media.html
Nuestra nota media será de un 7,5.
1.2 Media ponderada
La media ponderada (MP) es una medida de centralización. Consiste en otorgar a cada
observación del conjunto de datos (X1,X2,…,XN) unos pesos (p1,p2,…,pN) según la
importancia de cada elemento.
Ahora vamos a ver un ejemplo en el que vamos a calcular nuestra nota de Economía.
Nuestra nota media de economía, va a depender de tres notas. Dado que la importancia o
ponderación, de las distintas partes de la asignatura no es el mismo, tomaremos como
referencia la siguiente fórmula:
Donde x es el valor de la observación i, P es el peso o importancia de cada observación y
N el número total de observaciones.
Ejemplo 1:
Trabajo sobre el crash del 29 — 20%
Examen final ———————— 70%
Asistencia a clase —————— 10%
En el trabajo sobre el crash del 29, gracias a que buscamos información en
Economipedia, nos pusieron un 9,5. En el examen final tuvimos un 8,5. Sin embargo, solo
asistimos a 10 clases de un total de 20. Por lo que nuestra nota en asistencia a clase es
de un 5.
Para saber nuestra nota final de la asignatura de economía debemos multiplicar nuestra
nota por la ponderación. Tal que:
Nuestra nota final de la asignatura es de 8,35.
Otro ejemplo 22:
2
MEDIA PONDERADA, tomado de https://www.universoformulas.com/estadistica/descriptiva/media-
ponderada/
La nota final de una asignatura es una media ponderada de las notas que han obtenido
los alumnos en los cuatro elementos evaluables que determina el profesor. El responsable
de la asignatura otorga un peso de 3 al examen inicial, de 1 al trabajo entregable, 2 al
trabajo final y 4 al examen final. Las notas de un alumno han sido las siguientes:
Se hace la suma de los productos de las notas por el peso de cada nota y se divide por la
suma de los pesos.
La nota final del alumno en esta asignatura es de 6,14. Se puede ver en el siguiente
gráfico como la nota es muy próxima a las notas sacadas en los exámenes. Esto es a
causa de que los exámenes eran más importantes y tenían unos pesos mucho mayores
que los de los trabajos.
1.3 Media geométrica
La media geométrica de conjunto de números positivos, y siempre positivos, es la raíz n-
ésima del producto del conjunto de números.
Dado que es un producto conjunto, si uno de los elementos es cero, entonces el producto
total será cero. Y, en consecuencia, la raíz dará como resultado cero. Por ello, debe
siempre tenerse en cuenta que ninguno de los números sea cero.
Donde N es el número de observaciones que tenemos.
Esta media se utiliza principalmente para variables en tantos por uno (porcentajes)
o índices. Su ventaja sobre las demás formas de cálculo es su menor sensibilidad a
valores extremos de las variables. Su desventaja, sin embargo, es que no se pueden
utilizar números negativos, ni valores iguales a cero.
Ejemplo 1:
Supongamos los resultados de una empresa. La empresa ha generado un 20%
de rentabilidad el primer año, un 15% el segundo año, un 33% el tercer año y un 25% el
cuarto año. Lo fácil, en este caso sería sumar las cantidades y dividir entre cuatro. Sin
embargo, esto no es correcto.
Para calcular la media de varios porcentajes debemos hacer uso de la media geométrica.
Aplicado al caso anterior, tendríamos lo siguiente:
El resultado es 1,23, que expresado en porcentaje es un 23%. Lo que quiere decir que en
promedio, cada año la empresa ha ganado un 23%. Dicho de otra forma, si cada año
hubiese ganado un 23%, hubiera ganado lo mismo que ganando un 20% el primer año, un
15% el segundo, un 33% el tercero y un 25% el último año.
NOTA: Si las rentabilidades fueran negativas, no se pondrían números negativos. Si la
rentabilidad es del -20%, el número a multiplicar sería 0,8. Si la rentabilidad es del -5%, el
número a multiplicar sería 0,95. En conclusión si las rentabilidades son positivas, a uno le
sumamos el porcentaje en tanto por uno. Mientras que, si las rentabilidad o porcentajes
son negativos, a 1 le restamos el porcentaje en tanto por uno.
Ejercicio 2
En una empresa quieren saber la proporción media de mujeres en los diferentes
departamentos. Para ello, se recoge el porcentaje de mujeres en los cinco principales
departamentos.
Como es la media de porcentajes, calculamos la media geométrica que es más
representativa.
Ejercicio 33
3
https://www.universoformulas.com/estadistica/descriptiva/media-geometrica/
Una aldea sufre un proceso rápido de envejecimiento. El primer año aumentan los
mayores de 65 años un 10%, el segundo año, un 20%, el tercer año un 30% y el cuarto
año, un 40%.
Si la población de inicial es de 100 mayores de 65 años, ¿cuál será un mejor indicador
para caracterizar ese envejecimiento: la media aritmética o la media geométrica?
Solución:
Sabemos que, para llegar a la cifra final al cabo de los cuatro años, debemos acumular
sucesivamente los porcentajes anuales:
Tras el cuarto año, en la aldea hay 240 personas con más de 65 años.
Si calculamos la media aritmética de los porcentajes de incremento anual, obtendremos:
Si esta media aritmética la acumulamos a los cuatro años:
El resultado obtenido excede a la realidad.
Pero si hubiésemos empleado la media geométrica de los incrementos anuales:
Llegamos a un porcentaje anual obtenido con la media geométrica del 24,02%.
Calculamos la población final a partir de este último indicador, acumulándolo a los cuatro
años.
Obtenemos el resultado final exacto. Por lo que resulta más representativa, trabajando
con porcentajes, la media geométrica que la aritmética:
Relación entre medias
Existe una relación de orden entre cuatro tipos de media. En esta relación se excluye
la media ponderada porque depende de los pesos. Sean:
H la media armónica
MG la media geométrica
x la media aritmética
RMS la media cuadrática
Entonces:
En esta relación, solamente se cumple la igualdad cuando todos los datos sean iguales,
es decir si: x1 = x2 = x3 = … = xN.
Se da la siguiente relación, en el caso de distribuciones de solamente dos datos, sean
estos los que sean:
Cuando en la distribución hay solamente dos datos, la media geométrica es la media
geométrica entre la media aritmética y la media armónica.
Esta relación se convierte en una aproximación, cuando, habiendo múltiples valores,
estos están muy agrupados en torno a la media.
1.4 Media armonizada
La media armonizada de un conjunto de valores es igual a la inversa de la media
aritmética. Su formula queda tal que:
Se recomendada para calcular velocidades. Es especialmente sensible a valores
extremos pequeños, pero poco sensible a valores extremos grandes. En economía se usa
para calcular uno de los índices más famosos y utilizados en estadística económica,
el índice de Paasche.
Ejemplo 1:
Supongamos que tenemos una empresa con reparto a domicilio en moto. Nos realizan un
encargo a 4 kilómetros. El primer kilómetro el repartidor va a una velocidad de 30 km/h, el
segundo kilómetro a 25 km/h, el tercer kilómetro se encuentran con tráfico y reduce la
velocidad a 15 km/h y el último tramo a 35 km/h.
Nos disponemos a calcular la velocidad media del repartidor y obtenemos que:
La velocidad media de nuestro repartidor durante el reparto ha sido de 23,5 km/h.
Ejemplo 2:
Un tren realiza un trayecto de 400km. La vía tiene en mal estado que no permitían correr.
Los primeros 100 km los recorre a 120km/h, los siguientes 100km la vía está en mal
estado y va a 20km/h, los terceros a 100km/h y los 100 últimos a 130km/h. Para calcular
el promedio de velocidades, calculamos la media armónica.
La media armónica es de H=52,61km/h.
Relación entre medias
Existe una relación de orden entre cuatro tipos de media. En esta relación se excluye
la media ponderada porque depende de los pesos. Sean:
H la media armónica
MG la media geométrica
x la media aritmética
RMS la media cuadrática
Entonces:
En esta relación, solamente se cumple la igualdad cuando todos los datos sean iguales,
es decir si: x1 = x2 = x3 = … = xN.
Se da la siguiente relación, en el caso de distribuciones de solamente dos datos, sean
estos los que sean:
Cuando en la distribución hay solamente dos datos, la media geométrica es la media
geométrica entre la media aritmética y la media armónica.
Esta relación se convierte en una aproximación, cuando, habiendo múltiples valores,
estos están muy agrupados en torno a la media.
Como se explica en el artículo enlazado anteriormente, existen muchos tipos de media. La
elección de cada tipo de media tiene que ver, principalmente con el tipo de dato sobre el
que se calcula.
2. Mediana
La mediana es un estadístico de posición central que parte la distribución en dos, es
decir, deja la misma cantidad de valores a un lado que a otro. La fórmula de la mediana
es:
Cuando el número de observaciones es par:
Mediana = (n+1) / 2 = Media de las observaciones
Cuando el número de observaciones es impar:
Mediana = (n+1) / 2 = Valor de la observación
Es decir, que, si tenemos 50 datos ordenados preferiblemente de menor a mayor, la
mediana estaría en la observación número 25,5. Esto es el resultado de aplicar la fórmula
para un conjunto de datos par (50 es número par) y dividir entre 2. El resultado es 25,5 ya
que dividimos entre 50+1. La mediana será la media entre la observación 25 y la 26.
En el próximo epígrafe lo veremos más detenidamente, con ejemplos visuales
Ejemplo de cálculo de la mediana4
Imaginemos que tenemos los siguientes datos:
2,4,12,6,8,14,16,10,18.
En primer lugar, los ordenamos de menor a mayor con lo que tendríamos lo siguiente:
2,4,6,8,10,12,14,16,18.
Pues bien, el valor de la mediana, como indica la fórmula, es aquel que deje la misma
cantidad de valores tanto a un lado como a otro. ¿Cuántas observaciones tenemos? 9
observaciones. Calculamos la posición con la fórmula de la mediana correspondiente.
Mediana = 9+1 / 2 = 5
¿Qué quiere decir este 5? Nos dice que el valor de la mediana, se encuentra en la
observación cuya posición es la quinta.
Por lo tanto, la mediana de esta sería de datos sería el número 10, ya que está en la
posición quinta. Además, podemos comprobar cómo tanto a la izquierda del 5 hay 4
valores (2, 4, 6 y 8) y a la derecha del 10 hay otros 4 valores (12, 14, 16 y 18).
4
https://economipedia.com/definiciones/mediana.html
Otro ejemplo de la mediana
Imaginemos ahora que tenemos los siguientes números:
1,2,4,2,5,9,8,9.
Si los ordenamos tendríamos lo siguiente:
1,2,2,4,6,8,9,9.
En este caso, la cantidad de observaciones es par. Por tanto, de tener en cuenta las
consideraciones para el número de observaciones par. La fórmula nos indica lo siguiente:
Mediana = 8+1 / 2 = 4,5
Claro que pensaréis, ¿cuál es la posición 4,5? O está en la posición 4 o está en la
posición 5, pero la 4,5 no existe. Lo que haremos será una media de los valores que están
en la posición 4 y 5. Esos números son el 4 y el 6. La media entre estos dos números es 5
[ (4+6) / 2 ].
El valor de la mediana, por tanto, sería 5. El número 5 (nos lo imaginamos) dejaría al lado
izquierdo (1, 2, 2 y 4) la misma cantidad de observaciones que al lado derecho (6, 8, 9 y
9)
3. Moda
La moda (Mo(X)), o moda estadística, es el valor más repetido del conjunto de datos, es
decir, el valor cuya frecuencia relativa es mayor. En un conjunto puede haber más de una
moda.
Ejemplo
Tenemos una muestra de las once edades de los jugadores de un equipo de fútbol.
Hacemos recuento del elemento que más se repite en el conjunto.
La edad que más se repite es 26, por lo que la moda del conjunto es 26.
b. ¿Qué son las medidas de dispersión? ¿Cuáles son?
Las medidas de dispersión nos informan sobre cuánto se alejan del centro los valores
de la distribución.
Las medidas de dispersión o medidas de variabilidad muestran la variabilidad de un
conjunto de datos, indicando la mayor o menor concentración de datos respecto a las
medias de centralización.
Los de variabilidad o dispersión nos indican si esas puntuaciones o valores están
próximas entre sí o si por el contrario están o muy dispersas.
Una medida razonable de la variabilidad podría ser la amplitud o rango, que se obtiene
restando el valor más bajo de un conjunto de observaciones del valor más alto. Es fácil de
calcular y sus unidades son las mismas que las de la variable, aunque posee varios
inconvenientes:
No utiliza todas las observaciones (sólo dos de ellas);
Se puede ver muy afectada por alguna observación extrema;
El rango aumenta con el número de observaciones, o bien se queda igual. En
cualquier caso nunca disminuye.
1. Rango
El rango (R) o recorrido estadístico es la diferencia entre el valor máximo y el mínimo de
un conjunto de datos.
Ejemplo
Supongamos que deseamos calcular el rango de las edades del once inicial de un
equipo de fútbol.
El jugador más mayor (máximo del conjunto) tiene 31 años, mientras que el más
joven (mínimo) 18. Por lo tanto el rango es:
2. Rango intercuartílico
El rango intercuartílico IQR (o rango intercuartil) es una estimación estadística
de la dispersión de una distribución de datos. Consiste en la diferencia entre el tercer y
el primer cuartil. Mediante esta medida se eliminan los valores extremadamente alejados.
El rango intercuartílico es altamente recomendable cuando la medida de tendencia central
utilizada es la mediana (ya que este estadístico es insensible a posibles irregularidades en
los extremos).
Con el IQR podremos elaborar los diagramas de caja, que es un instrumento muy
visual para evaluar la dispersión de una distribución.
3. La varianza
La varianza (S2) mide la dispersión de los datos de una muestra (X1,X2,…,XN)
respecto a la media (x), calculando la media de los cuadrados de las distancias de todos
los datos.
Al elevar las diferencias al cuadrado se garantiza que las diferencias absolutas
respecto a la media no se anulan entre sí. Además, resaltan los valores alejados.
Siempre se cumple que la varianza es mayor o igual que cero (S2 ≥ 0). Ésta
es cero cuando todos los datos son el mismo (ejemplo: {1,1,1,1,1}).
Si en vez de tratarse de una muestra, la varianza se refiere a la población, el
denominador será N.
Ejercicio
Un médico de un instituto quiere realizar un estudio para ver si los alumnos de un centro
tienen sobrepeso. Le interesaría calcular la varianza para ver como difieren los pesos
respecto a la media. Para ello, se selecciona una muestra de doce alumnos de 14 o 15
años.
Se calcula la media de los pesos de los alumnos, y se obtiene que x = 53,5kg.
Una vez se sabe la media, se halla la diferencia de cada elemento respecto a esta, para
calcular la dispersión de los datos.
Una vez se ha calculado el cuadrado de la diferencia de cada elemento con la media, ya
se puede determinar la varianza (S2):
El valor alto de la varianza confirma una de sus características: que es sensible a los
valores que se separan bastante de la media.
A continuación se puede observar un gráfico de las diferencias del peso de cada alumno
respecto a la media:
4. La desviación típica (o desviación estándar)
La desviación típica (o desviación estándar) es la medida de dispersión (S) asociada a
la media. Mide el promedio de las desviaciones de los datos de una muestra (X1,X2,
…,XN) de la media (x) en las mismas unidades de los datos. Dicho de otra forma, es un
indicador de cómo tienden a estar agrupados los datos respecto a la media
El cuadrado de la desviación típica es la varianza.
Cuando se trata de la desviación típica de una población, el denominador es N. Si se
trata de una muestra, será N-1 y a la varianza la denominaremos con el signo σ.
Ejercicio uno:
Hallar la desviación media, la varianza y la desviación típica de las series de números
siguientes:
.
.
a. 2, 3, 6, 8, 11.
Media aritmética
Desviación media
Varianza
Desviación típica
b. 12, 6, 7, 3, 15, 10, 18, 5.
Media aritmética
Desviación media
Varianza
Desviación típica
Ejercicio dos continuaciones:
Calcular la desviación típica de la distribución de la tabla:
Solución:
a. Media aritmética
b. Desviación típica
5. Coeficiente de variación de pearson
El coeficiente de variación de Pearson (r) mide la variación de los datos respecto a
la media, sin tener en cuenta las unidades en la que están.
Indica la relación existente entre la desviación típica de una muestra y su media.
Al dividir la desviación típica por la media se convierte en un valor exento de unidad de
medida. Si comparamos la dispersión en varios conjuntos de observaciones tendrá menor
dispersión aquella que tenga menor coeficiente de variación.
El principal inconveniente, es que, al ser un coeficiente inversamente proporcional a la
media aritmética, cuando está tome valores cercanos a cero, el coeficiente tenderá a
infinito.
El coeficiente de variación toma valores entre 0 y 1. Si el coeficiente es próximo al 0,
significa que existe poca variabilidad en los datos y es una muestra muy compacta. En
cambio, si tienden a 1 es una muestra muy dispersa.
Para interpretar fácilmente el coeficiente, podemos multiplicarlo por cien para tenerlo en
tanto por cien.
c. ¿Qué son las medidas de posición? ¿Cuáles son?
Las medidas de posición dividen un conjunto de datos en grupos con el mismo
número de individuos.
Para calcular las medidas de posición es necesario que los datos estén
ordenados de menor a mayor.
Las medidas de posición son:
1. Cuartiles
Los cuartiles son los tres elementos de un conjunto de datos ordenados que dividen el
conjunto en cuatro partes iguales.
Distinguimos los casos en que los datos están agrupados en frecuencias y los que no lo
están. Los datos también pueden estar agrupados en intervalos de valores.
Vayamos a datos no agrupados. Para el cuartil 1 (Q 1) y cuartil 3 (Q3) hallaremos su
posición mediante los siguientes pasos:
(N+1)/4 y 3(N+1)/4 pueden resultar números decimales. Por ejemplo, si el conjunto de
datos es de 20 elementos, N=20, tendremos que el sujeto del primer cuartil es el
(N+1)/4=(20+1)/4=21/4=5,25. ¿Qué hacemos en el caso de que nos dé un número
decimal?
Diferenciaremos dos casos:
Sin parte decimal: elegimos ese mismo sujeto. Por ejemplo, si el conjunto tiene
19 elementos, (N+1)/4=(19+1)/4=20/4=5, por lo que el primer cuartil será Q1=X5.
Con parte decimal: supongamos que el elemento es un número con parte
decimal entre el sujeto i y el i+1. Sea un número de la forma i,d donde i es la parte entera
y d la decimal. El cuartil será:
Podéis ver un ejemplo práctico en el siguiente apartado.
El cálculo del segundo cuartil (Q2) depende de si el número de sujetos N es par o impar.
Al ser la mediana, se utiliza el procedimiento de cálculo de la mediana.
Características de los cuartiles
El cuartil 1 (Q1) es el percentil 25 (P25).
El cuartil 2 (Q2) es la mediana y el percentil 50 (P50).
El cuartil 3 (Q3) es el percentil 75 (P75).
Ejercicio
Sea un conjunto de la edad de los veinte integrantes (N=20) de un club. Supongamos que
el conjunto está ordenado:
Primer cuartil
El primer cuartil será el sujeto (N+1)/4=21/4=5,25. Como es decimal, el cuartil será
un número entre el X5=28 y X6=29.
El número decimal es el 5,25, por lo que i=5 y d=0,25. El cuartil 1 es:
Segundo cuartil
El segundo cuartil es la mediana. Al ser un conjunto con un número par de
elementos, el cuartil es la media de los sujetos N/2=20/2=10 y N/2+1=20/2+1=11.
Es decir, será la media de X10=34 y X6=37.
Tercer cuartil
El tercer cuartil es el sujeto 3(N+1)/4=63/4=15,75. Como el número es decimal, el
cuartil estará entre X15=52 y X16=53.
El número decimal es el 15,75, por lo que i=15 y d=0,75. El cuartil 3 es:
2. Percentiles
El percentil es una medida de posición no central. Los percentiles Pi son los 99
puntos que dividen una serie de datos ordenada en 100 partes iguales, es decir, que
contienen el mismo número de elementos cada una.
Sea (X1, X2,…,XN) una muestra de N elementos. El percentil Pi se calcula mediante la
fórmula siguiente:
Donde Pi es la posición del percentil buscado en la serie ordenada de datos.
(N+1)·i/100 pueden resultar números decimales. Por ejemplo, si el conjunto de datos es
de 200 elementos, N=200, tendremos que el sujeto del percentil 50 será es el
(N+1)·i/100=201·50/100=100,5. ¿Qué hacemos en el caso de que nos de un número
decimal?
Diferenciaremos dos casos:
Sin parte decimal: elegimos ese mismo sujeto. Por ejemplo, si el conjunto tiene
199 elementos, (N+1)·i/100=200·50/100=100, por lo que el percentil 50 será P50=X100.
Con parte decimal: supongamos que el elemento es un número con parte
decimal entre el sujeto t y el t+1. Sea un número de la forma t,d donde t es la parte entera
y d la decimal. El percentil será:
Los percentiles están pensados para conjuntos de elementos de más de cien elementos.
Una aplicación muy conocida de los percentiles son las tablas de crecimiento de los
niños, en las que se ubica el peso y la talla de un determinado niño dentro de su grupo de
edad.
Características de los percentiles
El percentil 25 (P25) es el cuartil 1 (Q1).
El percentil 50 (P50) es la mediana y el cuartil 2 (Q2).
El percentil 75 (P75) es el cuartil 3 (Q3).
Ejercicio
Tenemos las notas finales de matemáticas de los 500 alumnos de un Instituto. Un
profesor de matemáticas de este centro, desea calcular los percentiles 10, 25, 50, 75 y
85, es decir P10, P25, P50, P75 y P85.
Los datos los tenemos ordenados en la tabla anterior, donde las notas van de 0 a 10,
ni son las frecuencias absolutas y las Ni frecuencias absolutas acumuladas
Ahora podemos proceder a calcular los percentiles aplicando su fórmula.
Cálculo del percentil 10:
Y obtenemos que P10 = 1.
Cálculo del percentil 25:
Se obtiene que P25 = 3,25.
Cálculo del percentil 50:
Y obtenemos que P50 = 6.
Cálculo del percentil 75:
Resultando que P75 = 7.
Cálculo del percentil 85:
Y obtenemos que P85 = 8.
Escoger un artículo científico de una temática de su interés, e identifique las
medidas vistas en la sesión 5 y las consultadas en este taller. El estudiante estará
en la capacidad de socializar el articulo a sus compañeros y docente.
Articulo: Factores de riesgo cardiovascular en adolescentes de 10 a 17 años escolarizados de la
ciudad de Medellín, 2015