Medidas de Tendencia Central
✔ Son un modo de resumir un único conjunto de datos numéricos a través de un número
que debería ser típico para el grupo.
✔ No debería ser ni demasiado grande, ni demasiado pequeño y debería estar tan cerca
del “centro” de la distribución como sea posible.
✔ Pretende indicar dónde se encuentra el centro de la distribución de un conjunto de
datos. Pero ¿dónde se encuentra el “centro” de una distribución?
Mgtr. Elias Ariza
El Promedio o la Media Aritmética
La Media Poblacional
Mgtr. Elias Ariza
La Media para Datos Agrupados
Datos agrupados para una variable
continua
Datos agrupados para una variable
discreta
Mgtr. Elias Ariza
Ejemplo
Caso 1. Calcule la media de la siguiente distribución
xi ni fi Ni Fi
1 6 0.3 6 0.3
2 7 0.35 13 0.65
3 4 0.2 17 0.85
4 2 0.1 19 0.96
5 1 0.05 20 1
Mgtr. Elias Ariza
Ejemplo
Caso 2. Calcule la media de la siguiente distribución
Intervalos Ci ni
7.405-8.105 7.755 7
8.105-8.805 8.805 9
8.805-9.505 9.155 2
9.505-10.205 9.855 2
10.205-10.905 10.555 1
Característica y Propiedades de la Media
✔ Se usa para datos numéricos.
✔ Representa el centro de gravedad o el punto de equilibrio de los datos.
✔ La suma de las distancias de los datos a la media es cero. Esta propiedad está
relacionada con el hecho que la media es el centro de gravedad de los datos.
xi Distancia
10 -2
11 1
13 -1
14 2
Total 0
Mgtr. Elias Ariza
Característica y Propiedades de la Media
✔ Es muy sensible a la presencia de datos atípicos (OUTLIERS).
Con solo modificar un dato la media se desplazó tanto, que ya no se encuentra entre
la mayoría de los datos. Podemos decir que en este caso la media no es una buena
medida de posición de los datos.
En consecuencia, la media es una buena
medida del centro de la distribución
cuando ésta es simétrica.
Mgtr. Elias Ariza
La Mediana
✔ Una medida central tal que, con los datos ordenados de menor a mayor, el 50% de los datos son
inferiores a su valor y el 50% de los datos tienen valores superiores.
✔ La mediana divide en dos partes iguales la distribución de frecuencias o gráficamente, divide el
histograma en dos partes de áreas iguales.
✔ Si n es impar entonces la mediana es el dato central una vez se ordenen los datos.
✔ Si n es par entonces la mediana es la media aritmética de los dos valores centrales.
xi xi xi
13.5
1,5,14,3,7,8,9,12,2,4 1,5,14,3,8,9,12,2,4 1,5,23,14,19,21,20,2,4,13
xi xi xi
1,2,3,4,5,7,8,9,12,14 1,2,3,4,5,8,9,12,14 7,4,8,9,12,13,21,23,11,5,6,17, 11
25
xi
1,3,5,5,6,8,12,24,21,19,18,17, 8
16,14,23,31,5,6,7,1,1,6,7,10,1
Mgtr. Elias Ariza 1,15,21,7,4,8,9,12,13,21
Mediana para Datos Agrupados de una Variable Discreta
Xi Ni
1 6
2 13
3 17
4 19
5 20
Xi Ni
1 6
2 10
3 15
4 17
5 20
Mediana para Datos Agrupados de una Variable Continua
Mgtr. Elias Ariza
Mediana para Datos Agrupados de una Variable Continua
Ejemplo. Calcular la mediana para la siguiente distribución de datos.
Intervalo ni Ni
7.405 — 8.105 7 7
8.105 — 8.805 9 16
8.805 — 9.505 2 18
9.505 — 10.205 2 20
10.205 — 10.905 1 21
TOTAL 21
Mgtr. Elias Ariza
La Moda
✔ Es el valor de la variable que tiene una frecuencia máxima.
✔ En otras palabras, es el valor que más se repite.
✔ Puede suceder que la moda no sea única, es decir que aparezcan varios máximos en la distribución
de frecuencias. En ese caso diremos que tenemos una distribución bimodal, trimodal, etc.
✔ En el caso de una variable discreta que no toma valores repetidos, la moda no tiene sentido. Cuando
sí existen valores repetidos su cálculo es directo ya que puede leerse directamente de la tabla de
distribución de frecuencias.
Ejemplo. Calcular la moda para la siguiente distribución de datos
X ni fi Ni Fi
1 6 0.30 6 0.30
2 7 0.35 13 0.65
3 4 0.20 17 0.85
4 2 0.10 19 0.95
5 1 0.05 20 1.00
La Moda para Datos Agrupados de una Variable Continua
Mgtr. Elias Ariza
La Moda para Datos Agrupados de una Variable Continua
Ejemplo. Calcular la moda para la siguiente distribución de datos.
Intervalos ni Ni
7.405 — 8.105 7 7
8.105 — 8.805 9 16 El intervalo de clase modal
8.805 — 9.505 2 18
9.505 — 10.205 2 20
10.205 — 10.905 1 21
TOTAL 21
Mgtr. Elias Ariza
Taller|Medidas de Tendencia Central
Caso 1. Calcule la media aritmética, mediana y la moda de los siguientes datos.
17 4 7 8 10 12 6 1 0 17
19 14 22 17 11 31 3 15 17 29
Caso 2. Haga una tabla de distribución de frecuencias de intervalos K para los siguientes
datos y calcule la media, la mediana y la moda.
21 13 23 1
21 13 7 15
21 16 20 16
7 17 7 17
12 21 13 20
9 8 10 11
21 10 21 20
Mgtr. Elias Ariza
Taller|Medidas de Tendencia Central
Caso 3. Se ha consultado a dos grupos de personas la cantidad de personas que viven en
el hogar. Las respuestas se tabularon en las siguientes tablas.
Grupo 1 Grupo 2
4 8 6 5
5 4 5 2
6 4 6 6
3 4 3 7
23 3 5 7
¿Qué grupo tiene el mayor promedio y cuál es este valor? ¿Cuál es de los dos grupos tiene
mayor simetría para responder esto, adicional a la media, calcule la moda y la mediana y
compare los resultados de ambos grupos?
Mgtr. Elias Ariza
Medidas de Posición
✔ Las medidas de posición o ubicación relativa son aquellas que dividen la serie de datos en múltiples
partes con la misma proporción.
✔ Se llaman en general cuantiles y se pueden clasificar en tres grandes grupos: cuartiles, deciles y
percentiles.
Mgtr. Elias Ariza
Los Cuartiles
✔ Son medidas de posición que dividen la serie de datos en cuatro partes iguales.
✔ Cada una de las partes representa un 25% de la totalidad de datos.
✔ Los cuartiles se usan con frecuencia en el análisis de datos de encuestas para dividir la población en
grupos.
25% 25% 25% 25%
Q1 Q2 Q3
Fórmula general para datos
no agrupados
Mgtr. Elias Ariza
Variación de la Fórmula cuando N es Par o Impar
Mgtr. Elias Ariza
Ejemplos
Mgtr. Elias Ariza
Ejemplos
Mgtr. Elias Ariza
Ejemplos
Mgtr. Elias Ariza
Ejemplos
Mgtr. Elias Ariza
Ejemplos
Mgtr. Elias Ariza
Ejemplos
Mgtr. Elias Ariza
Cuartiles para datos agrupados en intervalos K
Mgtr. Elias Ariza
Ejemplos
Rango
199-299 85 85
299-399 90 175
399-499 120 295
499-599 70 365
599-699 62 427
699-799 36 463
Mgtr. Elias Ariza
Ejemplos
Calcular los cuartiles de la siguiente tabla de distribución de frecuencias.
Rango
50-60 8 8
60-70 10 18
70-80 16 34
80-90 14 48
90-100 10 58
100-10 5 63
110-120 2 65
Mgtr. Elias Ariza
Los Deciles
Mgtr. Elias Ariza
Los Percentiles
Mgtr. Elias Ariza
Taller|Medidas de Posición
1. Calcule los cuartiles de los siguientes datos.
17 4 7 8 10 12 6 1 0 17
19 14 22 17 11 31 3 15 17 29
2. Haga una tabla de distribución de frecuencias de intervalos K para los siguientes
datos y calcule la media, la mediana, la moda, los cuartiles, el decil 5 y el percentil 50.
21 13 23 1 16 22 21 17 18
21 13 7 15 21 13 24 23 15
21 16 20 16 2 2 7 23 0
7 17 7 17 21 23 21 21 21
12 21 13 20 12 2 21 18 13
9 8 10 11 21 3 10 8 12
21 10 21 20 21 2 7 6 21
Mgtr. Elias Ariza
Medidas de Variabilidad (Dispersión)
✔ Las medidas de variabilidad nos informan sobre el grado de concentración o dispersión que
presentan los datos respecto a su promedio.
✔ Llamaremos homogénea, concentrada o poco dispersa a aquella distribución en la que todos
los datos están cercanos al centro, como 4, 4, 5, 5, 5, 5, 6, 6, 6, 6, 7.
✔ Llamaremos heterogénea o dispersa a la distribución con datos más separados del centro,
como 1, 3, 5, 8, 10, 16, 20, 31, 14.
✔ Las más comunes son:
• Recorridos
• Desviación media
• Varianza
• Desviación típica
• Coeficiente de variación
Mgtr. Elias Ariza
El Recorrido o Rango
✔ Es la diferencia entre el máximo valor del conjunto de datos y el mínimo de ellos. A
mayor rango, mayor dispersión.
✔ El rango del conjunto 4 6 4 7 8 6 5 3 4 7 7 9 6 5 es 6, la diferencia entre el máximo
9 y el mínimo 3.
✔ No es una buena medida, pues ignora todo lo que ocurre dentro de ese rango.
✔ Con el fin de eliminar la excesiva influencia de los valores extremos en el recorrido,
se define el recorrido intercuartílico como la diferencia entre el tercer y el primer
cuartil. Dando el rango que ocupa el 50% de los datos.
✔ En ocasiones se utiliza el recorrido semi intercuartílico, o mitad del recorrido
intercuartílico
Mgtr. Elias Ariza
La Desviación Media
✔ En el caso de que la variable no tome valores repetidos, ni esté agrupada en
intervalos, la expresión anterior se simplifica a.
Mgtr. Elias Ariza
La Desviación Media
✔ En ocasiones se define una desviación media en términos de desviaciones
absolutas en torno a la mediana. En este caso se obtiene la llamada desviación
media respecto a la mediana
Mgtr. Elias Ariza
Ejemplos
Ejemplo 1. Número de hijos de una muestra de 20 familias tenemos. Calculemos el
recorrido semiintercuartíılico y la desviación respecto a la media aritmética. Datos
agrupados por valor de la variable
1. Calcular los cuartiles
xi ni fi Ni Fi
1 6 0.3 6 0.3
2 7 0.35 13 0.65
3 4 0.2 17 0.85
4 2 0.1 19 0.96
5 1 0.05 20 1 2. Calcular el recorrido semi intercuartílico
Mgtr. Elias Ariza
3. Calcular desviación respecto a la media aritmética
Recordar el cálculo de la media para
datos repetidos y con
frecuencia absoluta
Mgtr. Elias Ariza
Ejemplo 2. Calculemos el recorrido semi intercuartílico y la desviación respecto
a la media aritmética. Datos agrupados en intervalos de clase K
8.63 10.16 8.50 8.31 10.80 7.50 8.12
8.42 9.20 8.16 8.36 9.77 7.52 7.96
7.83 8.62 7.54 8.28 9.32 7.96 7.47
intervalos Ci ni fi Ni Fi
7.405-8.105 7.755 7 0.333 7 0.333
8.105-8.805 8.805 9 0.429 16 0.762
8.805-9.505 9.155 2 0.095 18 0.857
9.505-10.205 9.855 2 0.095 20 0.952
10.205-10.905 10.555 1 0.048 21 1.00
1. Calcular los cuartiles
Mgtr. Elias Ariza
2. Calcular el recorrido semi intercuartílico
3. Calcular la desviación respecto a la media aritmética
Recordar el cálculo de la media para
datos en inérvalos de clase
Mgtr. Elias Ariza
La Varianza
Muestra
Población
Variable discreta Variable continua
Mgtr. Elias Ariza
Ejemplo
✔ Calcular la varianza de los siguientes datos correspondientes a una muestra.
Calificaciones ni
1. Se calcula la media aritmética
4 3
5 6
6 4
7 13
8 7
10 6
Total 39
2. Se calcula la varianza de la muestra
Mgtr. Elias Ariza
La Desviación Estándar
✔ La desviación típica, al igual que la media y la varianza, es un índice muy sensible a las
puntuaciones extremas.
✔ Cuanta más pequeña sea la desviación típica mayor será la concentración de datos alrededor
de la media.
✔ La desviación típica será siempre un valor positivo o cero, en el caso de que las puntuaciones
sean iguales.
✔ La desviación típica mide cuánto se separan los datos.
Muestra
Población
Mgtr. Elias Ariza
Ejemplo
Calcular la desviación estándar de los siguientes datos correspondientes a una muestra.
Intervalo ni ci 1. Se calcula la media aritmética
60-65 5 62.5
65-70 20 67.5
70-75 40 72.5
80-85 27 82.5
85-90 8 87.5
Total 100
2. Se calcula la varianza de la muestra
Mgtr. Elias Ariza
El Coeficiente de Variación
✔ El coeficiente de variación es la relación entre la desviación típica de una muestra y su media.
✔ El coeficiente de variación permite comparar las dispersiones de dos distribuciones distintas,
siempre que sus medias sean positivas.
✔ Se calcula para cada una de las distribuciones y los valores que se obtienen se comparan
entre sí.
✔ La mayor dispersión corresponderá al valor del coeficiente de variación mayor.
✔ Puede expresarse en porcentaje.
Mgtr. Elias Ariza
Ejemplo
Mgtr. Elias Ariza
Taller | Medidas de Variabilidad
1. Calcular el recorrido semi intercuartílico y la desviación media debida a la media aritmética para los siguientes
datos semicuantitativos.
xi 1 2 3 4 5 6 7 9
ni 4 5 3 5 6 1 2 3
2. Calcular el recorrido semi intercuartílico y la desviación media debida a la media aritmética para los siguientes
datos numéricos.
xi
2 4 12 5 6 9 1 12 11 3 7
xi
3. Realice una tabla de distribución de frecuencias y calcula el recorrido 7 7 5 6 6 7 9
semi intercuartílico y la desviación media debida a la media aritmética para 4 8 9 7 5 10 8
los siguientes datos semicuantitativos.
7 7 3 5 2 5 7
Mgtr. Elias Ariza
4. Calcular la varianza de una distribución estadística que viene dada por la siguiente tabla.
Ki ni
10-15 3
15-20 5
20-25 7
25-30 4
30-35 2
5. Para el problema anterior calcular la desviación típica y el coeficiente de variación.
6. Hallar la desviación media, la varianza y la desviación típica de la series de números dados: 12, 6, 7, 3,
15, 10, 18, 5.
7. Cuál de las siguientes series de datos tiene la mayor dispersión.
Muestra 1:12, 6, 4, 5, 9, 1, 2, 10, 13, 15
Muestra 2: 23, 21, 25, 18, 17, 20, 19, 30, 16, 24
Mgtr. Elias Ariza
El Error Típico o Error Estándar de la Media Muestral
✔ El error estándar es una medida estadística de la variabilidad de una muestra con respecto a la población de
la cual se extrajo. Es decir, es una medida de cuánto varían las medias muestrales obtenidas al elegir
diferentes muestras de la misma población.
✔ El error estándar se utiliza comúnmente para estimar la precisión de la media muestral. Por ejemplo, si se
desea estimar la media de altura de una población a partir de una muestra aleatoria, se puede utilizar el error
estándar para estimar la precisión de esta estimación.
✔ Cuanto menor sea el error estándar, mayor será la precisión de la estimación de la media muestral. Por lo
tanto, una muestra grande tendrá un error estándar más pequeño que una muestra pequeña, ya que una
muestra más grande representa mejor la población y tiene menos variabilidad.
Mgtr. Elias Ariza
Coeficiente de Asimetría
Se dice que una distribución de medidas es simétrica cuando valores equidistantes de la variable, a uno y
otro lado, del valor central tienen la misma frecuencia. Es decir, en este caso tendremos simetría en el
histograma (o en el diagrama de barras) alrededor de una vertical trazada por el punto central.
Asimetría negativa Simetría Asimetría positiva
Asimetría hacia la izquierda Asimetría hacia la derecha
Con el fin de cuantificar el grado de asimetría de una distribución se pueden definir los coeficientes de
asimetría. Aunque no son los únicos, existen dos coeficientes principales: Coeficiente de asimetría de
Fisher y Coeficiente de asimetría de Pearson
Mgtr. Elias Ariza
Coeficiente de Asimetría de Fisher
Se define como el cociente entre el momento de orden 3 respecto a la media y el cubo de la desviación típica
donde;
Datos no agrupados Datos agrupados variable discreta Datos agrupados variable continua
g1 = 0 (distribución simétrica; existe la misma concentración de valores a la derecha y a la izquierda de la media)
g1 > 0 (distribución asimétrica positiva; existe mayor concentración de valores a la derecha de la media que a su izquierda)
g1 < 0 (distribución asimétrica negativa; existe mayor concentración de valores a la izquierda de la media que a su derecha)
Mgtr. Elias Ariza
Análisis de Datos con MS Excel
✔ Si tiene que desarrollar análisis estadísticos o técnicos complejos, puede ahorrar pasos y tiempo si
utiliza las Herramientas para análisis.
✔ Deberá proporcionar los datos y parámetros para cada análisis, y la herramienta utilizará las
funciones de macros estadísticas o técnicas correspondientes para realizar los cálculos y mostrar
los resultados en una tabla de resultados.
✔ Algunas herramientas generan gráficos además de tablas de resultados.
✔ Las funciones de análisis de datos sólo pueden utilizarse en una única hoja de cálculo a la vez.
✔ Para analizar los datos del resto de las hojas, actualice la herramienta de análisis para cada una de
ellas.
Mgtr. Elias Ariza