Medidas de tendencia central (Estadistica-para-Administracion-Berenson-y-
Levine-Completo-4ta-Edicion)
Es posible caracterizar cualquier conjunto de datos numéricos por la medición de
su tendencia central, variación y forma. La mayoría de los conjuntos de datos
presentan una tendencia central a agruparse en tomo a un valor central. Cuando
la gente habla de un "promedio", o ''valor medio", o del valor más común o
frecuente, se refiere de manera informal a la media, la mediana y la moda, tres
medidas de tendencia central. La variación mide la distribución o dispersión de
valores que conforman el conjunto de datos. Una medida simple de la variación es
el rango, que es la diferencia entre los valores máximo y mínima. En la estadística,
son de uso más común la desviación estándar y la varianza, dos medidas que se
explican más adelante en esta sección. La forma de un conjunto de datos
representa un patrón para todos los valores, desde el mínimo hasta el máximo.
Muchos conjuntos de datos tienen un patrón semejante a una campana, cuya cima
de valores está en alguna parte del centro.
La media
La media aritmética (por lo general llamada la media) es la medida más común de
la tendencia central. La media es la medida más común en la que todos los
valores desempeñan el mismo papel. La media sirve como "punto de equilibrio"
del conjunto de datos (como el punto de apoyo de un balancín). La media se
calcula sumando todos los valores del conjunto de datos y dividiendo el resultado
por el número de valores considerados.
suma de valores
X=
numero de valores
La mediana
La mediana es el valor que divide en dos partes iguales a un conjunto de datos ya
ordenado. La me diana no se ve afectada por los valores extremos, de manera
que puede utilizarse cuando están presentes. La mediana es el valor medio de un
conjunto de datos ordenado de menor a mayor.
El 50% de los valores son menores que la mediana y el otro 50% son mayores.
n+1
mediana= valor clasificado
2
La moda
La moda es el valor del conjunto de datos que aparece con mayor frecuencia. AI
igual que en la mediana y a diferencia de la media, los valores extremos no
afectan a la moda. Usted solo debe utilizar la media con propósitos descriptivos,
ya que varía más de una muestra a otra que la media o la me diana. Con
frecuencia, en un conjunto de datos no existe moda, o bien, hay varias modas. Por
ejemplo, considere los datos de tiempo para arreglarse que se muestran a
continuación.
29-31-35-39-39-40-43-44-44-46
Existen dos modas, 39 y 44 minutos ya que cada uno de estos valores aparece
dos veces.
(pág. 72-76)
Medidas de localización
Son medidas de que nos facilitan encontrar la posición exacta de un dato dentro
de una muestra.
Las medidas de localización equivalen a los valores que puede tomar una variable
caracterizados por agrupar a cierto porcentaje de observaciones en la muestra o
población.
Las medidas de localización son ideales para obtener información adicional a
partir de datos resumidos, es decir, que presentan perdida de información por
agrupamiento en intervalos de clase.
Percentiles
Los percentiles representan los valores de la variable que están por debajo de un
porcentaje, el cual puede ser un valor de 1% a 100% (en otras palabras, el total de
los datos es divido en 100 partes iguales).
Para obtener deciles, cuartiles o percentiles se utiliza la siguiente formula
i=¿ ¿
Donde:
I: decil, percentil o cuartil que se desea obtener
P: dato que se requiere hallar
N: tamaño de la muestra
Medidas de dispersión (Quevedo-F.-Medidas-de-tendencia-central-y-
dispersión 2011.)
Las medidas de dispersión entregan información sobre la variación de la variable.
Pretenden resumir en un solo valor la dispersión que tiene un conjunto de datos.
Las medidas de dispersión más utilizadas son: Rango de variación, Varianza,
Desviación estándar, Coeficiente de variación.
Rango de variación
Se define como la diferencia entre el mayor valor de la variable y el menor valor de
la variable.
( rango de variacion=maximo−minimo )
La mejor medida de dispersión, y la más generalizada es la varianza, o su raíz
cuadrada, la desviación estándar. La varianza se representa con el símbolo σ²
(sigma cuadrada) para el universo o población y con el símbolo s2 (s cuadrado),
cuando se trata de la muestra. La desviación estándar, que es la raíz cuadrada de
la varianza, se representa por σ (sigma) cuando pertenece al universo o población
y por “s”, cuando pertenece a la muestra. σ² y σ son parámetros, constantes para
una población particular; s2 y s son estadígrafos, valores que cambian de muestra
en muestra dentro de una misma población. La varianza se expresa en unidades
de variable al cuadrado y la desviación estándar simplemente en unidades de
variable. (pág. 2)
Formulas
Donde µ es el promedio de la población
2 2 2
(Y 1−µ) +(Y 2−μ) −…+(Yn−μ)
σ2
N
2
∑ (Yi−Y )
2
i
σ
x−1