ESCUELA DE ADMINISTRACIÓN
SEDE EL TIGRE
ESTADÍSTICA GENERAL
Medidas de posicion.
Autor María I. González Marín.
Universidad Gran Mariscal de Ayacucho.
1020A373: Estadística general.
MSc. Hamlet Mata
30 de mayo del 2021
Introducción
La medición de la posición nos proporciona información sobre la serie de
datos que estamos analizando. La descripción de un conjunto de datos
incluye la ubicación de estos datos en el contexto de posibles valores como
elementos importantes. Una vez determinados los conceptos básicos de la
investigación de distribución de frecuencia variable, estudiaremos diferentes
formas de resumir estas distribuciones a través de la medición de la
ubicación (o centralización), teniendo en cuenta los errores del resumen.
Medidas de descentralización correspondientes
Se trata de encontrar el valor medido de la distribución de frecuencia
integrada. Además de procesar todos los datos de la variable, esta es una
tarea tediosa. Podemos utilizar algunos valores para caracterizar su
distribución de frecuencia, seleccionar un valor central como resumen de los
datos y calcular el valor de la variable alrededor del valor central. La métrica
se distribuye y su valor representa la estadística el valor del dato que se
encuentra en el centro de la distribución de frecuencia, por lo que también
se les llama "Medidas de Tendencia Central”.
Medidas de posición
Las medidas o índices de posición, también llamados cuantiles,
informan acerca de la posición relativa de un sujeto con respecto a su grupo
de referencia, dentro de la distribución de frecuencias de la variable. Para
ello debemos dividir la distribución en un número de partes o secciones
iguales entre sí en cuanto al número de observaciones.
Las medidas de posición, por tanto, sirven para medir y para dividir.
De esta forma, unos resumirán los diferentes valores en uno que, en este
caso, sea representativo. Por ejemplo, un promedio. Mientras los otros
dividirán el conjunto de los datos en partes iguales, más sencillas de
interpretar. Las medidas de posición se suelen dividir en dos grandes
grupos: la de tendencia no central y las centrales.
Las medidas de tendencia central: son medidas estadísticas que
pretenden resumir en un solo valor a un conjunto de valores. Representan
un centro en torno al cual se encuentra ubicado el conjunto de los datos.
Las medidas de tendencia central más utilizadas son: media, mediana y
moda. Las medidas de dispersión en cambio miden el grado de dispersión
de los valores de la variable.
La media aritmética, geométrica o armónica:
Son tres medidas centrales que nos indican un promedio ponderado
de los datos. La primera es la más utilizada y la más conocida de las tres.
La geométrica se aplica en series que muestran crecimientos porcentuales.
Por su parte, la armónica es útil en el análisis de inversiones en bolsa.
La mediana:
En este caso, esta es la medida de posición central más reconocible.
Divide la distribución en dos partes iguales. De esta forma, expresa el valor
mediano, que no medio. Es muy útil en variables como los ingresos o
salarios, a la vez que está muy relacionada con la media y algunos de los
cuantiles vistos.
La moda:
Estamos ante una medida central de los valores más frecuentes. Por
tanto, la moda nos informa sobre aquellos que se repiten en más ocasiones.
Esta medida es muy útil en los estudios de mercado cuando medimos una
impresión sobre un producto con una escala likert.
Las medidas de posición no centrales son los cuantiles. Estos
realizan una serie de divisiones iguales en la distribución ordenada de los
datos. De esta forma, reflejan los valores superiores, medios e inferiores.
Entre ellas encontramos:
Cuartiles:
Los cuartiles son valores que dividen una muestra de datos en cuatro
partes iguales. Utilizando cuartiles puede evaluar rápidamente la dispersión
y la tendencia central de un conjunto de datos, que son los pasos iniciales
importantes para comprender sus datos.
Quintiles:
Un quintil es la quinta parte de una población estadística, representa
el 20% del número total de individuos de una población determinada. Es un
termino muy utilizado en economía para distribuir a la población.
Deciles:
Estamos ante un cuantil que divide los datos en diez partes iguales.
Existen nueve deciles, de D1 a D9. El D5 se corresponde con la mediana.
Por su lado, los valores superiores e inferiores (equivalentes a los diferentes
cuartiles) se sitúan en puntos intermedios entre estos.
Percentiles: En estadística, un percentil se define como una medida
de posición no central, utilizada para comparar datos. Consiste en un
número de 0 a 100 que indica el porcentaje de datos que son igual o
menor que un determinado valor.
¿Cuáles son las características de las medidas de posición?
-Deben ser definidas rigurosamente y no ser susceptibles de diversas
interpretaciones.
-Deben depender de todas las observaciones de la serie.
-No deben tener un carácter matemático demasiado abstracto.
-Deben ser susceptibles de cálculos algebraicos.
¿Qué es la sumatoria y cuáles son sus propiedades? De ejemplos.
El sumatorio, la sumatoria, o la operación de suma es un operador
matemático que permite representar sumas de muchos sumandos, n o
incluso infinitos sumandos, se expresa con la letra griega sigma ( ), y se
define como:
Esto se lee: «sumatorio sobre i, desde m hasta n, de x sub-i». La
variable i es el índice de suma al que se le asigna un valor inicial llamado
límite inferior, m. La variable i recorrerá los valores enteros hasta alcanzar el
límite superior, n.
Ejemplo: desarrolla la siguiente sumatoria:
x = 1 nx (x – 1)
Resultado: x = 1nX (X – 1) = 1(1 1) + 2(2 – 1) + 3(3 – 1) + 4(4 – 1) +
… + (n – 1)(n – 1) – 1 + n(n – 1) =
= 10 + 21 + 3 2 +43 +… +(n – 1)(n – 2) + n(n – 1) 2) + n(n – 1)
= 0 + 2 + 6 + 12 + … + (n –2) + n(n – 1)
Ejemplo: Encuentre una fórmula para:
Resultado: hacemos uso de las propiedades 2.3 y de las
fórmulas 2.4.3.
¿Qué es la media aritmética, para datos agrupados, propiedades,
modalidades para su cálculo? De ejemplos.
La media aritmética es el valor obtenido al sumar todos los datos y
dividir el resultado entre el número total de datos. La calculamos de la
siguiente manera:
Donde “n” es el número de datos.
Algunas propiedades de la media son:
-Considera todas las puntuaciones
-El numerador de la fórmula es la cantidad de valores
-Cuando hay puntuaciones extremas, no tiene una representación
exacta de la muestra
Ejemplo: Calcular la media de: 8, 9, 10, 11, 16, 17,6
N= 7 (el número de datos)
Aplico la fórmula:
Ejemplo: Calcular la media de: 84, 91, 72, 68, 87,78
N- 6 (el numero de datos)
¿Cuáles son los pasos para determinar la media Aritmética en datos
agrupados?
Cuando los datos vienen agrupados en una tabla de frecuencias, la
expresión de la media es distinta. Supongamos que tenemos clases
diferentes en nuestra tabla de frecuencias, en donde para cada clase,
tenemos su media y su frecuencia correspondiente, entonces calculamos la
media como:
Debemos observar que ahora N es la suma de las frecuencias de
cada clase, esto es
Además, cuando cada grupo o clase es un intervalo, la media de
dicho intervalo es simplemente el punto medio entre los límites.
Como observación a considerar, notemos que al tener una tabla de
frecuencias, al agrupar los datos, sustituimos cada dato por la media del
grupo o clase al que pertenece, y que la suma de todas las frecuencias es
igual a la cantidad de datos que tendríamos si no agrupáramos, por lo tanto,
al calcular la media en datos agrupados, lo que hacemos es simplemente
reemplazar cada dato por la media del grupo o clase al que pertenece. En
caso de tener datos no agrupados, en general es mejor no agrupar ya que
esto implica pérdida de información.
¿Qué es la mediana, cuáles son sus propiedades? De ejemplos.
La mediana es un conjunto es un valor que se encuentra a la mitad de
los otros valores, es decir, que al ordenar los número de menor a mayor,
éste se encuentra justamente en medio entre los que están por arriba.
Algunas propiedades de la mediana son:
-Las operaciones para calcular el valor son muy sencillas de realizar.
-La medida no depende de los valores de las variables, solamente de su
orden.
-Generalmente, los valores son enteros.
-Se puede calcular aunque los números que se encuentren arriba y abajo
no tengan límites.
Ejemplo
-Calcular la mediana de los siguientes precios de un kilo de manzanas
en diferentes supermercados: 9, 11, 8, 7, 13, 10, 12
Ordenamos los valores de menor a mayor: 7, 8, 9, 10, 11, 12, 13
Al ser una serie de un número impar de valores (7), la mediana sería
el valor central: Me = 10
- Calcular la mediana de las siguientes notas de exámenes: 8, 13, 12,
10
Ordenamos los valores de menor a mayor: 8, 10, 12, 13
Al ser una serie de un número par de valores (4), la mediana sería la
media de los valores centrales: Me = (10 + 12) / 2 = 11
¿Cuáles son los pasos para determinar la mediana en datos
agrupados?
La mediana se encuentra en el intervalo donde la frecuencia
acumulada llega hasta la mitad de la suma de las frecuencias absolutas.
Es decir tenemos que buscar el intervalo en el que se encuentre.
es el límite inferior de la clase donde se encuentra la mediana
es la semisuma de las frecuencias absolutas
es la frecuencia absoluta de la clase mediana
es la frecuencia acumulada anterior a la clase mediana
es la amplitud de la clase
¿Qué es la moda, cuáles son sus propiedades? De ejemplos.
En la estadística, la moda es el valor con mayor frecuencia en una de
las distribuciones de datos. Esto va en forma de una columna cuando
encontremos dos modas, es decir, dos datos que tengan la misma
frecuencia absoluta máxima. Una distribución trimodal de los datos es en la
que encontramos tres modas.
Las principales propiedades de la moda son:
-Es una muestra muy clara
-Las operaciones para determinar el resultado son muy fáciles de
elaborar
-Los valores que se presentan pueden ser cualitativos y cuantitativos
-Cálculo sencillo.
-Interpretación muy clara.
-Al depender sólo de las frecuencias, puede calcularse para variables
cualitativas. Es por ello el parámetro más utilizado cuando al resumir
una población no es posible realizar otros cálculos, por ejemplo,
cuando se enumeran en medios periodísticos las características más
frecuentes de determinado sector social. Esto se conoce
informalmente como "retrato robot".
Ejemplos
-Calcular la moda de los siguientes precios de un kilo de
manzanas en diferentes supermercados: 9, 11, 9, 9, 13, 11, 12
Ordenamos los valores de menor a mayor: 9, 9, 9, 11, 11, 12,
13
Vemos que el valor 9 se repite 3 veces, más que cualquier otro,
por lo tanto: Mo = 9
Ejemplos
Calcular la moda de las siguientes notas de exámenes: 9, 8, 9,
14, 11, 13, 11, 12
Ordenamos los valores de menor a mayor: 8, 9, 9, 11, 11, 12,
13, 14
Los valores 9 y 11 se repiten dos veces y son adyacentes, por
lo que la moda es la media de ambos: Mo = (9 + 11) / 2 = 10
¿Cuáles son las otras medidas posiciónales, descríbalas y de
ejemplos?
Las medidas de posición se suelen dividir en dos grandes grupos: la
de tendencia no central y las centrales. Las medidas de posición no
centrales son los cuantiles. Estos realizan una serie de divisiones iguales en
la distribución ordenada de los datos. De esta forma, reflejan los valores
superiores, medios e inferiores.
Los más habituales son:
El cuartil: Es uno de los más utilizados y divide la distribución en
cuatro partes iguales. Siendo así tres elementos de un conjunto de datos
ordenados que dividen el conjunto en cuatro partes iguales..Los valores
inferiores de la distribución se sitúan por debajo del primero (Q1). La mitad o
mediana son los valores menores iguales al cuartil dos (Q2) y los superiores
son representados por el cuartil tres (Q3).
Cada cuartil representa un 25% hasta llegar a 100% siendo 100% el
total de las muestras analizadas:
Cuartil 1 (Q1): valor que es superior al del 25% de las muestras más
bajas
Cuartil 2 (Q2): valor que es superior al del 50% de las muestras más
bajas
Cuartil 3 (Q3): valor que es superior al del 75% de las muestras más
bajas
Cuartil 4 (Q4): valor más alto
Ejemplo: Calcular el cuartil con la siguiente serie de números
31, 24, 56,78, 91, 13, 51, 74, 32, 46, 93, 141
Se ordenan de menor a mayor
13, 24, 31, 32, 46, 51, 56, 74, 78, 91, 93, 141
Entonces, podemos calcular los tres cuartiles:
Q1=1x(12+1)/4=3,25
Así pues, como estamos frente a un número no entero, para hallar el
primer cuartil sumamos el número en la posición 3, más la parte decimal
(0,25) multiplicada por la diferencia entre el número en la posición 3 y el
número en la posición 4 (si se tratara de un número entero, por ejemplo, 3,
solo tomaríamos el número en la posición 3).
31+0,25(32-31)=31+0,25=31,25
En el caso del segundo cuartil, haremos una operación similar:
Q2=2*(12+1)/4=6,5
Sumamos el número en la posición 6 más la parte decimal (0,5)
multiplicada por la diferencia entre el número en la posición 6 y el número
en la posición 7.
51+(0,5*(56-51))=51+(0,5*5)=51+2,5=53,5
Luego, haremos la misma operación con el tercer cuartil:
Q3=3x(12+1)/4=9,75
Sumamos el número en la posición 9, más la parte decimal (0,75)
multiplicada por la diferencia entre el número en la posición 9 y el número
en la posición 10.
78+(0,75*(91-78))=78+9,75=87,75
En conclusión, Q1, Q2 y Q3 son 3,25; 53,5 y 87,57, respectivamente.
El quintil: En este caso, divide la distribución en cinco partes. Por
tanto, hay cuatro quintiles. Además, no existe ningún valor que divida la
distribución en dos partes iguales. Es menos frecuente que el anterior.
Ejemplo: maginemos que queremos estudiar una distribución
de salarios en una población.
Estamos utilizando valores ficticios a modo de ejemplo y en miles de
unidades anuales. Por ello, miremos la figura
En la imagen, observamos que los casos con menores ingresos se
sitúan por debajo del quintil 1, y su valor límite sería de 1333.
Por otro lado, los datos con mayores ingresos son los que aparecen a
partir del quintil 4, con un valor límite de 2009.
Esta medida estadística, por tanto, nos da información relevante
sobre una serie de datos ordenados.
El decil: Estamos ante un cuantil que divide los datos en diez partes
iguales. Existen nueve deciles, de D1 a D9. El D5 se corresponde con la
mediana. Por su lado, los valores superiores e inferiores (equivalentes a los
diferentes cuartiles) se sitúan en puntos intermedios entre estos.
Ejemplo: Calcular el decil 6 (D6) de las siguientes muestras de notas
en matemáticas de un aula (notas de 0 a 20): 16, 10, 12, 8, 15, 18, 20, 9,
11, 1, 13, 17, 9, 10, 14
Ordenamos de menor a mayor: 1, 8, 9, 9, 10, 10, 11, 12, 13, 14, 15,
16, 17, 18, 20
N = número de muestras = 15 muestras
x = (N · i) / 10 = (15 · 6) / 10 = 9
Como x = 9 es un número sin decimales, entonces el decil 6 es el
valor de la muestra que ocupa la posición 9
D6 (decil 6) = 13
En un examen muy difícil de universidad, se obliga al profesor a
aprobar al menos al 10%. Calcular la nota a partir de la cual está obligado a
aprobar siendo las notas (notas de 0 a 20): 0, 4, 1, 0, 0, 7, 2, 1, 4, 0, 3, 9, 2,
0, 0, 4, 8, 1, 0, 9, 4
Necesitamos calcular el decil 9 (D9) ya que nos interesa calcular el
valor a partir del cual solo hay un 10% con mejores notas
Ordenamos de menor a mayor: 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 2, 2, 3, 4, 4,
4, 4, 7, 8, 9, 9
N = número de muestras = 21 muestras
x = (N · i) / 10 = (21· 9) / 10 = 18,9
Como x = 18,9 es un número con decimales, entonces el decil 9 es la
media de los valores que ocupan la posición 18 y 19
D9 (decil 9) = (7 + 8) / 2 = 7,5
El percentil: Por último, este cuantil divide la distribución en cien
partes. Hay 99 percentiles. Tiene, a su vez, una equivalencia con los deciles
y cuartiles.
Ejemplo: Calcular el percentil 40 (P40) de las siguientes muestras de
notas en matemáticas de un aula (notas de 0 a 20): 16, 10, 12, 8, 15, 18, 20,
9, 11, 1, 13, 17, 9, 10, 14
Ordenamos de menor a mayor: 1, 8, 9, 9, 10, 10, 11, 12, 13, 14, 15,
16, 17, 18, 20
N = número de muestras = 15 muestras
x = (N · i) / 100 = (15 · 40) / 100 = 6
Como x = 6 es un número sin decimales, entonces el percentil 40 es
el valor de la muestra que ocupa la posición 6
P40 (percentil 40) = 10
Ejemplo: En un examen muy difícil de universidad, se obliga al
profesor a aprobar al menos al 10%. Calcular la nota a partir de la cual está
obligado a aprobar siendo las notas (notas de 0 a 20): 0, 4, 1, 0, 0, 7, 2, 1, 4,
0, 3, 9, 2, 0, 0, 4, 8, 1, 0, 9, 4
Necesitamos calcular el percentil 90 (P90) ya que nos interesa calcular el
valor a partir del cual solo hay un 10% con mejores notas
Ordenamos de menor a mayor: 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 2, 2, 3, 4, 4, 4, 4, 7,
8, 9, 9
N = número de muestras = 21 muestras
x = (N · i) / 100 = (21· 90) / 100 = 18,9
Como x = 18,9 es un número con decimales, entonces el percentil 90 es la
media de los valores que ocupan la posición 18 y 19
P90 (percentil 90) = (7 + 8) / 2 = 7,5
¿Qué son las medidas de dispersión? ¿Cuáles son las propiedades de
cada medida de dispersión?, ¿Cuáles son los tipos y las propiedades
de cada una? y ¿Cómo se calcula cada uno? De ejemplo de cada una.
Las medidas de tendencia central ofrecen una idea aproximada del
comportamiento de una serie estadística. No obstante, no resultan
suficientes para expresar sus características: una misma media puede
provenir de valores cercanos a la misma o resultar de la confluencia de
datos estadísticos enormemente dispares. Para conocer en que grado las
medidas de tendencia central son representativas de la serie, se han de
complementar con medidas de dispersión como la varianza o la desviación
típica.
Por lo tanto las medidas de dispersión pueden considerarse
Parámetros estadísticos que indican cómo se alejan los datos respecto de la
media aritmética. Sirven como indicador de la variabilidad de los datos.
Las medidas de centralización ayudan a determinar el «centro de
gravedad» de una distribución estadística. Para describir el comportamiento
general de la serie se necesita, sin embargo, una información
complementaria para saber si los datos están dispersos o agrupados.
Así, las medidas de dispersión pueden definirse como los valores
numéricos cuyo objeto es analizar el grado de separación de los valores de
una serie estadística con respecto a las medidas de tendencia
central consideradas. Las medidas de dispersión más utilizadas son el
rango, la desviación estándar y la varianza.
Rango
El Rango es el intervalo entre el valor máximo y el valor mínimo; por
ello, comparte unidades con los datos. Permite obtener una idea de
la dispersión de los datos, cuanto mayor es el rango, aún más dispersos
están los datos (sin considerar la afectación de los valores extremos). El
rango, también es llamado amplitud o recorrido de medida. se calcula como
la diferencia entre el mayor y el menor valor de la variable. Se denota
como R.
Para calcular el rango de una muestra o población estadística
utilizaremos la siguiente fórmula:
R = Máxx – Mínx
Donde
-R es el rango.
-Máx es el valor máximo de la muestra o población.
-Mín es el valor mínimo de la muestra o población estadística.
-x es la variable sobre la que se pretende calcular esta medida.
Ejemplo: Supongamos que tenemos una empresa que produce microchips
para luego venderlos a las principales marcas de computadoras. Esta empresa
encarga a un economista que realice un estudio sobre la evolución de las
ventas (últimos 4 años) para, posteriormente, ofrecer consejos que mejoren los
resultados empresariales. Entre otras muchas métricas, se pide que se calcule
el rango de producción de microchips. A continuación se muestra la siguiente
tabla de datos:
Mes 1 44.347
Mes 2 12.445
Mes 3 26.880
Mes 4 23.366
Mes 5 42.464
Mes 6 15.480
Mes 7 21.562
Mes 8 11.625
Mes 9 39.496
Mes 10 39.402
Mes 11 47.699
Mes 12 44.315
Mes 13 29.581
Mes 14 44.320
Mes 15 35.264
Mes 16 10.124
Mes 17 43.520
Mes 18 26.360
Mes 19 19.534
Mes 20 30.755
Mes 21 37.327
Mes 22 15.832
Mes 23 33.919
Mes 24 29.498
Mes 25 46.136
Mes 26 18.007
Mes 27 36.339
Mes 28 27.696
Mes 29 47.413
Mes 30 47.636
Mes 31 20.978
Mes 32 49.079
Mes 33 40.668
Mes 34 45.932
Mes 35 40.454
Mes 36 46.132
Mes 37 35.054
Mes 38 11.906
Mes 39 22.532
Mes 40 43.045
Mes 41 45.074
Mes 42 16.505
Mes 43 27.336
Mes 44 37.831
Mes 45 29.757
Mes 46 37.765
Mes 47 22.237
Mes 48 38.601
MÁXIMO 49.079
MÍNIMO 10.124
RANGO 38.955
El mes que más microchips produjo la empresa (MÁXIMO) fue el mes 32 con
49.079 microchips producidos. Por su parte, el momento que menos microchips
produjo tuvo lugar en el mes 16 con 10.124 microchips producidos. Por tanto,
el rango estadístico que es la diferencia (49.079-10.124) se sitúa en 38.955.
¿Cómo se interpreta esto? Esto quiere decir, que durante los últimos 4 años la
variación máxima que ha habido ha sido de 38.955 microchips producidos.
Gráficamente podemos verlo del siguiente modo:
Desviación estándar
En estadística, la desviación típica (también conocida como
desviación estándar y desvío típico y representada de manera abreviada por
la letra griega minúscula sigma σ o la letra latina s, así como por las
siglas SD (de standard deviation, en algunos textos traducidos del inglés))
es una medida que se utiliza para cuantificar la variación o la dispersión de
un conjunto de datos numéricos.
Una desviación estándar baja indica que la mayor parte de los datos
de una muestra tienden a estar agrupados cerca de su media (también
denominada el valor esperado), mientras que una desviación estándar alta
indica que los datos se extienden sobre un rango de valores más amplio.
Ejemplo Calcular la desviación estándar de las siguientes
puntuaciones de un jugador de baloncesto en los últimos partidos:
Puntuaciones: 18, 20, 20, 22, 20, 20
Calculamos la media aritmética ():
Número de valores: 6
Media Aritmética = (18 + 20 + 20 + 22 + 20 + 20) / 6 = 120 / 6 = 20
Calculamos la Desviación Estándar:
σ2 = [(18-20)2 + (20-20)2 + (20-20)2 + (22-20)2 + (20-20)2 + (20-20)2]
/ 6 = 16 / 6 = 8 /3 = 2,67
Desviación estándar: σ = √ 2,67 = 1,63
Varianza
La varianza es una medida de dispersión que representa la
variabilidad de una serie de datos respecto a su media. Formalmente se
calcula como la suma de los residuos al cuadrado divididos entre el total de
observaciones.
También se puede calcular como la desviación típica al cuadrado.
Dicho sea de paso, entendemos como residuo a la diferencia entre el valor
de una variable en un momento y el valor medio de toda la variable.
La unidad de medida de la varianza será siempre la unidad de medida
correspondiente a los datos pero elevada al cuadrado. La varianza siempre
es mayor o igual que cero. Al elevarse los residuos al cuadrado es
matemáticamente imposible que la varianza salga negativa. Y de esa forma
no puede ser menor que cero.
Donde:
-X: variable sobre la que se pretenden calcular la varianza
-xi: observación número i de la variable X. i puede tomará valores
entre 1 y n.
-n: número de observaciones.
-x̄: Es la media de la variable X.
Ejemplo: Vamos a acuñar una serie de datos sobre salarios.
Tenemos cinco personas, cada uno con un salario diferente:
Juan: 1.500 euros
Pepe: 1.200 euros
José: 1.700 euros
Miguel: 1.300 euros
Mateo: 1.800 euros
La media del salario, la cual necesitamos para nuestro cálculo, es de
((1.500 + 1.200 + 1.700 + 1.300 + 1.800) /5) 1.500 euros.
Dado que la fórmula de la varianza en su forma desglosada se
formula como sigue:
Obtendremos que se debe calcular tal que:
El resultado es de 52.000 euros al cuadrado. Es importante recordar
que siempre que calculamos la varianza tenemos las unidades de medida al
cuadrado. Para pasarlo a euros, en este caso tendríamos que realizar
la desviación típica. El resultado aproximado sería de 228 euros. Esto
quiere decir que, en media, la diferencia entre los salarios de las distintas
personas será de 228 euros.
¿Qué es la teoría de los momentos estadísticos?, ¿Cuáles son
características, tipos, como se calcula dada uno? De ejemplos de cada
uno.
En estadística, un parámetro es un número que resume la ingente
cantidad de datos que pueden derivarse del estudio de una variable
estadística. El cálculo de este número está bien definido, usualmente
mediante una fórmula aritmética obtenida a partir de datos de la población.
Los parámetros estadísticos son una consecuencia inevitable del
propósito esencial de la estadística: crear un modelo de la realidad.
El estudio de una gran cantidad de datos individuales de una
población puede ser farragoso e inoperativo, por lo que se hace necesario
realizar un resumen que permita tener una idea global de la población,
compararla con otras, comprobar su ajuste a un modelo ideal,
realizar estimaciones sobre datos desconocidos de la misma y, en
definitiva, tomar decisiones. A estas tareas contribuyen de modo esencial
los parámetros estadísticos.
Por ejemplo, suele ofrecerse como resumen de la juventud de una
población la media aritmética de las edades de sus miembros, esto es, la
suma de todas ellas, dividida por el total de individuos que componen tal
población.
En resumen podríamos decir que son formulaciones matemáticas,
que se definen como parámetros estadísticos, algunos de ellos cuales
tienen amplia connotación dentro del estudio de curvas de distribución de
frecuencias y más específicamente respecto del sesgo y de la curtosis.
Los momentos son una forma de generalizar toda la teoría relativa a los
parámetros estadísticos y guardan relación con una buena parte de ellos.
Dada una distribución de datos estadísticos x1, x2, ..., xn, se define
el momento central o momento centrado de orden k como
Los momentos de una variable aleatoria X son los valores esperados
de ciertas funciones de X. éstos forman una colección de medidas
descriptivas que pueden emplearse para caracterizar la distribución de
probabilidad de X y especificarlas si todos los momentos de X son
conocidos.
- Momentos absolutos Se denomina momento absoluto de orden n
de una variable aleatoria X, definida en Rx, y con funci´on de densidad
fX(x), a ν n x = E[Xn ] donde E[∗] representa el operador ”Esperanza Matem
´atica”’, definido como E[g(X)] = ∫ Rx g(x) fX(x)dx siempre que esta integral
sea absolutamente convergente.
-Momentos centrales Se denomina momento central de orden n de
una variable aleatoria X, definida en Rx, y con funci´on de densidad fX(x), a
µ n x = E[(X − E[X])n ] = ∫ Rx (x − E[X])n fX(x)dx
¿Qué son las medidas de asimetría y kurtosis?, ¿Cuáles son sus
características, tipos? ¿Cómo se calcula cada uno? De ejemplo de
cada uno.
La asimetría y curtosis informan sobre la forma de la distribución de
una variable. Estas medidas permiten saber las características de
su asimetría y homgeneidad sin necesidad de representarlos gráficamente.
Asimetría
La asimetría es la medida que indica la simetría de la distribución de
una variable respecto a la media aritmética, sin necesidad de hacer la
representación gráfica. Los coeficientes de asimetría indican si hay el
mismo número de elementos a izquierda y derecha de la media.
Existen tres tipos de curva de distribución según su asimetría:
-Asimetría negativa: la cola de la distribución se alarga para valores
inferiores a la media.
-Simétrica: hay el mismo número de elementos a izquierda y derecha
de la media. En este caso, coinciden la media, la mediana y la moda.
La distribución se adapta a la forma de la campana de Gauss, o
distribución normal.
-Asimetría positiva: la cola de la distribución se alarga (a la derecha)
para valores superiores a la media
Existen tres coeficientes de asimetría:
Coeficiente de asimetría de Fisher
El coeficiente de asimetría de Fisher CAF evalúa la proximidad de los
datos a su media x. Cuanto mayor sea la suma ∑(xi–x)3, mayor será la
asimetría. Sea el conjunto X=(x1, x2,…, xN), entonces la fórmula de la
asimetría de Fisher es:
Coeficiente de asimetría de Pearson
El coeficiente de asimetría de Pearson CAP mide la diferencia entre
la media y la moda respecto a la dispersión del conjunto X=(x1, x2,…, xN).
Coeficiente de asimetría de Bowley
El coeficiente de asimetría de Bowley CAB toma como referencia
los cuartiles para determinar si la distribución es simétrica o no. Para aplicar
este coeficiente, se supone que el comportamiento de la distribución en los
extremos es similar. Sea el conjunto X=(x1, x2,…, xN), la asimetría de Bowley
es:
Curtosis
La curtosis (o apuntamiento) es una medida de forma que mide cuán
escarpada o achatada está una curva o distribución.
Este coeficiente indica la cantidad de datos que hay cercanos a
la media, de manera que a mayor grado de curtosis, más escarpada (o
apuntada) será la forma de la curva.
La curtosis se mide promediando la cuarta potencia de la
diferencia entre cada elemento del conjunto y la media, dividido entre
la desviación típica elevado también a la cuarta potencia. Sea el
conjunto X=(x , x ,…, x ), entonces el coeficiente de curtosis será:
1 2 N
Conclusión
La medidas de posicion en el conjunto de datos tiene como objetivo
proporcionar a los analistas una medida cuantitativa de la ubicación de
algunos centros de datos en la muestra. En la medición de posición,
intentamos encontrar una medición de la distribución de frecuencia
integrada. Además de procesar todos los datos de la variable, esta es una
tarea tediosa. Podemos usar algunos valores para caracterizar la
distribución de frecuencia, seleccionar un valor central como resumen de los
datos y el valor de la variable debe distribuirse alrededor del valor central.
La descripción de un conjunto de datos toma estas posiciones como
elementos importantes en el contexto de posibles valores.
Referencias Bibliográficas.
Ejemplos de Cuartiles. (2017). Matematicas10.net.
https://www.matematicas10.net/2017/02/ejemplos-de-cuartiles.html
https://www.facebook.com/enrique.rusarias. (2021). Medidas de posición |
Economipedia. Economipedia.
https://economipedia.com/definiciones/medidas-de-posicion.html
u/grupomate44. (2021, January 26). Medidas de posicion. GeoGebra.
https://www.geogebra.org/m/f4byn8tk
MEDIDAS DE POSICIÓN, DE TENDENCIA CENTRAL Y DISPERSIÓN. -
TOMi.digital. (2021). TOMi.digital.
https://tomi.digital/es/22956/medidas-de-posicion-de-tendencia-central-
y-dispersion?utm_source=google&utm_medium=seo
Medidas de dispersión - EcuRed. (2021). Ecured.cu.
https://www.ecured.cu/Medidas_de_dispersi%C3%B3n
los momentos estadisticos - TIC,S EN ESTADISTICA. (2021). los
momentos estadisticos - TIC,S EN ESTADISTICA. Google.com.
https://sites.google.com/site/ticsdestadistica/los-momentos-estadi