0% encontró este documento útil (0 votos)
42 vistas19 páginas

Tema Ii

Las medidas de tendencia central, como la media aritmética, la mediana y la moda, son utilizadas para representar un conjunto de datos mediante un solo valor que indica dónde tienden a concentrarse los datos. La media aritmética se calcula como el promedio de los datos, mientras que la mediana es el valor central que divide el conjunto de datos en dos partes iguales, y la moda es el valor que más se repite. Existen también medidas especiales como la media ponderada y la media geométrica, que se aplican en situaciones específicas.

Cargado por

luis martinez
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
42 vistas19 páginas

Tema Ii

Las medidas de tendencia central, como la media aritmética, la mediana y la moda, son utilizadas para representar un conjunto de datos mediante un solo valor que indica dónde tienden a concentrarse los datos. La media aritmética se calcula como el promedio de los datos, mientras que la mediana es el valor central que divide el conjunto de datos en dos partes iguales, y la moda es el valor que más se repite. Existen también medidas especiales como la media ponderada y la media geométrica, que se aplican en situaciones específicas.

Cargado por

luis martinez
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

MEDIDAS DE CENTRALIZACIN

El objetivo principal de las medidas de tendencia central es poder representar por medio de un
solo nmero al conjunto de datos, es decir, dan valores representativos de la distribucin de
frecuencias, situados en algn lugar intermedio, alrededor del cual, se encuentran los otros
valores. Nos indican dnde tienden a concentrarse los valores.

Existen tres medidas de tendencia central generales, que son, la Media aritmtica, la Mediana y
la Moda; as como otras que se utilizan en casos particulares como la Media ponderada, la Media
Armnica, la Media Geomtrica, la Media Cuadrtica.

MEDIDAS DE TENDENCIA CENTRAL GENERALES.


: Es el promedio de los datos, y su objetivo principal es encontrar el valor
Media Aritmtica
que debera de estar en el centro. Su ventaja principal es que es la nica medida en la que
( ) = 0, su inconveniente es que se ve influida por valores extremos.

Datos No Agrupados:

Ejemplo: Calcular la media aritmtica de los nmeros 10,12,36,25,58

10 + 12 + 36 + 25 + 58 121
= = = 24.2
5 5

Datos Agrupados:

Frecuencia por la marca de clase de cualquier rengln


=
=


Nmero total de datos

Dnde: n = ltima clase

1
Nota: La media muestral se denota , la media poblacional se conoce como .

Ejemplo: calcular el salario promedio de:


Salario No. De emp.

( ) ()

$15000 18

$20000 35

$25000 29

n 82

Obtengamos .
15000 18 + 20000 35 + 25000 29 1695000
= = = $20670.70
82 82

Media aritmtica ponderada


Por otro lado, si al promediar los datos estos tienen diferentes pesos, entonces estamos ante un
caso de media aritmtica ponderada, que puede definirse de la siguiente manera

=

Definicin:
Sea dado un conjunto de observaciones, tales como 1 , 2 ; 3 ; ; ; y un conjunto de
valores 1 , 2 ; 3 ; ; ; asociado con cada observacin Xi respectivamente, que reciben el
nombre de factores de ponderacin, entonces la media ponderada se calcula como:

Ejemplo:
En el curso de estadstica del Prof. Cabrera la nota semestral se calcula como una media
ponderada. Por cuanto que el promedio de laboratorios representa el 30% de la nota semestral.
El promedio de ejercicios parciales representa el 30% y el examen semestral el restante 40%.
Si obtiene en este curso los siguientes promedios al final del semestre: laboratorios 90 pts.
Parciales 75 pts. Y en el examen semestral 70 pts.; el promedio semestral se calcula de la
siguiente forma:
90 .30 + 75 .30 + 70 .40 27 + 22.5 + 28
= = = 77.5
. 30 + .30 + .40 1
La nota semestral de 77.5 corresponde a "C".

2
Mediana : Es el valor central, el que delimita al 50% de los datos, es decir, es el valor que se
encuentra exactamente en la mitad de los datos.

Datos No agrupados: En los datos ordenados se aplica la siguiente relacin, para encontrar la
posicin de los datos.
+1
= , = ,
2 2
Entonces podemos tener slo dos alternativas
a) El valor de la posicin puede ser entero y lo nico que debemos hacer es contar el nmero
de lugares que nos indica esta frmula.
b) El valor de la posicin nos da un valor decimal (.5) y entonces debemos: sumar los valores
involucrados y dividirlos entre 2. Por ejemplo; si tenemos los valores 5, 7, 8, 13 entonces la
posicin nos da 2.5 por que tendremos que seleccionar a los nmeros 7 y 8 para luego
sumarlos (15) y dividirlos entre 2 (7.5)
Datos Agrupados:

Se localiza la clase o rengln que contiene a la mediana, con la siguiente condicin , es
2

decir debemos encontrar la primera frecuencia acumulada que sea mayor o igual a la mediana,
para posteriormente aplicar la siguiente formula:


= + (2 )

Donde:
:
:
:
:

Nota: Si la posicin, en los datos no agrupados, es decimal (.5), se toma el promedio del dato
anterior y el siguiente.
Ejemplo: Calcular el sueldo mediano de:

intervalos Salario No. De emp. N de emp. Acum.


( ) ()
12500-17500 $15000 18 18
17500-22500 $20000 35 53

3
22500-27500 $25000 29 82

Primero se obtiene la posicin:


82
= = = 41
2 2

Entonces buscamos el rengln de la mediana buscando la fa igual o ms grande de 41, como


18+35 = 53, entonces decimos que es el segundo rengln o clase donde se encuentra la mediana
y aplicamos la frmula:


42 18
= + (2 ) = 17500 + ( ) 5000 = $20928.57
35

Moda : Es el valor ms frecuente, el que se observa mayor nmero de veces.

Datos No Agrupados: Despus de ordenar los datos buscamos el valor que ms se repite.

Ejemplo: Encontrar la moda de; 47, 48, 49, 49, 49, 51, 51, 52. Podemos observar que el nmero
que ms se repite es el 49. Si ningn valor se repite, no existe moda

Datos Agrupados:

Se localiza la clase modal buscando la frecuencia ms alta y despus se aplica la siguiente


frmula:

= + ( )
2

:
:
:
:
:

Nota: La distribucin puede ser: amodal, unimodal, bimodal, trimodal,...., polimodal.

4
Ejemplo: Calcular el salario que ms se repite en:
intervalos Salario No. De emp. N de emp. Acum.
( ) ()
12500-17500 $15000 18 18
17500-22500 $20000 35 53
22500-27500 $25000 29 82

Observamos las frecuencias (No. de empleados) y decimos que la clase modal es la segunda,
porque 35 es la frecuencia ms grande y aplicamos:
35 18
= + ( ) = 17500 + ( ) 5000 = $$21195.65
2 2 35 18 29

Relacin entre Media Aritmtica, Mediana y Moda:

Para distribuciones unimodales que sean poco asimtricas:


= 3 ( )
Sus posiciones relativas, segn la simetra de la distribucin de frecuencias son:

Relacin Simetra
= = Simtrica
< < Sesgo positivo
> > Sesgo negativo

Ntese que en nuestros ejemplos tenemos:


> > 21195.65 > 20857.17 > 20670.7

MEDIDAS DE TENDENCIA CENTRAL PARA CASOS ESPECIALES


Media Aritmtica Ponderada Xp : Es el promedio de los datos en donde se le da un peso o

importancia especfica a cada observacin. Se calcula:

5
Ejemplo:

Se desea obtener el precio promedio de:


Precio del producto $ Cantidad en Kg
17.80 75
35.90 56
79.45 19

Aplicamos la frmula:

=1 17.8 75 + 35.9 56 + 79.45 19 4854.95


= = = = $32.37
=1 75 + 56 + 19 150

Media Geomtrica (G): Con cierto tipo de datos, la media aritmtica no da el valor promedio
correcto. La media geomtrica sirve para promediar los crecimientos geomtricos de una
variable.
Si suponemos que Y representa el factor de crecimiento geomtrico de la variable X, es decir:

= entonces el factor de crecimiento geomtrico promedio de la variable X ser:
1

Datos No Agrupados:
= 1 2
Donde = 1
Ejemplo:
Si los precios de la accin Anhuac en los ltimos cuatro das fueron; 4.75, 5.23, 4.78 y 6.32
calcula el factor de crecimiento promedio y el crecimiento porcentual promedio.

Existen dos formas de resolverlo:

a) De la forma ms ortodoxa, es decir:

6
3 5.23 4.78 6.32 3
= 1 2 = = 1.330526316 = 1.099869493
4.75 5.23 4.78

Lo que acabamos de obtener es factor de crecimiento promedio y para obtener el crecimiento


se aplica la siguiente formula:
= (1 ) 100 = (1 . 099869493) 100 = 9.9869%

3 6.32 3
b) Otra forma es = = 4.75 = 1.330526316 = 1.099869493

Datos Agrupados:


=

Dnde: k = ltima clase


Nota: Se puede demostrar que .
Tambin puede calcularse la media geomtrica ponderada.

Ejemplo:

Supngase que se cuenta con la informacin diaria de los incrementos porcentuales de una
accin y que se representan en la siguiente tabla:
Crecimiento porcentual (%) Frecuencias en das
10 14
20 15
30 48

a) Calcular los factores de crecimiento.



=1+
100

b) Calcular el factor de crecimiento promedio


77
= 1 1 2 2 = 1.114 1.215 1.348 = 1.2415965

7
Media Armnica (H): Cuando los datos a promediarse estn medidos en unidades expresadas
en forma de cocientes (./. , $/, . ), lo ms adecuado es utilizar la media armnica, ya
que la media aritmtica nos llevar a un promedio equivocado.
Datos No Agrupados:

=
1
=1

Ejemplo:
65 / 98 /
.
2
= = = 78.1595
1 1 1
=1 +
65 98

Datos Agrupados:

=

=1

Dnde: n = ltima clase


Nota: Se puede demostrar que
. Tambin puede calcularse la media armnica
ponderada.

Ejemplo:
Supngase que una flotilla de vehculos muestra la siguiente informacin:
/
50 15
60 28
75 31

La respuesta es:
74
= = = 62.711864
15 28 31
=1 + 60 +
50 75
Media Cuadrtica (MC):
La media cuadrtica naci con el objetivo de poder obtener el promedio de valores positivos y
negativos al mismo tiempo, adems de ser una gran ayuda para poder calcular las dispersiones
promedio de los datos (ver medidas de dispersin).

8
Datos no agrupados:

2
= =1

Ejemplo:
Supngase que se obtienen las ganancias y prdidas del precio de una accin durante una
semana; - 4.00, 3.50, 2.35, 6.20, 3.25 Calcular el promedio:

2 (4)2 + (3.5)2 + (2.35)2 + (6.2)2 + (3.25)2 50.775


= =1 = = = 3.18669
5 5

Datos agrupados:

2
= =1

Ejemplo:
Ahora deseamos obtener el promedio de una tabla de distribucin de frecuencias pero con datos
positivos y negativos.
Ganancias y prdidas del precio de una accin No. De das
(x) ()
-7.25 25
2.75 14
12.75 2

2 25 (7.25)2 + 14 (2.75)2 + 2 (12.75)2


= =1 = = 6.5239
41

2.3 MEDIDAS DE POSICIN


Para caracterizar el valor de una observacin se puede establecer una estructura divisional
ascendente o descendente- para situar la posicin relativa de un caso en el marco de su
poblacin de referencia. Las medidas de posicin no central permiten dividir la distribucin
en un variable nmero de segmentos cuantiles- facilitando la ubicacin de orden de un sujeto
o caso sobre un conjunto de los datos. Estas medidas requieren que exista un orden en las
categoras de la variable, por lo que slo se pueden determinar a partir de la escala ordinal.
Los cuantiles ms comunes en el mbito de la estadstica aplicada a las Ciencias Sociales son:

9
Cuartiles, Deciles y percentiles (cuadro 1) pero, con la misma lgica podran generarse otras
unidades divisionales como por ejemplo, quintiles, sextiles, etc.

Ayudan a localizar el valor de la variable que acumula cierto porcentaje especfico de datos.
Cuartiles (Q): Encuentran el valor acumulado al 25%, 50% y 75% respectivamente.


= + 4

Donde:
: = 1,2,3,4
:
:
: .
:
Ejemplo:

Intervalos
45-55 6 6
55-65 10 16
65-75 19 35
75-85 11 46
85-95 4 50

Primer cuartil: Buscamos en la columna de las frecuencias Acumuladas el valor que supere al
50
25% de N=50, corresponde al 2 intervalo. 4
= 12.5 El primer cuartil se encuentra en la

frecuencia acumulada 16, el lmite inferior es 55.


50
6
4
1 = 55 + 166 10 =61.5
50
50% = 25
2
2 50
16
2 = 65 + 4 10 = 69.73
35 16
3 50
75% = 37.5
4
3 50
35
3 = 75 + 4 10 = 77.27
46 35

10
4 50
100% = 50
4
4 50
46
4 = 85 + 4 10 = 95
50 46

Deciles (D): Representan el 10%, 20%,..., 90% de los datos acumulados respectivamente.


= + 10

Percentiles (P): Representan el 1%, 2%,..., 99% de los datos acumulados respectivamente.
Cada cuartil delimita dos regiones:
- el p% de datos de menor valor (acumulados a la izquierda del cuartil C)
- el (1-p)% de datos de mayor valor (acumulados a la derecha del cuartil C).

100
= +

MEDIDAS DE DISPERSIN

Rango (o Intervalo):
Es la distancia que existe entre el menor y mayor valor de los datos.
Datos No Agrupados:
=
Datos Agrupados:
=

Rango Semi-Inter Cuartil (Q): (o Desviacin Cuartil)


Mide el rango promedio de una cuarta parte de los datos (evita los valores extremos)
3 1
=
2
Desviacin Media Absoluta (DM): (o Desviacin Absoluta Promedio)
Es la distancia promedio de los datos a su media.
Datos No Agrupados:
=1| |
=

11
Datos Agrupados:
=1 | |
=

Varianza:
Poblacional 2 : Es el promedio del cuadrado de la distancia de los datos a su media

Datos No Agrupados:

=1( )2
2
=1 2
2
= = 2

Datos Agrupados:
=1 ( )2 =1 2
2 = 2 = 2

Muestral 2 : La suma de las distancias al cuadrado se divide entre en nmero de datos menos
uno:

Datos No Agrupados:

2
=1( )2 2
=1 2 2
= =
1 1 1

Datos Agrupados:
=1 ( )2 =1 2 2
2 = 2 =
1 1 1

Nota: S 2 para muestras "chicas". Para muestras grandes S 2 o 2 prcticamente no difieren.

Desviacin Estndar:
Mide la variacin de los datos en trminos absolutos. Es la raz cuadrada positiva de la varianza.

Poblacional: = 2

Muestral: = 2

12
La desviacin estndar se interpreta construyendo intervalos alrededor del promedio:

a) Teorema de Chebyshev. Si la distribucin no es simtrica y unimodal.

- Al menos el 75% de los valores cae dentro de 2 desviaciones estndar alrededor de la media:
2
- Al menos el 89% de los valores caen dentro de 3 desviaciones estndar alrededor de la media:
3
b) Regla Emprica. Si la distribucin es una curva acampanada, unimodal y simtrica:
- Aproximadamente el 68% de los datos (poblacin) se encuentran a una desviacin estndar
alrededor de la media:
- Aproximadamente el 95% de los datos (poblacin) se encuentran a 2 desviaciones estndar
alrededor de la media: 2
- Aproximadamente el 99% de los datos (poblacin) se encuentran a 3 desviaciones estndar
alrededor de la media: 3

Coeficiente de Variacin (CV): Mide la variacin relativa de la variable con respecto a su


promedio. Mide la magnitud de la desviacin estndar en relacin con la magnitud de la media.
Se expresa en por cientos.

= 100

MEDIDAS DE FORMA
Proporcionan un valor numrico para saber hacia qu lado de la distribucin hay mayor
acumulacin de frecuencias y si la concentracin central de frecuencias es mayor que en los
extremos o viceversa sin tener que graficar los datos.

Momento Respecto de la Media: El momento respecto a la media aritmtica es:


Datos No Agrupados:
=(
)
=

Datos Agrupados:
= (
)
=

13
El primer momento respecto a la media (r=1) siempre es igual a cero.
El segundo momento respecto a la media (r=2) es la varianza poblacional.

Sesgo: Es el grado de asimetra que tiene la distribucin. La distribucin puede ser:


- Insesgada: Si tiene forma de campana y el rea acumulada del centro de la distribucin a la
derecha es igual a la que se acumula a la izquierda.

Moda=Mediana=Media
Insesgada

- Con sesgo positivo o a la derecha: Si tiene la mayor acumulacin de frecuencias a la


izquierda y una cola larga a la derecha.

Sesgo Positivo (a la derecha)


Moda

Mediana
Media

- Con sesgo negativo o a la izquierda: Si la mayor acumulacin est a la derecha y tiene una
cola larga a la izquierda.

Sesgo Negativo (a la izquierda)


Moda

Mediana

Media

14
Coeficiente Momento de Sesgo : se calcula dividiendo el tercer momento respecto a la media
entre la desviacin estndar al cubo:
Datos No Agrupados:
3 =1( )3
3 = =
3 3

Datos Agrupados:
3 =1 ( )3
3 = =
3 3
Coeficiente momento de sesgo Sesgo
3 = 0 No hay sesgo. La distribucin es Insesgada
3 > 0 La distribucin tiene sesgo positivo o a la derecha.
3 < 0 La distribucin tiene sesgo negativo o a la izquierda.

Curtosis: Mide qu tan puntiaguda es una distribucin, con respecto a la Normal.


La distribucin puede ser:
- Mesocrtica: solo la distribucin Normal (es el trmino medio).
- Leptocrticas: Las distribuciones ms puntiagudas que la Normal.
- Platocrticas: Las distribuciones menos puntiagudas que la Normal.

Leptocrtica

Mesocrtica

Platocrtica

Coeficiente momento de Curtosis ( ): se calcula dividiendo el cuarto momento respecto a la


media entre la varianza al cuadrado (o la desviacin estndar a la cuarta).

Datos No Agrupados:
4 =1( )4
4 = =
4 4

Datos Agrupados:
4 =1 ( )4
4 = =
4 4

15
Coeficiente momento de Curtosis Curtosis
4 = 3 La distribucin es Mesocrtica.
4 > 3 La distribucin es Leptocrtica.
4 < 3 La distribucin es Platocrtica.

MEDIDAS DE CONCENTRACIN

En una distribucin, ni la media ni la varianza son explicativas de la mayor o menor igualdad en


el reparto; para esto usamos las medidas de concentracin.
Consideremos que la variable en cuestin es el salario. Una distribucin muy concentrada indica
que pocos individuos reciben la mayor parte del total, mientras que poca concentracin supone
que todos los individuos tienen un reparto igualitario.

Indic de Gini:
1
=1 ( )
=
1
=1

Donde:
=

= = 100

( )
q i = 100

0 1

Si = 0, la variable est menos concentrada (mejor repartida).


Si = 1, la variable est ms concentrada (peor repartida).

Curva de Lorenz:
Se grafican los valores de la proporcin acumulada de individuos (p) y la proporcin acumulada
del total de la variable (q).
La funcin identidad representa la igualdad absoluta, es decir, a la variable cuando no est
concentrada (la recta a 45 grados). La desigualdad absoluta o mxima concentracin de la
variable indicara que un solo individuo tenga el total de la variable (el tringulo inferior).

16
Cuanto ms se acerque la Curva de Lorenz a la diagonal, ms igualitario ser el reparto ( =
0). Cuanto ms se acerque la Curva de Lorenz al tringulo inferior, ms concentrada esta la
variable ( = 1).

El Indic de Gini calcula el rea entre la diagonal y la Curva de Lorenz, como un porcentaje del
rea del tringulo inferior de la grfica (mide la desigualdad relativa).

Ejemplo:

Vamos a calcular el Indic Gini de una serie de datos con los sueldos de los empleados de una
empresa (millones de pesos).

Empleados (Frecuencias
Sueldos Frecuencias relativas
absolutas)
(Millones) Simple Acumulada Simple Acumulada

3,5 10 10 25,0% 25,0%

4,5 12 22 30,0% 55,0%


6,0 8 30 20,0% 75,0%
8,0 5 35 12,5% 87,5%
10,0 3 38 7,5% 95,0%
15,0 1 39 2,5% 97,5%
20,0 1 40 2,5% 100,0%

Calculamos los valores que necesitamos para aplicar la frmula del Indic de Gini:

17
( )
3.5 10 10 25.0 35 35 13.6 10.83

4,5 12 22 55,0 54,0 89,0 34,6 18,97

6,0 8 30 75,0 48,0 147,0 57,2 19,53


8,0 5 35 87,5 40,0 187,0 72,8 15,84
10,0 3 38 95,0 30,0 217,0 84,4 11,19
15,0 1 39 97,5 15,0 232,0 90,3 7,62
25,0 1 40 100,0 25,0 257,0 100,0 0

= 435,0 ( ) = 83,99

Por lo tanto:

= 83,99 / 435,0 = 0,19

Un Indic Gini de 0,19 indica que la muestra est bastante uniformemente repartida, es decir,
su nivel de concentracin no es excesivamente alto.

Ejemplo: Ahora vamos a analizar nuevamente la muestra anterior, pero considerando que hay
ms personal de la empresa que cobra el sueldo mximo, lo que conlleva mayor concentracin
de renta en unas pocas personas.

Sueldos Empleados (Frecuencias absolutas) Frecuencias relativas


(Millones) Simple Acumulada Simple Acumulada

3,5 10 10 25,0% 25,0%

4,5 10 20 25,0% 50,0%


6,0 8 28 20,0% 70,0%
8,0 5 33 12,5% 82,5%
10,0 3 36 7,5% 90,0%
15,0 0 36 0,0% 90,0%
20,0 4 40 10,0% 100,0%

18
En este caso obtendramos los siguientes datos:

( )
3.5 10 10 25.0 35 35 11.7 13.26

4,5 10 20 50 45 80 26.8 23.15

6,0 8 28 70,0 48 128 43,0 27,05


8,0 5 33 82,5 40 168 56,4 26,12
10,0 3 36 90,0 30 198 66,4 23,56
15,0 0 36 90,0 0 198 66,4 23,56
25,0 4 40 100,0 100 298 100,0 0,00

= 407,5 ( ) = 136,69

El ndice Gini sera:

= 136,69 / 407,5 = 0,34

El ndice Gini se ha elevado considerablemente, reflejando la mayor concentracin de rentas


que hemos comentado.

19

También podría gustarte