0% encontró este documento útil (0 votos)
245 vistas11 páginas

Modulo de Dispersion

Este documento presenta diferentes medidas de dispersión para analizar la variabilidad de conjuntos de datos, incluyendo el rango, desviación media, varianza y desviación estándar. Explica que la dispersión es importante para juzgar la confiabilidad de las medidas centrales de los datos y distinguir patrones de dispersión. Luego define cada medida de dispersión y ofrece ejemplos numéricos para ilustrar su cálculo y interpretación.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
245 vistas11 páginas

Modulo de Dispersion

Este documento presenta diferentes medidas de dispersión para analizar la variabilidad de conjuntos de datos, incluyendo el rango, desviación media, varianza y desviación estándar. Explica que la dispersión es importante para juzgar la confiabilidad de las medidas centrales de los datos y distinguir patrones de dispersión. Luego define cada medida de dispersión y ofrece ejemplos numéricos para ilustrar su cálculo y interpretación.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

20de setiembre del 2014

UNIDAD N03:
Medidas de Dispersin

Editado por: Lizet Doriela Mantari Mincami


LIC. INFORMTICA Y MATEMTICA
INTRODUCCIN

Al igual que sucede con cualquier conjunto de datos, la media aritmtica, la mediana y la moda slo nos revelan una parte
de la informacin que necesitamos acerca de las caractersticas de los datos. Para aumentar nuestro entendimiento del
patrn de los datos, debemos medir tambin su dispersin, extensin o variabilidad.

La dispersin es importante porque:

Proporciona informacin adicional que permite juzgar la confiabilidad de la medida de tendencia central. Si los
datos se encuentran ampliamente dispersos, la posicin central es menos representativa de los datos.
Ya que existen problemas caractersticos para datos ampliamente dispersos, debemos ser capaces de distinguir
que presentan esa dispersin antes de abordar esos problemas.
Quiz se desee comparar las dispersiones de diferentes muestras. Si no se desea tener una amplia dispersin de
valores con respecto al centro de distribucin o esto presenta riesgos inaceptables, necesitamos tener habilidad
de reconocerlo y evitar escoger distribuciones que tengan las dispersiones ms grandes.

Como la dispersin ocurre frecuentemente, debemos estar en capacidad de describirla, ya que el grado de variabilidad es
importante.

En el presente estudio vamos a considerar las siguientes medidas de dispersin absolutas:

El rango o recorrido.
Desviacin Media
La varianza.
La desviacin estndar o desviacin tpica.
El coeficiente de variacin.

1
MEDIDAS DE DISPERSION

Tomando dos ejemplos:


Valores 5, 50, 95 y 49, 50, 51 con media aritmtica y mediana iguales
Determinamos que: Media aritmtica (50)
Est muy alejada entre los extremos 5 y 95, siendo ms dispersa y heterognea, que 49 y 51 es ms
homognea.
Por lo tanto la media del 1er ejemplo no es representativa.

1. EL RANGO O RECORRIDO (R):

Es la medida de variabilidad ms fcil de calcular. Para datos finitos o sin agrupar, el rango se define como la diferencia
entre el valor ms alto (Xmax) y el ms bajo (Xmin) de un conjunto de datos.

Rango para datos no agrupados:

R = Xmax - Xmin

Ejemplo:
Se tienen las edades en aos, de cinco estudiantes del Cuarto Ciclo de la Universidad Peruana Los Andes
Sede Satipo: 18, 23, 27, 34 y 25, entonces su Rango estar dado por:

R = 34-18 = 16 aos

Interpretando: Las edades de los estudiantes del Cuarto Ciclo de la Universidad Peruana Los Andes sede
Satipo, tienen un Rango de diferencia de 16 aos; lo que es lo mismo:

Las edades de los estudiantes del Cuarto Ciclo de la Universidad Peruana Los Andes sede
Satipo estn comprendidas entre los 18 y 34 aos.

Con datos agrupados no se saben los valores mximos y mnimos si no hay intervalos de clases abiertos podemos
aproximar el rango mediante el uso de los lmites de clases. Se aproxima el rango tomando el lmite superior de la
ltima clase menos el lmite inferior de la primera clase.

Rango para datos agrupados:

R= Ls del ltimo intervalo Li del primer intervalo

Propiedades del Rango o Recorrido:

El recorrido es la medida de dispersin ms sencilla de calcular e interpretar puesto que simplemente es la


distancia entre los valores extremos (mximo y mnimo).

2
Puesto que el recorrido se basa solo en los valores extremos ste tiende a ser errtico, no permitiendo brindar
informacin precisa. Es como si una persona respondiese que tiene una edad comprendida entre los cero y 80
aos.
La principal desventaja del recorrido es que slo est influenciado por los valores extremos, puesto que no cuenta
con los dems valores de la variable. Por tal razn, siempre existe el peligro de que el recorrido ofrezca una
descripcin distorsionada de la dispersin.
En el control de la calidad se hace un uso extenso del recorrido cuando la distribucin a utilizarse no la distorsionan
y cuando el ahorro del tiempo al hacer los clculos es un factor de importancia.

2. DESVIACIN MEDIA (DM):


La desviacin media, mide la distancia absoluta promedio entre cada uno de los datos, y el parmetro que caracteriza
la informacin. Usualmente se considera la desviacin media con respecto a la media aritmtica:
a. Desviacin Media para datos no agrupados:

=1| |
=

b. Desviacin Media para datos agrupados:

=1| |
=

Donde:
: o valores de la variable
:

:
:
:

3. LA VARIANZA (s2 2):

La varianza es una medida de dispersin relativa a algn punto de referencia. Ese punto de referencia es la media
aritmtica de la distribucin. Ms especficamente, la varianza mide que tan cerca, o que tan lejos estn los diferentes
valores respecto a su propia media aritmtica. Cuando ms lejos estn las Xi de su propia media aritmtica, mayor es
la varianza; cuando ms cerca estn las Xi a su media menos es la varianza. Se define y expresa matemticamente
de la siguiente manera:

3
La varianza se denota usualmente por la letra minscula griega (sigma) elevada al cuadrado ( 2); esto cuando se
trata de la varianza de la poblacin; y en otros casos s2 (si es de la muestra). Segn otros analistas, la varianza se
define como: "el cuadrado medio de las desviaciones con respecto a su media aritmtica". Matemticamente, se
expresa como:

a. Varianza para datos no agrupados


=1( )
2
2 =

Ejemplo de aplicacin N1:

Se tienen las edades en aos de cinco estudiantes del 1er ciclo de la UPLA sede Satipo: 18, 23, 25, 27, y 34.
Al calcular la media aritmtica (promedio de las edades, se obtuvo 25.4 aos), encontrar la varianza de las
edades de estos estudiantes:

Para calcular se utiliza una tabla estadstica de trabajo de la siguiente manera:

Xi ( Xi - x) ( Xi - x )2
=1( )2
18
2 = =

23

25

27

34

Total

Interpretando: Las edades de los estudiantes del primer ciclo de la UPLA sede Satipo, estn dispersos en ..
aos cuadrticos respecto a su promedio.

b. Varianza para datos agrupados

=1( )2
2 =

Como Ud. Podr observar, la nica diferencia con la formula anterior radica en que sta ltima posee la frecuencia
absoluta simple (fi).

4
Ejemplo de aplicacin N2:

Se tienen los datos de una muestra de 30 cuentas por cobrar de la empresa UPLITAS S.A. dispuestos en una tabla
de distribucin de frecuencias, a partir de los cuales se deber calcular la varianza, para lo cual se construye la
siguiente tabla estadstica de trabajo. Previamente halle la media aritmtica.

Intervalos xi fi (
) ( )2 ( )

7 22 6

22 37 9

37 52 4

52 67 3

67 82 6

82 97 2

Total

=1 ( )2
2 =

Respuesta: la varianza de las cuentas por cobrar es igual

Interpretacin: Las cuentas por cobrar de la Empresa UPLITAS S.A. estn dispersos en S/. cuadrticos respecto
a su promedio.

Propiedades de la varianza:

La varianza es siempre un valor no negativo, que puede ser igual o distinta de 0. Ser 0 solamente cuando todos
los datos tengan el mismo valor.
La varianza es la medida de dispersin cuadrtica ptima por ser bastante representativa.
Si a todos los valores de la variable se le suma una constante, la varianza no se modifica. Vemoslo:

Si a xi le sumamos una constante xi = xi + k tendremos (sabiendo que )

5
Si todos los valores de la variable se multiplican por una constante la varianza queda multiplicada por el
cuadrado de dicha constante. Vemoslo:

Si a xi = xi k tendremos (sabiendo que )

4. LA DESVIACIN ESTNDAR O DESVIACION TIPICA (S )

Mide el grado de dispersin de los diversos valores, respecto al promedio; es decir es una medida de la cantidad tpica
en la que los valores del conjunto de datos difieren de la media. Esta medida de dispersin es la ms utilizada.

Se calcula de forma sencilla, si se conoce la varianza, por cuanto que es la raz cuadrada positiva de esta. A la desviacin
se le representa por la letra minscula griega "sigma" ( ) para el caso de la desviacin poblacional, por la letra s para
el caso de desviacin muestral.

Clculo de la Desviacin Estndar

= 2 = 2
Ejemplo:

Del clculo de la varianza de las edades de los cinco estudiantes universitarios del primer ciclo (ejemplo N1 anterior) se
obtuvo 2= , como la desviacin estndar es la raz cuadrada positiva, entonces = . = .

Interpretacin: Las edades de los estudiantes del primer ao de la UPLA sede Satipo, estn dispersos en .. aos
respecto a su promedio.

Igual procedimiento se aplica para encontrar le desviacin estndar de las cuentas por cobrar de la empresa
UPLITAS S.A. (ejemplo N2 anterior), recordemos que la varianza obtenida fue de .., entonces la desviacin
estndar es igual a .

Interpretacin: Las cuentas por cobrar de la Empresa UPLITAS S.A. estn dispersos en . nuevos soles,
respecto a su promedio.

6
Propiedades de la Desviacin Estndar

A su vez la desviacin estndar, tambin tiene una serie de propiedades que se deducen fcilmente de las de la varianza
(ya que la desviacin tpica es la raz cuadrada positiva de la varianza):

La desviacin estndar es siempre un valor positivo.


Es la medida de dispersin ptima por ser la ms pequea.
La desviacin estndar toma en cuenta las desviaciones de todos los valores de la variable
Si a todos los valores de la variable se le suma una misma constante la desviacin estndar no vara.
Si a todos los valores de la variable se multiplican por una misma constante, la desviacin estndar queda
multiplicada por el valor absoluto de dicha constante.

5. El Coeficiente de Variacin de Pearson (C.V.)

Las medidas de dispersin cuantifican la separacin, la dispersin, la variabilidad de los valores de la distribucin
respecto al valor central. Distinguimos entre medidas de dispersin absolutas, que no comparan diferentes muestras
entre s, y las relativas que si permiten comparar varias muestras.

Cuando se quiere comparar el grado de dispersin de dos o ms distribuciones que no vienen dadas en las mismas
unidades o con medias diferentes, se utiliza el llamado "Coeficiente de Variacin de Pearson", o simplemente
COEFICIENTE DE VARIACION. Entre dos o ms distribuciones dadas posee menor dispersin aquella cuyo
coeficiente de variacin sea menor. Se define como la relacin por cociente entre la desviacin estndar y la media
aritmtica; o en otras palabras es la desviacin estndar expresada como porcentaje respecto de la media aritmtica.

Calculo del Coeficiente de Variacin:


. . = 100

Donde: C.V. representa el nmero de veces que la desviacin tpica contiene a la media aritmtica y por lo tanto cuanto
mayor es C.V. mayor es la dispersin y menor la representatividad de la media.

Propiedades del Coeficiente de Variacin:

Si a todos los valores de la variable se le suma una misma constante el coeficiente de variacin queda alterado.

Ejemplo: Suponga que Usted trabaja en una compaa de ventas, que ofrece un premio al mejor vendedor. De los registros
de ventas se tienen los siguientes datos de ventas, expresados en porcentajes de cumplimiento de las metas fijadas
mensualmente:

7
Vendedor A: 95 105 100

Vendedor B: 100 90 110

El promedio trimestral de cumplimiento de las metas de ventas de ambos vendedores es igual y equivalen a 100, pero Ud.
slo le puede dar el premio a uno de ellos. A cul de ellos escogera y en base a qu criterio?. Explique.

Este problema se resuelve utilizando el coeficiente de variacin, para estos efectos es necesario encontrar la desviacin
estndar trimestral de las ventas de cada uno. Realice la operacin con el auxilio de la calculadora cientfica, y hallar los
siguientes valores:

4.08
Vendedor A: = 100 s = 4.08 . . = 100 =4.08 %
100

8.16
Vendedor A: = 100 s = 8.16 . . = 100 =8.16%
100

Respuesta: Dado que el vendedor A tiene menor coeficiente de variacin (4.08%), a el le corresponde recibir el premio.

Ejemplo:
Sea la tabla de frecuencias siguiente:
Cuadro N01

CUENTAS POR COBRAR EN NUEVOS SOLES DE LA EMPRESA [Link]

Intervalos xi fi Fi (Xi ) (Xi )2 (Xi )2 * fi


50 - 60 8

60 - 70 4

70 - 80 5

80 - 90 3

90 - 100 3

100 - 110 5

Total

8
TALLER DE PROBLEMAS N 01

Problema #1: Datos no agrupados


Calcule el rango, la varianza y la desviacin estndar de las observaciones que se presentan a continuacin: 63, 45, 39, 55,
69, 21, 50, 25, 33, 25

Problema #2: Datos no agrupados


Un profesor evala a ocho estudiantes y obtiene las siguientes puntuaciones (xi): 13, 15, 08, 17, 11, 14, 09 y 10.
o Hallar la media, desviacin estndar y la varianza de esta poblacin de valores. Interprete.
o Como en la clase haca un calor terrible, hubo alarma por la amenaza de incendio durante el examen. El profesor
para contrarrestar esta tensin, decide incrementar en tres puntos las puntuaciones inciales obtenidas. Hallar la
media, desviacin estndar y varianza de este nuevo conjunto de datos. Hay diferencias respecto al primer
resultado obtenido?
o A cada puntuacin incrementada, el profesor decide otorgarle un 10% ms de dicha puntuacin. Hallar la media,
desviacin estndar y varianza de este nuevo conjunto de datos. Hay diferencias respecto al primer y segundo
resultado anteriormente obtenidos?

Problema #3: Datos Agrupados


La distribucin de frecuencias que se presenta a continuacin, muestra el tiempo que emplean un grupo de estudiantes en
resolver un problema de estadstica. Calcule e interprete el rango, la varianza y la desviacin estndar de estos datos:

Tiempo en N de
Fi xi (
) )2
( )
(
minutos estudiantes
0.5 - 1.0 6
1.0 - 1.5 12
1.5 - 2.0 30
2.0 - 2.5 42
2.5 - 3.0 28
3.0 - 3.5 12
Total 130

Problema #4: Coeficiente de Variacin de Pearson


Los siguientes datos describen las distribuciones de puntuaciones en determinados grupos ocupacionales sometidos a una
prueba general de conocimientos sobre realidad nacional.

Ocupaciones y/o profesiones N


s Rango
Transportista 172 128.1 11.7 94 - 157
Comerciante 94 127.1 10.9 96 - 157
Constructor 45 124.5 11.7 100 - 157
Vendedor 492 109.2 16.3 42 - 149
Agricultor 128 102.7 16.0 56 - 139
Periodista 817 96.2 19.7 16 - 149
Abogado 817 91.4 20.7 24 - 141
Carpintero 77 89.0 19.6 45 - 145

Compare los resultados obtenidos para cada grupo ocupacional utilizando el coeficiente de variacin y el rango o
recorrido. Elabore un nuevo cuadro en funcin al coeficiente de variacin obtenido (de menor a mayor dispersin)

9
Ocupaciones y/o profesiones C.V.

Problema #5: Coeficiente de Variacin


La tabla a continuacin indica los salarios bsicos por hora (en S/.) en abril 2010 para ciertas categoras ocupacionales de
obreros sindicalizados en cierto sector de la construccin. Determine cul es la ocupacin en la que existe la mayor variacin
en los salarios bsicos y cul es la que muestra la menor variacin. Para hacer estas comparaciones deber utilizar el
coeficiente de variacin.

Salarios bsicos por hora, segn tipo de trabajo y lugares encuestados


Ocupacin A B C D
Albailes S/. 6,29 S/. 7,35 S/. 5,75 S/. 7,50
Carpinteros S/. 5,90 S/. 7,20 S/. 5,38 S/. 6,66
Electricistas S/. 7,50 S/. 7,60 S/. 6,70 S/. 7,35
Pintores S/. 7,18 S/. 6,80 S/. 4,75 S/. 6,12
Enchapadores S/. 5,92 S/. 5,90 S/. 5,95 S/. 6,85
Gasfiteros S/. 8,00 S/. 4,45 S/. 6,25 S/. 7,80
Ayudantes S/. 4,20 S/. 4,80 S/. 3,18 S/. 4,70

10

También podría gustarte