0% encontró este documento útil (0 votos)
110 vistas10 páginas

Clase 3

Este documento describe diferentes medidas de dispersión para analizar cómo se distribuyen los datos en un conjunto, incluyendo rango, desviación media, varianza y desviación estándar. Explica cómo calcular cada medida para datos agrupados y no agrupados, y lo que indican la varianza y desviación estándar sobre la dispersión de los datos en torno a la media. También presenta un criterio de homogeneidad y ejercicios de aplicación.

Cargado por

Paulita C Reyes
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
110 vistas10 páginas

Clase 3

Este documento describe diferentes medidas de dispersión para analizar cómo se distribuyen los datos en un conjunto, incluyendo rango, desviación media, varianza y desviación estándar. Explica cómo calcular cada medida para datos agrupados y no agrupados, y lo que indican la varianza y desviación estándar sobre la dispersión de los datos en torno a la media. También presenta un criterio de homogeneidad y ejercicios de aplicación.

Cargado por

Paulita C Reyes
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Medidas de dispersión

Una segunda propiedad que describe a un conjunto de datos es la dispersión. Dispersión es


el grado de variación o diseminación de los datos. Dos conjuntos de datos pueden diferir tanto en
tendencia central como en dispersión o dos conjuntos de datos pueden tener las mismas medidas
de tendencia central, pero diferir mucho en términos de dispersión.

Los estadígrafos de dispersión nos indican si la distribución o conjunto de datos forma


grupos homogéneos o heterogéneos. Las medidas de dispersión a estudiar son: rango, desviación
media, varianza y desviación estándar.

Rango
Indica el número de valores que toma la variable. El rango es la diferencia entre el valor
máximo y el valor mínimo de un conjunto de datos.

Si los datos están agrupados en una tabla de frecuencias, el recorrido es la diferencia entre
el límite real superior del último intervalo y el límite real inferior del primer intervalo.

Ejemplo:
1) Sea el siguiente conjunto de datos:
12 15 17 23 25 28

2) Sea la siguiente tabla:


El rango mide "la dispersión total" del conjunto de datos. Aunque el rango es una medida
de dispersión simple y que se calcula con facilidad, su debilidad preponderante es que no
toma en consideración la forma en que se distribuyen los datos entre los valores más
pequeños y los más grandes.

Desviación Media

Es la media aritmética de los valores absolutos de las desviaciones de todos los datos
respecto a la media aritmética. Su símbolo es DM.

a) Desviación media para datos no agrupados

Ejemplo: Obtener la desviación media para los datos 5 , 7 , 8 , 1 0 , 16

b) Desviación media para datos agrupados

Ejemplo: Determine la desviación media de los siguientes datos agrupados :

Pesos fi
(Kg.)
60 - 62 5
63 - 65 18
66 - 68 42
69 - 71 27
72 - 74 8
Total 100
Varianza y Desviación Estándar

Dos medidas de dispersión que se utilizan con frecuencia y que si toman en consideración
la forma en que se distribuyen los valores son la varianza y su raíz cuadrada, la desviación
estándar. Estas medidas establecen la forma en que los valores fluctúan con respecto a la media.

Varianza

La varianza se define como el promedio aritmético de las diferencias entre cada uno de los
valores del conjunto de datos y la media aritmética del conjunto elevadas al cuadrado.
Su símbolo es S 2 si estamos trabajando con una muestra y si estamos trabajando con
una población.

a) Varianza para datos no agrupados

3
Ejemplo: Determine la varianza del siguiente conjunto de datos:
25 12 23 28 17 15

b) Varianza para datos agrupados Muestra

Ejemplo: Considere la tabla con los datos de los edades de 26 personas

4
Las formulas anteriores para calcular la Varianza muestra tienen una forma abreviada:

Ejemplo: De un grupo de contribuyentes se determinó que el promedio de impuestos es de


$32.200, con una varianza de $7.600. Determinar en cada uno de los siguientes casos, la nueva
varianza:
a) Los impuestos aumentan en un 2 %
b) A los impuestos se les disminuye la cantidad de $2.300
c) A cada contribuyente, se le disminuye un 3 % y además se le condona $2.550

Solución:
Desviación Típica o Desviación Estándar

Es la raíz cuadrada positiva de la Varianza. Su símbolo es S si se está trabajando con una


muestra y es a si se está trabajando con una población.

a) Desviación estándar para datos no agrupados

Y (xi-x)2
s
=\ i = i ______ donde x l representa los datos de la
71 — 1 muestra.

N
Y ( X i ~ fJ'
\ )2 donde x l representa los datos de la
i= l _______ poblacion.
N-l
Ejemplo: Para el conjunto de datos 25,12, 23, 28, 17,15 donde se obtuvo que su varianza
era S 2 = 39,2 ; tendremos entonces que su desviación estándar es :

b) Desviación estándar para datos agrupados

Ejemplo: Para el ejemplo de los datos tabulados sobre las edades de 26 personas se obtuvo
como varianza S 2 = 51,618; luego su desviación estándar será :
¿Que indican la Varianza y la Desviación Estándar?

La varianza y la desviación estándar miden la dispersión "promedio" en torno a la media


aritmética, es decir, como fluctúan las observaciones mayores por encima de la media aritmética y
como se distribuyen las observaciones menores por debajo de ella.
La varianza tiene ciertas propiedades matemáticas útiles. Sin embargo, al calcularla se
obtienen unidades al cuadrado: cm2, pulgadas, mm2, (edades)2, (horas)2, etc. por ello, en la
práctica, la principal medida de dispersión que se utiliza es la desviación estándar, cuyo valor esta
dado en las unidades originales: cm, pulgadas, mm, edades, horas, etc.

En los ejemplos anteriores:

a) Para la muestra de datos: 25,12, 23, 28, 17,15 se obtuvo por desviación estándar: S =
6,26 (unidades). Esto indica que la mayor parte de los datos de esta muestra se agrupan dentro de
6,26 unidades por encima y por debajo de la media aritmética, es decir, entre 20 - 6,26 = 13,74 y
20 + 6,26 = 26,26

b) Para el caso de los datos tabulados correspondientes a las edades de 26 personas, se


obtuvo una desviación estándar de 5 = 7,18 años. Esto indica que la mayor parte de los datos
están agrupados entre 29,96 - 7,18 = 22, 78 años y 29, 96 + 7,18 = 37,14 años.
Criterio de Homogeneidad

Una distribución se considera homogénea, si la desviación estándar se encuentra entre la


quinta y la cuarta parte del rango. Si no es as^ entonces se considera que la muestra es
heterogénea.

a) Para la muestra de datos: 25, 12, 23, 28, 17, 15

Por lo tanto, la muestra es heterogenea.

b) Para el caso de los datos tabulados de las edades de 26 personas

Observaciones:

1) Cuanto más separados o dispersos estén los datos, es decir, para muestras
heterogéneas, tanto mayores serán el rango, la varianza y la desviación estándar.

2) Si los datos están más concentrados, es decir, para muestras homogéneas, tanto
menores serán el rango, la varianza y la desviación estándar.

3) Si todas las observaciones son iguales (de manera que no haya variación en los datos ),
el rango, la varianza y la desviación estándar serán iguales a cero.
Ejercicios
1) En una industria dos operarios en siete días de trabajo, son capaces de producir, por dia,
y en forma individual la siguiente cantidad de árboles para fresa de 250 mm de longitud por 300
mm de diámetro.

Operario A 105 106 104 102 103 100 101


Operario B 103 102 107 101 105 102 103

Determine:
a) Rango del operario A y del operario B
b) Varianza del operario A.
c) Desviación estándar de ambos operarios.
d) (Son las muestras homogéneas?.

2) Se hace una encuesta entre 100 personas acerca del número de horas diarias que se
dedican a ver televisión, obteniéndose la siguiente información:

N° de fi
horas
0-1 30
2-3 20
4-5 15
6-7 32
8-9 1
10 - 11 2
Total 100

Calcular la varianza y la desviación estándar.

3) De un total de 100 datos, 20 son 4, 40 son 5, 30 son 6 y el resto 7. Hallar la desviación


Estándar.

4) Cuatro grupos de estudiantes, consistentes en 15, 20,10 y 18 individuos, dieron pesos de


60,72, 55 y 65 kilos. Hallar la varianza de los estudiantes.

5) Las notas de un estudiante en sus certámenes han sido 84, 91, 72, 68, 87 y 78. Hallar
la desviación estándar. Las notas, ¿son homogéneas?
6) La siguiente tabla corresponde a la estatura de 80 estudiantes de una determinada
carrera:

Estatura fi
1,65 - 1,69 6
1,70 - 1,74 12
1,75 - 1,79 30
1,80 - 1,84 22
1,85 - 1,89 8
1,90 - 1,94 2
Total 80

Hallar rango, varianza y desviación estándar de la estatura.

También podría gustarte