Introducción a la Estadística General
Introducción a la Estadística General
PROFESIONALIZACIÓN
ADMINISTRATIVA
AREQUIPA – 2015
Profesionalización Administrativa
INSTITUTO SUPERIOR PÚBLICO
“” HONORIO DELGADO ESPINOZA PROF. KARIM SANTOS C.
ESTADÍSTICA GENERAL
1. Definición de Estadística:
En el lenguaje común, la estadística se entiende como un conjunto de datos así
como se habla de:
- Estadística de ingresantes a las universidades.
- Estadística de desocupados.
- Estadística de subempleados.
- Estadística de analfabetos. Etc.
Sin embargo es necesario señalar más explícitamente el objetivo de la
estadística, respecto a lo cual se ha establecido que, la estadística es aquella
disciplina que se encarga de la recopilación, clasificación, presentación y
descripción de unidades de información denominadas datos, para luego tomar
¡ADECUADAS DECISIONES!
2. Tipos de Estadística:
- Estadística descriptiva.- es la parte de la estadística que se encarga de la
recolección, clasificación, presentación, descripción y simplificación de
datos. En otras palabras podemos expresar que un estudio estadístico se
considera “descriptivo” cuando solo se pretende analizar y describir los
datos.
- Estadística inferencial.- Es la que nos proporciona la teoría necesaria
para inferir o estimar las leyes de una población partiendo de los
resultados o conclusiones del análisis de una muestra. O sea, podemos
considerar que un estudio estadístico es inferencial cuando se pretende
inferir conclusiones que atañen a una población de donde procede la
muestra y como estas conclusiones nunca pueden ser absolutamente
ciertas, ellas estarán ligadas a cierto grado de incertidumbre o
probabilidad.
3. Población y Muestra:
- Población.- Se entiende por población o universo la totalidad de
individuos o elementos en las cuales puede presentarse determinada
característica susceptible de ser estudiada. Generalmente, este conjunto
viene definido por comprensión, es decir, citando la propiedad que
caracteriza a sus elementos. Los datos individuales de una población se
llaman unidades elementales u observaciones.
Ejemplo1: Población de puntajes de rendimiento en la lectura de todos
los alumnos del nivel primario en un sistema escolar.
Ejemplo 2: Trabajadores independientes de 20 a 30 años de edad.
Ejemplo 3: Población estudiantil del nivel secundario.
- Muestra.- es un subconjunto de elementos seleccionados
convenientemente de la población, de tal manera que puede hacerse
“deducciones” de ella respecto a la población completa.
Se suelen tomar muestras cuando es difícil o costosa la observación de
todos los elementos de la población estadística. Al número de elementos
de la muestra se le llama tamaño de la muestra.
Ejemplo 1: Resultados de las Elecciones Presidenciales
Una muestra apropiada podría ser de 500 a 10 000 electores y de la cual
se puede predecir el ganador.
4. Variables Estadísticas:
Se denomina variable a aquella característica, materia de estudio de la
investigación o también a aquel dato sometido a variación dentro de una escala o
intervalo.
Ejemplo: Sueldo del magisterio, estatura de los futbolistas, accidentes de
tránsito.
Una variable puede ser:
- Variable cuantitativa.- es aquella variable que está asociada a la
característica cantidad y por lo tanto se puede establecer cuánto o en que
cantidad se posee una determinada característica. Por ejemplo: El ingreso
familiar, la presión arterial y número de asesinatos.
a) Discreta
Es aquella que acepta el procedimiento del conteo, en
consecuencia sólo puede tomar algunos valores del intervalo
considerado (generalmente números enteros positivos). Por
ejemplo: Número de ojos en una familia, Número de accidentes
de tránsito y número de colegios por distrito.
(Valores que pueden tomar: 0,1 ,2, 3,4…)
b) Contínua
Es aquella que puede tomar cualquier valor del intervalo
considerado. Por ejemplo: Tiempos en una competencia
deportiva, Distancias entre capitales provinciales. Etc.
- Variable cualitativa.- es aquella que está asociada a la característica
Calidad, es decir, sus valores son cualidades, propiedades o atributos que
presentan la población. Por ejemplo: La variable “Profesión”, “Estado
Civil”. A la vez se puede clasificar en:
Variable cualitativa nominal.-Son aquella que surgen cuando se
definen categorías y se cuenta el número de observaciones pertenecientes
a cada categoría y no lleva ninguna ordenación en las posibles
modalidades. Ejemplo: La variable cualitativa “orientación en el tiempo”
con las posibles modalidades (presente, pasado y futuro) es una variable
cualitativa nominal.
Variable cualitativa ordinal: cuando el investigador va más allá del
nivel de clasificación y busca ordenar sus casos en términos del grado
que poseen una determinada característica, entonces esta trabajando con
una variable cualitativa ordinal. Ejemplo: la variable cualitativa “clase
social” con las posibles modalidades (bajo, medio, alto), es una variable
cualitativa ordinal.
5. Parámetro y Estadígrafo:
Parámetro es una medida usada para describir alguna característica de una población, y
para determinar su valor es necesario utilizar la información de la población completa y
por lo tanto, las decisiones se tomarán con certidumbre total.
Las más usadas son:
- Media poblacional
- Varianza poblacional
- Proporción poblacional
Estadígrafo es una medida usada para describir alguna característica de la
muestra y la forma de decisiones contiene un grado de incertidumbre. Las más
usadas son:
Media muestral
Varianza muestral
Proporción muestral
6. Las Etapas del Método Estadístico:
De acuerdo con el orden de aplicaciones de la estadística a un problema
determinado. Los métodos estadísticos se dividen en 4 etapas:
a) Planificación del estudio.
b) Recolección de la información.
c) Organización o clasificación de los datos recogidos.
d) Análisis e interpretación de los resultados.
Etapa de la Planificación.- Básicamente la etapa de planificación tiene por
finalidad estudiar los detalles concernientes a la recolección, clasificación y
análisis de la información, en base a lo cual se describirán las características de
una determinada población o se confirmará o negara determinada hipótesis de
trabajo. Es obvio sin embargo, que ninguna planificación podrá hacerse
adecuadamente, si antes no se ha hecho una conveniente evaluación de los
conocimientos que sobre el problema se poseen y de las hipótesis que se han
formulado para explicarlo.
Podemos esquematizar la planificación en los siguientes 5 pasos:
- Planteamiento del problema.
- Búsqueda y evaluación de la información existente.
- Formulación de la hipótesis.
- Verificación de la hipótesis.
- Análisis y presentación de los resultados.
Etapa de la Recolección de la Información.- Esta etapa tan a menudo
olvidada, tiene para el investigador mucha importancia que cualquier otra, pues
tienen que ser vigilada constantemente por el investigador para que se realice
conforme los planes trazados. Pues si la información ha sido recogida de manera
correcta, podrán tener validez las conclusiones que de ella se deriven. En el caso
contrario, no se justifica siquiera el empleo de la estadística, ya que ninguna
técnica podrá corregir los errores presentes en los datos básicos recogidos.
La decisión sobre los datos que van a recogerse y sobre la precisión con que
deben ser obtenidos depende primordialmente del propósito de la investigación y
del material estudiado, siendo conveniente limitarse a recoger tan sólo aquella
información que va utilizarse.
Los principales métodos de recolección son el método de encuestas y
experimentos, el método censal y método de registros.
Etapa de Organización de la Información.- Una vez recogida la información,
es necesario revisarla cuidadosamente y luego resumirla y presentarla
convenientemente, antes de que sea posible analizarla.
En la etapa de organización se consideran los 3 pasos siguientes:
- Revisión y corrección de la información recogida.- la corrección es
necesario hacer frecuentemente en la organización de los datos. Por
ejemplo la escritura es demasiado pobre, la marca no esta colocada
adecuadamente, las respuestas son inconsistentes, las respuestas son
incompletas y se necesitan cálculos.
- Presentación de la información mediante cuadros.-después de la revisión
y corrección de los datos recopilados, conviene estructurara y ordenar
estos datos de acuerdo algún sistema de clasificación a fin de describirlos
o analizarlos.
En toda tabla o cuadro estadístico debe considerarse: el título, el cuadro
propiamente dicho y las indicaciones complementarias.
Las indicaciones complementarias con el fin de que no haya dudas sobre
el contenido del cuadro, éste se anotará en la parte inferior de la tabla.
Las indicaciones complementarias son: la fuente de información,
comentarios y notas explicativas
- Presentación de la información mediante gráficos.- Los gráficos dan una
idea mucho más sintética que los cuadros estadísticos. Unas veces su
finalidad es simplemente tratar de mostrar a otras personas la evolución
de determinado fenómeno, pues mientras que la interpretación de un
cuadro estadístico requiere ciertos conocimientos, cualquiera puede
comprender fácilmente que una línea ascendente indica un aumento del
fenómeno estudiado.
Al igual que en los cuadros estadísticos, en los gráficos se considera: el
título, el gráfico propiamente dicho y las notas explicativas.
Análisis e Interpretación de los Resultados.- A través de métodos
estadísticos, se calculan indicadores y medidas de resumen, se establecen
relaciones entre variables, se estiman valores, se ejecutan pruebas estadísticas
como elementos de referencia para la descripción, análisis e interpretación del
comportamiento de los datos, para hacer inferencias validas y obtener
información de las unidades o elementos estudiados.
PRÁCTICA Nº 1
2. Supóngase que el 60% de todos los electores registrados en un país son integrantes del
partido A y el 40% no. A partir de una muestra de 500 electores, se encuentra que 250
pertenecen al partido A. Responda lo siguiente:
a) ¿Cuál es la población?, ¿es finita o infinita?
b) ¿Cuál es la muestra?,¿ cuál es su tamaño?
c) ¿Podría conocer la proporción de electores en la muestra que pertenecen al
partido A?.
d) ¿Conoce la proporción de electores en la población que pertenecen al partido
A?
4. Indique en cada uno de los casos siguientes si se trata de una variable o de una
constante:
a) Número de días del mes de agosto.
b) Edad de los estudiantes.
c) Calificaciones obtenidas en un examen que contiene 100 preguntas.
d) Máxima calificación posible en el examen anterior.
Ejemplo:
Datos obtenidos sobre las notas de matemática de 20 alumnos.
12 10 12 8 7
7 15 14 12 10
12 9 8 17 11
13 9 12 7 5
- Tamaño (n).- Es la cantidad de datos recogidos.
Para nuestro ejemplo: n = 20
- Alcance (A).- Es el intervalo cerrado que tiene por límites los datos de
menor a mayor valor.
Para nuestro ejemplo: A = [5;17]
- Rango (R).- Llamado también amplitud, es la distancia que existe entre
Li y Ls de una distribución
Para nuestro ejemplo: 17 - 5 = 12
- Numero de Intervalo (NI).- Es la cantidad de intervalos de clase,
dependiendo del criterio del estadístico. Sin embargo, para determinar un
primer valor del número de clases usamos.
NI = 1 + 3,322 log n
- Marca de clase (xi):- Se denomina así a la media aritmética de los
límites de cada intervalo de clase y es un valor representativo.
- Amplitud del intervalo (AI): Es la distancia entre Li – Ls .Distancia que
existe entre Li – Ls de cada intervalo de clase.
a) Frecuencia Absoluta (ƒi): es el número de datos contenidos en un
intervalo de clase. La suma total de las frecuencias absolutas debe
corresponder con el número total de elementos.
b) Frecuencia Relativa (hi): es el cociente de cada frecuencia absoluta entre
el número total de elementos. La suma de todas las frecuencias relativas es
igual a 1.
fi
hi ; 0 hi 1
n
c) Frecuencia Absoluta Acumulada (Fi): Es la suma de las frecuencias
absolutas, desde la primera clase hasta la clase en observación
La última frecuencia absoluta acumulada debe ser al número de elementos.
d) Frecuencia Relativa Acumulada (Hi): es la acumulación de las
frecuencias relativas.
La frecuencia relativa acumulada debe ser igual a uno.
8. Distribución de la Estadística según los datos.
Para poder construir las tablas de distribución de frecuencia se debe saber
primero con que tipo de variable se va a trabajar. En función de esto y de la
clasificación de variables, vista anteriormente, las estadísticas, para su mejor
estudio, pueden ser clasificadas de la manera siguiente:
8.1. Estadística tipo I: Son aquellas que contienen poca información y cada uno
de sus elementos no se repite. Se les llama también de Datos No Agrupados.
Por ser la información bastante pequeña, no existen tablas de frecuencias y
únicamente LOS DATOS SE PRESENTAN ORDENADOS, en filas o en
columnas.
Ejemplo: La siguiente información es las notas del curso de estadística
12 10 06 13 11 15
Ordenamos y clasificación
Xi 06 10 11 12 13 15
Características:
La amplitud
A = Ls - Li
A = 15 – 6 = 9 La A tipo I es pequeña
Tamaño o número de datos
n=6 El número de datos es pequeño existe pocos datos.
Por la agrupación: son datos no agrupados sin repetibilidad.
8.2. Estadística tipo II: Son aquellas que contienen una información
medianamente grande.
Ejemplo: Sea el número de hermanas de las alumnos de contabilidad ISPHDE
4 3 4 2 2 6 1 3 8 6
2 3 4 3 4 2 3 5 6 4
4 2 4 3 4 6 3
- Recolección de datos.
- Orden y clasificación.
Xi Tabulación fi
1 I 1
2 IIIII 5
3 IIIII II 7
4 IIIII III 8
5 I 1
6 IIII 4
8 I 1
n = 27
- Características.
La amplitud: A = 8 - 1= 7 entonces es pequeña.
n = 27 grande el tipo II significa que hay más datos
Agrupación: son datos no agrupados pero con repetibilidad o frecuencia.
8.3. Estadística tipo III: Son para datos agrupados
Ejemplo
Sea la edad del Papá de los alumnos de contabilidad ISPHDE 2007.
56 45 53 52 49 50 48 60 46 46
46 50 45 46 56 45 55 44 45 47
56 44 56 52 55 49 47 46 51 46
62 44 49 48 46 51 n = 36
- Recolección
- Orden y clasificación:
A = 62 – 44 = 18
NI = 1 + 3,322 log n
NI = 1 + 3,322 log 36
NI = 1 + 3,322(1,5563)
7
NI = 6,17
6
A
AI =
NI
18 3 18
AI1 2,57 AI 2 3
7 2 6
Regla: NI x AI 7 x 3 = 21
7 x 2 = 14
6 x 3 = 18
De los productos anteriores escogemos los mayores o
iguales que la amplitud. 21 y 18
Escogemos: Primero el menor igual a 18
NI = 6
AI = 3
Segundo es igual a 21
NI = 7
NI = 3
YI CONTEO fi
44 - 46 IIIII IIIII IIII 14
47 – 49 IIIII II 7
50 -52 IIIII I 6
53 -55 III 3
56 -58 IIII 4
59 -61 I 1
62 - 64 I 1
n = 36
- Características:
A = 18 grande
n = 36 grande
Agrupación: agrupados
Ejemplo: Los pesos de los alumnos de contabilidad III
71 61 45 53 62 60 57 73 51 48 54
49 55 55 57 63 74 51 52 49 56 63
63 60 52 66 48 55 70 59 62 63 47
60 55
PRÁCTICA Nº 2
1. Sean las alturas de las plantas en una clase de botánica. Complete el cuadro.
Altura de plantas en cm. (Xi) Conteo fi Fi hi Hi %
60 I 1 0.05
62 I 0.05
64 I
65 I 0.20
66 II 6 10%
67 II
68 IIIII 0.65
69 I
70 I
71 II 17
72 I
73 I
76 I 1 5%
TOTAL 20 1 100%
Hemos visto que la tabla estadística resume los datos que disponemos de una población,
de forma que ésta se puede analizar de una manera más sistemática y resumida. Para
darnos cuenta de un solo vistazo de las características de la población resulta aún más
esclarecedor el uso de gráficas y diagramas.
fi y
Yi fi
Diagramas de Barras Verticales Diagramas de Barras Horizontales
Yi
2. REPRESENTACIÓN PARA VARIABLES CUANTITATIVAS.
a) Histograma.- Conjunto de rectángulos adyacentes cuya base es igual a
la amplitud de cada intervalo y la altura es igual a la respectiva
frecuencia.
fi
Yi : Intervalo de clase
b) Polígono de frecuencias.- Se dibuja los pares ordenados (xi , fi ), es
decir, pares que constan de las marcas de clase de cada intervalo y su
respectiva frecuencia, luego se unen los puntos con una línea poligonal.
fi
Marca de clase
Fi
Intervalo de clase
PRÁCTICA Nº 3
1. Los siguientes datos proporcionan las renumeraciones (en dólares) de 50
obreros.
73 47 67 82 67 70 60 67 61 80 65
70 57 85 59 70 57 73 77 58 69 58
76 67 52 68 69 66 72 86 76 79 77
88 94 67 77 54 93 56 73 64 70 46
68 63 72 84 63 74
Agrupar estos datos en una tabla de frecuencias cuyos intervalos sean de
amplitud constante.
2. Los siguientes datos son los puntajes obtenidos por 50 estudiantes en un examen
de Estadística General.
33 50 61 69 80 35 52 64 71 81 35
53 65 73 84 39 54 65 73 85 41 55
65 74 85 41 55 66 74 88 42 57 66
76 89 45 59 66 77 91 47 60 67 77
94 48 60 68 78 97
Clasificar estos datos convenientemente en intervalos de clase de la misma
amplitud.
3. Se tiene la siguiente tabla de frecuencias relativas de 300 empleados según su
edad:
Edades 19 - 21 22 - 24 25 - 27 28 - 30 31 - 33
hi 0.15 0.25 0.40 0.10 0.10
a) MEDIA ARITMÉTICA: ( X )
- Datos no agrupados.- Es el cociente o división entre la sumatoria de
datos que existen y el número de datos.
N
X X 2 ... X N X i
x
X= 1 i 1
Tipo I
N N N
Ejemplo 1
Sean las notas siguientes: 13 – 07 – 10 – 14 – 11 hallar la media
aritmética.
Solución:
1. Recolección
2. Orden y clasificación
Xi 07 – 10 – 11 – 13 - 14 = 55
3. Cálculo de X
X
X
55
11
N 5
- Datos agrupados.- Sean X 1 , X 2 ,..., X k valores de la variable X
ponderados por sus respectivas frecuencias absolutas: f1,…,fk. La media
de la variable X es dado por:
k
f i. Xi
X i 1
Tipo II
N
X
y' i fi
TipoIII
N
Ejemplo 2
Sean el número de orden del nacimiento de los alumnos de contabilidad
III ISHDE 2007
3 2 4 4 4 4 3 2
1 1 3 1 6 2 2 4
2 2 3 4 3 3 1 2
3 1 1 3 4 2 2 1
Recolección
Orden y clasificación
Xi conteo fi Xifi
1 IIIII II 7 7
2 IIIII IIII 9 18
3 IIIII III 8 24
4 IIIII II 7 28
5 0 0
6 I 1 6
32 83
Cálculo de la X
X =
X f
i i
83
2,59 3
N 32
Interpretación
El promedio del número de orden de nacimiento de los alumnos de
Contabilidad III ISHDE 2007 es tercer lugar.
Ejemplo 3
Sean ingresos quincenales en dólares de 45 personas son:
Yi fi y’i y’i fi
X
y' i fi
2702
60.04 =
[26-34[ 1 30 30
[34-42[ 2 38 76
N 45
[42-50[ 4 46 184
Interpretación. El promedio de los ingresos
[50-58[ 10 54 540
quincenales es $ 60,04
[58-66[ 16 62 992
[66-74[ 8 70 560
[74-82[ 3 78 234
[82-90[ 1 86 86
Total 45 2702
PRÁCTICA Nº 4
1) Sean el número de hermanos de los alumnos de Administración del III semestre ISPHDE – 2011. Calcular
la media aritmética, graficar e interpretar.
8 3 6 13 4 5 7 3 6 7
9 4 3 10 5 5 5 2 0 6
8 3 5 5 5 5 4 2 5 5
2) Sea el número de hermanos de las mamas de los alumnos de Computación e informática del V semestre del
ISPHDE – 2010. Calcular la media aritmética, graficar e interpretar.
9 7 5 6 4 4 7 4 5 6 2
1 2 1 10 2 7 6 1 3 6 0
7 0 4 1 9 6 5 3 3 4
3) Sea la talla de las madres de los alumnos de contabilidad del HDE-2010. Calcular la media aritmética,
graficar e interpretar.
164 150 150 160 158 162 150 152 155 164 155
158 167 165 164 175 150 155 157 158 160 159
160 160 162 158 154 154 163 162 170 170 158
158 158 162 160 160 160 160 160 150 160 168
172 166 167 173
4) Determine la media aritmética de la distribución.
Ingreso Familiar [2,4> [4,6> [6,8> [8,10> [10,12>
Nº de familias 5 10 14 8 3
y’i
N / 2 Faa
Me Li i
f
Me =34,6
PRÁCTICA Nº 5
Ejemplo 2:
Xi fi
0 10
1 8
2 15
3 22
4 5
El dato que se repite mayor número de veces es el 3 porque se repite 22 veces
por lo tanto la moda es 3
Ejemplo 3:
Sea la edad del hermano mayor de los alumnos de computación e informática V
del ISPHDE. Calcular la moda y graficar
PRÁCTICA Nº 6
1. Dadas las siguientes mediciones de la emisión diaria (en toneladas) de óxido de
azufre de una planta industrial.
21.3 15.8 18.4 22.7 19.6 15.8 26.4 17.3 11.2 23.9 26.8
22.7 18.0 20.5 11.0 18.5 23.0 24.6 20.1 16.2 8.3 21.9
12.3 22.3 13.4 17.9 12.2 13.4 15.1 19.1
Construya una distribución de frecuencias para los datos con 6 intervalos, de
igual amplitud.
a. Dibuje el histograma y el polígono de frecuencias correspondiente.
b. Calcule la media aritmética, mediana y moda, ¿Cuál es la más
representativa?¿Por qué?
90-94 10
Total 100
La media geométrica se utiliza para promediar: razones (a/b), índices (a/b en %),
proporciones (a/(a+b)), tasas de cambio (a-b)/b, que varían con el tiempo, entre
otros.
Aplicando logaritmo de base 10
n
n n
de donde resulta:
n
log( xi )
X G anti log i 1
n
e) Media Armónica:
La media armónica de n valores no nulos x1 , x2 ,…,xn es el número, X H que se
define como el recíproco de la media aritmética de los recíprocos de esos n
valores.
n
Esto es, X H n
1
x i 1 i
X
2
denotar por X
2
y se define como MQ =
2
X = i 1
i
=
X 2
N N
CUANTILES
Son consecuencia del estudio de la mediana. Los cuantiles más usados son los cuartiles,
deciles y percentiles.
1. Cuartiles (Qr): dividen al conjunto de datos ordenados en cuatro partes iguales
y en 3 cuartiles.
0% 100%
25% Q1 25% Q2 25% Q3 25%
Una vez determinado la clase cuartílica, para lo cual empleamos rN/4, los
cuartiles se obtienen por medio de la fórmula:
rN
Faa
Qr Li 4 i , r = 1, 2, 3
f
50N/100 = N/2 = 30
30 29
P50 27 3
4
3
P50 27 27 0.75 27.75
4
8N/10 = 4N/5 = 48
48 33
D8 30 3
4
15
D8 30 3 30 11.25 41.25
4
PRÁTICA Nº 5
5. Hallar (a) la media aritmética, (b) la media geométrica y (c) la media armónica
de los números 0, 2, 4 y 6
6. Hallar la media cuadrática de los números: 2.7; 3.8; 3.2 y 4.3.
7. La tabla muestra una distribución de frecuencias de puntuaciones de un examen
final del álgebra. (a) Hallar los cuartiles de la distribución, (b) interpretar su
significado y c) Hallar D8 , P30
Grado Número de estudiantes
90-100 9
80-89 32
70-79 43
60-69 21
50-59 11
40-49 3
30-39 1
MEDIDAS DE DISPERSIÓN O CONCENTRACIÓN
1. Introducción.
Las medidas de tendencia central no son suficientes para describir un conjunto de
valores de alguna variable estadística. Los promedios determinan el centro, pero
nada indican acerca de cómo están situados los datos respecto al centro.
En primer lugar se necesita una medida del grado de dispersión o variabilidad con
respecto al centro con la finalidad de ampliar la descripción de los datos o de
comparar dos o más series de datos.
En segundo lugar se necesita una medida del grado de asimetría o deformación en
ambos lados del centro de una serie de datos, con el fin de describir la forma de la
distribución de los datos. Esta medida se denomina índice de asimetría.
En tercer lugar se necesita una medida que nos permita comparar en apuntamiento
o curtosis de distribuciones simétricas con respecto a la distribución simétrica
normal. Esta medida se denomina índice de apuntamiento o curtosis.
2. Definición.
Las medidas de dispersión son los que cuantifican el grado de concentración o
dispersión de los valores de la variable en torno de un promedio o valor central de
la distribución. Las medidas de dispersión se necesitan para dos propósitos:
- Para verificar la confiabilidad de los promedios
- Para que sirva como base para el control de la variación misma
- También podemos decir que los términos concentración y dispersión
pueden ser utilizados indistintamente, pues se da la relación:
Homogéneas: < dispersión Heterogéneas: > dispersión
> concentración < concentración
3. Clases de medidas
El rango
Rango intercuartil y rango semiintercuartil
Desviación media
Varianza
Desviación estándar
Coeficiente de la variabilidad
El rango.- El rango de variación o recorrido, R, de una serie de datos, es la
diferencia entre sus valores máximo y mínimo. Esto es,
R X max X min
RI $70 $62 8
Esto, indica que el 50% de los ingresos quincenales de los 100 empleados
varía dentro del valor $ 8.
Rango semiintercuartil.-(RSI), es igual al rango intercuartil dividido por
Q3 Q1
2. RSI
2
El rango semiintercuartil se puede asociar con la mediana y se puede
expresar en función de ella. Si una distribución es normal los cuartiles Q1 y
Q3 son equidistantes de la mediana. Se deduce entonces, que el rango
intercuartil y la mediana RSI, son la misma distancia. Además, como
exactamente el 50% de los datos se encuentra en el rango intercuartil,
entonces, el intervalo: mediana RSI contiene también exactamente el
50% de los datos. Si la distribución es asimétrica, el intervalo: mediana
RSI contendría aproximadamente el 50% de los datos.
Ejemplo:
Si la distribución de los 100 ingresos quincenales donde Q1= $ 62 y Q3=$
70, el rango semiintercuartil es $ 4. Si la mediana fuera igual al $ 66,
entonces, aproximadamente el 50% de los datos se hallan comprendidos en
el intervalo $ 66 4.
La Desviación Media.-(DM) La desviación media o desviación promedio,
es simplemente la media aritmética de los valores absolutos de las
desviaciones de todos los valores en relación con algún punto central, tal
como la media o la mediana. Formalmente tenemos la siguiente definición.
Definición: Sean x1 , x2 ,…,xk valores de la variable x, con frecuencias
absolutas f1,…,fk, respectivamente. La desviación media de x respecto a un
k
f i xi p k
promedio p es dado por: DM i 1
donde N f i
N i 1
xi x
DM i 1
I Donde:
N Xi = datos
k fi = frecuencia absoluta
f i xi x N = total de datos
DM i 1
II X = media aritmética
N y’i = marca de clase
k
f i y 'i x
DM i 1
III
N
k
f i xi Me
y con respecto a la mediana es: DM i 1
N
Ejemplo 1:
Dadas las notas de seis estudiantes, calcular su desviación media. 14, 11, 7,
10, 14, 20
k
xi x
DM i 1
𝟏𝟒+𝟏𝟏+𝟕+𝟏𝟎+𝟏𝟒+𝟐𝟎 𝟕𝟔
X= = = 𝟏𝟐, 𝟔
𝟔 𝟔
|14−12,6|+|11−12,6|+|7−12,6|+|10−12,6|+|14−12,6|+|20−12,6|
𝐷𝑀 =
6
Ejemplo 2:
Sean el número de habitaciones de los hogares de los alumnos de
Mecánica de Producción del ISHDE -2012. Hallar la desviación media.
k
f i xi x
DM i 1
f i. Xi
186
X i 1
= 30 = 6.2
N
37.6
𝐷𝑀 = = 1.25
30
Interpretación:
Los valores observados se dispersan en 1.25 puntos de su media aritmética.
Ejemplo 3:
La siguiente tabla de distribución de frecuencia muestra los promedios
finales obtenidos por los estudiantes, en estadística general. Hallar la
desviación media.
k
f i y 'i x
DM i 1
N
Primero se calcula la media aritmética:
X
y' i fi
624
12
N 52
Interpretación:
Los valores observados se dispersan en 2.88 puntos de su media aritmética.
CUADRO RESUMEN
Medida Símbolo Tipo I Tipo II Tipo III
Rango R R = Xmax - Xmin
Desviación media DM
D
Df i
Df i
N N N
Varianza S2
D 2
D 2
fi
D 2
fi
N N N
Desviación estándar S
D 2
D 2
fi
D 2
fi
N N N
Coeficiente de CV S S S
100 100 100
variabilidad x x x
PRÁCTICA Nº 6
2. En una empresa, el salario medio de los hombres es de S/. 4000 con una desviación
estándar de S/.1500 y el de las mujeres es un promedio de S/. 3000 con una
desviación estándar de S/. 1200. Hallar el coeficiente de variación de los salarios de
los hombres y mujeres.
3. Dada la siguiente distribución de frecuencias de datos discretos:
Xi fi
1200 16 - Determine la varianza.
- Calcule la desviación típica
1400 23
1600 17
1800 41
2000 32
2200 21
Total 150