0% encontró este documento útil (0 votos)
512 vistas39 páginas

Introducción a la Estadística General

Este documento presenta los conceptos fundamentales de la estadística. Explica que la estadística se encarga de recopilar, clasificar y describir datos para tomar decisiones informadas. Distingue entre estadística descriptiva e inferencial. Define conceptos clave como población, muestra, variables, parámetros y estadígrafos. Finalmente, resume las cuatro etapas del método estadístico: planificación, recolección de datos, organización de datos e interpretación de resultados.

Cargado por

Daniel Apaza
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
512 vistas39 páginas

Introducción a la Estadística General

Este documento presenta los conceptos fundamentales de la estadística. Explica que la estadística se encarga de recopilar, clasificar y describir datos para tomar decisiones informadas. Distingue entre estadística descriptiva e inferencial. Define conceptos clave como población, muestra, variables, parámetros y estadígrafos. Finalmente, resume las cuatro etapas del método estadístico: planificación, recolección de datos, organización de datos e interpretación de resultados.

Cargado por

Daniel Apaza
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

INSTITUTO SUPERIOR PÚBLICO

“HONORIO DELGADO ESPINOZA”

PROFESIONALIZACIÓN
ADMINISTRATIVA

CURSO: ESTADISTICA GENERAL

DOCENTE: KARIM SANTOS CUSI

AREQUIPA – 2015
Profesionalización Administrativa
INSTITUTO SUPERIOR PÚBLICO
“” HONORIO DELGADO ESPINOZA PROF. KARIM SANTOS C.

ESTADÍSTICA GENERAL

1. Definición de Estadística:
En el lenguaje común, la estadística se entiende como un conjunto de datos así
como se habla de:
- Estadística de ingresantes a las universidades.
- Estadística de desocupados.
- Estadística de subempleados.
- Estadística de analfabetos. Etc.
Sin embargo es necesario señalar más explícitamente el objetivo de la
estadística, respecto a lo cual se ha establecido que, la estadística es aquella
disciplina que se encarga de la recopilación, clasificación, presentación y
descripción de unidades de información denominadas datos, para luego tomar
¡ADECUADAS DECISIONES!
2. Tipos de Estadística:
- Estadística descriptiva.- es la parte de la estadística que se encarga de la
recolección, clasificación, presentación, descripción y simplificación de
datos. En otras palabras podemos expresar que un estudio estadístico se
considera “descriptivo” cuando solo se pretende analizar y describir los
datos.
- Estadística inferencial.- Es la que nos proporciona la teoría necesaria
para inferir o estimar las leyes de una población partiendo de los
resultados o conclusiones del análisis de una muestra. O sea, podemos
considerar que un estudio estadístico es inferencial cuando se pretende
inferir conclusiones que atañen a una población de donde procede la
muestra y como estas conclusiones nunca pueden ser absolutamente
ciertas, ellas estarán ligadas a cierto grado de incertidumbre o
probabilidad.
3. Población y Muestra:
- Población.- Se entiende por población o universo la totalidad de
individuos o elementos en las cuales puede presentarse determinada
característica susceptible de ser estudiada. Generalmente, este conjunto
viene definido por comprensión, es decir, citando la propiedad que
caracteriza a sus elementos. Los datos individuales de una población se
llaman unidades elementales u observaciones.
Ejemplo1: Población de puntajes de rendimiento en la lectura de todos
los alumnos del nivel primario en un sistema escolar.
Ejemplo 2: Trabajadores independientes de 20 a 30 años de edad.
Ejemplo 3: Población estudiantil del nivel secundario.
- Muestra.- es un subconjunto de elementos seleccionados
convenientemente de la población, de tal manera que puede hacerse
“deducciones” de ella respecto a la población completa.
Se suelen tomar muestras cuando es difícil o costosa la observación de
todos los elementos de la población estadística. Al número de elementos
de la muestra se le llama tamaño de la muestra.
Ejemplo 1: Resultados de las Elecciones Presidenciales
Una muestra apropiada podría ser de 500 a 10 000 electores y de la cual
se puede predecir el ganador.
4. Variables Estadísticas:
Se denomina variable a aquella característica, materia de estudio de la
investigación o también a aquel dato sometido a variación dentro de una escala o
intervalo.
Ejemplo: Sueldo del magisterio, estatura de los futbolistas, accidentes de
tránsito.
Una variable puede ser:
- Variable cuantitativa.- es aquella variable que está asociada a la
característica cantidad y por lo tanto se puede establecer cuánto o en que
cantidad se posee una determinada característica. Por ejemplo: El ingreso
familiar, la presión arterial y número de asesinatos.
a) Discreta
Es aquella que acepta el procedimiento del conteo, en
consecuencia sólo puede tomar algunos valores del intervalo
considerado (generalmente números enteros positivos). Por
ejemplo: Número de ojos en una familia, Número de accidentes
de tránsito y número de colegios por distrito.
(Valores que pueden tomar: 0,1 ,2, 3,4…)
b) Contínua
Es aquella que puede tomar cualquier valor del intervalo
considerado. Por ejemplo: Tiempos en una competencia
deportiva, Distancias entre capitales provinciales. Etc.
- Variable cualitativa.- es aquella que está asociada a la característica
Calidad, es decir, sus valores son cualidades, propiedades o atributos que
presentan la población. Por ejemplo: La variable “Profesión”, “Estado
Civil”. A la vez se puede clasificar en:
Variable cualitativa nominal.-Son aquella que surgen cuando se
definen categorías y se cuenta el número de observaciones pertenecientes
a cada categoría y no lleva ninguna ordenación en las posibles
modalidades. Ejemplo: La variable cualitativa “orientación en el tiempo”
con las posibles modalidades (presente, pasado y futuro) es una variable
cualitativa nominal.
Variable cualitativa ordinal: cuando el investigador va más allá del
nivel de clasificación y busca ordenar sus casos en términos del grado
que poseen una determinada característica, entonces esta trabajando con
una variable cualitativa ordinal. Ejemplo: la variable cualitativa “clase
social” con las posibles modalidades (bajo, medio, alto), es una variable
cualitativa ordinal.
5. Parámetro y Estadígrafo:
Parámetro es una medida usada para describir alguna característica de una población, y
para determinar su valor es necesario utilizar la información de la población completa y
por lo tanto, las decisiones se tomarán con certidumbre total.
Las más usadas son:
- Media poblacional
- Varianza poblacional
- Proporción poblacional
Estadígrafo es una medida usada para describir alguna característica de la
muestra y la forma de decisiones contiene un grado de incertidumbre. Las más
usadas son:
 Media muestral
 Varianza muestral
 Proporción muestral
6. Las Etapas del Método Estadístico:
De acuerdo con el orden de aplicaciones de la estadística a un problema
determinado. Los métodos estadísticos se dividen en 4 etapas:
a) Planificación del estudio.
b) Recolección de la información.
c) Organización o clasificación de los datos recogidos.
d) Análisis e interpretación de los resultados.
Etapa de la Planificación.- Básicamente la etapa de planificación tiene por
finalidad estudiar los detalles concernientes a la recolección, clasificación y
análisis de la información, en base a lo cual se describirán las características de
una determinada población o se confirmará o negara determinada hipótesis de
trabajo. Es obvio sin embargo, que ninguna planificación podrá hacerse
adecuadamente, si antes no se ha hecho una conveniente evaluación de los
conocimientos que sobre el problema se poseen y de las hipótesis que se han
formulado para explicarlo.
Podemos esquematizar la planificación en los siguientes 5 pasos:
- Planteamiento del problema.
- Búsqueda y evaluación de la información existente.
- Formulación de la hipótesis.
- Verificación de la hipótesis.
- Análisis y presentación de los resultados.
Etapa de la Recolección de la Información.- Esta etapa tan a menudo
olvidada, tiene para el investigador mucha importancia que cualquier otra, pues
tienen que ser vigilada constantemente por el investigador para que se realice
conforme los planes trazados. Pues si la información ha sido recogida de manera
correcta, podrán tener validez las conclusiones que de ella se deriven. En el caso
contrario, no se justifica siquiera el empleo de la estadística, ya que ninguna
técnica podrá corregir los errores presentes en los datos básicos recogidos.
La decisión sobre los datos que van a recogerse y sobre la precisión con que
deben ser obtenidos depende primordialmente del propósito de la investigación y
del material estudiado, siendo conveniente limitarse a recoger tan sólo aquella
información que va utilizarse.
Los principales métodos de recolección son el método de encuestas y
experimentos, el método censal y método de registros.
Etapa de Organización de la Información.- Una vez recogida la información,
es necesario revisarla cuidadosamente y luego resumirla y presentarla
convenientemente, antes de que sea posible analizarla.
En la etapa de organización se consideran los 3 pasos siguientes:
- Revisión y corrección de la información recogida.- la corrección es
necesario hacer frecuentemente en la organización de los datos. Por
ejemplo la escritura es demasiado pobre, la marca no esta colocada
adecuadamente, las respuestas son inconsistentes, las respuestas son
incompletas y se necesitan cálculos.
- Presentación de la información mediante cuadros.-después de la revisión
y corrección de los datos recopilados, conviene estructurara y ordenar
estos datos de acuerdo algún sistema de clasificación a fin de describirlos
o analizarlos.
En toda tabla o cuadro estadístico debe considerarse: el título, el cuadro
propiamente dicho y las indicaciones complementarias.
Las indicaciones complementarias con el fin de que no haya dudas sobre
el contenido del cuadro, éste se anotará en la parte inferior de la tabla.
Las indicaciones complementarias son: la fuente de información,
comentarios y notas explicativas
- Presentación de la información mediante gráficos.- Los gráficos dan una
idea mucho más sintética que los cuadros estadísticos. Unas veces su
finalidad es simplemente tratar de mostrar a otras personas la evolución
de determinado fenómeno, pues mientras que la interpretación de un
cuadro estadístico requiere ciertos conocimientos, cualquiera puede
comprender fácilmente que una línea ascendente indica un aumento del
fenómeno estudiado.
Al igual que en los cuadros estadísticos, en los gráficos se considera: el
título, el gráfico propiamente dicho y las notas explicativas.
Análisis e Interpretación de los Resultados.- A través de métodos
estadísticos, se calculan indicadores y medidas de resumen, se establecen
relaciones entre variables, se estiman valores, se ejecutan pruebas estadísticas
como elementos de referencia para la descripción, análisis e interpretación del
comportamiento de los datos, para hacer inferencias validas y obtener
información de las unidades o elementos estudiados.
PRÁCTICA Nº 1

1. En cuatro pruebas de matemática, Juana recibió calificaciones de 17, 18,15 y 14;


mientras que Juan recibió calificaciones de 14,13,16 y13. A partir de estos datos se
llega a las siguientes conclusiones, ¿cuáles de estas incluyen la estadística descriptiva y
cuales se obtienen mediante la estadística inferencial?.
a) El promedio de las calificaciones de Juana es 16 y el promedio de las
calificaciones de Juan es 14.
b) Juana es mejor estudiante que Juan.
c) Probablemente en la siguiente prueba, Juana obtenga calificaciones más
elevadas que Juan.
d) La diferencia entre los dos promedios es 2 puntos.

2. Supóngase que el 60% de todos los electores registrados en un país son integrantes del
partido A y el 40% no. A partir de una muestra de 500 electores, se encuentra que 250
pertenecen al partido A. Responda lo siguiente:
a) ¿Cuál es la población?, ¿es finita o infinita?
b) ¿Cuál es la muestra?,¿ cuál es su tamaño?
c) ¿Podría conocer la proporción de electores en la muestra que pertenecen al
partido A?.
d) ¿Conoce la proporción de electores en la población que pertenecen al partido
A?

3. En los siguientes problemas, identifique: la población, la muestra, la variable y el tipo


de variable.
a) Se selecciona una muestra de los becerros recién nacidos en Cajamarca en el
2002 y se registra sus pesos.
b) Varias veces durante el día un ingeniero de control de calidad, en una fábrica
textil, selecciona diferentes muestras de metros cuadrados de telas, las examina
y registra el número de imperfecciones que encuentra.
c) Un profesor de Estadística desea estimar el número de estudiantes que leen el
periódico escolar, antes de empezar la clase. Hay 33 estudiantes en clase, el
profesor decide que una muestra de 10 puede ser suficiente para su estudio.

4. Indique en cada uno de los casos siguientes si se trata de una variable o de una
constante:
a) Número de días del mes de agosto.
b) Edad de los estudiantes.
c) Calificaciones obtenidas en un examen que contiene 100 preguntas.
d) Máxima calificación posible en el examen anterior.

5. Clasifique las siguientes características, según el tipo de variable que usualmente es


adoptado para resumir los datos.
a) El número de tornillos de cada caja producidos en un mes.
b) Porcentaje de fallecimientos por edades.
c) Número de estudiantes que han ingresado a la UNSA durante los últimos 10
años.
d) Personas enfermas de sarampión de acuerdo a su edad.
e) Número de automóviles ensamblados mensualmente.
f) Temperaturas registradas cada media hora por un observatorio
7. Distribución de Frecuencias.- Consiste en la agrupación de los datos originales
en clases (intervalos o categorías), las que consisten de los diferentes valores que
toma la variable; mostrando las frecuencias correspondientes ƒi a esas clases
(frecuencias absolutas), es decir, las veces que se repite cada clase.
Clases Frecuencias Clases Frecuencias
Categoría 1 ƒ1 Intervalo 1 ƒ1
Categoría 2 ƒ2 Intervalo 2 ƒ2
   
Categoría n ƒn Intervalo n ƒn
Total n   fi Total n   fi

Ejemplo:
Datos obtenidos sobre las notas de matemática de 20 alumnos.
12 10 12 8 7
7 15 14 12 10
12 9 8 17 11
13 9 12 7 5
- Tamaño (n).- Es la cantidad de datos recogidos.
Para nuestro ejemplo: n = 20
- Alcance (A).- Es el intervalo cerrado que tiene por límites los datos de
menor a mayor valor.
Para nuestro ejemplo: A = [5;17]
- Rango (R).- Llamado también amplitud, es la distancia que existe entre
Li y Ls de una distribución
Para nuestro ejemplo: 17 - 5 = 12
- Numero de Intervalo (NI).- Es la cantidad de intervalos de clase,
dependiendo del criterio del estadístico. Sin embargo, para determinar un
primer valor del número de clases usamos.
NI = 1 + 3,322 log n
- Marca de clase (xi):- Se denomina así a la media aritmética de los
límites de cada intervalo de clase y es un valor representativo.
- Amplitud del intervalo (AI): Es la distancia entre Li – Ls .Distancia que
existe entre Li – Ls de cada intervalo de clase.
a) Frecuencia Absoluta (ƒi): es el número de datos contenidos en un
intervalo de clase. La suma total de las frecuencias absolutas debe
corresponder con el número total de elementos.
b) Frecuencia Relativa (hi): es el cociente de cada frecuencia absoluta entre
el número total de elementos. La suma de todas las frecuencias relativas es
igual a 1.
fi
hi  ; 0  hi  1
n
c) Frecuencia Absoluta Acumulada (Fi): Es la suma de las frecuencias
absolutas, desde la primera clase hasta la clase en observación
La última frecuencia absoluta acumulada debe ser al número de elementos.
d) Frecuencia Relativa Acumulada (Hi): es la acumulación de las
frecuencias relativas.
La frecuencia relativa acumulada debe ser igual a uno.
8. Distribución de la Estadística según los datos.
Para poder construir las tablas de distribución de frecuencia se debe saber
primero con que tipo de variable se va a trabajar. En función de esto y de la
clasificación de variables, vista anteriormente, las estadísticas, para su mejor
estudio, pueden ser clasificadas de la manera siguiente:
8.1. Estadística tipo I: Son aquellas que contienen poca información y cada uno
de sus elementos no se repite. Se les llama también de Datos No Agrupados.
Por ser la información bastante pequeña, no existen tablas de frecuencias y
únicamente LOS DATOS SE PRESENTAN ORDENADOS, en filas o en
columnas.
Ejemplo: La siguiente información es las notas del curso de estadística
12 10 06 13 11 15
Ordenamos y clasificación
Xi 06 10 11 12 13 15
Características:
La amplitud
A = Ls - Li
A = 15 – 6 = 9 La A tipo I es pequeña
Tamaño o número de datos
n=6 El número de datos es pequeño  existe pocos datos.
Por la agrupación: son datos no agrupados sin repetibilidad.
8.2. Estadística tipo II: Son aquellas que contienen una información
medianamente grande.
Ejemplo: Sea el número de hermanas de las alumnos de contabilidad ISPHDE
4 3 4 2 2 6 1 3 8 6
2 3 4 3 4 2 3 5 6 4
4 2 4 3 4 6 3
- Recolección de datos.
- Orden y clasificación.
Xi Tabulación fi
1 I 1
2 IIIII 5
3 IIIII II 7
4 IIIII III 8
5 I 1
6 IIII 4
8 I 1
n = 27
- Características.
La amplitud: A = 8 - 1= 7 entonces es pequeña.
n = 27 grande el tipo II significa que hay más datos
Agrupación: son datos no agrupados pero con repetibilidad o frecuencia.
8.3. Estadística tipo III: Son para datos agrupados
Ejemplo
Sea la edad del Papá de los alumnos de contabilidad ISPHDE 2007.
56 45 53 52 49 50 48 60 46 46
46 50 45 46 56 45 55 44 45 47
56 44 56 52 55 49 47 46 51 46
62 44 49 48 46 51 n = 36
- Recolección
- Orden y clasificación:
A = 62 – 44 = 18
NI = 1 + 3,322 log n
NI = 1 + 3,322 log 36
NI = 1 + 3,322(1,5563)
7
NI = 6,17 
6
A
AI =
NI
18 3 18
AI1   2,57  AI 2  3
7 2 6
Regla: NI x AI  7 x 3 = 21
7 x 2 = 14
6 x 3 = 18
De los productos anteriores escogemos los mayores o
iguales que la amplitud. 21 y 18
Escogemos: Primero el menor igual a 18
NI = 6
AI = 3
Segundo es igual a 21
NI = 7
NI = 3
YI CONTEO fi
44 - 46 IIIII IIIII IIII 14
47 – 49 IIIII II 7
50 -52 IIIII I 6
53 -55 III 3
56 -58 IIII 4
59 -61 I 1
62 - 64 I 1
n = 36
- Características:
A = 18 grande
n = 36 grande
Agrupación: agrupados
Ejemplo: Los pesos de los alumnos de contabilidad III
71 61 45 53 62 60 57 73 51 48 54
49 55 55 57 63 74 51 52 49 56 63
63 60 52 66 48 55 70 59 62 63 47
60 55
PRÁCTICA Nº 2

1. Sean las alturas de las plantas en una clase de botánica. Complete el cuadro.
Altura de plantas en cm. (Xi) Conteo fi Fi hi Hi %
60 I 1 0.05
62 I 0.05
64 I
65 I 0.20
66 II 6 10%
67 II
68 IIIII 0.65
69 I
70 I
71 II 17
72 I
73 I
76 I 1 5%
TOTAL 20 1 100%

2. Se han tomado el peso en kilogramos en 30 niños, obteniéndose.


24 23 22 28 35 21 23 23 34 24 21
25 28 26 27 30 32 25 26 33 34 21
31 25 31 26 25 25 22 22
Construir una distribución de frecuencias de 5 intervalos.

3. Dada la siguiente distribución de empresas según el número de empleados se


pide:
a) Determinar el porcentaje de empresas que tienen número de empleados
entre 50 y 90
b) Determinar el porcentaje de empresas con número de empleados inferior
a 35.
Distribución de 250 Empresas según el número de empleados.
Números de empleados Frecuencia
[0,10> 5
[10,20> 20
[20,30> 35
[30,40> 40
[40,60> 50
[60,80> 30
[80,100> 20
[100,140> 20
[140,180> 15
[180,200> 15
Total 250

4. He aquí una distribución de frecuencias absolutas y relativas de los dividendos


pagados por acción por 20 compañías escogidos al azar de la lista de la bolsa de
valores de Lima. Halle los datos que faltan.
Clases fi hi
[0.00-0.10> 0.05
[0.10-0.20> 0
[0.20-0.30> 1
[0.30-0.40>
[0.40-0.50> 0.15
[0.50-0.60> 0.20
[0.60-0.70> 2
[0.70-0.80> 0.00
[0.80-0.90> 3
[0.90-1.00> 0.00

5. Al investigar el nivel socioeconómico en los valores: Bajo(B),Medio(M),


Alto(A), 20 familias dieron las siguientes respuestas.
M,B,B,M,A,B,B,M,M,B,M,B,B,A,M,B,M,A,M,B
Construir la distribución de frecuencias.

6. Se revisaron 20 lotes de 48 artículos cada uno y se encontró el siguiente número


de artículos defectuosos por lote:
3,2,5,0,1,3,2,1,0,1,3,4,2,4,4,3,4,3,2,3
Construir la distribución de frecuencias relativas y frecuencias relativas
acumuladas ¿Qué porcentaje de lotes tienen dos o más pero menos de 4 artículos
defectuosos?

7. La inversión anual, en miles de dólares, de una muestra de 40 pequeñas


empresas fueron:
31-17-27-20-28-10-34-25-40-24-15-39-18-30-41-26-12-46-18-23-36-19
29-37-33-27-27-24-26-31-25-28-33-28-22-23-31-29-35-21
a) Construir una distribución de frecuencias de 8 intervalos de clase

8. Completar la siguiente tabla de distribución de frecuencia


Yi fi Fi hi Hi %
[12-20> 5
[20- > 15
[ - 36> 20
[ > 30
[ > 20
[ > 100
Total n=

9. Se preguntó a un grupo de 30 estudiantes cuántos libros habían comprado por el


último semestre. Sus respuestas fueron:
5-6-5-5-4-5-4-5-3-6-4-4-4-6-2
9-5-4-3-3-8-11-7-8-7-4-10-4-3-6

Haga una tabla de frecuencias relativas no agrupadas.


REPRESENTACIÓN GRÁFICA

Hemos visto que la tabla estadística resume los datos que disponemos de una población,
de forma que ésta se puede analizar de una manera más sistemática y resumida. Para
darnos cuenta de un solo vistazo de las características de la población resulta aún más
esclarecedor el uso de gráficas y diagramas.

1. REPRESENTACIÓN GRÁFICA PARA VARIABLES CUALITATIVAS


Los gráficos más usuales para representar variables de tipo nominal son los
siguientes:
a) Gráfico de barras.- Se dibuja rectángulos paralelos de igual base, con
igual separación entre ellas, altura igual a las frecuencias absolutas
(relativas, porcentuales) de clase, la anchura de la separación entre
barras debe ser no mayor al de la barra, ni menor a la mitad de esta.

fi y

Yi fi
Diagramas de Barras Verticales Diagramas de Barras Horizontales

b) Gráfico de sectores o diagrama circular.-Se construye partiendo una


circunferencia en sectores proporcionales a las frecuencias absolutas
(relativas, porcentuales) de clase.
El arco de cada porción se calcula usando la regla de tres.
n ----- 360º
fi ----- X 90º CA 95 º
M
175º
C
c) Pictograma.-Son útiles para llamar la atención de todo tipo de lector, su
unidad es un pequeño dibujo que da alguna información de los datos, se
debe asignar previamente el valor que se le asigna a la unidad. Para
construir un pictograma debemos tener en cuente lo siguiente:
- Los símbolos deben explicarse por sí mismos.
- Las cantidades mayores se indica por un número mayor de
símbolos y no por símbolos más grandes.
- Los pictogramas sólo se utilizan para hacer comparaciones.
fi

Yi
2. REPRESENTACIÓN PARA VARIABLES CUANTITATIVAS.
a) Histograma.- Conjunto de rectángulos adyacentes cuya base es igual a
la amplitud de cada intervalo y la altura es igual a la respectiva
frecuencia.

fi

Yi : Intervalo de clase
b) Polígono de frecuencias.- Se dibuja los pares ordenados (xi , fi ), es
decir, pares que constan de las marcas de clase de cada intervalo y su
respectiva frecuencia, luego se unen los puntos con una línea poligonal.

fi

Marca de clase

c) Polígono de frecuencias acumuladas (ojiva).- Dibujamos en forma


similar al polígono de frecuencias considerando en el eje de las abscisas
a las clases (límites de clase) y en eje de las ordenadas las frecuencias
acumuladas.

Fi

Intervalo de clase

PRÁCTICA Nº 3
1. Los siguientes datos proporcionan las renumeraciones (en dólares) de 50
obreros.
73 47 67 82 67 70 60 67 61 80 65
70 57 85 59 70 57 73 77 58 69 58
76 67 52 68 69 66 72 86 76 79 77
88 94 67 77 54 93 56 73 64 70 46
68 63 72 84 63 74
Agrupar estos datos en una tabla de frecuencias cuyos intervalos sean de
amplitud constante.
2. Los siguientes datos son los puntajes obtenidos por 50 estudiantes en un examen
de Estadística General.
33 50 61 69 80 35 52 64 71 81 35
53 65 73 84 39 54 65 73 85 41 55
65 74 85 41 55 66 74 88 42 57 66
76 89 45 59 66 77 91 47 60 67 77
94 48 60 68 78 97
Clasificar estos datos convenientemente en intervalos de clase de la misma
amplitud.
3. Se tiene la siguiente tabla de frecuencias relativas de 300 empleados según su
edad:
Edades 19 - 21 22 - 24 25 - 27 28 - 30 31 - 33
hi 0.15 0.25 0.40 0.10 0.10

a) Obtenga una distribución de frecuencias absolutas.


b) Determine una distribución de frecuencias acumuladas.
4. En un curso de matemática que consta de 35 alumnos, en un examen
(calificación de 0 a 10 puntos) se obtuvieron los siguientes resultados.
5 5 9 6 10 6 8 6 6 8 5
9 5 9 7 10 8 6 7 7 7 8
9 7 1 6 7 6 9 9 6 10 6
8 7
Complete la siguiente tabla:
Nota Conteo fi hi Fi %
1
2
3
4
5
6
7
8
9
10
5. En una encuesta de opinión acerca de las preferencias de una marca de bebida
gaseosa por sus colores: Negro (N), Blanco(B) y Rojo (R), veinte consumidores
dieron las siguientes respuestas:
B, N, N, B, R, N, N, B, B, N
B, N, N, R, B, N, B, R, B, N
Construir la distribución de frecuencias y realizar el diagrama de barras y
diagrama circular.

6. Los ingresos quincenales en dólares de 45 personas son:


63 89 36 49 56 64 59 35 78
43 53 70 57 62 43 68 62 26
64 72 52 51 62 60 71 61 55
59 60 67 57 67 61 67 51 81
53 64 76 44 73 56 62 63 60
Construir una distribución de frecuencias de 8 intervalos y realizar un
histograma, polígono de frecuencias y su ojiva.

7. Los datos anotados en seguida representan los totales en soles, gastados en


golosinas por una muestra de 25 estudiantes durante un periodo de exámenes.
57 28 63 38 29 89 77 72 39
47 64 84 88 42 36 72 69
68 41 52 39 72 45 52 84
Realizar su histograma, su polígono de frecuencias y su ojiva.

8. Del ejercicio 2 construir los gráficos respectivos.


9. Supongamos que tenemos una relación de 200 alquileres urbanos y una relación
de 100 alquileres rurales.
a) Construya los histogramas de las dos distribuciones.
b) Con base a los histogramas discuta y compare las dos
distribuciones.
Clases de alquileres Zona Urbana Zona Rural
(Codificados)
[2,3> 10 30
[3,5> 40 50
[5,7> 80 15
[7,10> 50 5
[10,15> 20 0
Total 200 100
MEDIDAS DE TENDENCIA CENTRAL
1. Definición.-Un promedio es un valor típico o representativo de un conjunto de
datos. Como tales valores suelen situarse hacia el centro del conjunto de datos
ordenados por magnitud, los promedios se conocen como medidas de tendencia
central.
2. Características del Valor Central:
- Debe estar definido en forma objetiva
- Debe depender de toda la información obtenida en lo posible.
- Debe ser fácil de comprender y interpretar.
- Debe ser fácil de calcular.
- Debe ser estable.
- Debe ser adecuado a cálculos algebraicos posteriores.
3. Clases de Medidas.- Los promedios más usuales son:
a) La media aritmética o media
b) La mediana.
c) La moda
d) La media geométrica.
e) La media cuadrática.
f) La media armónica

a) MEDIA ARITMÉTICA: ( X )
- Datos no agrupados.- Es el cociente o división entre la sumatoria de
datos que existen y el número de datos.
N

X  X 2  ...  X N X i
x
X= 1  i 1
 Tipo I
N N N
Ejemplo 1
Sean las notas siguientes: 13 – 07 – 10 – 14 – 11 hallar la media
aritmética.
Solución:
1. Recolección
2. Orden y clasificación
Xi 07 – 10 – 11 – 13 - 14  = 55
3. Cálculo de X
X 
X 
55
 11
N 5
- Datos agrupados.- Sean X 1 , X 2 ,..., X k valores de la variable X
ponderados por sus respectivas frecuencias absolutas: f1,…,fk. La media
de la variable X es dado por:
k

f i. Xi
X  i 1
Tipo II
N

X 
 y' i fi
 TipoIII
N
Ejemplo 2
Sean el número de orden del nacimiento de los alumnos de contabilidad
III ISHDE 2007
3 2 4 4 4 4 3 2
1 1 3 1 6 2 2 4
2 2 3 4 3 3 1 2
3 1 1 3 4 2 2 1
Recolección
Orden y clasificación
Xi conteo fi Xifi
1 IIIII II 7 7
2 IIIII IIII 9 18
3 IIIII III 8 24
4 IIIII II 7 28
5 0 0
6 I 1 6
32 83

Cálculo de la X

X =
X f
i i

83
 2,59  3
N 32
Interpretación
El promedio del número de orden de nacimiento de los alumnos de
Contabilidad III ISHDE 2007 es tercer lugar.
Ejemplo 3
Sean ingresos quincenales en dólares de 45 personas son:
Yi fi y’i y’i fi

X 
 y' i fi

2702
 60.04 =
[26-34[ 1 30 30
[34-42[ 2 38 76
N 45
[42-50[ 4 46 184
Interpretación. El promedio de los ingresos
[50-58[ 10 54 540
quincenales es $ 60,04
[58-66[ 16 62 992
[66-74[ 8 70 560
[74-82[ 3 78 234
[82-90[ 1 86 86
Total 45 2702

PRÁCTICA Nº 4
1) Sean el número de hermanos de los alumnos de Administración del III semestre ISPHDE – 2011. Calcular
la media aritmética, graficar e interpretar.
8 3 6 13 4 5 7 3 6 7
9 4 3 10 5 5 5 2 0 6
8 3 5 5 5 5 4 2 5 5
2) Sea el número de hermanos de las mamas de los alumnos de Computación e informática del V semestre del
ISPHDE – 2010. Calcular la media aritmética, graficar e interpretar.
9 7 5 6 4 4 7 4 5 6 2
1 2 1 10 2 7 6 1 3 6 0
7 0 4 1 9 6 5 3 3 4
3) Sea la talla de las madres de los alumnos de contabilidad del HDE-2010. Calcular la media aritmética,
graficar e interpretar.
164 150 150 160 158 162 150 152 155 164 155
158 167 165 164 175 150 155 157 158 160 159
160 160 162 158 154 154 163 162 170 170 158
158 158 162 160 160 160 160 160 150 160 168
172 166 167 173
4) Determine la media aritmética de la distribución.
Ingreso Familiar [2,4> [4,6> [6,8> [8,10> [10,12>
Nº de familias 5 10 14 8 3

5) Los ingresos quincenales en dólares de 45 personas son:


63 89 36 49 56 64 59 35 78 43 53
70 57 62 43 68 62 26 64 72 52 51
62 60 71 61 55 59 60 67 57 67 61
67 51 81 53 64 76 44 73 56 62 63
60
Calcular la media aritmética si su distribución es 8 intervalos, graficar e interpretar
b) LA MEDIANA: (Me) Es el valor numérico o estadígrafo que divide a una
distribución en dos partes iguales.
El calculo de la mediana, podemos considerar los 3 casos siguientes:
N 1
- Caso 1: Si N es impar entonces
2
Ejemplo: Xi 10 2 6 8 4
Ordenamos: Xi 2 4 6 8 10
5 1
Hallar el centro = 3er lugar
2
Me  6

- Caso 2: Si N es par entonces, la mediana es indeterminada, pues


cualquier valor comprendido entre los valores que ocupen la posición
N N
y  1 puede ser considerado como el centro de la ordenación.
2 2
X N / 2  X N / 2 1
Me =
2
Ejemplo: Xi 2 4 6 8 10 12
N 6
Calcular   3 er lugar
2 2
N 6
 1   1  4 to lugar
2 2
6  8 14
Me   7
2 2

- Caso 3: En este caso el problema consiste en determinar un punto dentro


del intervalo en que está comprendida la mediana.
Primer paso: Calcular la posición de orden N/2. Como la variable es
contínua, no se debe preocupar si N es par o impar.
Segundo paso: Por las frecuencias acumuladas se identifica la clase que
contiene a la mediana, esto es, la clase para el cual se cumple.
N
Fk 1   Fk
2
Con lo cual la mediana estará en la clase que tiene como frecuencia
acumulada Fk.
Tercer paso: Utilizar la fórmula
 N / 2  Faa 
Me  Li   i
 f 
donde: Li = Límite inferior de la clase de la mediana.
N/2 = Número de datos entre 2
Faa = Frecuencia acumulada anterior.
f = Frecuencia de la clase de la Me
i = amplitud de intervalo.
Gráfico:
fi

y’i

Ejemplo: Sea el siguiente cuadro: Hallar la mediana y graficar


Yi (pesos) fi Fi y’i y’fi
[16-21 [ 13 13 18.5 240.5
[21-26 [ 5 18 23.5 117.5
[26-31 [ 12 30 28.5 342
[31-36 [ 22 52 33.5 737
[36-41 [ 7 59 38.5 269.5
[41-46 [ 15 74 43.5 652.5
[46-51 [ 18 92 48.5 873
N=92 3232

Hallamos el lugar céntrico: 92/2 = 46vo lugar


46vo lugar lo hallamos en la F4 = = 52, le corresponde Y4 =31-36 es el
lugar donde se encuentra la Me
Hallamos los demás términos: Li = 31; N/2 = 46; Faa=30; f = 22; i = 5

 N / 2  Faa 
Me  Li   i
 f 
Me =34,6
PRÁCTICA Nº 5

1) Sean el número de habitaciones de los hogares de los alumnos de Mecánica


Automotriz del ISPHDE.
4 6 6 4 5 6 6 7 5 5 6
8 4 9 8 6 6 7 3 6 6 8
7 9 9 8 6 7 5 4
Calcule la mediana y grafique.

2) Sea el siguiente cuadro.


Yi (pesos) fi Fi y’i y’fi
[16-21 [ 15 15 18.5 277.5
[21-26 [ 7 22 23.5 164.5
[26-31 [ 14 36 28.5 399
[31-36 [ 24 60 33.5 804
[36-41 [ 9 69 38.5 346.5
[41-46 [ 17 86 43.5 739.5
[46-51 [ 20 106 48.5 970
N= 3701
Calcule la media aritmética, mediana, grafique e interprete

3) Se talla de los profesores del instituto superior HDE – 2010


168 170 160 180 165 166 166 168 169 170 165 165
164 168 160 170 171 160 163 175 180 156 189 175
168 160 156 168 169 176 156 168 163 175 180
Calcule la media aritmética, mediana, grafique e interprete
4) Sean los ingresos quincenales en dólares de 45 personas
63 89 36 49 56 64 59 35 78 43 53 70
57 62 43 68 62 26 64 72 52 51 62 60
71 61 55 59 60 67 57 67 61 67 51 81
53 64 76 44 73 56 62 63 60
Calcular la media aritmética, mediana, grafique e intérprete, si su distribución es de 8
intervalos
c) LA MODA: (Mo) Es el valor numérico o estadígrafo que se repite el mayor
número de veces en una distribución de datos. La moda puede no existir, e
incluso no ser única en caso de existir.
Cálculo de la moda para datos agrupados en intervalos de clase
- Se identifica la clase modal (la clase con mayor frecuencia).
 1 
- Se aplica la fórmula : Mo  Li   i
 1   2 
Donde:
Li = Límite inferior de la clase modal
1 = Frecuencia modal menos frecuencia superior.
 2 = Frecuencia modal menos frecuencia inferior.
i = Amplitud de intervalo.
Ejemplo 1: Xi 2 4 6 8 10
No existe moda porque todos los datos, 30 únicos todos se repiten una vez.

Ejemplo 2:
Xi fi
0 10
1 8
2 15
3 22
4 5
El dato que se repite mayor número de veces es el 3 porque se repite 22 veces
por lo tanto la moda es 3

Ejemplo 3:
Sea la edad del hermano mayor de los alumnos de computación e informática V
del ISPHDE. Calcular la moda y graficar

Hallar la clase modal: fi = 8 entonces la clase modal es 19-21


Determinamos los elementos de la fórmula:
Li = 19
Δ1 = 8 - 0 = 8
Yi fi Fi Y’i Y’i.fi
[19-22[ 8* 8 20.5 164
Δ2 =8 – 6 = 2 [22-25[ 6 14º 23.5 141
i=3 [25-28[ 7 21 26.5 185.5
 1  [28-31[ 3 24 29.5 88.5
Mo  Li   i
 1   2  [31-34[ 2 26 32.5 65
[34-37[ 1 27 35.5 35.5
Mo = 21,4 Total 27 679.5

PRÁCTICA Nº 6
1. Dadas las siguientes mediciones de la emisión diaria (en toneladas) de óxido de
azufre de una planta industrial.
21.3 15.8 18.4 22.7 19.6 15.8 26.4 17.3 11.2 23.9 26.8
22.7 18.0 20.5 11.0 18.5 23.0 24.6 20.1 16.2 8.3 21.9
12.3 22.3 13.4 17.9 12.2 13.4 15.1 19.1
Construya una distribución de frecuencias para los datos con 6 intervalos, de
igual amplitud.
a. Dibuje el histograma y el polígono de frecuencias correspondiente.
b. Calcule la media aritmética, mediana y moda, ¿Cuál es la más
representativa?¿Por qué?

2. Dada la siguiente tabla de frecuencias:

[Intervalos> Frecuencias absolutas a. Realice un gráfico adecuado.

20-40 10 b. Determine la media aritmética

40-50 25 c. Determine el valor que divide a la

50-80 46 distribución en dos partes iguales.

80-90 9 d. Determine el valor más frecuente

90-94 10
Total 100

3. Hallar la media, mediana y la moda para los conjuntos: 3,5,2,6,5,9,5,2,8,6.


4. Dada la siguiente distribución de frecuencias
[Sueldo S/.> Nº de trabajadores
70-120 14
120-180 16
180-240 12
240-300 10
300-360 6
360-400 2
TOTAL 60

Construya un gráfico adecuado


Calcule el valor más frecuente
Determine el valor que divide a la distribución en dos partes iguales.
5. Sean los ingresos quincenales en dólares de 45 personas. Complete el cuadro,
calcule la moda y grafique
Yi fi Fi
[26 - 34[ 1
[34 – 42[ 2
[ [ 7
[ 58[ 10
[58 – 66[ 16
[66 – 74[ 41
[74 - [ 3
[82 - 90[ 45

6. Dadas las notas de los estudiantes de la carrera de mecánica Automotriz, obtenidas en el


examen de admisión del 2011 de ISPHDE, hallar su moda.
Yi fi
[30.5-40.5[ 12
[40.5-50.5[ 13
[50.5-60.5[ 10
[60.5-70.5[ 6
[70.5-80.5[ 9
[80.5-90.5[ 4
[90.5-100.5[ 6
d) Media Geométrica:
La media geométrica de n valores positivos x1,x2,…,xn es el número
X G  n x1.x2 ...xn

La media geométrica se utiliza para promediar: razones (a/b), índices (a/b en %),
proporciones (a/(a+b)), tasas de cambio (a-b)/b, que varían con el tiempo, entre
otros.
Aplicando logaritmo de base 10
n

log( x1 )  log( x2 )  ...  log( xn )  log( X ) i


log( X G )   i 1

n n
de donde resulta:
 n 
  log( xi ) 
X G  anti log  i 1 
 n 
 
 
e) Media Armónica:
La media armónica de n valores no nulos x1 , x2 ,…,xn es el número, X H que se
define como el recíproco de la media aritmética de los recíprocos de esos n
valores.
n
Esto es, X H  n
1
x i 1 i

La media armónica se utiliza para obtener promedios de valores que están en


relación inversa como la velocidad y el tiempo. En general, se usa para obtener
el promedio de un conjunto de valores expresados en forma de tasas de unidades
de un tipo por unidades de otro tipo (por ejemplo Km/h).
La media armónica es siempre menor que la media geométrica. Esta a su vez es
menor que la media aritmética. Esto es,
XH  XG  X
f) Media Cuadrática:
La media cuadrática (MQ) de un conjunto de números x 1, x2,…,xN s suele
N

X
2

denotar por X
2
y se define como MQ =
2
X = i 1
i
=
X 2

N N
CUANTILES

Son consecuencia del estudio de la mediana. Los cuantiles más usados son los cuartiles,
deciles y percentiles.
1. Cuartiles (Qr): dividen al conjunto de datos ordenados en cuatro partes iguales
y en 3 cuartiles.
0% 100%
25% Q1 25% Q2 25% Q3 25%

Una vez determinado la clase cuartílica, para lo cual empleamos rN/4, los
cuartiles se obtienen por medio de la fórmula:
 rN 
  Faa 
Qr  Li   4 i , r = 1, 2, 3
 f 
 
 

2. Deciles (Dr): Dividen al conjunto de datos ordenados en 10 partes iguales y en 9


deciles, para su obtención, determinamos la clase decílica, empleando rN/10 y
luego usamos la fórmula:
 rN 
  Faa 
Dr  Li   10 i , r = 1,2,…,9
 f 
 
 

3. Percentiles (Pr): Dividen al conjunto de datos ordenados en 100 partes iguales y


en 99 percentiles. Para obtener los percentiles, una vez determinado la clase
percentílica, empleando rN/100, hacemos uso de la fórmula:
 rN 
  Faa 
Pr  Li   100 i , r = 1, 2,…,99
 f 
 
 

Ejemplo: Sea el siguiente cuadro.


Hallar el Q1 , P50 , D8
Yi = Peso fi Fi
12 - 14 6 6
15 - 17 7 13
18 - 20 9 22
21 - 23 2 24
24 - 26 5 29
27 - 29 4 33
30 - 32 15 48
33 - 35 3 51
36 - 38 8 59
39 - 41 1 60
Solución:
N/4 = 60/4 = 15
 60 
  13 
Q1  18   4 3
 9 
 
 
2
Q1  18   3  18  0.67  18.67
9

50N/100 = N/2 = 30
 30  29 
P50  27   3
 4 
3
P50  27     27  0.75  27.75
4

8N/10 = 4N/5 = 48
 48  33 
D8  30   3
 4 
 15 
D8  30   3  30  11.25  41.25
4
PRÁTICA Nº 5

1. De la tabla anterior hallar Q3 ,P75 ,D9.


2. Halla la media geométrica de los números: a) 4.2 y 16.8 y b) 3.00 y 6.00
3. Hallar la media geométrica de los conjuntos:
a) 3, 5, 8, 3, 7, 2
b) 28,5; 73,6; 47,2; 31,5; 64,8
4. Hallar la media geométrica de la distribución. Verificar que la media geométrica
es menor igual que la media aritmética.
Xi fi
462 98
480 75
498 56
516 42
534 30
552 21
570 15
588 11
606 6
624 2

5. Hallar (a) la media aritmética, (b) la media geométrica y (c) la media armónica
de los números 0, 2, 4 y 6
6. Hallar la media cuadrática de los números: 2.7; 3.8; 3.2 y 4.3.
7. La tabla muestra una distribución de frecuencias de puntuaciones de un examen
final del álgebra. (a) Hallar los cuartiles de la distribución, (b) interpretar su
significado y c) Hallar D8 , P30
Grado Número de estudiantes
90-100 9
80-89 32
70-79 43
60-69 21
50-59 11
40-49 3
30-39 1
MEDIDAS DE DISPERSIÓN O CONCENTRACIÓN

1. Introducción.
Las medidas de tendencia central no son suficientes para describir un conjunto de
valores de alguna variable estadística. Los promedios determinan el centro, pero
nada indican acerca de cómo están situados los datos respecto al centro.
En primer lugar se necesita una medida del grado de dispersión o variabilidad con
respecto al centro con la finalidad de ampliar la descripción de los datos o de
comparar dos o más series de datos.
En segundo lugar se necesita una medida del grado de asimetría o deformación en
ambos lados del centro de una serie de datos, con el fin de describir la forma de la
distribución de los datos. Esta medida se denomina índice de asimetría.
En tercer lugar se necesita una medida que nos permita comparar en apuntamiento
o curtosis de distribuciones simétricas con respecto a la distribución simétrica
normal. Esta medida se denomina índice de apuntamiento o curtosis.

2. Definición.
Las medidas de dispersión son los que cuantifican el grado de concentración o
dispersión de los valores de la variable en torno de un promedio o valor central de
la distribución. Las medidas de dispersión se necesitan para dos propósitos:
- Para verificar la confiabilidad de los promedios
- Para que sirva como base para el control de la variación misma
- También podemos decir que los términos concentración y dispersión
pueden ser utilizados indistintamente, pues se da la relación:
Homogéneas: < dispersión Heterogéneas: > dispersión
> concentración < concentración
3. Clases de medidas
El rango
Rango intercuartil y rango semiintercuartil
Desviación media
Varianza
Desviación estándar
Coeficiente de la variabilidad
 El rango.- El rango de variación o recorrido, R, de una serie de datos, es la
diferencia entre sus valores máximo y mínimo. Esto es,
R  X max  X min

Siendo X max el valor máximo y X min el valor mínimo.


El rango es una medida de dispersión muy fácilmente calculable, pero es
muy inestable, ya que depende únicamente de los dos valores extremos. Su
valor puede cambiar grandemente si se añade o elimina un solo dato. Por
tanto su uso es muy limitado.
Por ejemplo, dadas las dos series de datos
1, 4, 4, 5, 5, 5, 5, 6, 6, 9
1, 2, 3, 4, 5, 6, 7, 8, 9
Ambas series tienen la misma media, 5, y el mismo rango, 8, pero las dos
series no tienen la misma dispersión, ya que la segunda tiene mayor
variabilidad.
El empleo del rango como medida de comparación de variación puede
estar justificado cuando se precise rápidamente de una medida de
dispersión y no haya tiempo de calcular algunas de las otras.
 Rango Intecuartil.- (RI) es la diferencia entre sus cuartiles tercero y
primero. Esto es, RI  Q3  Q1
El rango intercuartil es una medida que excluye el 25% más alto y el 25%
más bajo, dando un rango dentro del cual se encuentra el 50% central de
los datos observados y a diferencia del rango total no se encuentra afectada
por los valores extremos. Si el rango intercuartil es muy pequeño entonces
describe alta uniformidad o pequeña variabilidad de los valores centrales.
Por ejemplo:
Si en una distribución de frecuencias de 100 ingresos quincenales se
encuentran los cuartiles Q1  62$, y Q·3  70$, entonces, el rango
intercuartil es:
RI  Q3  Q1

RI  $70  $62  8
Esto, indica que el 50% de los ingresos quincenales de los 100 empleados
varía dentro del valor $ 8.
 Rango semiintercuartil.-(RSI), es igual al rango intercuartil dividido por
Q3  Q1
2. RSI 
2
El rango semiintercuartil se puede asociar con la mediana y se puede
expresar en función de ella. Si una distribución es normal los cuartiles Q1 y
Q3 son equidistantes de la mediana. Se deduce entonces, que el rango
intercuartil y la mediana  RSI, son la misma distancia. Además, como
exactamente el 50% de los datos se encuentra en el rango intercuartil,
entonces, el intervalo: mediana  RSI contiene también exactamente el
50% de los datos. Si la distribución es asimétrica, el intervalo: mediana 
RSI contendría aproximadamente el 50% de los datos.
Ejemplo:
Si la distribución de los 100 ingresos quincenales donde Q1= $ 62 y Q3=$
70, el rango semiintercuartil es $ 4. Si la mediana fuera igual al $ 66,
entonces, aproximadamente el 50% de los datos se hallan comprendidos en
el intervalo $ 66  4.
 La Desviación Media.-(DM) La desviación media o desviación promedio,
es simplemente la media aritmética de los valores absolutos de las
desviaciones de todos los valores en relación con algún punto central, tal
como la media o la mediana. Formalmente tenemos la siguiente definición.
Definición: Sean x1 , x2 ,…,xk valores de la variable x, con frecuencias
absolutas f1,…,fk, respectivamente. La desviación media de x respecto a un
k

f i xi  p k
promedio p es dado por: DM  i 1
donde N   f i
N i 1

La fórmula para la desviación con respecto a la media aritmética es:


k

 xi  x
DM  i 1
I Donde:
N Xi = datos
k fi = frecuencia absoluta
f i xi  x N = total de datos
DM  i 1
II X = media aritmética
N y’i = marca de clase
k

f i y 'i  x
DM  i 1
III
N
k

f i xi  Me
y con respecto a la mediana es: DM  i 1

N
Ejemplo 1:
Dadas las notas de seis estudiantes, calcular su desviación media. 14, 11, 7,
10, 14, 20
k

 xi  x
DM  i 1

𝟏𝟒+𝟏𝟏+𝟕+𝟏𝟎+𝟏𝟒+𝟐𝟎 𝟕𝟔
X= = = 𝟏𝟐, 𝟔
𝟔 𝟔

|14−12,6|+|11−12,6|+|7−12,6|+|10−12,6|+|14−12,6|+|20−12,6|
𝐷𝑀 =
6

2,6 + 1,4 + 5,6 + 2,6 + 1,4 + 7,4 21


𝐷𝑀 = = = 3,5
6 6
Interpretación:
Los valores observados se dispersan en 3,5 puntos de su media aritmética.

Ejemplo 2:
Sean el número de habitaciones de los hogares de los alumnos de
Mecánica de Producción del ISHDE -2012. Hallar la desviación media.
k

f i xi  x
DM  i 1

Calcular la media aritmética


k

f i. Xi
186
X  i 1
= 30 = 6.2
N

Después se completa la tabla de distribución de frecuencias:


Xi fi fi.Xi 𝑋̅ |𝑋𝑖 − 𝑋̅| 𝑓𝑖|𝑋𝑖 − 𝑋̅|
3 1 3 6.2 3.2 3.2
4 4 16 2.2 8.8
5 4 20 1.2 4.8
6 10 60 0.2 2
7 4 28 0.8 3.2
8 4 32 1.8 7.2
9 3 27 2.8 8.4
Total 30 186 37.6

Reemplazamos los valores, en la formula de desviación media:

37.6
𝐷𝑀 = = 1.25
30

Interpretación:
Los valores observados se dispersan en 1.25 puntos de su media aritmética.

Ejemplo 3:
La siguiente tabla de distribución de frecuencia muestra los promedios
finales obtenidos por los estudiantes, en estadística general. Hallar la
desviación media.
k

f i y 'i  x
DM  i 1

N
Primero se calcula la media aritmética:

X 
 y' i fi

624
 12
N 52

Después se completa la tabla de distribución de frecuencias:


Yi fi Y’i Y’i.fi 𝑋̅ |𝑦 ′ 𝑖 − 𝑋̅| 𝑓𝑖|𝑦 ′ 𝑖 − 𝑋̅|
[0-2[ 4 1 4 12 11 44
[2-4[ 0 3 0 9 0
[4-6[ 0 5 0 7 0
[6-8[ 5 7 35 5 25
[8-10[ 2 9 18 3 6
[10-12[ 0 11 0 1 0
[12-14[ 28 13 364 1 28
[14-16[ 10 15 150 3 30
[16-18[ 2 17 34 5 10
[18-20[ 1 19 19 7 7
total 52 624 150

Reemplazamos los valores en la formula de desviación media:


150
𝐷𝑀 = = 2.88
52

Interpretación:
Los valores observados se dispersan en 2.88 puntos de su media aritmética.

 Varianza.- (Var ó S2) es una medida que cuantifica el grado de dispersión


o de variación de los valores de una variable cuantitativa con respecto a su
media aritmética. Si los valores tienden a concentrarse alrededor de su
media, la varianza será pequeña. Si los valores tienden a distribuirse lejos
de la media, la varianza será grande.
La varianza calculada a partir de una muestra será denotada por S2 y
referida a una población se denotará  2 .
Definición: La varianza se define como la media aritmética de los
cuadrados de las diferencias de los datos con respecto a su media
aritmética.
La varianza es una medida de dispersión con unidades de medición al
cuadrado, por ejemplo, km2.
 Desviación estándar.- (S) es la raíz cuadrada positiva de la varianza. La
desviación estándar calculada a partir de una muestra se denotará por S y
referida a la población por 
 Coeficiente de variabilidad.- (CV) Es otros de las medidas de dispersión
que sirve para determinar la homogeneidad o heterogeneidad del grupo o
serie estadística que se analiza. Su valor se da en términos de porcentajes.
El valor del CV obtenido, se compara con el valor convencional de 33%
que indica el límite de homogeneidad o heterogeneidad. Si el valor del CV
es menor que el 33% se dice que el grupo es más homogéneo. Si el valor
del CV es mayor que el 33% se dice que el grupo es más heterogéneo.

CUADRO RESUMEN
Medida Símbolo Tipo I Tipo II Tipo III
Rango R R = Xmax - Xmin
Desviación media DM

D 
Df i

Df i

N N N
Varianza S2

D 2


D 2
fi

D 2
fi
N N N
Desviación estándar S

D 2

D 2
fi

D 2
fi
N N N
Coeficiente de CV S S S
  100   100   100
variabilidad x x x
PRÁCTICA Nº 6

1. Dada la distribución de frecuencias de 150 personas según su edad, calcule la


desviación estándar.
Edad [20,30[ [30,40[ [40,50[ [50,60[ [60,70[
Nº de personas 15 22 48 40 25

2. En una empresa, el salario medio de los hombres es de S/. 4000 con una desviación
estándar de S/.1500 y el de las mujeres es un promedio de S/. 3000 con una
desviación estándar de S/. 1200. Hallar el coeficiente de variación de los salarios de
los hombres y mujeres.
3. Dada la siguiente distribución de frecuencias de datos discretos:
Xi fi
1200 16 - Determine la varianza.
- Calcule la desviación típica
1400 23
1600 17
1800 41
2000 32
2200 21
Total 150

4. Encontrar la desviación simple para los obreros: 3,6,5,10 y 6


5. Los pesos de dos grupos de alumnos de una I.E. externos e internos son los
siguientes: Externos : 50,52,60,58,61,50,57,58,53,59,61,60 kg
Internos: 51,61,50,62,59,64,58,59,54,53,61,58,64 kg
Determine en cual de los grupos, el peso es más uniforme, o sea, donde los datos
son menos dispersos.
6. Hallar la desviación media para los siguientes datos.
Pesca (Tn) 200-224 225-249- 250-274- 275-299 300-324 325-349 350-374
Número de lanchas pesadas 26 31 39 52 30 24 14

7. En una prueba de Probabilidad y Estadística aplicada a 20 alumnos, se obtuvo la


siguiente distribución de puntos:
Puntos [35,45[ [45,55[ [55,65[ [65,75[ [75,85[ [85,95[
Nº de 1 3 8 3 3 2
alumnos

a. Calcular la desviación media


b. Determinar las desviación estándar
c. Calcular el coeficiente de variación. Interprete
8. Se tiene la siguiente información sobre una distribución de frecuencias de 50
elementos de un material sometido a prueba de rotura (en Kg/cm2) Los intervalos
tienen la misma amplitud igual a 20.
Intervalo Y’i fi Fi fi .Y’i
10 300
18 400
23 350
17
[ ,120[ 4 440
50
Total
Determinar la media, desviación estándar y el coeficiente de dispersión

9. La siguiente distribución corresponde al salario mensual de obreros de una empresa:


Intervalos de clase frecuencias
[3000-3500[ 80
[3500-4000[ 120
[4000-4500[ 132
[4500-5000[ 97
[5000-5500[ 86
[5500-6000[ 75
[6000-6500[ 53
[6500-7000[ 37
Se pide calcular:
La media aritmética, la mediana y la moda
La desviación estándar y la desviación media en función de la mediana

También podría gustarte