Histogramas
Histogramas
• Un histograma es un gráfico o diagrama que
muestra el número de veces que se repiten
cada uno de los resultados cuando se realizan
mediciones sucesivas.
• Esto permite ver alrededor de que valor se
agrupan las mediciones (Tendencia central) y
cual es la dispersión alrededor de ese valor
central.
• Supongamos que un médico dietista
desea estudiar el peso de personas
adultas de sexo masculino y recopila
una gran cantidad de datos midiendo
el peso en kilogramos de sus
pacientes varones:
• Así como están los datos es muy difícil sacar
conclusiones acerca de ellos.
• Entonces, lo primero que hace el médico
es agrupar los datos en intervalos
contando cuantos resultados de
mediciones de peso hay dentro de cada
intervalo (Esta es la frecuencia).
• Por ejemplo, ¿Cuántos pacientes pesan
entre 60 y 65 kilos? ¿Cuántos pacientes
pesan entre 65 y 70 kilos?:
Ahora se pueden representar las frecuencias en un
gráfico como el siguiente:
• Por ejemplo, la tabla nos dice que hay 48
pacientes que pesan entre 65 y 70 kilogramos.
Por lo tanto, levantamos una columna de
altura proporcional a 48 en el gráfico:
Y agregando el resto de las frecuencias nos queda el
histograma siguiente:
• ¿Qué utilidad nos presta el histograma?
Permite visualizar rápidamente
información que estaba oculta en la tabla
original de datos.
• Por ejemplo, nos permite apreciar que el
peso de los pacientes se agrupa
alrededor de los 70-75 kilos.
• Esta es la Tendencia Central de las
mediciones.
• Además podemos observar que los pesos
de todos los pacientes están en un rango
desde 55 a 100 kilogramos.
• Esta es la Dispersión de las mediciones.
• También podemos observar que hay muy
pocos pacientes por encima de 90
kilogramos o por debajo de 60
Kilogramos
• Ahora el médico puede extraer
toda la información relevante de
las mediciones que realizó y
puede utilizarlas para su trabajo
en el terreno de la medicina.
FORMAS DE UN
HISTOGRAMA.
La forma de un histograma depende de la distribución de las frecuencias
absolutas de los datos. Algunas de las formas más comunes que puede adoptar
un histograma son las siguientes:
Ejemplo
• Se desea conocer el ingreso mensual
promedio del asentamiento GALAPAGOS.
• La variable x1 será ingresos mensuales
expresadas en pesos.
• Para tal efecto se ha seleccionado una
muestra de 50 familias y se han obtenido los
siguientes datos:
N° fam Xi N° fam Xi N° fam Xi3 N° fam Xi
1 730 14 590 27 870 40 350
2 750 15 550 28 550 41 320
3 580 16 700 29 710 42 830
4 430 17 600 30 750 43 890
5 490 18 700 31 700 44 650
6 650 19 380 32 400 45 450
7 670 20 600 33 610 46 750
8 750 21 450 34 750 47 640
9 510 22 750 35 690 48 930
10 970 23 730 36 540 49 850
11 820 24 650 37 720 50 630
12 650 25 760 38 780
13 890 26 500 39 850
PROCEDIMIENTO
1. Se calcula el rango (R):
R= Mayor valor de xi-menor valor de xi
R= x10-x41= 970-320= 650
2. Se obtiene el número de clases e
intervalos, para tal efecto se utiliza
la regla de sturges:
tamaño de la muestra Regla de Sturges
m= 1+3.322*log n
• En este caso es n< 100, entonces:
• m= 1+3.322*log50
• m=6.64≈7 intervalos
3. El tamaño de clase (c) sería: C= R/m
C= 650/7= 92.8≈ 93
4. Construir la tabla de frecuencias, donde:
i= es el número de intervalos
Xi= intervalo de clase inferior
Xs= intervalo de clase superior
fi= repetición de los datos en determinado intervalo de
clases en valores absolutos (familias).
Fi=muestra la acumulación progresiva de las
frecuencias absolutas.
hi= expresa a las frecuencias relativas (%)
Hi= Acumulación progresiva de las frecuencias relativas.
tabla de frecuencias:
Frecuencias Frecuencias
Intervalo de clase Absolutas Relativas
i Marca
de Clase
Xi Xs fi Fi hi Hi
1 320 413 366.5 4 4 8% 8%
2 413 506 459.5 5 9 10% 18%
3 506 599 552.5 6 15 12% 30%
4 599 692 645.5 11 26 22% 52%
5 692 785 738.5 15 41 30% 82%
6 785 878 831.5 5 46 10% 92%
7 878 971 924.5 4 50 8% 100%
total 50 100%
5. Dibujar el histograma:
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
0 413 506 599 692 785 878 971
320 413 506 599 692 785 878
Ejercicio 2
• En un proceso de inyección de plástico una
característica de calidad del producto (disco) es su
grosor, que debe ser de 1.20 mm con una
tolerancia de +- 0.10 mm.
• Para considerar que el proceso de inyección fue
satisfactorio, el grosor del disco debe estar entre la
especificación inferior, EI = 1.10 y la superior, ES =
1.30. En un estudio de capacidad para este proceso
es necesario contestar las siguientes interrogantes:
¿qué tipo de discos en cuanto a grosor se están
produciendo?, ¿El grosor medio es adecuado? ¿La
variabilidad del grosor es mucha o poca?
• Para contestar estas preguntas, durante una
semana se obtuvieron de una línea de
producción los 125 datos de la tabla 2.1. El
muestreo fue sistemático: cada determinado
tiempo se tomaban cinco productos y se
medían y al final de la semana se tuvieron los
datos referidos. A continuación se analizarán
estos datos por medio de diferentes
estadísticos.
• Numero de intervalos:
1+3.322*log(125)=7.9≈8
• Rango: 1.26-1.10= 0.16 (Variación del
conjunto de datos)
• A=R/N= 0.16/8= 0,02
Frecuencias Frecuencias
Intervalo de clase Absolutas Relativas
Marca
i de Clase
Xi Xs fi Fi hi Hi
1 1.10 1.12 3
2 1.12 1.14 8
3 1.14 1.16 26
4 1.16 1.18 34
5 1.18 1,20 39
6 1.20 1.22 9
7 1.22 1.24 5
8 1.24 1.26 1
total 125 100%
Cálculo de los límites del proceso
• Limite real inferior (LRI)= µ-3 α
• Limite real superior (LRS)= µ+3 α
• Donde µ es la media del proceso y α es la
desviación estándar del proceso.
LIMITES
• µ= 1.179
• α= 0.027
• LRI= 1.179- 3 (0.027)= 1.098
• LRS= 1.179+ 3 (0.027)= 1.260
• Estos limites se comparan con las especificaciones
del producto, el LRI no debe estar bajo la
especificación inferior y el LRS no debe estar sobre
la especificación superior.
LIMITES
• En este caso las especificaciones son:
• Inferior=1.10 y superior=1.30
• Se observa que LRI< EI, es baja capacidad del
producto para cumplir las especificaciones.
• El LRS<ES, en este caso si se cumplen las
especificaciones.
LRI= 1.098 LRS= 1.260
EI= 1.1 ES= 1.30
Datos Estadísticos adicionales
• Media=
• Mediana=1.18
• Moda= 1.17
• Desviación estándar=
• Varianza muestral= 0.0007
• Coeficiente de Variación= 2.29%
Conclusiones
• El proceso se encuentra moderadamente
descentrado a la izquierda.
• Se aprecia una tendencia central de los datos
alrededor de 1.18, la distribución tiene forma
similar a una campana.
• El grosor de los discos no es satisfactorio, se debe
mejorar el centrado.
• Se deben calcular los limites reales inferior y
superior y compararlos con las especificaciones.
Conclusiones
• Analizar los cálculos de la desviación estándar
y de la media del proceso, así como la
mediana y la moda.
• Hallar el Coeficiente de Variación que es igual
a la magnitud relativa de la desviación
estándar en comparación con la media de los
datos. (Variación porcentual de una variable).
EJERCICIO
• CONSTRUYA EL HISTOGRAMA