.
APLICACIN DE HISTOGRAMAS
En estadstica, un histograma es una representacin grfica de una variable en forma de barras,
donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. En
el eje vertical se representan las frecuencias, y en el eje horizontal los valores de las variables,
normalmente sealando las marcas de clase, es decir, la mitad del intervalo en el que estn
agrupados los datos.
Se utilizan para variables continuas o para variables discretas, con un gran nmero de datos, y que
se han agrupado en clases.
En trminos matemticos, puede ser definida como una funcin inyectiva (o mapeo) que acumula
(cuenta) las observaciones que pertenecen a cada subintervalo de una particin. El histograma,
como es tradicionalmente entendido, no es ms que la representacin grfica de dicha funcin.
Se utiliza cuando se estudia una variable continua, como franjas de edades o altura de la muestra,
y, por comodidad, sus valores se agrupan en clases, es decir, valores continuos. En los casos en
los que los datos son cualitativos (no-numricos), como sexto grado de acuerdo o nivel de
estudios, es preferible un diagrama de sectores.
Los histogramas son ms frecuentes en ciencias sociales, humanas y econmicas que en ciencias
naturales y exactas. Y permite la comparacin de los resultados de un proceso.
TIPOS DE HISTOGRAMA
Diagramas de barras simples
Representa la frecuencia simple (absoluta o relativa) mediante la altura de la barra la cual
es proporcional a la frecuencia simple de la categora que representa.
Diagramas de barras compuesta
Se usa para representar la informacin de una tabla de doble entrada o sea a partir de dos
variables, las cuales se representan as; la altura de la barra representa la frecuencia
simple de las modalidades o categoras de la variable y esta altura es proporcional a la
frecuencia simple de cada modalidad.
Diagramas de barras agrupadas
Se usa para representar la informacin de una tabla de doble entrada o sea a partir de dos
variables, el cual es representado mediante un conjunto de barras como se clasifican
respecto a las diferentes modalidades.
Polgono de frecuencias
Es un grfico de lneas que de las frecuencias absolutas de los valores de una distribucin
en el cual la altura del punto asociado a un valor de las variables es proporcional a la
frecuencia de dicho valor.
Ojiva porcentual
Es un grfico acumulativo, el cual es muy til cuando se quiere representar el rango
porcentual de cada valor en una distribucin de frecuencias.
En los grficos las barras se encuentran juntas y en la tabla los nmeros
poseen en el primer miembro un corchete y en el segundo un parentesis, por
ejemplo: [10-20).
CONSTRUCCION DE HISTOGRAMAS
Paso 1
Determinar el rango de los datos. Rango es igual al dato mayor menos el dato menor.
Paso 2
Obtener los nmeros de clases, existen varios criterios para determinar el nmero de clases (o
barras) -por ejemplo la regla de Sturgess-. Sin embargo ninguno de ellos es exacto. Algunos
autores recomiendan de cinco a quince clases, dependiendo de cmo estn los datos y cuntos
sean. Un criterio usado frecuentemente es que el nmero de clases debe ser aproximadamente a
la raz cuadrada del nmero de datos. Por ejemplo, la raz cuadrada de 30 ( nmero de artculos)
es mayor que cinco, por lo que se seleccionan seis clases.
Paso 3
Establecer la longitud de clase: es igual al rango dividido por el nmero de clases.
Paso 4
Construir los intervalos de clases: Los intervalos resultan de dividir el rango de los datos en
relacin al resultado del PASO 2 en intervalos iguales.
Paso 5
Graficar el histograma: En caso de que las clases sean todas de la misma amplitud, se hace un
grfico de barras, las bases de las barras son los intervalos de clases y altura son la frecuencia de
las clases. Si se unen los puntos medios de la base superior de los rectngulos se obtiene el
polgono de frecuencias.
El histograma de una imagen representa la frecuencia relativa de los niveles de gris de la imagen.
Las tcnicas de modificacin del histograma de una imagen son tiles para aumentar el contraste
de imgenes con histogramas muy concentrados.
EJEMPLOS:
Todas las clases tendrn el mismo intervalo.
No habr solapamiento entre distintas clases.
La amplitud aproximada del intervalo se halla dividiendo el recorrido por el
nmero de clases.
Esta amplitud se redondea posteriormente a un nmero o cifra decimal
conveniente para el manejo de las clases y la graduacin del eje horizontal del
Histograma (1, 2, 5, 10, etc).
En el ejemplo de los paquetes de caf hay 120 datos, necesitamos entonces
aproximadamente 8 clases para el histograma.
Amplitud aproximada de cada clase 15gr./8=1.875 grs.
Amplitud elegida como conveniente en este caso: 2 grs.
Los lmites de la primera clase incluirn el valor mnimo de los datos.
Para evitar que algunos datos coincidan con los lmites de los intervalos, definir
stos de forma que tengan una cifra ms detrs de la coma.
Si, por ejemplo, los datos tienen dos cifras detrs de la coma (3,55; 3,83;
3,64; 3,73; 3,78, etc), se definirn las clases hasta la tercera cifra detrs de la
coma (3,545-3,555; 3,555-3,565, etc).
Si se obtiene una clase ms o menos respecto del nmero recomendado, debido
al redondeo posteriormente efectuado, no existe deterioro ni en la sencillez ni
en la informacin.
Determinar el nmero de datos que estn incluidos en cada una de las clases
(frecuencia de clase).
El recuento se har de la siguiente forma:
Empezar con el primer dato de la lista e identificar la clase en la cual est
incluido. Sealar para dicha clase, un "palote". Repetir el mismo proceso para
cada dato del conjunto.
Para facilitar el recuento final se dibujan los "palotes" en grupos de cinco,
cuatro verticales y el quinto cruzndolos. La suma de los "palotes" marcados
para cada clase corresponde a la frecuencia de la misma.
Comprobar que el nmero total de datos es igual a la suma de las frecuencias
de cada clase.
Cuando proceda, poner el ttulo, las condiciones en que se han recogido los
datos, los lmites de tolerancia nominales, etc. Estas notas ayudan a los dems
a interpretar el grfico y sirven de recordatorio de la fuente de los datos.
*Resultados de las mediciones del contenido de caf (120 paquetes medidos)
INTERPRETACIN
Uno de los propsitos del anlisis o interpretacin de un Histograma es
identificar y clasificar la pauta de variacin del conjunto de datos estudiado
(valor medio, recorrido, forma) y elaborar una explicacin admisible y
relevante para dicha pauta, que relacione la variacin con el proceso o
fenmeno en estudio.
El resultado de este anlisis es una teora sobre el funcionamiento del proceso
o sobre la causa del problema que se est investigando.
Por ser una teora es necesario confirmarla o rechazarla, recogiendo otros
datos que nos den informacin ms especfica sobre dicha teora.
EJEMPLO 2:
Una empresa se interesa en el ancho de bloques de madera y ha tomado 100 muestras de
la operacin de corte. Los datos han sido agrupados en intervalos o rangos y se muestran
en el siguiente cuadro:
Del cuadro se puede apreciar que de las 100 muestras de bloques de madera 5 miden de 2 a
13 centsimas de pulgada, 10 miden de 14 a 25 centsimas de pulgada, etc. El mayor nmero
de bloques de madera (34) miden de 28 49 centsimas de pulgada. Podemos representar
grficamente esta informacin a travs del siguiente histograma de frecuencia en el cual la
altura de cada barra indica la frecuencia de las observaciones en ese intervalo.
EJEMPLO 3:
RALLADURAS EN TABLEROS PARA MESA
A continuacin se presenta la informacin tomada de 40 tableros para mesas de
vidrio, los cuales presentan defectos de ralladura. Datos recolectados en 40 muestras:
EJEMPLO 4:
Largas colas en las taquillas de una estacin
Situacin
En una estacin se constituy un equipo para examinar las quejas de los
clientes sobre la lentitud en la venta y las largas colas en las horas punta.
El equipo midi los tiempos de las transacciones de 4 empleados durante
una hora punta tpica y construy con los datos obtenidos el siguiente
histograma:
DATOS:
HISTOGRAMA:
El histograma muestra claramente una distribucin con 2 picos. En
consecuencia el equipo formul la teora de que haba 2 procesos en
marcha.
La primera fue que los empleados nuevos eran simplemente ms lentos
que los ms experimentados pero los histogramas estratificados por
empleados mostraron la misma distribucin con 2 picos. Fuera cual fuera la
experiencia.
En otras palabras, la estratificacin por nivel de experiencia no sirvi para
separar los datos en 2 distribuciones en campaas distintas.
ESTRATIFICACION POR EMPLEADO:
EJEMPLO 5:
Una empresa de sistemas informticos estaba siendo sobrepasada por sus
competidores que eran capaces de desarrollar un sistema y entregarlo al
cliente en un promedio de 60 das, mientras que el promedio de la
empresa era
de 90 das.
El desarrollo de un sistema se realizaba en varios pasos y para cada uno de
ellos existan estndares para los tiempos nominales y mximos.
Pero el sistema no funcionaba: aunque no se haba dado ningn caso en
que un
equipo rebasara los estndares globales para su paso, el tiempo global
medio
era todava 30 das mayor que la meta de 60 das que los estndares se
proponan.
Un equipo de mejora de la calidad recopil los datos referentes a todos los
sistemas desarrollados para clientes el ao anterior y empez
construyendo histogramas de los tiempos empleados en cada paso.
La figura siguiente muestra la distribucin de los tiempos para 4 de los
pasos del proceso:
La interpretacin y conclusiones del equipo se resumen a continuacin:
PASO (A) Un grupo bien conducido en que el trabajo progres sin
brusquedades hacia su terminacin.
PASO (B) Un directivo o grupo moroso.
Un anlisis ulterior revel que aunque el trabajo se terminaba alrededor
del
tiempo fijado, (tiempo nominal), el equipo no lo entregaba hasta el ltimo
momento posible, por temor a tomar una decisin equivocada.
PASO (C) La forma plana de esta distribucin indica que el grupo tiene en
curso una gran variedad de procesos.
Un anlisis ulterior revel que la cantidad de trabajo que este grupo deba
invertir variaba mucho de una persona a otra y de cliente a cliente. No
haba
procesos estndar en el grupo ni una formacin organizada para el nuevo
personal.
Cada uno trabajaba en el desarrollo del sistema a su manera.
Se form un equipo de mejora de la calidad para el examen de los
procesos de
trabajo de este paso, con el fin de reducir su variabilidad.
El segundo pico, justo dentro del lmite mximo, tiene una explicacin
interesante: la distribucin en realidad rebasaba en un cierto nmero de
das el
lmite mximo. Pero cuando esto ocurra el supervisor del grupo registraba
una
fecha de terminacin justo en el lmite mximo, para no tener que dar
explicaciones por el retraso.
PASO (D) En este paso existan 2 procesos distintos, segn el tipo de
sistema. El grupo centr las acciones de mejora en aquellas circunstancias
que llevaban a tiempos globales mayores.
L as calificac io ne s de 50 alum no s e n Mate m ticas han sido las
siguie n te s:
5, 2, 4, 9, 7, 4, 5, 6, 5, 7, 7, 5, 5, 2, 10, 5, 6, 5, 4, 5, 8, 8, 4, 0,
8, 4, 8, 6, 6, 3, 6, 7, 6, 6, 7, 6, 7, 3, 5, 6, 9, 6, 1, 4, 6, 3, 5, 5,
6, 7.