UNIVERSIDAD TECNOLÓGICA NACIONAL
Facultad Regional Resistencia
Trabajo Práctico en R
Cátedra: Probabilidad y Estadística
Carrera: Ingeniería Química
Docentes: Broner, Diana Victoria
Cáceres, Mariel
Alumnas: Cerrutti, Lourdes y Galarza, Romina
Tema: Descriptiva y Regresión lineal Simple
Año 2020
CASO 1:
probabilidad y estadistica UTN-FRRE
En la etapa de pintado en una fábrica de cueros se tiene tres máquinas que realizan el
rociado de pintura, que trabajan los tres turnos, mañana, tarde y noche. Las cantidades
de cueros procesados por turno y por máquina y las horas que trabaja cada máquina se
observan en la hoja “datos” del archivo Excel. El supervisor del área quiere analizar las
cantidades de cueros que se procesan por máquina, y las horas trabajadas por turno con
el fin de controlar y comparar los turnos y máquinas. Organice y resuma los datos para
poder analizarlos utilizando el programa R. Utilice resúmenes por grupo, gráficos de
barras, histogramas, diagramas de cajas y cálculo de medidas de posición y dispersión.
Realice un informe que demuestre su análisis objetivo a partir de los resultados
obtenidos.
CASO 2
Un técnico de laboratorio debe realizar mediciones de absorbancia en un
espectrofotómetro a distintas muestras de cromo (como Cr 2O7-2, en solución ácida).
Primeramente debe realizar una calibración del instrumento basada en la ley de Beer.
Para ello mide 4 muestras con distintas concentraciones de cromo a distintas longitudes
de onda. Los valores se muestran en la siguiente tabla:
Absorbancias medidas
C (mol/L) λ= 490 λ= 550 λ= 430 λ= 415
0,01 0,01 0,1 0,11 0,14
0,02 0,1 0,24 0,22 0,3
0,03 0,11 0,31 0,4 0,47
0,04 0,18 0,45 0,5 0,61
Nota: C=concentración de cromo; λ=longitud de onda
a) Recuerda que la ley de Beer demuestra la relación lineal de la absorbancia en función
de la concentración. Con los conjuntos de datos de absorbancia leídos a distintas
longitudes de onda, debe elegir aquellos que mayor calidad de ajustamiento lineal
presente, para realizar las futuras mediciones de forma más precisa. ¿Le ayudas a
elegir?
b) Escribe la ecuación de Beer (ecuación lineal) para la longitud de onda elegida.
c) Luego de elegir la mejor ecuación, el laboratorista mide con el espectrómetro
observando una absorbancia de 0,29, ¿cuál es la concentración de cromo en la muestra?
probabilidad y estadistica UTN-FRRE
RESOLUCIÓN
CASO 1
Resumen de datos:
Cantidad: Rango = Max – Min = 500 – 32 = 468
Horas de trabajo: Rango = Max – Min = 7,070 - 1,267 = 5,803
Media =” Mean”
Mediana =” Median”
Desvío estándar = “Sn”
Resumen numérico de “cantidad” respecto de máquina.
Resumen numérico de “horas de trabajo” respecto de máquina.
Resumen numérico de “horas de trabajo” respecto de turno.
Resumen numérico de “cantidad” respecto de turno.
probabilidad y estadistica UTN-FRRE
HISTOGRAMAS:
Gráfico de cantidad producida:
Gráfico de cantidad según maquina:
probabilidad y estadistica UTN-FRRE
Gráfico de cantidad según turno:
Gráfico de horas de trabajo:
probabilidad y estadistica UTN-FRRE
Gráfico de horas de trabajo según maquina:
Gráfico de horas de trabajo por turno:
probabilidad y estadistica UTN-FRRE
GRÁFICAS DE BARRAS
Gráfica de Maquinas:
Gráfica de Turnos:
probabilidad y estadistica UTN-FRRE
Gráfica de Maquinas respecto del turno:
DIAGRAMAS DE CAJAS
Cantidad respecto de la máquina: Cantidad respecto al turno:
Horas de trabajo respecto al turno:
Horas de trabajo respecto de la maquina:
OBSERVACIONES:
El objetivo del supervisor del área es analizar los datos con el fin de comparar el
rendimiento de las máquinas y los turnos. El área supervisada cuenta con tres máquinas
llamadas A, B y C que operan en tres turnos: Mañana, Tarde y Noche.
probabilidad y estadistica UTN-FRRE
Para comparar las maquinas se realizó un resumen numérico de los datos de cantidad de
cueros procesados por máquina y de la cantidad de horas que cada máquina opera.
Analizando las tablas de resúmenes numéricos se encuentra que:
o Máquinas:
Máquina A:
La máquina A se utiliza 36 veces, es la máquina que mayor cantidad de cueros procesa
con una media de 262 aproximadamente y también es la máquina que mayor cantidad
de horas opera con una media de 4 horas aproximadamente.
Máquina B:
La máquina B es la que más veces se utiliza (38 veces), es la máquina que menor
cantidad de cueros procesa con una media de 243 cueros aproximadamente. La máquina
B trabaja una media de 3,9 horas aproximadamente.
Máquina C:
La máquina C es la que menos veces se utiliza (31 veces) y procesa una media de 253
cueros aproximadamente. Es la máquina que menor cantidad de horas trabaja con una
media de 3,8 horas aproximadamente.
Un factor llamativo en los datos de esta máquina es su desvío estándar de 115,69 en la
cantidad de cueros que procesa, lo que nos da un primer indicio de que la máquina
opera irregularmente. Esto se tratará con mayor profundidad al momento de analizar
diagramas.
o Turnos:
Turno Mañana:
Durante el turno de la mañana se trabaja una media de 3,7 horas aproximadamente,
durante el periodo de muestra se registraron 54 turnos de mañana, que es la mayor
cantidad entre los tres turnos. Se registra una media de 254 cueros procesados
aproximadamente durante el turno.
Turno Tarde:
Durante la tarde se trabaja una medie de 4 horas, durante el periodo de muestra se
registraron 27 turnos de tarde. Se registra una media de 257 cueros procesados por
turno.
Turno noche:
Durante el turno de la noche se trabaja una media de 4.5 horas, durante el periodo de
muestra se registran 24 turnos de noche que es la menor cantidad entre los tres turnos.
Se procesan una media de 242 cueros aproximadamente, que es la menor cantidad entre
los tres turnos.
Durante este turno se registra un desvío estándar de 118 en la cantidad de cueros
procesados, lo que nos da un primer indicio de que durante este turno hay una
irregularidad en el procesamiento de cueros. Se verá con mayor claridad al momento de
analizar diagramas.
probabilidad y estadistica UTN-FRRE
ANÁLISIS DE HISTOGRAMAS
En el histograma de cantidad producida observamos una moda con un valor cercano a
300, por lo que deducimos que hay una mayor tendencia a procesar un valor cercano a
300 cueros. En el histograma de cantidad según maquina observamos:
En el histograma de la máquina A se observa una moda con valor entre 200 y 300, que
coincide con la media de 262 cueros procesados. Los valores máximos de cantidad
superan los 400 pero no llegan a los 500.
En el histograma de la máquina B se pueden observar dos modas con valores alrededor
de 200 y alrededor de 300, esto indica que la máquina opera de manera irregular ya que
por momentos procesa alrededor de 200 cueros y por momentos procesa alrededor de
300. Los valores máximos para esta máquina superan los 400 pero no llegan a los 500.
En el histograma de la máquina C observamos una moda con valor entre 200 y 300 que
coincida con la media de 253 cueros procesados. Sin embargo, observamos que los
valores máximos para esta máquina llegan a los 500 y hay un espacio entre los valores
alrededor de 400. El hecho de que llegue a los 500 explica el desvío estándar de 115
notado en la tabla de resumen numérico.
Los histogramas de cantidad según turno muestran que los mayores valores de
frecuencia se encuentran en el turno de la mañana. En el histograma del turno mañana
se observan dos modas con valores inferiores a 200 y a 300 y un espacio sin frecuencia
alrededor de 400, por lo que se concluye que durante el turno de la mañana hay
irregularidades en el proceso. En los histogramas de horas de trabajo según maquina se
observa:
La máquina A trabaja alrededor de 4 horas con mayor frecuencia, la máquina B presenta
dos modas alrededor de 4 y 5 horas, y la maquina C trabaja entre 3 y 4 horas con mayor
frecuencia.
En los histogramas de horas de trabajo según turno se observa que durante la mañana se
trabaja durante 4 horas con mayor frecuencia, pero hay valores de frecuencia iguales
para 2 horas y entre 3 y 4 y entre 4 y 5 horas. Durante la tarde se trabaja alrededor de 4
horas con mayor frecuencia y durante la noche se obtiene la misma frecuencia, pero el
valor máximo de horas registrado esta alrededor de 7 horas, que difiere del máximo de
alrededor de 6 horas de los otros dos turnos.
ANÁLISIS DE GRÁFICOS DE BARRAS
En el gráfico de barras de máquinas según turno se observa que la máquina que más
trabaja durante la mañana es la maquina B y la que más trabaja durante la noche es la
máquina C.
ANÁLISIS DE DIAGRAMAS DE CAJAS
probabilidad y estadistica UTN-FRRE
Los diagramas de cajas nos permiten confirmar las irregularidades registradas en los
análisis anteriores.
La mayor discrepancia entre gráficos se observa entre la cantidad de horas de trabajo
respecto de las máquinas y de los turnos.
CONCLUSIÓN:
Luego de realizar los análisis de datos podemos concluir que:
La máquina A es la que más regularmente opera mientras que las maquinas B y C
presentan problemas de irregularidad respecto a las horas de trabajo y la cantidad
procesada.
El turno de la mañana es el más regular de los tres turnos respecto a cantidad procesada
y a horas de trabajo. El turno de la tarde es el más irregular.
CASO 2
a) Diagrama de dispersión de la absorbancia a 490 respecto de la concentración:
R2 = 0,926 R2 x100 = 92,6% Calidad del ajuste: Muy bueno
Diagrama de dispersión de la absorbancia a 550 respecto de la concentración:
probabilidad y estadistica UTN-FRRE
R2=0,9846 R2x100=98,46% Calidad del ajuste: Muy bueno
Diagrama de dispersión de la absorbancia a 430 respecto de la concentración
R2=0,9875 R2x100=98,75% Calidad del ajuste: Muy bueno
probabilidad y estadistica UTN-FRRE
Diagrama de dispersión de la absorbancia a 415 respecto de la concentración
R2= 0,9986 R2x100=99,86% Calidad del ajuste: Muy bueno
El conjunto de datos que mejor calidad de ajuste tiene es el medido a la longitud de
onda de 415.
b) Para obtener la ecuación del ajuste para la longitud de onda elegida utilizamos la
herramienta Excel.
Ecuación de Beer: y =15,8x - 0,015
c) Concentración de cromo para absorbancia = 0,29
0 , 29+0,015
y=15 , 8 x−0,015 → 0 , 29=15 , 8 x−0,015 → =x → x =0,019
15 , 8
La concentración de cromo en la muestra es de 0,019 mol/L.