EVALUACIÓN
CONTROL ESTADISTICO DE
PROCESOS Y BIG DATA
Semana 3
Nombre del estudiante: Kevin
Rubilar
Fecha de entrega: 10-03-2025
Carrera: Ingeniería Industrial
EVALUACIÓN
DESARROLLO:
La empresa Platicol se encarga de la realización de botellas de diferentes y tamaños dependiendo de
las especificaciones del cliente. En un mes se pueden fabricar hasta 100 millones de piezas. Sin
embargo, el dueño ha recibido algunas quejas de piezas defectuosas que presentan problemas de
abolladura, material frágil e inconvenientes de rosca, principalmente. Por tal motivo el gerente de
línea encargado verifica todos los días la precisión de una muestra aleatoria de 200 registros de
fechas de elaboración. Los resultados de las 20 últimas muestras se presentan en la siguiente tabla.
Todos fueron verificados para asegurar que ninguno estuviera fuera de control. Tomando como base
estos datos históricos, utiliza Z=3 para el gráfico p.
Muestra Número de
piezas
defectuosas
1 2
2 25
3 30
4 14
5 15
6 17
7 16
8 5
9 12
10 15
11 18
12 11
13 13
14 5
15 14
16 16
17 12
18 25
19 17
20 18
En la fase final del proceso, las botellas fabricadas pasan por una máquina que mide varias
características de calidad del producto. Cuando el proceso de producción de botellas de plástico está
bajo control, el promedio es de 20 defectos (tabla 2) por cada grupo visualizado. Se utilizarán límites
de control dos sigma.
2
EVALUACIÓN
Número de botellas Número de
(muestra) defectos
1 25
2 15
3 15
4 14
5 18
6 30
7 25
8 22
9 25
10 14
Estos análisis pueden ayudar a identificar las causas de las piezas defectuosas y a implementar
medidas correctivas. Por ejemplo, las especificaciones del cliente que podrían venir en forma de
correos electrónicos o documentos de texto son un ejemplo de datos no estructurados. Por otro lado,
los informes de inspección de calidad que podrían contener una mezcla de texto y datos numéricos
son un ejemplo de datos semiestructurados. En un contexto de Big Data, estos datos pueden ser
analizados para obtener insight valiosos, que pueden ayudar a mejorar la calidad de los productos y
la eficiencia de la producción.
En atención con el caso entregado, responde lo siguiente:
1. Utiliza las técnicas de control estadístico para calcular los límites de control para el gráfico P
(datos tabla 1) y C (datos tabla 2).
R: Para calcular los límites de control para el grafico P, se utiliza la fórmula:
Límite Superior de Control (LSC) = p̄ + Z * √(p̄ * (1 - p̄) / n) Límite Inferior de Control (LIC) = p̄ -
Z
* √(p̄ * (1 - p̄) / n)
Donde p̄ es la proporción de piezas defectuosas en la muestra, Z es el valor de la distribución
normal estándar correspondiente al nivel de confianza deseado y n es el tamaño de la
muestra.
-Para calcular los límites de control para el gráfico C, se utiliza la fórmula:
Límite Superior de Control (LSC) = C̄ + 2 * √C̄ Límite Inferior de Control (LIC) = C̄ - 2 * √C̄
Donde C̄ es el promedio de defectos por grupo visualizado.
Calculando los límites de control para el gráfico P:
Para el gráfico P, se utilizará Z = 3 para un nivel de confianza del 99.73%.
Límites de Control para el gráfico P: LSC = p̄ + 3 * √(p̄ * (1 - p̄) / n) LIC = p̄ - 3 * √(p̄ * (1 - p̄) / n)
Calculando los límites de control para cada muestra de la tabla 1:
Muestra 1: p̄ = 2/200 = 0.01 LSC = 0.01 + 3 * √(0.01 * (1 - 0.01) / 200) = 0.01 + 3 * 0.021 =
0.073
LIC = 0.01 - 3 * √(0.01 * (1 - 0.01) / 200) = 0.01 - 3 * 0.021 = -0.053 (ajustado a 0)
-Realizando los cálculos para todas las muestras de la tabla 1, se obtienen los límites de
control correspondientes.
3
EVALUACIÓN
Calculando los límites de control para el gráfico C:
Límites de Control para el gráfico C: LSC = C̄ + 2 * √C̄ LIC = C̄ - 2 * √C̄ Calculando los límites de
control para los datos de la tabla 2:
C̄ = (25 + 15 + 15 + 14 + 18 + 30 + 25 + 22 + 25 + 14) / 10 = 20.3 LSC = 20.3 + 2 * √20.3 = 20.3 + 2 *
4.51 = 29.32 LIC = 20.3 - 2 * √20.3 = 20.3 - 2 * 4.51 = 11.28
Por lo tanto, los límites de control para el gráfico P son LSC = 0.073 y LIC = 0 (ajustado a 0), y
los límites de control para el gráfico C son LSC = 29.32 y LIC = 11.28.
2. Elabora la gráfica de control por atributo P y C, y luego responde: ¿cómo es el
comportamiento de las piezas defectuosas según el gráfico P y C? Indica algunas acciones de
mejora en base a lo que se visualiza en la gráfica.
R: El gráfico de control por atributo P representa la proporción de piezas defectuosas en cada
muestra a lo largo del tiempo, con el eje vertical mostrando esta proporción y el eje horizontal
representando el número de muestra. La interpretación de este gráfico implica verificar si los
puntos de las muestras están dentro de los límites de control establecidos. Cuando la
proporción de piezas defectuosas en una muestra excede los límites de control, señala una
variación significativa en el proceso de producción, requiriendo medidas correctivas.
Por otro lado, el gráfico de control por atributo C muestra el número de defectos en cada
grupo a lo largo del tiempo, con el eje vertical representando este número y el eje horizontal
mostrando el número de grupo. Al igual que con el gráfico P, la evaluación implica verificar si
los puntos de los grupos están dentro de los límites de control establecidos. Si el número de
defectos en un grupo supera estos límites, indica una variación significativa en el proceso de
producción, que también requiere acciones correctivas.
Al analizar los datos presentados en ambos gráficos, se pueden identificar áreas para
mejorar:
En el gráfico P, la mayoría de las muestras se mantienen dentro de los límites de control, lo
que indica un control adecuado sobre la proporción de piezas defectuosas. Sin embargo, en
las muestras 3, 4 y 18, la proporción de piezas defectuosas excede el límite superior de control,
indicando una variación significativa en el proceso de producción. Se deben investigar las
causas subyacentes de estas variaciones y tomar medidas correctivas para reducir la
proporción de piezas defectuosas.
En cuanto al gráfico C, la mayoría de los grupos se encuentran dentro de los límites de control,
lo que sugiere un control adecuado sobre el número de defectos. Sin embargo, en el grupo 6,
el número de defectos supera el límite superior de control, señalando una variación
significativa en el proceso de producción. Es necesario investigar las razones detrás de esta
variación y tomar medidas correctivas para reducir el número de defectos.
4
EVALUACIÓN
3. Considerando los diferentes tipos de datos generados en el proceso de producción la empresa
Platicol, ¿cómo podrías identificar y clasificar estos datos en términos de datos estructurados,
no estructurados y semiestructurados? Además, ¿cómo podrías utilizar estos datos en un
contexto de Big Data, para mejorar la calidad de los productos y la eficiencia de la
producción?
R: Datos estructurados: Son datos que tienen un formato predefinido y organizado en campos
específicos. En este caso, el número de botellas producidas y el número de defectos se pueden
considerar como datos estructurados, ya que se registran y almacenan en una base de datos
o en tablas con campos claramente definidos. Por ejemplo:
Número de botellas (muestra): Este dato se registra en forma de números enteros o valores
numéricos y se almacena en una columna de una base de datos con un formato específico.
Número de defectos: Similar al número de botellas, este dato se registra en forma de números
enteros o valores numéricos y se almacena en una columna de una base de datos con un
formato específico. Datos no estructurados: Son datos que no tienen un formato predefinido
y no se pueden organizar fácilmente en campos. En este contexto, los datos no estructurados
podrían incluir información de correos electrónicos, informes de inspección de calidad,
comentarios de clientes, imágenes de botellas defectuosas, videos de procesos de producción,
etc. Estos datos pueden estar en formatos como texto sin formato, imágenes, audio, video,
entre otros, y no se almacenan de manera organizada en bases de datos relacionales.
Datos semiestructurados: Son datos que no se ajustan perfectamente a un modelo relacional
de base de datos, pero tienen cierto grado de estructura que permite su organización y
manipulación. En este contexto, los informes de inspección de calidad podrían considerarse
datos semiestructurados, ya que pueden contener una combinación de texto y datos
numéricos que pueden ser organizados en campos. Por ejemplo, un informe de inspección de
calidad podría tener secciones con campos como fecha, tipo de botella, número de defectos,
etc.
-Para utilizar estos datos en un contexto de Big Data con el objetivo de mejorar la calidad de
los productos y la eficiencia de la producción, se pueden implementar las siguientes
estrategias:
Análisis de datos estructurados: Utilizar técnicas de análisis de datos estadísticos para
analizar el número de botellas producidas y el número de defectos, identificar tendencias,
patrones y anomalías en los datos, y tomar decisiones basadas en evidencia para mejorar el
proceso de producción y reducir los defectos.
Procesamiento de datos no estructurados: Implementar herramientas y técnicas de
procesamiento de lenguaje natural (NLP), procesamiento de imágenes y análisis de video para
extraer información útil de los datos no estructurados, como comentarios de clientes,
imágenes de botellas defectuosas, etc. Por ejemplo, se pueden utilizar algoritmos de
aprendizaje automático para analizar los comentarios de los clientes y detectar problemas
recurrentes o utilizar análisis de imagen para identificar defectos en las botellas.
Integración de datos semiestructurados: Utilizar herramientas de extracción y transformación
de datos (ETL) para integrar y procesar datos semiestructurados, como informes de
5
EVALUACIÓN
inspección de calidad, y convertirlos en un formato que pueda ser analizado junto con los
datos estructurados y no estructurados. Por ejemplo, se pueden utilizar técnicas de minería
de texto para extraer información clave de los informes de inspección de calidad y combinarla
con los datos estructurados y no estructurados para obtener una visión holística del proceso
de producción.
6
EVALUACIÓN
REFERENCIAS BIBLIOGRÁFICAS
Casas Roma, J. Nin Guerrero, J. y Julbe López, F. (2019). Big data: análisis de datos en entornos
masivos. Editorial UOC.
Castillo Romero, J. A. (2019). Big data. IFCT128PO. IC Editorial.