Segmentación semántica o Segmentación de instancia
Redes Neuronales Artificiales y Deep Learning
Daniel Alejandro Pedroza Escobar
Ingenieria electronica
Facultad de Ingenieria
Universidad Autónoma de Occidente
Cali, Colombia
Jaime Ricardo Martinez Cortes
Ingenieria electronica
Facultad de Ingenieria
Universidad Autónoma de Occidente
Cali, Colombia
Abstract— artificial intelligence has adopted many of the La segmentación semántica se utiliza en numerosas
concepts and bases that a person can do, so one of the interesting aplicaciones, como la conducción autónoma, la generación de
things applicable with this technology is the ability to group and imágenes médicas y la inspección industrial.
enclose objects, which in the following work is segmented
through layers and attributes with what they are named.
Keywords—artificial intelligence; a.i. semantic segmentation;
layers; data analysis.
I. INTRODUCCIÓN
A continuación, se presentará el trabajo realizado para obtener
una Red Neuronal Artificial entrenada con el objetivo de
segmentar, agrupar y reconocer objetos en una imagen y
separarlos mediante capas que serán detectados por la red, esto
permitirá identificar objetos u anomalías en una imagen.
Figura1. Ejemplo de segmentacion.
Para el caso de del aprendizaje a la red le suministramos
imágenes en el que los atributos a contener serían: Rasperry pi
Detectron2:
3, Arduino nano, ESP8226, ESP32 LORA, ESP32 y Arduino
Detectron2 es una biblioteca avanzada desarrollada por
Uno , teniendo en cuenta imágenes el cual contenga al menos
Facebook AI Research (FAIR) para tareas de detección y
2 de esos atributos se le suministra a la red dichos data sets segmentación de objetos en visión por computadora.
para así proceder al entrenamiento y obtener validaciones con Construida sobre la plataforma PyTorch, ofrece un diseño
segmentaciones de imágenes parecidas modular y extensible, lo que permite la implementación rápida
de nuevos algoritmos y modelos. Detectron2 soporta una
II. MARCO TEORICO
amplia gama de algoritmos de detección de objetos como Mask
R-CNN, Faster R-CNN y RetinaNet, entre otros.
Segmentación semántica:
La segmentación semántica es un algoritmo de deep learning
que asocia una etiqueta o categoría a cada píxel presente en
una imagen. Se utiliza para reconocer un conjunto de píxeles
que conforman distintas categorías. Por ejemplo, un vehículo
de conducción autónoma necesita identificar vehículos, Figura2. Detectron2 logo.
peatones, señales de tráfico, aceras y otros elementos de la
carretera.
III. DESCRIPCIÓN DEL PROBLEMA entrenamiento y la red pudiera obtener resultados similares a
los escogidos.
Actualmente, la captación de objetos o elementos de forma
automática y rápida es muy requerida en la industria o hasta en Antes de poder crear y entrenar un modelo para segmentación,
el área médica debido a que se dispone de muchos detalles hay que preparar el dataset corecctamente, en este caso a la
pequeños o hasta detalles que simplifiquen la labor humana y imágenes de los microcontroladores que teníamos toco
disminuya el error que se presenta en el factor humano.
Por ello, la segmentación semántica o de instancia es un
método de aplicación para este tipo de ocasiones el cual
consiste en obtener información de una o varias imágenes (caso
de un video) cuyo resultado es la obtención de una máscara, el
cual enmarca la clase detectada como conjunto (caso de
segmentación semántica) o reconocer cada uno de los
elementos de la clase de forma individual (caso de
segmentación de instancias).
Teniendo en cuenta esto, se desea obtener la identificación de 6
clases en una imagen o de forma individual, en diferentes
imágenes donde aparezcan los microcontroladores utilizados.
Por ello, esta es una tarea de segmentación semántica para la V. RESULTADOS
identificación de cada una de las clases presentes en la imagen,
donde el objetivo es entrenar una red neuronal con el fin de
segmentar entre 6 objetos definidos por nosotros.
IV. PLANTEAMIENTO DE LA SOLUCIÓN
VI. CONCLUSIONES
Para el desarrollo de este mini proyecto, se decidió realizar
segmentación semántica de objetos usando detectron2. Para
nuestro data set personalizado usamos imágenes de 6
microcontroladores diferentes, estos fueron: Rasperry pi 3, REFERENCES
Arduino nano, ESP8226, ESP32 LORA, ESP32 y Arduino
UNO, que serán nuestras 6 clases, para poder tener datos