Ingeniería en Sistemas Computacionales
Inteligencia Artificial 1
Ing. Juan Carlos Ramírez Teresa
Unidad IV: Aplicaciones con técnicas de IA
Investigación Visión Artificial
Estudiante:
Noveron Hernández Gabriel
No. De Control:
16320909
Aula: 709
Horario: 13:00 a 14:00 hrs.
14 de Mayo del 2020
Tabla de contenido
4.3. Visión artificial.............................................................................................................................1
4.3.1. Conceptos básicos....................................................................................................................1
4.3.2. Desarrollos actuales y aplicaciones..........................................................................................2
Conclusiones......................................................................................................................................8
Bibliogrrafia........................................................................................................................................9
4.3. Visión artificial.
La visión artificial, también conocida como visión por computador (del inglés
computer vision) o visión técnica, es un subcampo de la inteligencia artificial. El
propósito de la visión artificial es programar una computadora para que "entienda"
una escena o las características de una imagen.
Los objetivos típicos de la visión artificial incluyen:
La detección, segmentación, localización y reconocimiento de ciertos objetos en
imágenes (por ejemplo, caras humanas).
La evaluación de los resultados (por ejemplo, segmentación, registro).
Registro de diferentes imágenes de una misma escena u objeto, es decir, hacer
concordar un mismo objeto en diversas imágenes.
Seguimiento de un objeto en una secuencia de imágenes.
Mapeo de una escena para generar un modelo tridimensional de la escena; este
modelo podría ser usado por un robot para navegar por la escena.
Estimación de las posturas tridimensionales de humanos.
Búsqueda de imágenes digitales por su contenido.
Estos objetivos se consiguen por medio de reconocimiento de patrones,
aprendizaje estadístico, geometría de proyección, procesamiento de imágenes,
teoría de grafos y otros campos. La visión artificial cognitiva está muy relacionada
con la psicología cognitiva y la computación biológica.
4.3.1. Conceptos básicos.
Se puede definir la “Visión Artificial” como un campo de la “Inteligencia Artificial”
que, mediante la utilización de las técnicas adecuadas, permite la obtención,
procesamiento y análisis de cualquier tipo de información especial obtenida a
través de imágenes digitales.
1
La visión artificial la componen un conjunto de procesos destinados a realizar el
análisis de imágenes. Estos procesos son: captación de imágenes, memorización
de la información, procesado e interpretación de los resultados.
4.3.2. Desarrollos actuales y aplicaciones.
Con la visión artificial se pueden:
Automatizar tareas repetitivas de inspección realizadas por operadores.
Realizar controles de calidad de productos que no era posible verificar por
métodos tradicionales.
Realizar inspecciones de objetos sin contacto físico
Realizar la inspección del 100% de la producción (calidad total) a gran
velocidad.
Reducir el tiempo de ciclo en procesos automatizados.
Realizar inspecciones en procesos donde existe diversidad de piezas con
cambios frecuentes de producción.
Las principales aplicaciones de la visión artificial en la industria actual son:
Identificación e inspección de objetos.
Determinación de la posición de los objetos en el espacio.
Establecimiento de relaciones espaciales entre varios objetos (guiado de
robots)
Determinación de las coordenadas importantes de un objeto.
Realización de mediciones angulares.
Mediciones tridimensionales.
Métodos de captación de las imágenes.
Digital. La función obtenida tras el resultado de la medida o muestreos
realizados a intervalos de tiempo espaciados regularmente, siendo el valor
2
de dicha función un número positivo y entero. Los valores que esta función
toma en cada punto dependen del brillo que presenta en esos puntos la
imagen original.
Píxel. Una imagen digital se considera como una cuadrícula. Cada
elemento de esa cuadrícula se llama Píxel (Picture element). La resolución
estándar de una imagen digital se puede considerar de 512x484 Pixel.
Nivel de grises. Cuando una imagen es digitalizada, la intensidad del brillo
en la escena original correspondiente a cada punto es cuantificada, dando
lugar a un numero denominado “nivel de gris”.
Imagen binaria. Es aquella que sólo tiene dos niveles de gris: negro y
blanco. Cada píxel se convierte en negro o blanco en función del llamado
nivel binario o UMBRAL.
Escena. Es un área de memoria donde se guardan todos los parámetros
referentes a la inspección de un objeto en particular: Cámara utilizada,
imágenes patrón memorizadas, tolerancias, datos a visualizar, entradas y
salidas de control, etc.
Window (ventana de medida). Es el área específica de la imagen recogida
que se quiere inspeccionar.
3
Módulo de digitalización. Convierte la señal analógica proporcionada por la
cámara a una señal digital (para su posterior procesamiento).
Memoria de imagen. Almacena la señal procedente del módulo de
digitalización.
Módulo de visualización. Convierte la señal digital residente en memoria, en
señal de vídeo analógica para poder ser visualizada en el monitor de TV.
Procesador de imagen. Procesa e interpreta las imágenes captadas por la
cámara.
Módulo de entradas/salidas. Gestiona la entrada de sincronismo de
captación de imagen y las salidas de control que actúan sobre dispositivos
externos en función del resultado de la inspección.
Comunicaciones. Vía I/O, ethernet, RS232 (la más estándar).
La secuencia a seguir en el proceso operativo es:
Captación. Obtención de la imagen visual del objeto a inspeccionar.
4
Instrucciones. Conjunto de operaciones a realizar para resolver el
problema.
Procesado. Tratamiento de la imagen mediante las instrucciones aplicadas.
Actuación. Sobre el entorno (aparato, pieza, elemento) en función del
resultado obtenido.
CAMARAS
Su función es capturar la imagen proyectada en el sensor, vía las ópticas, para
poder transferirla a un sistema electrónico.
Las cámaras utilizadas en visión artificial requieren de una serie de características
que permitan el control del disparo de la cámara para capturar piezas que pasan
por delante de ella en la posición requerida. Son mas sofisticadas que las cámaras
convencionales, ya que tienen que poder realizar un control completo de: tiempos,
señales, velocidad de obturación, sensibilidad, etc.
Se clasifican en función de:
La tecnología del elemento sensor.
· Cámaras de tubo. Se basan en la utilización de un material fotosensible que
capta la imagen, siendo leída por un haz de electrones.
· Cámaras de estado sólido CCD (Charge – Coupled – Device). Se basan en
materiales semiconductores fotosensibles para cuya lectura no es necesario un
barrido electrónico (más pequeñas que las de tubo)
La disposición física.
· Cámaras lineales. Se basan en un sensor CCD lineal
· Cámaras matriciales. Se basan en un sensor CCD matricial, lo que permite el
análisis de imágenes bidimensionales.
5
Hay una cámara específica para cada aplicación, color, monocromo, alta
definición, alta sensibilidad, alta velocidad, infrarrojas, etc. Pasamos a comentar
en forma breve el funcionamiento de las más utilizadas.
Cámaras lineales. Construyen la imagen línea a línea realizando un barrido del
objeto junto con un desplazamiento longitudinal del mismo.
Las cámaras lineales utilizan sensores que tienen entre los
512 y 8192 pixels, con una longitud lo mas corta posible y
gran calidad de imagen.
El hecho de construir imágenes de alta calidad a partir de
líneas individuales, requiere de una alta precisión. La
alineación y el sincronismo del sistema son críticos si se
quiere obtener una imagen precisa del objeto a analizar.
Su utilización está muy extendida para la inspección de
objetos de longitud indeterminada, tipo telas, papel, vidrio, planchas de metal, etc.
Características técnicas:
Número de elementos del sensor. A mayor número de elementos (pixels)
mayor tamaño de la óptica.
Velocidad. Número de pixels capaces de ser leídos por unidad de tiempo.
En las cámaras lineales es un valor mucho mas alto que en las matriciales.
En las cámaras de última generación se alcanzan velocidades superiores a
los 200 Mhz.
Cámaras lineales a color. Tienen tres sensores lineales, uno para cada
color (rojo verde y azul). Pueden ser de dos tipos:
6
· Trisensor. Los sensores CCd están posicionados unos junto a otros
separados por un pequeño espacio. Tienen una buena sensibilidad
pero solo pueden utilizarse en aplicaciones con superficies planas.
· Prisma. Los sensores están posicionados en las tres caras de un
prisma. Pueden utilizarse para cualquier tipo de aplicación pero
necesitan de una mayor iluminación.
Cámaras matriciales. El sensor cubre un área que está
formada por una matriz de pixels. Los sensores de las
cámaras modernas son todos de tecnología CCD
formados por miles de diodos fotosensibles posicionados
de forma muy precisa en la matriz.
El tamaño de los CCD está definido en pulgadas, sin
embargo su tamaño real no tiene nada que ver con su valor en pulgadas, sino que
están basados en la relación de los primeros con el tamaño de los tubos Vidicon.
Formatos habituales son 1/3”,1/2” y 2/3”.
Características de los sensores.
Factor de relleno. Porcentaje del área de píxel que es sensible a la luz, el
ideal es el 100%, porcentaje imposible de obtener por la separación entre
los registros.
Tipo de transferencia. Según la forma de transferencia de la información.
· Transferencia Inter-línea (ITL). Son los mas comunes, utilizan registros de
desplazamiento situados entre las líneas de píxel para almacenar y
transferir los datos de la imagen lo que permite una alta velocidad de
obturación.
· Transferencia de cuadro. Disponen de un área dedicada al
almacenamiento de la luz, la cual está separada del área activa, esto
7
permite un mayor factor de relleno aunque se pierde velocidad de
obturación.
· Cuadro entero. Son los de arquitectura más simple, emplean un registro
paralelo para exposición de los fotones, integración de la carga y transporte
de la misma, alcanzando con este sistema factores de relleno del 100%.
8
Conclusiones
Con toda la información que presentamos anteriormente tratamos de demostrar la
importancia que tiene la visión artificial que es una parte que abarca la inteligencia
artificial, pero de igual manera no deja de ser importante ya que gracias a la visión
artificial podemos crear mecanismos que realicen trabajo no por el simple hecho
de recibir órdenes si no que son capaces de visualizar su objetivo, tomar
decisiones y ejecutarlas.
En este artículo también se trata de explicar un poco más sobre los proyectos que
involucran la visión artificial, como por ejemplo aplicada en la detección de
peatones.
Pero todo esto solo es un trabajo de investigación ya que todo lo realizado es
simplemente una recopilación de información o experimentos que ya fueron
realizados.
9
Bibliogrrafia
Hughett. P, "A programable command interpreter to automate image
processing of infrared thermography",SPIE Vol 1467, Thermosense XIII,1991.
Ballard, D. y Brown, C. (1982) Computer Vision, Prentice
Hughett. P, "A programmable command interpreter to automate image
processing of infrared thermography",SPIE Vol 1467, Thermosense XIII,1991.
Tombropolous,R.Z., J.R. Adler et al. (1999), »Carabeamer : A treatment planner
for a robotic radiosirurgical system with general kinematics », Medical Image
Analysis 3(3) : 237,264
10