Imagen Digital
Imagen Digital
Sesión Nro. 03
Imagen digital
apzi
consultores
apzi
consultores
La imagen digital La imagen digital está representado bidimensionalmente
por una imagen a partir de una matriz numérica
¿Qué es? empleando bits.
Es la representación visual de un objeto obtenido
Bit
mediante diferentes dispositivos electrónicos como Es la unidad mínima de información compuesta por
filmadoras, celulares, cámaras, escaners o técnicas dígitos binarios (1 y 0) que se emplea en la informática
generadas directamente por ordenadores. y en cualquier dispositivo de tipo digital.
apzi
consultores
▪ La luz
En el mecanismo de la visión participan
▪ El ojo
tres agentes:
▪ El cerebro
… la formación de la
imagen biológica La formación de imágenes
es un proceso mediante el
El punto de partida de todo sistema de percepción visual, ya sea biológico o automático cual una información
luminosa 3D (la escena) es
es la imagen. proyectada en un plano 2D
El proceso óptico de captación de una imagen implica la utilización Mundo 3D (la imagen).
Ojo
de algún tipo de sensor sobre el que se obtendrá la representación Los ojos son sistemas
Las cámaras digitales imitan el proceso que tiene lugar en el ojo humano.
bidimensional de la escena que aparece ante él. complejos que convierten
la información visual en El reflejo de la luz pasa a través de la córnea y el cristalino que actúan
impulsos nerviosos que como lentes para proyectar de forma nítida las imágenes en la
… el ojo posteriormente utiliza el superficie de la retina.
En los seres vivos el sistema de adquisición de imagen lo constituyen los ojos. cerebro para interpretar la
Los fotorreceptores de la retina transforman la proyección en impulsos
imagen percibida.
nerviosos que pasan al cerebro a través del nervio óptico.
película
Si comparamos el funcionamiento
La retina es la membrana más del ojo con el de una cámara
diafragma
interna del ojo, encontrándose en digital, el iris actuaría como
la parte posterior del ojo. Cuando diafragma, la retina como sensor,
el ojo está adecuadamente abertura y el cristalino como lente que
enfocado, la luz procedente de un permite acercar o alejar la
objeto externo al ojo se proyecta objetivo
proyección del objeto sobre el
sobre la retina. sensor para conseguir un buen
enfoque.
Los rayos luminosos que se
reflejan en la escena son La imagen que se forma en la
retina es invertida, pero recién
recogidos por el cristalino después de que el cerebro
que actúa como una lente y procese la información recibida
son proyectados sobre la diafragma la veremos realmente cómo es.
superficie por fibras que le rayos
pupila lente película
La fóvea en sí es un pequeño luminosos cristalino retina
unen al cuerpo ciliar. Fóvea imagen
entrante circular en la retina de objeto
alrededor 1.5 mm. de diámetro. La
densidad de fotorreceptores es
aproximadamente 150.000
elementos por milímetro cuadrado,
similar a un sensor de cámara.
apzi
consultores
Una vez esta imagen es interpretada (leída), los ordenadores la transforman Puntos de Fósforo y Color
… la formación de la en una imagen visible a través de la pantalla e imprimible, a través de Imágenes Procesadas
En una cámara digital
imagen digital cualquier dispositivo de salida mediante un archivo digital.
los píxeles de los
Archivo digital captadores están
La gran ventaja del archivo digital es que puede duplicarse y formados por unos
copiarse tantas veces como se quiera. monitor elementos fotosensibles llamados
puntos de fósforo, que crean una Los puntos de fósforo
Es un dispositivo que convierte una señal analógica variable en corriente eléctrica de acuerdo convierten los rayos de luz en
el tiempo a una representación de números digitales de la conversor analógico a digital con la intensidad el tiempo de cargas eléctricas.
amplitud de esa señal. exposición a la luz recibida.
conversión ADC
Detector o sensor sólido de imagen, constituido dígitos binarios Desde un punto de vista eléctrico,
por ciertos de miles de receptores fotosensibles dispositivo de carga acoplada el captador es el mismo. Cada
(fotodiodos) punto de fósforo está cubierto
sensor CCD simplemente por un filtro rojo,
verde o azul.
El color de cada pixel en una pantalla se obtiene mediante filtro
tres elementos separados ( ): los luminóforos RGB ejemplo:
un filtro rojo detiene los rayos Un filtro cromático solo deja
verdes y azules, pero deja pasar pasar su propio color.
llamado como filtro de absorción de calor, está filtro
diseñados para reflejar o bloquear las longitudes el componente rojo de la luz.
infrarojo
de onda infrarroja dejando pasar la luz del zona de almacenamiento
Transferencia de una imagen
espectro visible cargos de fotodiodos
… de esta forma,
Escritorio Portátil Móvil Tablets la imagen continua 𝑓 𝑥, 𝑦 se representará mediante muestras
equiespaciadas organizadas en forma de matriz de dimensión 𝒎. 𝒏
donde cada elemento de la matriz es una cantidad discreta.
… esto se
le conoce como
imagen digital
nos referimos a cada elemento de este arreglo
como elemento de imagen o pixel.
apzi
consultores
𝐺 = 2𝑘
𝐺 = 28
La imagen digital será una función que asigna a una pareja de números 𝐺 = 256
naturales (coordenadas del píxel) a otro número natural (nivel de gris).
𝑚 𝑛 𝐺
ejemplo:
Como el número de niveles de gris 𝐺 es siempre una potencia de 2: 𝐺 = 2𝑘
una imagen típica de resolución VGA 640 𝑥 480 píxeles y 256 niveles de gris.
imagen El número de bits 𝑏 requeridos para almacenar una imagen digital será: 𝑏 = 𝑚. 𝑛. 𝑘 requiere: 𝑏 = 𝑚. 𝑛. 𝑘
continua 𝑏 = (640). (480). (8) 𝑣𝑎𝑙𝑜𝑟𝑒𝑠
𝑏 = 2,457.600 𝑏𝑖𝑡𝑠
¿Cuántos píxeles y conversión: 𝑏 = 2,457.600 𝑏𝑖𝑡𝑠 Τ8 𝑏𝑖𝑡𝑠
… la imagen digital será una aproximación
niveles de gris se 𝑏 = 307,200 𝑏𝑦𝑡𝑒𝑠
de la escena
requieren para tener
una buena
aproximación? Cuanto mayor sea, más se aproximará la imagen digital a la
escena original
Muestreo
Digitalización
256 niveles de gris 16 niveles de gris 8 niveles de gris 4 niveles de gris 2 niveles de gris apzi
consultores
Ojo Humano
… comparación perceptual de la
imagen digital
La comparación debe establecer relaciones en
diferentes presentaciones (ojo humano, monitor
de ordenador e impresora), mediante la
constancia perceptual, reconociendo el objeto
mediante sus propiedades invariantes:
resolución, profundidad del color, tamaño, etc.
Monitor
Constancia perceptual
Es el fenómeno por el cual percibimos los
objetos como inalterables a pesar de los
cambios que producen en el mismo debido
a los cambios sensoriales. … la percepción de la imagen en
Una vez nos hemos formado una percepción diferentes presentaciones
estable del objeto lo reconocemos casi desde
cualquier ángulo:
▪ Constancia de la forma
▪ Constancia del tamaño
▪ Constancia del color
… entonces
¿Cuántos tipos de
imágenes digitales Impresora
conocemos?
apzi
consultores
también se denomina como trazos de vectores.
\ \ \ figura
… tipos de • Imagen 3D
Son imágenes que pretenden transmitir la proyección de
imágenes digitales
algo visual en el espacio tridimensional, donde el 3D
permite ver la forma un objeto, un espacio o una escena,
teniendo en cuenta sus tres dimensiones (altura, ancho y 𝒙
profundidad). a𝑛𝑐ℎ𝑜
(ℎ𝑜𝑟𝑖𝑧𝑜𝑛𝑡𝑎𝑙)
Al dibujar con esta técnica, se conjuega el espacio 𝒛
𝑙argo
real con el de los objetos y sus volúmenes, mediante (𝑝𝑟𝑜𝑓𝑢𝑛𝑑𝑖𝑑𝑎𝑑)
la utilización de los tres ejes coordenados X, Y, Z, y
analizando cómo éstos interactúan entre si.
imagen 3D
Al relacionar el dibujo o gráfico con un ordenador y un programa
de modelado no solo se aprecian estas dimensiones sino que
comienzan a tener importancia la luz, las sombras, los reflejos o tipos de formatos
las texturas, entre otros elementos. (estáticas y dinámicas)
BLENDER
4 3 1 2 𝑎2
El proceso de la creación de imágenes tridimensionales se basa 𝑉 = 𝑎3 𝑉 = 𝑎. 𝑏. 𝑐 𝑉 = 𝜋𝑟 2 . ℎ 𝑉= 𝜋𝑟 𝑉= 𝜋𝑟 . ℎ 𝑉= .ℎ
3 3 3
en un grupo de fórmulas matemáticas muy claras y precisas.
… por lo tanto, se describen: El proceso de transformación de un modelo en 3D
hacia una imagen 3D es llamado renderización. Características de las imágenes 3D
‒ Objetos poligonales
‒ Tonalidades, Texturas, Sombras y Reflejos • La imagen 3D puede ser tratada como una imagen estática
‒ Transparencias, Translucidez y Refracciones Renderización o darle movimiento (animación).
‒ Iluminación (directa, indirecta y global) Es el proceso que permite obtener imágenes digitales • La imagen 3D puede almacenarse en cualquier formato
‒ Profundidad de campo tomadas del modelo tridimensional, a través de software gráfico ráster.
dedicados. Estas imágenes tienen como finalidad simular de • Múltiples imágenes en 3D constituyen una animación 3D.
‒ Desenfoques por movimiento • Básicamente se puede dividir en dibujo en 2D y modelado
‒ Ambiente, Punto de vista, etc. manera fotorrealista ambientes, materiales, luces, objetos
en 3D.
de un proyecto y de un modelo 3D. apzi
consultores
… tipos de • Imagen animada
Es aquella imagen que se caracteriza por el movimiento
imágenes digitales
que presenta; mientras tanto, tal estado es posible
gracias a la animación.
Animación
Es un proceso que se ejecuta para crear en el
espectador esa sensación de movimiento ya sea a partir
de imágenes o de dibujos.
imagen animada
Existen muchísimas técnicas y métodos que se emplean para crear
el mencionado movimiento.
Eliminación de figuras Retoque fotográfico para mejorar imágenes antiguas Colorear una imagen
… pero
¿Cuáles son las propiedades
de una imagen?
apzi
consultores
Lógicamente, cuanto mayor sea ésta resolución, más
contenedores de información (píxeles o puntos) tiene la
Es una medida de longitud del sistema inglés.
Pulgada imagen, por lo tanto, se traduce en obtener una imagen con
El símbolo de la pulgada es in, también se puede expresar con comillas “
… Propiedades de la ejemplo: 5 in … 5” … 5 plg.
más detalle (nitidez) o calidad visual y más peso en
megabytes (MB).
imagen digital ejemplo:
Se mide en ppp (píxeles o puntos por pulgada) Una resolución de 300 ppp:
¿Cómo se mide? 300 𝑝𝑝𝑝 𝑎𝑛𝑐ℎ𝑜 𝑥 300 𝑝𝑝𝑝 𝑎𝑙𝑡𝑜 = 90.000 𝑝í𝑥𝑒𝑙𝑒𝑠
o en inglés dpi (dots per inch).
Resolución … gracias a esta fórmula, resulta fácil conocer la dimensión
La resolución representa la cantidad de detalle que puede observarse en una máxima de un tiraje.
𝑦 imagen, bien sea obtenida mediante escáner, cámara de fotos o impresa. Para las imágenes digitales
1 plg. 2 plg. 4 plg. 10 plg. almacenadas como mapa de
pixel bits, la convención es describir
la resolución de la imagen con
dos números enteros:
1 plg. 2 plg. 4 plg. 10 plg. 4𝑥4 4x4
cantidad de filas de píxeles
…. ¿Cuántos píxeles tiene la imagen a lo alto?
1 2 4 10 cantidad de columnas de píxeles
¿Cuántos píxeles tiene la imagen a lo ancho?
1 ppp 2 ppp 4 ppp 10 ppp
5 px 1 pixel
4 px 8 px 16 px
5 px 10 px 18 px 40 px Densidad
4 𝑝𝑥 8 𝑝𝑥 16 𝑝𝑥
𝑟𝑒𝑠𝑜𝑙𝑢𝑐𝑖ó𝑛 = 𝑟𝑒𝑠𝑜𝑙𝑢𝑐𝑖ó𝑛 = 𝑟𝑒𝑠𝑜𝑙𝑢𝑐𝑖ó𝑛 =
4 𝑝𝑙𝑔 4 𝑝𝑙𝑔 4 𝑝𝑙𝑔
5 𝑝𝑥
𝑟𝑒𝑠𝑜𝑙𝑢𝑐𝑖ó𝑛 = = 5 𝑝𝑝𝑝 𝑟𝑒𝑠𝑜𝑙𝑢𝑐𝑖ó𝑛 = 1 𝑝𝑝𝑝 𝑟𝑒𝑠𝑜𝑙𝑢𝑐𝑖ó𝑛 = 2 𝑝𝑝𝑝 𝑟𝑒𝑠𝑜𝑙𝑢𝑐𝑖ó𝑛 = 4 𝑝𝑝𝑝
1 𝑝𝑙𝑔
10 px 18 px 40 px apzi
consultores
▪ Resolución de Pantalla Tamaño absoluto
Representa el número de píxeles por pulgada (ppp) que es La anchura y la altura de la pantalla del monitor, medido generalmente
capaz de mostrar en un monitor del ordenador. en pulgadas; este tamaño va depender del monitor.
… Propiedades de la Resolución o tamaño relativo
La resolución de pantalla viene dada por el producto del ancho
imagen digital Viene determinada por el número de píxeles que se
x alto, medidos ambos en píxeles, con lo que se obtiene una muestran en la pantalla del monitor; esta resolución va
relación llamada relación de aspecto. depender de la tarjeta gráfica.
Relación de aspecto
La relación de aspecto puede variar, ya que está de acuerdo
a la forma del monitor y de la tarjeta gráfica o de video.
Monitor Tarjeta gráfica
… por ello, se pueden diferenciar dos tamaños de pantalla:
▪ Resolución de Impresión
En una impresora, se refiere
al número de puntos por
pulgadas (ppp) a los que se
puede imprimir una imagen 300 ppp 600 ppp
150 ppp – 200 ppp
digital de calidad. impresión óptima
impresión fotográfica impresión lineal
Si queremos asegurarnos, debemos alcanzar los 300 A mayor calidad por 600 ppp si la
A partir de 150 ppp podemos decir que ppp, porque muchas veces la óptica de la cámara
la resolución de impresión es buena impresión se considera mapas lineales.
digital, la limpieza del objetivo o el procesador de
(calidad aceptable). imágenes de la cámara disminuye la calidad.
apzi
consultores
▪ Modelo NCS
el modelo Natural Color System
(NCS) fue desarrollado por el
Instituto Escandinavo del Color
… Propiedades de la (Skandinavista Farginstitutet AB) de
Estocolmo en 1960.
imagen digital
▪ Modelo CIE
El modelo CIE XYZ y el modelo CIE
LAB. La CIE (Commission
Modos de Color Internationale de I´Eclairage)
propuso este modelo en 1931 como
Es el contenedor donde colocamos la información sobre cada basa sus modos de color en estándar de medida.
pixel de una imagen, definiendo el sistema que utilizamos para modelos establecidos para
▪ Árbol de Munsell
describir los colores en un entorno determinado. describir y reproducir el color. El logro de Munsell fue advertir que,
Modelo de colores Rojo dado que en estado puro unos
Es un modelo matemático abstracto que permite colores son más saturados que otros,
… podemos almacenar El modo de color determina el modelo de color Azul las relaciones se distorsionan cuando
una cantidad pequeña de representar los colores en forma numérica, utilizando
que se utiliza para mostrar en pantalla e típicamente 3 o 4 valores o componentes cromáticos.
el espectro se representa en una
datos de color en un forma regular.
contenedor muy grande, imprimir las imágenes.
▪ Sistema PANTONE
pero no podremos
PANTONE Inc. es una empresa con
almacenar una gran sede en Caristadt, Nueva Jersey
cantidad de datos de (Estados Unidos), creadora de un
color en un contenedor Verde sistema de control de color para las
muy pequeño. Estos son los modos de color más comunes y utilizados en las imágenes: artes gráficas.
Mapa de bits Escala de grises Indexado HSB RGB LAB CMYK ¿Qué es un canal de color?
Es un componente cromático de
un modo de color que puede
admitir diversas tonalidades.
R = Red (Rojo)
Canales G = Green (Verde)
RGB
B = Blue (Azul)
C = Cyan (Cian)
Canales M = Magenta (Magenta)
CMYK Y = Yellow (Amarillo)
K = Black o Key (Negro)
Síntesis Sustractiva
Es un modelo de color en síntesis sustractiva
que se utiliza en la impresión de imágenes en C M Y K
colores.
Es la versión moderna y más precisa del antiguo modelo
tradicional de coloración (RYB) que se utiliza aún en RYB
pintura y artes plásticas ( ).
la misma foto en tres estados pictóricos o foto original con todos foto en versión de foto monocromo
modos de color: sus colores escala de grises de la representa los colores sin
representados. fotografía original. escala intermedia. apzi
consultores
… Propiedades de la Descripción de las Síntesis de Color
imagen digital
Luz Blanca
Luz Roja
Se suman
longitudes de onda
Luz Azul
Luz Blanca
Filtros transparentes
Luces de color con solo
con tintes de color
algunas longitudes de onda
apzi
consultores
… Propiedades de la Bits
imagen digital es una posición de memoria que puede
tener el valor 0 ó 1
cuanto mayor sea la profundidad de
Profundidad de Color color de una imagen, más colores
Se refiere a la descripción del número de bits utilizados para dispondrá y contendrá siempre la
representar el color de cada pixel de la imagen. paleta de colores, manifestando la
representación de matrices de
la profundidad también se conoce colores más sutiles.
como profundidad de bits por pixel imagen paleta de colores
(bpp), es decir, la cantidad de color que
Paleta de colores
hay en cada pixel, y se ocupa como es aquel que se utiliza para designar al conjunto de colores y
unidad de medida sobre todo cuando tonalidades existentes o elegidas para decorar, pintar,
se específica junto con el número de colorear algún objeto o superficie.
bits utilizados.
en la tabla podemos comprobar el número de colores Las cámaras digitales suelen asignar 12 bits por canal de color:
8 𝑏𝑖𝑡𝑠 = 1 𝑏𝑦𝑡𝑒
posibles según el número de bits de profundidad de color.
CÁMARA PROFUNIDAD
COLOR RESULTADO
DIGITAL DE EDITORES
Profundidad Colores Descripción
Preprocesamiento de imágenes
▪ Se trabaja directamente con los puntos (pixels) para extraer
propiedades como el gradiente, profundidad, textura, color, etc.
▪ Poco uso del conocimiento acerca del contenido de las imágenes.
▪ Procesamiento guiado por operador humano o algún algoritmo de
alto nivel.
▪ A la entrada y salida se tienen datos del mismo tipo (imágenes).
Obtener una descripción Este proceso es muy Descomponer el problema Se reduce y refina en cada No es siempre secuencial,
de una imagen complejo en varias etapas o niveles nivel hasta conseguir la sin que hay interacciones
de visión descripción deseada y retroalimentación
apzi
consultores
Interpretación de imágenes
▪ Orienta al proceso de interpretación de los entes obtenidos en los
niveles inferiores y se utilizan modelos o conocimiento a priori del
problema.
▪ Se caracteriza por el uso explícito de conocimiento acerca de la
escena.
▪ Procesamiento guiado por objetos o fines a cumplir.
▪ Empleo de técnicas propias de inteligencia artificial.
▪ Obtención de conocimiento o datos simbólicos acerca de la escena
partiendo de datos del tipo “imagen”
Segmentación de imágenes
Nivel ▪ Segmentación, extracción de
Alto características,
transformaciones espectrales,
codificación, transmisiones,
Nivel comprensión de imágenes,
Medio descripción, captura,
digitalización, almacenamiento,
recuperación, supresión de
ruido, realce, etc.
procesamiento de ▪ Agrupa los elementos obtenidos
la imagen Nivel en el nivel bajo para obtener
Bajo bordes, líneas, regiones,
generalmente con el propósito
de segmentar la imagen.
Preprocesamiento de imágenes
▪ Se trabaja directamente con los puntos (pixels) para extraer
propiedades como el gradiente, profundidad, textura, color, etc.
▪ Poco uso del conocimiento acerca del contenido de las imágenes.
▪ Procesamiento guiado por operador humano o algún algoritmo de
… y otros alto nivel.
▪ A la entrada y salida se tienen datos del mismo tipo (imágenes).
evalúa y establece
relaciones dentro de los verifica y valida el
datos, prediciendo conjuntos de datos,
resultados en base al confirmando si cumplen
colección organizada de diseño del modelo con los requisitos
datos tabulados que propuesto. específicos.
contiene valores y
variedad de información. prueba de datos
ordenador algoritmos entrenamiento de datos
DOC
datasets
XLS
modelo
DB
VP FP
sistema que aprende
FN VN a reconocer patrones
específicos y tomar
conjunto de datos
decisiones a partir de
(características)
matriz de confusión un conjuntos de
datos.
colección de datos
relacionados y caracterizados exactitud precisión sensibilidad puntuación F1
depuración de datos (accuracy) (precision) (recall) (F1 score)
de un tema con diferentes
tipos de información. evalúa y mide el rendimiento del modelo
proceso de detectar y corregir o eliminar propuesto, comparando los valores predichos
registros incorrectos o corruptos de un con los valores reales del conjunto de datos.
conjunto de datos tabulados. apzi
consultores
… metodología para desarrollar
Procesamiento de Imágenes
apzi
consultores
… descripción de la metodología Juntando todo lo anterior, podemos obtener una estructura global de los
Procesamiento de Imágenes niveles del procesamiento en un sistema de visión genérica.
0 1 0 1 0 1 0 0 1 0 1 0 1 0 1 0 1 0 0 1 0 1 0 1 0 1 0 1 0