INSTITUTO POLITÉCNICO NACIONAL
Sección de estudios de Posgrado e Investigación
Departamento de Telecomunicaciones
Clasificación de imágenes satelitales mediante el
uso de Memorias Asociativas
TESIS
Que para obtener el grado de:
MAESTRO EN CIENCIAS EN INGENIERÍA DE
TELECOMUNICACIONES
PRESENTA
EDWIN RAFAEL CERVANTES GÓMEZ
DIRECTORES DE TESIS:
DR. MARCO ANTONIO ACEVEDO MOSQUEDA
DRA. MARIA ELENA ACEVEDO MOSQUEDA
México, D. F., Junio de 2014
I
II
III
Dedicatoria
Dedico ésta tesis a todos aquellos que día a día mantienen un compromiso
permanente por mejorar el nivel académico en México, coadyuvando en su
formación no solo profesional, sino en la vida misma. Luchando
inquebrantablemente por desarrollar en cada ser, un espíritu indomable.
A todos aquellos que vienen detrás, a quienes nos debemos como un vivo
ejemplo a seguir siendo la guía y la luz que ilumine su camino.
Asimismo a mis profesores, amigos y a mi familia, quienes hombro
con hombro me acompañaron por el largo camino de la formación
educativa y de la vida. Me dieron su confianza y su cariño, me
motivaron y condujeron siempre por el camino correcto.
En especial a mi abuelo Rafael Cervantes Martínez, por ser
tan apasionado con la ciencia, y ser para mí el mejor ejemplo
a seguir de un verdadero ingeniero.
“SI TIENES UN GRAN SUEÑO DEBES ESTAR DISPUESTO A UN GRAN ESFUERZO PARA CONCRETARLO,
POR QUE SOLO LO GRANDE ALCANZA LO GRANDE”
Facundo Cabral
IV
Agradecimientos
Agradezco profundamente a todos aquellos que depositaron su confianza en mí y
que me impulsaron y apoyaron en los momentos de incertidumbre, compartiendo
su experiencia y conocimiento, cuyas lecciones de vida, son el mejor regalo que
pudieron otorgarme.
Gracias a Celsa Gómez Ortíz, mi madre, por su incondicional apoyo y
comprensión, ya que sin ella no habría podido alcanzar este sueño.
Gracias a Rafael Cervantes Villanueva, mi padre, por estar siempre cuando
más lo he necesitado, darme la mejor herencia en vida que jamás podría haber
deseado: “Mi carrera”.
A mis hermanos Brian y Linda, por motivarme en todo momento a seguir
luchando y tratar de ser un buen ejemplo a seguir.
A mi tío Cesar David Ramírez Ortíz y a Jesús Flores por asesorarme en
todo momento durante la maestría.
A mis amigos, en especial a Alejando Gómez Velastegui, por su apoyo, sus
consejos y por ayudarme a retomar el camino.
A mis asesores Dr. Marco A. Acevedo Mosqueda y Dra. María Elena
Acevedo Mosqueda por guiarme y ayudarme a alcanzar una meta más en
mi vida.
“NO NOS ATREVEMOS A MUCHAS COSAS PORQUE SON DIFÍCILES, PERO SON DIFÍCILES PORQUE NO
NOS ATREVEMOS A HACERLAS”
Lucio Anneo Séneca
V
Simbología
M memoria asociativa, memoria asociativa morfológica máx.
W memoria asociativa morfológica mín.
mij ij-ésima componente de la memoria asociativa M.
x vector columna que corresponde a un patrón de entrada.
Y vector columna que corresponde a un patrón de salida.
(x,y) asociación de un patrón de entrada con uno de salida.
(xk,yk) asociación de la k-ésima pareja de patrones.
{(xξ,yξ) | ξ=1,2,…,p} conjunto fundamental.
~
x
k
Versión alterada del patrón fundamental xk.
xµ j-ésima componente de un vector columna xµ.
n dimensión de los patrones de entrada.
m dimensión de los patrones de salida.
p número de parejas del conjunto fundamental.
V operación máximo.
⋀ operación mínimo.
⊠ operador que indica que cualquier operación entre dos
vectores debe seguir las propiedades de multiplicación de
matrices.
VI
Glosario
Asociación: Relación que se establece entre dos patrones.
Clase: Son los grupos o conjuntos de patrones que
representan un mismo tipo de concepto.
Conjunto fundamental: Es un conjunto finito de asociaciones de entrada-salida
conocidas, es decir, *( ) + donde p es
número de patrones totales.
Escala de grises: Conjunto de todos los posibles niveles de gris en una
imagen monocromática.
Memoria asociativa: Dispositivo o modelo matemático que permite
almacenar o memorizar relaciones entre patrones.
Patrones: Son representaciones abstractas de un objeto en el
mundo físico; los patrones exhiben cierta regularidad en
una colección de observaciones conectadas en el
tiempo, en el espacio o en ambas, y que pueden servir
como modelo.
Píxel: Elemento discreto de una imagen digital, cuyo valor
indica la intensidad del color o del nivel de gris de la
imagen en ese punto.
Reconocimiento de Es la rama científica que se encarga de emular la
patrones: habilidad humana de reconocer objetos, mediante
técnicas y métodos que sean implementados en
máquinas desarrolladas y construidas para este fin.
Recuperación: Proceso mediante el cual dado un patrón conocido
como llave se obtiene de una memoria asociativa el
patrón asociado a dicha llave.
VII
Resumen
En este documento se describe un algoritmo nuevo para clasificar imágenes
satelitales SPOT. Se utiliza la teoría de las Memorias Asociativas y un banco de
pruebas de 280 muestras obtenidas de cinco escenas SPOT diferentes del
territorio Mexicano.
Se clasificaron siete clases diferentes: agua, nubes, sombras, hielo, suelo,
vegetación de cobertura alta y vegetación de cobertura baja. El algoritmo está
compuesto de tres partes fundamentales, el entrenamiento de la memoria, la
recuperación o clasificación de los patrones del conjunto fundamental y la
clasificación de imágenes no conocidas por la memoria.
Para generar la Memoria Asociativa Morfológica primero aplicamos la operación
de máximos para la etapa de entrenamiento y mínimos en la de recuperación,
posteriormente entrenamos usando mínimos y recuperamos con máximos. Esto
con la finalidad de comparar que operación nos arroja mejores resultados.
VIII
Abstract
This thesis describes a novel algorithm to classify SPOT satellite images. The
Theory of Associative Memories and a test of 280 samples obtained from five
different Mexican territory SPOT scenes were used.
Seven different classes were classified: Water, clouds, shadows, ice, soil, high
coverage vegetation and low coverage vegetation. The algorithm consists of three
main parts, the memory training, recovery or classification of the fundamental set
and image classification of unknown patterns.
To generate the Morphological Associative Memory, we first apply the maximum
operation for the training stage and the minimum operation in the recovery stage.
Then we train using minimum and we recover with maximum. This was done to
compare which operation gives us better results.
IX
ÍNDICE
Capítulo 1 ......................................................................................................................................... 1
Introducción ..................................................................................................................................... 1
1.1. Antecedentes ........................................................................................................................ 1
1.2. Justificación.......................................................................................................................... 2
1.3. Objetivos................................................................................................................................ 2
1.4. Organización del documento............................................................................................. 3
Capítulo 2 ......................................................................................................................................... 4
Marco Teórico y Estado del Arte.................................................................................................. 4
2.1. Percepción Remota .............................................................................................................. 4
2.1.1. ESPECTRO ELECTROMAGNÉTICO ................................................................... 5
2.1.2. ADQUISICION DE DATOS ..................................................................................... 8
2.1.3. IMÁGENES SATELITALES .................................................................................. 10
2.1.4. CARACTERÍSTICAS DE UNA IMAGEN SATELITAL ...................................... 13
2.1.5. PLATAFORMA SPOT ........................................................................................... 19
2.1.6. CLASIFICACIÓN DE IMÁGENES SATELITALES ............................................ 27
Capítulo 3 ....................................................................................................................................... 30
Memorias Asociativas .................................................................................................................. 30
3.1. Conceptos básicos de una Memoria Asociativa........................................................... 30
3.1.1. DEFINICIÓN TÉCNICA DE UNA MEMORIA ASOCIATIVA. ................................ 33
3.2. Memorias Asociativas Morfológicas .............................................................................. 34
3.2.1. MEMORIAS MORFOLÓGICAS AUTOASOCIATIVAS (MAX Y MIN) ................. 34
3.2.2. MEMORIAS MORFOLÓGICAS HETEROASOCIATIVAS (MAX Y MIN) ........... 36
Capítulo 4 ....................................................................................................................................... 40
Implementación del Algoritmo de Clasificación propuesto ................................................. 40
4.1. Obtención de imágenes SPOT ........................................................................................ 41
4.2. Clasificación de imágenes SPOT 5 ................................................................................ 43
4.2.1. SECCIÓN DE ÁREAS DE INTERÉS ....................................................................... 43
4.2.2. ENTRENAMIENTO DE LA MEMORIA .................................................................... 47
4.2.3. PRESENTACIÓN DE LA IMAGEN A CLASIFICAR .............................................. 54
Capítulo 5 ....................................................................................................................................... 57
Pruebas y Resultados ................................................................................................................... 57
X
Capítulo 6 ....................................................................................................................................... 78
Conclusiones y trabajos futuros ................................................................................................. 78
6.1. Productos derivados de esta tesis ................................................................................... 79
6.2. Trabajos futuros .................................................................................................................. 79
Referencias ..................................................................................................................................... 80
ANEXO I ......................................................................................................................................... 83
Índice de figuras
Fig.1. 1. Esquema operativo de un satélite de observación ...................................................... 5
Fig.1. 2. Campo eléctrico y campo magnético. ............................................................................ 6
Fig.1. 3. Espectro electromagnético. ............................................................................................. 7
Fig.2. 1. Imagen pancromática. .................................................................................................... 11
Fig.2. 2. Imagen multiespectral .................................................................................................... 12
Fig.2. 3. Estructura de una imagen satelital. .............................................................................. 14
Fig.2. 4. Cubo de colores. ............................................................................................................. 17
Fig.2. 5. Combinación de bandas. ............................................................................................... 18
Fig.2. 6. Satélite Spot 5. ................................................................................................................ 19
Fig.3. 1. Representación gráfica de una memoria asociativa. ................................................ 31
Fig.3. 2. Un patron junto con tres versiones ruidosas del mismo. .......................................... 32
Fig.3. 3. Memoria asociativa M. ................................................................................................... 33
Fig.4. 1. Diagrama general del proceso de clasificación. ......................................................... 40
Fig.4. 2. Escenas Spot 5 multiespectrales. ................................................................................ 42
Fig.4. 3. Metadatos de una escena Spot. ................................................................................... 42
Fig.4. 4. Combinación de bandas espectrales........................................................................... 43
Fig.4. 5. Bandas espectrales de una imagen multiespectral. .................................................. 44
Fig.4. 6. Muestras tomadas para la clase 1: .............................................................................. 45
Fig.4. 7. Muestras de la clase 2. .................................................................................................. 45
Fig.4. 8. Clase nubes. .................................................................................................................... 46
Fig.4. 9. Clase sombras. ............................................................................................................... 46
Fig.4. 10. Clase hielo. .................................................................................................................... 46
Fig.4. 11. Clase 6 suelo. ................................................................................................................ 47
Fig.4.12. Clase 7. ........................................................................................................................... 47
Fig.4. 13. Conversión de imagen a vector. ................................................................................. 48
Fig.4. 14. Escena Spot a clasificar. ............................................................................................. 54
Fig.4. 15. Subimagen de 510 x 510 píxeles. .............................................................................. 55
XI
Fig.4. 16. Proceso de clasificación. ............................................................................................. 56
Fig.5. 1. Tonalidades de azul que clasifica mal. ........................................................................ 58
Fig.5. 2. Sección de una imagen Spot a clasificar. ................................................................... 64
Fig.5. 3. Zona con alta densidad de vegetación. ....................................................................... 71
Índice de tablas
Tabla 2. 1. Escala de una imagen satelital................................................................................. 16
Tabla 2. 2. Satélites Spot activos e inactivos............................................................................. 20
Tabla 2. 3. Resolución espacial y espectral, Spot 5, 4, 3, 2,1. ............................................... 23
Tabla 2. 4. Instrumento de alta resolución. ................................................................................ 23
Tabla 2. 5. Resumen general de Spot. ....................................................................................... 24
Tabla 4. 1. Resolución espacial y espectral del Spot 5. ........................................................... 41
Tabla 5. 1. Resultados prueba 1. ................................................................................................. 57
Tabla 5. 2. Resultados prueba 2. ................................................................................................. 58
Tabla 5. 3. Resultados prueba 3. ................................................................................................. 59
Tabla 5. 4. Resultados prueba 4. ................................................................................................. 60
Tabla 5. 5. Resultados prueba 5. ................................................................................................. 61
Tabla 5. 6. Caso 1. ......................................................................................................................... 62
Tabla 5. 7. Caso 2. ......................................................................................................................... 62
Tabla 5. 8. Caso 3. ......................................................................................................................... 62
Tabla 5. 9. Caso 4. ......................................................................................................................... 63
Tabla 5. 10. Caso 5. ....................................................................................................................... 63
Tabla 5. 11. Clasificación usando memorias de máximos y mínimos.................................... 63
Tabla 5. 12. Imagen clasificada parte 1 de 6 ............................................................................. 65
Tabla 5. 13. Segunda imagen clasificada parte 1 de 5 ............................................................ 73
XII
Capítulo 1
Introducción
En este documento se presentan las bases teóricas que sustentan el
funcionamiento del Algoritmo de clasificación propuesto, mismo que pertenece al
enfoque asociativo de clasificación de patrones.
1.1. Antecedentes
Las imágenes obtenidas por los satélites de teledetección ofrecen una
perspectiva única de la Tierra, de sus recursos y del impacto que sobre ella
ejercen los seres humanos. La teledetección por satélite ha demostrado ser una
fuente rentable de valiosa información para numerosas aplicaciones, entre las que
cabe citar la planificación urbana, vigilancia del medio ambiente, gestión de
cultivos, prospección petrolífera, exploración minera, desarrollo de mercados,
localización de bienes raíces y muchas otras [1]-[7]. Las imágenes satelitales
de alta resolución permiten ver claramente detalles de lo que ocurre tanto en el
espacio como en la tierra por eso se utilizan cada vez más y más.
Del mismo modo realizar una buena clasificación de estas imágenes, es de
suma importancia, como por ejemplo en la generación de mapas temáticos o
estudio de recursos naturales, donde es necesario la identificación de diferentes
objetos que van desde cuerpos de agua, vegetación, suelo, nubes, hasta la
identificación específica de tipos de suelos, y comunidades de vegetación.
1
Capítulo 1 Introducción
1.2. Justificación.
Como bien se sabe el objetivo de la percepción remota es la obtención de
información de un objeto, área o fenómeno sin estar en contacto directo con éste
[4]. Con la clasificación llegamos a la etapa de operaciones de extracción de
información reemplazando el análisis visual de la imagen mediante la aplicación
de técnicas cuantitativas para automatizar la identificación de los objetos
contenidos en una escena. Por lo que el tener una buena clasificación es de suma
importancia para gran variedad de aplicaciones, en especial en los mapas de
clasificación donde las zonas del terreno se clasifican y agrupan en clases de
ocupación.
Actualmente no es posible decidir qué clasificador es el mejor para todas las
situaciones dada la gran variedad de escenas y circunstancias que los trabajos de
percepción remota enfrentan. La mayoría de los clasificadores son bastante
complejos, algunos necesitan un preprocesamiento de las escenas, otros
requieren una gran capacidad de procesamiento, o se necesita adquirir algún
software especial como por ejemplo el clasificador por máxima probabilidad, el
software ERDAS y el ISODATA [5]. Por esta razón en este trabajo se propone un
algoritmo de clasificación nuevo en el cual se usen las imágenes tal como son
adquiridas aumentando la velocidad de procesamiento y disminuyendo la
complejidad que otros algoritmos presentan.
1.3. Objetivos.
Objetivo general:
Clasificar una escena SPOT en siete clases diferentes: Agua, nubes, sombras,
hielo, suelo, vegetación de cobertura alta y vegetación de cobertura baja.
Objetivos particulares:
Clasificar una imagen satelital usando una memoria morfológica entrenada
con máximos.
Clasificar una imagen satelital usando una memoria morfológica entrenada
con mínimos.
Obtener un porcentaje de recuperación cercano al 100% en el conjunto
fundamental.
2
Capítulo 1 Introducción
1.4. Organización del documento
En este Capítulo se han presentado: los antecedentes, la justificación, y el
objetivo de este trabajo de tesis. El resto del documento está organizado como se
describe a continuación.
En el Capítulo 2 se presentan los conceptos básicos necesarios para
comprender el tema a tratar y el estado del arte del área de investigación dentro
de la cual se encuentra circunscrita la presente tesis, que es la clasificación de
imágenes satelitales. Por otro lado, aquellas herramientas matemáticas,
materiales y métodos necesarios para la presentación del algoritmo propuesto
serán expuestos en el Capítulo 3.
El Capítulo 4 es la parte más relevante de este documento. En el mismo se
presenta la implementación detallada del Algoritmo de clasificación propuesto. Las
pruebas y resultados experimentales, así como la discusión de los mismos, son
presentados en el Capítulo 5; y en el Capítulo 6 se presentan las conclusiones y
trabajos futuros.
3
Capítulo 2
Marco Teórico y Estado del Arte
2.1. Percepción Remota
La Percepción Remota (Remote Sensing) o Teledetección es la ciencia y arte
de obtener información de un objeto, área o fenómeno a través del análisis de los
datos adquiridos mediante algún dispositivo que no está en contacto físico con el
objeto, área o fenómeno investigados. Esto es posible gracias a la radiación
electromagnética.
Los objetos terrestres, iluminados por la radiación solar, reflejan ésta luego de
introducir en ella modificaciones inducidas por la misma estructura y composición
de dichos objetos. La radiación reflejada es capturada por los sensores del
satélite, siendo parcialmente procesada a bordo de éste y retransmitida a
estaciones receptoras terrestres para su posterior procesamiento y análisis [4],
[5].Ver Fig. 1.1
La Percepción Remota involucra dos procesos básicos:
Adquisición de datos desde plataformas con sensores adecuados.
Análisis de los datos mediante dispositivos visuales o digitales.
Al igual que una cámara digital, un sensor de satélite no posee película. En su
lugar, cuenta con miles de detectores diminutos que miden la cantidad de
radiación electromagnética (es decir, la energía) que refleja la superficie de la
tierra y los objetos que hay en ella. Estas mediciones se denominan espectrales.
Cada valor de reflectancia espectral se registra como un número digital. Estos
números se transmiten de nuevo a la tierra donde un ordenador los convierte en
colores o matices de gris para crear una imagen que se parece a una fotografía.
Dependiendo de la sensibilidad para la que han sido concebidos, los sensores
miden la reflectancia de la energía en las partes visible del espectro
electromagnético del infrarrojo cercano, medio y térmico.
4
Capítulo 2 Marco Teórico y Estado del Arte
Fig.1. 1. Esquema operativo de un satélite de observación
La Percepción Remota permite elaborar levantamientos de altos volúmenes de
información de la superficie terrestre que sirve de apoyo a diversas ciencias de
cara a un conocimiento más avanzado del espacio que nos circunda.
Dentro de este esquema, la Percepción Remota ocupa un lugar de notable
aplicación en las actividades, agrícolas, medioambientales, catastrales, militares,
industriales y de ordenamiento territorial; lo cual subraya el interés de esta técnica
para un amplio abanico de disciplinas y pone de manifiesto la necesidad de
promover este tipo de tecnología de una forma adecuada que constituya un apoyo
muy conveniente para reducir los costos y el tiempo invertido para la elaboración
de un proyecto o estudio.
2.1.1. ESPECTRO ELECTROMAGNÉTICO
La energía electromagnética o energía radiante es una entidad física que se
manifiesta bajo dos aspectos complementarios entre sí: el ondulatorio y el
corpuscular [1], [4], [5]. La concepción ondulatoria que permite explicar ciertos
fenómenos como los de difracción e interferencia interpreta la radiación como un
campo eléctrico y uno magnético oscilando en planos perpendiculares (Fig.1.2). El
fenómeno ondulatorio posee una doble periodicidad: en el espacio y en el tiempo.
La periodicidad espacial determina la longitud de onda que es la distancia entre
dos puntos consecutivos de igual amplitud del campo eléctrico o magnético. El
intervalo de tiempo transcurrido entre dos instantes consecutivos en que uno u
otro campo alcanza igual valor se denomina período t. Se define la frecuencia de
la radiación como la relación 1/t que se expresa en ciclos por segundo.
5
Capítulo 2 Marco Teórico y Estado del Arte
Fig.1. 2. Campo eléctrico y campo magnético.
La concepción corpuscular permite explicar ciertos hechos experimentales
como el efecto fotoeléctrico y la absorción de radiación por las moléculas y
consiste en concebir la radiación como un haz de corpúsculos llamados cuantos
de radiación o fotones que se desplazan en la dirección del haz con la velocidad
de la luz.
Las concepciones ondulatoria y corpuscular de la radiación se concilian en la
relación de PLANCK:
(2.1)
Dónde:
ε = energía del fotón
h = constante de Planck (6.63 x 10-34 Js)
v = frecuencia del movimiento ondulatorio
La relación de Planck permite que un haz de radiación de determinada
frecuencia (o longitud de onda) sea interpretado como un flujo de cuantos de
determinada energía.
En la Fig.1.3 se representa el espectro electromagnético. La región visible del
espectro electromagnético representa sólo una pequeña fracción de éste.
6
Capítulo 2 Marco Teórico y Estado del Arte
El espectro visible es aquel con el que estamos más familiarizados; se observa
cuando la luz blanca es dispersada por la refracción de un arco iris. Todos los
tipos de cobertura terrestre (tipos de roca, cuerpos de agua, tipos de vegetación,
cascos urbanos etc.) absorben una parte de la radiación electromagnética,
dándole una firma distinguible de otra a lo largo del espectro.
Fig.1. 3. Espectro electromagnético.
Rangos del espectro electromagnético desde la región visible hasta las
microondas.
Espectro Visible (0.4 a 0.7 µm). Es la única radiación electromagnética
que puede percibir el ojo humano.
Infrarrojo Cercano (0.7 a 1.3 µm). Es de especial importancia, puesto que
puede detectarse a partir de films dotados de emulsiones especiales.
Infrarrojo Medio (1.3 a 8.0 µm). Se entremezclan los procesos de reflexión
de la luz solar y de emisión de la superficie terrestre.
Infrarrojo Lejano o Térmico (8.0 a 14 µm). Incluye la porción emisiva del
espectro terrestre.
7
Capítulo 2 Marco Teórico y Estado del Arte
Microondas (a partir de 1 mm). Energía bastante transparente a la
cubierta nubosa.
A continuación se muestran algunas aplicaciones en distintas longitudes de onda.
Azul Visible:
Cartografía de aguas someras.
Diferenciación de suelo y vegetación.
Verde Visible:
Diferenciación de la vegetación por su salud.
Rojo Visible:
Diferenciación de la vegetación por especies.
Infrarrojo Cercano:
Cartografía de la vegetación.
Cartografía del vigor/salud de la vegetación.
Diferenciación de la vegetación por especies.
Infrarrojo Medio:
Diferenciación de los tipos de rocas por composición.
Detección de humedad en la vegetación y suelo.
Cartografía de la estructura geológica.
Trazado de límites tierra/agua.
2.1.2. ADQUISICION DE DATOS
La detección de las radiaciones electromagnéticas, fundamentalmente
emitidas por el sol y reflejadas por los objetos terrestres, o incluso emitidas por
dichos objetos puede efectuarse por medios fotográficos o eléctricos.
Históricamente fueron la placa o el film fotográfico, usualmente sobre plataformas
aéreas, los sensores remotos por excelencia. Estos, a partir de las últimas
décadas, debieron convivir con los sensores electrónicos, más adecuados para las
exigencias a que son sometidos sobre plataformas suborbitales y satelitales.
En general, los satélites utilizan sensores [1]-[7] electrónicos de estado sólido,
adecuados a las regiones espectrales para las que se desea obtener imágenes.
Cada satélite puede registrar las imágenes terrestres simultáneamente en varias
8
Capítulo 2 Marco Teórico y Estado del Arte
regiones, visible e infrarrojo cercano, medio o térmico del espectro
electromagnético. Los sistemas óptico-telescópicos del satélite enfocan las
escenas terrestres sobre arreglos de tales detectores y las señales analógicas
generadas por éstos son digitalizadas para su retransmisión, sea a otros satélites
geosincrónicos o sea a estaciones rastreadoras terrenas.
2.1.2.1 Sensores Remotos.
Existen gran número de sensores destinados a numerosas aplicaciones. Los
llamados espectroradiómetros de barrido (scanning radiometers) son de particular
importancia en sistemas de percepción remota. En la gran mayoría de estos
instrumentos el mecanismo de base es el efecto fotoeléctrico: cuando un haz de
fotones incide sobre una placa negativamente cargada o sobre algún material
fotosensible adecuado se produce una emisión de partículas negativas
(electrones). Estos electrones pueden fluir desde la placa generando una señal
electrónica. La magnitud de la corriente eléctrica producida (número de
fotoelectrones por unidad de tiempo) es directamente proporcional a la intensidad
luminosa. La energía cinética de los fotoelectrones emitidos varía con la longitud
de onda asociada a los fotones incidentes. Sin embargo, debe tenerse en cuenta
que diferentes materiales que manifiestan el fenómeno fotoeléctrico liberan
fotoelectrones bajo diferentes intervalos de longitudes de onda: cada uno de ellos
presenta un umbral de longitudes de onda para el que el fenómeno se manifiesta y
otro umbral de longitudes de onda para el que el fenómeno cesa.
Como los sensores son instrumentos capaces de medir cuantitativamente la
radiación electromagnética en determinadas regiones del espectro se denominan
radiómetros. Cuando este sensor incluye además un componente del tipo de un
prisma o red de difracción o filtros de interferencia que pueden dispersar la
radiación de una dada región del espectro en longitudes de onda discretas que
son dirigidas hacia los detectores se denomina espectrómetro. Cuando la
radiación es dispersada no en longitudes de onda discretas sino en bandas
espectrales más anchas, es decir cubriendo ciertos intervalos de longitudes de
onda el término más conveniente para el sensor es espectroradiómetro. Este es el
caso más usual en los sensores aeroespaciales.
Existen dos opciones básicas usadas para la percepción remota de los objetos
sobre el terreno:
Sistemas de Percepción Activa
Sistemas de Percepción Pasiva
Sistemas de Percepción Activa.
Los sistemas de percepción activa generan una señal, rebota en un objeto, y
miden las características de la señal reflejada. Un ejemplo de este tipo de
9
Capítulo 2 Marco Teórico y Estado del Arte
percepción es el Radar. Las ondas de radio son emitidas por un transistor son
recogidas por un receptor después de haber sido reflejadas por un objeto. Las
señales reflejadas pueden ser usadas por los sistemas Radar para determinar la
distancia y dirección de los objetos percibidos. También se pueden crear
imágenes de los objetos. En este sistema no afecta la presencia de Nubes.
Un radar es un sensor activo de microondas el cual utiliza ondas de radio para
detectar la presencia de objetos y para determinar su rango (posición). Este
proceso requiere transmitir pequeños pulsos de energía de microondas en la
dirección de interés y grabar la fuerza y el origen de los “ecos” o “reflexiones”
recibidos desde objetos dentro del campo de visión del sistema. El poder de
resolución del radar (su habilidad para diferenciar entre objetivos), está
determinado por la longitud de onda transmitida por este.
Los sensores activos (por ejemplo, radar, sonar) son capaces de iluminar un
objeto con su propia fuente de radiación. La iluminación va a inducir a un objeto a
emitir radiación (fluorescencia) o causar que refleje la radiación producida por el
sensor. Los sensores activos son utilizados frecuentemente cuando la radiación
natural en una banda particular del espectro no es suficiente para iluminar
adecuadamente al objetivo, esto es, la radiación natural está por debajo del
umbral de la señal para ruido.
Sistemas de Percepción Pasiva.
Las imágenes creadas por los sistemas de percepción pasiva son de mayor
valor en las aplicaciones de la percepción remota en la evaluación de los recursos
naturales. Los sistemas pasivos simplemente reciben las señales emitidas
naturalmente y reflejadas por los objetos percibidos. Estas señales, generadas por
la radiación solar natural, pueden proveer una información muy rica sobre los
objetos percibidos.
La resolución espectral de un sensor es su habilidad para diferenciar las
longitudes de onda del espectro electromagnético. La resolución radiométrica es
su habilidad para distinguir diferentes niveles de intensidad de la radiación
electromagnética en una banda espectral dada.
2.1.3. IMÁGENES SATELITALES
Una imagen satelital es una matriz digital de puntos (igual a una fotografía
digital) capturada por un sensor montado a bordo de un satélite que órbita
alrededor de la Tierra. A medida que el satélite avanza en su órbita, “barre” la
superficie con un conjunto de detectores que registran la energía reflejada.
La teledetección espacial hace uso de las imágenes satelitales como un
insumo de datos para extraer información del medio geofísico y geográfico. El
número de bandas, las regiones del espectro electromagnético en las cuales éstas
10
Capítulo 2 Marco Teórico y Estado del Arte
se encuentran localizadas, la resolución espacial y el tamaño de la imagen,
producidas por los diferentes satélites es variado.
Las imágenes de satélite, se encuentran en formato raster, el cual consiste en
una matriz de miles de pixeles, en donde cada pixel tiene un valor digital o de
reflectancia; ejemplificando, si la resolución de la imagen es de 30 metros, cada
pixel muestra un área en la superficie terrestre de 30 x 30 metros ( ), con
esto, la firma espectral o reflectancia de todos los objetos existentes en una
superficie de será promediada para darle su valor digital al píxel. La
información contenida en cada píxel está en formato digital, normalmente de 8 bit
por lo que cada píxel de la imagen puede tener posibles valores o
colores distintos, en donde el 0 corresponde al color negro, 255 al color blanco y
se encuentran 254 distintos tonos de gris intermedios [4], [5].
Entender la diferencia entre información espacial y espectral es muy importante
porque se trata del primer paso para elegir entre los dos tipos fundamentales de
imágenes de satélite: pancromáticas y multiespectrales.
2.1.3.1 Imágenes pancromáticas.
Son imágenes que se captan mediante un sensor digital que mide la
reflectancia de energía en una amplia parte del espectro electromagnético (con
frecuencia, tales porciones del espectro reciben el nombre de bandas). Para los
sensores pancromáticos más modernos, esta única banda suele abarcar la parte
visible y de infrarrojo cercano del espectro. Los datos pancromáticos se
representan por medio de imágenes en escala de grises.
Fig.2. 1. Imagen pancromática.
11
Capítulo 2 Marco Teórico y Estado del Arte
En la Fig. 2.1, se presenta una imagen pancromática con una resolución
espacial de 5m y de 12000 x 12000 píxeles.
2.1.3.2 Imágenes multiespectrales.
Se captan mediante un sensor digital que mide la reflectancia en muchas
bandas. Por ejemplo, un conjunto de detectores puede medir energía roja reflejada
dentro de la parte visible del espectro mientras que otro conjunto mide la energía
del infrarrojo cercano. Es posible incluso que dos series de detectores midan la
energía en dos partes diferentes de la misma longitud de onda. Estos distintos
valores de reflectancia se combinan para crear imágenes de color. Los satélites de
teledetección multiespectrales de hoy en día miden la reflectancia
simultáneamente en un número de bandas distintas que pueden ir de tres a
catorce. En la Fig.2.2 tenemos una imagen multiespectral con cuatro bandas
espectrales.
Fig.2. 2. Imagen multiespectral
2.1.3.3 Imágenes hiperespectrales.
Las imágenes hiperespectrales se obtienen mediante un sensor espectral que
mide la reflectancia en muchas bandas, con frecuencia cientos. La teoría en lo que
se apoya la detección hiperespectral es que la medida de la reflectancia en
numerosas franjas estrechas del espectro permite detectar características y
diferencias muy sutiles entre los rasgos de la superficie, especialmente en lo que
se refiere a vegetación, suelo y rocas.
12
Capítulo 2 Marco Teórico y Estado del Arte
Los sensores hiperespectrales recopilan información como un conjunto de
"imágenes". Cada imagen representa un rango del espectro electromagnético
también conocido como banda espectral. Estas "imágenes" se combinan y forman
una imagen tridimensional hiperespectral, un cubo de datos, para el
procesamiento y análisis.
2.1.3.4 Aplicaciones Pancromáticas.
Localizan, identifican y miden accidentes superficiales y objetos,
principalmente por su apariencia física, es decir, forma, tamaño, color y
orientación.
Identifican y cartografían con precisión la situación de los elementos
generados por la acción del hombre, como edificios, carreteras, veredas,
casas, equipamientos de servicios públicos, infraestructura urbana,
aeropuertos y vehículos.
Actualizan las características físicas de los mapas existentes.
Trazan los límites entre tierra y agua.
Identifican y cuantifican el crecimiento y desarrollo urbano.
Permiten generar modelos digitales de elevación de gran exactitud.
Catalogan el uso del suelo.
2.1.3.5 Aplicaciones Multiespectrales.
Distinguen las rocas superficiales y el suelo por su composición y
consolidación.
Delimitan los terrenos pantanosos.
Estiman la profundidad del agua en zonas litorales.
Catalogan la cubierta terrestre.
2.1.4. CARACTERÍSTICAS DE UNA IMAGEN SATELITAL
2.1.4.1 Estructura de una imagen satelital.
Una imagen digital consiste de elementos discretos denominados pixeles.
Estos elementos bidimensionales constituyen los menores elementos no divisibles
de la imagen. En la Fig.2.3 vemos en forma esquemática cómo una imagen digital
está compuesta de pixeles ubicados en la intersección de cada fila i y columna j en
cada una de las k bandas correspondientes a una dada escena [5].
Cada pixel en cada banda está en perfecto registro geométrico con sus
equivalentes de las restantes bandas. Asociado a cada pixel existe un número
(Número Digital, DN) que mide la radiancia promedio o brillo correspondiente al
13
Capítulo 2 Marco Teórico y Estado del Arte
área de escena abarcada por dicho pixel. En una base binaria de 8 bits el DN
poseerá 256 valores en un rango de 0 a 255.
Fig.2. 3. Estructura de una imagen satelital.
Estos valores pueden ser modulados para producir en la pantalla de una
computadora una escala de grises que va desde el negro (DN=0) hasta el blanco
(DN=255). O sea que para cada pixel en una escena que consta de k bandas
espectrales habrá asociados k niveles de grises. Estos definen un espacio
espectral k dimensional en el que cada pixel es representado por un vector que
constituye su firma espectral y que permitirá, a través de operaciones de
clasificación basadas en algoritmos matemático-estadísticos, asignar dicho pixel a
clases temáticas definidas. El área terrestre representada por un pixel está
determinada por la altura del sensor y los parámetros de diseño de éste,
particularmente el campo de visión instantáneo (IFOV). Obviamente al reducirse
dicha área más detalles de la imagen serán aparentes, es decir que aumenta la
resolución espacial.
2.1.4.2 Resolución.
Los sistemas de Percepción Remota difieren en la resolución, es decir, el nivel
de detalle con que pueden capturar las imágenes, su frecuencia temporal, “finura
espectral”, etc. Desde este punto de vista podemos considerar cuatro diferentes
tipos de resolución: espacial, espectral, radiométrica y temporal.
Resolución espacial.
La resolución espacial se refiere al tamaño del objeto o característica del
terreno de menor tamaño que se puede distinguir en una imagen. Se trata de una
de las características más importantes que hay que considerar a la hora de elegir
imágenes, porque determina de forma directa qué rasgos del terreno pueden
cartografiarse. Esto es muy importante para evaluar los costos del proyecto dado
14
Capítulo 2 Marco Teórico y Estado del Arte
que, generalmente, cuanto más detallada es una imagen más cara resulta por
unidad de superficie.
Existen diferentes factores que influyen en la resolución espacial: además de
los obviamente asociados al sensor, como son el poder resolutivo del sistema
óptico, debemos considerar las influencias atmosféricas, presencia de humo,
neblina, bajos niveles de iluminación, etc.
También existen factores asociados a las características del objeto a detectar y
de su entorno: un buen contraste y bordes nítidos del objeto favorecen la
detección. La selección de la resolución espacial necesaria para un dado proyecto
debe analizarse cuidadosamente. En efecto, pretender resoluciones mayores que
la necesaria encarece el costo de las imágenes y la carga del proceso.
Resolución espectral.
La resolución espectral se refiere al número y ancho de las bandas espectrales
registradas por un sensor. Cuanto más estrechas sean estas bandas mayor será
la resolución espectral. El número de bandas se utiliza asimismo para explicar
cómo mide el sistema de reflectancia de varias longitudes de onda distintas. Por
ejemplo, un sensor multiespectral de cuatro bandas mide la energía en cuatro
longitudes de onda diferentes. Hay que tener en cuenta, no obstante, que una
imagen multiespectral se compone casi siempre de tres bandas como mínimo por
que una imagen a color sólo puede crearse adicionando los tres colores
fundamentales (rojo, verde y azul).
Resolución radiométrica.
Resolución radiométrica o sensibilidad radiométrica hace referencia al número
de niveles digitales utilizados para expresar los datos recogidos por el sensor. En
general, cuando mayor es el número de niveles mayor es el detalle con que se
podrá expresar dicha información.
En el caso de los sistemas óptico-electrónicos, la imagen habitualmente se
presenta en formato digital, gracias a una conversión analógico-digital realizada a
bordo del satélite. El número de valores que incluye ese rango, es decir, el número
máximo de niveles digitales de la imagen, suele identificarse con la resolución
radiométrica del sensor. Actualmente, la mayor parte de los sistemas ofrecen 256
niveles por píxel, es decir, de 0 a 255.
Resolución temporal.
La resolución temporal es una medida de la frecuencia con la que un satélite es
capaz de obtener imágenes de una determinada área. También se denomina
intervalo de revista. Altas resoluciones temporales son importantes en el
monitoreo de eventos que cambian en períodos relativamente cortos, como
inundaciones, incendios, calidad del agua en el caso de contaminaciones,
15
Capítulo 2 Marco Teórico y Estado del Arte
desarrollo de cosechas, etc. Asimismo, en áreas con cubiertas nubosas casi
constantes como por ejemplo las selvas tropicales, períodos cortos de vista, es
decir altas resoluciones temporales, aumentan la probabilidad de obtener
imágenes satisfactorias.
2.1.4.3 Precisión.
Se refiere a la certeza con la que un objeto dado se encontrará sobre el terreno
donde aparece en la imagen. Normalmente, la precisión se expresa en píxeles,
que se pueden convertir fácilmente en metros. Por ejemplo, una imagen con
resolución de 10 metros puede tener una precisión de un píxel, lo que significa que
un objeto de dicha imagen puede estar descolocado 10 metros en cualquier
dirección. Si bien esto puede parecer de gran inexactitud, no debe olvidarse que
las imágenes son con frecuencia la fuente de información más precisa en
comparación con los mapas, la aerofotografía y las bases de datos.
2.1.4.4 Tamaño de la escena.
Cada sensor del satélite posee una anchura de franja o campo de visión que
determina el tamaño de una escena de imagen. El sensor recoge miles de
medidas de reflectancia a lo largo de esta franja, pero este caudal de mediciones
se divide habitualmente en escenas de dimensiones cuadradas. De este modo, si
el ancho de la franja es de 60 kilómetros, el tamaño estándar de la imagen de toda
la escena será de 60 x 60 km. La mayoría de los distribuidores de imágenes
satelitales pueden “cortar” una subescena más pequeña de la escena total, tal
como un cuarto o la mitad. Si el área de interés es muy pequeña, la compra de
una subescena es una opción rentable. Si el área de interés es mayor que una
escena estándar, se pueden solicitar dos o más escenas adyacentes y pedir que
una consultora especializada realice con ellas un mosaico, es decir una sola
imagen a partir de varias distintas pero adyacentes.
2.1.4.5 Escala.
Los conceptos de escala y resolución espacial están estrechamente
relacionados con el grado de detalle con que podemos visualizar una dada
imagen.
La escala de una imagen o de un mapa hace referencia a la diferencia relativa
de tamaño o distancia entre los objetos de la imagen y los reales terrenos. Esta
diferencia se expresa como la relación entre la distancia sobre la imagen y la real
terrena. Así por ejemplo, una escala de 1: 100000 significa que 1 cm en el mapa o
imagen corresponde a 100000 cm (1 km) sobre el terreno.
Tabla 2. 1. Escala de una imagen satelital.
16
Capítulo 2 Marco Teórico y Estado del Arte
Escala 1 mm sobre la 5 cm sobre la
imagen imagen
1:10000 10 m 500 m
1:40000 40 m 2,000 m
1:500000 500 m 25, 000 m
En la tabla 2.1 se muestran algunos ejemplos de valores a diferente escala.
2.1.4.5 Combinaciones de color.
Las imágenes multiespectrales pueden ser estudiadas individualmente en
escalas de grises o en imágenes coloreadas obtenidas a partir de las primeras.
Estas últimas se generan según el modelo de color RGB. (Del inglés Red, Green,
Blue). Este hace referencia a la composición del color en términos de la intensidad
de los colores primarios con los que se forma: el rojo, el verde y el azul.
Es un modelo de color basado en la síntesis aditiva, es decir basado en la
mezcla por adición de dichos primarios. Para indicar en qué proporción se mezcla
cada color se asigna un valor a cada uno de los colores primarios. Así por
ejemplo, para un display de computadora de 8 bits por pixel el rango de valores
posibles (o sea de DN) para cada componente de color es de 0 a 255. En
consecuencia para una imagen RGB existirán 224 = 16.777.216 combinaciones
posibles de rojo, verde y azul, y a cada pixel de una combinación de color
corresponderá un punto dentro del cubo de color representado en la Fig. 2.4
Fig.2. 4. Cubo de colores.
17
Capítulo 2 Marco Teórico y Estado del Arte
Por lo tanto, las coordenadas del rojo serán (255, 0,0), del verde (0, 255,0) y
del azul (0, 0,255). La ausencia de color, es decir el negro corresponde al punto
(0, 0,0). La combinación de dos colores a nivel 255 con un tercero a nivel 0 da
lugar a tres colores intermedios: el amarillo (255, 255,0), el cian (0, 255,255) y el
magenta (255, 0,255). El blanco se forma con los tres colores primarios a su
máximo nivel (255, 255,255).
La escala de grises es la diagonal que une el blanco y el negro. Concretando,
para preparar una combinación de color se seleccionan tres bandas de interés de
la escena multiespectral y se le asigna a cada una de ellas uno de los tres colores
primarios. El display nos entregará una combinación RGB correspondiente a las
bandas seleccionadas y a la asignación de colores como se muestra en los
ejemplos de la Fig. 2.5.
Fig.2. 5. Combinación de bandas.
18
Capítulo 2 Marco Teórico y Estado del Arte
2.1.5. PLATAFORMA SPOT
La constelación SPOT (Sistema Probatorio de información de la Tierra) se
conforma por una serie de satélites civiles de observación de la Tierra, que
entraron en operación desde 1986 [4].
Fig.2. 6. Satélite Spot 5.
El programa Spot aprobado en 1978 por Francia, ha sido desarrollado por el
Centro Nacional de Estudios Espaciales francés (CNES) en colaboración con
Bélgica y Suecia. Los satélites han sido desarrollados por Matra (convertida en
EADS Astrium), junto con Aerospatiale/Satélites (convertida hoy en día en Thales
Alenia Space).
Desde 1986 se han lanzado 5 satélites SPOT, proporcionando imágenes de
media y alta resolución de la superficie de la Tierra. En la tabla 2.2 se muestran
las fechas de lanzamiento de estos satélites. Una de las ventajas del sistema
SPOT, es su capacidad de recepción de imágenes en tierra, pues cuenta con un
total de 43 estaciones distribuidas entre los 5 continentes.
19
Capítulo 2 Marco Teórico y Estado del Arte
Tabla 2. 2. Satélites Spot activos e inactivos.
SPOT Image es actualmente el líder a nivel mundial en distribución de
imágenes satelitales y productos derivados de la observación satelital terrestre,
con aplicaciones en Agricultura, Cartografía, Catastro Rural, Estudios
Ambientales, Planeamiento Urbano, Telecomunicaciones, Forestería, Geología,
Exploración de Gas y Petróleo, e Ingeniería Civil.
La información que contiene una imagen Spot brinda una representación
objetiva, exhaustiva y fiable de la superficie terrestre. Además, es información
precisa y global a la vez, una sola imagen Spot abarca una superficie de
3,600km². Al momento, el archivo Spot cuenta con más de 20 millones de
imágenes y cubre varias veces la casi totalidad del globo terrestre. Su campo
amplio de observación, es de (60 km x 60 km) y la multirresolución que ofrece una
gama completa de imágenes con una resolución de 20 m a 2,5 m, les permiten
adaptarse para trabajos a escala local o regional (de 1:100000 a 1:10000). Estas
imágenes contribuyen a observar y analizar los fenómenos de cambio del territorio
20
Capítulo 2 Marco Teórico y Estado del Arte
y asimismo a comprender de la mejor manera posible los cambios producidos en
zonas de gran extensión o en sitios específicos precisos.
Los satélites SPOT con el sensor multiespectral HRV (XS) integrado tienen un
rango de la longitud de onda Verde hasta el Infrarrojo Cercano. La cobertura HRV
(XS) en sus primeros satélites es en tres bandas espectrales, con una resolución
espacial de 20 metros. El satélite SPOT lleva un sensor pancromático (HRV-P)
que cubre desde el rango espectral del Verde hasta el Rojo del espectro visible en
una sola franja del terreno con 10 metros de resolución, ambos sensores cubren
una franja de 60 Km. A lo largo de la trayectoria orbital. Los satélites actuales en
órbita (SPOT4 y SPOT5) integran en sus sensores una alta resolución visible
infrarroja (HRVIR) y una alta resolución geométrica (HRG).
Los sensores SPOT tienen la capacidad única de poder ser dirigidos hasta 27°
a la izquierda o derecha de la trayectoria orbital. Esta característica permite vistas
repetidas, fuera del nadir, de una misma franja del terreno, produciendo imágenes
estereopares. La relación base/altura varía desde 0.75 en el ecuador hasta 0.50
en latitudes medias.
2.1.5.1 SPOT en órbita.
Cada satélite SPOT se coloca sobre una órbita polar, circular, heliosincrónica y
en fases con relación a la Tierra.
Órbita polar.
La rotación de la Tierra alrededor del eje polar, teniendo en cuenta la
inclinación del plano orbital (98 grados), permite al satélite sobrevolar la Tierra en
su totalidad en el transcurso de un ciclo de 26 días.
Órbita circular.
Altitud: 832 Km.
Inclinación: 98 grados (órbita cuasi polar)
Número de revoluciones: 14+ 5/26 por día.
Período de revolución: 101 minutos.
Diferencia en el ecuador entre dos trazas consecutivas en el suelo: 2.823
Km.
Duración de un ciclo: 26 días.
Número de revoluciones por ciclo: 369
21
Capítulo 2 Marco Teórico y Estado del Arte
Para poder comparar las imágenes tomadas en dos lugares diferentes, las
mismas se deben adquirir a la misma altitud. La órbita debe ser entonces circular,
en otras palabras, la altitud debe ser constante en relación a la superficie de la
Tierra.
Órbita heliosincrónica.
Para poder comparar las observaciones de un punto dado tomadas en fechas
diferentes, las imágenes deben tomarse en condiciones de iluminación similares.
A estos efectos, el plano orbital debe formar un ángulo constante en relación a la
dirección del sol, a fin de que el satélite sobrevuele siempre un punto preciso a la
misma hora local. La órbita se llama heliosincrónica (nodo descendente a 10:30
hs).
Órbita en fases.
Cada satélite SPOT observa una zona dada de cada 26 días. Durante estos 26
días, efectúa un número entero de revoluciones (369) y sus trazas ulteriores sobre
la superficie de la Tierra repiten las primeras (el satélite efectúa 14 + 5/26
revoluciones por día). Este tipo de órbita se denomina “en fases”.
2.1.5.2 Estructura de SPOT.
La carga útil de cada satélite SPOT está constituida por dos instrumentos
ópticos idénticos, registradores de datos y un sistema de transmisión de imágenes
hacia las estaciones de recepción terrenas.
El satélite SPOT 5 transporta además un instrumento HRS (Alta resolución
estereoscópica) para la adquisición simultánea de pares de imágenes
estereoscópicas.
Los instrumentos ópticos de alta resolución de los satélites SPOT (HVR - Alta
resolución visible en SPOT 2; HRVIR - Alta resolución visible infrarroja en SPOT 4
y HRG - Alta resolución geométrica en SPOT 5) pueden efectuar observaciones
oblicuas, hasta +/- 27 grados de la vertical del satélite. En efecto, la orientación del
espejo de entrada de cada instrumento puede telecontrolarse desde las
estaciones terrenas, permitiendo así observar las regiones particulares que no
están necesariamente en la vertical del satélite.
Cada instrumento puede adquirir las imágenes indistintamente en modo
pancromático o multiespectral. Las bandas espectrales de cada instrumento se
adquieren con una resolución en el suelo variable según el satélite. Los dos
instrumentos de toma de imágenes de alta resolución pueden funcionar
22
Capítulo 2 Marco Teórico y Estado del Arte
independientemente o simultáneamente en modo pancromático o multiespectral.
Las siguientes tablas muestran las características principales de los satélites
SPOT.
Tabla 2. 3. Resolución espacial y espectral, Spot 5, 4, 3, 2,1.
Tabla 2. 4. Instrumento de alta resolución.
23
Capítulo 2 Marco Teórico y Estado del Arte
Tabla 2. 5. Resumen general de Spot.
24
Capítulo 2 Marco Teórico y Estado del Arte
2.1.5.3 Niveles de procesamiento.
Las imágenes SPOT están disponibles dentro de diferentes niveles de
procesamiento geométrico, repartidas en 2 gamas de productos [1]-[7]:
SPOT Scene.
Nivel 1A: El preprocesamiento de nivel 1A consiste en corregir los errores
radiométricos originados en las diferencias de sensibilidad entre los detectores
elementales del instrumento de captura de imagen (igualación radiométrica). No
se aplica ninguna corrección geométrica.
En SPOT 5 el nuevo sensor estelar, que ofrece un mejor conocimiento de la
altitud del satélite, permite aumentar considerablemente la precisión de
localización de las imágenes en comparación con los satélites SPOT 1 a 4, que
pasa entonces a 50m.
Estos productos están dirigidos particularmente a los usuarios experimentados
que utilizan software de procesamiento de imagen. Están, ante todo, destinados a
las aplicaciones cartográficas y se utilizan para los procesamientos geométricos
de la imagen: MDE (Modelos Digitales de Elevación), ortorectificación y todos los
procesamientos radiométricos de precisión.
Nivel 1B: El preprocesamiento de nivel 1B consiste en aplicar correcciones
radiométricas idénticas a las del nivel 1A (igualación radiométrica) y geométricas.
Los procesamientos geométricos consisten en corregir la imagen de las
distorsiones internas causadas por las condiciones de captura de la imagen
(variación de la altitud del satélite, efecto panorámico, curvatura y rotación de la
tierra, etc.).
Estos productos están dirigidos a los usuarios que necesitan un primer nivel de
corrección geométrica. Están particularmente adaptados para mediciones
geométricas (distancias, ángulos y superficies), para la fotointerpretación y los
estudios temáticos. En este caso, el análisis visual, asistido por ordenador o
completamente digital.
Nivel 2A: En el nivel 2A, la escena se rectifica en la proyección cartográfica
estándar (UTM, WGS84), sin utilización de puntos de apoyo. Se trata de un
producto de nivel inicial en la gama de los productos cartográficos. En SPOT 1, 2,3
y 4, la altitud de rectificación es constante sobre toda la escena; en SPOT 5, se
utiliza un MDE mundial con mallas de 1 Km. de lado. Las correcciones
geométricas se basan en un modelo de remuestreo teniendo en cuenta las
25
Capítulo 2 Marco Teórico y Estado del Arte
distorsiones debidas a las condiciones de captura de imagen y las
transformaciones necesarias para transponer la imagen a la proyección
cartográfica estándar UTM WGS84. Este modelo se calcula sobre la base de los
parámetros de la captura de imagen conocidos a priori (efemérides del satélite,
altitud, etc.), sin provisión de mediciones exteriores.
Para una escena de altitud constante, la precisión de localización es la del nivel
1B, es decir, en SPOT 1 a 4, mejor que 350m y en SPOT 5 mejor que 50m.
Estos productos están dirigidos paran usuarios que desean asociar información
geográfica de tipos y fuentes diferentes, y aplicar su propio procesamiento a las
imágenes de nivel 2A a fin de extraer información específica. Teniendo en cuenta
el error de localización, la imagen es directamente superponible a otras
informaciones geográficas sobre la misma proyección cartográfica: vectores,
cartas tipo raster u otras imágenes satelitales.
SPOTView
Nivel 2B: El nivel 2B es un nivel “geocodificado”. La escena se presenta en una
proyección cartográfica dada y el uso de puntos de apoyo (medidos sobre una
carta o sugeridos de levantamientos topográficos) permite mejorar la localización
de los puntos en el nivel de tierra.
Las correcciones geométricas se basan en modelo de remuestreo que tiene en
cuenta las distorsiones debidas a las condiciones de la captura de imagen y las
transformaciones necesarias para transponer la imagen a la proyección
cartográfica deseada (proyección Lambert conforme, proyección UTM, proyección
estereográfica polar, proyección polifónica, etc.). Las correcciones geométricas se
basan en una modelización de la dinámica de vuelo del satélite de acuerdo con los
parámetros de la captura de imagen (efemérides, actitud, etc.) y con los datos
geográficos o cartográficos constituidos por los puntos de apoyo.
Estos productos se encuentran disponibles en forma de cartas espaciales, ya
sea en escenas enteras o degradadas geográficamente (degradaciones de
30’*30’, 15’*15’, 7’30*7´30). Están concebidos para ser utilizados como cartas
digitales y brindan al usuario información geográfica actualizada que cubre la
totalidad del globo. Los productos de nivel 2B pueden ser utilizados siempre que
las deformaciones debidas al relieve no sean determinantes (terreno con poco
relieve).
Nivel 3 Orto: Este nivel de procesamiento es un nivel “geocodificado”, como el
nivel 2B. También llamado “ortoimagen”, el producto de nivel orto corrige los
26
Capítulo 2 Marco Teórico y Estado del Arte
errores residuales de paralaje debidos al relieve, gracias a la utilización de un
MDE.
Los productos de nivel orto son particularmente indicados para las regiones con
relieve. Este grado de procesamiento muy elaborado responde a la necesidad de
una precisión cartográfica máxima para la creación y actualización de cartografía.
Permite igualmente superponer la imagen con otra información geográfica de tipos
y fuentes diferentes.
2.1.6. CLASIFICACIÓN DE IMÁGENES SATELITALES
Con la clasificación llegamos a la etapa de operaciones extracción de
información reemplazando el análisis visual de la imagen mediante la aplicación
de técnicas cuantitativas para automatizar la identificación de los objetos
contenidos en una escena. Esto implica el análisis de datos de escenas
pancromáticas o multiespectrales aplicando distintas técnicas, entre ellas reglas
de decisión basadas en conceptos estadísticos para establecer la identidad de
cada pixel en una imagen.
Las técnicas de clasificación de imágenes posibilitan la transformación de
imágenes crudas (fotografías aéreas, imágenes de Satélite, etc.) en datos
temáticos o mapas que muestran información con un significado evidente.
Concretando, el proceso de clasificación intenta categorizar todos los pixeles de
una imagen digital asignándolos a una o más clases de coberturas terrestres o
clases temáticas.
Los métodos tradicionales de clasificación involucran dos alternativas: no
supervisada y supervisada. El método no supervisado crea agrupamientos
espectrales que no tienen mayor significado desde el punto de vista del usuario,
por lo que el analista debe intentar asociar una clase temática a cada uno de
dichos grupos. En el método supervisado, en cambio, el analista supervisa el
proceso de categorización del pixel especificando al algoritmo de la computadora
descriptores numéricos de los varios tipos de coberturas terrestres presentes en la
escena. Para ello debe recurrirse a un muestreo de sitios representativos de
coberturas conocidas, llamadas áreas o sitios de entrenamiento que permitan
compilar un código de interpretación numérica que describe los atributos
espectrales para cada cobertura de interés.
Cada pixel de la escena es entonces comparado con el código de cada
categoría asignándole el nombre de aquella categoría a la que más se asimila. O
sea que en el enfoque supervisado el analista define sus categorías de interés y
examina su separabilidad espectral, mientras que en el no supervisado primero
27
Capítulo 2 Marco Teórico y Estado del Arte
determina las clases espectralmente separables y luego define las clases
temáticas de interés.
Clasificación supervisada: Podemos definir esta clasificación como un proceso
en que pixeles de identidad conocida, ubicados dentro de las áreas de
entrenamiento, se utilizan para clasificar pixeles de identidad desconocida [8]-[10].
La clasificación supervisada involucra las siguientes etapas:
Etapa de entrenamiento.
Selección del algoritmo de clasificación adecuado y clasificación.
Operaciones de post clasificación.
En la etapa de entrenamiento el analista selecciona áreas de identidad
conocida de la cubierta terrestre de interés (cultivos, forestaciones, suelos, etc.)
delineándolas sobre la imagen digital bajo formas de rectángulos o polígonos
cuyos datos numéricos quedan archivados en la computadora como regiones de
interés constituyendo los “datos de entrenamiento”. Para realizar la selección el
analista debe tener un conocimiento previo del área de estudio, sea por
reconocimientos de campo, sea por consulta de mapas, fotografías aéreas, etc.
Una vez que se dispone de un conjunto de estos datos de entrenamiento debe
tratase de adjudicar cada uno de los pixeles de la escena a alguna clase. Entre los
algoritmos clásicos tenemos:
Clasificador por mínima distancia
Clasificador por paralelepípedos
Clasificador por máxima probabilidad
En la identificación de especies forestales [9], se usaron los métodos del
clasificador por mínima distancia y por máxima probabilidad. Otro ejemplo de la
utilización de una clasificación supervisada se cita en el clasificador genérico de
objetos en imágenes ETM+ [10].
Clasificación no supervisada: El método no supervisado crea agrupamientos
espectrales o clusters (grupo o agrupamiento) y el analista debe intentar asociar
una clase temática a cada uno de dichos grupos. Las clasificaciones no
supervisadas guardan relación con el valor relativo al color, al tono o al clúster,
para identificar entidades [5]-[10].
Existen numerosos algoritmos para crear estos clusters. Uno de ellos es
conocido como ISODATA (Iterative Self-Organizing Data Analysis Technique). Se
trata de un método iterativo que requiere relativamente poca intervención humana,
siendo usual que el analista deba especificar:
28
Capítulo 2 Marco Teórico y Estado del Arte
• Número máximo de clusters que el algoritmo debe identificar (por ejemplo
10, 20 o más según el caso).
• Máximo porcentaje de pixeles cuyos valores se permite permanezcan
incambiados entre iteraciones. Cuando se alcanza dicho número el
algoritmo se detiene.
• Máximo número de iteraciones. Cuando se alcanza dicho número el
algoritmo se detiene.
• Número mínimo de miembros en un cluster. Si un cluster contiene menos
de dicho mínimo es eliminado y los miembros son asignados a un cluster
alternativo.
• Máxima desviación estándar. Cuando la desviación estándar para un
cluster excede el máximo especificado y el número de miembros que
contiene es más que el doble del mínimo especificado, el cluster se divide
en otros dos clusters.
• Suele también fijarse valores mínimos para las distancias entre los centros
de los clusters. Cuando la distancia resulta inferior a dichos valores los
clusters se fusionan.
Un claro ejemplo donde fue utilizado el algoritmo ISODATA es en la
clasificación de imágenes LANSAT y su aplicación en la identificación de especies
forestales [9].
En la clasificación no supervisada de la cobertura de suelo de la región sierra
de Tabasco [8], la asignación de los pixeles a las clases seleccionadas se llevó a
cabo con el criterio de decisión de la máxima verosimilitud usando el software
ERDAS junto con el algoritmo ISODATA.
Además de los métodos clásicos de clasificación mencionados anteriormente,
existen muchos otros, tanto paramétricos (es decir que asumen alguna clase
particular de distribución estadística, usualmente la distribución normal) como no
paramétricos (es decir que no hacen suposiciones acerca de la distribución de
probabilidad de los datos que procesan), por ejemplo los métodos de inteligencia
artificial como son las redes neuronales y los clasificadores difusos [5].
29
Capítulo 3
Memorias Asociativas
Los seres humanos somos capaces de reconocer patrones con extrema
facilidad (imágenes, sonidos, olores, sabores, etcétera). Lo aprendimos a hacer
desde que nos encontrábamos en el vientre materno. Lo perfeccionamos al
interactuar primeramente con nuestros padres y luego con nuestros semejantes.
Somos capaces de reconocer el rostro de una persona, no obstante que sólo
veamos una parte de la cara, o que la persona se haya puesto peluca o lentes, o
se haya quitado la barba o el bigote, por ejemplo [12], [13].
Como seres vivos contamos con los sistemas de reconocimiento de patrones
más sofisticados que el hombre haya podido jamás imaginar. Los sabe usar con
extrema facilidad, siéndole sin embargo muy difícil explicar cómo funcionan.
En relación con este tipo de habilidades, se dice que la mente humana es
asociativa; es decir que los seres humanos poseemos memoria asociativa, dado
que podemos recordar, mediante asociaciones, lo que hemos aprendido: objetos,
seres vivos, conceptos e ideas abstractas, a pesar de que éstas estén
contaminadas con “ruido” (como en el caso de los rostros con lentes o sin barba, o
las melodías incompletas).
3.1. Conceptos básicos de una Memoria Asociativa
Una memoria asociativa es un dispositivo electrónico, programa computacional
o modelo matemático, que permite recuperar patrones a través de su recuerdo por
medio de otros patrones llamados llaves; a los patrones que se recuperan se les
llama patrones de información. En la Fig. 3.1 se puede observar este proceso [11]-
[14], [16].
30
Capítulo 3 Memorias Asociativas
Fig.3. 1. Representación gráfica de una memoria asociativa.
En una primera etapa, la memoria es construida a través de un conjunto de
patrones de información junto con sus llaves respectivas. Al conjunto de
asociaciones (llave, patrón) se le llama conjunto de entrenamiento de la memoria
asociativa.
En una segunda etapa, a la memoria se le presenta una llave. Si la memoria
asociativa es capaz de recordar todos los patrones del conjunto de entrenamiento,
se dice que dicha memoria tiene la capacidad básica de recuerdo (o
recuperación). A la cantidad de patrones que se pueden almacenar en la memoria
sin alterar su capacidad básica de recuerdo se le llama capacidad de la memoria
asociativa.
Para clarificar las cosas, supóngase que a una memoria asociativa se le ha
enseñado el siguiente conjunto de tres patrones con sus llaves respectivas:
[(amarillo, plátano), (verde, sandía), (rojo, fresa)]
Si ahora en la etapa de recuperación se le presenta a la memoria asociativa
como entrada, por ejemplo, el color amarillo, la memoria debería responder con el
patrón plátano.
Recordar el conjunto de patrones de entrenamiento no es un problema muy
difícil de resolver, es más bien una propiedad deseable de cualquier memoria
asociativa. El verdadero problema de una memoria asociativa estriba en ser capaz
de recuperar patrones del conjunto de entrenamiento a partir de versiones
alteradas o distorsionadas de las llaves. Si esto ocurre, se dice que la memoria
asociativa tiene recuperación robusta. Como ejemplo ilustrativo, sería conveniente
que la memoria asociativa del ejemplo anterior pudiera recordar el objeto plátano,
cuando se le presenta como llave el color amarillo claro o el amarillo oscuro; al
conjunto de patrones distorsionados que son mapeados al mismo patrón correcto
se le llama soporte.
31
Capítulo 3 Memorias Asociativas
En general, las memorias asociativas más eficientes desarrolladas hasta el
momento, son capaces de reconocer patrones del conjunto de entrenamiento a
través de versiones alteradas de los mismos, pero en presencia de ruido ya sea
aditivo o substractivo. El ruido aditivo se caracteriza por alterar un patrón de
manera que sus componentes se ven sesgadas hacia valores mayores. El ruido
substractivo, por otro lado, altera un patrón de manera que sus componentes se
ven sesgadas hacia valores menores. El ruido combinado o mezclado, que es el
que se presenta en la realidad, altera un patrón de manera que sus valores se ven
cargados en forma aleatoria hacia valores mayores o menores.
Fig.3. 2. Un patrón junto con tres versiones ruidosas del mismo.
Para ilustrar lo anterior supóngase que un patrón es la colección de números
mostrada en la Fig. 3.2(a). Supóngase también que cada componente (cada
número del patrón) puede variar en el rango de 0 a 7. Una versión alterada del
patrón P de la Fig. 3.2(a) alterada por ruido aditivo se muestra en la Fig. 3.2 (b).
Como se puede ver, los valores de las componentes del patrón se encuentran
sesgados hacia el valor máximo que puede tomar una componente del patrón (7
para nuestro ejemplo). En la Fig. 3.2(c) se muestra la versión alterada del mismo
patrón P, pero con ruido substractivo, mientras que en la Fig. 3.2 (d) se muestra la
versión alterada de P con ruido mezclado. En el caso anterior sólo la primera,
tercera y quinta componentes han sido alteradas por el ruido.
En resumen, una memoria asociativa ideal debe tener las siguientes
características:
Capacidad de almacenamiento ilimitada.
Recuperación básica.
Recuperación robusta.
32
Capítulo 3 Memorias Asociativas
Soportes de tamaño máximo para cada patrón llave del conjunto de
entrenamiento.
Una forma de representación sencilla que implique un costo computacional
pequeño.
3.1.1. DEFINICIÓN TÉCNICA DE UNA MEMORIA ASOCIATIVA.
Desde un punto de vista técnico, una memoria asociativa puede ser vista como
un sistema dinámico, donde los patrones a recuperar pueden ser considerados
como estados (caso auto-asociativo), o como salidas de los estados (caso hetero-
asociativo). Visto como un sistema dinámico discreto, el problema consiste en
construir dicho sistema dinámico tomando en cuenta un conjunto de patrones
(entrenamiento o fase de aprendizaje) y dado un patrón de referencia alterado por
algún tipo de ruido, encontrar el patrón original (fase de recuerdo o recuperación).
Esto es equivalente a transitar por el sistema dinámico desde un estado inicial
hasta llegar al estado estable más cercano, por ejemplo, el centro del soporte. Si
la perturbación asociada no es muy grande o el ruido introducido satisface las
condiciones de recuperación de la memoria, el patrón recuperado debería
corresponder con el deseado [12], [13], [14].
Más en detalle, una memoria asociativa es un sistema que relaciona
vectores de entrada y vectores de salida como sigue:
x M y
Fig.3. 3. Memoria asociativa M.
Cada vector de entrada forma una asociación con un vector de salida. Una
asociación entre un vector de entrada y un vector de salida será denotada
como ( ). Para entero y positivo, la asociación correspondiente será denotada
como ( ).
Una memoria asociativa puede ser representada por una matriz cuya
componente ij-ésima es es generada a partir de un conjunto finito de
asociaciones previamente definido, conocido como el conjunto finito de
asociaciones de entrenamiento o conjunto de patrones de entrenamiento, o
simplemente conjunto de entrenamiento (CE) o conjunto fundamental (CF).
33
Capítulo 3 Memorias Asociativas
Si ξ es un índice, el CE es representado como {( ) } donde
es la cardinalidad del conjunto. Los patrones que forman el conjunto de
entrenamiento serán llamados patrones de entrenamiento.
Si se satisface que * + es auto-asociativa; de otra forma
será denotada ~
k
es hetero-asociativa. Una versión alterada de un patrón x .
Finalmente, si al inyectar una versión distorsionada de con * +a
una memoria asociativa , acontece que la salida se corresponde exactamente
con el patrón asociado , se dice que la memoria presenta recuperación
robusta. A la vecindad de patrones distorsionados de un patrón llave que
mapean al patrón de información correspondiente se le llama soporte de .
3.2. Memorias Asociativas Morfológicas
La diferencia fundamental entre las memorias asociativas clásicas y las
morfológicas, radica en que los fundamentos operacionales de las memorias
asociativas morfológicas, se encuentran en las operaciones morfológicas de
dilatación y erosión. Estas memorias rompieron el esquema utilizado a través de
los años en los modelos de memorias asociativas clásicas, que utilizan
operaciones convencionales entre vectores y matrices para la fase de aprendizaje
y suma de productos para recuperar patrones.
Las memorias asociativas morfológicas, por otro lado, usan máximos o
mínimos de sumas para la fase de aprendizaje, y máximos o mínimos de sumas
para la fase de recuperación.
Hay dos tipos de memorias asociativas morfológicas: las memorias máx,
simbolizadas con M, y las memorias mín, las cuales se simbolizan con W; en cada
uno de los dos tipos, las memorias pueden funcionar en ambos modos
heteroasociativo y autoasociativo.
3.2.1. MEMORIAS MORFOLÓGICAS AUTOASOCIATIVAS (MAX Y MIN)
Las memorias morfológicas autoasociativas máx utilizan el producto mínimo
para ambas fases: aprendizaje y recuperación de patrones. Además, en la fase de
aprendizaje juega un papel relevante el operador máximo; de ahí el nombre de
memorias máx. La fase de aprendizaje consiste de dos etapas:
34
Capítulo 3 Memorias Asociativas
1. Para cada una de las p asociaciones ( ) se encuentra la matriz
( ) de dimensiones n x n, donde ( ) ( ):
( ) (3.1)
( )
2. Se aplica el operador máximo ∨ a las matrices para obtener la memoria
M.
(3.2)
⋁, ( )- [ ]
Donde la ij-ésima componente de la memoria se presenta
como:
(3.3)
⋁( )
La fase de recuperación consiste en realizar el producto mínimo ∆ de la
memoria con un patrón de entrada , donde * +, para obtener un
vector columna de dimensiones n:
(3.4)
La i-ésima componente del vector es:
(3.5)
⋀( )
35
Capítulo 3 Memorias Asociativas
Las memorias morfológicas autoasociativas mín son el dual de las memorias
morfológicas autoasociativas máx, es decir:
(3.6)
⋀( )
(3.7)
⋁ ( )
3.2.2. MEMORIAS MORFOLÓGICAS HETEROASOCIATIVAS (MAX Y MIN)
Las memorias morfológicas heteroasociativas máx utilizan el producto mínimo
para ambas fases: aprendizaje y recuperación de patrones. Además, en la fase de
aprendizaje juega un papel relevante el operador máximo; de ahí el nombre de
memoria máx. La fase de aprendizaje consiste de dos etapas:
1. Para cada una de las asociaciones ( ) se encuentra la matriz
( ) de dimensiones m x n, donde:
( ) ( ): (3.8)
(3.9)
( )
( )
2. Se aplica el operador máximo ∨ a las matrices para obtener la memoria
M.
(3.10)
⋁, ( )- [ ]
36
Capítulo 3 Memorias Asociativas
Donde la ij-ésima componente de la memoria se presenta como:
⋁( ) (3.11)
La fase de recuperación consiste en realizar el producto mínimo ∆ de la
memoria con un patrón de entrada , donde * +, para obtener un
vector columna de dimensiones m:
(3.12)
La i-ésima componente del vector es:
⋀( ) (3.13)
Las memorias morfológicas heteroasociativas mín son el dual de las memorias
morfológicas heteroasociativas máx, es decir:
⋀( ) ⋁( ) (3.14)
Ejemplo:
Sean los patrones x1, x2 y x3 que pertenecen a las clases y1, y2 y y3
respectivamente.
x1=(0 0 0) y1=(0 1 0)
x2=(0 -2 -4) y2=(-1 -1 0)
x3=(0 -3 0) y3=(0 -2 0)
37
Capítulo 3 Memorias Asociativas
Procedemos a entrenar la memoria usando máximos:
(3.15)
⋁, ( )-
Presentamos cada patrón a su clase correspondiente:
Para
(0 1 0) ⊠ – (0 0 0) = ( )
Para
(-1 -1 0) ⊠ – (0 -2 -4) = ( )
Para
(0 -2 0) ⊠ – (0 -3 0) = ( )
Calculamos el máximo de todas las matrices anteriores:
( )V( )V( )=( )
También podemos entrenar la memoria usando operaciones de mínimos:
W ( ) ( ) ( )=( )
38
Capítulo 3 Memorias Asociativas
Etapa de recuperación: Presentamos cada patrón a reconocer con la
memoria entrenada.
=( ) ∧ (0 -2 -4) = (-1 -1 0) = y2
W =( ) V (0 -0 0) = (0 1 0) = y1
=( ) ∧ (0 -3 0) = (0 -2 0) = y3
Como se puede observar podemos recuperar cada patrón entrenado usando la
memoria de máximos ( ) o de mínimos (W ).
39
Capítulo 4
Implementación del Algoritmo de
Clasificación propuesto
En este capítulo se desarrolló el algoritmo propuesto para la clasificación de
imágenes SPOT5 usando las Memorias Asociativas Morfológicas, el cual se
observa en el diagrama de la Fig.4.1.
Obtención de
imágenes SPOT
1 5
Sección de áreas
de interés
Entrenamiento
de la memoria
Presentación de la imagen
a clasificar
Clasificación de
la imagen
Fig.4. 1. Diagrama general del proceso de clasificación.
40
Capítulo 4 Implementación
4.1. Obtención de imágenes SPOT
Se utilizaron cinco escenas pancromáticas y multiespectrales del satélite SPOT
5 del territorio Mexicano, proporcionadas por la Marina. Las imágenes tienen un
nivel de procesamiento 1A y una resolución espacial de 5m en su banda
pancromática y 10m en sus bandas multiespectrales como se observa en la tabla
4.1.
Cada escena SPOT multiespectral cuenta con cuatro bandas espectrales que
empiezan en el verde visible y llegan hasta el infrarrojo medio.
Tabla 4. 1. Resolución espacial y espectral del Spot 5.
Los productos SPOT son enviados en un formato llamado DIMAP el cual
consta de dos partes: la parte de imagen y la parte descriptiva. Ver anexo I.
La parte de imagen esta, por defecto, descrita en formato GeoTIFF. Este
formato está compuesto por el TIFF, que es el formato de imagen más difundido
en el mundo de la generación de imágenes y la parte Geo que consiste
esencialmente en agregar, al archivo TIFF básico, información de georeferencia
del archivo de imagen (coordenadas de la esquina superior izquierda de la
imagen, dimensión de los píxeles) y, eventualmente, en descubrir la proyección
cartográfica y sistema geográfico asociados. Las cinco imágenes utilizadas en
este trabajo se muestran en la Fig.4.2.
41
Capítulo 4 Implementación
Fig.4. 2. Escenas Spot 5 multiespectrales.
La parte descriptiva mejor conocida como metadatos está escrita en XML. El
XML es similar al HTML, con una estructura mejor definida, y ofrece la posibilidad
de crear palabras clave propias y sus correspondientes valores asociados.
Fig.4. 3. Metadatos de una escena Spot.
La Fig.4.3 muestra información específica de una escena SPOT como es el
número de bits, el nivel de procesamiento de la imagen, resolución, entre otras
características.
42
Capítulo 4 Implementación
4.2. Clasificación de imágenes SPOT 5
4.2.1. SECCIÓN DE ÁREAS DE INTERÉS
Se selecciona cada una de las imágenes multiespectrales SPOT 5 para tomar
muestras y formar un banco de datos de 280 subimágenes con las que
entrenaremos a la memoria asociativa morfológica. Cabe mencionar que el
algoritmo será programado usando el software Matlab.
Primero leemos la imagen y la separamos en sus 4 bandas espectrales,
combinamos tres de ellas y formamos una nueva imagen a color, ver Fig.4.4.
Fig.4. 4. Combinación de bandas espectrales.
Elegimos la combinación B4, B1 y B2 debido a que esta combinación muestra
mayor contraste y nos ayuda a distinguir cada una de las clases discriminando
entre la vegetación en color verde, el agua en tonalidades de azul, nubes en
blanco, etc., y además es ideal para el mapeo de uso de suelos.
43
Capítulo 4 Implementación
La Fig.4.5 muestra una imagen multiespectral al ser separada en sus cuatro
bandas.
Fig.4. 5. Bandas espectrales de una imagen multiespectral.
Tomaremos como muestra imágenes de 51 x 51 píxeles para cada una de las
clases. La selección de las clases se hizo de manera visual con un criterio
particular, conociendo de antemano el terreno y basados en clasificaciones
hechas en artículos previos, por ejemplo en el artículo llamado “Clasificador
genérico de objetos en imágenes ETM” [10]. Definiéndose las siguientes clases:
Clase 1: Agua (50 imágenes a entrenar).
Clase 2: Vegetación de cobertura alta (50 imágenes a entrenar).
Clase 3: Nubes (30 imágenes a entrenar).
Clase 4: Sombras (20 imágenes a entrenar).
Clase 5: Hielo (20 imágenes a entrenar).
Clase 6: Suelo (60 imágenes a entrenar).
Clase 7: Vegetación de cobertura baja (50 imágenes a entrenar).
44
Capítulo 4 Implementación
Cabe aclarar que la cantidad de imágenes para cada clase no tiene que ser la
misma, esto depende de la cantidad de muestras diferentes que se pueden
visualizar en las 5 escenas SPOT, por ejemplo en las distintas tonalidades de un
color.
Clase 1 Agua: Esta clase hace referencia a todos los cuerpos de agua
encontrados en las imágenes, encontramos diferentes tonalidades de azul debido
a la profundidad de la misma. Algunas de las muestras se pueden observar en la
Fig.4.6 a), del mismo modo en la Fig.4.6 b) se observan muestras que
seleccionamos contaminadas con alguna otra clase y que deberán ser clasificadas
en agua.
Fig.4. 6. Muestras tomadas para la clase 1:
.
a) Diferentes tonalidades de azul, b) Muestras contaminadas
Clase 2 Vegetación de cobertura alta: Esta clase está enfocada a las áreas
con alta densidad de vegetación como son los bosques o selvas.
Fig.4. 7. Muestras de la clase 2.
La Fig.4.7 contiene los diferentes patrones pertenecientes a esta clase,
observándose en color verde obscuro las de mayor densidad de vegetación.
45
Capítulo 4 Implementación
Clase 3 Nubes: El número de imágenes tomadas para esta clase son menores
en comparación con las anteriores, debido a que no había gran variedad de
muestras a elegir y no se presentaba la existencia de nubes en las 5 escenas
SPOT. Ver Fig.4.8.
Fig.4. 8. Clase nubes.
Clase 4 Sombras: De la misma forma que en la clase 3, no hay muchas
muestras de sombras en las imágenes pero es de suma importancia
considerarlas ya que se presenta contaminando a la mayoría de las clases. En la
siguiente figura podemos observar algunas de las muestras de sombras
generadas por las nubes.
Fig.4. 9. Clase sombras.
Clase 5 Hielo: Las muestras para esta clase fueron tomadas de la punta de los
volcanes Popocatepetl e Iztaccihuatl en una escena del estado de Puebla.
Fig.4. 10. Clase hielo.
De la Fig. 4.10 vemos que las tonalidades de azul son muy particulares en esta
clase y totalmente diferentes con las tonalidades presentadas en la clase de agua.
46
Capítulo 4 Implementación
Clase 6 Suelo: En la Fig.4.11 podemos observar una gran variedad de
muestras diferentes, por lo que se tomaron más imágenes para entrenar en
comparación con las clases anteriores.
Fig.4. 11. Clase 6 suelo.
Clase 7 Vegetación de cobertura baja: Finalmente en esta clase se clasificaran
las imágenes que contengan baja densidad de vegetación como son una gran
cantidad de sembradíos o parcelas como se muestra en la Fig.4.12.
Fig.4.12. Clase 7.
4.2.2. ENTRENAMIENTO DE LA MEMORIA
Una vez obtenido el banco de datos con el que entrenaremos a la memoria,
debemos tratar cada imagen en forma de vector. Primero convertimos la imagen a
escala de grises para poder trabajar solo con una matriz. Después guardamos
esta matriz en forma de vector, así tendremos , para , para
conformar el CF. Ver Fig.4.13.
47
Capítulo 4 Implementación
[ ] , -
Fig.4. 13. Conversión de imagen a vector.
Así tendremos 280 vectores dentro del CF.
, -
, -
, -
, - (4.1)
, -
{ , -}
Ahora definimos las 7 clases en forma de vectores. Si entrenamos usando
máximos las clases quedan de la siguiente forma:
y1= [500 0 0 0 0 0 0]; Agua
y2= [0 500 0 0 0 0 0]; Vegetación de cobertura alta
y3= [0 0 500 0 0 0 0]; Nubes
y4= [0 0 0 500 0 0 0]; Sombras
y5= [0 0 0 0 500 0 0]; Hielo
y6= [0 0 0 0 0 500 0]; Suelo
y7= [0 0 0 0 0 0 500]; Vegetación de cobertura baja
Si entrenamos usando mínimos solo basta cambiar el 500 por -500 y todo lo
demás se conserva igual. El número 500 o -500 nos indica que dependiendo la
48
Capítulo 4 Implementación
posición en la que se encuentre dentro del vector, esa será la clase a la que
pertenezca un patrón. Por ejemplo, en y5 encontramos el 500 en la quinta posición
lo que indica que es la clase cinco correspondiente al Hielo. El valor máximo de un
píxel es de 255 por lo que es conveniente definir un número mayor a este para las
clases y mediante la experimentación el valor que clasifica mejor es el 500.
Habiendo definido las clases y teniendo el CF podemos empezar el proceso de
entrenamiento de la memoria asociativa morfológica. Nos basamos en la ecuación
(3.10).
⋁, ( )- [ ]
Dónde:
( ) ( )
∨ Operador má imo
Número de patrones por clase.
Número de clases.
Número de patrones a entrenar = 280.
⊠ Sólo nos indica que la operación resta que se hará entre el vector
de la clase y el de cada patrón se debe realizar siguiendo la regla de la
multiplicación de matrices.
Entonces empezamos a entrenar presentando todos los patrones por clase.
Ejemplificaremos para la clase 1:
Tenemos 50 patrones dentro de esta clase (de a ) y la clase está definida
por el vector , -. Cada vector está compuesto por 2601
píxeles de la imagen por lo que se van a generar 50 matrices de 7 x 2601 valores
para esta clase (una por patrón).
Para fin de explicar de manera más detallada la etapa de entrenamiento,
supongamos que los 50 patrones de la clase 1 están formados por 5 píxeles,
entonces tenemos:
49
Capítulo 4 Implementación
, -
, -
, - (4.2)
{ , -}
Las 50 matrices de esta clase se generan de la siguiente forma:
⊠( )
⊠ ( ) (4.3)
( ) ( )
⊠( )
⊠ ( ) (4.4)
( ) ( )
⊠( )
⊠ ( ) (4.5)
( ) ( )
⊠( )
50
Capítulo 4 Implementación
⊠ ( ) (4.6)
( ) ( )
El proceso anterior se tiene que repetir para las 7 clases y obtendremos un
total de 280 matrices. El paso que sigue es calcular el máximo de todas las
matrices para generar finalmente la memoria entrenada ( ). Calcularemos el
máximo de las matrices anteriores para seguir ejemplificando.
( ) ( )
⋁ (4.7)
( ) ( )
(4.8)
( )
Considerando el entrenamiento de todos los patrones y sus respectivas clases,
la memoria asociativa morfológica quedaría parecida a la siguiente matriz:
51
Capítulo 4 Implementación
(4.9)
( )
En este trabajo obtuvimos dos memorias morfológicas, una entrenada con
máximos y la otra con mínimos. En el caso de la memoria de mínimos el proceso
de entrenamiento es el mismo pero debemos considerar las clases definidas con
un valor de -500, y al tener ya las 280 matrices entrenadas, generamos la
memoria final obteniendo el mínimo entre los valores de cada una de las matrices
(a esta matriz la llamaremos ).
Para una mejor eficiencia de nuestro programa se decidió hacer un ciclo for en
el cual generamos cada matriz e inmediatamente calculamos la matriz de
máximos comparando esta con la del patrón siguiente.
Etapa de recuperación:
Una vez generada la memoria tenemos ahora que recuperar cada uno de
los patrones aprendidos, para posteriormente presentarle una imagen
desconocida y clasificarla en las clases correspondientes.
Ahora partiremos de las siguientes ecuaciones (3.12) y (3.13):
Dónde:
Representa la clase de la imagen presentada.
Es la memoria entrenada, ya sea o .
La imagen a clasificar.
⋀( )
En la ecuación se observa que tenemos que realizar una suma entre la
memoria entrenada y la imagen a clasificar, para posteriormente calcular el
mínimo y obtener un vector que indica a que clase pertenece.
52
Capítulo 4 Implementación
Para entender esta etapa, partiremos de la ecuación (4.8) y clasificaremos el
vector de la ecuación (4.2).
⋀ ⊠ ( ) (4.10)
[( ) ]
∧ ∧ ∧ ∧
∧ ∧ ∧ ∧
∧ ∧ ∧ ∧ (4.11)
∧ ∧ ∧ ∧
∧ ∧ ∧ ∧
( ∧ ∧ ∧ ∧ )
( )
De la ecuación anterior observamos que a la salida de la memoria obtenemos
un vector de 7 elementos el cual nos indica a que clase pertenece nuestro patrón
de entrada, como lo vimos anteriormente la posición en donde encuentre el valor
de 500 es la clase en la que se clasifico (en este caso la clase 1).
Este ejemplo es muy simple, pero nos ayuda a entender la etapa de
recuperación o clasificación de la memoria morfológica. En el programa real
obtendríamos algunos valores como los que se muestran a continuación:
, ,
( ) ( )
53
Capítulo 4 Implementación
( ) ( )
4.2.3. PRESENTACIÓN DE LA IMAGEN A CLASIFICAR
Recordemos que partimos de 5 escenas SPOT para formar nuestro banco de
datos y entrenar a la memoria morfológica, ahora escogeremos una de las
escenas y la clasificaremos.
Fig.4. 14. Escena Spot a clasificar.
54
Capítulo 4 Implementación
Debido a que la escena multiespectral de la Fig.4.14 tiene una resolución de
6000 x 6000 píxeles es conveniente segmentarla y hacer una clasificación por
secciones, de tal forma que aumente la velocidad de procesamiento.
Segmentaremos la escena en subimágenes de 510 x 510 píxeles como la
siguiente imagen.
Fig.4. 15. Subimagen de 510 x 510 píxeles.
Partiendo de la imagen mostrada en la Fig.4.15, empezaremos el proceso de
clasificación.
1. Leemos la imagen y la convertimos a escala de grises para generar una
sola matriz.
2. Dividimos la imagen en pequeños cuadros de 51 x 51 píxeles.
55
Capítulo 4 Implementación
3. Cada cuadro es guardado como un solo vector que contiene 2601 valores.
4. Le presentamos vector por vector a la memoria morfológica ya entrenada.
5. Finalmente obtenemos la clase a la que pertenece cada sección.
Fig.4. 16. Proceso de clasificación.
En la Fig.4.16 se resume el proceso de clasificación partiendo de una imagen
desconocida, la cual es seccionada en subimágenes para posteriormente
presentarle a la memoria cuadro por cuadro y clasificar cada segmento de la
imagen original.
En este capítulo explicamos detalladamente cada parte de nuestro algoritmo
propuesto, siguiendo paso a paso cada etapa, usando un ejemplo matemático
para entender mejor la implementación.
56
Capítulo 5
Pruebas y Resultados
En este capítulo se analizan algunas de las pruebas realizadas con las
memorias morfológicas creadas. Empezamos desde la clasificación de imágenes
con pocas clases hasta llegar a las 7 clases que definimos en nuestro objetivo
general. Para una mejor visualización de los datos, se presentan los resultados en
forma de tablas.
Las primeras dos pruebas se hicieron ocupando una memoria morfológica
entrenada con máximos.
Prueba 1:
Para ver el funcionamiento de nuestro algoritmo la primer prueba que se hizo
fue clasificar solamente 3 clases ordenadas de la siguiente manera:
Clase 1 Agua: 50 imágenes.
Clase 2 Vegetación de cobertura alta: 50 imágenes.
Clase 3 Nubes: 30 imágenes.
Total de imágenes a clasificar = 130
Resultados:
Tabla 5. 1. Resultados prueba 1.
Nombre de la clase Número de imágenes
clasificadas correctamente
Agua 27/50
Vegetación de cobertura alta 48/50
Nubes 30/30
Total 105/130
% 80.76
57
Capítulo 5 Pruebas y Resultados
Analizando los resultados de la tabla 5.1 podemos darnos cuenta que la clase
que peor clasifica es la clase 1 (Agua), debido a que todas las imágenes en
tonalidades azul claro las confunde con vegetación. La Fig.5.1 muestra algunas
imágenes mal clasificadas.
Fig.5. 1. Tonalidades de azul que clasifica mal.
Prueba 2:
Para tratar de solucionar el problema de la clase 1, volveremos a definir
nuestras clases separando el agua en dos diferentes:
Clase 1 Agua (Azul fuerte): 25 imágenes.
Clase 2 Agua (Azul claro): 25 imágenes.
Clase 3 Vegetación de cobertura alta: 50 imágenes.
Clase 4 Nubes: 30 imágenes.
Total de imágenes a clasificar = 130
Resultados:
Tabla 5. 2. Resultados prueba 2.
Nombre de la clase Número de imágenes
clasificadas correctamente
Agua (Azul fuerte) 14/25
Agua (Azul claro) 8/25
Vegetación de cobertura alta 46/50
Nubes 30/30
Total 98/130
% 75.38
Podemos observar de la tabla 5.2 que esta prueba no ayudó a mejorar la
clasificación, sino al contrario confunde siete imágenes más con respecto a la
prueba 1. Por lo que tenemos que hacer una tercera prueba.
58
Capítulo 5 Pruebas y Resultados
Prueba 3:
Usaremos ahora una memoria morfológica entrenada con mínimos y
nuevamente definimos las tres clases de la prueba 1.
Resultados:
Tabla 5. 3. Resultados prueba 3.
Nombre de la clase Número de imágenes
clasificadas correctamente
Agua 49/50
Vegetación de cobertura alta 49/50
Nubes 30/30
Total 128/130
% 98.46
.
La tabla 5.3 muestra una gran mejoría en los resultados, clasificando un 98.46
% de las imágenes presentadas, además solucionamos el problema que teníamos
con la clase 1. Podemos concluir que para este caso particular es mejor utilizar
una memoria morfológica entrenada con mínimos que con máximos.
Prueba 4:
Usaremos un método de validación llamado “Hold out” para saber el porcentaje
de reconocimiento de nuestro algoritmo de la siguiente forma:
1. Ordenamos el banco de datos de 130 imágenes de forma aleatoria.
2. Dividimos el banco de datos en dos conjuntos.
3. Formamos el conjunto fundamental (C.F.) y el conjunto de prueba (C.P.),
donde:
Valor típico para
( )
Tenemos entonces:
59
Capítulo 5 Pruebas y Resultados
Para la Clase 1:
( ) á
( ) á
Para la Clase 2:
( ) á
( ) á
Para la clase 3:
( ) á
( ) á
1. Ejecutamos el algoritmo de recuperación de patrones con el C.F. y el C.P.
obtenidos.
Resultados:
Tabla 5. 4. Resultados prueba 4.
Nombre de la clase Número de imágenes
clasificadas correctamente
Agua 49/50
Vegetación de cobertura alta 50/50
Nubes 30/30
Total 129/130
% 99.23
En la prueba de la tabla 5.4 entrenamos con 91 imágenes de 130, y al clasificar
todas la memoria solo confunde una, con lo que tenemos un buen porcentaje de
reconocimiento.
60
Capítulo 5 Pruebas y Resultados
Prueba 5:
Teniendo como base las pruebas anteriores ahora ya definimos las 7 clases de
nuestras imágenes y clasificamos primero usando la memoria de máximos y
posteriormente la de mínimos.
Tabla 5. 5. Resultados prueba 5.
Nombre de la clase Máximos Mínimos
Agua 26/50 21/50
Vegetación alta 32/50 49/50
Nubes 30/30 30/30
Sombras 20/20 20/20
Hielo 15/20 15/20
Suelo 32/60 49/60
Vegetación baja 43/50 39/50
Total 198/280 223/280
% 70.71 79.64
.
De la tabla 5.5 podemos observar que la memoria de mínimos se comportó
diferente y al agregar más clases bajo su desempeño, se logró clasificar
solamente 21 imágenes de 50 en la clase de agua. Por otro lado si comparamos
los resultados de una memoria y otra, podemos ver que en algunas clases como la
de vegetación baja la memoria de máximos tiene un mejor desempeño, por otro
lado en la clase suelo y vegetación alta la memoria de mínimos es la mejor.
Analizando más a detalle los resultados en la clase de agua, la memoria de
máximos clasifica solamente las imágenes en tonalidades de azul fuerte y la
memoria de mínimos clasifica las imágenes en azul claro. De aquí podemos decir
que para mejorar el reconocimiento de patrones si usamos ambas memorias
cubriríamos la mayor parte de imágenes que aún no han sido clasificadas
correctamente ya que al parecer una memoria complementa a la otra.
Para poder unir ambas memorias en una clasificación debemos primero
entender el comportamiento de los resultados en las 280 imágenes y saber que
patrón se está repitiendo. Encontramos 5 casos a considerar:
61
Capítulo 5 Pruebas y Resultados
Caso1:
Si solo en la clase correcta los valores tanto de la memoria de máx como de
mín se encuentran en un rango entre +/- 500 a +/- 599, como se observa en la
tabla 5.6.
Tabla 5. 6. Caso 1.
Caso 2:
Si en dos clases los valores tanto de la memoria de máx como de mín se
encuentran en un rango entre +/- 500 a +/- 599. Pero al sumar ambos valores el
más chico corresponde a la clase correcta. Ver tabla 5.7.
Tabla 5. 7. Caso 2.
Caso 3:
Si en dos clases los valores tanto de la memoria de máx como de mín se
encuentran en un rango entre +/- 500 a +/- 599. Pero al sumar ambos valores el
más grande corresponde a la clase correcta y además existe un 500 en min o
máx. Ver tabla 5.8.
Tabla 5. 8. Caso 3.
Caso 4:
Si en tres clases los valores tanto de la memoria de máx como de mín se
encuentran en un rango entre +/- 500 a +/- 599. Pero al sumar ambos valores el
valor de en medio corresponde a la clase correcta y además existe un 500 en mín
o máx. Ver tabla 5.9.
62
Capítulo 5 Pruebas y Resultados
Tabla 5. 9. Caso 4.
Caso 5:
Si en tres clases los valores tanto de la memoria de máx como de mín se
encuentran en un rango entre +/- 500 a +/- 599. Pero al sumar ambos valores el
más chico corresponde a la clase correcta, como lo muestra la tabla 5.10.
Tabla 5. 10. Caso 5.
Al aplicar estos casos a nuestro algoritmo obtenemos la siguiente tabla de
resultados:
Tabla 5. 11. Clasificación usando memorias de máximos y mínimos
Nombre de la Máximos Mínimos Ambas
clase memorias
Agua 26/50 21/50 50/50
Vegetación alta 32/50 49/50 48/50
Nubes 30/30 30/30 30/30
Sombras 20/20 20/20 20/20
Hielo 15/20 15/20 20/20
Suelo 32/60 49/60 56/60
Vegetación baja 43/50 39/50 49/50
Total 198/280 223/280 273/280
% 70.71 79.64 97.5
.
Los resultados obtenidos al juntar las memorias es bastante aceptable y
aumentamos el reconocimiento a un 97.5% confundiendo solamente 7 imágenes
de 280. Con estos resultados es momento de probar el algoritmo con una imagen
no conocida.
63
Capítulo 5 Pruebas y Resultados
Prueba 6:
Se clasificó la imagen de la Fig.5.2 en la cual se pueden observar casi todas
las clases que se definieron al principio de este trabajo.
Fig.5. 2. Sección de una imagen Spot a clasificar.
64
Capítulo 5 Pruebas y Resultados
Resultados:
Tabla 5. 12. Imagen clasificada parte 1 de 6
65
Capítulo 5 Pruebas y Resultados
Tabla 5. 12. Imagen clasificada parte 2 de 6
66
Capítulo 5 Pruebas y Resultados
Tabla 5.12. Imagen clasificada parte 3 de 6
67
Capítulo 5 Pruebas y Resultados
Tabla 5.12. Imagen clasificada parte 4 de 6
68
Capítulo 5 Pruebas y Resultados
Tabla 5.12. Imagen clasificada parte 5 de 6
69
Capítulo 5 Pruebas y Resultados
Tabla 5.12. Imagen clasificada parte 6 de 6
70
Capítulo 5 Pruebas y Resultados
En la Tabla 18 podemos observar 100 imágenes clasificadas. Para cada una se
muestran los resultados que genera la memoria máx (valores positivos) y los que
genera la memoria mín (valores negativos), el valor en color rojo representa la
clase a la cual se clasifico dicha imagen, en color azul la clase a la que realmente
pertenece y en amarillo los casos específicos en los que caen nuestros resultados.
En la clase 3 (nubes), los resultados que arroja la memoria mín son valores de
-500 en la mayoría de las imágenes, clasificando así 42 imágenes de 48.
La memoria que clasificó con más exactitud la clase de agua fue la máx, logro
clasificar 14 imágenes de un total de 18. Algunas de las imágenes que no clasifica
están contaminadas por algún otra clase, por ejemplo la imagen número 14 de la
tabla 18 parte 1 contiene vegetación de cobertura baja.
Podemos observar de la tabla 18 parte 3, que la imagen 42 corresponde a la
clase de vegetación de cobertura baja, sin embargo esta mínimamente
contaminada por la clase sombras y la memoria máx la clasifica en esta clase.
Las imágenes que pertenecen a la clase de sombras son clasificadas al cien
por ciento con la memoria máx, mientras que las imágenes de suelos son
clasificadas usando ambas memorias.
El tiempo que tardo en clasificar la imagen de la figura 30 fue de 25 segundos.
Prueba 7:
Se clasificó la imagen de la Fig.5.3 que a diferencia de la imagen mostrada en
la figura 30 ésta presenta mayor cantidad de vegetación de cobertura alta.
Fig.5. 3. Zona con alta densidad de vegetación.
71
Capítulo 5 Pruebas y Resultados
Del mismo modo que en la imagen anterior esta escena contiene una gran
cantidad de nubes y sombras, En la Tabla 19 se pueden observar los resultados
de las 50 subimágenes generadas. Una parte importante de estos resultados es
que se puede apreciar que cuando una memoria clasifica de manera errónea la
otra lo hace adecuadamente, aunque hay algunos casos en los que no logra
clasificar puesto que la imagen está contaminada por más de 1 clase. Algunas de
estas imágenes son la 2,3, 4, y 12.
A pesar de que esta imagen es totalmente diferente a la clasificada
anteriormente, tiene una buena respuesta al clasificar nubes con la memoria mín y
sombras con la memoria máx. Clasifica aceptablemente las imágenes de
vegetación de cobertura alta si la imagen solo contiene esta clase, en cambio el
algoritmo es sensible a pequeñas mezclas con la clase sombras y llega a
confundirse y clasificar mal.
Observando los resultados de las tablas 18 y 19 podemos decir que nuestro
algoritmo clasifica mejor las imágenes que no están mezcladas con más de una
clase, como son la clase de suelo, vegetación de cobertura alta y vegetación de
cobertura baja. Por otro lado para las clases nubes, agua y sombras hay una
mejor recuperación inclusive en imágenes que contienen dos clases o más.
72
Capítulo 5 Pruebas y Resultados
Tabla 5. 13. Segunda imagen clasificada parte 1 de 5
73
Capítulo 5 Pruebas y Resultados
Tabla 5. 13. Segunda imagen clasificada parte 2 de 5
74
Capítulo 5 Pruebas y Resultados
Tabla 5. 13. Segunda imagen clasificada parte 3 de 5
75
Capítulo 5 Pruebas y Resultados
Tabla 5. 13. Segunda imagen clasificada parte 4 de 5
76
Capítulo 5 Pruebas y Resultados
Tabla 5. 13. Segunda imagen clasificada parte 5 de 5
77
Capítulo 6
Conclusiones y trabajos futuros
En este trabajo se demostró que el algoritmo de clasificación propuesto puede
ser una alternativa diferente, eficiente y rápida para clasificar una imagen satelital.
Ya que solo es necesario contar con las escenas como son adquiridas
originalmente sin necesidad de realizar un preprocesamiento. Otra ventaja es que
no es necesario adquirir un software especial, basta con instalar Matlab en la PC,
y hacer la clasificación usando las memorias ya entrenadas.
En lo que respecta a la recuperación de los patrones aprendidos o los patrones
que conforman el conjunto fundamental, nuestro algoritmo tiene un porcentaje de
recuperación por encima del 97 por ciento.
Para clasificar imágenes con pocas clases basta con usar la memoria de
mínimos por sus excelentes resultados en la recuperación del conjunto
fundamental y en la clasificación de patrones no conocidos.
Cuando se le presentan escenas no conocidas el clasificador trabaja bien, sin
embargo hay imágenes que llega a confundir o que no sabe dónde clasificar
debido a que el tamaño elegido de los patrones a entrenar provoca que se
mezclen dos o más clases en una misma imagen. Este problema se podría
resolver entrenando con imágenes más pequeñas de tal forma que se contaminen
lo menos posible con otras clases.
Cabe mencionar que esta tesis puede ser usada como base para próximos
trabajos, como por ejemplo, discriminar entre diferentes tipos de vegetación.
78
Capítulo 6 Conclusiones y trabajos futuros
6.1. Productos derivados de esta tesis
1er Foro de investigación “Los retos de la Geomática en México”. Organizado por
la Sociedad de Geociencia y Percepción Remota (GRSS) de IEEE México y el
Centro de Desarrollo Aeroespacial (CDA) del IPN.
Presentación del trabajo titulado “Propuesta de clasificación de imágenes
Spot mediante el uso de memorias asociativas morfológicas” en la
modalidad de poster.
6.2. Trabajos futuros
Esta tesis se puede complementar realizando más pruebas para saber cómo
reacciona nuestro algoritmo de clasificación. Algunas pueden ser las siguientes:
Hacer una clasificación de diferentes tipos de escenas satelitales (SPOT,
Lansat, Terra, etc.)
Realizar la fusión de dos imágenes satelitales, una de alta resolución
espacial y otra de alta resolución espectral, y tomar muestras de estas
imágenes fusionadas para el conjunto fundamental. Recuperar los patrones
aprendidos y clasificar imágenes no conocidas tanto fusionadas como
multiespectrales, y comparar resultados.
Realizar la clasificación generando dos memorias asociativas por cada
banda de la escena multiespectral.
Utilizar muestras de menor tamaño y realizar una clasificación con el
algoritmo propuesto.
Detallar más a fondo el terreno que se desea clasificar y definir más clases
dependiendo el tipo de suelo, si es un lugar montañoso, o de diferentes
densidades de vegetación en una misma zona, etc.
Aún hay mucho por trabajar utilizando las memorias morfológicas y esta tesis es
un claro ejemplo de aplicaciones diferentes donde pueden ser utilizadas.
79
Referencias
[1] James B. Campbell and Randolph H. Wynne. (2011). Introduction to
Remote Sensing. The Guilford Press, New York, 667 pp.
[2] Emilio Chuvieco. (1995). Fundamentos de Teledetección Espacial. Segunda
edición, Ediciones Rialp,S.A. Madrid. 451 pp.
[3] Emilio Chuvieco and Alfredo Itvete. Fundamentals of satellite remote
sensing. Cre Press.
[4] Julio Martínez Muñoz. (2005). Percepción remota “Fundamentos de
Teledetección Espacial”. Recopilación, Comisión Nacional del Agua,
Jefatura de Control Cartográfico. 62 pp.
[5] Introducción a la Percepción Remota.
[6] Sensores remotos y GIS. (SRGIS). Guía básica sobre imágenes satelitales
y sus productos. Basado en “Imágenes de satélite – Una guía objetiva”
producida por el Business Image Group y Spot Image.
[7] Jorge Lira. (1987). La Percepción Remota: Nuestros ojos desde el espacio.
Fondo de cultura económica, Primera edición. ISBN 968-16-2568-4. México,
D.F
[8] A Galindo Alcántara. (2010). Clasificación no supervisada de la cobertura
de suelo de la región sierra de Tabasco mediante imágenes Lansat ETM+.
Universidad Juárez Autónoma de
Tabasco. Octubre de 2010.
[9] Vicente Ramiro y Rickfelder Rosana. (2003). Clasificación digital de
imágenes Landsat y su aplicación en la identificación de especies
forestales. Trabajo final de cursada, Universidad Nacional de la Plata.
Octubre de 2003
[10] Luis A. Palacios Sánchez, Fernando Paz Pellat, José L. Oropeza Mota,
Benjamín Figueroa Sandoval, Mario Martínez Menes, Carlos A. Ortiz Solorio
y Adolfo Exebio García. (2006). Clasificador genérico en objetos en
imágenes ETM+. Hidrociencias, Campus Montecillo, Colegio de
Postgraduados.
80
Referencias
[11] Yáñez Márquez C. (2002). Memorias Asociativas basadas en Relaciones de
Orden y Operadores Binarios. Tesis de Doctorado en Ciencias de la
Computación, IPN, Centro de Investigación en Computación, México, D.F.
[12] Ricardo Barrón Fernández. (2006). Memorias Asociativas y Redes
neuronales morfológicas para la recuperación de patrones. Tesis de
Doctorado. Centro de Investigación en Computación. Mayo de 2006.
México, D.F.
[13] Rolando Flores Carapia. (2006). Memorias asociativas Alfa-Beta basadas
en el código Johnson-Möbius modificado. Tesis de Maestria. Centro de
Investigación en Computación. Octubre de 2006, México, D.F.
[14] Itzamá López Yáñez. (2011). Teoría y aplicaciones del clasificador
asociativo Gamma. Tesis de Doctorado. Junio de 2011, México, D.F.
[15] Miguel Angel Veganzones, Zurine De Miguel y Arantza Azpiroz. (2007). Uso
de las Memorias Morfológicas Asociativas para en análisis de estrategias de
afrontamiento en el estrés social en ratones. ISBN:978-84-9860-019-3.
Grupo de Inteligencia Computacional, Universidad Del País Vasco
(UPV/EHU).
[16] Cornelio Yáñez Márquez y Juan Luis Díaz de León Santiago. (2001).
Lernmatrix de Steinbuch. No. 48 Serie : VERDE. Centro de Investigación en
Computo, IPN. Junio de 2001.
[17] Cornelius T. Leondes. (1998). Image Processing and Pattern Recognition.
Academic Press, volume 5 of Neural Network Systems Techniques and
Applications, 383 pp.
[18] Richard O. Duda, Peter E. Hart and David G. Stork. [“s.f.”]. Pattern
Classification. Second edition, ISBN: 0-471-05669-3. 637 pp.
[19] Marqués de Sá, J.P. (2001). Pattern Recognition, Concepts, Methods and
Application. Springer, Germany, May 2001. 318 pp.
[20] Gerhard X. Ritter, Peter Sussner, and Juan Luis Diaz de Leon. (1998).
Morphological Associative Memories. IEEE Transactions on Neural
Networks, Vol. 9, No. 2. March 1998.
[21] Alfonso Fernández Sarría. (2007). Estudio de técnicas basadas en la
transformada Wavelet y optimización de sus parámetros para la
clasificación por texturas de imágenes digitales. Tesis de Doctorado.
Valencia, Febrero de 2007.
81
Referencias
[22] Jesús García Consuegra Bleda. [“s.f.”]. Problemática en la clasificación de
imágenes de satélite Landsat. Departamento de informática en la Escuela
Universitaria Politécnica de Albacete.
[23] Yan Gao. (2008). Comparación de distintos métodos de clasificación digital
de imágenes de satélite. Tesis de Doctorado en Geografía. UNAM, Facultad
de Filosofía y Letras. Mayo de 2008.
[24] G. Masip y J.A.Martínez Casasnovas. (2001). Análisis de diferentes
métodos de clasificación de una imagen de satélite para caracterizar la
superficie afectada por el incendio del Solsonés de 1998. Universitat de
Lleida, Dept. Medi Ambienti i Ciencies del Sól. Teledetección, Medio
Ambiente y Cambio Global..
[25] Michael Weeks. Digital Signal Proccessing: Using Matlab and Wavelets.
Second edition.
[26] Lillesand Kiefer. Remote Sensing and Image Interpretation. Third edition.
[27] Digital Signal Processing. Using Matlab and Wavelets.
82
ANEXO I
83
Anexo I
84
Anexo I
85
Anexo I
86
Anexo I
87