Tema 3 Fotogrametria Digital Correclacion y Orientaciones
Tema 3 Fotogrametria Digital Correclacion y Orientaciones
Año 2008_______________
CORRELACIÓN Y ORIENTACIONES
8.1. Introducción
8.2. Principio de la correlación de imágenes
8.2.1. Correlación de imágenes en una dimensión
8.2.2. Correlación de imágenes en dos dimensiones
8.3. Métodos de correlación
8.4. Geometría epipolar
8.5. Correlación y segmentación
8.6. Técnicas manuales, semiautomáticas y automáticas de orientación
8.7. Orientación automática
8.7.1. Orientación interna
8.7.2. Orientación Relativa
8.7.3 Orientación Absoluta
8.8. Técnicas automáticas y semiautomáticas de transferencia de puntos
Bibliografía
8.1. Introducción
En este capitulo se van tratar las técnicas de correlación (matching) de imágenes digitales que
consisten el establecimiento automático de correspondencias entre elementos extraídos de dos o
más imágenes digitales con un recubrimiento común. El término matching se ha impuesto en la
literatura especializada como la expresión más adecuada para expresar correlación entre imágenes
digitales en fotogrametría.
Documento elaborado en base a los “Apuntes de FOTOGRAMETRÏA II” del Prof Juan Antonio Pérez Álvarez de la
Universidad de Extremadura. España. ____________________________________________________________1
Cátedra Fotogrametría. Prof. Ing Carlos Lizana. Dpto.: Ingeniería en Agrimensura U N S J. Año 2008_______________
Cuando el área de búsqueda es demasiado grande en las dos direcciones (x e y), se utiliza lo que
se denomina correlación bidimensional. En cualquier método de correlación que se utilice, el primer
paso es comparar dentro del área de búsqueda los componentes que tengan un tamaño similar
procurando buscar fuera de esta área los puntos que se corresponden con los que hay dentro del área
que se representa.
Puesto que una imagen fotográfica está grabada en dos dimensiones, la correlación de imágenes es
esencialmente un trabajo en dos dimensiones. Sin embargo, la correlación de la imagen estéreo se
puede reducir a una sola dirección, a la de la línea epipolar, y así el trabajo se reduce de forma
considerable. A partir de aquí se realizan dos pasos:
Figura 1. Matrices o áreas de búsqueda y patrón. Matriz o área de búsqueda (Search matriz o area)
Documento elaborado en base a los “Apuntes de FOTOGRAMETRÏA II” del Prof Juan Antonio Pérez Álvarez de la
Universidad de Extremadura. España. ____________________________________________________________2
Cátedra Fotogrametría. Prof. Ing Carlos Lizana. Dpto.: Ingeniería en Agrimensura U N S J. Año 2008_______________
Figura 2. Matrices o áreas de búsqueda y patrón anteriores con sus respectivos niveles digitales.
El área de búsqueda está compuesta por los valores digitales de los píxeles sobre las líneas
escaneadas más cercanas del centro de búsqueda estimado sobre la línea epipolar de búsqueda
conjugada (imagen derecha).
Después de encontrar los puntos conjugados por medio de algoritmos de correlación, el patrón se
traslada a otra columna, y el área de búsqueda es también trasladado sobre la columna de acuerdo
con el punto conjugado encontrado. Entonces comienza el proceso de búsqueda de un nuevo punto.
En la practica siempre es aconsejable realizar el remuestreo de los píxeles a lo largo de las líneas
epipolares de la fotografía izquierda y derecha antes de llevar a cabo la correlación unidimensional
de la imagen. Se llama remuestreo (resampling) a la operación de transformar una imagen en otra
derivada mediante la reordenación de sus píxeles dentro de una malla rectangular.
Documento elaborado en base a los “Apuntes de FOTOGRAMETRÏA II” del Prof Juan Antonio Pérez Álvarez de la
Universidad de Extremadura. España. ____________________________________________________________3
Cátedra Fotogrametría. Prof. Ing Carlos Lizana. Dpto.: Ingeniería en Agrimensura U N S J. Año 2008_______________
En este ejemplo, el área buscada tiene 15×15 píxeles (15 filas y 15 columnas), pero pueden ser
de 50 x 50 incluso de 100 x 100 elementos. Esta área no tiene por qué ser cuadrada.
La ventana patrón y el área de búsqueda contienen números que indican los niveles digitales
de cada uno de los píxel que rodean a sus respectivos centros de la imagen. Para cada cambio de
posición del patrón sobre el aérea de búsqueda se utiliza un algoritmo de correlación digital
(apartado 8.3) para compararla distribución de los niveles digitales de los píxel. La posición
que muestre la similitud más fuerte respecto a los niveles de grises se tomará entonces como
punto homólogo obtenido por correlación (match point).
Documento elaborado en base a los “Apuntes de FOTOGRAMETRÏA II” del Prof Juan Antonio Pérez Álvarez de la
Universidad de Extremadura. España. ____________________________________________________________4
Cátedra Fotogrametría. Prof. Ing Carlos Lizana. Dpto.: Ingeniería en Agrimensura U N S J. Año 2008_______________
La correlación digital compara la información digital de dos imágenes (ventana patrón y área
de búsqueda) de forma sucesiva de acuerdo a determinados grupos de puntos. A continuación se
describirán varios métodos típicos de cálculo computacional directos. Además, también hay
métodos indirectos, tales como los métodos en los que la transformada de Fourier o la
transformada de Hadamard se llevan a cabo sobre dos grupos de datos que son comparados en
correlación; después de esto, el procesamiento es realizado en el dominio de las frecuencias, y
luego se lleva a cabo la correspondiente transformación inversa para volver al espacio dominio
y producir la función de correlación. Cuando hay un gran número de datos, más de 200, los
métodos de calculo de forma indirecta son una ventaja. Sin embargo en correlación digital
aplicada a fotogrametría, con un número pequeño de valores de datos cercanos al pico.
Debido a que cada método de computación en correlación digital tiene sus imperfecciones en
teoría se utilizan de forma simultánea dos o más métodos con el propósito de comparar
resultados y reducir errores en la definición de los puntos homólogos.
Documento elaborado en base a los “Apuntes de FOTOGRAMETRÏA II” del Prof Juan Antonio Pérez Álvarez de la
Universidad de Extremadura. España. ____________________________________________________________5
Cátedra Fotogrametría. Prof. Ing Carlos Lizana. Dpto.: Ingeniería en Agrimensura U N S J. Año 2008_______________
En este método, se calculan los valores de la función de covarianza de dos grupos de datos, y
la covarianza mayor obtenida se toma como la posición de la correlación buscada.
es decir:
Así pues, la relación de correlación entre las imágenes se puede expresar por las anteriores
ecuaciones de covarianza.
Documento elaborado en base a los “Apuntes de FOTOGRAMETRÏA II” del Prof Juan Antonio Pérez Álvarez de la
Universidad de Extremadura. España. ____________________________________________________________6
Cátedra Fotogrametría. Prof. Ing Carlos Lizana. Dpto.: Ingeniería en Agrimensura U N S J. Año 2008_______________
Llamando x a los valores correspondientes a la ventana patrón e y a los del área de búsqueda, los
valores medios de los niveles digitales de ambas imágenes serán respectivamente en la primera
serie de búsqueda correspondería a la posición 1,1
Documento elaborado en base a los “Apuntes de FOTOGRAMETRÏA II” del Prof Juan Antonio Pérez Álvarez de la
Universidad de Extremadura. España. ____________________________________________________________7
Cátedra Fotogrametría. Prof. Ing Carlos Lizana. Dpto.: Ingeniería en Agrimensura U N S J. Año 2008_______________
Documento elaborado en base a los “Apuntes de FOTOGRAMETRÏA II” del Prof Juan Antonio Pérez Álvarez de la
Universidad de Extremadura. España. ____________________________________________________________8
Cátedra Fotogrametría. Prof. Ing Carlos Lizana. Dpto.: Ingeniería en Agrimensura U N S J. Año 2008_______________
Luego, después de trasladar un grupo de datos en relación al otro, se repite la operación hasta el
lugar encontrado donde la suma es mínima. Este sería la posición donde se obtiene el máximo
de correlación. La cantidad de trabajo de cálculo que conlleva este método es relativamente
pequeño y fácil de obtener los resultados.
Aplicando este método al ejemplo anteriormente propuesto, los valores de aplicar la ecuación
anteriormente dan como resultado que la suma mínima corresponde a la posición fila 3,
columna 10, coincidente con la posición x=12, y =5 sobre el área de búsqueda, coincidente con
los métodos anteriores.
El procedimiento es el mismo que el apartado anterior exceptuando que se añade los cuadrados
de los niveles de grises, es decir;
Uso de las diferencias de los valores de los niveles de grises de los píxeles colindantes
En este método, el tratamiento de la diferencia de los valores de los Nd se lleva acabo primero
sobre la serie original de la imagen digital, así por ejemplo, tendremos:
Documento elaborado en base a los “Apuntes de FOTOGRAMETRÏA II” del Prof Juan Antonio Pérez Álvarez de la
Universidad de Extremadura. España. ____________________________________________________________9
Cátedra Fotogrametría. Prof. Ing Carlos Lizana. Dpto.: Ingeniería en Agrimensura U N S J. Año 2008_______________
Así, sustituyendo estas diferencias (cualquiera de las dos, la primera o la segunda ) por los
valores originales de los Nd, se puede obtener la solución de un valor máximo de la función de
correlación, es decir:
O bien para el valor mínimo de la suma de los valores absolutos de las diferencias de los
niveles de grises (en este caso las diferencias de las diferencias), es decir:
Supongamos dos imágenes con un recubrimiento común tomadas desde O1 y O2; la base
O1O2 se llama eje epipolar. El plano que pasa por los centros de proyección izquierda (O1) y
derecha (O2) y el punto arbitrario P, es llamado plano epipolar que pasa por el punto P (Fig. 5).
El plano epipolar que pasa por el punto principal es llamado plano epipolar principal. En un
modelo fotogramétrico cada una de las imágenes izquierda y derecha tienen sus respectivos
planos epipolares principales. La línea de intersección de un plano epipolar y el plano de la
fotografía se denomina rayo o línea epipolar. Todos los rayos epipolares de una misma
fotografía intersectan en un punto llamado punto epipolar K, que es la intersección de la recta
que pasa a través de los dos centros de proyección (eje epipolar) con el plano de la fotografía.
Documento elaborado en base a los “Apuntes de FOTOGRAMETRÏA II” del Prof Juan Antonio Pérez Álvarez de la
Universidad de Extremadura. España. ____________________________________________________________10
Cátedra Fotogrametría. Prof. Ing Carlos Lizana. Dpto.: Ingeniería en Agrimensura U N S J. Año 2008_______________
En la mayoría de los casos, los dos ejes de toma de las fotografías no son paralelos ni
perpendiculares a la base aérea (O1O2), entonces es necesario la transformación de las imágenes
a una posición en las que las líneas epipolares homólogas sean paralelas al eje abscisas del
sistema de coordenadas imagen, es decir, que tengan la misma coordenada y. Las imágenes
normalizadas deben ser paralelas a la base aérea y deben tener la misma distancia principal.
Documento elaborado en base a los “Apuntes de FOTOGRAMETRÏA II” del Prof Juan Antonio Pérez Álvarez de la
Universidad de Extremadura. España. ____________________________________________________________11
Cátedra Fotogrametría. Prof. Ing Carlos Lizana. Dpto.: Ingeniería en Agrimensura U N S J. Año 2008_______________
Para generar una imagen normalizada a partir de una original se va a partir del hecho de que
se ha llevado a cabo una orientación relativa por rotaciones (Fig. 5), donde (x’, y´) (x”, y”) son
las coordenadas de las imágenes originales (u’, v’) (u”, v”) las coordenadas de las imágenes
normalizadas. La distancia principal en las imágenes normalizadas es c´. El origen de
coordenadas local esta en el centro de proyección izquierdo (O1) y el eje de las X pasa a través
del centro de proyección (O2). El eje Z es perpendicular a la primera imagen normalizada. El eje
Y es perpendicular al plano XZ.
La relación matemática entre las coordenadas imagen (x’, y´) de una de las imágenes
originales y las coordenadas de la imagen normalizada (u’, v’) pueden expresarse por las
Documento elaborado en base a los “Apuntes de FOTOGRAMETRÏA II” del Prof Juan Antonio Pérez Álvarez de la
Universidad de Extremadura. España. ____________________________________________________________12
Cátedra Fotogrametría. Prof. Ing Carlos Lizana. Dpto.: Ingeniería en Agrimensura U N S J. Año 2008_______________
La expresión que relaciona las coordenadas de la imagen normalizada con la original viene
dada por:
Una vez aplicada la transformación geométrica, hay que determinar el nivel de gris que le
corresponde a cada píxel, debido a que la posición proyectada no debe coincidir con la posición
original del mismo ni con su valor entero. Al realizar la transformación espacial se tiene que los
valores de las coordenadas de la imagen normalizadas están en el sistema imagen, es decir, son
valores reales y no valores enteros como corresponden a la posición de en una imagen digital
(fila y columna), de forma que habrá puntos que no quedarán definido por sus niveles digitales
(fig. 8). Por tanto, es necesario interpolar el valor de gris; a esta operación se le conoce con el
nombre de remuestreo (resampling).
Por medio de este método (remuestreo) hacemos varios muestreos sobre la imagen inicial.
Cada vez que se efectúan cambios geométricos en la imagen digital, surgen varios errores de
Documento elaborado en base a los “Apuntes de FOTOGRAMETRÏA II” del Prof Juan Antonio Pérez Álvarez de la
Universidad de Extremadura. España. ____________________________________________________________13
Cátedra Fotogrametría. Prof. Ing Carlos Lizana. Dpto.: Ingeniería en Agrimensura U N S J. Año 2008_______________
forma inevitable.
Este método se llama así por situar en cada cuadrado de la malla de la imagen el valor de gris
del píxel más cercano en la imagen original. Esta es la solución mas rápida y su principal
inconveniente está en la distorsión que introduce en rasgos lineales de la imagen como
carreteras, caminos, ....etc.
xP = Int ( x + 0.5)
yP = Int ( y + 0.5)
Este método supone promediar los niveles de gris de los cuatro píxeles más próximos de la
imagen original. Este promedio se pondera según la distancia del píxel original al corregido;
teniendo mayor influencia los píxeles más cercanos de la imagen original. Reduce el efecto de
distorsión en los rasgos lineales, pero tiende a difuminar un tanto los contrastes espaciales de la
imagen original.
Considera los niveles de gris de los 16 píxeles más próximos. El efecto visual es más
correcto que los anteriores pero supone un volumen de cálculo mucho mayor.
De los tres métodos de remuestreo mencionados, el método del vecino más próximo es el
más simple. Se distingue por su rápida ejecución en cuanto a cálculo se refiere, pero
geométricamente hablando es el menos adecuado, con una precisión de ±0.5 píxel. Los otros
dos métodos restantes tienen una mayor precisión geométrica pero se requiere mayor trabajo en
Documento elaborado en base a los “Apuntes de FOTOGRAMETRÏA II” del Prof Juan Antonio Pérez Álvarez de la
Universidad de Extremadura. España. ____________________________________________________________14
Cátedra Fotogrametría. Prof. Ing Carlos Lizana. Dpto.: Ingeniería en Agrimensura U N S J. Año 2008_______________
En segmentación se vio como se pueden detectar bordes o como definir umbrales y de esta
forma encontrar objetos o zonas con valores de grises uniformes y por tanto homogéneos.
Comprobamos como, debido a la complejidad de la radiometría, no existe un único método o
técnica y como suele ser una combinación de éstos la mejor solución.
Así pues, será necesario definir toda la lógica de operación capaz de seleccionar los datos
correctos y obtener con ellos los mejores resultados. Teniendo en cuenta que una de nuestras
necesidades es obtener la mayor precisión y el menor error posible para sacar el mejor partido a
un vuelo o fotografías, estas técnicas serán esenciales para llegar a ese fin.
Estas condiciones permiten ampliar la precisión e incluso nos ayudarán a tomar las
decisiones que vamos a necesitar desde el punto de vista informático al enriquecer las
ecuaciones y también nos permitirán emplear el cálculo de mínimos cuadrados para mejorar los
resultados.
Documento elaborado en base a los “Apuntes de FOTOGRAMETRÏA II” del Prof Juan Antonio Pérez Álvarez de la
Universidad de Extremadura. España. ____________________________________________________________15
Cátedra Fotogrametría. Prof. Ing Carlos Lizana. Dpto.: Ingeniería en Agrimensura U N S J. Año 2008_______________
Por tanto, serán necesarios tener en cuenta aquellos factores que intervienen tanto en la
definición de la imagen como en la formación del modelo tridimensional, y a modo de ejemplo
se apuntan aquellos que tienen una mayor incidencia:
1Textura: fotografías aéreas de texturas muy uniformes, exigen en la gran mayoría de los
casos, una preseñalización de los puntos de apoyo o un marcado por transferidores
estereoscópicos de estos puntos sobre los fotogramas y previo a las operaciones de
escáner. Dentro de ciertos límites, la textura puede alcanzar una mayor entidad según la
sensibilidad de la película. Emulsiones infrarrojas blanco y negro darán una mejor
definición en los bordes de la red de drenaje, diferenciación de especies de arbóreas, etc.
Emulsiones en color permiten un resalte y mayor facilidad de interpretar características
del terreno. La ventaja del color en fotogrametría digital, además de las características
enunciadas, estriba en la posibilidad de aplicar algoritmos simples de segmentación muy
usados en el análisis multiespectral de sensores remotos. Una desventaja del color es el
problema de la calibración dado que las imágenes se obtienen por digitalización en
escáner así como el almacenamiento de las estas.
2Modelo estereoscópico: el modelo estereoscópico permite la interpretación bajo dos
puntos de vistas diferentes y mediante la información tridimensional dar una correcta
solución al problema.
Sin embargo, se incluyen dentro de los sistemas fotogramétricos, equipos que no contemplan
ningún proceso automático. Su desarrollo se realiza igual que en fotogrametría analítica, pero
cambiando el restituidor por el ordenador. Desde este punto de vista las orientaciones en estos
sistemas son completamente manuales. Existen ayudas en la posición dentro de las imágenes,
pero no automatismo.
Los otros sistemas cuentan con la correlación como procedimiento de cálculo. Pero hay que
distinguir claramente dos posibilidades dentro de estos sistemas mirando solo los procesos de
orientación. Cuando la correlación es un apoyo o cuando la correlación supone la
automatización del proceso. La diferencia es muy importante, la segunda posibilidad consigue
que, por decirlo fácilmente, la orientación se realice sola, mientras que la primera posibilidad
hace que sea el operador el que realice las orientaciones y que solamente en la materialización
del punto sobre el terreno se considere la correlación, la eliminación de la paralaje en cada
punto es automática. Podemos hablar de procesos semiautomáticos.
Dentro de los casos de procesos automáticos, se verá en el próximo apartado que no se puede
hablar de automatización completa, ya que la orientación absoluta no es totalmente automática.
Sin embargo, la orientación interna es completamente automática hasta, el punto que existen
sistemas de escáner que realizan la orientación interna a la vez que escanean las fotografías, por
lo cual el operador se olvida completamente de la orientación interna. Respecto a la orientación
relativa se puede hablar también de ella como un proceso automático, exige un tiempo de
cálculo dependiendo de la resolución de las fotografías y de la capacidad de proceso del
ordenador que puede llegar a ser importante y que en ordenadores bastante potentes queda
reducido a 1 ó 2 minutos por par estereoscópico. Un aspecto importante y causante de este
tiempo es el elevado número de puntos conjugados que es necesario utilizar para llegar a
orientar el modelo como se verá en el proceso explicado más adelante.
Documento elaborado en base a los “Apuntes de FOTOGRAMETRÏA II” del Prof Juan Antonio Pérez Álvarez de la
Universidad de Extremadura. España. ____________________________________________________________16
Cátedra Fotogrametría. Prof. Ing Carlos Lizana. Dpto.: Ingeniería en Agrimensura U N S J. Año 2008_______________
A continuación se estudiarán cada una de las fases del proceso de orientación (interna y
externa) desde un punto de vista de la automatización de cada una de ellas.
Existen en una fotografía métrica aérea ocho posibilidades dentro de las zonas donde se
encuentran las marcas fiduciales. Las cámaras convencionales tienen cuatro marcas fiduciales
diametralmente dispuestas, aunque existen cámaras que disponen de las ocho marcas. Nuestro
planteamiento se basa en la localización de estas marcas, en su medición y en el conocimiento
de la focal de la cámara.
Por la disposición de las marcas fiduciales también existirá una rotación de 90º en el caso de
que existiera una mala posición de la fotografía en el momento del escaneo, teniendo en cuenta
que dentro de la misma pasada, las fotografías están dispuestas en la misma dirección. Por tanto
existe la posibilidad de necesitar una rotación previa a la orientación interna para corregir este
error (Fig. 7).
Como las marcas fiduciales son objetos bidimensionales con una geometría y radiometría
particular y que no difieren en rotación más de 10º. La correlación es la opción más válida para
la medición de las marcas. Si tenemos en cuenta la homogeneidad tanto en la forma como en la
radiometría de estas marcas, la correlación presenta en esta detección una aceptación máxima en
la medición. Si a este aspecto añadimos técnicas de segmentación por binarización se consigue
una correlación muy eficiente.
Documento elaborado en base a los “Apuntes de FOTOGRAMETRÏA II” del Prof Juan Antonio Pérez Álvarez de la
Universidad de Extremadura. España. ____________________________________________________________17
Cátedra Fotogrametría. Prof. Ing Carlos Lizana. Dpto.: Ingeniería en Agrimensura U N S J. Año 2008_______________
1Reconocimiento del patrón, mediante la identificación del tipo de marca fiducial que
contenga la fotografía.
2
3Tratamiento de imágenes piramidales. El uso de imágenes piramidales, ayudará a una
rápida localización de la zona en que se encuentra la marca fiducial.
Para la realización de esta fase de orientación es necesario disponer de los siguientes datos:
Durante el enfrentamiento de puntos, se determinan puntos conjugados. Para cada nivel, las
características del punto son extraídas y separadas en cada imagen usando un operador de
Documento elaborado en base a los “Apuntes de FOTOGRAMETRÏA II” del Prof Juan Antonio Pérez Álvarez de la
Universidad de Extremadura. España. ____________________________________________________________18
Cátedra Fotogrametría. Prof. Ing Carlos Lizana. Dpto.: Ingeniería en Agrimensura U N S J. Año 2008_______________
Sin embargo si se han desarrollado sistemas con una orientación absoluta semiautomática
consistente en definir sobre una imagen al punto de apoyo y que sea el ordenador el encargado
de localizar en el resto de las imágenes el mismo punto con el subsiguiente ahorro de tiempo.
Documento elaborado en base a los “Apuntes de FOTOGRAMETRÏA II” del Prof Juan Antonio Pérez Álvarez de la
Universidad de Extremadura. España. ____________________________________________________________19
Cátedra Fotogrametría. Prof. Ing Carlos Lizana. Dpto.: Ingeniería en Agrimensura U N S J. Año 2008_______________
Aspecto de importancia en estos casos serán las técnicas de segmentación, sobre todo en
detección de bordes y el apoyo de condiciones geométricas ya que estos puntos una vez
transferidos se utilizarán para medirse monoscópicamente y un error en la materialización de los
puntos sobre el terreno se arrastrará posteriormente.
Bibliografía
Documento elaborado en base a los “Apuntes de FOTOGRAMETRÏA II” del Prof Juan Antonio Pérez Álvarez de la
Universidad de Extremadura. España. ____________________________________________________________20