Problema inverso
Un problema inverso en ciencia es el proceso de calcular, a partir de un conjunto
de observaciones, los factores causales que las produjeron: por ejemplo, calcular
una imagen en tomografía computarizada de rayos X, reconstrucción de fuentes
en acústica, o calcular la densidad de la Tierra a partir de mediciones de su campo
de gravedad. Se llama problema inverso porque comienza con los efectos y luego
calcula las causas. Es el inverso de un problema directo, que comienza con las
causas y luego calcula los efectos.
Los problemas inversos son algunos de los problemas matemáticos más
importantes en ciencias y matemáticas porque nos informan sobre parámetros que
no podemos observar directamente. Tienen una amplia aplicación en identificación
de sistemas, óptica, radar, acústica, teoría de la comunicación, procesamiento de
señales, imágenes médicas, visión por computadora, geofísica, oceanografía,
astronomía, detección remota, procesamiento de lenguaje natural, aprendizaje
automático, pruebas no destructivas, análisis de estabilidad de taludes y muchos
más. otros campos.
Historia
Comenzar con los efectos para descubrir las causas ha preocupado a los físicos
durante siglos. Un ejemplo histórico son los cálculos de Adams y Le Verrier que
llevaron al descubrimiento de Neptuno a partir de la trayectoria perturbada de
Urano. Sin embargo, no se inició un estudio formal de los problemas inversos
hasta el siglo XX.
Hermann Weyl descubrió uno de los primeros ejemplos de una solución a un
problema inverso y lo publicó en 1911, describiendo el comportamiento asintótico
de los valores propios del operador de Laplace-Beltrami. Hoy conocida como ley
de Weyl, quizás se entienda más fácilmente como una respuesta a la pregunta de
si es posible escuchar la forma de un tambor. Weyl conjeturó que las frecuencias
propias de un tambor estarían relacionadas con el área y el perímetro del tambor
mediante una ecuación particular, un resultado mejorado por matemáticos
posteriores.
El campo de los problemas inversos fue abordado más tarde por el físico
soviético-armenio Viktor Ambartsumian.
Cuando aún era estudiante, Ambartsumian estudió a fondo la teoría de la
estructura atómica, la formación de los niveles de energía y la ecuación de
Schrödinger y sus propiedades, y cuando dominó la teoría de los valores propios
de las ecuaciones diferenciales, señaló la aparente analogía entre niveles
discretos de energía y los valores propios de ecuaciones diferenciales. Luego
preguntó: dada una familia de valores propios, ¿es posible encontrar la forma de
las ecuaciones cuyos valores propios son? Esencialmente, Ambartsumian estaba
examinando el problema inverso de Sturm-Liouville, que se ocupaba de
determinar las ecuaciones de una cuerda vibrante. Este artículo se publicó en
1929 en la revista de física alemana Zeitschrift für Physik y permaneció en la
oscuridad durante bastante tiempo. Al describir esta situación después de muchas
décadas, Ambartsumian dijo: "Si un astrónomo publica un artículo con contenido
matemático en una revista de física, lo más probable es que lo olvide".
Sin embargo, hacia el final de la Segunda Guerra Mundial, este artículo, escrito
por Ambartsumian, de 20 años, fue encontrado por matemáticos suecos y
constituyó el punto de partida para toda un área de investigación sobre problemas
inversos, convirtiéndose en la base de toda una disciplina.
Luego se han dedicado importantes esfuerzos a una "solución directa" del
problema de dispersión inversa especialmente por Gelfand y Levitan en la Unión
Soviética. Propusieron un método analítico constructivo para determinar la
solución. Cuando las computadoras estuvieron disponibles, algunos autores
investigaron la posibilidad de aplicar su enfoque a problemas similares, como el
problema inverso en la ecuación de onda 1D. Pero rápidamente resultó que la
inversión es un proceso inestable: el ruido y los errores pueden amplificarse
enormemente, lo que hace que una solución directa sea difícilmente practicable.
Luego, alrededor de los años setenta, aparecieron los enfoques de mínimos
cuadrados y probabilísticos, que resultaron ser muy útiles para la determinación de
parámetros involucrados en varios sistemas físicos. Este enfoque tuvo mucho
éxito. Hoy en día, los problemas inversos también se investigan en campos fuera
de la física, como la química, la economía y la informática. Eventualmente, a
medida que los modelos numéricos prevalecen en muchas partes de la sociedad,
podemos esperar un problema inverso asociado con cada uno de estos modelos
numéricos.
Comprensión conceptual
Desde Newton, los científicos han intentado mucho modelar el mundo. En
particular, cuando se dispone de un modelo matemático (por ejemplo, la ley
gravitatoria de Newton o la ecuación de Coulomb para la electrostática), podemos
prever, dados algunos parámetros que describen un sistema físico (como una
distribución de masa o una distribución de cargas eléctricas), el comportamiento
del sistema. Este enfoque se conoce como modelado matemático y los
parámetros físicos mencionados anteriormente se denominan parámetros del
modelo o simplemente modelo. Para ser precisos, introducimos la noción
de estado del sistema físico: es la solución de la ecuación del modelo
matemático. En la teoría del control óptimo, estas ecuaciones se denominan
ecuaciones de estado. En muchas situaciones, no estamos realmente interesados
en conocer el estado físico, sino solo sus efectos en algunos objetos (por ejemplo,
los efectos que tiene el campo gravitatorio en un planeta específico). De ahí que
tengamos que introducir otro operador, llamado operador de observación, que
convierte el estado del sistema físico (aquí el campo gravitatorio predicho) en lo
que queremos observar (aquí los movimientos del planeta considerado). Ahora
podemos introducir el llamado problema de avance, que consta de dos pasos:
determinación del estado del sistema desde los parámetros físicos que lo
describen
aplicación del operador de observación al estado estimado del sistema para
predecir el comportamiento de lo que queremos observar.
Esto conduce a introducir otro operador F (F significa "para adelante") que mapas
parámetros modelo p en F (p), los datos que modelo p predice que es el resultado
de este procedimiento de dos pasos. Operador F se llama operador o mapa del
futuro. En este enfoque básicamente intentamos predecir los efectos sabiendo las
causas.
La siguiente tabla muestra, considerando la Tierra como el sistema físico y para
diferentes fenómenos físicos, los parámetros del modelo que describen el sistema,
la cantidad física que describe el estado del sistema físico y las observaciones
comúnmente realizadas sobre el estado del sistema.
Parámetros modelo
Ecuaciones de Observaciones comunes sobre el
(introducción del Estado del sistema físico
gobierno sistema
modelo)
Ley de Medición realizada por gravimetros
gravedad de Distribución de masa Campo gravitacional en diferentes ubicaciones
Newton superficiales
Campo magnético medido en
Distribución de la
Ecuaciones de diferentes ubicaciones superficiales
susceptibilidad Campo magnético
Maxwell por magnetómetros (caso de estado
magnética
fijo)
Distribución de Campo de onda causado Velocidad de partículas medida por
Ecuación de
velocidades de onda y por fuentes sísmicas sismómetros colocados en
onda
densidades artificiales o naturales diferentes lugares de superficie
Difundir la concentración
Ecuación de Distribución del Vigilancia de esta concentración
material como función del
difusión coeficiente de difusión medida en diferentes lugares
espacio y del tiempo
En el enfoque del problema inverso, en términos generales, tratamos de conocer
las causas dados los efectos.
Enunciado general del problema inverso
El problema inverso es el "inverso" del problema de avance: en lugar de
determinar los datos producidos por parámetros de modelo particulares, queremos
determinar los parámetros de modelo que producen los datos que es la
observación que hemos grabado (el subscripto obs stands for observed). Nuestro
objetivo, en otras palabras, es determinar los parámetros del modelo p tal que (al
menos aproximadamente)
= F(p)
FMN
El espacio de modelos denotado por P: el espacio vectorial abarcado por
parámetros modelo; tiene M dimensiones;
El espacio de datos denotado por D: D=RN si organizamos las muestras
medidas en un vector con N componentes (si nuestras mediciones
consisten en funciones, D es un espacio vectorial con dimensiones
infinitas);
F(p): respuesta del modelo p; consta de los datos predichos por
modelo p;
F(P): la imagen de P por el mapa de adelante, es un subconjunto
de D (pero no un subespacial a menos que F es lineal) de las respuestas de
todos los modelos;
d obs- F(p): datos inadaptados (o residuales) asociado con modelo p: se
pueden organizar como vector, un elemento D.
El concepto de residuos es muy importante: en el ámbito de encontrar un modelo
que coincida con los datos, su análisis revela si el modelo considerado puede
considerarse realista o no. Las discrepancias sistemáticas poco realistas entre
los datos y las respuestas del modelo también revelan que el mapa de avance es
inadecuado y puede brindar información sobre un mapa de avance mejorado.
Cuando el operador F es lineal, el problema inverso es lineal. De lo contrario, eso
es más a menudo, el problema inverso es no lineal. Además, los modelos no
siempre pueden ser descritos por un número finito de parámetros. Es el caso
cuando buscamos parámetros distribuidos (una distribución de velocidades de
onda, por ejemplo): en tales casos el objetivo del problema inverso es recuperar
una o varias funciones. Tales problemas inversos son problemas inversos con
dimensión infinita.
Problemas inversos lineales
En el caso de un mapa directo lineal y cuando tratamos con un número finito de
parámetros del modelo, el mapa directo se puede escribir como un sistema lineal
Un ejemplo elemental: el campo gravitatorio de la Tierra
Solo unos pocos sistemas físicos son realmente lineales con respecto a los
parámetros del modelo. Uno de esos sistemas de la geofísica es el del campo
gravitatorio de la Tierra. El campo gravitatorio de la Tierra está determinado por la
distribución de la densidad de la Tierra en el subsuelo. Debido a que la litología de
la Tierra cambia significativamente, podemos observar diferencias mínimas en el
campo gravitatorio de la Tierra en la superficie de la Tierra. A partir de nuestra
comprensión de la gravedad (ley de gravitación de Newton), sabemos que la
expresión matemática de la gravedad es:
Al discretar la expresión anterior, podemos relacionar las observaciones de datos
discretas sobre la superficie de la Tierra con los parámetros de modelo discretos
(densidad) en la subsuperficie que deseamos conocer más. Por ejemplo,
considere el caso en el que tenemos mediciones realizadas en 5 lugares en la
superficie de la Tierra. En este caso, nuestro vector de datos, d es un vector de
columna de dimensión (5×1): su i-to componente se asocia con el i-la ubicación de
observación. También sabemos que sólo tenemos cinco masas
desconocidas pj en la subsuperficie (no realista pero utilizado para demostrar el
concepto) con ubicación conocida: denotamos por rij la distancia entre i-la
ubicación de observación y el j- la misa. Así, podemos construir el sistema lineal
que relaciona las cinco masas desconocidas a los cinco puntos de datos como
sigue:
Para resolver los parámetros modelo que se ajustan a nuestros datos, podemos
invertir la matriz F para convertir directamente las mediciones en nuestros
parámetros modelo. Por ejemplo:
Sin embargo, incluso una matriz cuadrada no puede tener inverso: matriz F puede
ser deficiente de rango (es decir, tiene cero eigenvalues) y la solución del
sistema no es único. Entonces la solución del problema inverso
será indeterminada. Esta es una primera dificultad. Los sistemas
sobredeterminados (más ecuaciones que desconocidos) tienen otros problemas.
También el ruido puede dañar nuestras observaciones haciendo d posiblemente
fuera del espacio F(P) de posibles respuestas a parámetros modelo para que la
solución del sistema puede no existir. Esta es otra dificultad.
Herramientas para superar la primera dificultad
La primera dificultad refleja un problema crucial: nuestras observaciones no
contienen suficiente información y se requieren datos adicionales. Los datos
adicionales pueden provenir de información previa física sobre los valores de los
parámetros, sobre su distribución espacial o, más generalmente, sobre su
dependencia mutua. También puede provenir de otros experimentos: por ejemplo,
podemos pensar en integrar datos registrados por gravímetros y sismógrafos para
una mejor estimación de las densidades. La integración de esta información
adicional es básicamente un problema de estadística. Esta disciplina es la que
puede responder a la pregunta: ¿Cómo mezclar cantidades de distinta naturaleza?
Seremos más precisos en la sección "Enfoque bayesiano" abajo.
En cuanto a los parámetros distribuidos, la información previa sobre su distribución
espacial consiste a menudo en información sobre algunos derivados de estos
parámetros distribuidos. Además, es práctica común, aunque algo artificial, buscar
el modelo "simplest" que coincide razonablemente con los datos. Esto se logra
generalmente penalizando L1 norma del gradiente (o la variación total) de los
parámetros (este enfoque también se denomina la maximización de la entropía).
También se puede hacer el modelo simple a través de una parametrización que
introduce los grados de libertad sólo cuando sea necesario.
También puede integrarse información adicional a través de limitaciones de
desigualdad en los parámetros modelo o algunas funciones de ellos. Estas
limitaciones son importantes para evitar valores poco realistas para los parámetros
(valores negativos, por ejemplo). En este caso, el espacio abarcado por
parámetros modelo ya no será un espacio vectorial sino un espacio
vectorial subconjunto de modelos admisibles denotado por Padm en la secuela.
Herramientas para superar la segunda dificultad
Como se mencionó anteriormente, el ruido puede ser tal que nuestras mediciones
no son la imagen de ningún modelo, de modo que no podemos buscar un modelo
que produzca los datos sino buscar el mejor (o óptimo) modelo: es decir, el que
mejor se ajuste a los datos. Esto nos lleva a minimizar una función objetiva, a
saber, una funcional que cuantifica la magnitud de los residuos o hasta qué punto
los datos predichos son de los datos observados. Por supuesto, cuando tenemos
datos perfectos (es decir, sin ruido) entonces el modelo recuperado debe
adaptarse perfectamente a los datos observados. Una función objetiva estándar,
, es de la forma:
(p) es la norma Euclideana (será
la L2 norma cuando las mediciones son funciones en lugar de muestras) de los
residuos. Este enfoque equivale a hacer uso de los mínimos cuadrados ordinarios,
un enfoque ampliamente utilizado en las estadísticas. Sin embargo, se sabe que la
norma euclidiana es muy sensible a los outliers: para evitar esta dificultad
podemos pensar en utilizar otras distancias, por ejemplo la L1 norma, en
sustitución de la L2 norma.
Enfoque bayesiano
Muy similar al enfoque de mínimos cuadrados es el enfoque probabilístico: si
conocemos las estadísticas del ruido que contamina los datos, podemos pensar
en buscar el modelo más probable m, que es el modelo que coincide con el criterio
de máxima verosimilitud.. Si el ruido es gaussiano, el criterio de máxima
verosimilitud aparece como un criterio de mínimos cuadrados, siendo reemplazado
el producto escalar euclidiano en el espacio de datos por un producto escalar que
implica la covarianza del ruido. Además, si se dispusiera de información previa
sobre los parámetros del modelo, podríamos pensar en utilizar la inferencia
bayesiana para formular la solución del problema inverso. Este enfoque se
describe en detalle en el libro de Tarantola.
Solución numérica de nuestro ejemplo elemental
Aquí hacemos uso de la norma Euclideana para cuantificar los inadaptados de
datos. Mientras tratamos con un problema inverso lineal, la función objetiva es
cuadrática. Para su minimización, es clásico calcular su gradiente utilizando la
misma racionalidad (como vamos a minimizar una función de sólo una variable).
En el modelo óptimo Popt, este gradiente desaparece que puede ser escrito como:
Esta expresión se conoce como la ecuación normal y nos da una posible solución
al problema inverso. En nuestra matriz de ejemplo FTF resulta ser generalmente
de rango completo para que la ecuación anterior tenga sentido y determine
singularmente los parámetros modelo: no necesitamos integrar información
adicional para terminar con una solución única.
Aspectos matemáticos y computacionales
Los problemas inversos suelen estar mal planteados, a diferencia de los
problemas bien planteados que normalmente se encuentran en los modelos
matemáticos. De las tres condiciones sugeridas por Jacques Hadamard para un
problema bien planteado (existencia, singularidad y estabilidad de la solución o
soluciones), la condición de estabilidad es la que más se viola. En el sentido del
análisis funcional, el problema inverso se representa mediante un mapeo entre
espacios métricos. Si bien los problemas inversos a menudo se formulan en
espacios dimensionales infinitos, las limitaciones a un número finito de mediciones
y la consideración práctica de recuperar solo un número finito de parámetros
desconocidos pueden llevar a que los problemas se reformulen en forma discreta.
En este caso, el problema inverso normalmente será mal condicionado. En estos
casos, la regularización se puede utilizar para introducir supuestos leves sobre la
solución y evitar el sobreajuste. Muchos casos de problemas inversos
regularizados pueden interpretarse como casos especiales de inferencia
bayesiana.
Solución numérica del problema de optimización
Algunos problemas inversos tienen una solución muy simple, por ejemplo, cuando
uno tiene un conjunto de funciones unisolvent, que significa un conjunto
de n funciones tales que las evalúan n distintos puntos producen un conjunto de
vectores linealmente independientes. Esto significa que dada una combinación
lineal de estas funciones, los coeficientes se pueden computar mediante la
organización de los vectores como columnas de una matriz y luego la inversión de
esta matriz. El ejemplo más simple de las funciones unisolvent es polinomios
construidos, utilizando el teorema de unisolvence, para ser unisolvent.
Concretamente, esto se hace invirtiendo la matriz de Vandermonde. Pero esto es
una situación muy específica.
En general, la solución de un problema inverso requiere sofisticados algoritmos de
optimización. Cuando el modelo es descrito por un gran número de parámetros (el
número de desconocidos involucrados en algunas aplicaciones de tomografía de
difracción puede alcanzar mil millones), resolver el sistema lineal asociado con las
ecuaciones normales puede ser engorroso. El método numérico que se utiliza para
resolver el problema de optimización depende en particular del costo necesario
para calcular la solución Fp del problema del futuro. Una vez elegido el algoritmo
apropiado para resolver el problema de avance (una multiplicación simple de la
matriz-vector puede no ser adecuado cuando la matriz F es enorme), el algoritmo
apropiado para realizar la minimización se puede encontrar en libros de texto que
tratan con métodos numéricos para la solución de sistemas lineales y para la
minimización de funciones cuadráticas (véase por ejemplo Ciarlet o Nocedal).
Además, es posible que el usuario desee agregar restricciones físicas a los
modelos: en este caso, debe estar familiarizado con los métodos de optimización
restringidos, un tema en sí mismo. En todos los casos, calcular el gradiente de la
función objetivo suele ser un elemento clave para la solución del problema de
optimización. Como se mencionó anteriormente, la información sobre la
distribución espacial de un parámetro distribuido se puede introducir a través de la
parametrización. También se puede pensar en adaptar esta parametrización
durante la optimización.
Si la función objetiva se basa en una norma que no sea la norma euclidiana,
tenemos que dejar el área de optimización cuadrática. Como resultado, el
problema de optimización se hace más difícil. En particular, cuando el L1 la norma
se utiliza para cuantificar los datos mal adaptados la función objetiva ya no es
diferenciable: su gradiente ya no tiene sentido. Los métodos dedicados (véase por
ejemplo Lemaréchal) de optimización no diferenciable entran.
Una vez que se computa el modelo óptimo tenemos que abordar la pregunta:
"¿Podemos confiar en este modelo?" La cuestión puede formularse de la siguiente
manera: ¿Cuán grande es el conjunto de modelos que coinciden con los datos
"casi también" como este modelo? En el caso de funciones objetivas cuadráticas,
este conjunto está contenido en un hiper-ellipsoide, un subconjunto de RM ()R es el
número de desconocidos), cuyo tamaño depende de lo que queremos decir con
"cercamente también", que está en el nivel de ruido. La dirección del eje más
grande de este ellipsoide (eigenvector asociado con el menor valor de la matriz F)
es la dirección de componentes mal determinados: si seguimos esta dirección,
podemos traer una fuerte perturbación al modelo sin cambiar significativamente el
valor de la función objetiva y así terminar con un modelo cuasi-optimal
significativamente diferente. Vemos claramente que la respuesta a la pregunta
"podemos confiar en este modelo" se rige por el nivel de ruido y por los
eigenvalues del Hesiano de la función objetiva o equivalentemente, en el caso en
que no se haya integrado la regularización, por los valores singulares de la
matriz FTF. Por supuesto, el uso de regularización (o de otro tipo de información
anterior) reduce el tamaño del conjunto de soluciones casi óptimas y, a su vez,
aumenta la confianza que podemos poner en la solución computada.
Estabilidad, regularización y discretización de modelos en dimensión infinita
Nos centramos aquí en la recuperación de un parámetro distribuido. Cuando
buscamos parámetros distribuidos tenemos que discretizar estas funciones
desconocidas. Al hacerlo, reducimos la dimensión del problema a algo finito. Pero
ahora, la pregunta es: ¿existe algún vínculo entre la solución que calculamos y la
del problema inicial? Luego otra pregunta: ¿a qué nos referimos con la solución
del problema inicial? Dado que un número finito de datos no permite la
determinación de una infinidad de incógnitas, el funcional de desajuste de datos
original debe regularizarse para garantizar la unicidad de la solución. Muchas
veces, reducir las incógnitas a un espacio de dimensión finita proporcionará una
regularización adecuada: la solución calculada se verá como una versión discreta
de la solución que buscábamos. Por ejemplo, una discretización ingenua a
menudo funcionará para resolver el problema de desconvolución: funcionará
siempre que no permitamos que las frecuencias faltantes aparezcan en la solución
numérica. Pero muchas veces, la regularización tiene que estar integrada
explícitamente en la función objetivo.
Para entender lo que puede suceder, debemos tener en cuenta que resolver un
problema lineal inverso de este tipo equivale a resolver una ecuación integral de
Fredholm del primer tipo:
Donde K es el núcleo, x y y son vectores de R2, y es un dominio en R2. Esto
tiene para una aplicación 2D. Para una aplicación 3D, consideramos .
Tenga en cuenta que aquí los parámetros del modelo p consiste en
una función y que la respuesta de un modelo también consiste en una función
denotada . Esta ecuación es una extensión a la dimensión infinita de la
ecuación matriz dado en el caso de problemas discretos.
Para lo suficientemente suave K el operador definido anteriormente es compacto
en espacios razonables de Banach, como el L2. F. La teoría de Riesz establece
que el conjunto de valores singulares de tal operador contiene cero (de ahí la
existencia de un espacio nulo), es finito o lo más contable, y, en este último caso,
constituyen una secuencia que va a cero. En el caso de un núcleo simétrico,
tenemos una infinidad de eigenvalues y los eigenvectores asociados constituyen
una base hilbertiana de L2. Así, cualquier solución de esta ecuación se determina
hasta una función aditiva en el espacio nulo y, en el caso de la infinidad de valores
singulares, la solución (que implica la reciproca de pequeños eigenvalues
arbitrarios) es inestable: dos ingredientes que hacen de la solución de esta
ecuación integral un problema típico malpuesto! Sin embargo, podemos definir una
solución a través del pseudo-inverso del mapa adelante (de nuevo a una función
aditiva arbitraria). Cuando el mapa de avance es compacto, la regularización
clásica de Tikhonov funcionará si lo utilizamos para integrar información previa
indicando que L2 la norma de la solución debe ser lo más pequeña posible: esto
hará que el problema inverso sea bien planteado. Sin embargo, como en el caso
de dimensión finita, tenemos que cuestionar la confianza que podemos poner en la
solución computada. De nuevo, básicamente, la información reside en los valores
eigenvalues del operador hesiano. Si se exploran subespacios que contienen
eigenvectores asociados con pequeños eigenvalues para calcular la solución,
entonces la solución difícilmente se puede confiar: algunos de sus componentes
serán mal determinados. El valor más pequeño es igual al peso introducido en la
regularización de Tikhonov.
Los núcleos irregulares pueden producir un mapa adelante que no es compacto e
incluso sin límites si equipamos ingenuamente el espacio de los modelos con
el L2 norma. En tales casos, el Hessian no es un operador vinculado y la noción de
eigenvalue ya no tiene sentido. Se requiere un análisis matemático para
convertirlo en un operador vinculado y diseñar un problema bien planteado: una
ilustración se puede encontrar en. De nuevo, tenemos que cuestionar la confianza
que podemos poner en la solución computada y tenemos que generalizar la
noción de eigenvalue para obtener la respuesta.
El análisis del espectro del operador hessiano es, por tanto, un elemento clave
para determinar la fiabilidad de la solución calculada. Sin embargo, dicho análisis
suele ser una tarea muy pesada. Esto ha llevado a varios autores a investigar
enfoques alternativos en el caso de que no estemos interesados en todos los
componentes de la función desconocida sino solo en sub-desconocidos que son
las imágenes de la función desconocida por un operador lineal. Estos enfoques se
denominan " El método de Backus y Gilbert, el enfoque de los centinelas de Lions
y el método SOLA: estos enfoques resultaron estar fuertemente relacionados entre
sí, como se explica en Chavent. Finalmente, el concepto de resolución limitada, a
menudo invocado por los físicos, es nada más que una visión específica del hecho
de que algunos componentes mal determinados pueden corromper la solución.
Pero, en términos generales, estos componentes del modelo mal determinados no
están necesariamente asociados con frecuencias altas.
Algunos problemas lineales inversos clásicos para la recuperación de
parámetros distribuidos
Los problemas mencionados a continuación corresponden a diferentes versiones
de la integral Fredholm: cada uno de ellos está asociado con un núcleo
específico K.
Desconvolución
El objetivo de la deconvolución es reconstruir la imagen original o la señal p
(x) que aparece como ruidoso y borroso en los datos d (x). Desde un punto de
vista matemático, el núcleo K(x,y) aquí sólo depende de la diferencia entre x y y.
Métodos tomográficos
En estos métodos intentamos recuperar un parámetro distribuido, la observación
consistente en la medición de las integrales de este parámetro realizada a lo largo
de una familia de líneas. Denotamos Tx la línea en esta familia asociada al punto
de medición x. La observación en x puede ser escrito como:
Tomografía computarizada
En la tomografía computarizada de rayos X, las líneas en las que se integra el
parámetro son líneas rectas: la reconstrucción tomográfica de la distribución del
parámetro se basa en la inversión de la transformada de Radon. Aunque desde un
punto de vista teórico se entienden bien muchos problemas lineales inversos, los
problemas relacionados con la transformada de Radon y sus generalizaciones aún
presentan muchos desafíos teóricos con preguntas sobre la suficiencia de los
datos aún sin resolver. Dichos problemas incluyen datos incompletos para la
transformada de rayos X en tres dimensiones y problemas que involucran la
generalización de la transformada de rayos X a campos tensoriales. Las
soluciones exploradas incluyen la técnica de reconstrucción algebraica, la
retroproyección filtrada y, a medida que aumenta la potencia informática, los
métodos de reconstrucción iterativos, como la varianza mínima asintótica dispersa
iterativa.
Tomografía de difracción
La tomografía de difracción es un problema lineal inverso clásico en la sismología
de exploración: la amplitud registrada en un momento dado para un par fuente-
receptor determinado es la suma de las contribuciones que surgen de puntos tales
que la suma de las distancias, medidas en tiempos de viaje, desde la fuente y el
receptor, respectivamente, es igual al tiempo de grabación correspondiente. En 3D
el parámetro no se integra a lo largo de líneas sino sobre superficies. Si la
velocidad de propagación es constante, dichos puntos se distribuyen en un
elipsoide. El problema inverso consiste en recuperar la distribución de puntos de
difracción a partir de los sismogramas registrados a lo largo del levantamiento,
siendo conocida la distribución de velocidades. Beylkin y Lambaré et al.
propusieron originalmente una solución directa: estos trabajos fueron los puntos
de partida de enfoques conocidos como migración preservada de amplitud (ver
Beylkin y Bleistein). Si se utilizan técnicas de óptica geométrica (es decir, rayos)
para resolver la ecuación de onda, estos métodos resultan estar estrechamente
relacionados con los llamados métodos de migración de mínimos cuadrados
derivados del enfoque de mínimos cuadrados (ver Lailly, Tarantola).
Tomografía Doppler (astrofísica)
Si consideramos un objeto estelar en rotación, las líneas espectrales que podemos
observar en un perfil espectral se desplazarán debido al efecto Doppler. La
tomografía Doppler tiene como objetivo convertir la información contenida en el
seguimiento espectral del objeto en una imagen 2D de la emisión (en función de la
velocidad radial y de la fase en el movimiento periódico de rotación) de la
atmósfera estelar. Como explica Tom Marsh, este problema lineal inverso es como
la tomografía: tenemos que recuperar un parámetro distribuido que se ha
integrado a lo largo de las líneas para producir sus efectos en las grabaciones.
Conducción de calor inversa
Las primeras publicaciones sobre la conducción inversa del calor surgieron a partir
de la determinación del flujo de calor superficial durante el reingreso a la
atmósfera desde sensores de temperatura enterrados. Otras aplicaciones donde
se necesita el flujo de calor superficial pero los sensores de superficie no son
prácticos incluyen: dentro de motores alternativos, dentro de motores de cohetes;
y prueba de componentes de reactores nucleares. Se ha desarrollado una
variedad de técnicas numéricas para abordar el mal posicionamiento y la
sensibilidad al error de medición causado por la amortiguación y el retraso en la
señal de temperatura.
Problemas inversos no lineales
Los problemas inversos no lineales constituyen una familia inherentemente más
difícil de problemas inversos. Aquí el mapa de adelante es un operador no
lineal. La modelación de fenómenos físicos suele depender de la solución de una
ecuación diferencial parcial (véase la tabla anterior excepto la ley de gravedad):
aunque estas ecuaciones diferenciales parciales son a menudo lineales, los
parámetros físicos que aparecen en estas ecuaciones dependen de una manera
no lineal del estado del sistema y, por lo tanto, de las observaciones que hacemos
al respecto.
Algunos problemas inversos no lineales clásicos
Problemas de dispersión inversa
Mientras que los problemas inversos lineales se resolvieron por completo desde el
punto de vista teórico a finales del siglo XIX, solo una clase de problemas inversos
no lineales lo era antes de 1970, los problemas de dispersión inversa espectral e
inversa (una dimensión espacial), después del trabajo seminal de la escuela
matemática rusa (Krein, Gelfand, Levitan, Marchenko). Chadan y Sabatier han
realizado una amplia revisión de los resultados en su libro "Problemas inversos de
la teoría de la dispersión cuántica" (dos ediciones en inglés, una en ruso).
En este tipo de problema, los datos son propiedades del espectro de un operador
lineal que describen la dispersión. El espectro está formado por valores propios y
funciones propias, formando juntos el "espectro discreto" y generalizaciones,
llamado espectro continuo. El punto físico muy notable es que los experimentos de
dispersión dan información solo sobre el espectro continuo, y que conocer su
espectro completo es necesario y suficiente para recuperar el operador de
dispersión. Por lo tanto tenemos parámetros invisibles, mucho más interesantes
que el espacio nulo que tiene una propiedad similar en problemas lineales
inversos. Además, hay movimientos físicos en los que el espectro de dicho
operador se conserva como consecuencia de dicho movimiento. Este fenómeno
se rige por ecuaciones de evolución diferenciales parciales no lineales especiales,
por ejemplo, la ecuación de Korteweg-de Vries. Si el espectro del operador se
reduce a un solo valor propio, su movimiento correspondiente es el de un solo
golpe que se propaga a velocidad constante y sin deformación, una onda solitaria
llamada 'solitón'.
Una señal perfecta y sus generalizaciones para la ecuación de Korteweg-de Vries
u otras ecuaciones diferenciales parciales no lineales integrables son de gran
interés, con muchas aplicaciones posibles. Esta área se ha estudiado como una
rama de la física matemática desde la década de 1970. Los problemas inversos no
lineales también se estudian actualmente en muchos campos de la ciencia
aplicada (acústica, mecánica, mecánica cuántica, dispersión electromagnética, en
particular sondeos de radar, sondeos sísmicos y casi todas las modalidades de
imágenes).
Wu y Sprung dieron un último ejemplo relacionado con la hipótesis de Riemann, la
idea es que en la antigua teoría cuántica semiclásica, el inverso del potencial
dentro del hamiltoniano es proporcional a la semiderivada de los valores propios
(energías) contando función n(x).
Equilibrio de permeabilidad en yacimientos de petróleo y gas
El objetivo es recuperar el coeficiente de difusión en la ecuación diferencial parcial
parabólica que modela flujos de fluidos monofásicos en medios porosos. Este
problema ha sido objeto de numerosos estudios desde un trabajo pionero
realizado a principios de los años setenta. Con respecto a los flujos de dos fases,
un problema importante es estimar las permeabilidades relativas y las presiones
capilares.
Problemas inversos en las ecuaciones de onda
El objetivo es recuperar las velocidades de onda (ondas P y S) y las distribuciones
de densidad de los sismogramas. Tales problemas inversos son de gran interés en
sismología y geofísica de exploración. Podemos considerar básicamente dos
modelos matemáticos:
La ecuación de onda acústica (en la que se ignoran las ondas S cuando las
dimensiones del espacio son 2 o 3)
La ecuación elastodinámica en la que las velocidades de onda P y S
pueden derivarse de los parámetros de Lamé y de la densidad.
Estas ecuaciones hiperbólicas básicas se pueden mejorar incorporando
atenuación, anisotropía,...
La solución del problema inverso en la ecuación de onda 1D ha sido objeto de
numerosos estudios. Es uno de los pocos problemas inversos no lineales para los
que podemos probar la unicidad de la solución. El análisis de la estabilidad de la
solución fue otro desafío. Se desarrollaron aplicaciones prácticas utilizando el
método de mínimos cuadrados. La extensión a problemas 2D o 3D y a las
ecuaciones de elastodinámica se intentó desde los años 80, ¡pero resultó ser muy
difícil! Este problema, a menudo denominado inversión de forma de onda completa
(FWI), aún no está completamente resuelto: entre las principales dificultades se
encuentran la existencia de ruido no gaussiano en los sismogramas, problemas de
salto de ciclo (también conocido como ambigüedad de fase) y la caótica
Comportamiento de la función de inadaptación de datos. Algunos autores han
investigado la posibilidad de reformular el problema inverso para que la función
objetivo sea menos caótica que la función de desajuste de datos.
Tomografía de tiempo de viaje
Al darse cuenta de lo difícil que es el problema inverso en la ecuación de onda, los
sismólogos investigaron un enfoque simplificado haciendo uso de la óptica
geométrica. En particular, se propusieron invertir la distribución de la velocidad de
propagación, conociendo los tiempos de llegada de los frentes de onda
observados en los sismogramas. Estos frentes de onda pueden estar asociados a
llegadas directas oa reflexiones asociadas a reflectores cuya geometría se desea
determinar, junto con la distribución de velocidades.
Distribución del tiempo de llegada () x es un punto en el espacio físico) de un
frente de onda emitido desde una fuente de punto, satisface la ecuación Eikonal:
Este problema es similar a la tomografía: los tiempos de llegada medidos son la
integral a lo largo de la trayectoria del rayo de la lentitud. Pero este problema
similar a la tomografía no es lineal, principalmente porque la geometría
desconocida de la trayectoria del rayo depende de la distribución de la velocidad
(o lentitud). A pesar de su carácter no lineal, la tomografía de tiempo de viaje
resultó ser muy eficaz para determinar la velocidad de propagación en la Tierra o
en el subsuelo, siendo este último aspecto un elemento clave para la obtención de
imágenes sísmicas, en particular utilizando los métodos mencionados en la
Sección &# 34;Tomografía de difracción".
Aspectos matemáticos: las preguntas de Hadamard
The questions concern well-posedness: ¿Tiene el problema menos cuadrado una
solución única que depende continuamente de los datos (problema de
estabilidad)? Es la primera pregunta, pero también es difícil debido a la no
linearidad de . Para ver de dónde surgen las dificultades, Chavent
propuso dividir conceptualmente la minimización de la función de inadaptación de
datos en dos pasos consecutivos (Padm es el subconjunto de modelos admisibles:
paso de proyección: dado dobs encontrar una proyección en F(Padm) (punto
de paro F(Padm) según la distancia implicada en la definición de la función
objetiva)
dada esta proyección encontrar una pre-imagen que es un modelo cuya
imagen por operador F es esta proyección.
Pueden surgir dificultades, y generalmente surgirán, en ambos pasos:
1. operador F no es probable que sea uno a uno, por lo tanto, puede haber
más de una pre-imagen,
2. incluso cuando F es uno a uno, su inverso puede no ser continuo F(P),
3. la proyección en F(Padm) puede no existir, si este conjunto no está cerrado,
4. la proyección en F(Padm) puede ser no-unique y no continuo ya que esto
puede ser no-convex debido a la no-linearidad de F.
Nos referimos a Chavent para un análisis matemático de estos puntos.
Aspectos computacionales
Una función de inadaptación de datos no convexa
Como el mapa directo no es lineal, es probable que la función de inadaptación de
datos no sea convexa, lo que hace que las técnicas de minimización local sean
ineficientes. Se han investigado varios enfoques para superar esta dificultad:
uso de técnicas de optimización global tales como muestreo de la función
de densidad posterior y algoritmo de metrópolis en el marco probabilístico
problema inverso, algoritmos genéticos (solo o en combinación con
algoritmo de metrópolis: ver para una aplicación a la determinación de las
permeabilidades que coinciden con los datos de permeabilidad existentes),
redes neuronales, técnicas de regularización incluyendo análisis de escala
múltiple;
reformulación de la función objetiva menos cuadrada para que sea más
suave (ver el problema inverso en las ecuaciones de onda).
Cálculo del gradiente de la función objetivo
Los problemas inversos, especialmente en dimensión infinita, pueden ser de gran
tamaño, por lo que requieren un tiempo de cálculo importante. Cuando el mapa
directo es no lineal, las dificultades computacionales aumentan y puede ser difícil
minimizar la función objetivo. Contrariamente a la situación lineal, aquí no tiene
sentido un uso explícito de la matriz hessiana para resolver las ecuaciones
normales: la matriz hessiana varía con los modelos. Mucho más efectiva es la
evaluación del gradiente de la función objetivo para algunos modelos. Se puede
ahorrar un esfuerzo computacional importante cuando podemos evitar el cómputo
muy pesado del jacobiano (a menudo llamado "derivados de Fréchet"): el método
de estado adjunto, propuesto por Chavent y Lions, tiene como objetivo evitar este
cómputo tan pesado. Ahora es muy utilizado.
Aplicaciones
La teoría del problema inverso se utiliza ampliamente en las predicciones
meteorológicas, la oceanografía, la hidrología y la ingeniería petrolera.
Los problemas inversos también se encuentran en el campo de la transferencia de
calor, donde se estima un flujo de calor superficial a partir de los datos de
temperatura medidos dentro de un cuerpo rígido; y, en la comprensión de los
controles sobre la descomposición de la materia vegetal. El problema lineal
inverso también es fundamental en la estimación espectral y la estimación de la
dirección de llegada (DOA) en el procesamiento de señales.
La litografía inversa se utiliza en el diseño de fotomáscaras para la fabricación de
dispositivos semiconductores.
Referencias
Chadan, Khosrow & Sabatier, Pierre Célestin (1977). Problemas inversos
en la trampa cuántica Teoría. Springer-Verlag. ISBN 0-387-08092-9
Aster, Richard; Borchers, Brian y Thurber, Clifford (2018). Estimación del
parámetro y problemas inversos, Tercera Edición, Elsevier. ISBN
9780128134238, ISBN 9780128134238
Press, WH; Teukolsky, SA; Vetterling, WT; Flannery, BP (2007). "Sección
19.4. Problemas inversos y el uso de una información prioritaria". Recetas
numéricas: El arte de la computación científica (3a edición). Nueva York:
Cambridge University Press. ISBN 978-0-521-88068-8.