Universidad Nacional de Trujillo
Facultad de Ingeniería
Departamento de Ingeniería de Minas
Exploración y Estimación de
Recursos y Reservas Geológicas
Dr. Marco A. Cotrina
[email protected]
Modelamiento geoestadístico
Introducción
¿Por qué usar modelos probabilísticos para estudiar las variables regionalizadas?
Los fenómenos en Ciencias de la Tierra involucran procesos complejos, de modo que, en la mayoría
de las situaciones, un modelo deterministístico de la variable regionalizada en estudio no es
concebible.
Un modelo probabilístico es más adecuado, pues permite considerar tanto lo que se conoce de la
variable regionalizada (mediciones disponibles por la toma de muestras) como lo que se desconoce
(concepto de probabilidades). Sin embargo, la variable regionalizada no es realmente el resultado
de un proceso aleatorio: se trata solamente de una interpretación debida a nuestro
desconocimiento de la realidad
Límites de la estadística clásica
Se considera las observaciones como realizaciones independientes de una misma variable aleatoria.
Esta interpretación impide una predicción precisa de un valor no observado.
El modelo geoestadístico
La hipótesis de independencia de los valores observados no es realista en muchos ámbitos de las
geociencias.
El modelo geoestadístico
Se considera “interacciones” entre las observaciones, de modo de tomar en cuenta sus dependencias
espaciales.
Aquí, se puede prever el valor en un sitio no muestreado gracias a su interacción / dependencia con
los valores observados en los sitios vecinos.
El modelo geoestadístico
• La interpretación geoestadística es satisfactoria, dado que las variables regionalizadas presentan
dos aspectos complementarios.
• Un aspecto “aleatorio” causante de la variabilidad local
• Un aspecto “estructurado” que refleja las características globales de la variable (continuidad
espacial, anisotropía…).
Formalización matemática
Se interpreta cada valor de la variable regionalizada en estudio z(x) como una realización de una
variable aleatoria Z(x).
El conjunto de variables aleatorias {Z(x), x Rd} constituye una función aleatoria. De este modo, la
variable regionalizada se interpreta como una realización de una función aleatoria.
Cuidado
Las diferentes variables aleatorias {Z(x1),Z(x2)... Z(xn)} no son independientes.
Variables aleatorias Correlacionadas
Aspecto errático Continuidad espacial
Noción de correlación espacial
Dos ejemplos de variables regionalizadas que presentan los mismos valores, pero distribuidos de
forma diferente en el espacio. Las variables aleatorias se modelarán con mayores correlaciones en el
primer caso que en el segundo caso.
Noción de correlación espacial
Se representará mejor mediante intervalo o rango de valores.
1,68 1,31 0,93 0,78 2,57 3,39 1,71 2,29 2,46 1,21 0,78 2,53
2,22 1,07 1,32 1,21 1,71 2,28 1,68 2,23 1,07 1,18 2,57 1,32
3,6 3,24 2,29 1,18 1,09 1,07 0,41 0,72 1,62 3,6 0,5 3,39
2,46 3,39 2,4 2,33 0,5 0,41 3,24 0,81 0,35 2,62 2,4 0,15
2,53 3,43 2,23 1,69 0,72 0,81 3,39 2,33 0,93 1,31 2,22 0,01
1,62 2,62 1,99 0,15 0,01 0,35 1,09 2,28 1,69 3,43 1,99 1,07
Caracterización de una variable aleatoria
Una variable aleatoria Z se caracteriza por una distribución de probabilidad, la cual se representa por
medio de:
• Una función de distribución:
z R, F(z) = Prob(Z < z)
• Una densidad de probabilidad (variable continua) o una masa de probabilidad (variable discreta).
Se suele considerar parámetros sintéticos (llamados “momentos”) para describir la distribución de
probabilidad:
• Esperanza (momento de primer orden)
• Varianza (momento de segundo orden)
Caracterización de una función aleatoria
Una función aleatoria {Z(x), x Rd} se caracteriza por lo que se denomina su
“distribución espacial”, que reúne todas las distribuciones de probabilidad de las variables aleatorias
que conforman esta función, por ejemplo, la distribución multivariable.
F(z1,... zn; x1, ... xn) = Prob(Z(x1) < z1,... Z(xn) < zn)
Para un determinado conjunto de sitios x1,... xn y de umbrales z1,... zn.
Caracterización de una función aleatoria
Ejemplo 1: función aleatoria multi-Gaussiana
Todas las distribuciones de probabilidad que conforman la distribución espacial son multinormales o
multi-Gaussianas. La densidad de probabilidad en un conjunto de sitios {x1, ... xn}es de la forma:
1 1
𝑓 𝑍1 , … 𝑍𝑛 ; 𝑋1 , … 𝑋𝑛 = 𝑛 𝑒𝑥𝑝 − 𝑍 − 𝑚 𝑡 𝐶 −1 𝑍 − 𝑚
2𝜋 𝑑𝑒𝑡 𝐶 2
𝑐𝑜𝑛:
𝑧 = 𝑍1 , … 𝑍𝑛 𝑡
𝑍 = 𝑍(𝑋1 ), … 𝑍(𝑋𝑛 ) 𝑡
m el vector de esperanzas de Z
C la matriz de varianza-covarianza de Z
Caracterización de una función aleatoria
Ejemplo 2: Realizaciones de funciones aleatorias con distribuciones espaciales distintas.
Caracterización de una función aleatoria
La distribución espacial es una información extremadamente
compleja, que no puede ser determinada unívocamente a
partir de una sola realización de la función aleatoria, conocida
además en un número limitado de datos.
→ La inferencia estadística se basa en repetir el experimento
aleatorio, pero al estudiar un fenómeno único se tiene
solamente una realización…
→ Para salir de este problema, se requiere algunas
simplificaciones para poder inferir todo o parte de la
distribución espacial a partir del conjunto de datos
disponibles.
Caracterización de una función aleatoria
Simplificación nº1: Restricción a distribuciones uni y bivariables
La caracterización de la función aleatoria se centrará en las distribuciones univariables.
𝐹 𝑍1 ; 𝑥1 = 𝑃𝑟𝑜𝑏 𝑍 𝑥1 < 𝑧1
y bivariables
𝐹 𝑍1 , 𝑍2 ; 𝑥1 , 𝑥2 = 𝑃𝑟𝑜𝑏 𝑍 𝑥1 < 𝑧1 , 𝑍 𝑋2 < 𝑧2
Caracterización de una función aleatoria
Ilustración 1: función de distribución y densidad de probabilidad de una variable aleatoria Z(x1).
Caracterización de una función aleatoria
Ilustración 2: función de distribución y densidad de probabilidad de un par de variables aleatorias
{Z(x1),Z(x2)}.
Caracterización de una función aleatoria
Simplificación nº2: Hipótesis de estacionaridad
Se postula que la distribución espacial es invariante por traslación en el espacio:
∀ 𝑛 ∈ 𝑁, ∀𝑥1 , … 𝑥𝑛 ∈ 𝑅𝑑 , ∀ℎ ∈ 𝑅𝑑 , ∀𝑧1 , … 𝑧𝑛 ∈ 𝑅,
𝐹 𝑧1 , … 𝑧𝑛 ; 𝑥1 , … 𝑥𝑛 = 𝐹 𝑧1 , … 𝑧𝑛 ; 𝑥1 + ℎ, … 𝑥𝑛 + ℎ
En particular, todas las variables Z(x) tienen la misma distribución univariable, mientras que la
distribución bivariable de Z(x) y Z(x′) no depende de la posición absoluta de los sitios x y x′, sino
que de su posición relativa, es decir, h = x′ – x.
Caracterización de una función aleatoria
Consecuencia: La distribución de probabilidad conjunta entre dos datos es la misma para todos los
pares de datos que tienen el mismo vector de separación. La repetición entre los pares permite inferir
dicha distribución de probabilidad.
Caracterización de una función aleatoria
Simplificación nº3: Hipótesis de ergodicidad
Se puede aproximar las esperanzas matemáticas (promedio sobre las realizaciones) por un
promedio en el espacio.
Estas dos últimas simplificaciones (hipótesis de estacionaridad, ergodicidad) constituyen una
decisión por parte del usuario. Sin embargo, la hipótesis de estacionaridad es juiciosa cuando existe
una homogeneidad de las propiedades de la variable regionalizada en el espacio. El estudio
exploratorio de datos es útil para poder eventualmente subdividir la zona de interés en varias sub-
zonas “homogéneas”.
Caracterización de una función aleatoria
Ilustración 1: 6 realizaciones de una misma función aleatoria estacionaria
Derivas
aparentes
Caracterización de una función aleatoria
Ilustración 2: realizaciones de funciones aleatorias estacionarias
Caracterización de una función aleatoria
En la práctica, se puede restringir la
hipótesis de estacionaridad a la escala de
trabajo (casi-estacionaridad, o
estacionaridad local). Por ejemplo, la
esperanza (media) varía lentamente en el
espacio y puede considerarse como
localmente constante.
Este supuesto se hace comúnmente al
aplicar el método de kriging en una
vecindad móvil.
Caracterización de una función aleatoria
Simplificación nº4: Momentos de las distribuciones uni y bivariables
La última simplificación consiste en considerar solamente los parámetros (momentos) más relevantes
de las distribuciones de probabilidad. Estos son:
• Esperanza o media: 𝑚 = 𝐸 𝑍 𝑋
independientes de x
• Varianza: 𝜎2 = 𝑣𝑎𝑟 𝑍 𝑋
(estacionaridad)
= 𝐸 𝑍2 𝑋 − 𝑚2
Caracterización de una función aleatoria
• Covarianza:
C h = 𝑐𝑜𝑣 𝑍 𝑥 + ℎ , 𝑍 𝑥
= 𝐸 𝑍 𝑥 + ℎ , 𝑍(𝑥) − 𝑚2 dependientes sólo de h
(estacionaridad)
• Variograma:
𝛾(ℎ) = 𝑣𝑎𝑟 𝑍 𝑥 + ℎ − 𝑍 𝑥 /2
= 𝐸 𝑍 𝑥 + ℎ − 𝑍(𝑥) 2 /2
Los momentos más importantes son la covarianza y el variograma, pues se refieren a la relación
existente entre pares de valores, luego dan una imagen sintética de la continuidad espacial de la
variable regionalizada.
La covarianza indica qué tan semejantes son los valores entre dos sitios, mientras que el variograma
indica qué tan desemejantes son.
Resumen
Relaciones entre los momentos
La varianza es el valor de la covarianza para una distancia h = 0:
𝜎 2 = 𝐶(0)
El variograma y la covarianza están relacionados entre sí:
𝐶 ℎ =𝛾 ∞ −𝛾 ℎ
𝛾 ℎ =𝐶 0 −𝐶 ℎ
Cuando la distancia de separación h se vuelve infinita, la covarianza tiende a 0 y el variograma es igual
a la varianza.
Relaciones entre los momentos
Ilustración: función de covarianza (rojo) y variograma (azul)
Relaciones entre los momentos
Las hipótesis de estacionaridad y ergodicidad
permiten estimar los parámetros de la
distribución espacial a partir de un conjunto
de datos experimentales:
• Esperanza → media (desagrupada) de los
datos
• Variograma → variograma experimental de
los datos
• Distribución univariable → histograma
(desagrupado) de los datos
• Distribución bivariable → nube de
correlación diferida.
Ejercicio
• Inferir la esperanza (media) y el variograma a partir del siguiente conjunto de datos espaciados 50m:
1 0 2 3 1 4 3 2 2 0
• La esperanza se puede estimar por el promedio de los datos:
1
𝑚ˆ = × 1 + 0 + 2 + 3 + 1 + 4 + 3 + 2 + 2 + 0 = 1.8
10
Ejercicio
• El variograma sólo se puede calcular para distancias múltiplos de 50m :
1 0 2 3 1 4 3 2 2 0
1
𝛾ˆ 50𝑚 = × 12 + 22 + 12 + 22 + 32 + 12 + 12 + 02 + 22 = 1.39
2×9
1
𝛾ˆ 100𝑚 = × 12 + 32 + 12 + 12 + 22 + 22 + 12 + 22 = 1.56
2×8
1
𝛾ˆ 450𝑚 = × 12 = 0.5
2×1
Herramientas requeridas
Las técnicas geoestadísticas tienen distintos niveles de requerimientos
• Estimación local de la variable (kriging) → media y variograma se busca evaluar los valores en sitios
no muestreados.
• Simulación → distribución espacial completa
Se busca estimar funciones de la variable, o bien caracterizar la incertidumbre en los valores no
muestreados (análisis de riesgo).
Lecturas recomendadas
Emery, X. 2014. Presentaciones de cátedra Análisis Estadístico y Geoestadístico de Datos.
Universidad de Chile. Santiago de Chile.
Chilès J.P. and Delfiner P., 2012. Geostatistics: Modeling Spatial Uncertainty, Wiley, New York,
699 p
Cressie N.A.C, 1993. Statistics for Spatial Data, Wiley, New York, 928 p
Matheron G., 1971. The Theory of Regionalized Variables and its Applications, Ecole Nationale
Supérieure des Mines de Paris, Fontainebleau, 212 p.
Preguntas?
Gracias