0% encontró este documento útil (0 votos)
156 vistas90 páginas

EDA Multivariable en Geología

Este documento presenta una introducción al análisis exploratorio de datos multivariables (EDA). Explica herramientas como el despliegue espacial de datos, estadísticas univariables y bivariables, y análisis de componentes principales. Además, describe cómo el EDA puede usarse para caracterizar las relaciones entre variables geológicas y de interés en la evaluación de yacimientos. Finalmente, incluye ejemplos de aplicación del EDA a datos geometalúrgicos y sísmicos.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
156 vistas90 páginas

EDA Multivariable en Geología

Este documento presenta una introducción al análisis exploratorio de datos multivariables (EDA). Explica herramientas como el despliegue espacial de datos, estadísticas univariables y bivariables, y análisis de componentes principales. Además, describe cómo el EDA puede usarse para caracterizar las relaciones entre variables geológicas y de interés en la evaluación de yacimientos. Finalmente, incluye ejemplos de aplicación del EDA a datos geometalúrgicos y sísmicos.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

EDA multivariable

Relator: Mauricio Garrido


PhDc Geología, Universidad de Chile
Ingeniero Civil de Minas, Universidad de Chile
mgarrido@[Link]

Agradecimientos: Julián M. Ortiz


PhD Mining, Queen’s University, Canadá
[Link]@[Link]
Resumen
• EDA: Exploratory Data Analysis de datos multivariable
• Introducción
• Recuerdo estadísticas univariables y herramientas exploratorias
• Definiciones formales
• Herramientas exploratorias multivariables
• Análisis de componentes principales
• Aplicación 1: Integración de datos geometalúrgicos
• Aplicación 2: PCA a datos sísmicos
• Ejercicios prácticos
Introducción
• Situaciones que ameritan un estudio multivariable:
• Yacimiento polimétalico: interesan varios elementos (cobre, oro, plata,
arsénico, molibdeno, etc.)
• Yacimiento monométalico: interesan varios atributos relacionados con un
mismo elemento (cobre total, cobre soluble, recuperación, etc.)

• Mediciones procedentes de varias fuentes: cobre total medido en


• (a) sondajes de diamantina
• (b) sondajes de aire reverso
• (c) pozos de tronadura
Objetivos
• EDA busca caracterizar de manera cuantitativa las relaciones entre los atributos
geológicos y las variables de interés, así como las relaciones multivariables.
• En el contexto de la evaluación de yacimientos, se busca la determinación de los
atributos geológicos que controlan las distribuciones estadísticas y espaciales de
los elementos.
• La ejecución y resultados del EDA permite aumentar el conocimiento geológico y
facilitar una elección informada de los atributos geológicos a modelar, criterios de
agrupamiento, guía para criterios de modelamiento y guía para la elección de
parámetros de la estimación de recursos
Herramientas
• Despliegue-visualización espacial de datos
• Estadísticas básicas
• Distribuciones
• Gráficos de dispersión
• Medias condicionales
• PCA
Despliegue de datos
• Visualización en 3-D interpretación
Despliegue de datos
• Análisis utilizando plantas y secciones (2D)
Despliegue de datos
• Vista para 1 sondaje/taladro (variable
categórica + variable contínua)
Despliegue de datos
• Mapas codificados con color

• ¿Donde están leyes


altas?
• ¿Cómo cambian las
leyes?
• ¿Existe agrupamiento
o clústers en
muestreo?
Despliegue de datos

Leyes con colores + Zona mineral mapeada (letras) + Sólido 3D modelado de zona Bn+Cp
Estadísticas básicas univariables
• Medidas de posición:
• Media 1 n
m 
n
z (u )
1

• Mediana  z (u( n1) / 2 ) si n es par



M   ( z (un / 2 )  z (u( n / 2)1 ))
 si n es impar
 2

• Moda, mínimo y máximo


• Rango = máximo – mínimo
• Deciles, percentiles y cuantiles: el cuantil p de la distribución es el valor zp tal que
p% de los datos está bajo zp
F ( z p )  Prob{Z  z p }  p  [0,1]
Estadísticas básicas univariables
• Medidas de dispersión:

1 n
• Varianza s   ( z (u )  m) 2
2

n  1

• Desviación estándar s s2

• Rango intercuartil IQR  Q 3  Q1

s
• Coeficiente de variación CV 
m
Estadísticas básicas univariables
A. Yacimiento tipo pórfido cuprífero CV = 0.7 Unidades de mayor ley,
B. Yacimiento de cobre de mediana variabilidad CV = 1.5 mayor varianza y efecto
C. Yacimiento de oro de alta variabilidad CV = 4.5 proporcional
A B C
Estadísticas básicas univariables
• Medidas de forma: n
1
• Coeficiente de asimetría (skewness) n


( z (u )  m)
1
3

s3

Frec.
Frec. Frec.

Positivo
Mm z(x)
Cercano a 0
M
Negativo
mM
m
z(x) z(x)
Estadísticas básicas univariables
• Coeficiente de aplanamiento (Kurtosis)
n
1
n


( z (u )  m)
1
4

s4
• Da una idea del aplanamiento de la distribución (relación entre altura y ancho de
la campana).
• Su valor es 3 para distribuciones normales (Gaussianas)
Estadísticas básicas univariables
• Histograma de frecuencia relativa: despliegue
Histograma
200

de frecuencia de ocurrencia de datos en clases 180

160

140

Frecuencia
120

100

80

60

40

20

0
0 0,2 0,4 0,6 0,8 1 1,2 1,4 1,6 1,8 2 2,2 2,4 2,6 2,8 3 3,2 3,4 3,6 3,8 4 4,2 4,4 4,6 4,8 5

Clase

• Histograma de frecuencia acumulada: 100%


Histograma acumulado

despliegue de la frecuencia acumulada bajo un

Frecuencia acumulada
80%

valor de corte (que define una clase) 60%

40%

20%

0%
0 0,2 0,4 0,6 0,8 1 1,2 1,4 1,6 1,8 2 2,2 2,4 2,6 2,8 3 3,2 3,4 3,6 3,8 4 4,2 4,4 4,6 4,8 5

Clase
Estadísticas básicas univariables
• Histogramas:
• Registra el número de muestras en cada clase.
• “Ancho” de clase suele ser constante la altura de cada barra del histograma es proporcional a la
frecuencia de la clase
• Entrega estadísticas de las muestras (no de la población)
• Escala logarítmica puede ser útil
• Media y varianza son muy sensibles a valores extremos
• Mediana y rango intercuartil son medidas más robustas

• ¿Cómo construirlo?
• Dependiendo del número de muestras, escoger un número de clases
• Desplegar el rango importante de los datos (colas no se ven bien)
• Desplegar estadísticas con un número razonable de decimales
Estadísticas básicas por categoría
• Diagrama de caja (box-plot)
• Resume una distribución, en especial su forma y dispersión, en un diagrama de
una sola dimensión
Estadísticas básicas por categoría
• Diagrama de caja (box-plot)
• Se utilizan para comparar distribuciones para distintas categorías, definidas por
algún atributo geológico
Definiciones formales multivariables
• Corregionalización: conjunto de variables regionalizadas {z1,... zN} definidas en
una misma región del espacio (campo)

• Homotopía: las variables están muestreadas en los mismos sitios

• Heterotopía (parcial o total): las variables están muestreadas en distintos sitios


• Parcial  una de cada 10 muestras analizada por cobre total se analiza
también por cobre soluble
• Total  considerar leyes de cobre muestreadas en distintas campañas como
variables diferentes
Definiciones formales multivariables
• En industria minera, muestreo heterotópico es
Caso homotópico Caso heterotópico
muy común.
• Qué hacer si:
(0.4, 2.3) (0.4, 2.3)
• ¿Quiero comparar distribuciones variable A con
variable B?
• ¿Quiero comparar correlaciones par a par entre
(0.1, 2.1) (0.1, -99) variable A y variable B?

• También ocurre diferencias entre los soportes de


(0.3, 2.8) (-99, 2.8)
muestreo, que hacer si:
• ¿Variable A está muestreada a un soporte de 1 m y
variable B a un soporte de 15 m?
Gráficos cuantiles a cuantiles
• Sirve para comparar dos histogramas, al visualizar los cuantiles del primero en
función de aquellos del segundo
• También llamado q-q plot
• Normalmente, se realiza para comparar la misma variable:
• Agrupada vs desagrupada
• Campaña 1 vs Campaña 2
• Ley en AR vs Ley en DDH
Gráficos cuantiles a cuantiles
• Se utiliza para comparar dos distribuciones F1 y F2
cuantil a cuantil.
• No se utiliza para comparar la relación par a par
que hay entre las variables.
• Decir que el gráfico indica una buena correlación
entre las variables es incorrecto
• Escoger una serie de valores de probabilidad
pk, k = 1, 2, …, K
• Graficar q1(pk) versus q2(pk), k = 1, 2, …, K
Gráficos cuantiles a cuantiles
• Interpretación:

• Si todos los puntos caen en una línea de 45°, las dos distribuciones son
exactamente iguales
• Si la línea esta desplazada de los 45°, las dos distribuciones tienen la
misma forma pero diferentes medias
• Si la inclinación de la línea no es 45°, las dos distribuciones tienen
diferentes varianzas
• Si hay un carácter no lineal en el grafico Q-Q, las distribuciones tienen
diferentes formas en el histograma
Gráfico de probabilidad acumulada
• Puede usarse para verificar modelos de distribución:
• Línea recta en escala aritmética  distribución
normal
• Línea recta en escala logarítmica  distribución
lognormal
• Pequeñas divergencias pueden ser importantes
(especialmente en los extremos)

• Permite detectar valores extremos y anómalos


Gráfico de probabilidad acumulada
• Son útiles para chequear la presencia de dos poblaciones
• Debe confirmarse con información geológica
Gráfico de probabilidad acumulada
• Son útiles para chequear la presencia de dos poblaciones
• Debe confirmarse con información geológica
Gráfico de probabilidad acumulada
• Son útiles para comparar
distribuciones separando por algún
atributo geológico.

• Cada color representa una categoría

• Unidades se pueden agrupar según


distribución, siempre y cuando esto
tenga sentido geológico y espacial.
Nube de correlación
• También llamada “diagrama de dispersión” o “scatterplot”
• Permite ver la relación par a par de dos variables y detectar eventuales datos
anómalos.
• Complementado por estadísticas como el coeficiente de correlación
Nube de correlación

• Conciliación corto/largo plazo:

 Estéril a botadero
 Mineral a planta
• Mineral a botadero
Χ Estéril a planta
Medias condicionales
• Corresponde al cálculo de las leyes medias y varianzas de las variables de interés
según coordenadas este, norte y cota.

• De ser necesario deben ser calculadas en direcciones del depósito por medio de
una rotación de los datos.
Medias condicionales
• Perimen evaluar el comportamiento espacial de la variable de interés.
• Detectan tendencias de alza o baja.
• Detectan el nivel de variabilidad según coordenadas.
Medias condicionales
• Puede incluirse la desviación estándar para cuantificar la variabilidad y visualizar
mejor las tendencias estadísticas.
Medias condicionales
• Puede incluirse la desviación estándar para cuantificar la variabilidad y visualizar
mejor las tendencias estadísticas.
Swathplot
• Se utilizan para validar estimaciones de forma local (sondaje v/s modelo de
bloques)
Coeficiente de correlación
• El coeficiente de correlación es una medida de la dependencia lineal entre
las dos variables
1 n
  ( z 1  m Z1 )( z 2   m Z 2 )
n  1 

 Z1   Z 2

• Una correlación de XY = 1 implica que X e Y están perfectamente


correlacionadas.
• Independencia entre dos variables implica que el coeficiente de correlación
es cero: XY = 0. Sin embargo, la inversa no es siempre cierta. Correlación cero
no implica necesariamente independencia entre las dos variables.
• El coeficiente de correlación lineal varía entre -1 y +1.
Coeficiente de correlación
• Usos comunes de nube de correlación:
• Despliegue bivariable
• Estimado-verdadero
• Dos variables, o la misma variable separada por algún vector distancia (h-
scatterplot)

• El coeficiente de correlación de posición es un complemento útil:


• si rank >  entonces unos pocos outliers dañan la que en otro caso seria una
buena correlación
• si rank <  entonces unos pocos outliers mejoran la que en otro caso seria una
pobre correlación
• si rank = 1 entonces una transformación no lineal de una variable puede hacer
=1
Coeficiente de correlación
• Muy sensible a valores extremos
• El coeficiente de correlación cambia incluso de signo

Correlación con valor aberrante Correlación sin valor aberrante

Y Y

= 0,73
 = -0,68

X X
Coeficiente de correlación Caso 1 Caso 2
Y Y

• Diferentes ejemplos de = 1  = 0,68

coeficiente de correlación X X

Caso 3 Caso 4
Y Y

=0 =0

X X

Caso 5 Caso 6
Y Y

 = -0,87

 = -1

X X
Coeficiente de correlación Caso 1 Caso 2
Y Y

• Diferentes ejemplos de = 1  = 0,68

coeficiente de correlación X X

Caso 3 Caso 4
Y Y

=0 =0

Correlación positiva X X

No hay dependencia
Caso 5 Caso 6
Y Y

Correlación negativa  = -0,87

 = -1

X X
Regresión lineal
• Se considera la nube de dispersión entre dos variables X e Y. La regresión lineal
consiste en determinar la recta que mejor represente la nube de puntos (X,Y).
• Permite estimar Y a partir de X
• Su ecuación es Ŷ  a X  b

var (Y)
a  XY b  mY  a mX
var (X)
Regresión lineal
• Ilustración
Regresión lineal
• Estimar una variable utilizando otra con la que está correlacionada.
• Regresión Lineal: cálculo de la línea de regresión que minimiza la suma de los
errores al cuadrado.
Matriz de correlación
• Se trata de la matriz de los coeficientes de correlación entre varias variables.
• Permite destacar grupos de variables correlacionadas entre sí, y poco
correlacionadas con variables de otros grupos

Cu Mo Au Ag
Coeficientes de
Cu 1.00 0.85 0.51 0.45 correlación lineal

Mo 0.88 1.00 0.42 0.30

Au 0.37 0.31 1.00 0.77


Coeficientes de
correlación de
Ag 0.49 0.26 0.86 1.00
ranking
Análisis de componentes principales
• El análisis de componentes principales busca construir, a partir de variables
iniciales, otras variables estadísticamente no correlacionadas.
• Estas cantidades no correlacionadas son llamadas factores.
• En el caso multiGaussiano, estas variables no correlacionadas serían también
independientes.
• Los factores son combinaciones lineales de las variables iniciales y tienen una
media nula sobre el conjunto de las muestras.
Análisis de componentes principales
• Se trata de un método basado en la
diagonalización de la matriz de correlación,
destinado a identificar “factores” (variables
sintéticas) jerarquizados y mutuamente no
correlacionados, que descomponen la
información multivariable.
• Los primeros factores permiten resumir la
información contenida en todas las variables
Análisis de componentes principales
• Se utiliza para:
• Compresión de información abundante
• Interpretar relaciones multivariables
• Agrupamiento de datos correlacionados
• Detección de datos aberrantes multivariables
• Identificación de factores no relevantes

• El PCA no se plantea en el marco espacial (o sea, no toma en cuenta las correlaciones


entre muestras ubicadas en sitios distintos)
• Asume Homotopía
Análisis de componentes principales
Elementos Transformación Selección variables Interpretación Caracterización de
geoquímicos variables PCA de interés geológica de datos variables principales

Ag_ppm PCA1 PCA1 Describen ¿Qué sentido Cu_ppm


As_ppm PCA2 PCA2 el 90% de geológico tiene el Mo_ppm Puedo
Ce_ppm PCA3 PCA3 la varianza agrupamiento de las Ag_ppm
Cu_ppm PCA4 As_ppm
caracterizar un
CuS_ppm PCA5 variables principales? Pb_ppm fenómeno
La_ppm PCA6 Zn_ppm
Lu_ppm PCA7
Mo_ppm PCA8
Nd_ppm 18 PCA9
Variables
Pb_ppm elementos PCA10 estadísticamente no
Sb_ppm PCA11 correlacionadas (cov ~ 0)
Sm_ppm PCA12
Tb_ppm PCA13
Th_ppm PCA14
U_ppm PCA15
Y_ppm PCA16
Yb_ppm PCA17
Zn_ppm PCA18
Análisis de componentes principales

Filtro y agrupamiento
de variables
Análisis de componentes principales
• Comentarios:
• La reducción de información y la representación gráfica de las variables resultan
las ventajas más llamativas de este método.
• Para buscar vectores y valores propios se debe invertir matrices que tal vez sean
de un tamaño considerable, esto se puede considerar una desventaja por el
tiempo que este paso puede tomar.
• Al eliminar factores no relevantes, tal vez no se elimine información importante
para el análisis global, pero se pueden estar obviando datos que ayuden a
concluir sobre un tema más específico.
Análisis multivariable de datos
geometalúrgicos
Interpretación con dendogramas de variables principales
Introducción
• Geometalurgia abarca la solución a problemas de la
minería de forma transdisciplinaria, donde se integran
conocimientos de geología, metalurgia y operaciones
mineras.
• Se busca estudiar la distribución de los parámetros
metalúrgicos a lo largo de un yacimiento usando
técnicas geoestadísticamente aceptadas para soportar
el proceso de modelamiento metalúrgico.
• Dureza del mineral.
• cinética de flotación.
• cinética de lixiviación.
Herramientas de análisis multivariable
• Para generar modelos predictivos de metalurgia, es necesario:
• Identificar las variables que afectan al proceso.
• Conocer el comportamiento de las variables involucradas.
• Proponer modelos predictivo usando las variables involucradas.

• Las herramientas multivariables permiten encontrar


relaciones estadísticas, entre geología y metalurgia, que
podrían ser interpretadas geológicamente.
Herramientas de análisis multivariable
• Las respuestas metalúrgicas dependen de:
• Factores operacionales, tales como ambiente del proceso,
condicionamiento de muestras, cantidad de reactivos, etc.
• Condiciones geológicas, tales como granulometría, liberación, textura,
mineralogía, etc.
• La geometalurgia es la integración de información geológica, minera y
metalúrgica.
• Los factores operacionales son relativamente fijos (y conocidos) en ensayos de
laboratorio.
• Condiciones geológicas cambian todo el tiempo debido a la variabilidad
inherente de un yacimiento.
Herramientas de análisis multivariable
• Dendograma permite agrupar numéricamente
diferentes grupos o clústers de variables
correlacionadas entre sí.
• CuNS, CuCit y CuAcSul mide cobre no soluble
relacionado con súlfuros, por lo que
presentan altas correlaciones y pueden ser
considerados como un clúster estadístico
que describen el mismo proceso geológico
(mena sulfurada de cobre).
• CuT y MoT están relacionados por
mineralizaciones de calcopirita y
molibdenita, que en yacimientos de tipo
pórfido cuprífero tienen semejantes orígenes
metalogénicos.
Herramientas de análisis multivariable
• Relaciones extremadamente
complejas pueden ser
ordenadas estadísticamente a
través de los dendogramas.
Herramientas de análisis multivariable
• Estas herramientas multivariables, junto con la interpretación
geológica, permiten establecer relaciones entre geología y metalurgia.
• Estas relaciones pueden ser usadas para generar modelos predictivos
con cuantificación de incertidumbre.
• Relaciones minerales pueden ser cuantificadas a través de análisis
QEMSCAN a través de las caracterizaciones minerales.
• Se puede construir una matriz de correlación entre análisis químico,
zonas minerales, caracterización mineral y variables metalúrgicas.
• Estas correlaciones son explicadas por procesos metalogénicos
asociados a la formación de los diferentes tipos de yacimientos.
Herramientas de análisis multivariable
• QEMSCAN: Evaluación cuantitativa de materiales mediante microscopía
electrónica de barrido (análisis mineralógico)
Interpretación geológica multivariable
• Ejemplo en yacimiento pórfido cuprífero: árbol de relaciones
más importantes.

Zonas
minerales

Enriquecimi
Cu Fe ento
Secundario

Calcopirita Bornita Mo As Clorita Cuarzo Magnetita Pirita Recuperaci


Calcosina
(0.56) (0.47) (0.50) (0.7) (0.70) (-0.52) (0.63) (0.51) ón

Molibdenita Tenantita Arcillas Sericita Rutilo Anhidrita Biotita Plagioclasas Calcita Enargita Esfalerita Cuprita Digenita OxFe
(0.96) (0.91) (0.51) (0.54) (0.54) (-0.51) (-0.55) (-0.52) (0.50) (0.61) (-0.50) (-0.53) (-0.60) (-0.51)

Sb OxFe Feld_K Carbonato Covelina


(0.62) (0.55) (051) (0.95) (0.55)

Tetraedrita Jarocita Hematita Limonita


(0.62) (0.52) (0.68) (0.62)
Interpretación geológica multivariable
Zonas
minerales

Enriqueci
miento
Cu Fe
Secundari
o
Calcopirit Magnetit
Bornita Mo As Clorita Cuarzo Pirita Recupera
a a Calcosina
(0.47) (0.50) (0.7) (0.70) (-0.52) (0.51) ción
(0.56) (0.63)

Molibden Plagioclas
Tenantita Arcillas Sericita Rutilo Anhidrita Biotita Calcita Enargita Esfalerita Cuprita Digenita OxFe
ita as
(0.91) (0.51) (0.54) (0.54) (-0.51) (-0.55) (0.50) (0.61) (-0.50) (-0.53) (-0.60) (-0.51)
(0.96) (-0.52)

Carbonat
Sb OxFe Feld_K Covelina
o
(0.62) (0.55) (051) (0.55)
(0.95)

Tetraedri
Jarocita Hematita Limonita
ta
(0.52) (0.68) (0.62)
(0.62)

• Cu  Calcopirita/Bornita: principal mena


hipógena de cobre.
• Cu  Mo: Relación en sistemas porfídicos
hidrotermales de alta temperatura.
• Cu  As: Sulfuros de Cu/As en condiciones de
alta sulfidización (Enargita) o condiciones de
sulfidización moderada (Tennantita).
• Mo  Molibdenita: Principal mena de
molibdeno.
• As  Tenantita: Sulfuro de Cu y As (47.5% Cu).
Interpretación geológica multivariable

• Sistema porfídico de alta


temperatura y condiciones de
sulfidización moderada a alta
explica principales correlaciones
entre minerales de
Cu/Mo/As/Sb.
Interpretación geológica multivariable
Zonas
minerales

Enriqueci
miento
Cu Fe
Secundari
o
Calcopirit Magnetit
Bornita Mo As Clorita Cuarzo Pirita Recupera
a a Calcosina
(0.47) (0.50) (0.7) (0.70) (-0.52) (0.51) ción
(0.56) (0.63)

Molibden Plagioclas
Tenantita Arcillas Sericita Rutilo Anhidrita Biotita Calcita Enargita Esfalerita Cuprita Digenita OxFe
ita as
(0.91) (0.51) (0.54) (0.54) (-0.51) (-0.55) (0.50) (0.61) (-0.50) (-0.53) (-0.60) (-0.51)
(0.96) (-0.52)

Carbonat
Sb OxFe Feld_K Covelina
o
(0.62) (0.55) (051) (0.55)
(0.95)

Tetraedri
Jarocita Hematita Limonita
ta
(0.52) (0.68) (0.62)
(0.62)

• El Fe se distribuye hacia fases sulfuradas como


pirita, pirrotina, arsenopirita, calcopirita, bornita,
óxidos de Fe como magnetita, hematita e
ilmenita, y minerales de alteración como epidota,
clorita, actinolita, biotita. Es poco probable
encontrar al Fe como impureza en la estructura
cristalina del cuarzo (correlación negativa).
• Clorita  Arcillas: Asociación de alteración
arcillas-sericita-clorita (probablemente con mayor
cantidad de sericita dada las condiciones ácidas de
la arcilla).
Interpretación geológica multivariable
Zonas
minerales

Enriqueci
miento
Cu Fe
Secundari
o
Calcopirit Magnetit
Bornita Mo As Clorita Cuarzo Pirita Recupera
a a Calcosina
(0.47) (0.50) (0.7) (0.70) (-0.52) (0.51) ción
(0.56) (0.63)

Molibden Plagioclas
Tenantita Arcillas Sericita Rutilo Anhidrita Biotita Calcita Enargita Esfalerita Cuprita Digenita OxFe
ita as
(0.91) (0.51) (0.54) (0.54) (-0.51) (-0.55) (0.50) (0.61) (-0.50) (-0.53) (-0.60) (-0.51)
(0.96) (-0.52)

Carbonat
Sb OxFe Feld_K Covelina
o
(0.62) (0.55) (051) (0.55)
(0.95)

Tetraedri
Jarocita Hematita Limonita
ta
(0.52) (0.68) (0.62)
(0.62)

• Arcillas-Óxidos de Fe: Asociación típica de


cubiertas lixiviadas. Cuando la mineralización
hipógena se ve expuesta a las condiciones
oxidantes de la superficie, la pirita genera fluidos
ácidos altamente lixiviantes. El Fe es altamente
inmóvil ante estas condiciones, existe de forma
residual en la cubierta lixiviada y suele presentarse
como hematita, goetita y jarosita (grupo de las
limonitas).
Interpretación geológica multivariable
Zonas
minerales

Enriqueci
miento
Cu Fe
Secundari
o
Calcopirit Magnetit
Bornita Mo As Clorita Cuarzo Pirita Recupera
a a Calcosina
(0.47) (0.50) (0.7) (0.70) (-0.52) (0.51) ción
(0.56) (0.63)

Molibden Plagioclas
Tenantita Arcillas Sericita Rutilo Anhidrita Biotita Calcita Enargita Esfalerita Cuprita Digenita OxFe
ita as
(0.91) (0.51) (0.54) (0.54) (-0.51) (-0.55) (0.50) (0.61) (-0.50) (-0.53) (-0.60) (-0.51)
(0.96) (-0.52)

Carbonat
Sb OxFe Feld_K Covelina
o
(0.62) (0.55) (0.51) (0.55)
(0.95)

Tetraedri
Jarocita Hematita Limonita
ta
(0.52) (0.68) (0.62)
(0.62)

• Pirita  Anhidrita-Biotita-Plagioclasa: Minerales


asociados a alteraciones de alta temperatura,
principalmente a alteración potásica (biotita,
feldespato-K, plagioclasa Na-Ca, anhidrita y
magnetita). La mineralización presente en estas
primeras etapas está constituida principalmente
por molibdenita, calcopirita y bornita, mientras
que la pirita es escasa.
• Pirita  Calcita: Asociación de alteración
propilítica; clorita, epidota +- magnetita, hematita,
pirita, sericita y calcita (presente en la unidad
litológica Pórfido dacítico).
• Biotita  Feld-K: Asociación de alteración
potásica (biotita-feldespato-K +- cuarzo +-anhidrita
+- magnetita).
Interpretación geológica multivariable
Zonas
minerales

Enriqueci
miento
Cu Fe
Secundari
o
Calcopirit Magnetit
Bornita Mo As Clorita Cuarzo Pirita Recupera
a a Calcosina
(0.47) (0.50) (0.7) (0.70) (-0.52) (0.51) ción
(0.56) (0.63)

Molibden Plagioclas
Tenantita Arcillas Sericita Rutilo Anhidrita Biotita Calcita Enargita Esfalerita Cuprita Digenita OxFe
ita as
(0.91) (0.51) (0.54) (0.54) (-0.51) (-0.55) (0.50) (0.61) (-0.50) (-0.53) (-0.60) (-0.51)
(0.96) (-0.52)

Carbonat
Sb OxFe Feld_K Covelina
o
(0.62) (0.55) (051) (0.55)
(0.95)

Tetraedri
Jarocita Hematita Limonita
ta
(0.52) (0.68) (0.62)
(0.62)

• Enriquecimiento secundario  Calcosina:


Principal mena de Cu (79.8% Cu) en zona de
enriquecimiento secundario.
• Calcosina  Enargita: Correlacionadas en
condiciones supérgenas de alta sulfidización.
• Recuperación  Minerales oxidados o de
enriquecimiento secundario.
• Recuperación  Esfalerita: activación de
esfalerita (comportamiento hidrofóbico) por
iones de CuSO4 o Cu(OH)2 en solución.
Interpretación geometalúrgica multivariable
• Las litologías y texturas entregan rangos de dureza para Bwi: ejemplo
El Teniente, Chile.
Interpretación geometalúrgica multivariable
• Las litologías y texturas entregan rangos de dureza para Bwi: ejemplo
El Teniente, Chile.

Basalto porfírico, Bwi > 17:


Cristales distribuidos en poblaciones de dos tamaños.
Abundantes microcristales con evidencia de
interferencia mutua entre cristales adyacentes.
Grandes interfaces de cristal.

Gabro, Bwi entre 15 y 17:


Cristales con distribución de tamaño serializada. Los
cristales más pequeños adoptan la forma de los
intersticios entre los más grandes cristales.
Interpretación geometalúrgica multivariable

• Se pueden definir asociaciones minerales que afectan negativamente la


recuperación metalúrgica: presencia de limonitas que alteran condiciones de
Eh/pH (química superficial en interacción agua/roca).
• Yacimiento con mineralización primaria y posterior enriquecimiento secundario:
presencia de minerales oxidados disminuyen la recuperación metalúrgica.
• A medida que aumenta el contenido de mena secundaria aumenta la
probabilidad de ocurrencia de Recuperación más bajos. La probabilidad de
Recuperación más baja aumenta en el siguiente sentido:

SP>SSD → SSD=SP → SSD>SP → SSF.


Recuperación
Interpretación geometalúrgica multivariable

• La probabilidad de Recuperación más baja


aumenta con el aumento en el contenido de
arcillas y con el aumento en el contenido de
vetillas con alteración potásico intenso.
• Los resultados de Recuperación bajos se
interpretan como respuesta a un ambiente de
condiciones adversas: las arcillas, limonitas y/u
óxidos de Cu son parte y evidencia de un evento
supérgeno; y las estructuras con alteración
potásica intensa o QSP (cuarzo-sericita-pirita)
ponen a disposición del sistema los canales para
la infiltración de las soluciones supérgenas (en
dichos canales está una parte importante de la
mena). Esto constituye una situación de
probabilidad de Rec baja.
Respuestas y modelos geometalúrgicos
• Procesos de molienda y flotación son caracterizados por dureza de roca y
cinética de flotación.
• Ensayos a escala de laboratorio entregan respuestas metalurgicas tales como:
• Dureza, BWI (Bond Work Index) requerimiento energético, SPI SAG Power
Index, TS test de moliendabilidad SAG, RWI test de bond para molienda con
barras, SMC (axb) SAG Mill Conminution.
• Recuperación Rougher (Cu, Mo, Fe, As, etc) y pH de flotación.
• Estos parámetros son utilizados para diseñar y optimizar la planta de procesos.
Respuestas y modelos geometalúrgicos
• Asociaciones minerales hidrotermales, en contacto con agua tienden al
equilibrio, generando condiciones de buffer fisicoquímico, en particular pH, Eh y
composición química.
• Este comportamiento no es restringido sólo al tipo de depósito, ocurre cuando
los minerales son procesados (molienda-flotación).

Caracterización Comportamiento
Modelo Interacción
mineral mena y conminución y
geoquímico agua-roca
ganga flotación

Relaciones multivariables
Relaciones multivariables e interpretación
• Atributos metalúrgicos tienen
relación estadística
(correlación) con parámetros
geológicos.
Relaciones multivariables e interpretación
• Rcu presenta buena correlación con Rmo y con bwi. La recuperación de cobre y
molibdeno es mejor en rocas que presentan mayor dureza y resistencia a la
fractura, posiblemente bajo condiciones de molienda frágil lográndose mejor
liberación de los minerales de mena.

• Existe una correlación inversa de Rcu con CuNS, un aspecto esperable dado que
esta variable representa cobre no sulfurado, no recuperable por flotación.
Relaciones multivariables e interpretación
• CuT% presenta débil correlación positiva con la recuperación de Fe y As, y
correlación inversa con BWi. Estos resultados sugieren que existen minerales de
cobre que aportan al CuT_% pero su recuperación no es óptima, incorporándose
pirita y cobres grises (tenantita/tetrahederita), minerales que contaminan el
concentrado y bajan la calidad.

• MoT_% presenta correlación positiva con Rmo aspecto que indica que la fuente
de este metal ocurre en el mineral molibdenita, mineral de buena recuperación.
Relaciones multivariables e interpretación
• Minerales de Fe y Ni presenta
correlaciones positivas con BWi.
Na presenta correlaciones
negativas con BWI.
• Es posible generar una variable
sintética que describa el
comportamiento de la variable
BWI. La alta correlación implica
que la variable sintética puede ser
usada para estimar el BWI (con un
nivel de certeza aceptable).
Conclusiones
• La integración de diferentes fuentes de información, con sus respectivos
soportes, permite la aplicación de herramientas convencionales de geoestadística
multivariable para búsqueda de correlaciones y generación de interpretaciones
geometalúrgicas de los procesos involucrados.
• Las herramientas de análisis multivariable permiten relacionar la geología con la
metalurgia generando interpretaciones cuantitativas, las cuales pueden ser
usados en modelos predictivos geometalúrgicos.
• Conocer las respuestas metalúrgicas desde la geología permite generar modelos
predictivos de alta resolución para la operación mina, mejorando calidad de
concentrado y capacidad de adaptación en operación mina (actuar de forma
predictiva y no reactiva).
Aplicación de Análisis de Componentes
Principales (ACP) a Sets de Datos Sísmicos
Hagen, David, 1982, The application of principal components
analysis to seismic data sets, Geoexploration 20, p. 93 – 111.
Antecedentes de ACP
• ACP es una técnica estadística de compresión de información ( reducción del
número de variables).
• Se puede aplicar a bases de datos de gran tamaño y con mucha información
redundante.
• Se obtienen factores que representan la información original.
• Los nuevos componentes principales o factores serán una combinación lineal de las
variables originales y además son no correlacionados entre sí.
• Un aspecto clave en ACP es la interpretación de los factores.
 Hay que relacionar los factores con variables iniciales.
ACP en Datos Sísmicos

• Contexto: Compañías exploradoras de petróleo.


• Datos: pocos datos de pozos y abundante
información sísmica.
• Problema: evaluar cambios en características
que ocurren en un set de trazas sísmicas.
• ACP permite considerar el alto grado de redundancia entre los sets de datos
sísmicos  reducción a información esencial (~10%).
ACP en Datos Sísmicos
• Objetivo:
 Establecer la litología de muestras de pozos y relacionar estas características a los datos sísmicos.
 La litología puede ser extrapolada para producir mapas que muestren áreas posibles de acumulación de
hidrocarburo.
• Este trabajo se orienta a encontrar entrampamientos estructurales entre rocas permeables e impermeables
(porosidad).
• Es importante determinar la conexión que existe entre muestras de pozos y datos sísmicos para poder interpretar
los datos.
 Construir sismogramas sobre las muestras usando generación de ondas.
 Luego, interpretar las ondas medidas en posiciones sin datos.
• Técnicas actuales permiten mejor obtención de datos sísmicos y su procesamiento, junto a una mayor resolución.
• Tendencia a usar datos sísmicos en la interpretación estratigráfica.
• Pequeños cambios en la forma de onda se relacionan con variaciones laterales en la composición y/o porosidad de las
capas de roca.
ACP en Datos Sísmicos - Procedimiento
• xik vector que representa un set de trazas, k= 1,…,N es el índice de traza, i=1,…,M es el índice de
muestra.
N
1
 Vector Media: xi 
N
 xik
k 1

 Matriz Covarianza: S ij 
1 N
 ( xik  xi )( x jk  x j )
N  1 k 1

• Matriz de covarianza invertible:


• Proceso produce M vectores propios ortogonales.
• La contribución de cada vector propio a la varianza total es proporcional a su valor propio .
• Si los primeros valores propios (ordenados de manera decreciente) representan una porción suficiente
de la varianza entonces solo los vectores propios asociados serán necesarios para el análisis.
ACP en Datos Sísmicos - Procedimiento
• Cada traza puede ser estimada como una combinación lineal de los componentes principales:
~
M
xik    mk Z mi
xik  ~
m 1

• Donde αmk es el coeficiente de correlación entre el vector propio Zm y la traza xk.

• Porcentaje de varianza total de la base de datos proporcionado por los primeros componentes
principales está dado por:
~
M

~
 m
 2 (M )  m 1
M

S
m 1
mm

• Donde λm = m-ésimo valor propio, y Smm = matriz diagonal de componentes de covarianza.


ACP en Datos Sísmicos - Procedimiento
• Ejemplo de reducción:
• Set de 200 trazas, de 50 muestras .

 4 componentes principales. pueden representar alrededor de 90% de la varianza total.


 Base de datos inicial de 10.000 muestras se reduce a 4x50 + 4x200 =1.000.
ACP en Datos Sísmicos - Resultados
• Como datos originales se usó el perfil de datos sísmicos mostrado:
ACP en Datos Sísmicos - Resultados
• Exploración dirigida a zona porosa que aparece y desaparece lateralmente (1.66-1.68 s).
• Diferenciación entre no poroso y poroso dada por división de un ciclo de baja frecuencia en dos
ciclos de alta frecuencia.
• Los pozos alcanzaron esta zona en las ubicaciones 152, 181, 194, 214 y 230.
• Los coeficientes para las trazas en los puntos 214 y 230, fueron usados en el proceso de
clasificación para representar las clases porosa y no porosa respectivamente.
• Los puntos 151, 181 y 195 no fueron usados en el proceso de clasificación, e indicaron carácter
no poroso, poroso y poroso respectivamente.
• Los datos fueron acomodados a 1.41 ms y filtrados usando un ancho de banda de 6-58Hz para
eliminar variaciones no relacionadas a la estratigrafía. El análisis estadístico fue hecho sobre los
datos en este formato.
ACP en Datos Sísmicos - Resultados
• El contraste entre poroso y no poroso se puede representar con la frecuencia instantánea.

 frecuencia alta  alta porosidad


 frecuencia baja  escasa porosidad

• La discriminación en el comportamiento de frecuencia instantánea permite usarla como input al


proceso de análisis estadístico.
Resultados Referencia
• Se realizaron comparaciones para
2, 3 y 5 componentes principales.
• Caso 5 CP  mejor resultado.
• Caso 3 CP  suficientemente
bueno.
ACP en Datos Sísmicos - Resultados
• Clasificación para 1, 2, 3 y 5 CP.

• Más oscuro implica mayor porosidad.


• Mientras más densa la zona sombría de una clase
particular, mayor probabilidad de estratigrafía
similar a la que existe en el pozo.
• Los puntos 214 y 230 muestran una alta
probabilidad de pertenecer a las respectivas
clases.
• El proceso ha clasificado correctamente los pozos
en los puntos 151 y 181 con un alto grado de
probabilidad, pero la clasificación del pozo en el
punto 195 es menos certera.
• La clasificación se convierte más selectiva para un
mayor número de componentes.
Conclusiones
• ACP + agrupamiento (clustering) es aplicable a distintos sets de datos sísmicos
• ACP se utilizó para la determinación de características esenciales de un set de
datos sísmicos con un alto contenido de información redundante.
• Reducción de información facilita la categorización precisa de los datos usando
clasificación supervisada asociada a los datos de pozos.
• El análisis estadístico y la clasificación puede ser hecha sobre los datos sísmicos o
sobre uno o más transformaciones de los datos, dependiendo cuales muestran un
carácter discriminatorio.
• El uso de estas técnicas sería provechoso en la reducción de la carga de trabajo
manual para el explorador de la compañía petrolera.
Referencias
• Wackernagel H., Multivariate geostatistics: an introduction with applications, Third Edition,
Springer-Verlag, Berlin, 2003, 387 p. – Chapter 17.
• Hagen, D., 1982, The application of principal components analysis to seismic data sets,
Geoexploration 20, p. 93 – 111.
• Suro-Pérez, V., and Journel, A. G., 1991, Indicator Principal Component Kriging, Mathematical
Geology, 23 (5), P. 759 – 788.
• Lajaunie, Ch., 1992, Letter to the editor - Comment on: Indicator Principal Component Kriging by
Suro-Pérez, V., and Journel, A. G., Mathematical Geology, 24 (5), p. 555 – 561.
• Suro-Pérez, V., and Journel, A. G., 1992, Letter to the editor – Reply to Lajaunie’s Comments,
Mathematical Geology, 24 (5), p. 563 – 565.

También podría gustarte