EDA Multivariable en Geología
EDA Multivariable en Geología
Leyes con colores + Zona mineral mapeada (letras) + Sólido 3D modelado de zona Bn+Cp
Estadísticas básicas univariables
• Medidas de posición:
• Media 1 n
m
n
z (u )
1
1 n
• Varianza s ( z (u ) m) 2
2
n 1
• Desviación estándar s s2
s
• Coeficiente de variación CV
m
Estadísticas básicas univariables
A. Yacimiento tipo pórfido cuprífero CV = 0.7 Unidades de mayor ley,
B. Yacimiento de cobre de mediana variabilidad CV = 1.5 mayor varianza y efecto
C. Yacimiento de oro de alta variabilidad CV = 4.5 proporcional
A B C
Estadísticas básicas univariables
• Medidas de forma: n
1
• Coeficiente de asimetría (skewness) n
( z (u ) m)
1
3
s3
Frec.
Frec. Frec.
Positivo
Mm z(x)
Cercano a 0
M
Negativo
mM
m
z(x) z(x)
Estadísticas básicas univariables
• Coeficiente de aplanamiento (Kurtosis)
n
1
n
( z (u ) m)
1
4
s4
• Da una idea del aplanamiento de la distribución (relación entre altura y ancho de
la campana).
• Su valor es 3 para distribuciones normales (Gaussianas)
Estadísticas básicas univariables
• Histograma de frecuencia relativa: despliegue
Histograma
200
160
140
Frecuencia
120
100
80
60
40
20
0
0 0,2 0,4 0,6 0,8 1 1,2 1,4 1,6 1,8 2 2,2 2,4 2,6 2,8 3 3,2 3,4 3,6 3,8 4 4,2 4,4 4,6 4,8 5
Clase
Frecuencia acumulada
80%
40%
20%
0%
0 0,2 0,4 0,6 0,8 1 1,2 1,4 1,6 1,8 2 2,2 2,4 2,6 2,8 3 3,2 3,4 3,6 3,8 4 4,2 4,4 4,6 4,8 5
Clase
Estadísticas básicas univariables
• Histogramas:
• Registra el número de muestras en cada clase.
• “Ancho” de clase suele ser constante la altura de cada barra del histograma es proporcional a la
frecuencia de la clase
• Entrega estadísticas de las muestras (no de la población)
• Escala logarítmica puede ser útil
• Media y varianza son muy sensibles a valores extremos
• Mediana y rango intercuartil son medidas más robustas
• ¿Cómo construirlo?
• Dependiendo del número de muestras, escoger un número de clases
• Desplegar el rango importante de los datos (colas no se ven bien)
• Desplegar estadísticas con un número razonable de decimales
Estadísticas básicas por categoría
• Diagrama de caja (box-plot)
• Resume una distribución, en especial su forma y dispersión, en un diagrama de
una sola dimensión
Estadísticas básicas por categoría
• Diagrama de caja (box-plot)
• Se utilizan para comparar distribuciones para distintas categorías, definidas por
algún atributo geológico
Definiciones formales multivariables
• Corregionalización: conjunto de variables regionalizadas {z1,... zN} definidas en
una misma región del espacio (campo)
• Si todos los puntos caen en una línea de 45°, las dos distribuciones son
exactamente iguales
• Si la línea esta desplazada de los 45°, las dos distribuciones tienen la
misma forma pero diferentes medias
• Si la inclinación de la línea no es 45°, las dos distribuciones tienen
diferentes varianzas
• Si hay un carácter no lineal en el grafico Q-Q, las distribuciones tienen
diferentes formas en el histograma
Gráfico de probabilidad acumulada
• Puede usarse para verificar modelos de distribución:
• Línea recta en escala aritmética distribución
normal
• Línea recta en escala logarítmica distribución
lognormal
• Pequeñas divergencias pueden ser importantes
(especialmente en los extremos)
Estéril a botadero
Mineral a planta
• Mineral a botadero
Χ Estéril a planta
Medias condicionales
• Corresponde al cálculo de las leyes medias y varianzas de las variables de interés
según coordenadas este, norte y cota.
• De ser necesario deben ser calculadas en direcciones del depósito por medio de
una rotación de los datos.
Medias condicionales
• Perimen evaluar el comportamiento espacial de la variable de interés.
• Detectan tendencias de alza o baja.
• Detectan el nivel de variabilidad según coordenadas.
Medias condicionales
• Puede incluirse la desviación estándar para cuantificar la variabilidad y visualizar
mejor las tendencias estadísticas.
Medias condicionales
• Puede incluirse la desviación estándar para cuantificar la variabilidad y visualizar
mejor las tendencias estadísticas.
Swathplot
• Se utilizan para validar estimaciones de forma local (sondaje v/s modelo de
bloques)
Coeficiente de correlación
• El coeficiente de correlación es una medida de la dependencia lineal entre
las dos variables
1 n
( z 1 m Z1 )( z 2 m Z 2 )
n 1
Z1 Z 2
Y Y
= 0,73
= -0,68
X X
Coeficiente de correlación Caso 1 Caso 2
Y Y
coeficiente de correlación X X
Caso 3 Caso 4
Y Y
=0 =0
X X
Caso 5 Caso 6
Y Y
= -0,87
= -1
X X
Coeficiente de correlación Caso 1 Caso 2
Y Y
coeficiente de correlación X X
Caso 3 Caso 4
Y Y
=0 =0
Correlación positiva X X
No hay dependencia
Caso 5 Caso 6
Y Y
= -1
X X
Regresión lineal
• Se considera la nube de dispersión entre dos variables X e Y. La regresión lineal
consiste en determinar la recta que mejor represente la nube de puntos (X,Y).
• Permite estimar Y a partir de X
• Su ecuación es Ŷ a X b
var (Y)
a XY b mY a mX
var (X)
Regresión lineal
• Ilustración
Regresión lineal
• Estimar una variable utilizando otra con la que está correlacionada.
• Regresión Lineal: cálculo de la línea de regresión que minimiza la suma de los
errores al cuadrado.
Matriz de correlación
• Se trata de la matriz de los coeficientes de correlación entre varias variables.
• Permite destacar grupos de variables correlacionadas entre sí, y poco
correlacionadas con variables de otros grupos
Cu Mo Au Ag
Coeficientes de
Cu 1.00 0.85 0.51 0.45 correlación lineal
Filtro y agrupamiento
de variables
Análisis de componentes principales
• Comentarios:
• La reducción de información y la representación gráfica de las variables resultan
las ventajas más llamativas de este método.
• Para buscar vectores y valores propios se debe invertir matrices que tal vez sean
de un tamaño considerable, esto se puede considerar una desventaja por el
tiempo que este paso puede tomar.
• Al eliminar factores no relevantes, tal vez no se elimine información importante
para el análisis global, pero se pueden estar obviando datos que ayuden a
concluir sobre un tema más específico.
Análisis multivariable de datos
geometalúrgicos
Interpretación con dendogramas de variables principales
Introducción
• Geometalurgia abarca la solución a problemas de la
minería de forma transdisciplinaria, donde se integran
conocimientos de geología, metalurgia y operaciones
mineras.
• Se busca estudiar la distribución de los parámetros
metalúrgicos a lo largo de un yacimiento usando
técnicas geoestadísticamente aceptadas para soportar
el proceso de modelamiento metalúrgico.
• Dureza del mineral.
• cinética de flotación.
• cinética de lixiviación.
Herramientas de análisis multivariable
• Para generar modelos predictivos de metalurgia, es necesario:
• Identificar las variables que afectan al proceso.
• Conocer el comportamiento de las variables involucradas.
• Proponer modelos predictivo usando las variables involucradas.
Zonas
minerales
Enriquecimi
Cu Fe ento
Secundario
Molibdenita Tenantita Arcillas Sericita Rutilo Anhidrita Biotita Plagioclasas Calcita Enargita Esfalerita Cuprita Digenita OxFe
(0.96) (0.91) (0.51) (0.54) (0.54) (-0.51) (-0.55) (-0.52) (0.50) (0.61) (-0.50) (-0.53) (-0.60) (-0.51)
Enriqueci
miento
Cu Fe
Secundari
o
Calcopirit Magnetit
Bornita Mo As Clorita Cuarzo Pirita Recupera
a a Calcosina
(0.47) (0.50) (0.7) (0.70) (-0.52) (0.51) ción
(0.56) (0.63)
Molibden Plagioclas
Tenantita Arcillas Sericita Rutilo Anhidrita Biotita Calcita Enargita Esfalerita Cuprita Digenita OxFe
ita as
(0.91) (0.51) (0.54) (0.54) (-0.51) (-0.55) (0.50) (0.61) (-0.50) (-0.53) (-0.60) (-0.51)
(0.96) (-0.52)
Carbonat
Sb OxFe Feld_K Covelina
o
(0.62) (0.55) (051) (0.55)
(0.95)
Tetraedri
Jarocita Hematita Limonita
ta
(0.52) (0.68) (0.62)
(0.62)
Enriqueci
miento
Cu Fe
Secundari
o
Calcopirit Magnetit
Bornita Mo As Clorita Cuarzo Pirita Recupera
a a Calcosina
(0.47) (0.50) (0.7) (0.70) (-0.52) (0.51) ción
(0.56) (0.63)
Molibden Plagioclas
Tenantita Arcillas Sericita Rutilo Anhidrita Biotita Calcita Enargita Esfalerita Cuprita Digenita OxFe
ita as
(0.91) (0.51) (0.54) (0.54) (-0.51) (-0.55) (0.50) (0.61) (-0.50) (-0.53) (-0.60) (-0.51)
(0.96) (-0.52)
Carbonat
Sb OxFe Feld_K Covelina
o
(0.62) (0.55) (051) (0.55)
(0.95)
Tetraedri
Jarocita Hematita Limonita
ta
(0.52) (0.68) (0.62)
(0.62)
Enriqueci
miento
Cu Fe
Secundari
o
Calcopirit Magnetit
Bornita Mo As Clorita Cuarzo Pirita Recupera
a a Calcosina
(0.47) (0.50) (0.7) (0.70) (-0.52) (0.51) ción
(0.56) (0.63)
Molibden Plagioclas
Tenantita Arcillas Sericita Rutilo Anhidrita Biotita Calcita Enargita Esfalerita Cuprita Digenita OxFe
ita as
(0.91) (0.51) (0.54) (0.54) (-0.51) (-0.55) (0.50) (0.61) (-0.50) (-0.53) (-0.60) (-0.51)
(0.96) (-0.52)
Carbonat
Sb OxFe Feld_K Covelina
o
(0.62) (0.55) (051) (0.55)
(0.95)
Tetraedri
Jarocita Hematita Limonita
ta
(0.52) (0.68) (0.62)
(0.62)
Enriqueci
miento
Cu Fe
Secundari
o
Calcopirit Magnetit
Bornita Mo As Clorita Cuarzo Pirita Recupera
a a Calcosina
(0.47) (0.50) (0.7) (0.70) (-0.52) (0.51) ción
(0.56) (0.63)
Molibden Plagioclas
Tenantita Arcillas Sericita Rutilo Anhidrita Biotita Calcita Enargita Esfalerita Cuprita Digenita OxFe
ita as
(0.91) (0.51) (0.54) (0.54) (-0.51) (-0.55) (0.50) (0.61) (-0.50) (-0.53) (-0.60) (-0.51)
(0.96) (-0.52)
Carbonat
Sb OxFe Feld_K Covelina
o
(0.62) (0.55) (0.51) (0.55)
(0.95)
Tetraedri
Jarocita Hematita Limonita
ta
(0.52) (0.68) (0.62)
(0.62)
Enriqueci
miento
Cu Fe
Secundari
o
Calcopirit Magnetit
Bornita Mo As Clorita Cuarzo Pirita Recupera
a a Calcosina
(0.47) (0.50) (0.7) (0.70) (-0.52) (0.51) ción
(0.56) (0.63)
Molibden Plagioclas
Tenantita Arcillas Sericita Rutilo Anhidrita Biotita Calcita Enargita Esfalerita Cuprita Digenita OxFe
ita as
(0.91) (0.51) (0.54) (0.54) (-0.51) (-0.55) (0.50) (0.61) (-0.50) (-0.53) (-0.60) (-0.51)
(0.96) (-0.52)
Carbonat
Sb OxFe Feld_K Covelina
o
(0.62) (0.55) (051) (0.55)
(0.95)
Tetraedri
Jarocita Hematita Limonita
ta
(0.52) (0.68) (0.62)
(0.62)
Caracterización Comportamiento
Modelo Interacción
mineral mena y conminución y
geoquímico agua-roca
ganga flotación
Relaciones multivariables
Relaciones multivariables e interpretación
• Atributos metalúrgicos tienen
relación estadística
(correlación) con parámetros
geológicos.
Relaciones multivariables e interpretación
• Rcu presenta buena correlación con Rmo y con bwi. La recuperación de cobre y
molibdeno es mejor en rocas que presentan mayor dureza y resistencia a la
fractura, posiblemente bajo condiciones de molienda frágil lográndose mejor
liberación de los minerales de mena.
• Existe una correlación inversa de Rcu con CuNS, un aspecto esperable dado que
esta variable representa cobre no sulfurado, no recuperable por flotación.
Relaciones multivariables e interpretación
• CuT% presenta débil correlación positiva con la recuperación de Fe y As, y
correlación inversa con BWi. Estos resultados sugieren que existen minerales de
cobre que aportan al CuT_% pero su recuperación no es óptima, incorporándose
pirita y cobres grises (tenantita/tetrahederita), minerales que contaminan el
concentrado y bajan la calidad.
• MoT_% presenta correlación positiva con Rmo aspecto que indica que la fuente
de este metal ocurre en el mineral molibdenita, mineral de buena recuperación.
Relaciones multivariables e interpretación
• Minerales de Fe y Ni presenta
correlaciones positivas con BWi.
Na presenta correlaciones
negativas con BWI.
• Es posible generar una variable
sintética que describa el
comportamiento de la variable
BWI. La alta correlación implica
que la variable sintética puede ser
usada para estimar el BWI (con un
nivel de certeza aceptable).
Conclusiones
• La integración de diferentes fuentes de información, con sus respectivos
soportes, permite la aplicación de herramientas convencionales de geoestadística
multivariable para búsqueda de correlaciones y generación de interpretaciones
geometalúrgicas de los procesos involucrados.
• Las herramientas de análisis multivariable permiten relacionar la geología con la
metalurgia generando interpretaciones cuantitativas, las cuales pueden ser
usados en modelos predictivos geometalúrgicos.
• Conocer las respuestas metalúrgicas desde la geología permite generar modelos
predictivos de alta resolución para la operación mina, mejorando calidad de
concentrado y capacidad de adaptación en operación mina (actuar de forma
predictiva y no reactiva).
Aplicación de Análisis de Componentes
Principales (ACP) a Sets de Datos Sísmicos
Hagen, David, 1982, The application of principal components
analysis to seismic data sets, Geoexploration 20, p. 93 – 111.
Antecedentes de ACP
• ACP es una técnica estadística de compresión de información ( reducción del
número de variables).
• Se puede aplicar a bases de datos de gran tamaño y con mucha información
redundante.
• Se obtienen factores que representan la información original.
• Los nuevos componentes principales o factores serán una combinación lineal de las
variables originales y además son no correlacionados entre sí.
• Un aspecto clave en ACP es la interpretación de los factores.
Hay que relacionar los factores con variables iniciales.
ACP en Datos Sísmicos
Matriz Covarianza: S ij
1 N
( xik xi )( x jk x j )
N 1 k 1
• Porcentaje de varianza total de la base de datos proporcionado por los primeros componentes
principales está dado por:
~
M
~
m
2 (M ) m 1
M
S
m 1
mm