0% encontró este documento útil (0 votos)
15 vistas18 páginas

Modulos

El documento presenta un análisis estadístico y visualización de datos relacionados con la variable 'bo' agrupada por categorías 'ug'. Se incluyen gráficos como Probability Plots, Scatter Plots y Boxplots para evaluar la distribución y correlación de las variables, así como histogramas y gráficos de líneas para analizar la frecuencia y tendencias. Además, se realiza un análisis de correlación entre variables geoquímicas utilizando una matriz de correlación y un mapa de calor.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
15 vistas18 páginas

Modulos

El documento presenta un análisis estadístico y visualización de datos relacionados con la variable 'bo' agrupada por categorías 'ug'. Se incluyen gráficos como Probability Plots, Scatter Plots y Boxplots para evaluar la distribución y correlación de las variables, así como histogramas y gráficos de líneas para analizar la frecuencia y tendencias. Además, se realiza un análisis de correlación entre variables geoquímicas utilizando una matriz de correlación y un mapa de calor.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

MÓDULO 5: VALIDACIÓN UG

¿Qué está sucediendo en estos datos?


Estos resultados muestran un análisis estadístico descriptivo de una variable llamada 'bo'
agrupado por categorías 'ug'.
Tipo de datos presentados
1. Variables principales:
 'ug' (1-4): Variable categórica que sirve como grupo
 'bo': Variable numérica continua (probablemente ratios o proporciones
por los valores)
2. Estadísticos reportados para cada grupo:
 count: Número de observaciones (233, 294, 409, 339 respectivamente)
 mean: Media aritmética (aumenta con el grupo: 0.018 a 0.333)
 std: Desviación estándar (aumenta con el grupo)
 min: Valor mínimo (0 en todos los grupos)
 Percentiles (25%, 50%, 75%): Medidas de posición
 max: Valor máximo (aumenta con el grupo: 0.36 a 1.661)
¿Qué está sucediendo?
Este código genera un gráfico de probabilidad (probability plot) para visualizar cómo se
distribuye la variable 'bo' en cada categoría 'ug'. El objetivo es comparar las distribuciones de
los diferentes grupos y evaluar su comportamiento respecto a una distribución teórica (normal
en este caso, pero con escala logarítmica).
Tipo de datos presentados
1. Datos de entrada:
o Variable categórica: 'ug' (grupos 1-4 como en el análisis anterior)

o Variable numérica: 'bo' (los mismos valores analizados en la tabla estadística


previa)
2. Transformación aplicada:
o Los datos se ordenan (sort_values()) dentro de cada grupo

o Se representan en escala logarítmica (datascale='log')

Tipo de gráfico
Es un Probability Plot (Gráfico de Probabilidad) con las siguientes características:
 Eje X: Valores ordenados de 'bo' (en escala logarítmica)
 Eje Y: Escala de probabilidad normal (en porcentajes)
 Líneas de referencia: Distribución teórica (probablemente normal)
 Multiserie: Una línea/curva por cada categoría UG
¿Qué está sucediendo?
Este código crea una visualización 3D que muestra la distribución espacial de datos
georreferenciados, diferenciando las categorías UG (Unidades Geológicas) mediante colores. La
visualización utiliza tres coordenadas espaciales (Este, Norte, Elevación) para posicionar cada
punto en el espacio tridimensional.
Tipo de datos presentados
1. Variables utilizadas:
o Coordenadas espaciales:

 x='East': Coordenada Este (posiblemente en metros o grados decimales)


 y='North': Coordenada Norte (posiblemente en metros o grados
decimales)
 z='Elevation': Elevación o altitud (probablemente en metros)
2. Transformación aplicada:
o Conversión de la columna 'ug' a tipo string (astype(str)) para asegurar que se
interprete como variable categórica/discreta
Tipo de gráfico
Es un Scatter Plot 3D (Gráfico de Dispersión Tridimensional) con las siguientes características:
 Ejes: Sistema de coordenadas XYZ (Este-Norte-Elevación)
 Codificación de color: Diferentes colores para cada categoría UG
 Marcadores: Puntos en el espacio 3D (tamaño posiblemente uniforme según la
línea marker-dict(sizes.0))
¿Qué está sucediendo?
Este código genera un conjunto de histogramas que muestran la distribución de la variable
'bo' separada por cada categoría 'ug' Cada subgráfico representa una categoría UG diferente,
permitiendo comparar visualmente las distribuciones.
Tipo de datos presentados
1. Variable numérica continua:
o 'bo': Variable cuantitativa que parece tener valores entre 0 y aproximadamente
0.8 (según los ejes X mostrados)
2. Variable categórica:
o 'ug': Unidades geológicas que sirven como grupos para segmentar los datos
(probablemente UG1, UG2, UG3, UG4 como en análisis anteriores)
Tipo de gráfico
Es un conjunto de histogramas con las siguientes características:
 Disposición: Multiple subplots (uno por categoría UG)
 Eje X: Valores de 'bo' (rango ≈0-0.8)
 Eje Y: Frecuencia o conteo de observaciones
 Barras: Representan la distribución de frecuencias de 'bo' en cada UG
Los histogramas revelan:
1. Distribuciones distintas para cada UG:
o UG1: Datos muy concentrados cerca de 0 (asimetría extrema)

o UG2: Mayor dispersión, pero aún concentrados en valores bajos


o UG3 y UG4: Distribuciones más amplias y valores más altos

2. Patrón progresivo:
o A mayor número de UG (1→4):

 Las distribuciones se desplazan hacia la derecha (valores más altos de


'bo')
 Las colas se alargan hacia valores superiores
3. Escalas diferentes:
o Los conteos (eje Y) varían significativamente entre UGs

o UG1 y UG2 tienen muchos más casos en el extremo inferior que UG3 y UG4

¿Qué está sucediendo?


Este código genera un diagrama de caja (boxplot) que compara la distribución de la variable
'bo' (probablemente concentración o relación de minerales) entre las diferentes categorías 'ug'
(Unidades Geológicas), utilizando una escala logarítmica en el eje Y para mejorar la
visualización de los datos.
Tipo de datos presentados
1. Variable numérica:
o 'bo': Variable cuantitativa que parece tener un rango amplio de valores (desde
cerca de 0 hasta valores más altos, según análisis previos)
2. Variable categórica:
o 'ug': Unidades geológicas que sirven como grupos de comparación (UG1, UG2,
UG3, UG4 como en análisis anteriores)
Tipo de gráfico
Es un Boxplot (diagrama de caja y bigotes) con características especiales:
 Eje X: Categorías UG (discreto)
 Eje Y: Valores de 'bo' en escala logarítmica (pero mostrados en formato normal)
 Elementos del boxplot:
o Caja: Rango intercuartílico (Q1 a Q3)

o Línea central: Mediana (Q2)

o Bigotes: Rango normal de los datos

o Puntos: Posibles valores atípicos

Interpretación clave
El boxplot en escala logarítmica permite observar:
1. Diferencias significativas entre UGs:
o Mediana (línea central) aumenta progresivamente de UG1 a UG4

o Dispersión (tamaño de la caja) también aumenta con el número de UG

2. Distribuciones asimétricas:
o Para UG1 y UG2: Mayor concentración en valores bajos (bigote inferior corto)

o Para UG3 y UG4: Mayor dispersión hacia valores altos

3. Posibles valores atípicos:


o Puntos individuales por encima de los bigotes indican valores inusuales

o Especialmente notables en UG3 y UG4

¿Qué está sucediendo?


El código genera un gráfico de dispersión que relaciona dos parámetros estadísticos clave
(media y desviación estándar) de la variable 'bo'). Este análisis revela cómo la variabilidad de
los datos se relaciona con sus valores promedio en diferentes categorías.
Tipo de datos presentados
1. Datos estadísticos:
o stats_by_ug: DataFrame con estadísticos descriptivos (media, std, etc.)
agrupados por UG
o Eje X: Media de 'bo' por UG (valores entre ~0.02 y 0.33 según análisis previos)

o Eje Y: Desviación estándar de 'bo' por UG (valores entre ~0.05 y 0.21)

2. Estructura:
o Cada punto representa una UG (1-4)

o Coordenadas: (mean, std) para esa UG

Tipo de gráfico
Scatter Plot (Diagrama de Dispersión) con:
 Puntos: Coloreados/etiquetados por UG
 Leyenda: Identifica cada categoría UG
 Escalas:
o Eje X: "Median" (aunque técnicamente debería ser "Mean")

o Eje Y: "Standard Deviation"

MÓDULO 6: ANÁLISIS MULTIVARIABLE


¿Qué está sucediendo?
Se está realizando un análisis de correlación entre tres variables geoquímicas ('bo', 'py', 'cpy')
mediante una matriz de correlación y su representación visual con un mapa de calor (heatmap).
El objetivo es identificar relaciones lineales entre estas variables.
Tipo de datos presentados
1. Variables analizadas:
o bo: Variable numérica (posiblemente concentración de boro)

o py: Variable numérica (probablemente pirita)

o cpy: Variable numérica (posiblemente pirita de cobre)

2. Matriz de correlación:
o Matriz simétrica 3×3 con coeficientes de Pearson

o Valores entre -1 (correlación negativa perfecta) y 1 (correlación positiva


perfecta)
o Diagonal principal siempre = 1 (autocorrelación)

Tipo de gráfico
Heatmap (Mapa de Calor) con:
 Ejes X e Y: Nombres de las variables ('bo', 'py', 'cpy')
 Celdas coloreadas: Intensidad proporcional al valor de correlación
 Anotaciones: Valores numéricos de correlación dentro de cada celda
 Escala de color (implícita):
o Colores cálidos: Correlaciones positivas

o Colores fríos: Correlaciones negativas

Interpretación
1. Correlaciones significativas:
o bo y py: Correlación negativa moderada (-0.36)

o bo y cpy: Correlación negativa débil (-0.20)

o py y cpy: Prácticamente no correlacionadas (0.0085)

2. Patrones geoquímicos:
o Cuando aumenta 'bo', tiende a disminuir 'py' (y viceversa)

o 'cpy' muestra muy poca relación con 'py' a pesar de su nombre similar

o 'bo' tiene cierta relación inversa con ambos minerales sulfurados


¿Qué está sucediendo?
Este gráfico es el resultado del código anterior (corregido) y muestra:
 Tres subgráficos de dispersión (scatter plots) organizados verticalmente
 Cada gráfico corresponde a un grupo diferente de la variable categórica 'ug' (los
números 1, 3 y 4 en la parte superior derecha de cada gráfico lo indican)
 Todos comparten los mismos ejes x (0.0 a 2.0) e y (0 a 16) como se definió en el código
Tipo de datos presentados
3. Variables analizadas:
o Eje X (bo): Variable numérica con rango de 0.00 a 2.00

o Eje Y (py): Variable numérica con rango de 0 a 16

o Grupos (ug): Categorías 1, 3 y 4 (como se ve en los títulos)

Tipo de gráfico
Es un conjunto de gráficos de dispersión (scatter plots) múltiples, donde:
 Cada punto representa una observación individual
 La posición muestra los valores de 'bo' (x) y 'py' (y)
 Los diferentes gráficos muestran cómo varía esta relación entre diferentes grupos ('ug')
¿Qué está sucediendo?
Este código y gráfico muestran:
1. Un análisis de distribución de muestras agrupadas por valores de 'Step_East'
2. Cuenta cuántas muestras hay para cada valor único de 'Step_East'
3. Genera un gráfico de líneas que muestra esta distribución
Tipo de datos que presenta
El gráfico revela:
 Eje X: Valores de 'Step_East' (rango aproximado 155,500 a 158,500)
o Parecen ser coordenadas o valores de posición (posiblemente longitud este)

 Eje Y: Conteo de muestras para cada valor de Step_East (0 a 120)


 Datos: Distribución de frecuencia de muestras a lo largo de un gradiente este
Tipo de gráfico
Es un gráfico de líneas que muestra:
 La frecuencia/cantidad de muestras (eje Y) para cada valor de Step_East (eje X)
 Título claro que explica el contenido
 Ejes automáticamente escalados
Posibles usos
Este tipo de análisis es útil para:
 Verificar distribución espacial de muestras
 Identificar lagunas en el muestreo
 Planificar futuras campañas de recolección de datos
 Analizar patrones de distribución geográfica

¿Qué está sucediendo?


Este código genera un gráfico de doble eje que visualiza:
1. La media de la variable 'bo' (eje Y izquierdo, en rojo)
2. La media de la variable 'py' (eje Y derecho, en azul)
3. Ambas series están agrupadas por valores de 'Step_East' (eje X)
Tipo de datos que presenta
El gráfico muestra:
 Eje X: Valores de 'Step_East' (155,500 a 158,500)
 Eje Y izquierdo (rojo):
o Media de 'bo' (rango 0.00 a 0.30)

o Muestra variabilidad con picos alrededor de 156,500 y 157,500


 Eje Y derecho (azul):
o Media de 'py' (rango aproximado -8 a 0, aunque los valores exactos no son
visibles)
o Parece mostrar una tendencia diferente a 'bo'

Tipo de gráfico
Es un gráfico de líneas con ejes duales que permite:
 Comparar dos variables con diferentes escalas en el mismo contexto espacial
 Visualizar relaciones potenciales entre 'bo' y 'py' a lo largo del gradiente East
 Mantener una referencia espacial común (Step_East) en el eje XObservaciones clave
Utilidad del gráfico
Este tipo de visualización es particularmente útil para:
 Identificar correlaciones espaciales entre variables
 Detectar patrones geográficos en los datos
 Comparar el comportamiento de variables con diferentes rangos de valores
 Analizar cómo cambian múltiples métricas a lo largo de un gradiente espacial

¿Qué está sucediendo?


Este código está generando dos gráficos 3D interactivos usando Plotly Express que muestran:
1. Primero: Distribución espacial de puntos coloreados por valores de 'bo'
2. Segundo: Distribución espacial de puntos coloreados por valores de 'py'
3. Ambos usan las mismas coordenadas espaciales (East, North, Elevation) pero con
diferente esquema de coloración
Tipo de datos que presenta
El gráfico trabaja con:
 Coordenadas espaciales:
o x='East' (coordenada este)

o y='North' (coordenada norte)

o z='Elevation' (altura/elevación)

 Variables de coloración:
o Primero: 'bo' (rango 0.0 a máximo valor en los datos)

o Segundo: 'py' (rango 0.0 a máximo valor en los datos)

Tipo de gráfico
Es un gráfico de dispersión 3D interactivo con:
 Tres dimensiones espaciales (East, North, Elevation)
 Cuarta dimensión visual representada por color (ya sea 'bo' o 'py')
 Capacidad de rotación, zoom y exploración interactiva
 Escala de colores secuencial (de Plotly)
¿Qué está sucediendo?
Este código genera un gráfico de probabilidad especializado que compara la distribución de la
variable 'bo' (probablemente concentración geoquímica) entre diferentes categorías 'ug'
(unidades geológicas), utilizando una escala logarítmica para los valores y una escala de
probabilidad normal en porcentajes para evaluar su distribución.
Tipo de Datos Presentados
1. Datos de entrada:
o Variable continua: 'bo' (valores geoquímicos, rango ~1e-4 a 1e1)

o Variable categórica: 'ug' (unidades geológicas como grupos)

2. Transformaciones aplicadas:
o Ordenamiento de valores dentro de cada categoría (sort_values())

o Escala logarítmica para los datos (datascale='log')

o Escala de probabilidad normal (probax='y')

Tipo de Gráfico
Probability Plot (Gráfico de Probabilidad) con características avanzadas:
 Eje X (Ordered Values): Valores ordenados de 'bo' en escala logarítmica (1e-4 a 1e1)
 Eje Y (Normal probability scale): Porcentajes acumulados (0.001% a 99.99%) en
escala normal
 Elementos gráficos:
o Líneas para cada categoría 'ug'

o Formateo especial del eje X (ScalarFormatter)

o Límites precisos en ambos ejes

o Leyenda identificando cada categoría

Interpretación Técnica
Este gráfico permite evaluar:
1. Ajuste a distribuciones teóricas: Compara los datos empíricos con una distribución
normal (en escala de probabilidad)
2. Diferencias entre unidades geológicas: Visualiza cómo varían las distribuciones de
'bo' entre categorías 'ug'
3. Comportamiento de valores extremos: Los percentiles altos/bajos muestran
desviaciones de la normalidad
4. Rangos característicos: La posición horizontal de las curvas indica valores típicos para
cada UG

¿Qué está sucediendo?


Este código crea un gráfico de probabilidad avanzado (probability plot) para analizar la
distribución de la variable 'py' (probablemente concentración de pirita u otro mineral sulfurado)
en diferentes unidades geológicas (UG). El gráfico utiliza escalas especializadas para evaluar
cómo se ajustan los datos a una distribución teórica.
Tipo de Datos Presentados
1. Variables clave:
o py: Variable numérica continua (concentraciones químicas, valores entre ~1e-4
y 1e1)
o ug: Variable categórica (unidades geológicas que agrupan los datos)

2. Características de los datos:


o Datos ordenados dentro de cada UG (sort_values())

o Escala logarítmica para los valores medidos

o Escala de probabilidad normal para los percentiles acumulados

Tipo de Gráfico
Gráfico de Probabilidad (ProbPlot) Mejorado con:
 Eje X: Valores ordenados de 'py' en escala logarítmica (rango 1e-4 a 1e1)
 Eje Y: Escala de probabilidad normal (% acumulados de 0.001% a 99.99%)
 Elementos visuales:
o Líneas para cada categoría UG (diferenciadas por color)

o Eje X con formato decimal estándar (no científico)

o Leyenda identificando cada UG

Interpretación
Este gráfico permite identificar:
1. Patrones de distribución:
o Líneas rectas sugerirían distribución log-normal

o Curvaturas indican desviaciones de la normalidad

2. Comparación entre UGs:


o Diferencias en pendiente = variabilidad distinta

o Desplazamientos horizontales = concentraciones medias diferentes

3. Valores extremos:
o Puntos en extremos superiores/inferiores muestran anomalías

o Separación entre curvas en altos percentiles indica diferencias en valores


máximos

MÓDULO 7: EXPORTACIÓN Y GENERACIÓN DE REPORTE


¿Qué está sucediendo?
Este código realiza tres operaciones principales con un conjunto de datos geológicos (DH):
1. Exportación de datos brutos a CSV
2. Generación de estadísticas descriptivas
3. Creación de un histograma para la variable 'bo'
Tipo de Datos Presentados
1. Datos Geológicos (DH)
 Variables espaciales:
o East (Coordenada Este): Valores ~1.55e10 a 1.58e10

o North (Coordenada Norte): Valores ~91561 a 93569

o Elevation: Valores 2703.21 a 3827.69 metros

 Variables geoquímicas:
o bo: Concentraciones 0.0 a 1.661

o cpy: 0.0 a 6.849

o py: 0.0 a 16.52

 Variables categóricas/metadatos:
o dom: Mayormente valor 3 (1.0 a 3.0)

o ug: Unidades geológicas (1 a 4)

2. Estadísticos Calculados
Para cada variable se calculan:
 count, mean, std, min, percentiles (25%, 50%, 75%), max
Gráficos Generados
Histograma de 'bo'
 Tipo: Histograma de frecuencias
 Configuración:
o 20 bins (intervalos)

o Rango aproximado: 0.0 a 1.5

o Distribución altamente asimétrica (sesgo positivo)

1. Distribución de 'bo':
o Concentración en valores bajos (media 0.14, mediana 0.058)

o Cola larga hacia valores altos (max 1.661)

o Sugiere múltiples poblaciones geoquímicas

2. Datos espaciales:
o Coordenadas en sistema de alta precisión

o Elevaciones típicas ~3000-3800 metros

3. Mineralizaciones:
o 'py' (pirita) muestra mayor variabilidad (std=1.99)

o 'cpy' (pirita de cobre) con valores más consistentes

También podría gustarte