ANLISIS
DE VARIOGRAMA Y
COMPOSITACIN CON DATOS
COMPARTIDOS
CURSO DE GEOESTADSTICA I
PRESENTADO POR:
BORIS YURI ACUA GARAY
CDIGO DE ALUMNO:
20132081B
PROFESORES:
Ing. TEVES ROJAS AUGUSTO
Ph.D MARIN SUAREZ VALERIANO ALFREDO
FECHA DE ENTREGA: MARTES 26 DE ARIL DEL 2016
FACULTAD DE INGENIERA GEOLGICA, MINERA Y METALRGICA
UNIVERSIDAD NACIONAL DE INGENIERA
LIMA-PER
UNIVERSIDAD NACIONAL DE INGENIERA
FACULTAD DE INGENIERA GEOLGICA, MINERA Y METALRGICA
GEOESTADSTICA I
1 INDICE
1
INDICE ...................................................................................................................... 2
INTRODUCCION ..................................................................................................... 3
OBJETIVOS .............................................................................................................. 4
FUNDAMENTO TEORICO ..................................................................................... 5
4.1
Geoestadistica .................................................................................................... 5
4.2
Variograma ........................................................................................................ 6
4.3
Variable regionalizada ....................................................................................... 7
4.4
Histograma ........................................................................................................ 7
4.5
Python ............................................................................................................... 8
ANALISIS Y COMPARACION DE DATOS ........................................................... 9
5.1
Formulacin del problema ................................................................................. 9
5.2
Generacin de 10,000 datos aleatorios en el intervalo [20,95] ........................ 10
5.3
Compositar de 20 en 20 y graficar el variograma e histograma
correspondiente. ........................................................................................................... 11
5.4
Compositar de 20 en 20 compartiendo 5 y graficar el variograma e histograma
correspondiente. ........................................................................................................... 12
5.5
Compositar de 20 en 20 compartiendo 10 y graficar el variograma e
histograma correspondiente. ........................................................................................ 14
5.6
Compositar de 20 en 20 compartiendo 15 y graficar el variograma e
histograma correspondiente. ........................................................................................ 16
6
COMPARANDO VARIOGRAMAS E HISTOGRAMAS ...................................... 18
CONCLUSIONES ................................................................................................... 20
BIBLIOGRAFIA ..................................................................................................... 21
VARIOGRAMA Y COMPOSITACIN EN PYTHON
UNIVERSIDAD NACIONAL DE INGENIERA
FACULTAD DE INGENIERA GEOLGICA, MINERA Y METALRGICA
GEOESTADSTICA I
INTRODUCCION
El concepto de variograma es bastante amplio y es de mucha utilidad en el campo de la
minera y los estudios estadsticos en donde existe una posicin determinada de la variable
aleatoria.
El variograma y la teora de variable regionalizada se introdujeron a partir de la deficiencia
de la estadstica al momento de realizar estimaciones a una poblacin con datos
estrictamente en una posicin determinada.
El variograma viene siendo una funcin vectorial en Rn que depende de la interdistancia
de los datos lag, permite conocer el alcance, es decir, la distancia mxima a la que una
muestra tiene influencia sobre otra muestra, una aplicacin de esta informacin es conocer
la vecindad en que se pueden buscar muestras para estimar el valor de un punto especifico.
La aplicacin de esta herramienta tambin permite, a partir de los datos proporcionados
por el variograma terico, realizar una estimacin por medio de la metodologa del
krigeaje, la cual utiliza el modelo matemtico para definir el ponderador que se aplica a
cada una de las muestras encontradas al momento de asignar un valor al punto buscado.
El presente trabajo fue hecho en el lenguaje de programacin Python para el clculo del
variograma y compositaciones.
VARIOGRAMA Y COMPOSITACIN EN PYTHON
UNIVERSIDAD NACIONAL DE INGENIERA
FACULTAD DE INGENIERA GEOLGICA, MINERA Y METALRGICA
GEOESTADSTICA I
OBJETIVOS
Analizar y discutir las diferencia al compartir datos.
Conocer el concepto, uso y funcionamiento del variograma.
Comparar diferentes variogramas obtenidos de una muestra en comn pero con
diferentes formas de agrupamiento.
Comprender la importancia y uso de las variables regionalizadas mediante el uso
del variograma.
VARIOGRAMA Y COMPOSITACIN EN PYTHON
UNIVERSIDAD NACIONAL DE INGENIERA
FACULTAD DE INGENIERA GEOLGICA, MINERA Y METALRGICA
GEOESTADSTICA I
FUNDAMENTO TEORICO
4.1
Geoestadistica
.
La Geoestadistica se define como el estudio de fenmenos regionalizados, es decir, que
se extienden en el espacio y presentan una cierta continuidad. Su inters primordial es la
estimacin, prediccin y simulacin de dichos fenmenos (Myers, 1987). Esta
herramienta ofrece una manera de describir la continuidad espacial, que es un rasgo
distintivo esencial de muchos fenmenos naturales, y proporciona adaptaciones de las
tcnicas clsicas de regresin para tomar ventajas de esta continuidad (Isaaks &
Srivastava, 1989). Petitgas (1996), la define como una aplicacin de la teora de
probabilidades a la estimacin estadstica de variables espaciales. La modelacin espacial
es la adicin ms reciente a la literatura estadstica. Geologa, ciencias del suelo,
agronoma, ingeniera forestal, astronoma, o cualquier disciplina que trabaja con datos
colectados en diferentes locaciones espaciales necesita desarrollar modelos que indiquen
cuando hay dependencia entre las medidas de los diferentes sitios. Usualmente dicha
modelacin concierne con la prediccin espacial, pero hay otras reas importantes como
la simulacin y el diseo muestral (Cressie, 1989). Cuando el objetivo es hacer prediccin,
la geoestadstica opera bsicamente en dos etapas. La primera es el anlisis estructural, en
la cual se describe la correlacin entre puntos en el espacio. En la segunda fase se hace
prediccin en sitios de la regin no muestreados por medio de la tcnica kriging. Este es
un proceso que calcula un promedio ponderado de las observaciones muestrales. Los
pesos asignados a los valores muestrales son apropiadamente determinados por la
estructura espacial de correlacin establecida en la primera etapa y por la configuracin
de muestreo (Petitgas, 1996).
VARIOGRAMA Y COMPOSITACIN EN PYTHON
UNIVERSIDAD NACIONAL DE INGENIERA
FACULTAD DE INGENIERA GEOLGICA, MINERA Y METALRGICA
GEOESTADSTICA I
4.2
Variograma
El teorema central del lmite, uno de los fundamentales en estadstica, estudia el
comportamiento de la suma de variables aleatorias, cuando crece el nmero de sumandos,
asegurando su convergencia hacia una distribucin normal en condiciones muy generales.
Este teorema, del cual existen diferentes versiones que se han ido desarrollando a lo largo
de la historia, tiene una gran aplicacin en inferencia estadstica, pues muchos parmetros
de diferentes distribuciones de probabilidad, como la media, pueden expresarse en funcin
de una suma de variables. Permite tambin aproximar muchas distribuciones de uso
frecuente: binomial, Poisson, chi cuadrado, t-student, gamma, etc., cuando sus parmetros
crecen y el clculo se hace. Por otro lado, la suma de variables aleatorias aparece en forma
natural en muchas aplicaciones de la ingeniera: determinacin de masa forestal, carga
soportada por una estructura, tiempo de espera de servicios, etc.
Todo ello explica por qu muchos mtodos estadsticos requieren la condicin de
normalidad para su correcta aplicacin y, en consecuencia, este teorema es un componente
importante de la formacin estadstica de los ingenieros. El teorema se apoya y relaciona
entre s con otros conceptos y procedimientos bsicos en estadstica, como los de variable
aleatoria y sus transformaciones, distribucin muestral, convergencia, tipificacin, clculo
de probabilidades, etc., algunos de los cuales podran plantear problemas de aprendizaje.
VARIOGRAMA Y COMPOSITACIN EN PYTHON
UNIVERSIDAD NACIONAL DE INGENIERA
FACULTAD DE INGENIERA GEOLGICA, MINERA Y METALRGICA
GEOESTADSTICA I
4.3
Variable regionalizada
Una variable medida en el espacio de forma que presente una estructura de correlacin, se
dice que es una variable regionalizada. De manera ms formal se puede definir como un
proceso estocstico con dominio contenido en un espacio euclidiano d-dimensional !" ,
{Z(x): x
!" }. Si d = 2, Z(x) puede asociarse a una variable medida en un punto
x del plano (Daz-Francs, 1993). En trminos prcticos Z(x) puede verse como una
medicin de una variable aleatoria (p.ej. concentracin de un contaminante) en un punto
x de una regin de estudio. Recurdese que un proceso estocstico es una coleccin de
variables aleatorias indexadas; esto es, para cada x en el conjunto de ndices D, Z(x) es
una variable aleatoria. En el caso de que las mediciones sean hechas en una superficie,
entonces Z(x) puede interpretarse como la variable aleatoria asociada a ese punto del plano
(x representa las coordenadas, planas o geogrficas, y Z la variable en cada una de ellas).
Estas variables 18 aleatorias pueden representar la magnitud de una variable ambiental
medida en un conjunto de coordenadas de la regin de estudio.
4.4
Histograma
Un histograma es una representacin grfica de una variable en forma de barras, donde la
superficie de cada barra es proporcional a la frecuencia de los valores representados. En
el eje vertical se representan las frecuencias, y en el eje horizontal los valores de las
variables, normalmente sealando las marcas de clase, es decir, la mitad del intervalo en
el que estn agrupados los datos.
As pues, podemos evidenciar comportamientos, observar el grado de homogeneidad,
acuerdo o concisin entre los valores de todas las partes que componen la poblacin o la
muestra, o, en contraposicin, poder observar el grado de variabilidad, y por ende, la
dispersin de todos los valores que toman las partes, tambin es posible no evidenciar
ninguna tendencia y obtener que cada miembro de la poblacin toma por su lado y
VARIOGRAMA Y COMPOSITACIN EN PYTHON
UNIVERSIDAD NACIONAL DE INGENIERA
FACULTAD DE INGENIERA GEOLGICA, MINERA Y METALRGICA
GEOESTADSTICA I
adquiere un valor de la caracterstica aleatoriamente sin mostrar ninguna preferencia o
tendencia, entre otras cosas
En general se utilizan para relacionar variables cuantitativas continuas, pero tambin se lo
suele usar para variables cuantitativas discretas, en cuyo caso es comn llamarlo diagrama
de frecuencias y sus barras estn separadas, esto es porque en el "x" ya no se representa
un espectro continuo de valores, sino valores cuantitativos especficos como ocurre en un
diagrama de barras cuando la caracterstica que se representa es cualitativa o categrica.
Su utilidad se hace ms evidente cuando se cuenta con un gran nmero de datos
cuantitativos y que se han agrupado en intervalos de clase. Como ejemplo se puede tomar
el puntaje obtenido en una prueba a un grupo de alumnos.
4.5
Python
Python es un lenguaje de programacin interpretado cuya filosofa hace hincapi en una
sintaxis que favorezca un cdigo legible.
Se trata de un lenguaje de programacin multiparadigma, ya que soporta orientacin a
objetos, programacin imperativa y, en menor medida, programacin funcional. Es un
lenguaje interpretado, usa tipado dinmico y es multiplataforma.
Es administrado por la Python Software Foundation. Posee una licencia de cdigo abierto,
denominada Python Software Foundation License,1 que es compatible con la Licencia
pblica general de GNU a partir de la versin 2.1.1, e incompatible en ciertas versiones
anteriores.
VARIOGRAMA Y COMPOSITACIN EN PYTHON
UNIVERSIDAD NACIONAL DE INGENIERA
FACULTAD DE INGENIERA GEOLGICA, MINERA Y METALRGICA
GEOESTADSTICA I
ANALISIS Y COMPARACION DE DATOS
Gran parte del presente trabajo fue realizado en el lenguaje de programcin Python en su
versin 2.7 con sistema operativo MAC OS X, no fue necesario usar otro tipo de
programas, mas si fue til un correcto uso de dicho lenguaje de programacin y un cdigo
limpio, el editor de texto usado fue PyCharm CE 2016.1.2 otro software libre.
5.1
Formulacin del problema
1) Se han generado 10,000 datos aleatorios con f.d.p. uniforme entre [a,b] donde a
representa mi edad 20 y b los dos ltimos dgitos del ao en que nac 95 , es
decir el intervalo vendra a ser [20,95].
2) Compositar de 20 en 20 los datos aleatorios, construir y graficar el histograma
y variograma correspondiente.
3)
a. Compositar de 20 en 20 compartiendo 5 datos
b. Compositar de 20 en 20 compartiendo 10 datos
c. Compositar de 20 en 20 compartiendo 15 datos
Construir y graficar el variograma e histograma correspondiente para cada caso
4) Conclusiones
VARIOGRAMA Y COMPOSITACIN EN PYTHON
UNIVERSIDAD NACIONAL DE INGENIERA
FACULTAD DE INGENIERA GEOLGICA, MINERA Y METALRGICA
GEOESTADSTICA I
5.2
Generacin de 10,000 datos aleatorios en el intervalo [20,95]
Para generar los datos aleatorios en dicho intervalo se ha tenido que importar una
librera adicional llamada random a la biblioteca de Python por defecto, hecho
esto se procede a generar los nmeros con el mdulo random.randit() de la
siguiente manera.
Notar que se ha declarado una lista l para guardar los datos correspondientes y
se ha calculado tambin el promedio de los datos aleatorios. Teniendo como salida:
VARIOGRAMA Y COMPOSITACIN EN PYTHON
10
UNIVERSIDAD NACIONAL DE INGENIERA
FACULTAD DE INGENIERA GEOLGICA, MINERA Y METALRGICA
GEOESTADSTICA I
5.3
Compositar de 20 en 20 y graficar el variograma e histograma
correspondiente.
Para la compositacin de 20 en 20 se define la lista comp y se usa el bucle for para la
sumatoria promedio de los nmeros aleatorios como se observa en la siguiente figura:
Para la grfica se puede ver que se ha aadido una librera llamada matplotlib.pylot
para graficar el histograma usando plt.his() y el para el variograma usando plt.plot().
Hecho esto nos da una salida de:
VARIOGRAMA Y COMPOSITACIN EN PYTHON
11
UNIVERSIDAD NACIONAL DE INGENIERA
FACULTAD DE INGENIERA GEOLGICA, MINERA Y METALRGICA
GEOESTADSTICA I
Donde el histograma de los compositos de 20 en 20 es:
El grfico del variograma de los compositos de 20 en 20 es:
5.4
Compositar de 20 en 20 compartiendo 5 y graficar el variograma e
histograma correspondiente.
De forma similar hallaremos las compositaciones compartiendo 5 datos, donde compar5
es la lista cuyos elementos son las compositaciones de 20 en 20 compartiendo 5 y
variograma5 es la lista cuyos elementos son la funcin variograma de compar5 como
se muestra a continuacin.
VARIOGRAMA Y COMPOSITACIN EN PYTHON
12
UNIVERSIDAD NACIONAL DE INGENIERA
FACULTAD DE INGENIERA GEOLGICA, MINERA Y METALRGICA
GEOESTADSTICA I
En donde la salida fue:
Donde el histograma de los compositos de 20 en 20 compartiendo 5 es:
VARIOGRAMA Y COMPOSITACIN EN PYTHON
13
UNIVERSIDAD NACIONAL DE INGENIERA
FACULTAD DE INGENIERA GEOLGICA, MINERA Y METALRGICA
GEOESTADSTICA I
El grfico del variograma de los compositos de 20 en 20 compartiendo 5 es:
5.5
Compositar de 20 en 20 compartiendo 10 y graficar el variograma e
histograma correspondiente.
Veamos cul es la diferencia al codificar el programa:
Donde compartiendo10 es la lista cuyos elementos son las compositaciones de 20 en 20
compartiendo 10 y variograma10 es la lista cuyos elementos son la funcin variograma
de compartiendo10.
VARIOGRAMA Y COMPOSITACIN EN PYTHON
14
UNIVERSIDAD NACIONAL DE INGENIERA
FACULTAD DE INGENIERA GEOLGICA, MINERA Y METALRGICA
GEOESTADSTICA I
La salida de es:
El histograma de los compositos de 20 en 20 compartiendo 10 es:
El grfico del variograma de los compositos de 20 en 20 compartiendo 10 es:
VARIOGRAMA Y COMPOSITACIN EN PYTHON
15
UNIVERSIDAD NACIONAL DE INGENIERA
FACULTAD DE INGENIERA GEOLGICA, MINERA Y METALRGICA
GEOESTADSTICA I
5.6
Compositar de 20 en 20 compartiendo 15 y graficar el variograma e
histograma correspondiente.
De la misma forma el cdigo para esta compositacin es el siguiente:
Donde compartiendo15 es la lista cuyos elementos son las compositaciones de 20 en 20
compartiendo 15 y variograma15 es la lista cuyos elementos son la funcin variograma
de compartiendo15.
La salida es:
VARIOGRAMA Y COMPOSITACIN EN PYTHON
16
UNIVERSIDAD NACIONAL DE INGENIERA
FACULTAD DE INGENIERA GEOLGICA, MINERA Y METALRGICA
GEOESTADSTICA I
El histograma de los compositos de 20 en 20 compartiendo 15 es:
El grfico del variograma de los compositos de 20 en 20 compartiendo 15 es:
VARIOGRAMA Y COMPOSITACIN EN PYTHON
17
UNIVERSIDAD NACIONAL DE INGENIERA
FACULTAD DE INGENIERA GEOLGICA, MINERA Y METALRGICA
GEOESTADSTICA I
Comparando Variogramas e Histogramas
Mostramos ahora las diferentes grficas de los histogramas.
Compartiendo 5
Compartiendo 10
Es claro notar que a medida que
compartimos ms datos la grfica
del histograma se apega cada vez
ms a la media, y existen mayor
cantidad de datos cercanos a la
media, y podemos decir que la
variabilidad disminuye.
Otra observacin es la tendencia de
la grfica a la campana de gauss,
manteniendo el rea bajo la curva
constante.
Compartiendo 15
VARIOGRAMA Y COMPOSITACIN EN PYTHON
18
UNIVERSIDAD NACIONAL DE INGENIERA
FACULTAD DE INGENIERA GEOLGICA, MINERA Y METALRGICA
GEOESTADSTICA I
19
Ahora comparamos los grficos de los variogramas
Compartiendo 5
Compartiendo 10
Compartiendo 15
Dado que el variograma permite conocer el
alcance, es decir, la distancia mxima a la
que una muestra tiene influencia sobre otra
muestra, es nuestro caso para nmeros
aleatorios es fcil darse cuenta la grfica de
stos ya que se encuentran tambin en orden
aleatorio mas no en orden ascendente ni
descendente lo cual nos dara una parbola.
Tambin podemos afirmar que a medida que
la cantidad de datos tiene a ser infinito, el
variograma tiende a 2.
VARIOGRAMA Y COMPOSITACIN EN PYTHON
UNIVERSIDAD NACIONAL DE INGENIERA
FACULTAD DE INGENIERA GEOLGICA, MINERA Y METALRGICA
GEOESTADSTICA I
CONCLUSIONES
La comparticin de datos al hacer los compsitos guarda un comportamiento
similar a cuando nosotros aumentamos la cantidad de compsitos , es decir la
variabilidad disminuye a medida que compartimos ms datos y eso se ve reflejado
en la grfica de los histogramas.
Podemos darnos cuenta que la media de los datos se mantiene prcticamente
constante ya que es un estimador insesgado, sin embargo, no ocurre lo mismo con
la desviacin estndar ni con la varianza.
De los datos agrupados, se puede concluir que a mayor cantidad de datos
compartidos existe una mayor influencia del primer dato sobre los dems, en el
caso en el que se compartieron 15 datos se encontr que la primera muestra puede
influye en las siguientes muestras. Mientras que en los grupos que compartan solo
5 elementos se encontr que el primer elemento tena poco a casi ninguna
influencia sobre las dems muestras.
El variograma de nuevo es til para realizar clculos en una poblacin donde cada
elemento tiene una posicin definida en el espacio vectorial, permitindonos de
sta forma darnos una herramienta para conocer el alcance de las muestras y poder
realizar una estimacin adecuada
La grfica de los histogramas refleja el claro comportamiento de la campana de
gauss y la distribucin normal.
VARIOGRAMA Y COMPOSITACIN EN PYTHON
20
UNIVERSIDAD NACIONAL DE INGENIERA
FACULTAD DE INGENIERA GEOLGICA, MINERA Y METALRGICA
GEOESTADSTICA I
BIBLIOGRAFIA
http://cg.ensmp.fr/bibliotheque/public/MATHERON_Ouvrage_00537.pdf
http://www.uoc.edu/in3/emath/docs/Distrib_Normal.pdf
http://geoestadistica.com/geoestadistica_conceptos.htm
http://www.glossary.oilfield.slb.com/es/Terms/v/variogram.aspx
http://python.swaroopch.com/preface.html
http://www.docentes.unal.edu.co/rgiraldoh/docs/LIBRO%20DE%20GEOESTADISTICA..pdf
https://es.wikipedia.org/wiki/Distribucin_normal
VARIOGRAMA Y COMPOSITACIN EN PYTHON
21