0% encontró este documento útil (0 votos)
51 vistas12 páginas

Homework - Statistics

Cargado por

Gregory Sandoya
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
51 vistas12 páginas

Homework - Statistics

Cargado por

Gregory Sandoya
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Guidelines Homework 1, Hydrology, 1PAO2024

Hydrological Statistics (17 pts)


Student: Gregory Sandoya
Tasks
1. use the attached datafile of annual instantaneous maximal discharges in the assigned river
(see the attached Excel table“Homework 1 Data“). Make a histogram, using a rule for the
number of bins 3pt
Primero ordenamos los datos de la muestra.

Yanahurco
Station DJ Valle
H0722
Year Discharges
1995 3.6
2003 7.7
2012 11.3
1996 13.2
1994 14.4
2005 15.4
1997 17.5
2009 19.5
1999 21.5
2002 21.5
2013 23.6
2008 27.5
2006 28.0
2007 35.0
2011 35.5
2001 41.7
2000 48.7
2004 52.5
1998 53.4
2010 -
2015 -

Segundo, utilizando la regla de Sturges calculamos el número de clases ideal para la muestra.
𝐾 = 1 + log 2 𝑛
Donde 𝑛 es el número de datos para este caso, 𝑛 = 19.
Por lo que tenemos que para la muestra se necesitan 5 clases
REGLA DE STURGES
5
Calculamos el máximo y el mínimo para sacar el ancho de clase y con ello definir los
intervalos.

𝐴𝑛𝑐ℎ𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 = (𝑀á𝑥 − 𝑀í𝑛)/𝐾

MÁXIMO
53.4
MÍNIMO
3.6
ANCHO DE CLASE
10.0

Agrupamos los datos:

Clase Frecuencia
[3.6 - 13.6) 4
[13.6 - 23.5) 6
[23.5 - 33.5) 3
[33.5 - 43.4) 3
[43.4 - 53.4) 3

Finalmente, hacemos el histograma.

HISTOGRAM
7
6
6

5
4
4
3 3 3
3

0
[3.6 - 13.6) [13.6 - 23.5) [23.5 - 33.5) [33.5 - 43.4) [43.4 - 53.4)

2. plot the observed and theoretical discharges, using the probabilistic papers of Gumbel
and lognormal distribution (=assign theoretical probabilities of Hazen or Weibull etc, and
draw the theoretical straight line) 6pt
GUMBEL DISTRIBUTION
Para calculalar la probabilidad teorica de Gumbel se usa la siguiente formula:
(𝑥−𝑢)

−𝑒 𝛼
𝐹(𝑥) = 𝑒
De la cual se sabe que:
x = Caudal a evaluar
𝑢 = 𝑥̅ − 𝑢𝑦 𝛼 ; Donde 𝑥̅ = 𝑚𝑒𝑑𝑖𝑎 𝑑𝑒 𝐶𝑎𝑢𝑑𝑎𝑙𝑒𝑠
𝑆
𝛼 = 𝜎𝑥 ; Donde 𝑆𝑥 = 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 𝑑𝑒 𝑙𝑜𝑠 𝐶𝑎𝑢𝑑𝑎𝑙𝑒𝑠
𝑦

Los valores de 𝜎𝑦 𝑦 𝑢𝑦 se obtienen mediante la siguiente tabla, al tener 19 datos, podemos usar los
valores de 20, ya que estos no tienen una variacion considerable:

Por lo tanto, 𝜎𝑦 = 1.0628 ; 𝑢𝑦 = 0.5236

Para los Caudales Teoricos se usa la inversa de la formula de Gumbel:


𝑥 = − ln(− ln(𝐹(𝑥))) ∗ 𝛼 + 𝑢

Ejemplo usando las ecuaciones antes mostrada de los calculos realizados


Para los calculos de promedio se uso la formula:
∑𝑁
𝑖=1 𝑥𝑖
𝑥̅ = = 25,87
𝑁

Donde N es nuestro numero de datos (19), y xi cada caudal dado.


Para la desviacion estandar se uso la siguiente formula:
∑𝑁
𝑖=1(𝑥𝑖 − 𝑥̅ )
2
𝑠𝑥 = √ = 14,93
𝑁−1

Con estos valores obtenidos se calcula los siguientes valores:


𝑆𝑥
𝛼= = 14,05
𝜎𝑦

𝑢 = 𝑥̅ − 𝑢𝑦 𝛼 = 25,87

Con estos valores obtenidos podemos hacer uso de las fórmulas, estas usadas para el primer caudal
de x = 3,6 :

(𝑥−𝑢)

−𝑒 𝛼
𝐹(𝑥) = 𝑒 = 0,01

𝑥 = − ln(− ln(𝐹(𝑥))) ∗ 𝛼 + 𝑢 = 7,72

Y se repite el proceso para el resto de caudales, obteniendo la siguiente tabla y graficas:

Tabla 1 GUMBEL DISTRIBUTION

Q Prob.
Posicion ordenado Prob. Hazen Gumbel Q teorico Superar
1,0 3,6 0,0263 0,01 7,72 0,99
2,0 7,7 0,0789 0,03 12,78 0,97
3,0 11,3 0,1316 0,06 15,93 0,94
4,0 13,2 0,1842 0,09 18,48 0,91
5,0 14,4 0,2368 0,10 20,74 0,90
6,0 15,4 0,2895 0,12 22,85 0,88
7,0 17,5 0,3421 0,16 24,88 0,84
8,0 19,5 0,3947 0,21 26,90 0,79
9,0 21,5 0,4474 0,26 28,93 0,74
10,0 21,5 0,5000 0,26 31,02 0,74
11,0 23,6 0,5526 0,31 33,21 0,69
12,0 27,5 0,6053 0,41 35,55 0,59
13,0 28,0 0,6579 0,42 38,10 0,58
14,0 35,0 0,7105 0,59 40,96 0,41
15,0 35,5 0,7632 0,60 44,25 0,40
16,0 41,7 0,8158 0,72 48,23 0,28
17,0 48,7 0,8684 0,82 53,39 0,18
18,0 52,5 0,9211 0,86 60,97 0,14
19,0 53,4 0,9737 0,87 76,80 0,13
20,0 - 1,0263 - - -
21,0 - 1,0789 - - -
22,0 - 1,1316 - - -
CAUDALES OBSERVADOS VS TEORICOS
9,0
8,0
7,0
6,0
5,0
OBSERVADOS
4,0
TEORICOS
3,0
2,0
1,0
0,0
0,0000 0,0000 0,0000 0,0001 0,0001 0,0001 0,0001

Gráfico 1 Obs vs Teo GUMBEL

Log Normal Distribution


Primero se convierten todos los datos de la data base en Ln(x).
Luego se calcula el promedio de este conjunto de datos usando la formula:
∑𝑁
𝑖=1 𝑥𝑖
𝑥̅ = = 25,87
𝑁
Y la desviacion estandar:

∑𝑁
𝑖=1(𝑥𝑖 − 𝑥̅ )
2
𝑠𝑥 = √ = 14,93
𝑁−1

Luego de esto hacemos uso de la formula de la distribucion normal para encontrar los valores los
valores Z log-normal:
ln (𝑥) − 𝑥̅
𝑍=
𝑠𝑥

O al usar la herramienta de calculo de excel se pueden usar las funciones que vienen
incluidas, para este caso se uso la formula: [Link]()
Para el calculo de los valores teoricos del caudal se despeja la formula de Z log-normal
despejando x, la cual es el caudal que buscamos:
𝑥 = 𝑒 𝑧∗𝑠𝑥 + ̅𝑥
Reemplazando toso estos valores y formulas en excel, se pueden obtener la siguiente tabla y
grafico:
Tabla 2 Tabla Log Normal Distribution

Q Z LOG CAUDAL
Posicion ordenado Prob. Hazen LN Q NORMAL TEO
1,0 3,6 0,0263 1,3 -1,94 5,62
2,0 7,7 0,0789 2,0 -1,41 8,07
3,0 11,3 0,1316 2,4 -1,12 9,88
4,0 13,2 0,1842 2,6 -0,90 11,50
5,0 14,4 0,2368 2,7 -0,72 13,04
6,0 15,4 0,2895 2,7 -0,55 14,58
7,0 17,5 0,3421 2,9 -0,41 16,15
8,0 19,5 0,3947 3,0 -0,27 17,79
9,0 21,5 0,4474 3,1 -0,13 19,52
10,0 21,5 0,5000 3,1 0,00 21,38
11,0 23,6 0,5526 3,2 0,13 23,43
12,0 27,5 0,6053 3,3 0,27 25,71
13,0 28,0 0,6579 3,3 0,41 28,31
14,0 35,0 0,7105 3,6 0,55 31,35
15,0 35,5 0,7632 3,6 0,72 35,05
16,0 41,7 0,8158 3,7 0,90 39,77
17,0 48,7 0,8684 3,9 1,12 46,27
18,0 52,5 0,9211 4,0 1,41 56,64
19,0 53,4 0,9737 4,0 1,94 81,40
20,0 - - - - -
21,0 - - - - -
22,0 - - - - -

CAUDALES OBSERVADOS VS TEORICOS


9,0
8,0
7,0
6,0
5,0
OBSERVADOS
4,0
TEORICOS
3,0
2,0
1,0
0,0
0,0000 0,0000 0,0000 0,0001 0,0001 0,0001 0,0001

Gráfico 2 Caudales Obs vs Teo Log Normal


3. make a table of maximum instantaneous discharges in the assigned river for the return
period of 10, 25, and 50 years, using:
Gumbel distribution
Para calcular los caudales esperados estos periodos de retorno para esta distribucion hay
que recordar las formulas y valores ya mencionados en la pregunta anterior que son:
(𝑥−𝑢)

−𝑒 𝛼
𝐹(𝑥) = 𝑒
𝑢 = 𝑥̅ − 𝑢𝑦 𝛼 ; Donde 𝑥̅ = 𝑚𝑒𝑑𝑖𝑎 𝑑𝑒 𝐶𝑎𝑢𝑑𝑎𝑙𝑒𝑠
𝑆
𝛼 = 𝜎𝑥 ; Donde 𝑆𝑥 = 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 𝑑𝑒 𝑙𝑜𝑠 𝐶𝑎𝑢𝑑𝑎𝑙𝑒𝑠
𝑦

𝜎𝑦 = 1.0628 ; 𝑢𝑦 = 0.5236

𝑥 = − ln(− ln(𝐹(𝑥))) ∗ 𝛼 + 𝑢

Donde en este caso la funcion F(x), sera reemplaza por la siguiente ecuacion:
𝟏
𝐏=𝟏−
𝐓
En la cual T sigifica el periodo de retorno para la cual sera evaluada, los cuales seran 10, 25 y
50 respectivamente.
𝟏
𝑥 = − ln (− ln (𝟏 − )) ∗ 14,05 + 25,87 = 50,3
𝟏𝟎
Y de esta manera para obtener en los 3 periodos de retorno.

10 25 50
GUMBEL 50,3 63,7 73,7

LogNormal distribution
En la distribucion Log Normal, usaremos la formula:
𝑥𝑇 = 𝑥̅ + 𝐾𝑇 ∗ 𝑠𝑥
Donde usaremos un sesgo de 0, ya que hablamos de una distribucion normal.

Para esta dsitribucion es necesario pasar todos los datos a Log(X), donde se usara un logaritmo de
base 10 de cada caudal.

Luego de estos nuevos datos se obtendra el promedio y desviacion estandar con las formulas
mencionadas anteriormente.
El valor 𝐾𝑇 conocido como Factor de Frecencia se lo encontrara en la tabla Kt valores de Pearson
Tipo III, en este caso se usara sesgo 0 y los 3 periodos de frecuencia mencionados.

Se realizan los calculos para cada periodo correspondiente, se resuelve para el periodo de retorno de
10 años:

𝑥𝑇 = 1,33 + 1,282 ∗ 0.30 = 1,714


Este valor es el Log(x) del caudal que deseamos por lo tanto despejamos x, que es nuestro caudal
deseado.
𝑥 = 𝑒𝑥𝑇 = 51,77

Se repite este proceso para los otros 2 periodos.


LogPearson III distribution
Se realiza el mismo proceso como para la distribución de Log Normal, sin embargo para este caso es
necesario calcular el sesgo, o coeficiente de asimetria:

𝑛 ∗ ∑𝑁
𝑖=1(𝑥𝑖 − 𝑥̅ )
3
𝐶=
(𝑁 − 1)(𝑁 − 2)(𝑠 3 )
Donde para nuestros datos (tambien convertidos con Log(x) ), nuestro coeficiente es de -0.85.

Por fines practicos se obtienen los valores de la tabla de Person tipo III, los valores con un coeficiente
de asimetria de -0.8 y – 0.9 y se los promedia para poder utilizarlos:

Al aplicar la formula de la distribucion se obtiene que para un periodo de retorno de 10 años:


1,166 + 1,147
𝑥𝑇 = 1,33 + ∗ 0.30 = 1,677
2
Se obtiene el valor del caudal:

𝑥 = 𝑒𝑥𝑇 = 47,48
Se repite este proceso para los otros 2 periodos.

Hasta el momento se tiene una tabla con los siguientes valores.

10 25 50
GUMBEL 50,3 63,7 73,7
LOG NORMAL 51,77 71,55 88,18
LogPearson III 47,48 57,24 63,48

Pearson III distribution


La distribución Pearson III utilizaremos la siguiente fórmula:

𝑥𝑇 = 𝐾𝑇 ∗ 𝛼 ∗ √𝛽 + 𝛼 ∗ 𝛽 + 𝜃
Por ello necesitamos tener el valor de la media y la desviación estándar de la muestra, 𝑥̅ =
25,9 𝑦 𝑠𝑥 = 14,93. Además con un coeficiente de asimetría 𝐺𝑥 = 0,586.

𝑠𝑥 2
𝛼=√ = 4,3776
𝛽

2
2
𝛽 = ( ) = 11,6387
𝐺𝑥

𝜃 = 𝑥̅ − √𝑠𝑥 2 𝛽 = −25,0815

Donde:

2 𝛾 𝛾 3
𝐾𝑇 = {[ (𝑍𝑇 − ) + 1] − 1}
𝛾 6 6

1
𝑍𝑇 = 𝐷𝐼𝑆𝑇𝑅. 𝑁𝑂𝑅𝑀. 𝐸𝑆𝑇𝐴𝑁𝐷. 𝐼𝑁𝑉 (1 − (𝑇𝑖𝑒𝑚𝑝𝑜 𝑑𝑒 𝑟𝑒𝑡𝑜𝑟𝑛𝑜))

2
𝛾= = 0,5862
√𝛽
Finalmente tenemos los siguientes valores de caudales para los tiempos de retorno para 10,
25 y 50 años.

10 25 50
PEARSON III 45,7 54,8 61,0

Gauss distribution
La distribución de Gauss usaremos la siguiente ecuación:

𝑥𝑇 = 𝑍 ∗ 𝑠𝑥 + 𝑥̅
Donde Z es la puntuación estándar de una distribucion normal, 𝑥̅ = 25,9 𝑦 𝑠𝑥 = 14,93.

Para calcular la puntuación estándar (Z) utilizaremos la siguiente ecuación:


1
𝑃 = 1−( )
𝑇𝑖𝑒𝑚𝑝𝑜 𝑑𝑒 𝑟𝑒𝑡𝑜𝑟𝑛𝑜

1
𝑍 = 𝐷𝐼𝑆𝑇𝑅. 𝑁𝑂𝑅𝑀. 𝐸𝑆𝑇𝐴𝑁𝐷. 𝐼𝑁𝑉 (1 − ( ))
𝑇𝑖𝑒𝑚𝑝𝑜 𝑑𝑒 𝑟𝑒𝑡𝑜𝑟𝑛𝑜

Por tanto, obtenemos los siguientes valores.

RETURN PERIOD 𝑃 𝑍 𝑥𝑇
10 0.9 1.28 45,0
25 0.96 1.75 52,0
50 0.98 2.05 56,5

Además, observamos el comportamiento de la muestra mediante la gráfica.

GAUSS
2.5
2
1.5
Puntuación Estándar (Z)

1
0.5
0 teóricos
11.3

15.4

21.5

27.5
3.6
7.7

13.2
14.4

17.5
19.5

21.5
23.6

28.0
35.0
35.5
41.7
48.7
52.5
53.4

-0.5 Observados
-1
-1.5
-2
-2.5
Caudales (Q)
4. Comment the similarities and differences in the results. Is there a difference in the Qmax
between the symmetric distribution and the asymmetric distribution? Does the skew
decrease with the transformation of the original values to their logarithms?Other
comments. 3pt
Hasta el momento se tiene una tabla con los siguientes valores.

10 25 50
GUMBEL 50,3 63,7 73,7
LOG NORMAL 51,77 71,55 88,18
LogPearson III 47,48 57,24 63,48
Pearson III 45,7 54,8 61,0
Gauss 45,0 52,0 56,5

• Los valores de caudal obtenidos utilizando las distribuciones de Pearson III y Gauss para
periodo de retorno de 10 años difiere muy poco entre sí.
• Los caudales obtenidos por los valores originales de la distribución Pearson III difieren en 2
unidades aproximadamente con respecto a su logaritmo.
• Al llevar los caudales originales utilizando la distribución Normal de Gauss al logaritmo,
observamos que disminuyó el sesgo que existía en el conjunto de datos pero también
aumentó el error que habrá mientras mayor sea el tiempo de retorno.
• Notamos una diferencia notable entre los valores obtenidos por distribuciones simétricas en
comparación con las asímetricas
• Los caudales para el tiempo de 10 años oscila en un rango entre 45 y 52, en cambio mientras
más aumenta el tiempo de retorno los valores del caudal se alejan entre sí, teniendo que
para 50 años el rango en el que se encuentran los caudales esta entre 56 y 89.

También podría gustarte