1
FACULTA DE INGENIERA
CARRERA DE INGENIERI CIVIL
TEMA: ANALISIS DE PRECIPITACIONES – PARA MODELO PREDICTIVO
DE LLUVIAS.
CURSO: HIDROLOGIA GENERAL
DOCENTE: ING. AMILCAR ORESTEDES ESCOBEDO GUEVARA
ESTUDIANTES:
ALLCCARIMA QUISOE, Yuler Marcial – N00236362
BONIFACIO HUALLULLO, Stiven – N00305896
CUEVA RAMIREZ, Aldo – N00247407
HAUXWELL OCMIN, Guillermo – N00247400
TORRES CAMPOS, Leonardo Percy – N00247405
Lima, 20 de Junio del 2023
2
INDICE
RESUMEN..........................................................................................................................3
INTRODUCCION...............................................................................................................4
METODOLOGIA................................................................................................................5
TIPOS DE DISTRIBUCIÓN...........................................................................................9
Distribución Log Normal.............................................................................................9
Distribución Pearson lll..............................................................................................10
Distribución Log Pearson III......................................................................................10
Distribución de Gumbel.............................................................................................10
Distribución Log Gumbel...........................................................................................11
RESULTADOS Y DISCUSION.......................................................................................13
CONCLUSIONES.............................................................................................................17
REFERENCIAS BIBLIOGRAFICAS..............................................................................19
3
RESUMEN
Dado el alto consumo de recursos y el manejo deficiente del agua, es un tema
candente, la falta de organización y conservación del agua que ha llevado a altas tasas de
déficit durante las sequías, aumento de las temporadas de lluvias y erosión. A medida que
aumenta el agua, es fundamental una mejor gestión del recurso.
El propósito del proyecto es crear un modelo de predicción de lluvias a partir del
análisis estadístico de datos históricos de lluvias ocurridas a partir de la estación páramo
de guerrero a fin de establecer un modelo matemático que permita generar una expresión
con un ajuste adecuado a los datos y con este proceso proyectar a futuro con cierto grado
de precisión los resultados probables de precipitación; Estas mediciones se podrán hacer
en proyectos o sitios existentes e incluso contrastar con los datos reportados de lluvias por
los instrumentos destinados para tal fin en la zona de estudio con el ideal de verificar el
grado de precisión del modelo.
4
INTRODUCCION
El disección de los datos climatológicos cada plazo tiene más trascendencia
para que a partir de la conducta de las variables relacionadas entre el espacio y las
actividades humanas a extinción de digerir eventos como las precipitaciones, por ende
librarse las consecuencias que pueden trasladar las crecientes súbitas de los cauces y de
esta manera, (Bazzamo, 2019) al proceder el disección de datos de estaciones en
períodos prolongados se puede razonar la simpatía al incremento en los fenómenos como
la velocidad intensa lo cual presume un maduro contingencia de pomposidad a las rondas
hídricas ocupadas desafortunadamente por asentamientos humanos.
Donde emplean eficientemente el manejo de datos a través de la gestión adecuada
del manifiesto por fragmento de los investigadores y permite un maduro ajuste con el
séquito y tratado de los datos, el quebradero de cabeza de la transformación en el interior
de naciente producto fue la legislatura de linchamiento del muestreo.
Partiendo de naciente menor disección es optimista en todo trabajo de manifiesto
que los datos recopilados tengan un legislatura oportuna de reconocimiento porque de
lejos depende la determinación de los resultados obtenidos en la transformación de los
mismos, en la eventualidad de datos climatológicos como las precipitaciones o caudales
los tiempos de reconocimiento de los datos dependen de la continuidad misma de los
equipos y sitios de graduación de esta manera por paradigma emplean series de datos de
caudales del río Haihe entre los primaveras 1960 a 1990 y de lejos logran identificar un
desnivel en los niveles del río causado por actividades humanas en su rivera y aún
influenciado por el cambio climático.
5
METODOLOGIA
En el estudio desarrollado se obtuvieron muestras de datos del laboratorio,
meteorológico y medio ambiente del observatorio de Paramo de guerrero, de las cuales
obtuvieron un máximo de 24 horas desde el 2005 hasta 2021. Contiene registros de
precipitación. Utilizamos muestras de datos continuos generados durante 17 años de
medición. Una vez definidas las estaciones de medida, encontramos un total de 6117
datos correspondientes desde enero del 2005 hasta septiembre de 2021. Para los datos de
precipitación diaria se procede a definir las precipitaciones máximas por cada mes y
luego por cada año para así reducir la muestra inicial a solo 17 valores correspondientes a
los datos de precipitaciones máximas mensuales en 24 horas anuales.
Una vez hecho este proceso se definen parámetros como la media, desviación
estándar y varianza, es allí donde se evidencia la presencia de valores con desviaciones de
la media muy grandes lo que indica posibles errores en la medición, a fin de hacer este
manejo adecuadamente (Chow, et al., 1994) recomienda el método del Water Resources
Council para los datos dudosos como se muestra:
Donde es el valor
del umbral máximo de los datos dados en la muestra y por ende es el valor del umbral
mínimo, es el valor de la media muestral, corresponde al dato constante del método
relacionado con la cantidad de valores dentro de la muestra y se usan en pruebas para
detectar datos dudosos en el 10% de significancia en información normalmente
6
distribuida y corresponde a la desviación estándar, tanto el valor de como el de con los
exponentes correspondientes a una base 10 y con la expresión se define el valor máximo
y mínimo de la muestra así
Posterior a este proceso y una vez determinados los valores a trabajar dentro de la
muestra para cada uno de los 17 años de registros, es necesario verificar los ajustes de
distribuciones de probabilidad por diferentes funciones y hacer pruebas de bondad de
ajuste de los datos, así como Gálvez-Nieto, et al. (2017) (SD = 1.83, se emplean en sus
estudios la bondad de ajuste de Chi cuadrado mediante la expresión.
Donde m es el número de intervalos, es el valor de la frecuencia relativa en el
intervalo i, es el valor teórico esperado y para determinar la bondad de ajuste es necesario
definir la sumatoria de estas relaciones en cada uno de los intervalos a los cuales se
ajustan los datos, esta cantidad de intervalos en los que se debe repartir la muestra se
define mediante la expresión.
Donde NC es el número de intervalos y N es la cantidad de datos muestrales.
7
Para la validez de la prueba de Chi cuadrado es necesario que se contraste y
verifique con los grados de libertad (y el nivel de confianza mediante la expresión.
m es el número de intervalos, p es el número de parámetros empleados en la
distribución y es el nivel de significancia donde generalmente se adopta como el 5% si se
desea tener un grado alto de ajuste de los datos o valores porcentuales mayores acorde a
las necesidades de cada estudio.
Otra prueba de bondad de ajuste empleada extensamente es la de Kolmogorov –
Smirnov usada por Khrueasom & Pongpullponsak (2017)h, L, k; y Vargas, et al. (2019),
a fin de establecer un mejor control en los procesos de mantenimientos y fabricación para
la reducción de costos productivos, esta prueba de ajustes en los datos se define a partir
de la hipótesis de validez que se plantea desde la diferencia absoluta entre la probabilidad
de ocurrencia del dato medido F0 (xm ) y la probabilidad esperada F (xm ) acorde a la
distribución de probabilidad elegida mediante la siguiente expresión
Para valorar entonces el nivel de ajuste es necesario también definir como en la
prueba de bondad de ajuste de chi cuadrado el nivel de confianza esperado en la muestra
y claramente determinar a su vez el número de intervalos, con este dato se establece con
la siguiente tabla el valor a tomar como dato crítico (Figura 1):
8
Figura 1. Valores críticos usados en la valoración de la bondad de ajuste de
Kolmogorov – Smirnov. Manual de drenaje para carreteras.
Con la representación anterior se establece el valor crítico y se compara con el
valor de S Calculado, si S<C el ajuste de este método es correcto, de ser de diferente
manera se rechaza el ajuste de los datos a la distribución ensayada.
Complementando lo anteriormente mencionado las distribuciones de probabilidad
que se pueden emplear en estudios de este tipo son Normal, Log Normal, Pearson lll, Log
Pearson lll, Gumbel y Log Gumbel como se describen a continuación:
Su uso está dado ampliamente en la literatura con diferentes aplicaciones a
variables continuas donde se permite evidenciar el comportamiento de dichas variables
hacia
9
una zona central y observar a los valores ubicarse allí y son simétricos a partir del
valor medio tal como es analizado por Aljohani (2022), donde se valora la percepción del
ruido y su comportamiento en forma de ondas y como la percepción del ruido se ajusta a
dicha distribución en forma de campana concéntrica y que hacia sus laterales es simétrica
y desciende de forma curva y emplea la expresión en su forma general
TIPOS DE DISTRIBUCIÓN
Distribución Log Normal
Esta distribución es la que más se presenta en fenómenos de la naturaleza según
Andersson, (2021) debido al ajuste adecuado para simular las condiciones de diferentes
fenómenos en la naturaleza y su comportamiento, tal como las emisiones de CO2 y como
pueden variar por su concentración en la atmósfera con la influencia de otros fenómenos,
la modelación de dicha distribución de probabilidad se emplea la expresión
10
Distribución Pearson lll
También conocida como gamma de tres parámetros es una función empleada para
describir variables asimétricas sin el uso de una transformación logarítmica y, como lo
describe Muñoz (2014), la distribución gamma debe su nombre a la función del mismo
nombre y además se relaciona con la distribución de Poisson dentro de la expresión
Distribución Log Pearson III
Así como la distribución log normal, la distribución log Pearson lo que hace es
relacionar los datos al sacarle el logaritmo para mejorar la tendencia de los mismos, la
expresión general de dicha distribución es.
Distribución de Gumbel
Esta distribución también tiene una forma curvada de forma asimétrica y es
empleada comúnmente para caracterizar fenómenos naturales como lo establecen Wang,
11
et al. (2021), al identificar el comportamiento de las tormentas que afectan a la zona de la
península de Shandong en china y el cual se ajusta adecuadamente a dicha distribución,
se modela con la siguiente ecuación.
Distribución Log Gumbel
Tal como las expresiones previas, lo que se busca con una distribución log gumbel
es generar un mejor ajuste de los datos aplicando el logaritmo a los mismos para mejorar
su comportamiento hacia la distribución de probabilidad y se establece de la siguiente
manera
Una vez verificado el ajuste de los datos se procede a determinar la curva
intensidad – duración – frecuencia con la metodología empleada por Pérez Rodríguez
(2019), donde se aplica una forma simple y de forma sintética la obtención de una
ecuación con la cual se predice las posibles lluvias que puedan ocurrir con diferentes
períodos de retorno mediante la expresión
12
Donde:
I = intensidad de la lluvia o precipitación de diseño
a, b, c y d son los coeficientes determinados por Díaz & Vargas (1998), para cada
región en Colombia
T= período de retorno de las lluvias bajo recomendación de diseño.
M = valor máximo anual de precipitación diaria
t= duración de la lluvia en tiempo de concentración
Así como existe esta expresión para Colombia existen muchas más expresiones
como las mencionadas por Hadi Mahdi (2020)rainfall intensity-duration-frequency (IDF;
tales como la expresión de Talbot, Bernard, Sherman y Kimijima donde por medio de
métodos de regresiones y con la cantidad de datos suficientes se pueden hacer los
estimativos de sus parámetros de ajustes y como lo definió en su estudio se pueden
aproximar cada una de las expresiones según el ajuste de probabilidad y generar
comparaciones entre sí, cada expresión y cada ajuste otorga parámetros diferentes acorde
al registro de datos y a la cantidad de los mismos.
RESULTADOS Y DISCUSION
Para la estación denominada “Páramo de Guerrero” ubicada en el municipio de
Zipaquirá, Cundinamarca, Colombia se procede a desarrollar el análisis de datos que
según el Instituto de Hidrología, Meteorología y estudios ambientales (2018), en
13
Colombia, en las estaciones las mediciones de precipitaciones son establecidas de manera
continua a través de pluviómetros y pluviográfos, en el presente desarrollo se toman los
datos de precipitaciones máximas en 24 horas durante un período de 17años, de estos
6117 datos se empiezan a definir características de distribución de los datos como se
muestra:
Figura 2. Valores de precipitaciones máximas diarias anuales sin procesar.
De la figura 2 se puede observar que el dato inicial en la medición como valor
máximo de precipitación en el año 2005 es de 227.8 mm, dentro de la muestra se tiene
también un valor medio de 44.435 mm lo cual evidencia a este dato con alta variación del
valor medio, esto se refleja en la varianza al tener un valor de2275.289 con una
desviación estándar de 47.69 mm, ese dato corresponde al primer año y primer mes de
operación de la estación del año y se encuentra por encima del valor máximo de
precipitación estimado para el umbral superior dado por la expresión:
P max = 10yH = 102.0758 = 119.06 mm
Con este valor de precipitación máxima esperada dentro de la muestra se procede
a retirar la lluvia que se encuentre por encima de este valor y se recalculan los valores
demedia, varianza y desviación estándar hasta el momento en el cual los datos ajustados
posteriores a la eliminación de cada dato estén por debajo del umbral máximo, es decir,
se hace un reprocesamiento cada vez que se retira un valor dudoso y a consecuencia de
esto cambia la media, la varianza y la desviación estándar de los datos, en este caso
14
puntual se retiraron 25 datos los cuales se encontraban por encima del umbral máximo y
se debió de hacer esa misma cantidad de veces el proceso para lograr definir un umbral
máximo final P max de 57,1 mm de precipitación, con media de los datos de 34,14 mm,
una varianza de 65.65 y una desviación estándar de 8.1 mm, resultado de este ajuste y
manipulación de los datos se obtiene la figura 3:
Figura 3. Valores de precipitaciones máximas diarias anuales ajustados.
Dentro de la aplicación de la bondad de ajuste por medio de Kolmogorov –
Smirnov se hacen ajustes a distribuciones de probabilidad Normal, Log Normal, Pearson
lll, Log Pearson lll, Gumbel y Log Gumbel a fin de verificar con dichas distribuciones de
probabilidad el mejor ajuste posible a los datos medidos en la estación objeto de análisis,
este proceso se hace mediante herramienta de Excel y los resultados se resumen en la
siguiente tabla:
15
Figura 4. Validación gráfica de la bondad de ajuste de los datos por las 6
funciones de distribución de probabilidad.
De la figura 4 se puede inferir que cada una de las funciones de probabilidad
analizadas tienen un ajuste adecuado hacia la tendencia de los datos al tener todo un valor
de ajuste adecuado al satisfacer la condición de confianza en el ajuste de los datos cuyo
valor debe ser siempre menor a 0.318, este valor no es superado en ninguna de las
distribuciones analizadas así que la hipótesis de ajuste es válida para todas.
En la determinación de la curva de intensidad – duración– frecuencia sintética se
parte desde el proceso mencionado previamente y al tomar los valores de las constantes a,
b, c y d se obtiene la expresión final:
Con esta expresión definida se procede a determinar con diferentes períodos de
retorno sus correspondientes duraciones de lluvias y las intensidades calculadas para la
estación de Páramo de Guerrero (figura 5):
16
Figura 5. Curvas de intensidad – duración – frecuencia para diferentes períodos
de retorno en años, duraciones de lluvia en minutos e intensidades de lluvia en mm/h.
Como resultado de este proceso de análisis de datos se obtienen tanto la expresión
propia de la estación analizada, así como su curva IDF con la cual se pueden hacer las
estimaciones de lluvias esperadas en cualquier período de retorno con la duración que se
pueda estimar consecuente con los tipos de análisis a desarrollarse en el municipio de
Zipaquirá, Cundinamarca.
CONCLUSIONES
El ajuste de datos dudosos es necesario para esa estación debido a que los
valores medidos al inicio de su operación tienen valores superiores a los 57.19 mm de
precipitación diaria y fue superado en 22 días seguidos con registros elevados de
precipitación cercanos a 100 mm o incluso tienen un máximo valor de 227.8 mm lo cual
es casi 4 veces mayor que ese valor de umbral máximo ajustado.
La distribución de Gumbel es la mejor ajustada a los datos una vez hecha la
prueba donde la diferencia entre la probabilidad de ocurrencia del dato medido y la
probabilidad esperada, para este caso esta diferencia su valor máximo es de 0.0821,
numero muy por debajo del valor de 0.318 e indica que el ajuste es muy bueno bajo esta
condición de distribución.
Una vez determinada la curva IDF de esta estación se pueden desarrollar diseños
basados en precipitaciones en la zona de influencia de la estación al tener en cuenta que
se puede estimar lluvias para hacer diseños de recolección de la misma, optimización del
recurso en los períodos de sequía, prevención de inundaciones, etc.
17
Esto puede migrarse a cualquier estación del país al seguir la misma metodología
y al corroborar la confiabilidad de los datos con el fin de mejorar la estimación de la
precipitación calculada. Una vez se tienen este proceso se continua con la investigación y
se proyecta diseñar un sistema de predicción de lluvias donde los usuarios puedan hacer
consultas puntuales sobre alguna fecha en específico y la probabilidad de ocurrencia de
una precipitación; así como el valor estimado para dicha lluvia. La aplicabilidad de este
proyecto también depende de la calidad de los datos y de los registros continuos
recopilados por la estación. Este resultado ha mejorado la precisión con el tiempo, lo que
permite que el Observatorio del Páramo de Guerrero registre más datos de precipitaciones
pueden registrar y se puede hacer una mejor estimación basada en el diseño de una
fábrica civil con una vida útil de más de 50 años.
18
REFERENCIAS BIBLIOGRAFICAS
Aljohani, H. M. (2022). Shape adaptive estimation using two normal distributions ECG. En
Shape adaptive estimation using two normal distributions ECG. (págs. 61 (1) 1-15).
Bazzamo, F. M Heredia. T, e. a. (2019). Tendencias en la precipitacion en tucuman bajo efecto
del cambio climatico. Meteorologia, 44 (2), 1-14.
Chow, V. Te, Maidment, D., & Mays, L. (1994). Hidrología aplicada. https://compress-
pdf.eamy.info/
Colombia. Instituto de Hidrología Meteorología y Estudios Ambientales. (2018).
Gálvez-Nieto, J. L., Salvo, S., Pérez-Luco, R., Hederich, C., & Trizano-Hermosilla, Í. (2017).
Invarianza factorial del Cuestionario para Evaluar Clima Social del Centro Escolar en
estudiantes chilenos y colombianos. Revista Latinoamericana de Psicologia, 49(2), 119–
127.
Lau, H. X., Lee, S. L. C., & Ali, Y. (2021). Effectiveness of data auditing as a tool to reinforce
good research data management (RDM) practice: a Singapore study. BMC Medical
Ethics, 22(1), 1–8.
Salazar Torres, J. I., & Girón Cardenas, E. (2021). Análisis y aplicación de algoritmos de minería
de datos. Perspectivas, 1(21), 71–88.
Vargas Batis, B., González Amita, R., Rodríguez Fonseca, R., & Garcés Castillo, W. (2019).
Composición, diversidad y distribución de especies frutales en fincas suburbanas de
Santiago de Cuba. Universidad Y Sociedad, 11(4), 94-105.