Estadística y Probabilidad en Hidrología
Estadística y Probabilidad en Hidrología
“ESTADÍSTICA,
DISTRIBUCIONES DE
PROBABILIDAD Y
PERIODOS DE RETORNO”
Hidrología: Abelardo Díaz Salaz
Huaraz, Ancash-Perú
Julio 2015
UNIVERCIDAD NACIONAL CURSO: HIDROLOGIA
SANTIAGO ANTUNEZ DE MAYOLO PROF: ABELARDO DIAZ S.
INTRODUCCIÓN
y Olleros.
la toma de decisiones.
EL GRUPO
UNIVERCIDAD NACIONAL CURSO: HIDROLOGIA
SANTIAGO ANTUNEZ DE MAYOLO PROF: ABELARDO DIAZ S.
UNIVERCIDAD NACIONAL CURSO: HIDROLOGIA
SANTIAGO ANTUNEZ DE MAYOLO PROF: ABELARDO DIAZ S.
Contenido
INTRODUCCIÓN................................................................................................................................................1
“ESTADÍSTICA, DISTRIBUCIONES DE PROBABILIDAD Y PERIODOS DE RETORNO”.............1
I. OBJETIVOS.......................................................................................................................................1
II...................................................................................................................................................................1
III. MARCO TEORICO.......................................................................................................................1
3.1. CONCEPTO DE ESTADÍSTICA.......................................................................................................1
3.2.- ESTADÍSTICA DESCRIPTIVA E INFERENCIAL..............................................................................2
3.3.- CONCEPTOS BÁSICOS DE ESTADÍSTICA......................................................................................3
3.4.- OBTENCIÓN DE DATOS. FUENTES, CENSOS, ENCUESTAS, REGISTROS.................................4
3.5.- VARIABLES...........................................................................................................................................5
CATEGORÍAS DE UNA VARIABLE............................................................................................................5
3.6.- PRESENTACIÓN DE DATOS................................................................................................................6
La codificación tabulación:..............................................................................................................................6
3.7.- TABLAS DE FRECUENCIAS................................................................................................................6
- TABLAS DE FRECUENCIAS SIMPLES....................................................................................................7
- FRECUENCIAS ACUMULADAS...............................................................................................................8
- TABLAS DE FRECUENCIAS PARA VALORES AGRUPADOS...............................................................8
3.8.- HERRAMIENTAS DE LA ESTADISTICA.........................................................................................11
3.8.1.- HISTOGRAMA Y POLÍGONOS DE FRECUENCIA.........................................................11
3.8.2.- MEDIA..................................................................................................................................12
3.8.3.- MEDIANA............................................................................................................................12
3.8.4.- MODA...................................................................................................................................13
3.8.5.- DESVIACIÓN DE LA MEDIA............................................................................................13
3.8.6.- DESVIACIÓN ESTÁNDAR Y VARIANCIA......................................................................14
3.8.7.- COVARIANZA.....................................................................................................................14
3.8.8.- COEFICIENTE DE CORRELACIÓN..................................................................................14
3.8.9.- COEFICIENTE DE VARIACIÓN........................................................................................15
3.8.10.- DESVIACIÓN ESTÁNDAR MUESTRAL........................................................................15
3.9.- DISTRIBUCIONES DE PROBABILIDAD EN HIDROLOGIA.........................................................16
3.11.- ANALISIS DE FRECUENCIA...........................................................................................................19
3.12.- DISTRIBUCIONES DE PROBABILIDAD PARA VARIABLES CONTINUAS.............................20
3.12.1.- DISTRIBUCION NORMAL...............................................................................................20
3.12.2.- DISTRIBUCION LOGNORMAL DE DOS PARAMETROS............................................21
3.12.3.- DISTRIBUCION GUMBEL O EXTREMA TIPO I...........................................................23
UNIVERCIDAD NACIONAL CURSO: HIDROLOGIA
SANTIAGO ANTUNEZ DE MAYOLO PROF: ABELARDO DIAZ S.
“ESTADÍSTICA, DISTRIBUCIONES DE
PROBABILIDAD Y PERIODOS DE RETORNO”
I. OBJETIVOS
a) Objetivo General
b) Objetivos Específicos
II.
III. MARCO TEORICO
“En Hidrología es Costumbre trabajar con los datos como los mostrados en el
Cuadro N° 01, estos datos son recopilados de las oficinas como del Servicio
Nacional de Meteorología e Hidrología-SENAMHI en el Perú.
Los datos tienen 2 Partes: La fecha de suceso, en este caso los años, y los
números que representan la ocurrencia o suceso de una variable
hidrometerológica (Datos Observados y medidos), que son las descargas
máximas instantáneas anuales en este caso.1
CUADRO N° 1.1.1.:2
POBLACIÓN O UNIVERSO:
MUESTRA:
ENCUESTA
REGISTRO ADMINISTRATIVO
ESTACION HIDROLOGICA
3.5.- VARIABLES
Las categorías de una variable deben cumplir con dos requisitos indispensables:
deben ser exhaustivas y excluyentes.
La codificación tabulación:
La codificación consiste en asignar a todas y cada una de las categorías que
comprende un cuestionario los números y signos correlativos que sean precisos,
según el procedimiento de tabulación empleado, para hacer posible la agrupación
de los datos. La codificación permite reemplazar por números todos los datos del
cuestionario. De su realización correcta depende que en la tabulación no haya
errores ni resulte falseada o viciada la distribución de datos. La codificación
incluye además la categorización de preguntas abiertas.
Una vez procesados los datos relevados, se analiza esa información empírica.
-1 -2 -3 -4 -5
1 144 0,214 144 0,214
2 225 0,334 369 0,548
3 174 0,259 543 0,807
4 88 0,131 631 0,938
UNIVERCIDAD NACIONAL CURSO: HIDROLOGIA
SANTIAGO ANTUNEZ DE MAYOLO PROF: ABELARDO DIAZ S.
En la columna (4) se suman los hogares acumulados hasta cada uno de los valores
de la variable.
Por ejemplo: si queremos saber cuántos hogares hay que tienen como máximo 2
cuartos, se observa que se acumulan 369, o sea, 144 hogares con un cuarto y 225
con 2 cuartos. Estos valores se denominan
- FRECUENCIAS ACUMULADAS.
Finalmente, en la columna (5) se efectúa el cociente entre los valores de la
columna (4) y el total de hogares, lo que nos indica el peso relativo de los casos
acumulados hasta cada uno de los valores de la variable, y llamamos a esta
columna frecuencia relativa acumulada.
Llamamos límites de clase a los valores que definen los extremos de un intervalo.
Por ejemplo: el intervalo 0 a 10 años, tiene como límites a los valores 0 y 10.
La amplitud del intervalo estará dada por la diferencia entre el límite superior y el
límite inferior.
Cada intervalo tendrá también lo que se llama marca de clase, que es el punto
medio del mismo.
Tabla de frecuencias
R= X max −X min
k =1.33 ln ( n ) +1
Dónde:
k: número de intervalo de clase.
n: número de datos de la muestra.
R
∆ X=
k
LI i =LI i−1 +∆ X
LSi=LI i +∆ X
UNIVERCIDAD NACIONAL CURSO: HIDROLOGIA
SANTIAGO ANTUNEZ DE MAYOLO PROF: ABELARDO DIAZ S.
Dónde:
Ln :limite inferior del intervalo n de clase .
LS1 :limite superior del intervalo n de clase .
LI i + LSi
Mc i=
2
nk
k n
k k
ni k
fri
n=∑ ni Fai=∑ fai fr i= Fri =∑ fr i fe i =
i=1 i=1 n i=1 ∆X
Sus bases sobre un eje horizontal (el eje X) con centros en las marcas de
clase y longitud igual al tamaño de los intervalos de clase.
Superficies proporcionales a las frecuencias de clase.
Un polígono de frecuencias, es un gráfico de línea trazado sobre las marcas de
clase. Puede obtenerse uniendo los puntos medios de los techos de los
rectángulos en el histograma.
3.8.2.- MEDIA
N
1
x́=
N
∑ xi
i=1
Xini
X i 1
n
3.8.3.- MEDIANA
n
M e =Y i−1+C i
2
( )
−N i−1
ni
3.8.4.- MODA
X X ni
2
i
V( x ) i 1
n
3.8.6.- COVARIANZA
Este valor indica el grado de similitud entre los conjuntos a y b, o sea, como los
datos están correlacionados entre sí. Cuanto mayor es la covarianza, mayor es el
grado de correlación entre los datos.
Aa , b
α a ,b=
√σ 2
a σ 2b
Sx
C . V . (x )= ×100
x́
√
n
1 2
σ^ = ∑ ( x i− x́ )
n i=1
UNIVERCIDAD NACIONAL CURSO: HIDROLOGIA
SANTIAGO ANTUNEZ DE MAYOLO PROF: ABELARDO DIAZ S.
Ejemplo Se tienen las probabilidades de que haya 1, 2, 3, etc., días nublados por
semana en un determinado lugar, con ellos calcule la distribución de
probabilidades
x P(x) F(x)
0 0.05 0.05
1 0.15 0.2
2 0.25 0.45
3 0.2 0.65
4 0.15 0.8
5 0.1 0.9
6 0.08 0.98
7 0.02 1
Total 1
UNIVERCIDAD NACIONAL CURSO: HIDROLOGIA
SANTIAGO ANTUNEZ DE MAYOLO PROF: ABELARDO DIAZ S.
0.30 1.20
0.25 1.00
0.20 0.80
F(x)
f(x)
0.15 0.60
0.10 0.40
0.05 0.20
0.00 0.00
0 1 2 3 4 5 6 7 0 2 4 6 8
# dias nublados # dias nublados
x P(x) F(x)
1 0.05 0.05
2 0.1 0.15
3 0.15 0.3
4 0.2 0.5
5 0.1 0.6
6 0.1 0.7
7 0.15 0.85
8 0.1 0.95
9 0.05 1
Total 1
0.25 1.20
0.20 1.00
0.80
0.15
F(x)
f(x)
0.60
0.10
0.40
0.05 0.20
0.00 0.00
1 2 3 4 5 6 7 8 9 0 2 4 6 8 10
Qmáx instántaneo *10² (m³/s) Qmáx instántaneo *10² (m³/s)
UNIVERCIDAD NACIONAL CURSO: HIDROLOGIA
SANTIAGO ANTUNEZ DE MAYOLO PROF: ABELARDO DIAZ S.
0.35 1.20
0.30 1.00
0.25 0.80
0.20
F(x)
f(x)
0.60
0.15
0.40
0.10
0.05 0.20
0.00 0.00
1 2 3 4 5 6 7 8 9 10 0 5 10 15
Qmáx instántaneo *10² (m³/s) Qmáx instántaneo *10² (m³/s)
f ( x)dx 1
i)
b
P( a x b) f ( x) dx
a
ii)
b
b
f ( x ) dx 0
iii)
Lo que implica que las probabilidades se definen solo como AREAS bajo la
función de densidad de probabilidad (FDP) entre límites finitos.
X T KT
X T x KT s
Para una distribución dada, puede determinarse una relación entre K y el período
de retorno Tr. Esta relación puede expresarse en términos matemáticos o por
medio del uso de una tabla.
- FUNCIÓN DE DENSIDAD:
1 ( x ) 2
1
f ( x) exp 2 2
x
2
x
los cuales (media) y s (desviación estándar) son derivados de los datos.
- ESTIMACIÓN DE PARÁMETROS:
1 n
x xi
n i 1
1
1 n 2
s
n 1 i 1
( xi x ) 2
UNIVERCIDAD NACIONAL CURSO: HIDROLOGIA
SANTIAGO ANTUNEZ DE MAYOLO PROF: ABELARDO DIAZ S.
- FACTOR DE FRECUENCIA:
xT
KT
KT F 1 (1 Tr1 )
- LIMITES DE CONFIANZA:
X Tr t(1 ) Se
t(1 )
Donde es el nivel de probabilidad es el cuantil de la distribución normal
estandarizada para una probabilidad acumulada de 1- y Se es el error estándar
Esta distribución es muy usada para el cálculo de valores extremos por ejemplo
Qmax, Qmínimos, Pmax, Pmínima (excelentes resultados en Antioquia). Tiene la
ventaja que X>0 y que la transformación Log tiende a reducir la asimetría positiva
ya que al sacar logaritmos se reducen en mayor proporción los datos mayores que
los menores.
- FUNCIÓN DE DENSIDAD:
UNIVERCIDAD NACIONAL CURSO: HIDROLOGIA
SANTIAGO ANTUNEZ DE MAYOLO PROF: ABELARDO DIAZ S.
1 ( y y )
1 2 y2
f ( x) exp x0
x 2
y = ln x
Donde:
y
y : media de los logaritmos de la población (parámetro escalar), estimado
- ESTIMACIÓN DE PARÁMETROS:
1 n 1 n 2
y ln( xi ) s y
n i 1
n 1 i 1
(ln( xi ) y ) 2
- FACTOR DE FRECUENCIA:
Ln(XTr) = xTr+KSy
De donde,
1
ln( 1 Cv 2 )
Exp K T * ( Ln(1 Cv 2 )) 2 1
2
Kt
Cv
s
Cv
x
K es la variable normal estandarizada para el Tr dado, es el coeficiente
de variación, x media de los datos originales y s desviación estándar de los datos
originales.
LIMITES DE CONFIANZA:
En el campo transformado.
Ln( X Tr ) t(1 ) ST
1
( S y ) K
2
2
Se 1 T
n 2
- FUNCIÓN DE DENSIDAD:
1 (x ) (x )
f ( x) exp exp
(x )
F ( x) f ( x)dx exp exp
- ESTIMACIÓN DE PARÁMETROS
6
s
x 0.5772
x y s
Donde son la media y la desviación estándar estimadas con la muestra.
- FACTOR DE FRECUENCIA:
6 Tr
KT 0.5772 ln ln
Tr 1
- LIMITES DE CONFIANZA
Xt t(1-) Se
s
Se
n
1
[1 1.1396KT 1.1K T 2 ] 2
- FUNCIÓN DE DENSIDAD:
1
1 x xˆ0 x xˆ0
f ( x) exp
Donde,
x0 x para 0
x x0 para 0
- ESTIMACIÓN DE PARÁMETROS:
2
2 Cs
ˆ
; ˆ s ; xˆ0 x ˆ
Cs 2
x y s
Cs es el coeficiente de asimetría, son la media y la desviación estándar
de la muestra respectivamente.
- FACTOR DE FRECUENCIA:
2 3 4 5
Cs 1 3 Cs Cs Cs 1 Cs
K z ( z 1) ( z 6 z )
2
( z 1)
2
z
6 3 6 6 6 3 6
- INTERVALOS DE CONFIANZA:
Xt t(1-) Se
S
Se
n
- FUNCIÓN DE DENSIDAD:
1
1 ln( x) y0 ln( x ) y0
f ( x) exp
x
Donde,
y0 y para 0
y y0 para 0
- ESTIMACIÓN DE PARÁMETROS:
2
ˆ 2 Cs
; ˆ s y ; xˆ0 x y ˆ
Cs 2
UNIVERCIDAD NACIONAL CURSO: HIDROLOGIA
SANTIAGO ANTUNEZ DE MAYOLO PROF: ABELARDO DIAZ S.
xy y sy
Cs es el coeficiente de asimetría, , son la media y la desviación
estándar de los logaritmos de la muestra respectivamente.
- FACTOR DE FRECUENCIA:
ln( YTr ) x y K s y
2 3 4 5
Cs 1 Cs Cs Cs 1 Cs
K z ( z 1) ( z 3 6 z )
2
( z 1)
2
z
6 3 6 6 6 3 6
- INTERVALOS DE CONFIANZA:
Xt t(1-) Se
Sy
Se
n
Estación de Querococha
Calculamos la amplitud :
R= 1.72
K= 5
ΔX= 0.344
<Xi-1,Xi) Mi f h F H
0.99 1.334 1.162 2 0.077 2 0.077
1.334 1.678 1.506 8 0.308 10 0.385
1.678 2.022 1.85 11 0.423 21 0.808
2.022 2.366 2.194 2 0.077 23 0.885
2.366 2.71 2.538 3 0.115 26 1.000
26 1.000
Xprom 1.773
S 0.409
0.600
0.400
0.200
0.000
1 1.2 1.4 1.6 1.8 2 2.2 2.4
1.000
0.800
0.600
0.400
0.200
0.000
1 1.2 1.4 1.6 1.8 2 2.2 2.4 2.6 2.8
UNIVERCIDAD NACIONAL CURSO: HIDROLOGIA
SANTIAGO ANTUNEZ DE MAYOLO PROF: ABELARDO DIAZ S.
Funcion Densidad Ex
0.160
0.140
0.120
0.100
0.080
0.060
0.040
0.020
0.000
1 1.2 1.4 1.6 1.8 2
1.000
0.800
0.600
0.400
0.200
0.000
1 1.2 1.4 1.6 1.8 2 2.2 2.4
Grafico Resumen:
1.400
1.200
0.200
0.152
0.000
1 1.2 1.4 1.6 1.8 2 2.2 2.4 2.6 2.8
UNIVERCIDAD NACIONAL CURSO: HIDROLOGIA
SANTIAGO ANTUNEZ DE MAYOLO PROF: ABELARDO DIAZ S.
Tenemos:
Donde:
T 100
α 0.319
β 1.590
F(w) 0.99
w 4.600
Q100 3.056
Tenemos:
Donde:
T 150
α 0.319
β 1.590
F(w) 0.993
w 5.007
UNIVERCIDAD NACIONAL CURSO: HIDROLOGIA
SANTIAGO ANTUNEZ DE MAYOLO PROF: ABELARDO DIAZ S.
Q100 3.186
Tenemos:
Donde:
T 250
α 0.319
β 1.590
F(w) 0.996
w 5.519
Q100 3.349
Tenemos:
Donde:
T 500
α 0.319
β 1.590
F(w) 0.998
w 6.214
Q100 3.570
Estación de Olleros
Calculamos la amplitud :
R= 4.2
K= 5
ΔX= 0.84
<Xi-1,Xi) Mi f h F H
2.99 3.83 3.41 3 0.115 3 0.115
3.83 4.67 4.25 11 0.423 14 0.538
UNIVERCIDAD NACIONAL CURSO: HIDROLOGIA
SANTIAGO ANTUNEZ DE MAYOLO PROF: ABELARDO DIAZ S.
Xprom 4.786
S 0.942
0.500
0.400
0.300
0.200
0.100
0.000
3 3.5 4 4.5 5 5.5 6 6.5 7
UNIVERCIDAD NACIONAL CURSO: HIDROLOGIA
SANTIAGO ANTUNEZ DE MAYOLO PROF: ABELARDO DIAZ S.
0.025
0.020
0.015
0.010
0.005
0.000
1 1.2 1.4 1.6 1.8 2 2.2 2.4 2.6 2.8
0.500
0.400
0.300
0.200
0.100
0.000
1 1.2 1.4 1.6 1.8 2 2.2 2.4 2.6 2.8
Grafico Resumen:
UNIVERCIDAD NACIONAL CURSO: HIDROLOGIA
SANTIAGO ANTUNEZ DE MAYOLO PROF: ABELARDO DIAZ S.
0.600
0.500
Funcion Densidad
0.400
Gumbel
Funcion Densidad
0.300 Empirica
Funcion Densidad
Exponencial
0.200 Funcion Densidad
Normal
0.100
0.049
0.000
1 2 3 4 5 6 7 8
Tenemos:
Donde:
T 100
α 0.735
β 4.362
F(w) 0.99
w 4.600
UNIVERCIDAD NACIONAL CURSO: HIDROLOGIA
SANTIAGO ANTUNEZ DE MAYOLO PROF: ABELARDO DIAZ S.
Q100 7.743
Tenemos:
Donde:
T 150
α 0.735
β 4.362
F(w) 0.993
w 5.007
Q100 8.042
Tenemos:
Donde:
T 250
α 0.735
β 4.362
F(w) 0.996
w 5.519
Q100 8.418
Tenemos:
Donde:
UNIVERCIDAD NACIONAL CURSO: HIDROLOGIA
SANTIAGO ANTUNEZ DE MAYOLO PROF: ABELARDO DIAZ S.
T 500
α 0.735
β 4.362
F(w) 0.998
w 6.214
Q100 8.928
Estación de Quillcay
QUILLCA
AÑOS QUILLCAY AÑOS
Y
1970 8.97 1970 8.97
1971 7.47 1971 8.41
1972 6.73 1972 8.28
1973 8.19 1973 8.19
1974 7.08 1974 8.08
1975 6.5 1975 7.64
1976 6.92 1976 7.56
1977 6.47 1977 7.53
1978 7.64 1978 7.49
1979 6.14 1979 7.48
1980 8.08 1980 7.47
1981 7.45 1981 7.45
1982 8.41 1982 7.43
1983 7.53 1983 7.24
1984 5.11 1984 7.14
1985 5.9 1985 7.08
1986 7.49 1986 7.04
1987 7.56 1987 7.03
1988 7.43 1988 6.92
1989 6.77 1989 6.77
1990 7.03 1990 6.73
1991 7.04 1991 6.5
1992 8.28 1992 6.47
1993 7.48 1993 6.14
1994 7.24 1994 5.9
1995 7.14 1995 5.11
Calculamos la amplitud :
R= 3.86
UNIVERCIDAD NACIONAL CURSO: HIDROLOGIA
SANTIAGO ANTUNEZ DE MAYOLO PROF: ABELARDO DIAZ S.
K= 5
ΔX= 0.772
<Xi-1,Xi) Mi f h F H
5.11 5.882 5.496 1 0.038 1 0.038
5.882 6.654 6.268 4 0.154 5 0.192
6.654 7.426 7.04 9 0.346 14 0.538
7.426 8.198 7.812 9 0.346 23 0.885
8.198 8.97 8.584 3 0.115 26 1.000
26 1.000
Xprom 7.233
S 0.825
0.500
0.400
0.300
0.200
0.100
0.000
1 1.2 1.4 1.6 1.8 2 2.2 2.4 2.6 2.8
Grafico Resumen:
UNIVERCIDAD NACIONAL CURSO: HIDROLOGIA
SANTIAGO ANTUNEZ DE MAYOLO PROF: ABELARDO DIAZ S.
0.600
0.500
Funcion Densidad
0.400
Gumbel
Funcion Densidad
0.300 Empirica
Funcion Densidad
Exponencial
0.200 Funcion Densidad
Normal
0.100 0.100
0.000
1 2 3 4 5 6 7 8 9
Tenemos:
T −1
F ( z )=
Donde:
T
Q− X́
z=
T S 100
F(z) 0.99
z 2.325
Q 9.152
UNIVERCIDAD NACIONAL CURSO: HIDROLOGIA
SANTIAGO ANTUNEZ DE MAYOLO PROF: ABELARDO DIAZ S.
Tenemos:
T −1
F ( z )=
Donde:
T
Q− X́
z=
T S 150
F(z) 0.99333
z 2.475
Q 9.276
Tenemos:
T −1
F ( z )=
Donde:
T
Q− X́
z=
T S 250
F(z) 0.996
z 2.66
Q 9.429
Tenemos:
T −1
F ( z )=
Donde: T
Q− X́
z=
T S 500
F(z) 0.998
z 2.88
Q 9.610
UNIVERCIDAD NACIONAL CURSO: HIDROLOGIA
SANTIAGO ANTUNEZ DE MAYOLO PROF: ABELARDO DIAZ S.
V. CONCLUSIONES
- Los diferentes periodos de retorno obtenidos nos dan una idea de cuál es el grado de
ocurrencia de una determinada precipitación.
VI. RECOMENDACIONES
- Siempre realizar el ajuste de los datos con los que se trabaja a una distribución ya
conocida con finalidad de una mayor interpretación de los resultados y extensión de
ellos.