WUHEE
工程水文学武汉大学水利水电学院
WUHEE
第四章 水文统计
第一节 概述
第二节 概率的基本概念一、事件必然事件、不可能事件、随机事件二、概率随机事件出现的可能性大小三、频率对于水文现象,用频率作为概率的近似值
WUHEE
第三节 随机变量及其概率分布一、随机变量水文特征值:年径流、洪峰流量离散型随机变量连续型随机变量:水位、流量二、随机变量的概率分布随机变量的取值与其概率的对应关系,称为随机变量的概率分布。
对于水文变量,研究大于等于某一取值 x的概率,即 F(x)
)()( xXPxF
WUHEE
水文上通常称概率分布曲线为 频率曲线概率分布函数导数负值,称为 概率密度函数
dx
xdFxFxf )()()( '
WUHEE
三、随机变量的统计参数描述水文现象基本特性和分布特点的某些数字特征,例如平均降雨量、年平均流量等,
称为统计参数。
总体统计参数,样本统计参数总体,随机变量所有取值的全体,
样本,从总体中抽取的一部分,
样本容量,样本包括的项数,样本大小。
水文系列都是有限长度,是样本,其统计参数就是样本统计参数,有均值、均方差、变差系数、偏态系数等。
WUHEE
(一)均值模比系数:

n
i
i
n x
nn
xxxx
1
21 1...
x
xi

n
i
i
n K
nn
KKKK
1
21 1...
WUHEE
(二)均方差放映系列中各变量值集中或离散的程度
5,10,15 σ= 4.08
1,10,19 σ=7.35

n
xx
n
i
i?
1
2
WUHEE
(三)变差系数( Cv)
5,10,15 x=10 σ=4.08 Cv=0.48
995,1000,1005 x=1000 σ=4.08 Cv=0.0048

n
K
x
C
n
i
i
v
1
21
WUHEE
(四)偏态系数( Cs)
反映系列在均值两边的对称程度。

3
1
3
3
1
3
)1(
v
n
i
i
n
i
i
s
nC
K
n
xx
C

WUHEE
(五)矩
( 1)原点矩随机变量 X对原点离差的 r次幂的数学期望
,称为随机变量 X的 r阶原点矩。
r=1时,就是算术平均数
),...,2,1()( nrXEm rr
WUHEE
( 2)中心矩随机变量 X对分布中心 E(X)离差的 r次幂的数学期望,称为随机变量 X的 r阶原点矩。
r=1时,一阶中心矩为 0
r=2时,
r=3时,
),...,2,1()( nrXEXE rr
xCXEXE v 222 )(
3333 )( sCXEXE
WUHEE
第四节 水文频率曲线线型一、正态分布

)(
2
1)( 22
2


xexf
xx

WUHEE
WUHEE
二,PⅢ 型分布
)0(10)()( axeaxxf
WUHEE
水文计算中,一般需求出指定频率 p所对应的随机变量取值,例如,频率为 1%(百年一遇)的设计洪峰流量。这需要对密度曲线进行积分,求出等于及大于 xp的累积频率 p值。
令 Φ 是均值为零,标准差为 1的标准化变量
(离均系数)
则有
px axp dxeaxxxpp )0(10 )()()(
VxC
xx
)1( VcXX dCxdx v
WUHEE
该式包含 Cs,P与 Φ p的关系,查附表 1,
由已知的 Cs值,查表可得不同 P的 Φ p值,然后利用已知的 和 Cv值,通过下式即可求出与各种 P相应的 xp值,从而可绘出 理论频率曲线 。
如何求 Cv Cs,在以后介绍。


p
sp dCfp,)(
x
)1( VcXX
x
WUHEE
例:某站年径流系列符合 pⅢ 型分布,已知该系列的 R=650mm,σ=162.5mm,Cs =2Cv,试结合下表计算设计保证率 p=90%的设计年径流量。
解,Cv=σ/R=162.5/650=0.25,∴ Cs=2Cv=0.5
查表得 Ф= -1.22,代入
R90%=650× (1-0.25× 1.22)
=650× 0.695=541.8mm
Cs 0,2 0,3 0,4 0,5 0,6
Φ -1,2 6 - 1,2 4 - 1,2 3 - 1,2 2 - 1,2 0
)1( VcXX
WUHEE
三、经验频率曲线经验频率曲线由实测资料绘制而成,它是水文频率计算的基础,具有一定的实用性。
设某水文要素(如年径流量)的实测系列共 n项,按由 大到小 的次序排列为 x1,x2,...、
xm,...,xn。经验频率就是在系列中大于及等于样本 xi的出现次数与样本容量之比值,即当 m=n时,p=100%,即样本的末项 xn是总体中的最小值,显然不符合实际,因为随着观测年数的增多,总会出现更小的数值。
%100 nmp
WUHEE
对上式进行修正,有:
数学期望公式切哥达也夫公式海森公式
%1 0 01 n mp
%1004.0 3.0 nmp
%1005.0 nmp
WUHEE
水文上常用,重现期,来代替,频率,
1,当研究暴雨或洪水时(一般 p≤50% )
例如,当某一洪水的频率为 p=1%时,则 T=100
年,称此洪水为百年一遇洪水,表示大于等于这样的洪水平均 100年会遇到一次。
2,当研究枯水或年径流时(一般 p≥50% )
例如,对于 p=90%的枯水流量,则 T=10年,称此为十年一遇枯水流量,表示小于等于这样的流量平均 10年会遇到一次。
PT 1?
PT 11
WUHEE
第五节 频率曲线参数估计用有限的样本观测资料估计总体分布线型中的参数,如 P— Ⅲ 型的,Cv,Cs。
一、矩法用样本矩估计总体矩,并通过矩与参数之间的关系,来估计频率曲线的参数。
均值 的无偏估计:
x
n
i
ixnx
1
1x
WUHEE
Cv的无偏估计量:
Cs 的无偏估计量:
模比系数由有限的样本资料算出的统计参数,去估计总体的统计参数总会出现一定的误差,称为抽样误差。
1
)1()1(
1
1
2
1
2


n
K
n
K
n
nC
n
i
i
n
i
i
v
3
1
3
3
1
2
2
)3(
)1()1(
)2)(1( v
n
i
i
v
n
i
i
s Cn
K
nC
K
nn
nC



x
xK i
i?
WUHEE
二、权函数法当样本容量较小时,用矩法估计的参数将产生误差,其中尤以 Cs的计算误差最大,为了提高 Cs的计算精度,马秀峰( 1984)提出了权函数法。
G
EC
s?4
n
i ii
xxxnE
1
)()(1
n
i ii
xxxnG
1
2 )()(1?
2)(
2
1
2
1)(?

xx
ex

WUHEE
第六节 水文频率计算适线法适线法(或称配线法)是以经验频率点据为基础,在一定的适线准则下,求解与经验点据拟合最优的频率曲线参数,得到一条理论频率曲线。
目估适线法、优化适线法一、目估适线法
( 1) 将实测资料由大到小排列,计算各项的经验频率,在频率格纸上点绘经验点据(纵坐标为变量取值,横坐标为对应的经验频率)。
( 2) 选定水文频率分布线型(一般选用 PⅢ 型)。
( 3) 假定一组参数,Cv,Cs。 为了使假定值大致接近实际,可用矩法或权函数法求出 3个参数,作为 3个参数第一次的假定值。当用矩法估计时,因
x
WUHEE
Cs 的抽样误差太大,一般不计算 Cs,而是根据经验假定 Cs为 Cv的某一倍数(如 Cs=2Cv)。
( 4) 根据假定的,Cv,Cs,查 附表 1或 附表 2,
计算 xp值,以 xp为纵坐标,p为横坐标,即可得到频率曲线。将此线画在绘有经验点据的图上,
看与经验点据配合的情况,若不理想,则修改参数(主要调整 Cv,Cs)再次进行计算。
( 5) 最后根据频率曲线与经验点据的配合情况,
从中选择一条与经验点据配合较好的曲线作为采用曲线。相应于该曲线的参数便看作是总体参数的估值。
( 6) 求指定频率的水文变量设计值。
x
WUHEE
统计参数对频率曲线的影响:
( 1)均值 对频率曲线的影响x
WUHEE
( 2) Cv对频率曲线的影响
WUHEE
( 3) Cs对频率曲线的影响
WUHEE
WUHEE
WUHEE
WUHEE
二、优化适线法在一定的适线准则(即目标函数)下,求解与经验点据拟合最优的频率曲线的统计参数的方法。
优化适线法准则:
离差平方和最小准则( OLS)(最小二乘法)
离差绝对值和最小准则( ABS)
相对离差平方和最小准则( WLS)
WUHEE
离差平方和最小准则( OLS)(最小二乘法):
使经验点据和同频率的频率曲线纵坐标之差的平方和达到最小。即使目标函数:
取极小值,即:
欲使 S(Q)为最小,则要使
n
i
ii QPfxQS
1
2)],([)(
)(m in)( ^ QSQS?
0)(
^
QQS
WUHEE
第七节 相关分析一、相关关系的概念目的,研究两个或多个随机变量之间的联系。例如:降雨与径流之间、上下游洪水之间、水位与流量之间等。
水文计算中的应用,资料的展延、水文预报等。
必须注意的问题,必须先分析变量在成因上是否有联系,不能在两个毫不相关的变量之间硬凑出相关关系。
WUHEE
两变量之间关系的三种情况:
WUHEE
简单相关,研究两个变量之间的相关关系,在 水文计算 中应用较多。
复相关,研究 3个或 3个以上变量的相关关系,在水文预报 中应用较多此外还可分为,直线相关 和 非直线相关 。
WUHEE
二、简单相关关系
(一)相关图解法
a:直线截距,b:直线斜率bxay
WUHEE
WUHEE
(二)相关分析法观测点与配合的直线在纵轴方向的离差为:
要使直线拟合“最佳”,须使离差△ yi的平方和为“最小”,即使为极小值。
bxay
iiii bxayyyy
^


n
i ii
n
i ii
n
i i
bxayyyy
1
2
1
2^
1
2 )()(
WUHEE
欲使上式取得极小值,可分别对 a和 b求一阶导数
,并使其等于零,即令解方程组,可得
r:相关系数,表示 x,y
间关系的密切程度
0
)(
1
2


a
bxay
n
i
ii
0
)(
1
2


b
bxay
n
i
ii
x
y
n
i
i
n
i
ii
r
xx
yyxx
b

1
2
1
)(
))((
xryxbya
x
y





n
i
i
n
i
i
n
i
ii
yyxx
yyxx
r
1
2
1
2
1
)()(
))((
WUHEE
将 a,b代入,得是回归线的 斜率,一般称为 y倚 x的 回归系数,
记为,即必须注意:
回归线是在一定标准情况下与实测点的最佳配合线
bxay
)( xxryy
x
y
x
yr
xyR
x
y
xy rR?

WUHEE
(三)相关分析的误差
1,回归线的误差
y倚 x的回归线的均方误:
2
)( 2
^

n
yyS ii
y
21 rS
yy
WUHEE
2,相关系数及其误差
( 1) r2=1,,y与 x完全相关;
( 2) r2=0,,y与 x零相关或非直线相关;
( 3) 0<r2<1,y与 x存在相关关系,r愈大,y,x关系愈密切。 r> 0,正相关; r < 0负相关。
水文计算中,要求:
n≥12、,Sy不大于均值 y 的 15%。 ︱
01 2 rS yy?
yyy rS 21
8.0?r
WUHEE
相关系数的可靠性判断:
用相关系数的均方误来判断
n
r
r
21?