1
(六)逐步回归方程的获得和回归效果检验
1.标准回归方程 P83
2.回归方程
代入关系式,
得,回归方程 P83
(4-40)
i
p
i
it xby
1
i
ii
yy
i
ii
t
it
yy
t
t bs
s
b
s
xx
x
s
yy
y
,,
)()(
1
iit
l
iy
p
i ii
yy
t xxr
s
s
yy
2
3.回归效果检验
(1)复相关系数
可以证明:
( 4-41) R越接近 1越好。
( 2)剩余标准差
( 4-42)
越小越好。
11
)(
pn
r
s
pn
Qs lyy
yyy
yy
l
yyl srQ,
)()(?
)(1 l
yyrR
yyS
QR 1
3
(七)逐步回归计算步骤及个例
步骤:见 P87 计算过程示意图
数值例子,P84
4
(八)逐步回归中与多元回归的讨论
p92
5
第二节线性回归模型的推广
有些非线性的固定函数关系,通过适当的变形使得非线性问题线性化。 P109
1.抛物线关系
2.指数关系
3.幂函数关系
4.三角函数关系
6
第三节 AIC准则
一、引人目的
在建立多元、逐步回归模型时,方程中因子的个数与所取的信度有关,带有一定的人为性。为此,提出用函数作为确定因子个数(自回归的阶数)的标准,以消除人为因素,使回归模型有具有较好的拟合效果。
7
二,基本思想 P111
确定一个依赖于样本数 n与因子个数 p的函数,在所有可能的 p中,选出使此函数达到最小的 p。 以这 p。 个因子作为入选因子的数量(自回归的阶数),来建立方程。
三,函数的形式
( 4-44)
为 P个中心化(距平)因子的残差方差,P为中心化变元的个数(自回归阶数)
是随着 p的增加而单调下降的,而 2p/n却随着 p的增加而增加。
第一项代表 拟合优度 。第二项代表 增加因子后的惩罚 。
n
pppAIC 2)(ln)( 2
)(ln 2 p?
)(2 p?
8
将 AIC( P0) =极小值时的 P0作为最佳因子个数(自回归的阶数)
四,AIC的应用
1.确定因子的个数或自回归的阶数
分别计算 1,2,…… m个因子的 AIC( 1),AIC
( 2) …… AIC ( m),取使 AIC达最小值的因子数 p为因子个数。
2.确定因子的重要性
分别计算各因子的 AIC,AIC达最小的因子最重要。
9
第四节 非线性模型一、非线性模型简介
1,模型 p112(4-46)
其中 f是待定参数 b1,b2……b p的非线性函数。 X可以是单个因子,也可以是 p个因子 X=(b1,b2……b p),
2,待定参数确定思路给出初始值后,用最小二乘法确定关于误差 的方程组( 4-50),采用逐次逼近法求得 bi。 理论上可行,
但实际误差大,求解困难。
二、逐段线性化的门限回归模型
1.基本思想 p114
将非线性的函数关系,按照某一变元不同的取值范围,
采取若干线性模型来描述 (逐段线性化 )。
2.模型 P115 ( 4-53)
),.,,,,( 21 pbbbXfy?
i?
10
(1) x1t,x2t,…x it,……x pt,为 P个自变元 (预报因子 ) i=1….p
(2) xit为门限自变元,是自变元中的一个,其选择见 P115
(3)据门限自变元 xit 的数值 (性质 ),把 xi分为 r段,分界点的值为为门限值 x1,x2……x r-1 (一般为转折点 ),分段原则
P116
(4)d为延迟量。
用两天前的因子作预报 d=2
3.数值例子 116
ditrtpt
r
pit
r
it
r
dittptpitit
dittptpitit
t
xxxbxbxb
xxxxbxbxb
xxxbxbxb
Y
1
)()(
1
)(
1
21
)2()2(
1
)2(
1
1
)1()1(
1
)1(
1
.,,,,,.,,,,,
.,,,,,.,,,,,,,,,.,,,,,,,,,.,,,,,,,,,.,,,,,,,,,.,,,,,,,,,.,,,,,,,,,.,,,,,,,,,.,,,,,,,,,
.,,,,,.,,,,,
.,,,,,.,,,,,
当当当
11
第五章 自回归模型基本思想,把水文要素随时间的变化作为一个随机过程来研究,将这一个随机过程 离散化 后得到一个水文时间序列。分析水文要素前后期演变情况的统计规律,应用这一规律由 前期水文要素 的数值作出 后期要素的预报。
本章将讨论因变量(预报对象)自身的变化统计规律。
12
第一节 随机时间序列的 概念
一、时间序列 P127
1.确定性时间序列
2.非确定性时间序列 P127
随机过程,P129有无数个时间序列组成
时间序列,随机过程的一个样本(现实)。
二、平稳时间序列( 是平稳随机过程 中的一个现实)
平稳随机过程 P130
一个随机过程,如果它的 数学期望,方差 不随时间变化。相关函数只是 时间间隔 的函数而与时间无关。称其为一个广义平稳过程或弱平稳过程。
平稳过程的特点:
– ( 1)、它的观测数据 x( t) 围绕在一个水平线附近作均匀随机摆动 。
– ( 2)、两个不同时刻的统计相关系数只是 时间间隔 的函数,与起点无关。
(六)逐步回归方程的获得和回归效果检验
1.标准回归方程 P83
2.回归方程
代入关系式,
得,回归方程 P83
(4-40)
i
p
i
it xby
1
i
ii
yy
i
ii
t
it
yy
t
t bs
s
b
s
xx
x
s
yy
y
,,
)()(
1
iit
l
iy
p
i ii
yy
t xxr
s
s
yy
2
3.回归效果检验
(1)复相关系数
可以证明:
( 4-41) R越接近 1越好。
( 2)剩余标准差
( 4-42)
越小越好。
11
)(
pn
r
s
pn
Qs lyy
yyy
yy
l
yyl srQ,
)()(?
)(1 l
yyrR
yyS
QR 1
3
(七)逐步回归计算步骤及个例
步骤:见 P87 计算过程示意图
数值例子,P84
4
(八)逐步回归中与多元回归的讨论
p92
5
第二节线性回归模型的推广
有些非线性的固定函数关系,通过适当的变形使得非线性问题线性化。 P109
1.抛物线关系
2.指数关系
3.幂函数关系
4.三角函数关系
6
第三节 AIC准则
一、引人目的
在建立多元、逐步回归模型时,方程中因子的个数与所取的信度有关,带有一定的人为性。为此,提出用函数作为确定因子个数(自回归的阶数)的标准,以消除人为因素,使回归模型有具有较好的拟合效果。
7
二,基本思想 P111
确定一个依赖于样本数 n与因子个数 p的函数,在所有可能的 p中,选出使此函数达到最小的 p。 以这 p。 个因子作为入选因子的数量(自回归的阶数),来建立方程。
三,函数的形式
( 4-44)
为 P个中心化(距平)因子的残差方差,P为中心化变元的个数(自回归阶数)
是随着 p的增加而单调下降的,而 2p/n却随着 p的增加而增加。
第一项代表 拟合优度 。第二项代表 增加因子后的惩罚 。
n
pppAIC 2)(ln)( 2
)(ln 2 p?
)(2 p?
8
将 AIC( P0) =极小值时的 P0作为最佳因子个数(自回归的阶数)
四,AIC的应用
1.确定因子的个数或自回归的阶数
分别计算 1,2,…… m个因子的 AIC( 1),AIC
( 2) …… AIC ( m),取使 AIC达最小值的因子数 p为因子个数。
2.确定因子的重要性
分别计算各因子的 AIC,AIC达最小的因子最重要。
9
第四节 非线性模型一、非线性模型简介
1,模型 p112(4-46)
其中 f是待定参数 b1,b2……b p的非线性函数。 X可以是单个因子,也可以是 p个因子 X=(b1,b2……b p),
2,待定参数确定思路给出初始值后,用最小二乘法确定关于误差 的方程组( 4-50),采用逐次逼近法求得 bi。 理论上可行,
但实际误差大,求解困难。
二、逐段线性化的门限回归模型
1.基本思想 p114
将非线性的函数关系,按照某一变元不同的取值范围,
采取若干线性模型来描述 (逐段线性化 )。
2.模型 P115 ( 4-53)
),.,,,,( 21 pbbbXfy?
i?
10
(1) x1t,x2t,…x it,……x pt,为 P个自变元 (预报因子 ) i=1….p
(2) xit为门限自变元,是自变元中的一个,其选择见 P115
(3)据门限自变元 xit 的数值 (性质 ),把 xi分为 r段,分界点的值为为门限值 x1,x2……x r-1 (一般为转折点 ),分段原则
P116
(4)d为延迟量。
用两天前的因子作预报 d=2
3.数值例子 116
ditrtpt
r
pit
r
it
r
dittptpitit
dittptpitit
t
xxxbxbxb
xxxxbxbxb
xxxbxbxb
Y
1
)()(
1
)(
1
21
)2()2(
1
)2(
1
1
)1()1(
1
)1(
1
.,,,,,.,,,,,
.,,,,,.,,,,,,,,,.,,,,,,,,,.,,,,,,,,,.,,,,,,,,,.,,,,,,,,,.,,,,,,,,,.,,,,,,,,,.,,,,,,,,,
.,,,,,.,,,,,
.,,,,,.,,,,,
当当当
11
第五章 自回归模型基本思想,把水文要素随时间的变化作为一个随机过程来研究,将这一个随机过程 离散化 后得到一个水文时间序列。分析水文要素前后期演变情况的统计规律,应用这一规律由 前期水文要素 的数值作出 后期要素的预报。
本章将讨论因变量(预报对象)自身的变化统计规律。
12
第一节 随机时间序列的 概念
一、时间序列 P127
1.确定性时间序列
2.非确定性时间序列 P127
随机过程,P129有无数个时间序列组成
时间序列,随机过程的一个样本(现实)。
二、平稳时间序列( 是平稳随机过程 中的一个现实)
平稳随机过程 P130
一个随机过程,如果它的 数学期望,方差 不随时间变化。相关函数只是 时间间隔 的函数而与时间无关。称其为一个广义平稳过程或弱平稳过程。
平稳过程的特点:
– ( 1)、它的观测数据 x( t) 围绕在一个水平线附近作均匀随机摆动 。
– ( 2)、两个不同时刻的统计相关系数只是 时间间隔 的函数,与起点无关。