Chapter 5
双变量回归:区间估计与假设检验主讲:彭红枫武汉大学经济与管理学院金融系
Copyright? Hongfeng Peng 2006 Wuhan
University
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
2
5.1 回顾统计学相关内容
问题:
如果,使得:
则称
22离 有 多,近,?
0,0 1and
2 2 2P r ( ) 1
22
(,)
为 置 信 区 间 ;
1- 为 置 信 系 数 ( 置 信 度 ) ;
为 显 著 性 水 平 。
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
3
假设检验中的两类错误
第一类错误:拒绝真实;
第二类错误:接受错误。
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
4
5.2回归系数?1和?2的置信区间在 ui 的正态性假定下,OLS 估计量 0 和 1 本身就是正态分布的,
),0(~ 2sNui? ),(? 2
2
22?
ix
N s ~? )1,0(~
/
22
22 N
x
Z
i?

s

但是 2s 很少能知道,在实践中用无偏估计量 2?s 来代替,则统计量 t
服从自由度为 n-2 的 t 分布:
)2(~
/?
)?(
22
22
2
22?
nt
xse
t
is


其中 222 /?)?( ixse s? 表示估计量 2 的标准差 (? 22 / ixs )的估计值。
由 1)Pr(
22
ttt 得:
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
5
回归系数?1和?2的置信区间
)]?(?),?(?[ 2
2
22
2
2 setset
2的显著水平为?的置信区间为:
同样,?1显著水平为?的置信区间为:
1 1 1 1
22
[ ( ),( ) ]t s e t s e
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
6
5.3 s2的置信区间
s 2 显著水平为? 的置信区间为:
óú?yó μù èè?á £? ±? à?
2
2
2?
)2(
s
s
n
·t ′ò ×ó òè ía n - 2 μ? 2? ·? 2£?é?è?ó ò′?¨à¢ s 2 μ÷£
òè 1)P r (
2
2/
22
2/1 μ? £?
]?)2(,?)2[( 2
2/1
2
2
2/
2

s
s
nn
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
7
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
8
5.3 假设检验问题:某一给定的观测或发现是否与某一声称的假设 ( stated
hypothesis )相符?此处用,相符,一词表示观测的值与假设的值
“足够相近,,因而我们不拒绝所声称的假设。
虚拟假设 ( Null hypothesis ):一种信以为真的、意在维护的或理论上的假设,并用 H0 表示。
与之对立的假设称为 对立假设 ( alternative hypothesis ),记为 H1。
对立假设可以是简单的或复合的。例如,H1,?2=1 是一个简单假设,
但是 H1,?2?1 则是一个复合假设。
方法:有显著性检验和置信区间两种方法。
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
9
5.4 假设检验,置信区间方法
H
0
£1
*
22
£o H
1
£1
*
22

óì?o ·
2
μó?÷ ê ía? μ÷ ía £1
)]
(
),
(
[
2
2
22
2
2


setset£
2
óú?ù èè H
0
£1
*
22
á á ′ê?÷ £?
ì 2o?a?ü?÷ H
0
ù èè £? μ? á? óú?÷ ìa £ì?ü?÷ H
0
ù èè?£
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
10
5.5 假设检验:显著性检验方法
**
0 2 2 1 2 2
*
2 2 2 2
0
2
2
2
1
*
22
2
22
2
1
22
**
2 2 2
22
22
11
2 0 0
,;,

( 2)
()?
( ) 1

[,]
,
n
i
i
n
i
i
nn
ii
ii
HH
H t t n
se
X
P t t
X
tt
XX
HH




s

s
ss








若 为 真,则因 此 有,
若 据 样 本 计 算 的 在 此 区 间,则 不 拒 绝 否 则 拒 绝 。
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
11
t检验方法的直接计算
1-ò éü ò?
- t
/2
O t
/2
t
H0,*22 ; H1,*22 。
计算 22 22
2
22
/?
)?(
ixse
t s
比较 |t|与
2
t,
|t|>
2
t ( t 值大)?
“统计量的值落入 临界域 内
统计量在统计上 显著
拒绝 H0假设?Pr(t)<?( P 值小)。
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
12
置信区间方法与显著性检验方法的关系
在置信区间程序中,我们试图建立一个以某种概率包含有真实但未知的 的一个范围或区间;
而在显著性检验步骤中,我们假设 为某值,然后来看所计算的 是否位于该假设值周围的某个合理 (置信 )范围之内。
2?
2?
2
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
13
显著性 t检验:决策规则
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
14
s2检验的显著性(?2检验)
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
15
补充:自由度
模型中样本值可以自由变动的个数,称为自由度
自由度 =样本个数 -样本数据受约束条件
(方程)的个数
例如,样本数据个数 =n,它们受 k+1个方程的约束(这 n个数必须满足这 k+1个方程)
那么,自由度 df = n-k-1
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
16
数据个数与约束方程
Y1+Y2+Y3=7
Y1=7
那么 Y2,Y3中只有 1个是自由的。
又如:
Y1+Y2+Y3+Y4=7
Y1=7
那么,Y2,Y3,Y4中只有 2个是自由的
k元模型中随机扰动项的自由度为什么
=n-k-1?




的由来。个方程求出。这就是过上列个通个是自由的,其余中只有个的自由度个方程的约束。因此,受个变数这里共有求导)(对求导)(对求导)(对求偏导数:
2
1
1
11
1111
11
11
2
2
1
11,1)1(
1
0
0
0
0
0
0







kn
i
ii
k i
i
i
kikki
i
ik
ikki
i
i
ikki
i
iikkii
k
kknnknkn
kn
a
a
aa
M i nM i n
u
uu
ux
ux
u
bxbxbyx
bxbxbyx
xbxby
uxbxbau
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
18
5.6 P value
P value
– 当我们对给定的样本算出一个检验统计量
(如 t统计量 )的值时,为什么不干脆查阅适当的统计表,看看得到一个大到和从样本得到的检验统计量那样大的数值的确切概率?
– 这个概率就叫做 P值 (P value)
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
19
5.7 回归分析的应用:预测问题
样本回归函数的一个用途是,预测,或
,预报,对应于给定 X的未来的 Y值。
– 均值预测
已知 X的值,去预测 Y的条件均值
– 个值预测
已知 X的值,去预测 Y的一个个别值
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
20
均值预测 (mean prediction)
ó ò| òú D¨μ? X ±? ·? êμ X
0
£? ó¤2a Y μt?ù?μ E(Y
0
)?£
μ
0210

XY
÷




2
2
0
2/002
2
0
2/0
)(1
)(
)(1
ii
x
XX
n
tYYE
x
XX
n
tY

2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
21
个值预测
(individual prediction)
1?¢ μ
0210

XY
2?¢?÷




2
2
0
2/002
2
0
2/0
)(1
1
)(1
1
ii
x
XX
n
tYY
x
XX
n
tY

2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
22
均值预测与各值预测之比较
1?¢ Y
0
μ÷ ±? Y
0
μù?μ E ( Y
0
) μ÷í £o
2?¢?a÷ ò? μí óú X £? X ′? μ? ×£
X
X
Y?ù?μ μ÷
Y ·μ μ÷
Y
Y
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
23
5.8 报告回归分析的结果
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
24
5.9 评价回归分析的结果
一些准则:
– 1、所估系数的符号是否与理论或事前预期相一致?
– 2、系数在统计上是否显著?
– 3、方程的显著性(回归模型在多大程度上解释了因变量的变异)
– 4、残差的正态性检验
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
25
正态性检验
正态性检验方法
– Chi-卡方拟合优度检验
– 雅克一贝拉( JB)检验
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
26
补充,Moments of a Random
Variable
The l-th moment of a continuous
random variable X is defined as
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
27
The first moment is called the mean or
expectation of X,It measures the
central location of the distribution.We
denote the mean of X by μ x.
The l-th central moment of X is defined
as
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
28
The second central moment,denoted
by,measures the variability of X
and is called the variance of X,
The positive square root,σ x,of
variance is the standard deviation of X.
2xs
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
29
The third central moment measures the
symmetry of X with respect to its
mean,whereas the 4th central moment
measures the tail behavior of X,
In statistics,skewness and kurtosis,
which are normalized 3rd and 4th
central moments of X,are often used
to summarize the extent of asymmetry
and tail thickness,
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
30
Specifically,the skewness and kurtosis
of X are defined as
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
31
习题
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
32
作业发送邮箱
fin.engineering@yahoo.com.cn