1
概率论与数理统计第 14讲本文件可从网址
http://math.vip.sina.com
上下载
(单击 ppt讲义后选择 '概率论 '子目录 )
2
3.3 条件期望
3
例 1 两封信随机投向 1,2,3,4四个信箱,x1,x2代表头两个信箱里的信数目,求在第 2个邮箱里有一封信条件下第一个邮箱内信数的平均数,
解 因已经计算出
3
1
3
1
1
3
2
0}1|{
,1,
)1,0(
3
2
3
1
}1|{
21
12
1
21
xx
xx
xx
E
kkP
kk
的平均值应为条件下在因此
4
对于二元离散型随机变量 (x,h),在 x取某一个定值,比如 x=xi的条件下,求 h的数学期望,
称此期望为给定 x=xi时 h的条件期望,记作
E{h|x=xi},有
i
jiij
j
j
ijji
yxPxyE
y
xyPyxE
}|{}|{
}|{}|{
hxhx
xh
xhxh
的条件期望为时关于同样地定义给定
5
对于二元连续型随机变量,定义
xyxxE
yxyyE
d)|()|(
d)|()|(
hx
xh
其中?(y|x)及?(x|y)分别是在 x=x条件下关于 h
的条件概率密度和在 h=y条件下关于 x的条件概率密度,当然这个定义假定各式都是有意义的,
6
3.4 方差、协方差
(一 ) 方差的概念
7
先看两个例子设甲,乙两炮射击弹着点与目标的距离分别为 x1,x2(为简便起见,假定它们只取离散值 ),
并有如下分布律,
则两炮有相同的期望值 (Exi=90,i=1,2),但比较两组数据可知乙炮较甲炮准确,弹着点集中,
x1 80 85 90 95 100
P 0.2 0.2 0.2 0.2 0.2
x2 85 87.5 90 92.5 95
P 0.2 0.2 0.2 0.2 0.2
8
图示比较,
90
90
95
95
85
8580 100
9
又如有两批钢筋,每批各 10根,它们的抗拉强度指标如下,
第一批,110,120,120,125,125,125,130,130,
135,140
第二批,90 100 120 125 130 130 135 140 145
145
它们的平均抗拉强度指标都是 126,但是,使用钢筋时,一般要求抗拉强度指标不低于一个指定数值 (如 115),那么,第二批钢筋的抗拉强度指标与平均值偏差较大,即取值较分散,
不合格的多,可以认为第二批比第一批质量差,
10
可见在实际问题中,仅靠期望值 (或平均值 )
不能完善地说明随机变量的分布特征,还必须研究其离散程度,通常人们关心的是随机变量 x对期望值 Ex的离散程度,
定义 3.3 如果随机变量 x的数学期望 Ex存在,称
x?Ex为随机变量的离差,
显然,随机变量离差的期望是零,即
E(x?Ex)=0
不论正偏差大还是负偏差大,同样都是离散程度大,为了消除离差 x?Ex的符号,用 (x?Ex)2来衡量 x与 Ex的偏差,
11
定义 3.4
2
2
)(
)(
.
,
,
xxx
x?x
x
x
x
x
EED
D
D
或方差根的标准差称为或而或记作称为随机变量的方差离差平方的数学期望随机变量
12
如果 x是离散型随机变量,并且
P{x=xk}=pk (k=1,2,...),则
xxExD
x
pExD
k
kk
d)()(
),(,
)(
2
2
xx
x
xx
则有概率密度是连续型随机变量如果可见随机变量的方差是非负数,Dx?0,常量的方差是零,当 x的可能值密集在它的期望值 Ex
附近时,方差较小,反之则方差较大,因此方差的大小可以表示随机变量分布的离散程度
13
在数学推导中喜欢用方差 Dx,而在实际应用中则更喜欢用标准差?x,这是因为标准差的量纲和随机变量的量纲一样,随机变量的单位是元,则标准差的单位也是元,随机变量的单位是公斤,则标准差的单位也是公斤,对于一些测量工具的误差通常用标准差来描述,而这是有国家标准的,一个经验之谈,任何随机变量在实际实验中和它的数学期望之差超过 3到 5
倍的标准差是实际不可能的,但数学上不承认这一点,例如,假设一个秤的标准差为一克,它称一公斤的东西可能不会正好一公斤,但决无可能是 0.994公斤,也无可能是 1.006公斤,
14
图示,方差大和方差小的情况方差小方差大?1(x)
2(x)
x
x
15
例 1 计算参数为 p的 0-1分布的方差解 根据 x的概率函数
P{x=1}=p P{x=0}=1?p=q
则 Ex=0?q+1?p=p
Dx=(0?p)2q+(1?p)2p=
=p(pq+q2)=pq(p+q)=pq
=p(1?p)
Ex=p Dx=pq
16
例 2 计算本节开始所举甲乙两炮射击中 Dx1,
及 Dx2
解 Ex1=Ex2=90,则
Dx1=102?0.2+52?0.2+02?0.2+52?0.2+102?0.2
=50
Dx2=52?0.2+2.52?0.2+02?0.2+2.52?0.2+52?0.2
=12.5
x1 80 85 90 95 100
P 0.2 0.2 0.2 0.2 0.2
x2 85 87.5 90 92.5 95
P 0.2 0.2 0.2 0.2 0.2
17
方差的性质
(1) 常量的方差等于零证 D(c)=E(c?Ec)2=E(c?c)2=0
(2) 随机变量与常量之和的方差就等于这个随机变量的方差本身证 D(x+c)=E{x+c?E(x+c)}2=E{x+c?Ex?c)2
=E(x?Ex)2=Dx
(3) 常量与随机变量乘积的方差,等于这常量的平方与随机变量方差的乘积,
证 D(cx)=E{cx?E(cx)}2=E{c(x?Ex)}2
=E{c2(x?Ex)2}=c2Dx
18
图示性质
c x?c的概率密度
x的概率密度
x的概率密度
cx的概率密度
19
(4) 两个独立随机变量之和的方差,等于这两个随机变量方差的和证 D(x+h)=E{x+h?E(x+h)}2
=E{x?Ex+h?Eh}2
=E{(x?Ex)2+(h?Eh)2+2(x?Ex)(h?
Eh)}
=E(x?Ex)2+E(h?Eh)2+2E{(x?Ex)(h?
Eh)}
=Dx+Dh
这是因为 x与 h独立,则 x?Ex与 h?Eh也独立,
因此 E{(x?Ex)(h?Eh)}=E(x?Ex)E(h?Eh)=0
20
性质 4可以推广到任意有限个随机变量即,若 x1,x2,...,xn相互独立,则有
D(x1+x2+...+xn)=Dx1+Dx2+...+Dxn
进一步可得,n个相互独立的随机变量的算术平均数的方差等于其方差算术平均数的 1/n倍,
n
DDD
nn
D nn xxxxxx
2121 1
21
(5) 任意随机变量的方差等于这个随机变量平方的期望与其期望平方之差,即
Dx=Ex2?(Ex)2
证 Dx=E(x?Ex)2
=E{x2?2xEx+(Ex)2}
=Ex2?2Ex?Ex+(Ex)2
=Ex2?(Ex)2
这个公式很重要,实际上计算一个随机变量的方差用的是这个公式,
22
计算 Ex2的办法,
dxxxE
pxE
k
kk
)(
:
:
22
22
x
x
x
x
为连续型当为离散型当
23
例 3 计算在区间 [a,b]上服从均匀分布的随机变量 x的方差,
解 已知 x的概率密度为在 3.1例 4中已算出
Ex=(a+b)/2
其它0
1
)(
bxa
abx?
2
233
22
33
222
)(
12
1
4
)(
)(3
)(
)(
)(3
)(1
)(
ab
ab
ab
ab
EED
ab
ab
dx
ab
xdxxxE
b
a
xxx
x
24
上面的解法太麻烦,另一种简单的解法是,
先求出在 [0,1]区间均匀分布的随机变量的方差,再乘上 (b?a)2,就是在 [a,b]区间均匀分布的随机变量的方差,
12
)(
,
2
)(
2
1
,],[)(
12
1
4
1
3
1
)(,
3
1
2
1
5.0
0
101
)(~
2
22
1
0
22
ab
D
ba
aabE
baaab
EEDdxxE
E
x
x
hh
xh
xxxx
x?x
因此上均匀分布服从在则则其它设
25
例 1 两相互独立的随机变量 x,h的分布如下面两表所示,计算 D(x?h)
解 Ex=9?0.3+10?0.5+11?0.2=9.9
Eh=6?0.4+7?0.6=6.6
Ex2=81?0.3+100?0.5+121?0.2=98.5
Dx=Ex2?(Ex)2=98.5?98.01=0.49
Eh2=62?0.4+72?0.6=43.8
Dh=Eh2?(Eh)2=43.8?43.56=0.24
D(x?h)=Dx+Dh=0.49+0.24=0.73
x 9 10 11
P 0.3 0.5 0.2
h 6 7
P 0.4 0.6
26
例 5 若连续型随机变量的概率密度是
cba
dxxx
dxxx
dxx
EDE
EED
cbaDE
xcbxax
x
,,
4.0)(
5.0)(
1)(
4.025.015.0)(
,15.0)(:
,,,15.0,5.0
0
10
)(
2
22
22
2
联立解得则从则因解求系数已知其它
xxx
xxx
xx
27
也即从
3,12,12
4.0
3
1
4
1
5
1
5.0
2
1
3
1
4
1
1
2
1
3
1
4.0)(
5.0)(
1)(
1
0
234
1
0
23
1
0
2
cba
cba
cba
cba
dxcxbxax
dxcxbxax
dxcbxax
解得
28
求方差的统计学办法求方差的统计学办法即是通过反复地试验来获得方差,假设经过了 n次试验,获得了 n个随机变量 x的数据 a1,a2,...,an,
222
1
2
2
11
2
1
22
1
2
21
)(
1
1
2
1
)2(
1
)(
1
/)...(,
xxx
xx
xxxx
x
EEa
n
a
n
a
n
aa
n
a
n
D
naaa
n
i
i
n
i
i
n
i
i
n
i
ii
n
i
i
n
则获得先统计其均值
29
如果有 n个相互独立的随机变量 x1,x2,...,xn,它们的方差都相同,为?2,则它们的和
x1+x2+...+xn的方差就是 Dx1+Dx2+...+Dxn=n?2,
因此它们的标准差就是
xxx nD n )( 21?
例如,假设 100个同方差的相互独立的随机变量相加,和的方差是每一个方差的一 100倍,而标准差只是每一个的标准差的 10倍,
30
例 假设在会计计数时,每个数都四舍五入到角,则四舍五入的误差是一个随机变量,在?5
分到 5分之间均匀分布,因此方差为
)(2887.0
12
1,
12
1 角标准差为?
如果算帐时有 10000个数相加,则四舍五入的误差也就相加,而和的标准差是每个数的标准差的 100倍,即约 28.87角,或 2.887元,
每个数最大可能误差为 5分,则 10000个数的最大可能误差为 5000角,或者 500元,但这种情况几乎不可能发生,
31
作业 习题三第 8,9,12,13题
D组交作业
32
请提问
概率论与数理统计第 14讲本文件可从网址
http://math.vip.sina.com
上下载
(单击 ppt讲义后选择 '概率论 '子目录 )
2
3.3 条件期望
3
例 1 两封信随机投向 1,2,3,4四个信箱,x1,x2代表头两个信箱里的信数目,求在第 2个邮箱里有一封信条件下第一个邮箱内信数的平均数,
解 因已经计算出
3
1
3
1
1
3
2
0}1|{
,1,
)1,0(
3
2
3
1
}1|{
21
12
1
21
xx
xx
xx
E
kkP
kk
的平均值应为条件下在因此
4
对于二元离散型随机变量 (x,h),在 x取某一个定值,比如 x=xi的条件下,求 h的数学期望,
称此期望为给定 x=xi时 h的条件期望,记作
E{h|x=xi},有
i
jiij
j
j
ijji
yxPxyE
y
xyPyxE
}|{}|{
}|{}|{
hxhx
xh
xhxh
的条件期望为时关于同样地定义给定
5
对于二元连续型随机变量,定义
xyxxE
yxyyE
d)|()|(
d)|()|(
hx
xh
其中?(y|x)及?(x|y)分别是在 x=x条件下关于 h
的条件概率密度和在 h=y条件下关于 x的条件概率密度,当然这个定义假定各式都是有意义的,
6
3.4 方差、协方差
(一 ) 方差的概念
7
先看两个例子设甲,乙两炮射击弹着点与目标的距离分别为 x1,x2(为简便起见,假定它们只取离散值 ),
并有如下分布律,
则两炮有相同的期望值 (Exi=90,i=1,2),但比较两组数据可知乙炮较甲炮准确,弹着点集中,
x1 80 85 90 95 100
P 0.2 0.2 0.2 0.2 0.2
x2 85 87.5 90 92.5 95
P 0.2 0.2 0.2 0.2 0.2
8
图示比较,
90
90
95
95
85
8580 100
9
又如有两批钢筋,每批各 10根,它们的抗拉强度指标如下,
第一批,110,120,120,125,125,125,130,130,
135,140
第二批,90 100 120 125 130 130 135 140 145
145
它们的平均抗拉强度指标都是 126,但是,使用钢筋时,一般要求抗拉强度指标不低于一个指定数值 (如 115),那么,第二批钢筋的抗拉强度指标与平均值偏差较大,即取值较分散,
不合格的多,可以认为第二批比第一批质量差,
10
可见在实际问题中,仅靠期望值 (或平均值 )
不能完善地说明随机变量的分布特征,还必须研究其离散程度,通常人们关心的是随机变量 x对期望值 Ex的离散程度,
定义 3.3 如果随机变量 x的数学期望 Ex存在,称
x?Ex为随机变量的离差,
显然,随机变量离差的期望是零,即
E(x?Ex)=0
不论正偏差大还是负偏差大,同样都是离散程度大,为了消除离差 x?Ex的符号,用 (x?Ex)2来衡量 x与 Ex的偏差,
11
定义 3.4
2
2
)(
)(
.
,
,
xxx
x?x
x
x
x
x
EED
D
D
或方差根的标准差称为或而或记作称为随机变量的方差离差平方的数学期望随机变量
12
如果 x是离散型随机变量,并且
P{x=xk}=pk (k=1,2,...),则
xxExD
x
pExD
k
kk
d)()(
),(,
)(
2
2
xx
x
xx
则有概率密度是连续型随机变量如果可见随机变量的方差是非负数,Dx?0,常量的方差是零,当 x的可能值密集在它的期望值 Ex
附近时,方差较小,反之则方差较大,因此方差的大小可以表示随机变量分布的离散程度
13
在数学推导中喜欢用方差 Dx,而在实际应用中则更喜欢用标准差?x,这是因为标准差的量纲和随机变量的量纲一样,随机变量的单位是元,则标准差的单位也是元,随机变量的单位是公斤,则标准差的单位也是公斤,对于一些测量工具的误差通常用标准差来描述,而这是有国家标准的,一个经验之谈,任何随机变量在实际实验中和它的数学期望之差超过 3到 5
倍的标准差是实际不可能的,但数学上不承认这一点,例如,假设一个秤的标准差为一克,它称一公斤的东西可能不会正好一公斤,但决无可能是 0.994公斤,也无可能是 1.006公斤,
14
图示,方差大和方差小的情况方差小方差大?1(x)
2(x)
x
x
15
例 1 计算参数为 p的 0-1分布的方差解 根据 x的概率函数
P{x=1}=p P{x=0}=1?p=q
则 Ex=0?q+1?p=p
Dx=(0?p)2q+(1?p)2p=
=p(pq+q2)=pq(p+q)=pq
=p(1?p)
Ex=p Dx=pq
16
例 2 计算本节开始所举甲乙两炮射击中 Dx1,
及 Dx2
解 Ex1=Ex2=90,则
Dx1=102?0.2+52?0.2+02?0.2+52?0.2+102?0.2
=50
Dx2=52?0.2+2.52?0.2+02?0.2+2.52?0.2+52?0.2
=12.5
x1 80 85 90 95 100
P 0.2 0.2 0.2 0.2 0.2
x2 85 87.5 90 92.5 95
P 0.2 0.2 0.2 0.2 0.2
17
方差的性质
(1) 常量的方差等于零证 D(c)=E(c?Ec)2=E(c?c)2=0
(2) 随机变量与常量之和的方差就等于这个随机变量的方差本身证 D(x+c)=E{x+c?E(x+c)}2=E{x+c?Ex?c)2
=E(x?Ex)2=Dx
(3) 常量与随机变量乘积的方差,等于这常量的平方与随机变量方差的乘积,
证 D(cx)=E{cx?E(cx)}2=E{c(x?Ex)}2
=E{c2(x?Ex)2}=c2Dx
18
图示性质
c x?c的概率密度
x的概率密度
x的概率密度
cx的概率密度
19
(4) 两个独立随机变量之和的方差,等于这两个随机变量方差的和证 D(x+h)=E{x+h?E(x+h)}2
=E{x?Ex+h?Eh}2
=E{(x?Ex)2+(h?Eh)2+2(x?Ex)(h?
Eh)}
=E(x?Ex)2+E(h?Eh)2+2E{(x?Ex)(h?
Eh)}
=Dx+Dh
这是因为 x与 h独立,则 x?Ex与 h?Eh也独立,
因此 E{(x?Ex)(h?Eh)}=E(x?Ex)E(h?Eh)=0
20
性质 4可以推广到任意有限个随机变量即,若 x1,x2,...,xn相互独立,则有
D(x1+x2+...+xn)=Dx1+Dx2+...+Dxn
进一步可得,n个相互独立的随机变量的算术平均数的方差等于其方差算术平均数的 1/n倍,
n
DDD
nn
D nn xxxxxx
2121 1
21
(5) 任意随机变量的方差等于这个随机变量平方的期望与其期望平方之差,即
Dx=Ex2?(Ex)2
证 Dx=E(x?Ex)2
=E{x2?2xEx+(Ex)2}
=Ex2?2Ex?Ex+(Ex)2
=Ex2?(Ex)2
这个公式很重要,实际上计算一个随机变量的方差用的是这个公式,
22
计算 Ex2的办法,
dxxxE
pxE
k
kk
)(
:
:
22
22
x
x
x
x
为连续型当为离散型当
23
例 3 计算在区间 [a,b]上服从均匀分布的随机变量 x的方差,
解 已知 x的概率密度为在 3.1例 4中已算出
Ex=(a+b)/2
其它0
1
)(
bxa
abx?
2
233
22
33
222
)(
12
1
4
)(
)(3
)(
)(
)(3
)(1
)(
ab
ab
ab
ab
EED
ab
ab
dx
ab
xdxxxE
b
a
xxx
x
24
上面的解法太麻烦,另一种简单的解法是,
先求出在 [0,1]区间均匀分布的随机变量的方差,再乘上 (b?a)2,就是在 [a,b]区间均匀分布的随机变量的方差,
12
)(
,
2
)(
2
1
,],[)(
12
1
4
1
3
1
)(,
3
1
2
1
5.0
0
101
)(~
2
22
1
0
22
ab
D
ba
aabE
baaab
EEDdxxE
E
x
x
hh
xh
xxxx
x?x
因此上均匀分布服从在则则其它设
25
例 1 两相互独立的随机变量 x,h的分布如下面两表所示,计算 D(x?h)
解 Ex=9?0.3+10?0.5+11?0.2=9.9
Eh=6?0.4+7?0.6=6.6
Ex2=81?0.3+100?0.5+121?0.2=98.5
Dx=Ex2?(Ex)2=98.5?98.01=0.49
Eh2=62?0.4+72?0.6=43.8
Dh=Eh2?(Eh)2=43.8?43.56=0.24
D(x?h)=Dx+Dh=0.49+0.24=0.73
x 9 10 11
P 0.3 0.5 0.2
h 6 7
P 0.4 0.6
26
例 5 若连续型随机变量的概率密度是
cba
dxxx
dxxx
dxx
EDE
EED
cbaDE
xcbxax
x
,,
4.0)(
5.0)(
1)(
4.025.015.0)(
,15.0)(:
,,,15.0,5.0
0
10
)(
2
22
22
2
联立解得则从则因解求系数已知其它
xxx
xxx
xx
27
也即从
3,12,12
4.0
3
1
4
1
5
1
5.0
2
1
3
1
4
1
1
2
1
3
1
4.0)(
5.0)(
1)(
1
0
234
1
0
23
1
0
2
cba
cba
cba
cba
dxcxbxax
dxcxbxax
dxcbxax
解得
28
求方差的统计学办法求方差的统计学办法即是通过反复地试验来获得方差,假设经过了 n次试验,获得了 n个随机变量 x的数据 a1,a2,...,an,
222
1
2
2
11
2
1
22
1
2
21
)(
1
1
2
1
)2(
1
)(
1
/)...(,
xxx
xx
xxxx
x
EEa
n
a
n
a
n
aa
n
a
n
D
naaa
n
i
i
n
i
i
n
i
i
n
i
ii
n
i
i
n
则获得先统计其均值
29
如果有 n个相互独立的随机变量 x1,x2,...,xn,它们的方差都相同,为?2,则它们的和
x1+x2+...+xn的方差就是 Dx1+Dx2+...+Dxn=n?2,
因此它们的标准差就是
xxx nD n )( 21?
例如,假设 100个同方差的相互独立的随机变量相加,和的方差是每一个方差的一 100倍,而标准差只是每一个的标准差的 10倍,
30
例 假设在会计计数时,每个数都四舍五入到角,则四舍五入的误差是一个随机变量,在?5
分到 5分之间均匀分布,因此方差为
)(2887.0
12
1,
12
1 角标准差为?
如果算帐时有 10000个数相加,则四舍五入的误差也就相加,而和的标准差是每个数的标准差的 100倍,即约 28.87角,或 2.887元,
每个数最大可能误差为 5分,则 10000个数的最大可能误差为 5000角,或者 500元,但这种情况几乎不可能发生,
31
作业 习题三第 8,9,12,13题
D组交作业
32
请提问