第四章 随机变量的数字特征数字特征的优越性:
1,较集中地反映了随机变量变化的一些平均特征。
2,很多重要的随机变量 (如二项分布、泊松分布、均匀分布、
指数分布、正态分布等 )的分布函数都能用一、两个数字特征完全确定。
3,重要的数字特征 ---数学期望、方差具有明确的统计意义,
同时还具有良好的数学性质。
4.随机变量的 数字特征较易求出。
第一节、数学期望例 1,有甲、乙两个射击选手,他们的射击技术由下表给出:
甲射手:
0.3 0.1 0.6p
8 9 10环数乙射手:
0.2 0.5 0.3p
8 9 10环数试问哪一个选手射击本领较好?
甲,8× 0.3N+9× 0.1N+10× 0.6N=9.3N
乙,8× 0.2N+9× 0.5N+10× 0.3N=9.1N
定义 4.1
设?为离散型随机变量,其分布律为若级数 绝对 收敛,则称 E(?)= 为?的数学期望 (或称 期望 或 均值 )。
,,,21 )( kxPp kk?

1k
kk px?
1k
kk px
1,设?~ B(n,p),求 E(?),E(?)=np.
2,设?~?(?),求 E(?),E(?)=?.
3,设?服从参数为 p的几何分布,求 E(?),E(?)=1/p.
例 2,设 随机变量?分布律为求 E(?) 。
,,,21 2/1)/2)1(( kkPp kkkk?
定义 4.2
设?为连续型随机变量,其分布密度为 f(x),若积分收敛,则称 为?的数学期望 (或称 期望 或 均值 )。
dxxfx )(?




dxxxfE )()(?
4,设?服从参数为?的指数分布,求 E(?),E(?)=1/?
5,设?服从 (a,b)区间上的均匀分布,求 E(?),E(?)=(a+b)/2
6,设,则 E(?)=?.)( 2,~ N
7,设?~?(?,?),则 E(?)=?/?。
.))(()212()( 22 nnEnn,则有,设例 3,设?的分布密度为
).()())1(/(1)( 2 EC a u c h yxxf 求,
例 4,设 相互独立,且均服从参数为?的指数分布,M=max{ },N=min{ },
求 E(M)和 E(N)。
n,,,?21
n,,,?21 n,,,?21
定义 4.3
对?=( ),若 都存在,
则称 为 n维随机变量?的数学期望
(或 均值向量 )。
n,,,?21 niE i,,,,?21)(
))()()(()( 21 nEEEE,,,
定理设 y=g(x)是连续函数,?=g(?):
1)?是离散型随机变量,其分布律为
2)?是连续型随机变量,其概率密度为 f(x),
,,,21)( ipxP ii?
。则
,若
i
i
i
i
i
i
pxggEE
pg ( x


1
1
)()]([)(
)

。则
,若
dxxfx)ggE
dxxfg ( x )
)(()]([)E(
)(







推广,
设 是连续函数,
1)?是离散型随机变量,其分布律为
2)?是连续型随机变量,其概率密度为
)( yxgy,?,,)( 21 。,)(
21 g?
,,,,,21)( 21 jiyxPp jiij
.)()]([)(
)(
1
21
1
ijj
ji
i
ij
ji
ji
pyxggEE
pyxg
,,则
,,若





。,)( yxf












.)()()]([)(
)()(
21
d x d yyxfyxggEE
d x d yyxfyxg
,,,则
,,,若

例 5,设二维随机变量 (?,?)的概率密度为试求的数学期望。
.0
1010
{)(
其它,;,当,


yxyx
yxf
定理
1,设 a,b,c为任意常数,若特别,E( c)=c。
。,则 bEaba )(
2,线性性:设 为任意常数,则 baaa n 和,,,?21
.)()(
11
bEabaE i
n
i
ii
n
i
i


3,若 相互独立,则
n,,,?21
。)()()()( 2121 nn EEEE
性质 设 为连续函数,
为相互独立的随机变量,则 也是相互独立的随机变量。
nixg i,,,,?21)(? n,,,?21
)()()( 2211 nnggg,,,?
由此可得
) ],([)]([)]([)]()()([ 22112211 nnnn gEgEgEgggE
例 6,(2003年数学一考研试题十一题 )
已知甲、乙两箱中装有同种产品,其中甲箱中装有 3件合格品和 3件次品,乙箱中仅装有 3件合格品。从甲箱中任取 3件产品放入乙箱后,求:
1) 乙箱中次品数 X的数学期望;
2) 从乙箱中任取一件产品是次品的概率。
例 7,(2002年数学三、四考研试题十二题 )
假设一设备开机后无故障工作的时间 X服从指数分布,
平均无故障工作的时间 (EX)为 5小时。设备定时开机,出现故障时自动关机,而在无故障的情况下工作 2小时便关机。
试求该设备每次开机无故障工作的时间 Y的分布函数 F(y)。
第二节 方差例 1.有甲、乙两个射击选手,他们的射击技术由下表给出:
击中环数 10 9 8 7 6
甲概率 0.15 0.2 0.3 0.2 0.15
乙概率 0.05 0.05 0.8 0.05 0.05
定义 4.5
设?为随机变量,若 存在,则称其为?的方差,记为
]))([( 2 EE?
].))([()()( 2 EEDV a r
称 为 标准差 (或 均方差 )。)( D?
1,设?为离散型随机变量,其分布律为则
,,,21)( ixPp ii?


1
2)]([)(
i
ii pExD
2.设?为连续型随机变量,其分布密度为 f(x),则



dxxfExD )()]([)( 2
方差实用计算公式,.)]([)()( 22 EED
公式变形,.)]([)()( 22 EDE
几种常用分布的方差:
1,设?~ B(n,p),则 D(?)=np(1-p) 。
2,设?~?(?),则 D(?)=? 。
3,设?服从参数为 p的几何分布,则 2/)1()( ppD
4,设?服从 (a,b)区间上的均匀分布,则,12/)()( 2abD
5,设?服从参数为?的指数分布,则,/1)( 2D
6,设,则)( 2,~ N,)( 2D
7,设?~?(?,?),则,/)( 2D
8,对
.2)( )212()(2 nDnn,,~
定理 4.4 (切比雪夫不等式 ) (教材 p127)
设?是随机变量,若 D(?)存在,则对任何?>0,

.)())(( 2
DEP
切比雪夫不等式的等价形式
.)(1))(( 2 DEP
思考题 (2001年数学一考研试题 )
设随机变量 X的方差为 2,则根据切比雪夫不等式估计
)2( EXXP 。
1,切比雪夫不等式可用来估计不是服从正态分布的随机变量落在 E(?)附近的概率。
2,切比雪夫不等式的主要作用是进行概率论的理论研究。
例 2 (2002年数学一考研试题十一题 )
设随机变量 X的概率密度为对 X独立地观察 4次,用 Y表示观察值大于?/3的次数,求的数学期望。2Y
其它。,;,
0
02/)2/co s (
{)(

xx
xf
定理 4.5 方差具有以下性质:
1,D(?)=0 当且仅当 P(?=c)=1,c为任意常数;特别,D(c )=0。
2,设 c 为任意常数,则 D(c?)= D(?)。2c
nccc,,,?21
3,设 为 任意常数,当 存在,有
niD i,,,,?21)(



nji
jjiiji
n
i
ii
n
i
ii EEEccDccD
11
2
1
))].())(([(2)()(
4,若 相互独立,则ni
i,,,,?21 )()(
1
2
1


n
i
ii
n
i
ii DccD
特别,若?与?相互独立,则 D(?+?)= D(?)+ D(?).
5,若 c?E(?),则 D(?)<E,2)( c
标准化随机变量:设 D(?)>0,构造 随机变量

)(
)(

D
E
则 与?服从同类分布,且称 为 标准化随机变量 。


,,1)(0)( DE
第三节、协方差和相关系数定义 4.6
对二维随机变量 (?,?),若 E{[?-E(?)][?-E(?)]} 存在,则称其为?与?的 协方差 (或 相关矩 ),记为 cov(?,?),即
cov (?,?)= E{[?-E(?)][?-E(?)]} 。
注,1) cov(?,?)=D(?),若 a为常数,则 cov(a,?)=0.
2) 协方差的实用计算公式,cov (?,?)= E()- E(?) E(?).
3) 对二维随机变量 (?,?),有计算公式:
D (?+?)= D (?)+ D (?)+2 cov (?,?).
协方差的简单性质
1.对称性,cov(?,?)= cov(?,?)。
2.线性性,cov(a?,?)= acov(?,?),
).c ov ()c ov ()c ov ( 2121,,,
由 对称性和 线性性进一步可得
,,,,
,,
)c o v()c o v()c o v(
)c o v()c o v(
222112
112121


bdadbc
acdcba


.)c o v ()c o v (
1 111


m
i
n
j
jiji
n
j
jj
m
i
ii baba,,
定义若 cov(?,?)= 0,则称?与?不相关 。
定理 4.6 对二维随机变量 (?,?),下列事实是等价的:
1) cov(?,?)= 0;
2)?与?不相关;
3) E()= E(?) E(?);
4) D (?+?)= D (?)+ D (?)。
结论 1,?与?相互独立 =>?与?不相关;
与?不相关与?相互独立 。
结论 2:设,则?与?不相关等价于?与?相互独立,即?=0。
)()( 222121,,,,~,N
思考题 2(2003年数学四考研试题 )
设随机变量 X和 Y都服从正态分布,且它们不相关,则 ( )
(A) X与 Y一定独立,(B) (X,Y)服从正态分布,
(C ) X与 Y未必独立,(D) X+Y服从一维正态分布,
思考题 3(2002年数学三考研试题填空题 )
设随机变量 X 和 Y 的联合概率分布为
0.07
0.08
- 1
0.18
0.32
0
0.15
0.20
0
1
1YX
则 和 的协方差2X 2Y?),c o v ( 22 YX
例 3(2002年数学三考研试题十一题第二小题 )
设随机变量 U在区间 [-2,2]上服从均匀分布,随机变量试求 D(X+Y)。
.11
11
11
11



U
U
Y
U
U
X
若,
,若,
{;若,
,若,

例 4(2001年数学四考研试题十二题 )
设随机变量 X和 Y的联合分布在以点 (0,1),(1,0),(1,1)
为顶点的三角形区域服从均匀分布,试求随机变量 U=X+Y的方差。
1
1
G
x+y=1
定理 4.8 (柯西 — 许瓦兹 不等式 )
对任何随机变量?与?,都有
1)
2) 等式成立当且仅当存在,使 P(?=? )=1。
0t 0t;)()()]([ 222 EEE?
定理 4.8推论,对任何随机变量?与?,都有
).()()][ co v ( 2 DD?,
)()(
)c o v ()c o v (


DD
,,
结论,设 是?与?的 标准化随机变量,则,
定义设 D(?)>0,D(?)>0,称为?与?的相关系数 (线性相关系数 ),通常简记成 r或?。
)co v (
)()(
)co v (


,

DD
r
定理 4.9 对?与?的相关系数 r,有以下结论:
1,?与?的不相关当且仅当 r=0;
2.
3,| r| =1 当且仅当存在常数 a,b,a?0使
P(?=a?+b)=1。;1?r
说明,
1,当 0< 0.3,称?与?微弱 相关;
当 0.3< 0.5,称?与?低度 相关;
当 0.5< 0.8,称?与?中等 相关 (或称 显著 相关 );
当 0.8< | r| < 1,称?与?高度 相关;
当| r| =1,称?与?完全 相关。
r
r
r
2,r=0 只说明?与?之间不存在线性关系,但完全可能存在曲线关系 )。只有当?与?相互独立,它们之间才无任何关系。
3,当 r>0,称?与?正相关,当 r<0,称?与?负相关 。
注:以上正 (负 )相关是一般教科书上给出的定义,但这种定义只能说明当?与?之间存在线性相关关系时的变化趋势。
准确地提法应该是:当?增大时,?增大 (减少 ),则称?与?
正 (负 )相关。
阐述 相关系数 r反映线性相关关系:
若用?的线性函数 a+b?,(a,b为常数 ) 来近似反映?,即
a+b?,则有以下 问题,?
1,随着 常数 a,b 取不同的值,a+b? 代表无数条直线,其中哪一条直线近似程度最好 (误差最小 )?
2,由于 a+b? 也是随机变量,如何度量 a+b? 与? 的误差?
考虑其均方 误差,]))([( 2 baEe
此处,e 是 a,b 的函数。将 e 的表达式展开,得
.)(2)()(2)(2)( 2222 aa b EEbaEbEEe
利用二元函数求极值的方法,令
,即,00 beae
性质,设
.) c ov(
)()(
21
2
2
2
121


,,
,则,,,,~,
r
N
,0)(2)(22 EbEaae
.0)(2)(2)(2 2 aEEbEbe
解方程组求出使 e 达最小的常数 得,,
00 ba
.
)(
)c o v ()()(
)(
)c o v (
00?


D
EEa
D
b,,,
).()1(
]))([(]))([(m i n
2
2
00
2
m i n

Dr
baEbaEe


将 代入 e 的表达式,经整理 可得00 ba,
结论 1,| r|越大,近似程度越好,?与?之间存在线性关系的程度越高,当 r=0,?与?之间不存在线性关系。
注意 r 与 之间存在关系:
0b
.
)(
)(
)(
)(
)(
)c o v (
)()(
)c o v (
0?



D
Db
D
D
DDD
r,,
结论 2,?与?正 (负 )相关当且仅当 >0( <0),且
0b 0b
)(
)(
0?
D
Dbr?
思考题 4 (2001年数学一、三、四考研试题 )
将一枚硬币重复掷 n 次,以 X 和 Y 分别表示正面向上和反面向上的次数,则 X 和 Y 的 相关系数等于 ( )
(A) -1,(B) 0,(C ) 1/2,(D) 1.
思考题 5 (2001年数学三考研试题填空题 )
设随机变量 X和 Y的数学期望分别为 -2,2,方差分别为 1
和 4,而 相关系数为 -0.5,则 根据切比雪夫不等式
P(| X+Y|?6)?,
思考题 6 (2003年数学三考研试题填空题 )
设随机变量 X和 Y的 相关系数为 0.9,若 Z=X-0.4,则 Y与 Z的相关系数为,
思考题 7 (2003年数学四考研试题填空题 )
设随机变量 X和 Y的 相关系数为 0.5,EX=EY=0,
222 )( 2 YXEEYEX 则,
例 5 (2003年数学四考研试题十二题 )
对于任意二事件 A和 B,0<P(A)<1,0<P(B)<1,
)()()()(
)()()(
BPAPBPAP
BPAPABP?

称做事件 A与 B的 相关系数。
(1) 证明 事件 A和事件 B独立的充分必要条件是其 相关系数等于零;
(2) 利用 随机变量 相关系数的基本性质,证明|?|?0.
定义 4.9 设 为 n维随机变量,记 )(
21 n,,,
,,,,,,,njijiij?21)co v (
称 为?的协方差矩阵。
nnijC )(?
n维正态分布的 性质,
1,服从 n维正态分布的 充分必要 条件是:
服从一维正态分布,其中,i=1,2,…n 为常数。
)( 21 n,,,
n
i
iia
1
ia
2.设 服从 n维正态分布,令 )(
21 n,,,
则 服从 m维正态分布。)(
21 m,,
,,,,mia
n
j
jiji?1
1


3.设 ( ) 服从 n维正态分布,则相互独立的 充分必要 条件是 两两不相关。
n,,21 n,,21
n,,21