二、标准差与变异系数第二节一、方差机动 目录 上页 下页 返回 结束三、协方差与相关系数方差、协方差和相关系数第四章四、矩问题出在甲班成绩都集中在 65~75分之间,而乙班成绩数学期望反映了随机变量的主要特征 (反映了随机变乙班,但在乙班有 5人成绩为优,而甲班却没有一个优。
量的 集中趋势 ),但只是一个方面,例如两个毕业班级中,
分散且不及格很多,也有 5人高于 85分。如果成绩优秀分数线定在 85分,那么,就会出现上述现象。
上例说明研究随机变量取值的 分散程度 也很重要,
甲班平均成绩为 70分,乙班平均成绩为 65分,甲班优于机动 目录 上页 下页 返回 结束而方差正是分散程度的一种量度,方差也是一个数,
故也是随机变量的数字特征 —刻画了随机变量在其中心位置附近的散布程度。
机动 目录 上页 下页 返回 结束设随机变量 X有均值 E(X)。试验中,X取的值当然不一定恰好是 E(X),而会有所偏离。偏离的量 X-E(X)本身也是随机的
(因为 X是随机的)。 我们要取这个偏离 X-E(X)的某种代表性的数字来刻画这偏离即离散的程度大小如何。我们不能就取
X-E(X)的均值,因为 E[X-E(X)]=E(X)-E(X)=0—正负偏离彼此抵消了。一种解决的方法是取 X-E(X)的绝对值以消除符号,再取其均值 })({ XEXE?
作为变量 X取值的离散程度的数字特征。这个量叫做 X的
―平均绝对差”,是常用于刻画离散程度的数字特征之一。
但是,由于绝对值在数学上处理很不方便,人们就考虑了另一种作法:先把 X-E(X)平方以消去符号,然后取其均值得
E { [X –E(X)]2 },把它作为 X取值离散程度的衡量。
这个量就叫做 X的方差。
一,方差设 X是一个随机变量,若 E{[X-E(X)]2} 存在,则称
E{[X-E(X)]2}为 X的方差或总体方差.记作 V(X),即机动 目录 上页 下页 返回 结束
V(X)=E{[X-E(X)]2}
按定义,随机变量 X的方差表达了 X的取值与其数学期望的偏离程度。若 X取值比较集中,则 V(V)较小,反之,若 X取值比较分散,则 V(X)较大。因此,V(X)是刻画 X取值分散程度的一个量,它是衡量 X取值分散程度的一个尺度。
由定义知,方差实际上就是随机变量 X的函数 g(X)=[X-E(X)]2
的数学期望。
机动 目录 上页 下页 返回 结束对于离散型随机变量 X,若其概率函数为 P{X=xi}=pi,则对于连续型随机变量 X,若其概率密度函数为 f(x),则随机变量 X的方差可按下式计算,V(X)=E(X2)-[E(X)]2
})]({[)( 2XEXEXV })]([)(2{ 22 XEXXEXE
22 )]([)()(2)( XEXEXEXE 22 )]([)( XEXE
例 1,离散型随机变量 X的分布律为计算 V(X)。
22 )]([)()( XEXEXV
22222 6.01.025.013.001.0)1(
64.036.01
解法一,直接利用定义式 。
泰勒 目录 上页 下页 返回 结束因 E(X)=-1× 0.1+0× 0.3+1× 0.5+2× 0.1=0.6
所以 V(X)=[-1-0.6]2× 0.1+[0-0.6]2× 0.3+
+[1-0.6]2× 0.5+[2-0.6]2× 0.1=0.64
解,
例 2:X~E(λ),E(X)=1/λ,求指数分布的方差 V(X)。
机动 目录 上页 下页 返回 结束例 3,X~U[a,b],E(X)=(a+b)/2,求均匀分布的方差,
解,
dxxfxXE )()(
22 dxabx
b
a?
12
b
a
x
ab
3
1 3
)(3131 22
33
aabbabab
ba dxxab 21
22 )]([)()( XEXEXV
机动 目录 上页 下页 返回 结束
( 2) 设 X是随机变量,C是常数,则有 V(CX)=C2V(X)。
( 1) 设 C是常数,则 V( C )=0 。
二、方差的性质
= C2E(X2) - C2[E(X)]2
= E(C2X2) - [CE(X)]2
麦克劳林 目录 上页 下页 返回 结束证,V(CX) = E[(CX)2] - [E(CX)]2
证,V(X) = E{[C-E(C)]2} = E{[C-C]2} = 0
= C2{E(X2) - [E(X)]2}
= C2V(X)
( 3)设 X,Y是两个随机变量,则证,V(X+Y)=E{[(X+Y)-E(X+Y)]2}
机动 目录 上页 下页 返回 结束
V(X+Y)=V(X)+V(Y)+2E{[X-E(X)][Y-E(Y)]}
特别,若 X,Y相互独立,则有 V(X+Y)=V(X)+V(Y)。
=E{[(X-E(X))+(Y-E(X))]2}
=E{[X-E(X)]2}+E{[Y-E(Y)]2}+2E{[X-E(X)][Y-E(Y)]}
=V(X)+V(Y)+2E{[X-E(X)][Y-E(Y)]}
上式右端第三项,2E{[X-E(X)][Y-E(Y)]}
=2E{XY-XE(Y)-YE(X)+E(X)E(Y)}
=2{E(XY)-E(X)E(Y)-E(Y)E(X)+E(X)E(Y)}
=2{E(XY)-E(X)E(Y)}
若 X,Y相互独立,由数学期望的性质 5知道上式右端为 0,
于是 V(X+Y)=V(X)+V(Y) 。
一般地,对于 n个相互独立的随机变量 X1,X2,┄,Xn有,
V(X1+X2+┄ +Xn) = V(X1) + V(X2) + ┄ + V(Xn)
例 4,两个相互独立的随机变量 X和 Y的方差分别为 4和 2,
XX *
0])([1)(1)( * XEXEXE则
2*2** )]([)()( XEXEXV
1])[(1 2
2
2
2
XE 即 XX *
。的标准化变量称为,,方差为的数学期望为 XX *10
2
XE
例 5:设随机变量 X具有 E(X)=μ,方差 V(X)=σ 2≠ 0。记机动 目录 上页 下页 返回 结束则随机变量 3X-2Y的方差是 。
解,V(3X-2Y)=V(3X)+V(2Y)=9V(X)+4V(Y)=9× 4+4× 2=44,
三、标准差 (SD)与 变异系数 (CV(X))
方差 V(X)的算术平方根称为随机变量 X的标准差 (均方差 ),记作 SD。
)(
)()(
XE
XVXCV?
标准差的量纲与 X一致。
变异系数没有量纲,主要用于比较不同事物间的离散程度。
四、常见随机变量的方差
1 X~B(1,p) V(X)=Pq
所以 V(X)=E(X2)-[E(X)]2=02× (1-p)+12× p-p2=p(1-p)=pq 。
2 X~B(n,p) V(X)=npq
证 因 X= X1+X2+┄ +Xn,其中 X1,X2,┅,Xn相互独立且
Xi ~ B(1,p) i= 1,2,…,n 。且 V(Xi) = pq 。
所以 V(X)=V(X1+X2+…+X n)
=V(X1)+V(X2)+…V(X n)
机动 目录 上页 下页 返回 结束证 因 X的概率函数为 P{X=0}=1-p,P{X=1}=p,且 E(X)=p。
=pq+pq+…+pq =npq 。
3.
证,
ee2 2
22 )]([)()( XEXEXV
22
)()]1([ XEXXE
机动 目录 上页 下页 返回 结束
4 X~E(λ),V(X)=1/λ2
5 X~U[a,b],V(X)=(b-a)2/12
6 X~N(μ,σ2),V(X)=σ2 (证略)
例 6,设随机变量 X服从参数为 λ的泊松分布,且 P{X=1}=
解,由题设可知,X的分布律为
)0(!}{
k
ekXP k
又 P{X=1}=P{X=2},即
!2!1
2
ee
从而 λ=0 (舍去),λ=2 。故有 E(X)=2,V(X)=2。
机动 目录 上页 下页 返回 结束
P{X=2},则 E(X)=,V(X)= 。
022
五,协方差与相关系数数学期望 E(X),E(Y)只反映了 X与 Y各自的平均值,方差只反映了各自对均值的偏离程度,它们对 X与 Y之间的相互联系不提供任何信息。而由方差性质 (3)的证明知,
故 E[(X-EX)(Y-EY)] ≠0反映了 X,Y不独立的事实,这时 X与定义,数学期望 E{[X-E(X)][Y-E(Y)]}称为随机变量 X
与 Y的协方差,记作 Cov(X,Y)
即 Cov(X,Y)=E{[X-E(X)][Y-E(Y)]} 。
机动 目录 上页 下页 返回 结束当 X与 Y独立时有 V(X+Y)=V(X)+V(Y),
一般情况下,有 V(X+Y)=V(X)+V(Y)+2E[(X-EX)(Y-EY)] 。
Y之间存在着一定的关系。
当 V(X),V(Y)不变时,Cov(X,Y)的绝对值越大,X和 Y的联系越密切 ;而当 Cov(X,Y)的不变时,V(X),V(Y)变大,二者定义:随机变量 X,Y的 相关系数 为
)()(
)]}()][({[
YVXV
YEYXEXE
]}
)(
)(][
)(
)({[
YV
YEY
XV
XEXE ),( ** YXCo v?
的联系会减弱。为此,我们定义了相关系数,用来表征两个随机变量的某种联系。
性质:
1 Cov(X,Y)=Cov(Y,X)
3 V(X+Y)=V(X)+V(Y)+2Cov(X,Y)
4 Cov(X,Y)=E(XY)-E(X)E(Y)
2 Cov(X,X)=V(X)
机动 目录 上页 下页 返回 结束
5 Cov(aX,bY)=abCov(X,Y)
6 Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)
7、相关系数的取值范围为 [-1,1],即 -1≤ρ≤1 。
证明:
0
)(
)(
)(
)(
2
YV
YEY
XV
XEX
E
0
)(
)(
)(
)(
)(
)(
2
)(
)(
2
2
yV
YEY
E
YV
YEY
XV
XEX
E
XV
XEX
E
,022
8、可以证明,当 ρ= -1 或 ρ=1 时,随机变量 X与 Y有线性关系 Y=α+βX ( α,β 为常数),反之亦然。
一个数字特征。当 ρ较大时,我们通常说 X,Y线性相关机动 目录 上页 下页 返回 结束于是相关系数 ρ是表征两随机变量线性相关程度的的程度较强,当 ρ较小时,我们通常说 X,Y线性相关的程度较弱。当 ρ=0时,称 X和 Y不线性相关。
当X和Y相互独立时,由性质4知 Cov(X,Y)=0,从而 ρ=0,
即X,Y不相关.反之,若X,Y不相关,X和Y却不一定相互独立.上述情况,从“不相关”和“相互独立”的含义来看是明显的.这是因为不相关只是就线性关系来说的,而相互独立是就一般关系而言的.
例 7.设 (X,Y的分布律为易知 E(X)=0,E(Y)=5/2,E(XY)=0,于是 ρ =0,
X,Y不相关.这表示 X,Y不存在线性关系.
但 P{X= -2,Y=1}=0,而 P{X= -2)P{Y=1}=1/8,
知 X,Y不是相互独立的.事实上 X和 Y具有关系,
Y=X2,Y的值完全由 X的值所确定.
X
Y
-2 -1 1 2 P{Y=i}
1
4
0 0
0 0 1/4
1/2
P{X=i} 1/4
六、矩数学期望、方差的概念还可推广为更一般的数字特征 —矩。
若 E(Xk) 存在,则称它为 X的 k阶原点矩;
若 E{[X-E(X)]k} 存在,则称它为 X的 k阶中心矩;
定义,设 X和 Y是随机变量,
例如 目录 上页 下页 返回 结束若 E(XkYl) 存在,则称它为 X与 Y的 k+l阶混合矩;
若 E{[X-E(X)]k[Y-E(Y)]l} 存在,则称它为 X和 Y
的 k + l 阶混合中心矩,其中 k,l 为正整数。
量的 集中趋势 ),但只是一个方面,例如两个毕业班级中,
分散且不及格很多,也有 5人高于 85分。如果成绩优秀分数线定在 85分,那么,就会出现上述现象。
上例说明研究随机变量取值的 分散程度 也很重要,
甲班平均成绩为 70分,乙班平均成绩为 65分,甲班优于机动 目录 上页 下页 返回 结束而方差正是分散程度的一种量度,方差也是一个数,
故也是随机变量的数字特征 —刻画了随机变量在其中心位置附近的散布程度。
机动 目录 上页 下页 返回 结束设随机变量 X有均值 E(X)。试验中,X取的值当然不一定恰好是 E(X),而会有所偏离。偏离的量 X-E(X)本身也是随机的
(因为 X是随机的)。 我们要取这个偏离 X-E(X)的某种代表性的数字来刻画这偏离即离散的程度大小如何。我们不能就取
X-E(X)的均值,因为 E[X-E(X)]=E(X)-E(X)=0—正负偏离彼此抵消了。一种解决的方法是取 X-E(X)的绝对值以消除符号,再取其均值 })({ XEXE?
作为变量 X取值的离散程度的数字特征。这个量叫做 X的
―平均绝对差”,是常用于刻画离散程度的数字特征之一。
但是,由于绝对值在数学上处理很不方便,人们就考虑了另一种作法:先把 X-E(X)平方以消去符号,然后取其均值得
E { [X –E(X)]2 },把它作为 X取值离散程度的衡量。
这个量就叫做 X的方差。
一,方差设 X是一个随机变量,若 E{[X-E(X)]2} 存在,则称
E{[X-E(X)]2}为 X的方差或总体方差.记作 V(X),即机动 目录 上页 下页 返回 结束
V(X)=E{[X-E(X)]2}
按定义,随机变量 X的方差表达了 X的取值与其数学期望的偏离程度。若 X取值比较集中,则 V(V)较小,反之,若 X取值比较分散,则 V(X)较大。因此,V(X)是刻画 X取值分散程度的一个量,它是衡量 X取值分散程度的一个尺度。
由定义知,方差实际上就是随机变量 X的函数 g(X)=[X-E(X)]2
的数学期望。
机动 目录 上页 下页 返回 结束对于离散型随机变量 X,若其概率函数为 P{X=xi}=pi,则对于连续型随机变量 X,若其概率密度函数为 f(x),则随机变量 X的方差可按下式计算,V(X)=E(X2)-[E(X)]2
})]({[)( 2XEXEXV })]([)(2{ 22 XEXXEXE
22 )]([)()(2)( XEXEXEXE 22 )]([)( XEXE
例 1,离散型随机变量 X的分布律为计算 V(X)。
22 )]([)()( XEXEXV
22222 6.01.025.013.001.0)1(
64.036.01
解法一,直接利用定义式 。
泰勒 目录 上页 下页 返回 结束因 E(X)=-1× 0.1+0× 0.3+1× 0.5+2× 0.1=0.6
所以 V(X)=[-1-0.6]2× 0.1+[0-0.6]2× 0.3+
+[1-0.6]2× 0.5+[2-0.6]2× 0.1=0.64
解,
例 2:X~E(λ),E(X)=1/λ,求指数分布的方差 V(X)。
机动 目录 上页 下页 返回 结束例 3,X~U[a,b],E(X)=(a+b)/2,求均匀分布的方差,
解,
dxxfxXE )()(
22 dxabx
b
a?
12
b
a
x
ab
3
1 3
)(3131 22
33
aabbabab
ba dxxab 21
22 )]([)()( XEXEXV
机动 目录 上页 下页 返回 结束
( 2) 设 X是随机变量,C是常数,则有 V(CX)=C2V(X)。
( 1) 设 C是常数,则 V( C )=0 。
二、方差的性质
= C2E(X2) - C2[E(X)]2
= E(C2X2) - [CE(X)]2
麦克劳林 目录 上页 下页 返回 结束证,V(CX) = E[(CX)2] - [E(CX)]2
证,V(X) = E{[C-E(C)]2} = E{[C-C]2} = 0
= C2{E(X2) - [E(X)]2}
= C2V(X)
( 3)设 X,Y是两个随机变量,则证,V(X+Y)=E{[(X+Y)-E(X+Y)]2}
机动 目录 上页 下页 返回 结束
V(X+Y)=V(X)+V(Y)+2E{[X-E(X)][Y-E(Y)]}
特别,若 X,Y相互独立,则有 V(X+Y)=V(X)+V(Y)。
=E{[(X-E(X))+(Y-E(X))]2}
=E{[X-E(X)]2}+E{[Y-E(Y)]2}+2E{[X-E(X)][Y-E(Y)]}
=V(X)+V(Y)+2E{[X-E(X)][Y-E(Y)]}
上式右端第三项,2E{[X-E(X)][Y-E(Y)]}
=2E{XY-XE(Y)-YE(X)+E(X)E(Y)}
=2{E(XY)-E(X)E(Y)-E(Y)E(X)+E(X)E(Y)}
=2{E(XY)-E(X)E(Y)}
若 X,Y相互独立,由数学期望的性质 5知道上式右端为 0,
于是 V(X+Y)=V(X)+V(Y) 。
一般地,对于 n个相互独立的随机变量 X1,X2,┄,Xn有,
V(X1+X2+┄ +Xn) = V(X1) + V(X2) + ┄ + V(Xn)
例 4,两个相互独立的随机变量 X和 Y的方差分别为 4和 2,
XX *
0])([1)(1)( * XEXEXE则
2*2** )]([)()( XEXEXV
1])[(1 2
2
2
2
XE 即 XX *
。的标准化变量称为,,方差为的数学期望为 XX *10
2
XE
例 5:设随机变量 X具有 E(X)=μ,方差 V(X)=σ 2≠ 0。记机动 目录 上页 下页 返回 结束则随机变量 3X-2Y的方差是 。
解,V(3X-2Y)=V(3X)+V(2Y)=9V(X)+4V(Y)=9× 4+4× 2=44,
三、标准差 (SD)与 变异系数 (CV(X))
方差 V(X)的算术平方根称为随机变量 X的标准差 (均方差 ),记作 SD。
)(
)()(
XE
XVXCV?
标准差的量纲与 X一致。
变异系数没有量纲,主要用于比较不同事物间的离散程度。
四、常见随机变量的方差
1 X~B(1,p) V(X)=Pq
所以 V(X)=E(X2)-[E(X)]2=02× (1-p)+12× p-p2=p(1-p)=pq 。
2 X~B(n,p) V(X)=npq
证 因 X= X1+X2+┄ +Xn,其中 X1,X2,┅,Xn相互独立且
Xi ~ B(1,p) i= 1,2,…,n 。且 V(Xi) = pq 。
所以 V(X)=V(X1+X2+…+X n)
=V(X1)+V(X2)+…V(X n)
机动 目录 上页 下页 返回 结束证 因 X的概率函数为 P{X=0}=1-p,P{X=1}=p,且 E(X)=p。
=pq+pq+…+pq =npq 。
3.
证,
ee2 2
22 )]([)()( XEXEXV
22
)()]1([ XEXXE
机动 目录 上页 下页 返回 结束
4 X~E(λ),V(X)=1/λ2
5 X~U[a,b],V(X)=(b-a)2/12
6 X~N(μ,σ2),V(X)=σ2 (证略)
例 6,设随机变量 X服从参数为 λ的泊松分布,且 P{X=1}=
解,由题设可知,X的分布律为
)0(!}{
k
ekXP k
又 P{X=1}=P{X=2},即
!2!1
2
ee
从而 λ=0 (舍去),λ=2 。故有 E(X)=2,V(X)=2。
机动 目录 上页 下页 返回 结束
P{X=2},则 E(X)=,V(X)= 。
022
五,协方差与相关系数数学期望 E(X),E(Y)只反映了 X与 Y各自的平均值,方差只反映了各自对均值的偏离程度,它们对 X与 Y之间的相互联系不提供任何信息。而由方差性质 (3)的证明知,
故 E[(X-EX)(Y-EY)] ≠0反映了 X,Y不独立的事实,这时 X与定义,数学期望 E{[X-E(X)][Y-E(Y)]}称为随机变量 X
与 Y的协方差,记作 Cov(X,Y)
即 Cov(X,Y)=E{[X-E(X)][Y-E(Y)]} 。
机动 目录 上页 下页 返回 结束当 X与 Y独立时有 V(X+Y)=V(X)+V(Y),
一般情况下,有 V(X+Y)=V(X)+V(Y)+2E[(X-EX)(Y-EY)] 。
Y之间存在着一定的关系。
当 V(X),V(Y)不变时,Cov(X,Y)的绝对值越大,X和 Y的联系越密切 ;而当 Cov(X,Y)的不变时,V(X),V(Y)变大,二者定义:随机变量 X,Y的 相关系数 为
)()(
)]}()][({[
YVXV
YEYXEXE
]}
)(
)(][
)(
)({[
YV
YEY
XV
XEXE ),( ** YXCo v?
的联系会减弱。为此,我们定义了相关系数,用来表征两个随机变量的某种联系。
性质:
1 Cov(X,Y)=Cov(Y,X)
3 V(X+Y)=V(X)+V(Y)+2Cov(X,Y)
4 Cov(X,Y)=E(XY)-E(X)E(Y)
2 Cov(X,X)=V(X)
机动 目录 上页 下页 返回 结束
5 Cov(aX,bY)=abCov(X,Y)
6 Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)
7、相关系数的取值范围为 [-1,1],即 -1≤ρ≤1 。
证明:
0
)(
)(
)(
)(
2
YV
YEY
XV
XEX
E
0
)(
)(
)(
)(
)(
)(
2
)(
)(
2
2
yV
YEY
E
YV
YEY
XV
XEX
E
XV
XEX
E
,022
8、可以证明,当 ρ= -1 或 ρ=1 时,随机变量 X与 Y有线性关系 Y=α+βX ( α,β 为常数),反之亦然。
一个数字特征。当 ρ较大时,我们通常说 X,Y线性相关机动 目录 上页 下页 返回 结束于是相关系数 ρ是表征两随机变量线性相关程度的的程度较强,当 ρ较小时,我们通常说 X,Y线性相关的程度较弱。当 ρ=0时,称 X和 Y不线性相关。
当X和Y相互独立时,由性质4知 Cov(X,Y)=0,从而 ρ=0,
即X,Y不相关.反之,若X,Y不相关,X和Y却不一定相互独立.上述情况,从“不相关”和“相互独立”的含义来看是明显的.这是因为不相关只是就线性关系来说的,而相互独立是就一般关系而言的.
例 7.设 (X,Y的分布律为易知 E(X)=0,E(Y)=5/2,E(XY)=0,于是 ρ =0,
X,Y不相关.这表示 X,Y不存在线性关系.
但 P{X= -2,Y=1}=0,而 P{X= -2)P{Y=1}=1/8,
知 X,Y不是相互独立的.事实上 X和 Y具有关系,
Y=X2,Y的值完全由 X的值所确定.
X
Y
-2 -1 1 2 P{Y=i}
1
4
0 0
0 0 1/4
1/2
P{X=i} 1/4
六、矩数学期望、方差的概念还可推广为更一般的数字特征 —矩。
若 E(Xk) 存在,则称它为 X的 k阶原点矩;
若 E{[X-E(X)]k} 存在,则称它为 X的 k阶中心矩;
定义,设 X和 Y是随机变量,
例如 目录 上页 下页 返回 结束若 E(XkYl) 存在,则称它为 X与 Y的 k+l阶混合矩;
若 E{[X-E(X)]k[Y-E(Y)]l} 存在,则称它为 X和 Y
的 k + l 阶混合中心矩,其中 k,l 为正整数。