第三章 随机变量的数字特征
【授课对象】理工类本科二年级
【授课时数】4学时
【授课方法】课堂讲授与提问相结合
【基本要求】1、理解数学期望、方差的概念,并掌握它们的性质。
2、会计算随机变量函数的数学期望。
3、了解协方差、相关系数的概念。
【本章重点】对数学期望、方差、相关系数等数字特征概念的理解与计算。
【本章难点】对不相关与相互独立间关系的理解。
【授课内容及学时分配】
§3.0 前 言从上一章我们可以看出,分布函数(或密度函数、分布列)给出了随机变量的一种最完全的描述。因此,原则上讲,全面认识和分析随机现象就应当求出随机变量的分布,但是对许多实际问题来讲,要想精确地求出其分布是很困难的。其实,通过对现实问题的分析,人们发现对某些随机现象的认识并不要求了解它的确切分布,而只要求掌握他们的某些重要特征,这些特征往往更能集中地反映随机现象的特点。例如要评价两个不同厂家生产的灯泡的质量,人们最关心的是谁家的灯泡使用的平均寿命更长些,而不需要知道其寿命的完全分布,同时还要考虑其寿命与平均寿命的偏离程度等,这些数据反映了它在某些方面的重要特征。
我们把刻划随机变量(或其分布)某些特征的确定的数值称为随机变量的数字特征。
本章主要介绍反应随机变量取值的集中位置、分散程度以及随机变量之间的线性相依程度的数字特征——数学期望、方差与相关系数(矩)。
§3.1 随机变量的数学期望一、离散型随机变量的数学期望引例:甲、乙二人进行射击比赛,以、分别表示他们命中的环数,其分布列分别为 ~ ~
试问谁的技术好些?
解:这个问题的答案并不是一眼看得出的。这说明了分布列虽然完整地描述了离散型随机变量的概率特征,但是却不够“集中”地反映出它的变化情况,因此我们有必要找出一些量来更集中、更概括地描述随机变量,这些量多是某种平均值。
若在上述问题中,使两个射手各射N枪,则他们打中靶的总环数大约是:
甲 8N+90.1N+100.6N=9.3N
乙 80.2N+90.5N+100.3N=9.1N
平均起来甲每枪射中9.3环,乙每枪射中9.1环,因此可以认为甲射手的本领要好些。
受上面问题的启发,对一般离散型随机变量,我们引入如下定义:
定义1:设为离散型随机变量,其分布列为:,若+
则称:E=为的数学期望或均值。
〖注〗:为使E与级数各项的次序无关,必须要求收敛;否则,不存在。
例1:设用一个匀称的骰子来玩游戏。在这样的游戏中,若骰子向上为2,则玩游戏的人赢20元,若向上为4则赢40元,若向上为6则输30元,若其它的面向上,则玩游戏的人既不赢也不输,求玩游戏的人赢得钱数的期望和。
解:令为任何一次抛掷中赢得钱数,则,则由离散型随机变量数学期望的定义可知:
从而玩游戏的人可期望赢5元,因此,在一个公正的游戏中,玩游戏的人为了参加游戏应当付5元底金。
例2:设随机变量只取非负整数值,且其分布列为,
试求。
解:
从而有
所以
二、连续型随机变量的数学期望由离散型随机变量数学期望的定义,我们自然可以设想取很密的分点,将分割成个小区间,则落在内的概率等于(积分中值定理),其中落在与之间,因此当时,与以概率取值的离散型随机变量相似,而后者的数学期望为,而这个和式的极限就是。
为此,对一般连续型随机变量,我们引入如下定义:
定义2:设为连续型随机变量,其密度函数为,若广义积分
,则称为的数学期望或均值。
我们知道,若在点连续时,有,从而,所以上述定义等价于:
定义2’:设~,若,则称为的数学期望或均值。
顺便指出,该定义是数学期望的一般定义,它对于离散型和连续型随机变量都适用。
例3:设连续型随机变量,求。
解:由连续型随机变量数学期望的定义可知:
三、随机变量函数的数学期望我们经常需要求随机变量函数的数学期望,这时可以通过下面的定理来求随机变量函数的数学期望。
定理:设是随机变量的函数:(其中是连续函数),
(1)是离散型随机变量,它的分布律为,若,则有;
(2)是连续型随机变量,其密度函数为,若,则有。
定理的证明超出了本书的范围,故略。
定理的重要意义在于当我们求时,不必算出的分布律或密度函数,而只需利用的分布律或密度函数就可以求出。
例4:设,求。
解:令,则=
=(e-1)=
上述定理还可以推广到两个或两个以随机变量函数的情形:
假设是随机变量的函数:(其中是连续函数)
(3) (,)为二维离散型随机变量,其联合分布列为,,若,则有;
(4)(,)为二维连续型随机变量,其联合密度函数为,若
,则有。
例5:设(,)的密度函数为
试求,的数学期望。
解:由定义知:
===1/3
四、数学期望的性质
1.若,则。特别地:,这里为常数。
2.线性性质:及有。
特别地:,。
思考:若存在,则
3.若,相互独立,则=EE
证明:仅对,为连续型随机变量时给予证明。
事实上,E=xyP(x,y)=xyP(x)P(y)
=xP(x)yP(y)=EE。
我们注意到,只要将证明中的“积分”用“和式”代替,就能得到离散型随机变量情形的证明。
【注】:性质3的逆不成立。
反例:设(,)的联合分布为:
显然:E=0,E=0,故有E=E
又,而P{=,P{=,
故,从而不独立。
例6:假定国际市场上每年对我国某种出口商品的需求量是随即变量(单位:千吨),其密度函数为P(x)=
设每售出这种商品一千吨,可为国家挣得外汇3千万元;但假如销售不了而囤积于仓库,则每吨须花保养费1千万元,问需要组织多少货源,才能使国家收益最大?
解:设为一年预备出口的该种商品量,由于外国的需求量为,则国家收入(单位:万元)是的函数,且=g()=
这为随机变量。若收益达到最大,那么其平均值也达到最大。
而=Eg(==
=d+
=
解得:当=3500时,取得最大值。因此,须组织3500千吨该商品,平均说来能使国家的收益最大,这最好的决策。
课后作业:1、仔细阅读P60-73;
2、作业:P80 1,2,4,5;
3、预习P73-79
§3.2方 差上节课,我们研究了随即变量的重要数字特征——数学期望。它描述了随机变量一切可能取值的平均水平。但在一些实际问题中,仅知道平均值是不够的,因为它有很大的局限性,还不能够完全反映问题的实质。例如,某厂生产两类手表,甲类手表日走时误差均匀分布在-10~10秒之间;乙类手表日走时误差均匀分布在-20~20秒之间,易知其数学期望均为0,即两类手表的日走时误差平均来说都是0。所以由此并不能比较出哪类手表走得好,但我们从直觉上易得出甲类手表比乙类手表走得较准,这是由于甲的日走时误差与其平均值偏离度较小,质量稳定。由此可见,我们有必要研究随机变量取值与其数学期望值的偏离程度——即方差。
一、方差的定义与计算设是随机变量,E是其数学期望,则表示与E之间的偏差大小,但由于绝对值对运算带来得不便,所以常用(-E)代替之。又因为(-E)仍是一随机变量,则用E(-E)来描述与其E的偏离程度的大小,为此有:
1.定义:设是一随机变量,若E(-E)<+,则称E(-E)为随机变量的方差,记为D(或Var),即D=E(-E),而称为的标准差(或均方差),记为。
由定义,显然D0,当的可能取值集中在附近时,D较小,否则D较大。可见,其大小就反映了与E的偏离程度或取值的分散程度。
2.计算:
由定义及随机变量函数的数学期望,可以推出方差的计算公式:
① D=E-(E)
事实上:D=E(-E)=E[-2E+(E)]
=E-2EE+(E)=E-(E)
②当是离散型随机变量时,则有:
D=E(-E)=P,其中P=P{} =1,2,3…
③若是连续变量,则有:
D=P(x),其中P(x)是的密度函数。
一般地,若随机变量的分布函数为F(x),则。
例1:设随机变量的数学期望,方差,记,
则有 ,
称为的标准化变量。
例2:设分别表示甲、乙手表的日走时误差,则其概率密度分别为:
因此有:E===0=E
D=E-(E)=E===
D=E===
因此D<D,即的偏离程度小,甲手表走得较好。
二、方差的性质
1.若C为常数,则Dc=0
2.对常a,D(a)=aD
由1,2得如下结论:
D(a+c)=aD,特别地D(+c)=D
思考:若存在,则
3.随机变量与独立,则D()=D+D
Proof:D()=E[-E()]=E[(-E)(-E)]
=E(-E)+E(-E)2E(-E)(-E)
(由,独立-E与-E独立E(-E)(-E)=E(-E)E(-E)=0)
故D(+)=D+D
推论:若相互独立,则。
4.对实数C,有E(-c)E(-E)=D
即随机变量的取值与其平均值的偏离程度是最小的。
Proof:E(-c)=E[-E+E-C]=E(-E)+E(E-C)+2E(-E)(E-C)
=E(-E)+(E-C)E(-E)=D
5.切比雪夫(Chebyshev)不等式:
设随机变量具有数学期望和方差,则,有
【注】:该不等式一方面给出了期望与方差之间的某种关系,同时也给出了在随机变量分布未知,只知期望和方差的情况下,对事件的概率的下限估计。
§3.3协方差与相关系数对于二维随机变量,我们除了讨论与的数学期望与方差外,还需要讨论描述与之间相互关系的数字特征——协方差与相关系数。
一、协方差的定义及其性质
1.定义1:称cov(,)=E(-E)(-E)为随机变量与的协方差。
由定义可知:cov(,)=E(-E)(-E)
=E-E-EE+E=E-E
即:cov(,)=E-E
2.性质:
⑴cov(,)=cov(,)
⑵cov(a,b)=abcov(,) a,b为任意常数
⑶cov()=cov(,)+cov(,)
⑷D()=D2cov()
若,独立,显然有cov(,)=0,反之不然。
引例:(,)的分布列为,(,)的分布列为:
计算可得
而cov(,)=E=1
cov(,)=E=10
由此并不能说出(,)比(,)间的联系紧密。
事实上10=,=10,他们之间的联系是一样的。之所以出现这种情况,是因为协方差的大小还受随机变量本身所取数值的影响。为了清除这种影响,我们引进一个无量纲的量—相关系数的概念,来衡量随机变量间的联系的密切程度。
二、相关系数的定义及其性质
1.定义2:若D>0,D>0,则称
为随机变量的相关系数(或标准协方差)。
显然:就是标准化随机变量,的协方差。
2.性质:
⑴(称正相关,称负相关。)
特别=1以概率1线形相关。即存在常数a与b使。
具体地:P(==1 ——正线性相关
P(=-=1 ——负线性相关定义3:若的相关系数=0,则称不相关。
注:只反映与不存在线性关系,不排除有其它的联系。相关系数只是与间线性相关程度的一种量度。
关于不相关有如下定理:
⑵对于,下列等价:
①E=E
②D(+)=D+D
③cov()=0
④,不相关,即=0
⑶若,相互独立,则,不相关,反之不然。
该性质说明,独立性是比不相关更为严格的条件。独立性反映与之间不存在任何关系,而不相关只是就线性关系而言的,即使与不相关,它们之间也还是可能存在函数关系的。
例3:P77例4
三、矩(数值)
设为一随机变量,称(假设它存在)为的阶原点矩;称为的阶中心矩。
特别地:=;是的期望和方差。
【注】:从随机变量数字特征的定义来看,所有有关随机变量数字特征的计算都归结为数学期望(均值)的计算。
课后作业:1、仔细阅读P73-79;
2、作业:P81 7,8,10,13;
3、预习P83-92
【授课对象】理工类本科二年级
【授课时数】4学时
【授课方法】课堂讲授与提问相结合
【基本要求】1、理解数学期望、方差的概念,并掌握它们的性质。
2、会计算随机变量函数的数学期望。
3、了解协方差、相关系数的概念。
【本章重点】对数学期望、方差、相关系数等数字特征概念的理解与计算。
【本章难点】对不相关与相互独立间关系的理解。
【授课内容及学时分配】
§3.0 前 言从上一章我们可以看出,分布函数(或密度函数、分布列)给出了随机变量的一种最完全的描述。因此,原则上讲,全面认识和分析随机现象就应当求出随机变量的分布,但是对许多实际问题来讲,要想精确地求出其分布是很困难的。其实,通过对现实问题的分析,人们发现对某些随机现象的认识并不要求了解它的确切分布,而只要求掌握他们的某些重要特征,这些特征往往更能集中地反映随机现象的特点。例如要评价两个不同厂家生产的灯泡的质量,人们最关心的是谁家的灯泡使用的平均寿命更长些,而不需要知道其寿命的完全分布,同时还要考虑其寿命与平均寿命的偏离程度等,这些数据反映了它在某些方面的重要特征。
我们把刻划随机变量(或其分布)某些特征的确定的数值称为随机变量的数字特征。
本章主要介绍反应随机变量取值的集中位置、分散程度以及随机变量之间的线性相依程度的数字特征——数学期望、方差与相关系数(矩)。
§3.1 随机变量的数学期望一、离散型随机变量的数学期望引例:甲、乙二人进行射击比赛,以、分别表示他们命中的环数,其分布列分别为 ~ ~
试问谁的技术好些?
解:这个问题的答案并不是一眼看得出的。这说明了分布列虽然完整地描述了离散型随机变量的概率特征,但是却不够“集中”地反映出它的变化情况,因此我们有必要找出一些量来更集中、更概括地描述随机变量,这些量多是某种平均值。
若在上述问题中,使两个射手各射N枪,则他们打中靶的总环数大约是:
甲 8N+90.1N+100.6N=9.3N
乙 80.2N+90.5N+100.3N=9.1N
平均起来甲每枪射中9.3环,乙每枪射中9.1环,因此可以认为甲射手的本领要好些。
受上面问题的启发,对一般离散型随机变量,我们引入如下定义:
定义1:设为离散型随机变量,其分布列为:,若+
则称:E=为的数学期望或均值。
〖注〗:为使E与级数各项的次序无关,必须要求收敛;否则,不存在。
例1:设用一个匀称的骰子来玩游戏。在这样的游戏中,若骰子向上为2,则玩游戏的人赢20元,若向上为4则赢40元,若向上为6则输30元,若其它的面向上,则玩游戏的人既不赢也不输,求玩游戏的人赢得钱数的期望和。
解:令为任何一次抛掷中赢得钱数,则,则由离散型随机变量数学期望的定义可知:
从而玩游戏的人可期望赢5元,因此,在一个公正的游戏中,玩游戏的人为了参加游戏应当付5元底金。
例2:设随机变量只取非负整数值,且其分布列为,
试求。
解:
从而有
所以
二、连续型随机变量的数学期望由离散型随机变量数学期望的定义,我们自然可以设想取很密的分点,将分割成个小区间,则落在内的概率等于(积分中值定理),其中落在与之间,因此当时,与以概率取值的离散型随机变量相似,而后者的数学期望为,而这个和式的极限就是。
为此,对一般连续型随机变量,我们引入如下定义:
定义2:设为连续型随机变量,其密度函数为,若广义积分
,则称为的数学期望或均值。
我们知道,若在点连续时,有,从而,所以上述定义等价于:
定义2’:设~,若,则称为的数学期望或均值。
顺便指出,该定义是数学期望的一般定义,它对于离散型和连续型随机变量都适用。
例3:设连续型随机变量,求。
解:由连续型随机变量数学期望的定义可知:
三、随机变量函数的数学期望我们经常需要求随机变量函数的数学期望,这时可以通过下面的定理来求随机变量函数的数学期望。
定理:设是随机变量的函数:(其中是连续函数),
(1)是离散型随机变量,它的分布律为,若,则有;
(2)是连续型随机变量,其密度函数为,若,则有。
定理的证明超出了本书的范围,故略。
定理的重要意义在于当我们求时,不必算出的分布律或密度函数,而只需利用的分布律或密度函数就可以求出。
例4:设,求。
解:令,则=
=(e-1)=
上述定理还可以推广到两个或两个以随机变量函数的情形:
假设是随机变量的函数:(其中是连续函数)
(3) (,)为二维离散型随机变量,其联合分布列为,,若,则有;
(4)(,)为二维连续型随机变量,其联合密度函数为,若
,则有。
例5:设(,)的密度函数为
试求,的数学期望。
解:由定义知:
===1/3
四、数学期望的性质
1.若,则。特别地:,这里为常数。
2.线性性质:及有。
特别地:,。
思考:若存在,则
3.若,相互独立,则=EE
证明:仅对,为连续型随机变量时给予证明。
事实上,E=xyP(x,y)=xyP(x)P(y)
=xP(x)yP(y)=EE。
我们注意到,只要将证明中的“积分”用“和式”代替,就能得到离散型随机变量情形的证明。
【注】:性质3的逆不成立。
反例:设(,)的联合分布为:
显然:E=0,E=0,故有E=E
又,而P{=,P{=,
故,从而不独立。
例6:假定国际市场上每年对我国某种出口商品的需求量是随即变量(单位:千吨),其密度函数为P(x)=
设每售出这种商品一千吨,可为国家挣得外汇3千万元;但假如销售不了而囤积于仓库,则每吨须花保养费1千万元,问需要组织多少货源,才能使国家收益最大?
解:设为一年预备出口的该种商品量,由于外国的需求量为,则国家收入(单位:万元)是的函数,且=g()=
这为随机变量。若收益达到最大,那么其平均值也达到最大。
而=Eg(==
=d+
=
解得:当=3500时,取得最大值。因此,须组织3500千吨该商品,平均说来能使国家的收益最大,这最好的决策。
课后作业:1、仔细阅读P60-73;
2、作业:P80 1,2,4,5;
3、预习P73-79
§3.2方 差上节课,我们研究了随即变量的重要数字特征——数学期望。它描述了随机变量一切可能取值的平均水平。但在一些实际问题中,仅知道平均值是不够的,因为它有很大的局限性,还不能够完全反映问题的实质。例如,某厂生产两类手表,甲类手表日走时误差均匀分布在-10~10秒之间;乙类手表日走时误差均匀分布在-20~20秒之间,易知其数学期望均为0,即两类手表的日走时误差平均来说都是0。所以由此并不能比较出哪类手表走得好,但我们从直觉上易得出甲类手表比乙类手表走得较准,这是由于甲的日走时误差与其平均值偏离度较小,质量稳定。由此可见,我们有必要研究随机变量取值与其数学期望值的偏离程度——即方差。
一、方差的定义与计算设是随机变量,E是其数学期望,则表示与E之间的偏差大小,但由于绝对值对运算带来得不便,所以常用(-E)代替之。又因为(-E)仍是一随机变量,则用E(-E)来描述与其E的偏离程度的大小,为此有:
1.定义:设是一随机变量,若E(-E)<+,则称E(-E)为随机变量的方差,记为D(或Var),即D=E(-E),而称为的标准差(或均方差),记为。
由定义,显然D0,当的可能取值集中在附近时,D较小,否则D较大。可见,其大小就反映了与E的偏离程度或取值的分散程度。
2.计算:
由定义及随机变量函数的数学期望,可以推出方差的计算公式:
① D=E-(E)
事实上:D=E(-E)=E[-2E+(E)]
=E-2EE+(E)=E-(E)
②当是离散型随机变量时,则有:
D=E(-E)=P,其中P=P{} =1,2,3…
③若是连续变量,则有:
D=P(x),其中P(x)是的密度函数。
一般地,若随机变量的分布函数为F(x),则。
例1:设随机变量的数学期望,方差,记,
则有 ,
称为的标准化变量。
例2:设分别表示甲、乙手表的日走时误差,则其概率密度分别为:
因此有:E===0=E
D=E-(E)=E===
D=E===
因此D<D,即的偏离程度小,甲手表走得较好。
二、方差的性质
1.若C为常数,则Dc=0
2.对常a,D(a)=aD
由1,2得如下结论:
D(a+c)=aD,特别地D(+c)=D
思考:若存在,则
3.随机变量与独立,则D()=D+D
Proof:D()=E[-E()]=E[(-E)(-E)]
=E(-E)+E(-E)2E(-E)(-E)
(由,独立-E与-E独立E(-E)(-E)=E(-E)E(-E)=0)
故D(+)=D+D
推论:若相互独立,则。
4.对实数C,有E(-c)E(-E)=D
即随机变量的取值与其平均值的偏离程度是最小的。
Proof:E(-c)=E[-E+E-C]=E(-E)+E(E-C)+2E(-E)(E-C)
=E(-E)+(E-C)E(-E)=D
5.切比雪夫(Chebyshev)不等式:
设随机变量具有数学期望和方差,则,有
【注】:该不等式一方面给出了期望与方差之间的某种关系,同时也给出了在随机变量分布未知,只知期望和方差的情况下,对事件的概率的下限估计。
§3.3协方差与相关系数对于二维随机变量,我们除了讨论与的数学期望与方差外,还需要讨论描述与之间相互关系的数字特征——协方差与相关系数。
一、协方差的定义及其性质
1.定义1:称cov(,)=E(-E)(-E)为随机变量与的协方差。
由定义可知:cov(,)=E(-E)(-E)
=E-E-EE+E=E-E
即:cov(,)=E-E
2.性质:
⑴cov(,)=cov(,)
⑵cov(a,b)=abcov(,) a,b为任意常数
⑶cov()=cov(,)+cov(,)
⑷D()=D2cov()
若,独立,显然有cov(,)=0,反之不然。
引例:(,)的分布列为,(,)的分布列为:
计算可得
而cov(,)=E=1
cov(,)=E=10
由此并不能说出(,)比(,)间的联系紧密。
事实上10=,=10,他们之间的联系是一样的。之所以出现这种情况,是因为协方差的大小还受随机变量本身所取数值的影响。为了清除这种影响,我们引进一个无量纲的量—相关系数的概念,来衡量随机变量间的联系的密切程度。
二、相关系数的定义及其性质
1.定义2:若D>0,D>0,则称
为随机变量的相关系数(或标准协方差)。
显然:就是标准化随机变量,的协方差。
2.性质:
⑴(称正相关,称负相关。)
特别=1以概率1线形相关。即存在常数a与b使。
具体地:P(==1 ——正线性相关
P(=-=1 ——负线性相关定义3:若的相关系数=0,则称不相关。
注:只反映与不存在线性关系,不排除有其它的联系。相关系数只是与间线性相关程度的一种量度。
关于不相关有如下定理:
⑵对于,下列等价:
①E=E
②D(+)=D+D
③cov()=0
④,不相关,即=0
⑶若,相互独立,则,不相关,反之不然。
该性质说明,独立性是比不相关更为严格的条件。独立性反映与之间不存在任何关系,而不相关只是就线性关系而言的,即使与不相关,它们之间也还是可能存在函数关系的。
例3:P77例4
三、矩(数值)
设为一随机变量,称(假设它存在)为的阶原点矩;称为的阶中心矩。
特别地:=;是的期望和方差。
【注】:从随机变量数字特征的定义来看,所有有关随机变量数字特征的计算都归结为数学期望(均值)的计算。
课后作业:1、仔细阅读P73-79;
2、作业:P81 7,8,10,13;
3、预习P83-92