第三章 连续型随机变量 §3.1 随机变量及分布函数 教学目的要求: 掌握随机变量、分布函数两个基本概念及分布函数的性质,并会求一些随机变量的分布函数,为后面的学习打下基础. 教 材 分 析 : 1.概括分析:在第二章中我们研究了离散型随机变量,在那里随机变量只取有限个或可列个值,这当然有很大的局限性.在许多随机现象中出现的一些变量,它们的取值是可以充满某个区间或区域的(也就不会只取有限个或可列个的值),概率论的任务是要研究它们的统计规律,那么对于这种更一般的随机变量,如何来描述它的统计规律呢?因为单点集的长度为零.由此可知,用“分布列”是行不通的,需要另外找一个合适的“工具”----分布函数.本节是概率论中的基本内容之一.学习本节,要求学生掌握随机变量、分布函数等基本概念,并会求一些随机变量的分布函数. 2.教学重点:随机变量、分布函数等基本概念,求一些随机变量的分布函数. 3.教学难点:并会求一些随机变量的分布函数. 教 学 过 程 : 一、导入: 在第二章中我们研究了离散型随机变量,在那里随机变量只取有限个或可列个值,这当然有很大的局限性.在许多随机现象中出现的一些变量,如“测量某地气温”,“某型号显像管的寿命”,“某省高考体格检查时每个考生的身高、体重”等,它们的取值是可以充满某个区间或区域的(也就不会只取有限个或可列个的值),如同离散型随机变量,这些变量的取值是随着试验结果的变化而变化的,因而在试验之前是不确定的,概率论的任务是要研究它们的统计规律,那么对于这种更一般的随机变量,如何来描述它的统计规律呢?不妨先看下述例子. [例3.1] 等可能地在[a,b]上投点.这是第一章中曾经讨论过的几何概率一类的问题.在这里“等可能”的含意是指,所投的点落在[a,b]中的任一子区间B=[c,d]中的概率,与B的长度B成正比,而与B在[a,b]中的位置无关.如果记“点落入B中”这一事件为B,则上述等可能性即意味着 P(B)==. 如果投在[a,b]中的点的坐标为ω(a≤ω≤b),令 (ω)=ω (a≤ω≤b) 这样就得到了一个随机变量(ω),它的取值充满了整个区间[a,b].如何来描写(ω)的统计规律呢?你可能会想到,既然对于离散型随机变量,可以用分布列描述它们的统计规律,何不仍采用“分布列”这个工具呢?既然有这个想法,那就来看看这个(ω)的“分布列”吧!对于上述的,它取[a,b]中任意一点值ω0的概率为 P((ω)=ω0)=P(ω=ω0)==0 因为单点集的长度为零.由此可知,用“分布列”是行不通的,需要另外找一个合适的“工具”,前面已经指出“点落入B中”的概率与B的长度B成正比,设B=[c,d]?[a,b],就有 P(c≤≤d)=P(点落入B中)=P(B)= 又因为P{=d}=0,所以 P(c≤≤d)=P(c≤<d) 而 P(c≤<d)=P(<d)-P(<c) 于是 P(c≤≤d)=P(<d)-P(<c) 这就告诉我们,为了掌握(ω)的统计规律,只要对任意实数x,知道P((ω)<x)=?就够了.这个概率当然与x有关,为此记 F(x)=P((ω)<x) 于是F(x)对所有x∈(-,+)都有定义,因而F(x)是定义在(-,+)上,取值于[0,1]的一个函数.现在就引入下述定义. 二、随机变量及分布函数的概念: 定义3.1 定义在样本空间Ω上,取值于实数域的函数(ω),称为是样本空间Ω上的(实值)随机变量,并称 F(x)=P((ω)<x),x∈(-,-) 是随机变量(ω)的概率分布函数.简称为分布函数或分布. 三、分布函数的性质: 从概率的性质容易看出任意一个随机变量的分布函数,都具有下述性质: (1) 单调性. 若x1<x2,则F(x1)≤F(x2); (2) 规范性. F(-)=F(x)=0, F(+)=F(x)=1; (3) 左连续性.F(x-0)=F(x). 性质(1)的证明是显然的,请读者自己完成.下面证明(2)和(3). 先证明(2),因为0≤F(x)≤1,且F(x)单调,故 F(x)=F(m) F(x)=F(n) 都存在,又由概率的完全可加性有 1=P(-<(ω)<+)=P= ==F(n)-F(m) 所以必有 F(x)=0, F(x)=1 成立. 再证明(3),因为F(x)是单调有界函数,其任一点的左极限F(x-0)必存在,为证明左连续,只要对某一列单调上升的数列 x1<x2<…<xn<…, xn→x(n→) 证明 F(xn)=F(x) 成立即可.这时,有 F(x)-F(x1)=P(x1≤<x)=P == =[F(xn+1)-F(x1)]=F(xn+1)-F(x1) 由此即得 F(x)=F(xn+1)=F(x-0) 分布函数的三个基本性质已经证毕.反过来还可以证明,任一满足这三个性质的函数,一定可以作为某个随机变量的分布函数.因此,满足这三个性质的函数通常都称为分布函数. 知道了随机变量(ω)的分布函数F(x),不仅掌握了{(ω)<x}的概率,而且还可以计算下述概率. P{(ω)≥x}=1-F(x) P{(ω)≤x}=F(x+0) P{(ω)>x}1-F(x+0) P{(ω)=x}=F(x+0)-F(x) 进一步,形如{x1≤(ω)≤x2}、{x1<(ω)<x2}、{x1<(ω)≤x2}、{x1≤(ω)<x2}这些事件以及它们经过有限次或可列次并、交、差以后的概率,都可以由F(x)算出来,所以F(x)全面地描述了随机变量(ω)的统计规律.既然分布函数能够描述一般的随机变量的统计规律,因而分布函数这个概念比分布列更重要.不过,对离散型随机变量来说,用得较多的还是分布列,那是因为它比较方便的缘故. 四、离散型随机变量的分布函数与分布列之间的关系: 现在就来看离散型随机变量的分布函数与分布列之间有怎样的关系?如果(ω)是一个离散型随机变量,它的分布列为  那么(ω)的分布函数为 F(x)=P((ω)<x)= 五、应用举例: [例3.2] 若只取一个值a,即有 P(=a)=1 求的分布函数F(x). [解] 易知 F(x)=P(<x)= 其图形如图3.1所示. 由图3.1我们看到F(x)是一个左连续的、阶梯状的函数,在x=a处有一个跳跃,其跃度为 1=P(=a) [例3.3] 设是参数为的普哇松分布的随机变量,即 P(=k)=, k=0,1,2,… 求的分布函数. [解] 由公式知道 F(x)=P(<x)== 由此,F(x)的图形如图3.2所示. 由图3.2可以看到,F(x)也是一个阶梯状的左连续函数,在x=k(k=0,1,2,…)处有跳跃,跃度为在x=k处的概率. F(k+0)-F(k)=P(=k), k=0,1,2,… 现在再来看例3.1中的随机变量(ω),它的分布函数F(x)是什么? [例3.1](续) 当x<a时,易知有 F(x)=P((ω)<x)=0 当a≤x≤b时,则有 F(x)=P((ω)<x)=P(a≤(ω)<x)= 当x>b时,显然有 F(x)=P((ω)<x)=1 综上所得,(ω)的分布函数为 F(x)= 其图形如图3.3所示. 在第二章中我们已经知道,在单位时间内来到电话交换局的电话呼唤次数、来到公共汽车站的乘客人数、来到机场降落的飞机数以及母鸡下蛋数等都可以用普哇松分布来描述,即 P((ω)=k)=, k=0,1,2,… 并且还知道其中的参数为单位时间内(来到的呼唤数、乘客入数、飞机数、下蛋数等)的平均值.如果现在考察的不是单位时间,而是[0,t],那么这个平均值应该与时间t成正比,也就是t,又因为普哇松分布具有可加性,所以在[0,t]这段时间内(来到的呼唤数、乘客数、飞机数、下蛋数等)应该服从 P(t(ω)=k)=, k=0,1,2,… 这是一个参数为t的普哇松分布.由此可知,上述在[0,t]时间内来到的呼唤数、乘客数、飞机数、下蛋数等虽然来源于不同的实际问题,却有相同的数量规律----都可以用普哇松分布来描述,在数学(排队论)中称它们是“普哇松流”,以机场跑道为例,在来到一架飞机以后,这条跑道就空闲着等待着下一架飞机的到来,这段空闲着的时间称为“等待时间”,它的长短当然是随机的.在公用事业(电话、公共汽车、飞机场等)的设计与规划中,这个“等待时间”太长和太短都是不合理的,因而有必要研究这个“等待时间”有怎样的统计规律?现在不妨仍以“母鸡下蛋”的语言来讨论这个问题,这就是下面的例子. [例3.4] 设母鸡在任意的[t0,t0+t]的时间间隔内下蛋个数服从 P(t(ω)=k)=, k=0,1,2,… 问两次下蛋之间的“等待时间”服从怎样的分布函数? [解] 设前一次下蛋时刻为0,因为不可能为负,所以当t≤0时,显然有 P(<t)=0 而当t>0时,因为在等待时间内鸡不下蛋 (>t)=(t(ω)=0) 所以有 P(>t)=P(t(ω)=0)=e-t 于是 P(≤t)=1-P(>t)=1-e-t 还因为 (<t)= 由概率的下连续性(定理1.1)即得 P(<t)=P===1- 从而描述的分布函数为 F(t)=P(<t)= 概率论中称这个分布函数是参数为的指数分布.我们已经看到,许多“等待时间”是服从这个分布的,一些没有明显“衰老”机理的元器件(如半导体元件)的寿命也可以用指数分布来描述,所以指数分布在排队论和可靠性理论等领域中有着广泛的应用. 由上面的讨论可以看到,分布函数是实变量x的单值函数,这是我们在数学分析中早已熟悉的对象,而且F(x)又具有相当好的性质,有利于进行数学处理,因而引入随机变量和分布函数这两个概念,就好像在随机现象和数学分析之间架起了一座桥梁,有了这座桥梁,“数学分析”这个强有力的工具才有可能进入随机现象的研究领域中来.由此可以体会到随机变量及分布函数这两个概念的地位和作用.在下面的讨论中,还可以进一步看到数学分析这个工具是如何发挥它的功能的. §3.2 连续型随机变量 教学目的要求: 掌握连续型随机变量、连续型分布函数、密度函数等基本概念及密度函数的性质,并会求一些连续型随机变量的密度函数,为后面的学习打下基础. 教 材 分 析 : 1.概括分析:在第二章中我们研究了离散型随机变量,在那里随机变量只取有限个或可列个值,这当然有很大的局限性.本节要研究另一类十分重要而且常见的随机变量----连续型随机变量.它是概率论中的基本内容之一.学习本节,要求学生掌握连续型随机变量、连续型分布函数、密度函数等基本概念及密度函数的性质,并会求一些连续型随机变量的密度函数. 2.教学重点:连续型随机变量、连续型分布函数、密度函数等基本概念及密度函数的性质,连续型随机变量的密度函数的求法. 3.教学难点:连续型随机变量、连续型分布函数、密度函数等基本概念及密度函数的求法. 教 学 过 程 : 一、连续型随机变量和概率密度函数的概念: 在第二章里,已经对离散型随机变量作了一些研究,下面将要研究另一类十分重要而且常见的随机变量----连续型随机变量. 定义3.2 若(ω)是随机变量,F(x)是它的分布函数,如果存在函数p(x),使对任意的x,有 F(x)= 则称(ω)对连续型随机变量,相应的F(x)为连续型分布函数,同时称p(x)是F(x)的概率密度函数或简称为密度. 二、密度函数的性质: 由分布函数的性质即可验证任一连续型分布的密度函数p(x)必具有下述性质: (1) p(x)≥0; (2) =1. 反过来,任意一个R上的函数p(x),如果具有以上两个性质,即可由定义3.2定义一个分布函数F(x). 如果随机变量(ω)的密度函数为p(x),则对任意的x1、x2(x1<x2),有 P(x1≤(ω)<x2)=F(x2)-F(x1)= 这一结果有很简单的几何意义:(ω)落在[x1,x2]中的概率,恰好等于在区间[x1,x2]上由曲线y=p(x)形成的曲边梯形的面积(图3.4中的阴影部分),而(2)式表明,整个曲线y=p(x)以下(x轴以上)的面积为1. 三、概率密度函数与分布函数及概率的关系: 由(3.15)式还可以证明,连续型随机变量(ω)取单点值的概率为零,也就是说对任意的x,P((ω)=x)=0,于是有 P(x1≤((()≤x2)=P(x1≤((()<x2)+P(((()=x2)=P(x1≤((()<x2)= 如果p(x)在某一范围内的数值比较大,则由上式可知,随机变量落在这个范围内的概率也较大,这意味着p(x)的确具有“密度”的性质,所以称它为概率密度函数.此外,由定义式可知,对p(x)的连续点必有  四、应用举例: 在例3.1中已经知道 F(x)= 显然这时有  在x=a点和x=b点,F(x)的导数不存在,在这两个点上可以补充定义: p(x)=, x=a或x=b (其它的值也可以,因为两个点上的函数值并不影响p(x)在一个区间上的积分值),这时显然有F(x)=成立,所以F(x)的密度函数为p(x),F(x)是一个连续型分布.在相应的随机变量可能取值的区间[a,b]上,它的密度函数p(x)是—个常数(=),这样的分布常常称为“均匀分布”,其中“均匀”的意思就是例3.1中开始时提到的“等可能”的意思.p(x)图形如图3.5所示. 由图3.5可以看出, ((()落在[a,b]中任一子区间[x1,x2]中的概率,即小曲边梯形的面积,的确与[x1,x2]的位置无关,而只与[x1,x2]的长度有关. [例3.4](续) 在例3.4中,已知 F(x)= 如果 p(x)= 这时显然有F(x)=成立,所以指数分布也是一个连续型的分布,它的密度函数p(x)是一个指数函数,其图形如图3.6所示. [例3.5] 若(,(((>0)是两个常数,则 p(x)=,-∞<x<∞ 是—个密度函数,因为这时p(x)>0为显然,此外还可以验证有  为此,可令=y,则  这时有  现在作坐标变换,令  这时,变换的雅可比式|J|=r,而  所以有  于是  这说明由上式给出的确是一个密度函数,这个密度函数称为正态密度,相应的分布函数为: F(x)=,-∞<x<∞ 并且称F(x)为正态分布,常常简单地记作N((,(2).如果一个随机变量, ((()的分布函数是正态分布.也称((()是一个正态变量. 正态分布是概率论中最重要的一个分布,高斯(Gauss)在研究误差理论时曾用它来刻划误差,所以在许多著作中也有称为高斯分布的,经验表明许多实际问题中的变量,如测量误差、射击时弹着点与靶心间的距离、热力学中理想气体的分子速度、某地区成年男子身高等都可以认为服从正态分布,进一步的理论研究表明,一个变量如果受到大量微小的、独立的随机因素的影响,那么这个变量—般是一个正态变量,在下一章中我们将讨论这个问题. 正态分布密度函数p(x)的图形如图3.7所示((=0).由上式及图3.7,可以清楚地看出,p(x)关于x=(点对称,在x=(处达到极大,当(固定时,(的值愈小,p(x)的图形就愈尖、愈狭,(的值愈大,p(x)的图形就愈平、愈宽.由前面关于密度函数的讨论已经知道,如果p(x)在(点附近愈尖、愈高,则随机变量在(点附近取值的概率也愈大,事实上,对任一服从N(0,(2)的随机变量(,有 P(-(≤((()≤()= P(-2(≤((()≤2()= P(-3(≤((()≤3()= 这说明,随机变量(的绝对值不超过(的概率略大于2/3,不超过2 (的概率在95℅以上,而超过3(的概率只有0.003,即 P(|(|>3()≈0.003 因为P(|(|>3()很小,在实际问题中常常认为它是不会发生的.也就是说,对服从N(0,(2)分布的随机变(来说,基本上可以认为有|(|≤3(,这种近似的说法被一些实际工作者称作是正态分布的“3(原则”. 由以上的讨论可知, (反映了随机变量(取值的分散程度,那么它与第二章中的方差又有什么关系呢,对这个问题,我们稍后要作进一步的讨论. 现在,细心的同学可能会问,(3.20)、(3.21)、(3.22)中的积分值是如何得到的?在数学分析中已经掌握的一些数值积分的方法(例如把被积函数用幂级数展开等),在这里当然用得上.不过前面已经指出,正态分布是概率论和数理统计中最常用的一个分布,为了避免每一次都去作这种繁重的近似计算,便编制了正态分布表以供查用.但是正态分布中含有参数(和(((>0),给定不同的一对(和(,就有一个不同的正态分布,那当然不可能对所有不同的(和(,都编制对应的正态分布表.事实上,人们只编制了一张(=0、(=1的N(0,1)分布表以供查用.N(0,1)分布常常称为是标准正态分布,其密度函数通常以(x)表示,相应的分布函数则记作(x),所以 (x)= 在本书的附录中给出了N(0,1)分布的(x)和(x)的表.有的同学肯定要问,如果要查N((,(2)分布怎么办?这只要通过一个函数关系(变换)就能解决. 设(是N((,(2)分布的随机变量,则 P((<x)= 这时令  则也是一个随机变量,并且有 P(<x)=P(<x)=P((<(x+()= 对上述积分作变量代换,令u=即得 P(<x)==(x) 由此可知是一个服从N(0,1)分布的标准正态随机变量.于是,要查F(x)=P((<x),只要查(y),其中y=,这就是说只要查N(0,1)分布表就可以了,因为这时有 F(x)=P((<x)=P(<)=P(<)=() 两边求导还有 p(x)= 所以一张N(0,1)分布表解决了所有N((,(2)分布的查表问题.其中的(3.24)式把一般的N((,(2)分布的随机变量(变换成标准正态变量,所以常常称它为“标准化”变换. §3.3多维随机变量及其分布 教学目的要求: 掌握多维随机变量、联合分布函数、边际分布函数、联合密度函数、边际密度函数等基本概念及性质,并会对一些随机变量进行计算. 教 材 分 析 : 1.概括分析:在前几节中我们研究了一维连续型随机变量的一些有关概念、性质和计算.本节将这些内容推广到多维的情形.学习本节,要求学生掌握有关基本概念,并会对一些随机变量进行有关的计算. 2.教学重点:多维随机变量的有关概念,对一些随机变量进行有关计算. 3.教学难点:对一些随机变量进行有关计算. 教 学 过 程 : 一、n维随机变量及分布函数的概念: 前面讨论了一维连续型随机变量,如同第二章中所讨论的多维离散型随机变量一样,还可以讨论多维连续型随机变量.这里,我们仍从一般的多维随机变量定义出发. 定义3.3 设(1((),(2((),…,(n(()是定义在同一个样本空间Ω上的随机变量,则n维向量((1((),(2((),…,(n(())称为是样本空间Ω上的n维随机变量或n维随机向量.并称n元函数 F(x1,x2,…,xn)=P((1(()<x1,(2(()<x2,…,(n(()<xn) 是n维随机变量((1((),(2((),…,(n(())的联合分布函数,也简称为联合分布或分布.联合分布函数描述了多维随机变量的统计规律. 二、二维随机变量概率的计算公式: 我们将着重讨论二维随机变量.如果((,()表示笛卡儿平面上点的坐标,那么 F(x,y)=P((<x,(<y) 就表示点((,()落在图3.8阴影部分中的概率. 这时,点((,()落入任一矩形{x1≤(<x2,y1≤(<y2}(见图3.9)中的概率,即可由概率的加法性质求得: P(x1≤(<x2,y1≤(<y2)=F(x2,y2)-F(x1,y2)-F(x2,y1)+F(x1,y1) 因为由图3.9可以直接看出 P(x1≤(<x2,y1≤(<y2)=P{((,()∈Ⅰ} =P{((,()∈(Ⅰ∪Ⅱ∪Ⅲ∪Ⅳ)}-P{((,()∈(Ⅲ∪Ⅳ)}-P{((,()∈(Ⅱ∪Ⅳ)}+P{((,()∈Ⅳ} 由此即得上式. 三、二维随机变量分布函数的性质: 如同一维分布函数,还可以证明二维分布函数F(x,y)具有下述性质: (1) 对x或y都是单调不减的; (2) 对x或y都是左连续的,即有: F(x,y)=F(x-0,y), F(x,y)=F(x,y-0) (3) 对任意的x和y,有  并且还有 F(+∞,-∞)==1  (4) 对任意的(x1,y1)和(x2,y2)(其中x1<x2,y1<y2),有: F(x2,y2)-F(x1,y2)-F(x2,y1)+F(x1,y1)≥0 其中性质(1)、(2)、(3)的证明是显然的,而性质(4)由(3.25)式可得.反过来还可以证明,任意一个具有上述四个性质的二元函数,必定可以作为某个二维随机变量的联合分布函数.因而,满足这四个条件的二元函数通常就称为二元联合分布函数. 四、边际分布函数的概念: 如果二维随机变量((,()的联合分布函数F(x,y)为已知,那么它的两个分量(与(的分布函数即可由F(x,y)求得,因为有 F((x)=P((<x)=P((<x,(<∞)=F(x,∞) 其中F(x,∞)=F(x,y).同理还有 F((y)=F(∞,y) 其中F(∞,y)=F(x,y).如同离散型情形,人们也称F((x)、F((y)是联合分布F(x,y)的边际分布函数,或简称为边际分布. 五、密度函数的概念及性质: 1.定义: 类似于一维时的情形,下面将着重讨论二维的连续型随机变量,这就是下述的定义. 定义3.4如果F(x,y)是—个联合分布函数,若存在函数p(x,y),使对任意的(x,y),有 F(x,y)= 成立,则称F(x,y)是一个连续型的联合分布函数,并且称其中p(x,y)是F(x,y)的联合概率密度函数或简称为密度. 如果二维随机变量((,()的联合分布函数F(x,y)是连续型分布函数,就称((,()是二维的连续型随机变量. 2.性质: 由分布函数的性质可知,任一二元密度函数p(x,y)必具有下述性质: (1) p(x,y)≥0; (2) =F(+∞,+∞)=1; 反过来,任意一个具有上述两个性质的二元函数p(x,y),必定可以作为某个二维随机变量的密度函数.此外,密度函数还具有性质: (3) 若p(x,y)在点(x,y)连续,F(x,y)是相应的分布函数,则有 =p(x,y) (4) 若G是平面上的某一区域,则 P{((,()∈G}= 例如,若 G={(x,y):x1≤x<x2,y1≤y<y2} 这时就有 P(x1≤(<x2,y1≤(<y2)=P{((,()∈G}= 这是与(3.25)式一致的,由此还容易求得边际分布为 F((x)=P((<x)=P((<x,(<∞)=F(x,∞)= 从而可知F((x)是一个连续型分布函数,相应的密度函数为 p((x)=(x)= 同理可知F((y)也是连续型分布函数,其密度函数为 p((y)= 因为F((x)、F((y)是边际分布函数,所以p((x)与p((y)也称为边际分布密度. [例3.6] 设G是平面上的一个有界区域,其面积为A,令 p(x,y)= 则p(x,y)是一个密度函数,以p(x,y)为密度函数的二维联合分布称为区域G上的均匀分布. 若二维随机变量((,()的联合分布是区域G上的均匀分布,密度函数为(3.42)所示,则对G中的任一(有面积的)子区域D,有 P{((,()∈D}= 其中SD是D的面积.上式表明,二维随机变量落入区域D的概率与D的面积成正比,而与D在G中的位置和形状无关,这正是我们在第一章中提过的在平面区域G中等可能投点的试验.由此可知“均匀”分布的含意就是“等可能”的意思. [例3.7] 设二维随机变量((,()具有密度函数 p(x,y)= 试求: (1) 常数C; (2) 分布函数F(x,y); (3) 边际分布函数F((x)、F((y)及相应的边际密度; (4) 求((,()落在图3.10中区域G内的概率. [解] (1) 1= == 故 C=4 (2) F(x,y)== 由此即得 F(x,y)= (3) F((x)== 从而有 F((x)= 于是边际密度为 p((x)= 同理可得 F((y)= p((y)= [例3.8] 设a1,a2,(1,(2,ρ为五个常数,且(1>0,(2>0,|ρ|<1,令 p(x,y)= 其截断了的部分图形如图3.11所示.由(3.43)式易知p(x,y)≥0,并且还有 =1 因而p(x,y)是一个二维密度函数.以p(x,y)为密度函数的分布函数,称为二维正态分布,常常记作N(a1,a2,,,ρ).如果二维随机变量的联合分布是二维正态分布,也称是一个二维正态变量.由((,()的联合分布可以求得(,(的密度函数.为此,令 ,  由(3.40)式知 p((x)== == === 由此知p((x)是N(a1,)分布的密度函数,由对称性还可得 p((y)== 因而二维正态分布N(a1,a2,,,ρ)的两个边际分布都是一维正态分布,分别为N(a1,)和N(a2,). 把上式两边对y积分,就有 1== 这里,我们顺便完成了对(3.44)式的验证. 如果ρ1≠ρ2,则两个二维正态分布: N(a1,a2,,,ρ1),N(a1,a2,,,ρ2)是不相同的,但是由(3.45)和(3.46)知道它们有完全相同的两个边际分布,这一事实再一次说明了边际分布不能唯一决定它们的联合分布,还值得一提的是,两个边际分布都是正态分布的二维随机变量,它们的联合分布不仅是不唯一确定的,而且还可以不是一个二维的正态分布,下面就是这样的一个例子. [例3.9] 设 p(x,y)=(1+sinxsiny), -∞<x,y<+∞ 则p(x,y)≥0为显然,且有: ==1 这是因为sinx是奇函数,而是偶函数,于是有 ==0 这时 p((x)== == 同理还有 p((y)= 所以(与(都是N(0,1)分布的随机变量,但是((,()却并不是一个二维正态变量. 六、随机变量的独立性: 在第二章中,我们曾经指出,二维离散型随机变量((,()的联合分布列不仅描述了(与(各自的统计规律,而且还包含有(与(相互之间联系的内容,当这两个随机变量取值的规律互不影响时,称(与(是独立的.现在把这个概念推广到一般的场合,在引入分布函数时,我们已经知道描述一般随机变量的统计规律需要用分布函数F(x)=P((<x),以代替离散型场合用的分布列P((=ai),在引入独立性的定义时,也作这样的替代,这时就有下面的定义. 1.二维随机变量的独立性: 定义3.5 设二维随机变量((,()的联合分布函数为F(x,y),又(与(的分布函数为F((x)、F((y),若对任意的(x,y)有 F(x,y)= F((x)·F((y) 成立,则称随机变量(与(是相互独立的. 如果((,()是二维连续型随机变量,则(与(也都是连续型随机变量,它们的密度函数分别为p((x)及p((y).这时容易验证与独立的充要条件为 p((x)·p((y)是((,()的密度函数 现在来验证这一结论.如果已知p((x)·p((y)是((,()的密度函数,就有 F(x,y)===F((x)·F((y) 故(3.47)式成立;反之,若已知(3.47)式成立,则 F(x,y)=F((x)·F((y)== 对任意的(x,y)成立,因而p((x)·p((y)是((,()的密度函数,(3.48)成立. 由此可知,要判断连续型随机变量(与(是否独立,只要验证p((x)·p((y)是否是((,()的密度函数就可以了,一般说来,这是比较容易的. [例3.10] 若二维随机变量((,()服从N(a1,a2,,,0)分布,问(与(是否独立? [解] 这时((,()有密度函数 p(x,y)= 由例3.8已知 p((x)=, p((y)= 显然这时p((x)·p((y)=p(x,y)成立,所以(与(相互独立.反过来,若(与(独立,则必有ρ=0.所以对二维正态随机变量N(a1,a2,,,ρ)来说,ρ=0是它们相互独立的充要条件. 这一节我们从一般的n维随机变量的定义出发,而后对二维随机变量作了较多的讨论,这主要是为了叙述和学习方便的缘故. 2.n维随机变量的独立性: 其实,把对二维的讨论推广到n维,并没有什么实质性的困难.例如,对n维随机变量的独立性,就有下述定义. 定义3.6 设n维随机变量((1,(2,…,(n)的联合分布函数为F(x1,x2,…,xn),其边际分布为,如果对任意的(x1,x2,…,xn),有 F(x1,x2,…,xn)= 成立,则称(1,(2,…,(n是n个相互独立的随机变量. 如果((1,(2,…,(n)是连续型随机变量,相应的边际密度函数为,则(3.49)的等价形式为: 是((1,(2,…,(n)的密度函数 §3.4 随机变量函数的分布 教学目的要求: 掌握随机变量函数的分布规律,并会求一些随机变量函数的密度函数,掌握几种特殊的分布及随机变量的和、商的分布函数和密度函数. 教 材 分 析 : 1.概括分析:在第二章中我们初步研究了离散型随机变量函数的分布函数,本节我们对一般的随机变量讨论随机变量函数的分布.学习本节,要求学生掌握随机变量函数的分布规律,并会求一些随机变量函数的密度函数. 2.教学重点:随机变量函数的分布规律,一些随机变量函数的密度函数的求法. 3.教学难点:会求一些随机变量函数的密度函数. 教 学 过 程 : 一、一维连续型随机变量函数的密度函数: 对离散型随机变量,我们讨论过随机变量函数的分布问题,对一般的随机变量当然也存在同样的问题,例如,若(是N((,(2)分布的随机变量,为了解决计算中的查表问题,在§3.2中曾经引入变换: (= 这个新出现的随机变量(就是原来的随机变量(的一个函数.现在来讨论连续型随机变量函数的分布问题,先介绍一个便于应用的定理. 定理3.1 设(是一个连续型随机变量,其密度函数为p(x),又函数y=f(x)严格单调,其反函数h(y)有连续导数,则(=f(()也是一个连续型随机变量,且其密度函数为  其中 ,  [证明] 不妨设f(x)是严格单调上升函数,这时它的反函数h(y)也是严格单调上升函数,于是 F((y)=P((<y)=P(f(()<y)=P((<h(y))=, f(-∞)<y<f(+∞) 由此得(的密度函数为  同理可证当f(x)严格单调下降时,有  由此知(3.51)式成立,命题得证. [例3.11] 设(是N((,(2)分布的随机变量,又y=f(x)=.容易验证这时定理3.1的条件满足,又因为y=f(x)的反函数为h(y)=(y+(,所以有  由此,我们又一次肯定了是一个N(0,1)分布的标准正态变量. 由例3.11可以看到,定理3.1在使用时的确很方便,但它要求的条件“函数严格单调,且反函数连续可微”很强,在许多场合往往不能满足.事实上,这个条件可以减弱为“函数f(x)逐段严格单调,反函数连续可微”.例如y=f(x)=x2可以成两段,在(-∞,0)段上它严格单调下降,反函数连续可微,而在[0,+∞]段上严格单调上升,反函数连续可微.所以y=x2不满足定理3.1的条件而满足减弱以后的条件.这时,密度公式(3.51)也应该作相应的修改,这里我们不给出修改后的密度公式(有兴趣的读者可以自己作这个修改工作),而给出这样的一个实例. [例3.12] 设(是N(0,1)分布的随机变量,试求(=(2的密度函数. [解] 对y≤0,显然有: F((y)=P((<y)=0 而当y>0时,有: F((y)=P((<y)=P((2<y)=P(-<(<)= 于是(的分布函数为 F((y)= 由此可得(的密度函数  不难看出,上式表示的密度函数是下述密度函数当n=1时的特例: p(x)= (其中(·)表示伽玛函数),以上式为密度函数的分布含有参数n,常常称这个分布是自由度为n的-分布(为希腊字母,读作“卡”,读作“卡方”),并记作(n),它是数理统计中一个重要的分布.由(3.52)式可知,N(0,1)变量的平方是自由度为1的-变量. 在例3.12的计算中,并没有套用现成的定理和公式,而是从分布函数的定义出发进行计算.这种方法比套用定理灵活,能解决更多的问题,下面我们继续用这种方法(有时要用到公式(3.37))来讨论多维随机变量函数的分布问题. 二、多维随机变量函数的分布: (一) 和的分布 设((,()是一个二维连续型随机变量,密度函数为p(x,y),现在来求ζ=(+(的分布,按定义为: Fζ(y)=P(ζ<y)=P((+(<y) 如果((,()表示平面上点的坐标,则P((+(<y)表示点落入图3.12中阴影部分的概率.由(3.37)式有: Fζ(y)= 如果(与(是独立的,由(3.48)知p((x1)·p((x2)是((,()的密度函数,用p((x1)·p((x2)代替(3.54)式中的p(x1,x2)便得: Fζ(y)== = 由此可得ζ的密度函数为: pζ(y)= 由对称性还可得: pζ(y)= 由(3.55)或(3.56)式给出的运算称为卷积,通常简单记为: . [例3.13] 设(,(是相互独立的N(0,1)随机变量,则ζ=(+(的密度函数为: == 令,即得:  由此可知ζ是一个N(0,2)分布的随机变量, 一般来说,若(i(i=1,2,…,n)是n个相互独立的服从N()分布的随机变量,则仍然是一个服从正态分布N((,(2)的随机变量,并且其参数为:(=, (2=. 这个事实有时也称正态分布具有可加性,如果大家有足够的耐心,可以利用上述卷积公式去证明这个结论.不过,在后面我们将会介绍一个简便得多的方法(见§3.7的例3.31). 我们已经证明了普哇松分布、正态分布具有可加性,其实还有一些其它的分布,也具有可加性,其中-分布的可加性在数理统计中颇为重要,我们在这里顺便证明这个结论.为此,可以讨论更一般形式的一个分布--分布.如果随机变量(具有密度函数为: p(x)= (其中α>0,β>0为两个常数),这时称(是参数为(α,β)的Γ分布的随机变量,相应的分布称作参数为(α,β)的Γ分布,并记作Γ(α,β). [例3.14] 设(,(是两个相互独立的随机变量,分别服从Γ(α1,β)、Γ(α2,β)分布,试求ζ=(+(的分布密度. [解] 由卷积公式(3.56)及(3.57)知当y≤0时,pζ(y)=0;而当y>0时有: pζ(y)== 令=t,则有:  其中 =β(α1,α2)= 于是  =, y>0 这就是说ζ服从Γ(α1+α2,β)分布,也就是有:Γ(α1,β)*Γ(α2,β)=Γ(α1+α2,β) 由此可知Γ分布也具有可加性(更确切的说法是Γ分布关于第一个参数α具有可加性).此外,很容易看出来,当α=,β=时,Γ(,)就是前面提到过的参数为n的-分布,所以-分布具有可加性. 如果(1,(2,…,(n是n个相互独立同分布的随机变量,每一个都服从N(0,1)分布,由例3.12知道每个(1≤i≤n)都服从(1)分布,并且仍然是相互独立的,这时由-分布的可加性并利用归纳法即知ζ=是服从(n)分布的随机变量.所以n个相互独立的N(0,1)变量的平方和是一个参数为n的-分布随机变量,因为人们习惯于把独立变量的个数称作“自由度”,所以也就把它称作自由度为n的变量. 以上我们讨论了两个随机变量和的分布问题,现在讨论它们的商的分布. (二)商的分布 设((,()是二维连续型随机变量,密度函数为p(x1,x2),现在来讨论的分布.依照定义 Fζ(y)=P(ζ<y)=P(<y) 若仍然把((,()看成平面上点的坐标,则P(<y)表示点落入图3.13中阴影部分的概率. 仍利用(3.37)式,有: Fζ(y)== = 于是的密度函数为: == [例3.15] 设(与(相互独立,分别是自由度为n及m的-分布的随机变量,试求的密度函数. [解] 自由度为n的-分布的密度函数由(3.53)式所给出,由此容易求得(/n的密度函数为:  同理还可求得(/m的密度函数为:  于是由(3.58)式得: == = 令x(ny+m)=t,则有: = = = 即为所要求的.其中末了前一步的积分  恰好是自由度为的-分布的密度函数的积分,所以等于1. 以(3.59)式为密度函数的分布称作参数为n,m的F-分布,并记作F(n,m),它也是数理统计中最常用的分布之一. 细心的同学会发现,在例3.15中,已知的是(、(相互独立,而在计算中用到的却是、相互独立.当然,由(、(的独立性能很快地推出、的独立性.为了今后的需要,我们给出一个更一般的结论,这就是下面的引理. 引理3.1 若随机变量(与(相互独立,又f(x)、g(x)是两个连续或逐段连续的函数,则f(()与g(()相互独立. 这个引理的结论在直觉上可以说是显然的.因为(、(的取值既然是独立的,也就是互相没有牵连,那么它们的函数f(()、g(()的取值当然也是没有牵连的,这就是说它们是独立的.(引理的严格证明超出了本书的范围,有兴趣的同学可以参阅复旦大学编的概率论教材.) [例3.16] 设(为N(0,1)分布的随机变量,(为自由度为n的-分布随机变量,又(、(相互独立,试求的密度函数. [解] (的密度函数由(3.53)式给出,利用定理3.1即可得到的密度函数为: p2(x)= 这时,由前述引理3.1知, (与仍相互独立,于是((,)的联合密度函数为: p(x1,x2)= 这时由(3.58)式即得:  令x2(y2+n)=t,则有: == 这里又一次利用了下述等式: =1 以(3.60)式为密度函数的分布,含有一个参数n,常常称作自由度为n的t-分布,它也是数理统计中常用的分布之一.