第二章 随机变量及其概率分布
【授课对象】理工类本科二年级
【授课时数】8学时
【授课方法】课堂讲授与提问相结合
【基本要求】1、了解随机变量的概念;
2、理解离散型随机变量的概念及其分布律的概念和性质;
3、理解连续型随机变量的概念及其概率密度函数的概念和性质;
4、理解分布函数的概念,并知道其性质;
5、会利用分布律、概率密度函数及分布函数计算有关事件的概率;
6、会求简单的随机变量函数的概率分布;
7、了解二维随机变量的概念,知道二维随机变量的边缘(边际)分布、联合分布函数等概念;
8、了解二维连续型随机变量的联合概率密度函数的概念及性质,进一步掌握其边缘分布与联合分布的关系,并会计算有关事件的概率;了解二维连续型随机变量独立性的概念。
【本章重点】随机变量的概念;连续型(离散型)随机变量的密度函数(分布律)的概念和性质以及它们的分布函数的概念和性质;二维随机变量的边缘分布、联合分布函数等概念;随机变量函数的概率分布以及二维随机变量独立性的概念。
【本章难点】随机变量的概念及性质;连续型随机变量的概率密度函数及分布函数的性质与相关计算;二维连续型随机变量的边缘分布与联合分布的关系以及独立性的概念。
【授课内容及学时分配】
§2.1 随机变量的概念在第一章里,我们主要研究了随机事件及其概率,同学们可能会注意到在随机现象中,有很大一部分问题与实数之间存在着某种客观的联系。例如,在产品检验问题中,我们关心的是抽样中出现的废品数;在车间供电问题中,我们关心的是某时期正在工作的车床数;在电话问题中关心的是某一段时间内的话务量等。对于这类随机现象,其试验结果显然可以用数值来描述,并且随着试验的结果不同而取不同的数值。然而,有些初看起来与数值无关的随机现象,也常常能联系数值来描述。比如,在投硬币问题中,每次实验出现的结果为正面或反面,与数值没有联系,但我们可以通过指定数“1”代表正面,“0”代表反面,为了计算n次投掷中出现的正面就只须计算其中“1”出现的次数了,从而使这一随机试验的结果与数值发生联系。
一般地,如果为某个随机事件,则一定可以通过如下示性函数使它与数值发生联系:
这就说明了,不管随机试验的结果是否具有数量的性质,我们都可以建立一个样本空间和实数空间的对应关系,使之与数值发生联系。
为了全面的研究随机试验的结果,揭示随机现象的统计规律性,我们将随机试验的结果与实数对应起来,将随机试验的结果数量化,引入随机变量的概念。
引例:随机试验E1:从一个装有编号为0,1,2,…,9的球的袋中任意摸一球。则其样本空间={,,…,},其中“摸到编号为的球”,=0,1,…,9.
定义函数 :,即()=,=0,1,…,9。
这就是和整数集{0,1,2,…,9}的一个对应关系,此时表示摸到球的号码。
从上例中,我们不难体会到:
①对应关系的取值是随机的,也就是说,在试验之前,取什么值不能确定,而是由随机试验的可能结果决定的,但的所有可能取值是事先可以预言的。
②是定义在上而取值在R上的函数。
同时在上例中,我们可以用集合{:()5}表示“摸到球的号数不大于5”这一随机事件,因而可以计算其概率。习惯上我们称定义在样本空间上的单值实函数为随机变量。这就有了如下定义:
定义:设随机试验E的样本空间为,=()是定义在上的单值实函数,若对任意实数,集合{:()x}是随机事件,则称=()为随机变量(Random Variable)。
定义表明随机变量=()是样本点的函数,为方便起见,通常写为,而集合{:()x}简记为{x}。
如在上例中,摸到不大于5号球的事件可表示为{5},则其概率为P{5}=3/5。
随机变量的引入,使概率论的研究由个别随机事件扩大为随机变量所表征的随机现象的研究。正因为随机变量可以描述各种随机事件,使我们摆脱只是孤立的去研究一个随机事件,而通过随机变量将各个事件联系起来,进而去研究其全部。今后,我们主要研究随机变量和它的分布。
§2.2 随机变量的概率分布对于随机变量来讲,我们不仅关心它取哪些值,更关心它以多大的概率取那些值,即研究随机变量的统计规律性—分布函数。
一、随机变量的分布函数
由前可知,若是随机变量,则对xR,{x}是随机事件,所以P{x}有意义。当实数a<b时,有:P{a<b}=P{b}-P{a}
可见,只要对一切实数x给出概率P{x},则任何事件{a<b}及它们的可列交、可列并的概率都可求得。从而P{x},xR完全刻划了随机变量的统计规律,并决定了随机变量的一切概率特征。
1.定义:设是上的随机变量,对xR,
称= P{x}为的分布函数。
2.性质:设是随机变量的分布函数,则具有如下性质:
①单调非降性:即对,
Proof:对,有,则

②规范性:,
③右连续性:对有 
(性质②,③的证明可参考其它有关的资料)
注:反之可证明:对于任意一个函数,若满足上述三条性质的话,则它一定是某随机变量的分布函数。
例1:判断下列函数是否为分布函数
 (√)  (×)
由定义可见,要计算取值的概率可以通过其分布函数来实现。为了研究随机变量的概率分布,我们常选择来代替之。
3.运算:若, 则有:

例2:已知的分布函数为

求。
解:

例3:设某随机变量的分布函数为,试确定A,B的值。
解:由
得
例4:设的分布函数为
 确定A并求
解:由右连续性知,而,
即
则
例5:设某随机变量的分布函数为
 (a>0)
求A,B。
解:由

课后作业:1、仔细阅读P30-33;
2、作业:P61 1,3,6,7;
3、预习P33-39
二、随机变量的分类

三、离散型随机变量及其分布律(列)
1.定义:设是上的随机变量,若的全部可能取值为有限个或可列无限个(即的全部可能取值可一一列举出来),则称为离散型随机变量。
若的取值为,把事件的概率记为,则称为的分布列。
【注】:由定义可知,若样本空间是离散的,则定义在上的任何单值实函数都是离散型随机变量。
2.离散型随机变量的分布列满足下列性质:
(1)非负性:
(2)规范性:
Proof:是概率,即,故
由于是的一切可能取值,故有,注意到对任意的,有,
由概率的可列可加性知:
反之,任意一个满足以上二性质的数列,都可以作为某离散型随机变量的分布列。
有了的分布列以后,我们可以通过如下方式求的分布函数:
3.离散型随机变量的分布函数:
,若这样的不存在,规定
显然,是一个右连续、单调非降的递阶函数,它在每个处有跳跃,其跃度为,当然,由也可以唯一确定和。因此的分布列也完全刻画了离散型随机变量取值的规律。这样,对于离散型随机变量,只要知道它的一切可能取值和取这些值的概率,也就是说知道了它的分布列,也就掌握了这个离散型随机变量的统计规律。
例1:袋中装有5只同样大小的球,编号为1,2,3,4,5,从中同时取出3只球,求取出的最大号的分布列及其分布函数并画出其图形。
解:先求的分布列:由题知,的可能取值为3,4,5,且
,
的分布列为:,由得:

注:离散型随机变量的分布列与其分布函数是一一对应的。
常见的离散型分布有:
1.退化分布(单点分布),,,
2.贝努里分布(两点分布):或
3.二项分布:
4.泊松(Poisson)分布:
四、连续性随机变量及概率密度函数
1.定义:设是随机变量,是它的分布函数,若存在一个非负可积函数 使得对任意的,有,则称为连续性随机变量,称为的概率密度函数或分布密度函数。
由定义显然可知,连续。
2.的几何意义:在几何上表示一条曲线称为分布密度曲线,则的几何意义是:以分布曲线为顶,
以X轴为底,从到x的一块变面积。
3.密度函数具有如下性质:
(1) 非负性:
(2) 规范性:
Proof:由分布函数的性质有,
注:任意一个满足以上二性质的函数,都可以作为某连续型随机变量的密度函数。
(3) 若在x处是连续的,则
注:由该性质,在连续点x处有,从这里我们看到概率密度的定义与物理学中的线密度的定义相类似,这就是为什么称之为概率密度的缘故。
(4)设a,b为任意实数,且,则
(5)若是连续型随机变量,则
事实上,
而
从此可知:概率为0的事件不一定是不可能事件,称为几乎不可能事件;同样概率为1的事件也不一定是必然事件。这样,对连续性随机变量有:
,

例2:设随机变量的密度函数为 其中常数,试确定k的值并求概率和的分布函数。
解:由


由于密度函数为
分布函数
注:连续型随机变量的密度函数与其分布函数之间是一一对应的。
常见的连续型分布有:①均匀分布:,;
②正态分布:,;
③指数分布:,。
以后当我们提到一个随机变量的“概率分布”时指的是它的分布函数;或者,当是离散型随机变量时指的是它的分布律,当是连续型随机变量时指的是它的概率密度。
课后作业:1、仔细阅读P33-39;
2、作业:P62 8,9,10,12;
3、预习P39-44
§2.3 随机变量的函数及其分布设是一随机变量,是一个连续的实值函数,按照随机变量的定义,也应是一随机变量。下面我们通过的分布来研究随机变量的分布。
关于该问题的一般提法:已知的分布,求的分布。
一、离散型随机变量函数的分布已知的分布列为 求的分布列。
由于是离散型随机变量,则仍是离散型随机变量,所以分布列为
,若其中有某些相等,则把相等的值分别合并,并相应地将其概率相加。
例1:设,试求的分布列。
解:易知的可能取值为1,2,5,且可知

则
二、连续型随机变量函数的分布引例:已知的密度函数为,求 的密度函数
因为
从而,其密度函数

一般地有如下定理:
Th:设连续型随机变量的密度函数为,若是处处可导的函数,则的密度函数为:

其中,D为其定义域。
Proof:仅证
在内取值,
所以,当时,,
当时,
当时,

从而有
例2:设连续型随机变量,试求的密度函数。
解:,由,则由上述定理可知

§2.4 二维随机变量及概率分布在前三节,我们主要讨论了一维随机变量及其分布函数,并简单地介绍了常见的随机变量的分布函数。但在实际应用和理论研究中,我们所感兴趣的许多现象,其每次试验的结果仅用一个随机变量描述还不够,往往要用两个或两个以上的随机变量来描述。例如,炮弹在地面的命中点的位置是由两个随机变量(两个坐标)来确定的。电子放大器的干扰电源是由振幅和相位这两个随机变量来确定的等等。下面我们先介绍二维随机变量及其分布,并推广到维。
一、二维随机变量的定义及其分布函数
1.定义:设是的两个随机变量,则由构成的二维向量称为二维随机变量。
二维随机变量的性质不仅与及有关,而且还依赖于这两个随机变量的相互关系,因此,逐个的来研究或的性质是不够的,还需要将作为一个整体来进行研究。和一维的情形类似,我们也借助“分布函数”来研究二维随机变量。
2.联合分布函数
<1>定义:设()为二维随机变量,,
称二元函数为的联合分布函数。
几何意义:在处的函数值就是随机点()落在以点为顶点的左下方无穷矩形区域内的概率。
<2>性质:
①对每个自变量具有单调非降性:
即对固定的,当时,有
对固定的,当时,有
②规范性, 


③对于每个自变量具有右连续:
即对固定的,(+0,)==(,)
对固定的,(,+0)==(,)
④对<R,<R有:
(,)-(,)-(,)+(,)0
事实上,
反之,对任意满足上述四条件的二元函数,都可作为某二维随机变量的分布函数。
【注】:上述四条件中(4)不可缺少。
例如:二元函数=满足性质①、②、③,而不满足④。
取,,,有-- + <0
故不能作为某二维随机变量的分布函数。
由于的分布函数完全决定了它的概率特征,因而也就完全决定了它的各分量的概率特征,这样就可以通过其联合分布函数来求每个分量的分布函数。
3.边缘分布函数:若的分布函数为,则称
;
分别为关于的边缘分布函数。
二、二维离散型随机变量及其分布
1.定义:设是二维随机变量,若分别是离散型随机变量;或者的全部可能取值为有限或可列个数对(,),=1,2…,则称为二维离散型随机变量,称为的联合分布列。
2.性质:
(1)非负性:0,=1,2….
(2)规范性:=1
反之,任何具有上述性质的数集{:=1,2….}都可作为某二维离散型随机向量的联合分布列。
知道了的联合分布列以后,可以求其联合分布函数:
3.联合分布函数
=P(ξx,ηy)=P{ξ=,η=}=,
同分布函数一样,可以求其边缘分布列:
4.边缘分布列
ξ的边缘分布列:
事实上:=P{ξ=,η=}=P({ξ=,η=}
=P({ξ=}[{η=}])=P{ξ=}
η的边缘分布列:
上述关于联合分布列与边缘分布列之间的关系可用下表来表示:
ξ η      
      
      
    
      
      
      
例1,袋中有2只白球,3只黑球,现进行有放回及无放回二次摸球。定义随机变量如下:ξ= η=,求(ξ,η)的分布列。
解,有放回情形,无放回情形:
ηξ 0 1  ηξ 0 1 
0    0   
1    1   
     
【结论】:联合分布列可以唯一地确定边缘分布列,反之不然.
课后作业:1、仔细阅读P39-44;
2、作业:P63 14,16,17,18;
3、预习P44-60
三、二维连续型随机变量及其分布
1.定义:设(ξ,η)为二维随机变量,为其联合分布函数,若存在非负可积的函数,使对 有:=P(ξx,ηy)=。
则称为连续型随机变量,为的联合概率密度函数。
2.具有如下性质:
<1>非负性,0 R
<2>规范性,dxdy=1
注:任意一个满足以上二性质的函数,都可以作为某二维连续型随机变量的密度函数。
<3>若在点连续,则=
<4>对某一区域D,P{(ξ,η)D}=
(该公式为的扩充)
由此不难求得 ξ,η的边缘概率密度函数:
3.边缘概率密度函数:
由(x)==知:
= 为ξ的概率密度函数同理= 为η的概率密度函数例2:已知二维随机变量具有密度函数

试求:①常数C、及;
②,其中D由围成。
解:①由规范性1=dxdy=cdxdy
=c  =,c=4
故=P(u,v)dudv
=
而(x)=
所以==
同理:=
==
②P{(ξ,η)D}==
==1-3
§2.5 随机变量的相互独立性独立性的概念在概率论中是非常重要也是最基本的概念,它在概率论和数理统计及其应用中占有很重的地位。
一、随机变量的相互独立性
1.定义:设是二维随机变量,若有
即,
则称相互独立。
2.设(ξ,η)是二维离散型随机变量,ξ,η相互独立对于的任一可能取值有,即
例1.设二维随机变量的联合分布列为
①求应满足的条件;
②若与相互独立,求的值。
解:①根据非负性和规范性可知:
②因为相互独立,则知
故
3.设(ξ,η)是二维连续型随机变量,则ξ,η相互独立,有
几乎处处成立。
Proof:,”若,则

ξ.η相互独立
“”由独立的定义

由联合密度函数的定义知:是(ξ,η)的联合概率密度函数。
即
例2.设;
①求常数;
②与是否相互独立;
③求。
解:①由规范性知:
又
,同理
从而,
②由于

而,所以与相互独立。
③
因为与相互独立,所以
【注】:①.若两两独立不能得到相互独立;
②.随机变量的独立性不具有传递性;
③对于而言,由的分布可以确定关于与的边缘分布,反之一般不成立,只有当与独立时,由边缘分布能确定联合分布;
④随机变量的独立性是随机事件独立性的扩充,我们也常利用问题的实际意义去判断两个随机变量的独立性。
二、随机向量函数的分布在前面,我们讨论了一维随机变量的函数的概率分布,下面我们讨论二维随机变量之间的函数分布:
已知的分布,求的分布
1.和的分布:
①对离散型随机变量:
已知的分布列为,求的分布。
这时的所有可能取值为 i,j=1,2,3…

若ξ,η独立,则

即找出的所有可能取值,并注意将相同的值进行合并,然后求出相应的概率。
思考:设,,且与独立,
求:(1)的联合分布列;
(2)的分布列;
(3)
②对连续型随机变量:
已知是连续型随机变量,其联合密度函数为,求的密度。


(若被积函数在积分区域上连续,则可交换积分顺序)
的密度函数为
若与相互独立,则
(卷积公式)
即相互独立的二随机变量和的密度函数是这两个随机变量密度函数的卷积。
以下仅对连续型随机变量考虑:设
2.商的分布:


独立情形:
3.最大与最小的分布:
当与相互独立时,
例4:已知  且相互独立,求的密度函数。
解:(法一)要使被积函数非零,则应有
,
从而可得。
(法二)令
易知,与相互独立(但与不一定相互独立),要使非零,
则应满足条件:,
则有

注:对于二维连续型随机变量来说,无论是求落在某一区域内的概率,还是求其函数的分布,都是使用公式 。
课后作业:1、仔细阅读P44-60;
2、作业:P64 21,23,24,26
3、预习P60-73