第四章 几类重要的分布
【授课对象】理工类本科二年级
【授课时数】8学时
【授课方法】课堂讲授与提问相结合
【基本要求】1、了解Bernoulli概型,熟练掌握二项分布、Poisson分布;
2、熟练掌握均匀分布、正态分布和指数分布及其性质;
3、熟记二项分布、泊松分布、均匀分布的数学期望和方差;
4、知道二维正态分布与均匀分布。
【本章重点】熟练掌握Bernoulli概型、二项分布、Poisson分布、均匀分布、正态分布和指数分布及其性质
【本章难点】对离散型与连续型随机变量的分布的理解
【授课内容及学时分配】
§4.0 前 言在第二章中我们曾经研究了随机变量的分布,具体的研究了离散型随机变量的分布和连续型随机变量的分布,并简单的介绍了常见的离散型分布和连续型分布,其中二项分布、Poisson分布、正态分布是概率论中三大重要的分布,因此,在本章中,我们重点研究二项分布、Poisson分布和正态分布,并在此基础上研究其它一些连续型分布。
§4.1 二项分布
二项分布是重要的离散型分布之一,它在理论上和应用上都占有很重要的地位,产生这种分布的重要现实源泉是所谓的伯努利试验。
一、泊努利分布[Bernoulli distribution] (两点分布、0-1分布)
1.泊努利试验在许多实际问题中,我们感兴趣的是某事件A是否发生。例如在产品抽样检验中,关心的是抽到正品还是废品;掷硬币时,关心的是出现正面还是反面,等。在这一类随机试验中,只有两个基本事件与,这种只有两种可能结果的随机试验称为伯努利试验。
为方便起见,在一次试验中,把出现称为“成功”,出现称为“失败”
通常记 。
2.泊努利分布定义:在一次试验中,设,,若以记事件发生的次数,则,称服从参数为的Bernoulli分布或两点分布,记为:。
二、二项分布[Binomial distribution]
把一重Bernoulli试验独立地重复地进行次得到重Bernoulli试验。
【注】:重复是指每次试验中成功的概率不变;独立是指次试验独立进行。
定义:在重Bernoulli试验中,设若以记事件发生的次数,则为一随机变量,且其可能取值为,其对应的概率由二项分布给出:
,,则称服从参数为的二项分布,记为。
若记,显然满足:
(1) 非负性,0
(2) 规范性:
二项分布描绘的是重Bernoulli试验中成功出现的次数。若记为成功出现的次数,则的可能取值为,其相应的概率为:
=
事实上:若记  ,则:
,其共有个项,且两两互不相容。
由试验的独立性可知:


例1:若在M件产品中有N件废品,现进行有放回的次抽样检查,问共取得件废品的概率有多少?
解:由于是有放回的抽样,因此,这是重的Bernoulli试验。记为“各次试验中出现废品”这一事件,则,设为次抽样检查中所抽到的废品数,则,因此,所求概率为:。
三、二项分布的数学期望与方差设,,
由数学期望的定义:

(令)
=
即:
由方差的定义:
 (令)
==
==

五、二项分布的Poisson逼近
Th:在重Bernoulli试验中,记为事件A在一次试验中出现的概率,它与试验总数有关(一组试验),若>0,则对的正整数,有
Proof:令,则,且 则
=
=
=
§4.2 泊松分布[Poisson distribution]
一、定义:称服从参数为的Poisson分布,若
 
记为:或, 
显然:

为计算方便课后给出了Poisson分布表,见附表1
【说明】历史上Poisson分布是作为二项分布的近似于1837年由法国数学家泊松引入的,若把试验中成功概率值很小的事件叫做稀有事件,则由上面TH当充分大时,重试验中稀有事件发生的次数近似服从Poisson分布。这时,参数的整数部分 [恰好是稀有事件发生的最可能次数,在实际中常用Poisson分布来作为大量重复独立试验中稀有事件发生的概率分布情况的数学模型,诸如不幸事件,意外事故、故障,非常见病,自然灾害等,都是稀有事件。
许多随机现象都服从Poisson分布。一是社会生活对服务的要求:如电话交换机中来到的呼叫次数;公共车站来到的乘客数都近似服从Poisson分布。另一领域是物理学。放射性分裂落到某区域的质电点;热电子的放射等都服从Poisson分布。
例2:设儿童在注射乙肝疫苗产生不良反映的概率为0.001,试确定2000个儿童中有3个以及多于两个儿童产生不良反应的概率?
解:设表示产生不良反应的儿童个数,则,由于假设“不良反应”是稀有事件,所以可假定服从,其中,从而可得,。
二、Poisson分布的数学期望和方差设,即

 (令)
=
==
所以:
例3:保险事业是最早使用概率论的部门之一,保险公司为了估计其利润,需要计算各种概率。 保险公司现在为社会提供一项人寿保险,据已有的资料显示:人群中与这项保险业务有关的死亡概率为0.0020,今有2500人参加这项保险,每个参保的人员在每年1月1日交付120元保险金,而在死亡时家属可从公司领20000元保险金。试问:(1)保险公司亏本的概率是多少?
(2) 保险公司赢利不少于10万元、20万元的概率是多少?
解:每年1月1日,保险公司的收入30万元=120,若一年中死亡人,则保险公司这一年应付出20000元,因此“公司亏本”意味着20000>300000 即>15人,这样“公司亏本”这一事件等价于“一年中多于15人死亡”的事件,从而转而求“一年中多于15人死亡”的概率,若把“参加保险的一个人在一年中是否死亡”看作一次随机试验,则问题可用,的试验来近似,设为一年中这些参保人员里死亡的人数,则
由上定理,,经查Poisson分布表,可得:
(1) {亏本}={==0.000070
(2)赢利不少于100000元,则意味着 300000-20000x;
赢利不少于200000元,则意味着300000-20000
故P{保险公司赢利不少于100000元}=P{=
P{保险公司赢利不少于200000元}= P{=
例4:P90 例2
课后作业:1、仔细阅读P83-92;
2、作业:P108 1,3,4,9,10
3、预习P92-98
§4.3 正态分布
0、引言:
前面我们已经研究了概率论中三个重要分布中的两个:二项分布和Poisson分布,这是两个离散型分布;下面研究第三个重要分布——正态分布,这是一个连续型分布,它不仅具有重要的理论意义,而且其应用相当广泛。
一、定义若连续型随机变量的概率密度函数为= (-则称服从参数为的正态分布。简记为~N()。[Normal distribution]
其相应的分布函数为:=
特别地:当时,称服从标准正态分布。记作,
其相应的密度函数和分布函数分别是:
=  =
为说明上述定义的合理性,需验证满足密度函数的性质:
1.非负性:显然0,
2.规范性:= (exponent)
(令)==1 (概率积分:)
即确为密度函数。
二、正态分布的特点与性质正态分布又叫Gauss分布,它在概率论的理论和应用中占有很重要的地位,因此需要研究其性质及特点。
(1)的各阶导均存在;
(2)关于x=对称 即=
且当x=时,取最大值=;
x离越远,值越小,这表明对于同样长度的区间,当区间离越远,则落在该区间上的概率越小,------位置参数,--------形状参数;
(3)在x=处有拐点,且以ox轴为水平渐近线,即=0。
三、正态分布的概率计算
(1)若,则,,。
从而P{=P{-x=P{==
(2)若,则~,且=P{}=。
proof:P{P{}=P{=
= (令)
即,于是F(x)=P{=P{}=
从而对任意实数ab,有=。
从上述分析可知:我们对所有有关正态分布的概率计算问题,都是归结为对标准正态分布的概率计算。为计算方便,书本P280给出了标准正态分布表。
例1:(质量控制的原则)设,则
P{=P{-1== P{=2
P{=2
上述结果表明:在生产过程中,当对某项质量指标作抽样调查时,可以把抽样值是否落在(,)之中作为判断生产过程是否正常的一个主要标志。
例2:设从学校到火车站有两条路线可走:第一条路线穿过市区,路程较短,但交通拥挤,所需时间(单位:秒)服从正态分布;第二条路线路程较长,但意外阻塞较少,所需时间服从正态分布问:
①若只有70分钟可用,则应走哪一条路线?
②若只有65分钟可用,又应走哪一条路线?
解:显然应走在允许的时间内有较大概率及时赶到火车站的路线,若以记行车时间,则有关概率如下:
①有70分钟可用时,走第一条路线及时赶到的概率为:

走第二条路线及时赶到的概率为:

因此,在这种场合,应走第二条路线。
②只有65分钟可用时,走第一条路线及时赶到的概率为:

走第二条路线及时赶到的概率为:

因此,在这种场合,应走第一条路线。
(3)分位数:(已知概率求区域)
①设随机变量的分布函数为,对于给定的正数,若有满足,则称为的(下侧)分位数(或分位点)。
②的分位数满足:。
由标准正态分布的对称性可知:。
四、正态分布的应用一方面,在现实中,正态分布是有广泛应用的概率分布,许多随机现象可以用正态分布或近似的正态分布来刻画。如在生产中,在生产条件不变的前提下,各种产品的某些量度(如建筑材料的抗压强度、细沙的强力、电灯泡的使用寿命、零件的尺寸等)一般都服从正态分布;在生物学中,同一种群的某种特征(像身高、体重等)一般也服从正态分布;在自然科学中,热力学中理想气体分子的速度分量,射击时命中位置目标沿某个坐标轴的偏差,测量同一物体的测量误差,考试成绩等都服从或近似服从正态分布;气象学中,每年某日的平均气温和降雨量,水文中的水位等也都服从或近似服从正态分布。另一方面,在理论上,正态分布是许多重要分布的极限分布,这就是下一章的中心极限定理。
五、正态分布的期望与方差设),则 = ()
===
DE(== ()
==(+)=
可见,正态分布的两个参数分别是该随机变量的数学期望和方差,其分布由期望和方差唯一决定。
【注】关于正态分布还有如下结论:
(1)若,则对常数,
(2)若,,则当相互独立时,有
~。
例3:设,且相互独立,试求 的密度函数。
解:由正态分布的结论可知服从正态分布,而正态分布由其两个参数唯一确定,因而只需要求出该正态分布的两个参数即可:
=2;
=4
,其概率密度函数为。
课后作业:
1、仔细阅读P92-98;
2、作业:P109 11,12,13
3、预习P98-107
§4.4 其他重要的概率分布
在其他重要的概率分布中,我们主要研究两个连续型的分布:指数分布和均匀分布。
一、指数分布[Exponent distribution]
1定义:若随机变量的概率密度函数为 (), 则称其服从参数为的指数分布。记为
显然有①;② ==1
其对应的分布函数为:
指数分布有着重要的应用,常用它来作为各种“寿命”分布的近似。例如无线电元件的寿命,动物的寿命,电话问题中的通话时间,随机服务系统中的服务时间等都常假定服从指数分布。
指数分布的重要性还表现在它具有类似于几何分布的“无记忆性”。
2指数分布的无记忆性:设服从指数分布,参数为则对,有P{,
若把理解为“寿命”,则上式表示:若已知寿命长于s年,则再活t年的概率与年龄s无关,所以有时又风趣的称指数分布是“永远年青”的。
在连续型随机变量中,只有指数分布具有这种无记忆性,这也是指数分布具有广泛应用的重要原因之一。指数分布在可靠性理论和排队论中有着广泛的应用,如随机服务系统中的服务时间等都服从指数分布。
例1:设在任意的时间间隔[]内来到某商店的顾客人数(泊松分布),求两位顾客来到之间的“等待时间”的分布函数。
解:设前一位顾客来到的时刻为0,则考虑的时间段为,当时,因非负,故;当t,若在等待时间内无顾客来到,即等待时间超过时间间隔,从而有,
故P{ 
的分布函数为,即服从参数为的指数分布。
3指数分布的数学期望和方差:
设 
则Edx===+
==

D=E-==
二、均匀分布[Uniformity distribution]
1 定义:称随机变量服从区间[a,b]上的均匀分布,若它具有密度函数:
  其中a,b为参数。记为
显然 ① ;②=1
其对应的分布函数为 
均匀分布描绘了几何型随机试验中随机点的分布。若在闭区间[a,b]上均匀投掷随机点的话,以表示随机点的落点坐标,则就服从。
对于任意长度为的区间,(),则落在该区间内的概率为P{c<=,这说明随机点落入任何区间内的概率只依赖于区间的长度而与区间在[a,b]中的位置无关,即取[a,b]中任意点的可能性一样。
例2:假设有一同学乘出租汽车从学校到火车站赶乘火车,火车是18:30发车,出租车从学校开出的时间是18:00,若出租车从学校到火车站所用的时间 ~U[15,30],且从下出租车到上火车还需9分钟,问此人能赶上火车的概率是多少?
解:若要赶上火车,则出租车行驶的时间最多只能有18分钟,所以
P{}=, 即:此人能赶上火车的概率只有40%。
2 均匀分布的数学期望和方差:
设 则
Edx==
Edx==
D=E-=
例3,设, 且独立,试求E(),D()
解:E=3 E= D=6 D= 由D=E
 E= D+=6+9=15 E= D+=
由独立,独立 所以
= EE= D()=E(=15=
三、分布[Gama distribution]
1.函数: ()
2.性质:利用分步积分法可以验证 =
! (
3.分布:若=  ( 则称服从参数为的分布,记为。
当时,=(指数分布)
可以证明,若 则E=,D=
§4.5 二维正态分布及二维均匀分布一、二维正态分布
1.定义:称二维随机变量服从二维正态分布,如果的联合概率密度函数为:
其中:为常数,且,
记为:。
2.性质:若,则
(1).,
(2).,;,;;
(3),与相互独立的充要条件为 (注:仅对二维正态分布成立)
例1:见例1。
二、二维均匀分布
定义:称二维随机变量在区域上服从二维均匀分布,如果的联合概率密度函数为: 
其中是平面上的一个有界区域,其面积为。
特别地:若区域是矩形区域:,则其概率密度函数为:

例2:见例2。
课后作业:
1、仔细阅读P98-107 ;
2、作业:P109 14,17,24,26
3、预习P112-119