2009-7-25
1
概率论第 5讲第五章 一维随机变量本文件可从网址
http://math.vip.sina.com
上下载
(单击 'ppt讲义 '后选择 '工程数学 '子目录 )
2009-7-25
2
第一节 一维随机变量及其分布函数
2009-7-25
3
每一随机试验,试验结果的集合多种多样,通常喜欢用计算机表示试验结果,则将每一试验结果用一数来表示,或者说建立起基本空间的每一个元素到实数的映射,这种代表试验结果的数,被称为 随机变量,有的基本空间本来就是实数轴,
因此试验结果本身就是随机变量,
2009-7-25
4
例 1 设一口袋中有依次标有 -1,2,2,2,3,3
数字的六个球,从这口袋中任取一个球,
取得的球上标有的数字 x是随着试验结果的不同而变化的,当试验结果确定后,
x的值也就相应地确定,
2009-7-25
5
例 2 从一批电灯泡中任取一个,取得的电灯泡在指定条件下的耐用时间 h是随着试验结果的不同而变化的,当试验结果确定后,h的值也就相应地确定,
2009-7-25
6
例 3 从一批次品率为 p的产品中逐件地抽取产品,每次抽取经检定后立即放回这批产品中再抽下一件,直到抽得次品为止,这样所需的抽取次数 z 是随着试验结果的不同而变化的,当试验结果确定后,
z 的值也就相应地确定,
2009-7-25
7
例 4 考察 "掷五分硬币 "试验,它有两个可能结果,"出现国徽朝上 "或 "出现伍分字样朝上 ",为了便于研究起见,将每一个结果用一个实数来代表,例如,可用 "1"
代表 "出现国徽朝上 ",用数 "0"代表 "出现伍分字样朝上 ",这样,当讨论试验结果时,就可以简单地说成结果是数 1或数 0.
建立这种数量化的关系,实际上相当于引入了一个变量 m,对于试验的两个结果,
m值分别规定为 1和 0,当试验确定后,m的值也就相应地确定,
2009-7-25
8
例 5 用步枪对准靶子上的一个点目标进行射击,考虑击中的点与点目标的距离 d.
可以在包含靶子的平面内以一个与这点目标为原点的直角坐标系,这样,试验结果可以用击中的点的坐标 x,y来表示,所考虑的 d是根据试验结果而定取什么值的,具体地,
22(,)x y x yd
2009-7-25
9
例 1-5中遇到的 x,h,z,m,d都是随机变量,
以后用小写希腊字母表示随机变量,
2009-7-25
10
设 x是一个随机变量,对于实轴上任意一个集 S,{x?S}代表了一个随机事件,意即基本空间 U内所有能使 x(e)?S的 e所组成的集代表一个随机事件,S确定后,
P{x?S}随之唯一地确定,由这个对应关系定出,以实轴上的集 S为自变量,函数值在区间 [0,1]上的函数 P{x?S},称为随机变量 x的分布,它表明了 x的取值规律,
2009-7-25
11
例如,例 1中的随机变量 x的分布可如下得出,
由于取得这六个球中的任一个的概率都为 1/6,所以
1 3 1 1{ 1 },{ 2 },{ 3 },
6 6 2 3
P P Px x x? -
对于数轴上的集合 S,P{x?S}可以如下算得,
检查 S含有 -1,2,3中的哪几个,把相应的概率 1/6,1/2,1/3中的有关几个相加,
2009-7-25
12
例如,当 S=[-1,2.5)时,S中含 -1,2,3中的 -1,2,
所以
1 1 2
{}
6 2 3
PSx
x-1 0 1 2 3
1/6
1/2
1/3
2009-7-25
13
这种 S给定后 P{x?S}随之确定的规律就是 x的取值规律,即 x的分布,
通常用下面规定的分布函数来表达分布,
设 x为一个随机变量,令
F(x)=P{x<x},(-?<x<?).
这样规定的函数 F(x)的定义域为整个数轴,函数值在区间 [0,1]上,称这个函数为
x的分布的 分布函数,简称为 x的分布函数,
2009-7-25
14
例 6 求 例 1中的随机变量 x的分布函数,
解 x可能取的值为 -1,2,3,取这些值的概率依次为 1/6,1/2,1/3.
当 x?-1时,{x<x}是不可能事件,所以 F(x)=0.
当 -1<x?2时,{x<x}包含 {x?-1},所以
1()
6
Fx?
当 2<x?3时,{x<x}包含 {x?-1或 x=2},所以
1 1 2()
6 2 3
Fx
当 3<x时,{x<x}是必然事件,所以 F(x)=1
2009-7-25
15
总括起来,F(x)的表达式为
0,1,
1 / 6,1 2,
()
2 / 3,2 3,
1,3
x
x
Fx
x
x

-



1/6
2/3
1
F(x)
-1O 1 2 3 x
2009-7-25
16
例 7 在一个均匀陀螺的圆周上均匀地刻上区间 [0,1)上的诸值,旋转这陀螺,求它停下时其圆周上触及桌面的点的刻度 x
的分布函数,
0
0.25
0.75
2009-7-25
17
解 按陀螺的均匀性及刻度的均匀性,对于区间 [0,1)内的任一个区间 [a,b),有
{}
10
baP a b b ax - -
-
对于数轴上任一个区间 S,由于 x取区间
[0,1)外的值的概率为零,所以
P{x?S}=l(S),
其中 l(S)为 (S?[0,1))的长度值,
下面来计算 x的分布函数,
2009-7-25
18
当 x?0时,(-?,x)?[0,1)为空集,所以
F(x)=P{x<x}=0.
当 0<x?1时,(-?,x)?[0,1)=[0,x),所以
F(x)=P{x<x}=x.
当 1<x时,(-?,x)?[0,1)=[0,1),所以
F(x)=P{x<x}=1.
即所求分布函数为
0,0,
( ),0 1,
1,1,
x
F x x x
x



2009-7-25
19
分布函数的图形为
0,0,
( ),0 1,
1,1,
x
F x x x
x



F(x)
1
1O x
2009-7-25
20
按分布函数的定义可知
P{a?x<b}=P{x<b}-P{x<a}=F(b)-F(a),
即事件 {x?[a,b)}的概率等于分布函数在该区间上的增量,
分布函数具有以下性质,
(1) 0?F(x)?1,(-?<x<+?).
(2) F(x1)?F(x2),(x1<x2)
即任一分布函数都是单调非减的,
0
00
0
( 3 ) l im ( ) 0,l im ( ) 1,
( 4) l im ( ) ( ),( ),
xx
xx
F x F x
F x F x x
-
-

-
即任一分布函数处处左连续
2009-7-25
21
第二节 离散型随机变量
2009-7-25
22
从 例 1及 例 3可以看到,有一类随机变量,
它所有可能取的值是有限个或可数多个数值,这样的随机变量称为 离散型随机变量,它的分布称为 离散型分布,
2009-7-25
23
除了可用随机变量的分布及分布函数表明随机变量的取值规律外,通常还可用下面规定的分布密度来表达离散型随机变量的取值规律,
2009-7-25
24
设 x为一个离散型随机变量,它所有可能取的值为 a1,a2,...,事件 {x=ai}的概率为
pi,(i=1,2,...),那末,可以用下列表格来表达 x取值的规律,
x a1 a2,.,ai,..
概率 p1 p2,.,pi,..
其中 0?pi?1,(i=1,2,...)且 1
i
i
p
称这个表格所表示的函数为离散型随机变量 x的 分布密度,或称 分布律 或 概率函数
2009-7-25
25
例 8 求出例 3中的随机变量 z的分布密度,
解 z可能取的值为 1,2,3,...即所有的自然数,
{z=1}即第一次就取得次品,P{z=1}=p,
{z=2}即第一次取得正品,第二次取得次品,
所以 P{z=2}=(1-p)p,
...
{z=i}即第 1,2,...,i-1次都取得正品,第 i次取得次品,所以
P{z=i}=(1-p)i-1p,(i=1,2,...).
2009-7-25
26
z的分布密度为
z 1 2 3,.,i,..
概率 p (1-p)p (1-p)2p,.,(1-p)i-1p,..
2009-7-25
27
下面介绍几个特殊的离散型分布。
如果 x的分布密度为
x a
概率 1
则称 x的分布为 退化分布,一个退化分布依赖于一个常数 a.
2009-7-25
28
如果 x的分布密度为
x a b
概率 1-p p
则称 x为 两点分布,当其中的 a,b依次为 0,1
时,称这种分布为 零 -壹分布,一个零 -壹分布依赖于一个在 (0,1)内的常数 p
2009-7-25
29
如果 x的分布密度为
nnn
aaa n
111
21
概率
x
其中 ai?aj,(i?j),则称 x的分布为离散均匀分布,一个离散均匀分布依赖于一个自然数 n及 n个不同的常数 a1,a2,...,an.
2009-7-25
30
第三节 二项分布 泊松 (Poisson)分布
2009-7-25
31
设在某个指定的试验中,一个指定的事件 A出现的概率为 p(0<p<1),重复独立地做这试验 n次,这 n次试验中,A出现的次数 x是一个随机变量,按第四章第五节,x
可能取的值为 0,1,2,...,n,而
{ } ( 1 ),( 0,1,2,,)i n i
n
P i p p i n
i
x -

-

2009-7-25
32
因此,x的分布密度为
ninnnn ppp
i
n
pp
n
pp
n
p
ni


--- -


-


-


- )1()1(
2
)1(
1
)1(
210
221概率
x
这个离散分布称为二项分布,它依赖于自然数 n及介于 0,1之间的数 p,以后把这个分布简记为 B (n,p)
2009-7-25
33
在次品率为 p的一大批产品中任取 n件产品,那末取得次品的件数 x服从 B (n,p),
只要把每取一件产品做为一次试验,令 A
为取得次品的事件,利用上面的结论便可推得这个结果,这里,注意到,由于这批产品中产品的件中很多,取去少许几件可以认为并不影响留下部分的次品率,
2009-7-25
34
下面来引出另一个重要的离散型分布,
设有 N个质点,每一个质点落在容积为 V
的媒质内,容积为 v的区域中的概率为
v
V
每个质点所处的位置与其余质点所处的位置相互独立,从这容积为 V的媒质内任取容积为 v的部分时,取到部分中含有的质点数是一个随机变量 x,下面来计算 x的分布密度,
2009-7-25
35
试验示意图,
V
v
2009-7-25
36
把每一个质点所落的位置看作一个试验结果,这个质点落在所取的部分内为指定事件 A发生,现在的 N就是重复独立试验的试验次数 n,v/V就是每次试验中 A发生的概率 p,从而 x服从二项分布
B (N,v/V),即 x的分布密度为
NiNiNN
V
v
V
v
V
v
i
N
V
v
V
vN
V
v
Ni
-


-


-
--


11
1
1
10
1
概率
x
2009-7-25
37
实际上,往往是 v/V近于 0,N很大,下面计算这种情形下,x取各个值的概率的近似值
( 1 ) ( 1 )
{ } 1
!
( 1 ) ( 1 )
1
1
i N i
Vv
N
vV
i
N N N i v v
Pi
i V V
v v v
N N N i
V V V
i
v
V
v
V
x
-

--


- -
-


- -?

-



-


2009-7-25
38
对于固定的 i,当 N,0v
V
但 vN
V

(?为一固定的数 )时,有,( 1 ),,( 1 ),
1 1,1,
V
i
v
v v v
N N N i
V V V
vv
e
VV

-
-? -

-? -

所以
{ },( 0,1,2,)
!
i
P i e i
i
x -
2009-7-25
39
因此,当 N很大 v
V
近于 0时,有
{ },( 0,1,2,,),
!
i
P i e i N
i
x -
其中,vN
V

2009-7-25
40
从而看到,当 n很大,p接近于零时,B(n,p)
的分布密度近似于下列函数


---- e
i
eee
i
i
!!2
210
2
因变量自变量其中?=np.
以这个函数为分布密度的离散型分布称为泊松分布,其中?为一个正的常数,泊松分布依赖于一个正的常数?,以后把参数为?的泊松分布记作 P (?)
2009-7-25
41
作业,第 64页开始第 4题,第 5题,