第六讲 随机变量及其分布
(二)
2,连续型随机变量
在前面我们学习一类离散型随机变量,主要特点是它 仅
取有限或可数个值,并且取每个值的概率大于 0 。 但
在实际问题中,我们时常需要考虑另外一类随机变量,
如,随机地向 [ 0,1 ] 区间上投点其落点的位置;日光灯
泡的使用寿命;测量误差等,对于这些数量关系,我们
都不可能要求它们取事先指定的可数个值。 实际上,它
们在 [ 0,1 ], ( 0,)? 和 (,)? ? ? ? 上取值。 更为重要的是,
它们取 每个给定值的可能性均为 0 。 这时,我们该怎样
刻画这些随机变量呢?,
让我们从随机地向 [ 0,1 ] 区间上投点开始,令 X 表示其
落点的位置。 正如几何概率模型中所说的,X 取每个
点的可能性都相同,并且我们可以考虑落在一个区间或
一个集合内的概率。
如计算
()P a X b?? ()P X B?
这只与区间长度 ba ? 或 B 的长度 ||B 有关,即
()P a X b b a? ? ? ? ( ) | |P X B B??
正如物理中计算物质质量一样,我们说 X 具有
均匀概率密度函数
1,0 1
()
0,
x
px
???
? ?
?
其它
一 般 地, 考 虑 (,)R =- ゥ 一个函数
,( )p x p x?, 如果满足
1,( ) 0px 3
2,
( ) 1p x d x
¥
-
=
ò
那么称 ()px 为
R
上的一个 概率密度函数 。
注, 条件 2 并不是很强的限 制,因为当
()p x d x M
¥
-
=ò
时,我们可以令 ( ) ( ) /p x p x M
*
= 即可得到一
个概率密度函数。
条件 1 要求 ()px 所对应的曲线完全位于 x 轴的
上方,事实上,曲线上方的面积有着重要的概
率意义。
如果一个随机变量,XR W 满足
( ) ( )
b
a
P a X b p x d x<?
ò,
ab"<,
那么称
X
为连续性随机变量,具有概率密度函
数 ()px 。
( 注意:这里实际上要求 {, ( ) }a X b?? ? ? ? F,
ab"< )
这时,对任何 x-? <,定义
( ) ( ) ( )
x
F x P X x p u d u
-
=? ò
称为 X 的分布函数。
从微积分学基本结果知,如果 ()px 是连续函
数,那么 ()px 是 ()Fx 的 导 数, 即
( ) ( )F x p x¢ = 。 如果 ()px 不是处处连续的函
数, 那 么 在 ()px 的 连 续 点 处, 仍 有
( ) ( )F x p x¢ = 。
不难看出 ()Fx 具有下列性质,
2, ()Fx 单调增加
1, 0 ( ) 1Fx??, l i m ( ) 0
x
Fx
? ? ?
?, l i m ( ) 1
x
Fx
?? ?
?
3, ()Fx 处 处 连续
注:对于连续型随机变量,我们更多地使用
密度函数,因为它常常更简洁、更具有特
色。
连续型随机变量的例子:
(1),均匀分布
如果随机变量 X 在 [ 0,1 ] 上取值,并且取每
个值是等可能的,即具有概率密度函数
1
,a
()
0,
xb
px ba
其它
?
???
? ??
?
?
那么称 X 服从 [ 0,1 ] 上的均匀分布,记作
[,]X U a b,。
相应的分布函数为
0,
(),a
1,
xa
xa
Fx xb
ba
xb
??
?
??
? ???
?
?
??
?
图形示范
(2),指数分布
如果随机变量在 [0,)¥ 上取值,具有概率密
度函数
,0
()
0,
xex
px
其它
?? ?? ? ? ?
? ?
?
其中 0l >, 那么称 X 服从参数为 l 的指数
分布分布,记作 e x p ( )X l,。
相应的分布函数为,
0,0
()
1,0x
x
Fx
ex ??
??
? ?
? ? ? ??
图形示范
正如前面学过的几何分布一样,指数分布也具有
无记忆性,即
( | ) ( )
y
P X x y X x e P X y
l-
> + > = = >
我们今后还会看到:指数分布和 P ois s on 分布有着
密切的联系。
(3),正态分布
其中 m-? <, 0s >,那么称 X 服从参数
为 2,ms 的正态分布,记作 2(,)XN ms,。
如果随机变量在 (,)- ゥ 上取值,具有概率密度
函数 2
2
1 ( )
( ) e x p,
22
x
px
x
m
sps
骣 -
÷?=- ÷
? ÷
? ÷桫
-? <
图形示范
当
2
0,1ms == 时,我们称为标准正态分布。 正态
分布这个名称也许首先 F,G alton 在 1885 年之前给
出,它被认为是最重要的一种概率分布。 根据著名
的中心极限定理 ( 以后将介绍 ),在自然界和人类社
会中许多现象都可由正态分布加以描述。
( 1 ) 验证上述 ()px 确实为密度函数,即
( ) 1p x d x
¥
-
=ò
( 2 ) 分析 ()px 的图形性质和特点
(3 ) 人们通常用 () xF 表示标准正态分布的分布函
数,即
2
2
1
()
2
u
x
x e d u
p
-
-
F= ò
对于一般的正态分布随机变量 2(,)XN ms:,其
分布函数 ()Fx 可由 () xF 来表示,
这个积分并没有一个显性函数表示,因此人们已建
立了一个表备用。
学查分布函数表
2
2
1 ( )( ) e x p
22
x ux
F x d umm
ssps-
骣 骣-- ÷? ÷?
= - = F÷? ÷?÷ ÷?? ÷
桫桫ò
2(,), ( 0,1 )XX N Nmm s h
s
-?::
例, 设 ( 2,9 )XN,,求 ( 5 2 0 )PX <<,
例, 设
2
(,)XN ms:,求 ( | | )PX ms-,
( | | 2 )PX ms-,以及 ( | | 3 )PX ms-,
解
解
正态随机变量的 9 9,73 % 的值落在 ( 3,3 )m s m s-+
之中,落在该区间之外的概率几乎为零, 这情况被实
际工作者称为,3 σ 原则,
解
例, 从南郊某地乘车到北区火车站有两条路可走,
第一条路较短,但交通拥挤,所需时间 X 服从
( 50,10 0)N 分布;第二条路线略长,但意外阻塞较
少,所需时间
Y
服从 ( 60,16)N,
(1 ) 若有 70 分钟可用,问应走哪一条路?
(2 ) 若只有 65 分钟可用,又应走哪一条路?
(4),Gamma 分布
如果随机变量在 ( 0,)¥ 上取值,具有概率密度函
数
1
,0
() ()
0,
x
x e x
px
其它
?
???
?
??
?
? ? ??
? ??
?
?
其中,0ab >, 那么称 X 服从参数为,ab 的 G 分
布,记作 (,)X abG,。
这里 G 函数 ()bG 被定义为
1() xx e d xbb
¥
--
-
G= ò
特别,1b = 如果 1b =,那么 X 正是前面介绍过
的参数为 a 的指数分布; 如果
1
2
a =,并且对某个
正整数 n 使得
2
n
b =, 那么我们称 X 服从参数为
n 的
2
c 分布,记作
2
()Xn c,。
(5),Cauchy 分布
如果随机变量在 (,)- ゥ 上取值,具有概率密度
函数
那么称 X 服从 C a u c h y 分布。
2
1
( ),
( 1 )
px
x
x
p
=
+
-? <
(6),Beta 分布
如果随机变量在 ( 0,1 ) 上取值,具有概率密度函数
其中,0ab >, 那么称 X 服从参数为,ab 的 B e ta
分布,记作 (,)XB ab,。
11( ) ( ) ( 1 ),0 1
()()
0,
x x x
px
其它
????
??
????? ? ? ?
?
??? ?
?
?
注意到 B e t a 函数 (,)B ab 和 G a m m a 函数间的关
系,
上述 ()px 确实是密度函数。
1 11
0
()(,), ( 1 )
( ) ( )
B x x d x?? ????
??
?? ??? ? ?
???
特别,如果 1ab ==,那么 X 服从 [ 0,1 ] 上的均
匀分布。
(7),Weibull分布
其中,0ab >, 那么称 X 服从参数为,ab 的
W e ib u ll 分布。
如果随机变量在 [ 0,)¥ 上取值,具有概率密度函
数
1,0
()
0,
xx e x
px
其它
???
?? ??? ? ? ??
? ?
??
特别,如果 1b =,那么 X 服从参数为 a 的指数分
布。
其分布函数为
1,0
()
0,
xex
Fx
其它
???
? ? ? ? ??
? ?
??
3,一般随机变量
以上我们介绍了两类典型的随机变量及其分布:
(1) 离散型随机变量取有限或可列个值,其分布可
用分布列刻画,分布函数是阶梯型函数;
(2) 连续型随机变量在一个或几个不相交的区间内
取值,具有密度函数,分布函数是处处连续的,并
具有导数。
但我们应该强调,除了这两种以外,还存在其它类
型的随机变量。
令
( ) 1,(,) )X T X H qq= - =
考虑下列随机试验,
投掷一枚硬币,出现正面的可能性为 p ;如果出
现正面,那么继续投掷一次标枪,标枪的倾斜角
度 q 为 ( 0,2 )p 上的均匀分布。 这时,样本空间为
{,(,), 0 2 }TH q q pW= #
其中 H 代表正面, T 代表反面。
该函数除 1- 点外处处连续,X 既不是离散型随
机变量,也不是连续型随机变量。
那么该随机变量 X 取值为 { 1 } [ 0,2 ]p-,其分布
函数 ()Fx 如下
0 1
,- 1 0
()
,0 2
2
1,2
x
qx
Fx x
q p x
x
,
?
?
?
???
?
??
??
? ?
? ? ?
?
?
? ? ???
严格来说,上式应写成
对一般的随机变量,我们主要使用分布函数来刻
画其取值的规律。 给定一个概率空间 (?,F,P ),
假设,XR W 是一个随机变量,那么定义
( ) ( )F x P X x=
作为分布函数。
( ) (, ( ) )F x P X xww=
注意到 P 是从 F 到 [ 0,1 ] 上的一个函数,或者说,
只有对 F 中的集合或事件 A, ()PA 才有定义。
因此,为了对每个 x, 我们能很好地定义
()Fx, 那么需要 {, ( ) }Xxww N F 。这就导致
了随机变量的严格数学定义,给定一个概率空间 (?,F,P ),如果对每个 x,
{, ( ) }Xxww N F,那么称,XR W 是关于
F 的可测函数。 这样的函数,我们称其为定义
在概率空间 (?,F,P ) 上随机 变量。
事实上,如果 X 是随机变量,那么对任何 B orel
集 B,都有
{, ( ) }XBww 挝 F
这一性质对我们今后的讨论很重要。
从概率的性质 可推出,一个随机变量的分布函数
具有下列性质,
1,l i m ( ) 0
x
Fx
? ??
?, l im ( ) 1
x
Fx
? ? ?
?
2,()Fx 单调增加
3,()Fx 左极限存在,右连续。
证:
注,如果给定函数 ()Fx,已知它具有上述三个
性质,那么我们也称其为分布函数,即使我们并
不知道其所对应的随机变量本身。 事实上,一定
能构 造一个概率空间 (
?
,F,
P
) 和一个随机变量
X
使得
X
在
P
下的分布为上面给定的 ()Fx,
正是基于这一点,我们有时直接研究分布函数的
分析性质。
(二)
2,连续型随机变量
在前面我们学习一类离散型随机变量,主要特点是它 仅
取有限或可数个值,并且取每个值的概率大于 0 。 但
在实际问题中,我们时常需要考虑另外一类随机变量,
如,随机地向 [ 0,1 ] 区间上投点其落点的位置;日光灯
泡的使用寿命;测量误差等,对于这些数量关系,我们
都不可能要求它们取事先指定的可数个值。 实际上,它
们在 [ 0,1 ], ( 0,)? 和 (,)? ? ? ? 上取值。 更为重要的是,
它们取 每个给定值的可能性均为 0 。 这时,我们该怎样
刻画这些随机变量呢?,
让我们从随机地向 [ 0,1 ] 区间上投点开始,令 X 表示其
落点的位置。 正如几何概率模型中所说的,X 取每个
点的可能性都相同,并且我们可以考虑落在一个区间或
一个集合内的概率。
如计算
()P a X b?? ()P X B?
这只与区间长度 ba ? 或 B 的长度 ||B 有关,即
()P a X b b a? ? ? ? ( ) | |P X B B??
正如物理中计算物质质量一样,我们说 X 具有
均匀概率密度函数
1,0 1
()
0,
x
px
???
? ?
?
其它
一 般 地, 考 虑 (,)R =- ゥ 一个函数
,( )p x p x?, 如果满足
1,( ) 0px 3
2,
( ) 1p x d x
¥
-
=
ò
那么称 ()px 为
R
上的一个 概率密度函数 。
注, 条件 2 并不是很强的限 制,因为当
()p x d x M
¥
-
=ò
时,我们可以令 ( ) ( ) /p x p x M
*
= 即可得到一
个概率密度函数。
条件 1 要求 ()px 所对应的曲线完全位于 x 轴的
上方,事实上,曲线上方的面积有着重要的概
率意义。
如果一个随机变量,XR W 满足
( ) ( )
b
a
P a X b p x d x<?
ò,
ab"<,
那么称
X
为连续性随机变量,具有概率密度函
数 ()px 。
( 注意:这里实际上要求 {, ( ) }a X b?? ? ? ? F,
ab"< )
这时,对任何 x-? <,定义
( ) ( ) ( )
x
F x P X x p u d u
-
=? ò
称为 X 的分布函数。
从微积分学基本结果知,如果 ()px 是连续函
数,那么 ()px 是 ()Fx 的 导 数, 即
( ) ( )F x p x¢ = 。 如果 ()px 不是处处连续的函
数, 那 么 在 ()px 的 连 续 点 处, 仍 有
( ) ( )F x p x¢ = 。
不难看出 ()Fx 具有下列性质,
2, ()Fx 单调增加
1, 0 ( ) 1Fx??, l i m ( ) 0
x
Fx
? ? ?
?, l i m ( ) 1
x
Fx
?? ?
?
3, ()Fx 处 处 连续
注:对于连续型随机变量,我们更多地使用
密度函数,因为它常常更简洁、更具有特
色。
连续型随机变量的例子:
(1),均匀分布
如果随机变量 X 在 [ 0,1 ] 上取值,并且取每
个值是等可能的,即具有概率密度函数
1
,a
()
0,
xb
px ba
其它
?
???
? ??
?
?
那么称 X 服从 [ 0,1 ] 上的均匀分布,记作
[,]X U a b,。
相应的分布函数为
0,
(),a
1,
xa
xa
Fx xb
ba
xb
??
?
??
? ???
?
?
??
?
图形示范
(2),指数分布
如果随机变量在 [0,)¥ 上取值,具有概率密
度函数
,0
()
0,
xex
px
其它
?? ?? ? ? ?
? ?
?
其中 0l >, 那么称 X 服从参数为 l 的指数
分布分布,记作 e x p ( )X l,。
相应的分布函数为,
0,0
()
1,0x
x
Fx
ex ??
??
? ?
? ? ? ??
图形示范
正如前面学过的几何分布一样,指数分布也具有
无记忆性,即
( | ) ( )
y
P X x y X x e P X y
l-
> + > = = >
我们今后还会看到:指数分布和 P ois s on 分布有着
密切的联系。
(3),正态分布
其中 m-? <, 0s >,那么称 X 服从参数
为 2,ms 的正态分布,记作 2(,)XN ms,。
如果随机变量在 (,)- ゥ 上取值,具有概率密度
函数 2
2
1 ( )
( ) e x p,
22
x
px
x
m
sps
骣 -
÷?=- ÷
? ÷
? ÷桫
-? <
图形示范
当
2
0,1ms == 时,我们称为标准正态分布。 正态
分布这个名称也许首先 F,G alton 在 1885 年之前给
出,它被认为是最重要的一种概率分布。 根据著名
的中心极限定理 ( 以后将介绍 ),在自然界和人类社
会中许多现象都可由正态分布加以描述。
( 1 ) 验证上述 ()px 确实为密度函数,即
( ) 1p x d x
¥
-
=ò
( 2 ) 分析 ()px 的图形性质和特点
(3 ) 人们通常用 () xF 表示标准正态分布的分布函
数,即
2
2
1
()
2
u
x
x e d u
p
-
-
F= ò
对于一般的正态分布随机变量 2(,)XN ms:,其
分布函数 ()Fx 可由 () xF 来表示,
这个积分并没有一个显性函数表示,因此人们已建
立了一个表备用。
学查分布函数表
2
2
1 ( )( ) e x p
22
x ux
F x d umm
ssps-
骣 骣-- ÷? ÷?
= - = F÷? ÷?÷ ÷?? ÷
桫桫ò
2(,), ( 0,1 )XX N Nmm s h
s
-?::
例, 设 ( 2,9 )XN,,求 ( 5 2 0 )PX <<,
例, 设
2
(,)XN ms:,求 ( | | )PX ms-,
( | | 2 )PX ms-,以及 ( | | 3 )PX ms-,
解
解
正态随机变量的 9 9,73 % 的值落在 ( 3,3 )m s m s-+
之中,落在该区间之外的概率几乎为零, 这情况被实
际工作者称为,3 σ 原则,
解
例, 从南郊某地乘车到北区火车站有两条路可走,
第一条路较短,但交通拥挤,所需时间 X 服从
( 50,10 0)N 分布;第二条路线略长,但意外阻塞较
少,所需时间
Y
服从 ( 60,16)N,
(1 ) 若有 70 分钟可用,问应走哪一条路?
(2 ) 若只有 65 分钟可用,又应走哪一条路?
(4),Gamma 分布
如果随机变量在 ( 0,)¥ 上取值,具有概率密度函
数
1
,0
() ()
0,
x
x e x
px
其它
?
???
?
??
?
? ? ??
? ??
?
?
其中,0ab >, 那么称 X 服从参数为,ab 的 G 分
布,记作 (,)X abG,。
这里 G 函数 ()bG 被定义为
1() xx e d xbb
¥
--
-
G= ò
特别,1b = 如果 1b =,那么 X 正是前面介绍过
的参数为 a 的指数分布; 如果
1
2
a =,并且对某个
正整数 n 使得
2
n
b =, 那么我们称 X 服从参数为
n 的
2
c 分布,记作
2
()Xn c,。
(5),Cauchy 分布
如果随机变量在 (,)- ゥ 上取值,具有概率密度
函数
那么称 X 服从 C a u c h y 分布。
2
1
( ),
( 1 )
px
x
x
p
=
+
-? <
(6),Beta 分布
如果随机变量在 ( 0,1 ) 上取值,具有概率密度函数
其中,0ab >, 那么称 X 服从参数为,ab 的 B e ta
分布,记作 (,)XB ab,。
11( ) ( ) ( 1 ),0 1
()()
0,
x x x
px
其它
????
??
????? ? ? ?
?
??? ?
?
?
注意到 B e t a 函数 (,)B ab 和 G a m m a 函数间的关
系,
上述 ()px 确实是密度函数。
1 11
0
()(,), ( 1 )
( ) ( )
B x x d x?? ????
??
?? ??? ? ?
???
特别,如果 1ab ==,那么 X 服从 [ 0,1 ] 上的均
匀分布。
(7),Weibull分布
其中,0ab >, 那么称 X 服从参数为,ab 的
W e ib u ll 分布。
如果随机变量在 [ 0,)¥ 上取值,具有概率密度函
数
1,0
()
0,
xx e x
px
其它
???
?? ??? ? ? ??
? ?
??
特别,如果 1b =,那么 X 服从参数为 a 的指数分
布。
其分布函数为
1,0
()
0,
xex
Fx
其它
???
? ? ? ? ??
? ?
??
3,一般随机变量
以上我们介绍了两类典型的随机变量及其分布:
(1) 离散型随机变量取有限或可列个值,其分布可
用分布列刻画,分布函数是阶梯型函数;
(2) 连续型随机变量在一个或几个不相交的区间内
取值,具有密度函数,分布函数是处处连续的,并
具有导数。
但我们应该强调,除了这两种以外,还存在其它类
型的随机变量。
令
( ) 1,(,) )X T X H qq= - =
考虑下列随机试验,
投掷一枚硬币,出现正面的可能性为 p ;如果出
现正面,那么继续投掷一次标枪,标枪的倾斜角
度 q 为 ( 0,2 )p 上的均匀分布。 这时,样本空间为
{,(,), 0 2 }TH q q pW= #
其中 H 代表正面, T 代表反面。
该函数除 1- 点外处处连续,X 既不是离散型随
机变量,也不是连续型随机变量。
那么该随机变量 X 取值为 { 1 } [ 0,2 ]p-,其分布
函数 ()Fx 如下
0 1
,- 1 0
()
,0 2
2
1,2
x
qx
Fx x
q p x
x
,
?
?
?
???
?
??
??
? ?
? ? ?
?
?
? ? ???
严格来说,上式应写成
对一般的随机变量,我们主要使用分布函数来刻
画其取值的规律。 给定一个概率空间 (?,F,P ),
假设,XR W 是一个随机变量,那么定义
( ) ( )F x P X x=
作为分布函数。
( ) (, ( ) )F x P X xww=
注意到 P 是从 F 到 [ 0,1 ] 上的一个函数,或者说,
只有对 F 中的集合或事件 A, ()PA 才有定义。
因此,为了对每个 x, 我们能很好地定义
()Fx, 那么需要 {, ( ) }Xxww N F 。这就导致
了随机变量的严格数学定义,给定一个概率空间 (?,F,P ),如果对每个 x,
{, ( ) }Xxww N F,那么称,XR W 是关于
F 的可测函数。 这样的函数,我们称其为定义
在概率空间 (?,F,P ) 上随机 变量。
事实上,如果 X 是随机变量,那么对任何 B orel
集 B,都有
{, ( ) }XBww 挝 F
这一性质对我们今后的讨论很重要。
从概率的性质 可推出,一个随机变量的分布函数
具有下列性质,
1,l i m ( ) 0
x
Fx
? ??
?, l im ( ) 1
x
Fx
? ? ?
?
2,()Fx 单调增加
3,()Fx 左极限存在,右连续。
证:
注,如果给定函数 ()Fx,已知它具有上述三个
性质,那么我们也称其为分布函数,即使我们并
不知道其所对应的随机变量本身。 事实上,一定
能构 造一个概率空间 (
?
,F,
P
) 和一个随机变量
X
使得
X
在
P
下的分布为上面给定的 ()Fx,
正是基于这一点,我们有时直接研究分布函数的
分析性质。