§ 1 随机变量由定义可知,随机变量首先是一个从 到 R的映射,即?
RX)( 定义还要求“对任意实数 x,有,})(|{ FxX
这就是所谓概率的可测性要求。

设 是一概率空间,是定义在 上的实值函数,如果对任意实数 x,有,
则称 是 上的一个 随机变量 。
),,( PF? )(?X?
FxX })(|{
)(?X ),,( PF?
第二章随机变量及其概率分布随机变量的概念在概率论和数理统计中具有基本的重要性,随机变量的引入,使对随机现象的研究规范化和数量化,从而可以把数学分析的方法引入概率论。
在实际问题中广泛存在着随机变量。它通常被分成两大类。如果 可能取的值是有限个或至多可列个,则称 为 离散型随机变量 ; 非离散型的范围太广,其中最主要的也是实际问题中最常见的是 连续型随机变量。
)(?X
)(?X
§ 2 离散型随机变量一。分布列分布列中包含两个要素:
( 1)随机变量可取哪些值?
( 2)随机变量取这些值的概率。
因此,分布列能全面地反映随机变量 X取值的概率分称 ( 2.1)
为离散型随机变量的 分布列。 (分布列也能用表格形式表示)
,...,2,1),( kxXP k
分布列满足,( 1),...;2,1,0 kP
k
( 2)
.1
1

k
kP
( 2.2)
布的情况。
例 1 汽车碰到红灯的概率为 P,要穿越四个十字路口才能到达目的地,求汽车停车前通过信号灯个数的分布列。
解,设 X={汽车停车前通过信号灯的个数 },
iA
={第 i个路口遇红灯 },i=1,2,3,4
则,)()0(
1 PAPXP
,)1()()1( 21 ppAAPXP
,)1()()2( 2321 ppAAAPXP
44321 )1()()4( pAAAAPXP
,)1()()3( 34321 ppAAAAPXP
注意:

4
0
4 1)1(...)1(
k
k ppppP
例 2 设盒中有 2个白球,3个黑球,从中任取三个。
并令 X为抽得的白球数,求 X的分布列。
解:
,10/1/)0( 353302 CCCXP
,10/6/)1( 352312 CCCXP
,10/3/)2( 351322 CCCXP
2,1,0,/)( 35332 kCCCkXP kk
通式为:
注意:
11
2
0
2
0
3
5
3
53
323
5


k k
kk
k C
CCC
C
P
由以上两例可见:古典概型是计算离散型随机变量分布列的基础。
二。贝努里试验有如下特点的试验称为 贝努里试验 ( 1)试验可独立重复地进行;( 2)每次试验都只有两种可能的结果,A发生或 A不发生。
重复地抛掷硬币,观察每次结果是出现正面还是反面;放回抽样,观察每次抽得的产品是正品还是次品;同一射手一次一次地射击,观察每次射击的结果是中靶还是脱靶等都是贝努里试验。
不放回抽样,观察每次结果是出现正面还是反面;掷骰子,观察每次投掷出现的点数等等都不是贝努里试验。
贝努里试验进行了 n次,称为 n重贝努里试验。
三。几种常用的离散型分布
(一)二项分布
),( pnB
在贝努里试验中,如果每次试验事件 A发生的概率为 P,即
pqppAP 1,10,)(
并设随机变量 X表示在 n次试验中事件 A发生的次数,
),1( pB
,其分布列为:
nkppCkXP knkkn,.,,,1,0,)1(}{
( 2.3)
特别,当 n=1时,X~
称 X服从 两点分布,其分布列为:
1,0,)1()( 1 kppkXP kk
),( pnB
( 2.4)
则称 X服从 二项分布,记作 X~
用二项分布的模型可以计算与该模型有关的概率问题。
例 3 某种电灯泡使用时数在 1500小时的概率为解,设 X=灯泡使用 1500小时后损坏的个数,则
)1()0()10( XPXPXXP
104.02.08.02.08.0 131133003CC
0.2,求三个这种灯泡在使用 1500小时后最多只有一个损坏的概率。
解,设 X=抛掷五枚分币出现正面的个数,

)(
)(
)(
)()/(
AP
BP
AP
ABPABP

5
2
)(
)3(
k
kXP
XP
13/5?
例 4 抛掷五枚分币,问:在至少出现两个正面的条件下,正面数刚好是三个的概率是多少?
A=至少出现两个正面,B=正面数刚好是三个。
kk
k
kCC?
5
5
2
5
3533
5 )2
1()
2
1(/)
2
1()
2
1(
(二) 几何分布 )(pG
其分布列为:
,.,,2,1,)1(}{ 1 kppkXP k( 2.5)
在贝努里试验中,如果每次试验事件 A发生的概率为 P,即
pqppAP 1,10,)(
并设随机变量 X 事件 A首次发生的试验次数,
,)(~ pGX
则称 X 服从 几何分布,记作
(三)超几何分布
),,( NMnH
在一堆 N 个产品中有 M 个次品,不放回地从中抽取 n 个。
设 X 表示抽到次品的个数,则称 X 服从 超几何分布,
),m i n (,.,,,1,0,/}{ nMkCCCkXP nNkn MNkM
( 2.6)
记作 ),,(~ NMnHX,其分布列为:
(四)负二项分布
),(1 prB?
其分布列为:
,...1,,)( 11 rrkqpCkXP rkrrk ( 2.6)
如设 则 Y 表示事件 A 在第 r 次发生前,
A 未发生的次数。则,rXY
)1()1(1 1)()( rkrr rk qpCrkXPkYP
,,,,2,1,0?k ( 2.7)
在贝努里试验中,如果每次试验事件 A发生的概率为 P,即
pqppAP 1,10,)(
并设随机变量 X 表示事件 A 第 r 次发生时的试验总次数,
则称 X 服从 负二项分布,),(~ 1 prBX?记作
(五)泊松分布
)(?P
其分布列为:
,.,,2,.1,0,!}{
kkekXP
k
0 ( 2.8)
在贝努里试验中,如果每次试验事件 A 发生的概率为 P,即
pAP?)(
很小,且
0np
为常数,其中 n 为试验次数。
又设 X 表示在单位时间内事件 A 发生的次数,则称
X 服从参数为 的 泊松分布,? )(~?PX记作,
一般当 1.0,10 pn 时,二项分布可用泊松分布近似计算。
上述常用分布有以下重要性质,(证明略)
( 1)当 n足够大,p足够小时,
,!/ keqpC kknkkn
其中
np ( 2.10)
,.,,2,1,0,!/)()( kketkXP k
( 2.9)
记作 )(~ tPX?,其分布列为:
在上述条件下,如设 X 表示在 t 时间内事件 A 发生的次数,则称 X 服从参数为 的泊松分布,t?
( 2)当 Nn 时,
,)1( knkknn
N
kn
MN
k
M ppC
C
CC
其中 NMp /? ( 2.11)为次品率
( 3)离散型分布有无后效性,即:
,)()/1( pAPkXkXP
的充要条件是 X 服从几何分布。(证略)
( 4)如果
),,(~ 1 prBX?
并记
iX
为事件 A从第
1?i 次到第 i 次的试验次数,则有
,...21 rXXXX
其中各 相互独立且
iX
ripGX i,...,2,1),(~?
(证略)
因此,服从负二项分布 的随机变量可分解为 r个相互独立均服从几何分布 的随机变量之和。
),(1 prB?
)(pG
§ 3 连续型随机变量概率密度函数简称 概率密度。
一。定义对于随机变量 X,如果存在非负的可积函数
,),( xxp 使对任意实数 a,b(a<b),都有:
ba dxxpbXaP )()(
则称 X为 连续型随机变量,并称 )(xp 为 X的 概率密度函 数 。
( 3。 1)
由公式( 3。 1)可见,知道了连续型随机变量的概率密度,就可求出随机变量落在任一区间内的概率。
二。概率密度的性质;0)()1(?xp
1)()2( dxxp
P(x)
xo
面积为 1
( 3)随机变量取任一值的概率为 0,即 P( X=a)=0.
证:
n
lim

na
na dxxp
/1
/1 0)(
灯泡的寿命,等车时间,测量误差等都是连续型随机变量。
)( aXPnlim )11( naXnaP
因此,对于连续型变量有:
)()( bXaPbXaP
)( bXaP )( bXaP
这与离散型变量是不同的。
例如,设
),1(~ pBX
,其分布列为:
1,0,)1()( 1 kppkXP kk
从而有:
,)10( pXP
.1)10( XP
,1)10( pXP,0)10( XP
( 4) 连续型 离散型
dxxp )( )( xXP
x
dxxp
x
xxXxP
xx
x


)()(
证:
)( xxP (积分中值定理)
0),( xxP
从而说明,概率密度 P(x)在某点处 x的高度,虽然并不反映 X取值的概率,但是,这个高度越大,则 X取 x附近的值的概率就越大,因此可以说,在某点密度曲线的高度反映了概率集中在该点附近的程度,
例 3。 1 随机变量 X的概率密度为:

其他,0
1,
1)( 2
x
x
C
xp
求( 1)常数 C;( 2) X落在区间( -1/2,1/2)的概率。
解,由
,1)(dxxp
可得
1][ a r c s i n
1
1 1
1
1
1 2


CxCdx
x
C
1 C
( 1)
例 3。 1 随机变量 X的概率密度为:

其他,0
1,
1)( 2
x
x
C
xp
求( 1)常数 C;( 2) X落在区间( -1/2,1/2)的概率。
解,( 2)
2/1 2/1 21 11)2121( dxxXP?
3
1)0
6(
2[ a r c s in ]2 2/1
0

第二章随机变量及其概率分布
§ 4 分布函数
§ 4 分布函数一。定义 随机变量的分布函数为
xxXPxF ),()(
( 4。 1)
由定义可知,对于连续型:
x dxxpxF )()(
( 4。 2)
对于离散型:
xx
k
k
pxF )(
( 4。 3)
由( 4。 2)可得:
)}(){()( aXbXPbXaP
)()()()( aFbFaXPbXP ( 4。 4)
由此可见,分布函数这一概念为连续型和离散型随机变量所共有,并且知道了连续型随机变量的分布函数,就能求出随机变量落到任一区间的概率。
由( 4。 2)
x dxxpxF )()(
可得
)()( xpxF
( 4。 5)
公式( 4。 2)与( 4。 5)反映了
)(),( xFxp 两者的内在联系。
二。分布函数的性质
( 1) ;1)(0 xF
xlim ;0)(?xF
1)(?xF
( 2) F( x)单调不减;
( 3) F( x)右连续,即 )()0( xFxF
xlim


2,1
21,4/3
10,4/1
0,0
)(
x
x
x
x
xF
4
1)2(,
2
1)1(,
4
1)0( XPXPXP
kkkCkXP 2
2 )2
11()
2
1()(
例 4。 1 设
),21,2(~ BX
求 F( x)
解:
2,1,0,41 2 kC k
例 4。 2 设


其它,0
21,2
10,
)( xx
xx
xp 求 F(x).
=
0
1
x tdt0
x dttt d t 110 )2(
0x
10?
x
21 x
2?x
F(x)?
解:



2,1
21,212
10,2
0,0
)( 2
2
x
xxx
xx
x
xF
>
例 4。 3 设 F(x)为 x的分布函数,试证:
)()0()0( xXPxFxF
证:
)()()0( xXPxFxF
)()( xXPxXP
由分布函数的定义及右连续可知作
},1)(|{ nxXA n

nAAA,..21
且有
n
n
i
i AA?
1
)0( xF
n
lim )
1(
nxXP
)( nAP? )(
1
n
i
iAP
)
1
n
i
iA
(概率的连续性)
)( xXP
)()0()0( xXPxFxF
(P?
n
lim
n
lim
n
lim
特别,当 x为 F(x)的连续点时,0)( xXP
本例说明:对于离散型随机变量,分布函数还有一条其特有的性质:分布函数是一个阶梯型的分段函数,在点
ixX?
的跳跃高度为
,..,2,1,)( ipxXP ii
三。几种常用的连续型随机变量
(一)均匀分布 ),( baU
如果随机变量在区间 (a,b)上等可能发生,则
),(~ baUX
其概率密度为:
( 4。 6)
均匀分布的特征是:落入区间 (a,b)内任一小区间上的概率只与区间长度有关而与具体位置无关。
X服从参数为 a,b的 均匀分布,记作



其他,0
,
1
)(
bXa
abxf
bdca
时,有
ab
cddXcP
)(
均匀分布的分布函数为:

x dxxpxF )()(
可得

bX
bxa
ab
ax
ax
xF
,1
,
,0
)(
即当
( 4。 7)
(二) 指数分布
)(?E
其概率密度为:

0,0
0,)(
x
xexp x
0
( 4。 8)
分布函数为:

0,0
0,1
)(
x
xe
xF
x?
0
( 4。 9)
从应用背景分析,指数分布与泊松分布有密切的联系。
如前所述,在贝努里试验的稀有事件中,如果每次试验事件 A发生的概率为 P,且以 X表示事件 A在单位时间内发生的次数,则 X服从参数为 的泊松分布。如记事件 A
相邻两次发生等待的时间为,则 服从参数为 的指数分布。

指数分布常用于可靠性的统计研究中,
对于任取
,0?t

)(1)( tPtP
(应理解成等待时间大于 t) )0(1 XP
事实上,对于任取
,0?t

.0)( tP?
,1!0)(1
0
t
t
eet?


因此,?

0,0
0,1
)(
t
te
tF
t? )(~ E?
还可以证明:
连续型分布有无后效性,即
)()|( tXPTXtTXP
的充要条件是指数分布。(证略)
的分布函数为
(三) 正态分布
),( 2N
其概率密度为:


xexf
x
,)(
)(
2
2
2
2
1

( 4。 10)
正态分布是应用最广泛的一种连续型分布,如果影响随机变量 X取值的因素很多且各因素对 X的影响都很小,则 X服从正态分布。
正态分布的重要性还体现在以下几个方面:
1。许多随机现象都服从或近似服从 正态分布;
2。 正态分布是 许多重要分布的极限分布;
3。许多非正态随机变量是正态随机变量的函数;
4。正态分布的概率密度和分布函数有良好的性质和比较简单的数学形式。
特点是,两头小,中间大,左右对称,,
正态分布的密度曲线是一条关于 对称的钟形曲线,
越大,曲线 p(x)越平坦,X的取值越分散;
越小,曲线 p(x)越陡峭,X的取值越集中在 x= 的附近。
正态分布 的图形特点),( 2N
决定了图形的中心位置,决定了图形中峰的陡峭程度,?


xdtexF
x
t
,)(
)(
2
2
2
2
1
( 4。 11)
设 X~,X的分布函数是
),( 2N
dtex
x t

2
2
2
1)(
标准正态分布函数:

xex
x
,
2
1)( 2
2
)(x?
)(x?
其密度函数和分布函数常用 和 表示:)(x? )(x?
的正态分布称为标准正态分布,1,0
标准正态分布 )(x? 和 )(x? 的性质
);()(.1 xx
,21)0(.2 取 )(x? 的最大值 。
)(.3 x? 的原函数不能用初等函数来表示 。
4,由 1)(

dxx?
可得

22/2 dxe x
);(1)(.5 xx
2
1)0(.6
( 4。 12)
可以证明,
标准正态分布的重要性还在于,任何一个一般的正态分布都可以通过线性变换转化为标准正态分布,
如果则
)1,0(~ N
即 X的分布函数
)()(? uxxF
( 4。 13)
从而有
)()()( abbXaP
( 4。 14)
),,(~ 2NX
XY
已将标准正态分布的分布函数制成表,由公式( 4。
14)可见,它也可以解决一般正态分布的概率计算问题,
例 4。 4 设
)2,3(~ 2NX
( 1)求 );104( XP
( 2)确定 c使得
);()( cXPcXP
( 3)设 d满足
,9.0)( dXP
问 d至多为多少?
解,( 1)
)5.35.3()104(xPXP
1)5.3(2)5.3()5.3(
9996.019698.02
解,( 2)
),()(1)( cXPcXPcXP
,5.0)2 3()(,5.0)( ccFcXP
.3,02 3 cc
( 3)
,9.0)2 3()2 3()( dduXPdXP?
436.0,282.12 3 dd
例 4。 4 设
)2,3(~ 2NX
( 1)求 );104( XP
( 2)确定 c使得
);()( cXPcXP
( 3)设 d满足
,9.0)( dXP
问 d至多为多少?
解:
)12.005.1012.005.10( XP
)12.005.10()12.005.10( FF
9 5 4 4.01)2(2)2()2(
螺栓为不合格品的概率:
0456.09544.01p
例 4。 5 由某机器生产的螺栓的长度 (cm)服从参数为的正态分布,规定长度在范围 06.0,05.10 12.005.10?
内为合格,求一螺栓为不合格品的概率。
例 4。 6 设顾客在某银行窗口等待服务的时间 X(以分计)
服从指数分布,其概率密度为

0,0
0,
5
1
)(
5/
x
xe
xp
x
X
某顾客在窗口等待服务,若超过 10分钟,他就离开。
他一个月到银行 5次,以 Y表示一个月内他未等到服务而离开窗口的次数,写出 Y的分布律,并求
).1(?YP
解:
,)10(1)10( 2 eFXP
)0(1)1( YPYP
5 1 6 7.0)1()(1 520205 eeC
),,5(~ 2?eBY?
)1( YP
四。分布函数要满足什么条件,其对应的随机变量如前所述,如果分布函数 F(x)满足三条基本性质,
定理 若 F(x)在 上连续且除有限个点)( x
kccc,..21
外,在 上)(xF? )( x
连续,则 X为连续型随机变量。(证略)
那么它还要满足什么条件,才是连续型随机变量的分布函数?
它必定是某随机变量的分布函数。
才是连续型随机变量?
如果随机变量 X的概率密度为
0,,0,
)(
)( 1

xexxp x( 4。 14)
则称 X服从参数为 的 伽玛分布,记作
),( ),(~X
其中
0 1 )0()( dxxe x
为伽玛函数。
五,? 分布伽玛函数有如下性质:
( 1) ),()1( 特别当 时,有Jn?
!)()1( nnnn
( 2)
)21(
分布 是一个较大的分布类。
当 1 时,是人们熟知的指数分布;
),(~),,(~ 2211 XX 且
21,XX
相互独立,则
),(~ 2121 XX
结论可推广到:如果各
iX
),(~ iiX?



n
i
n
i
iiX
1 1
),(~
即当相互独立且分布有如下重要性质:?
当 2/1,2/ n 时,是在数理统计中
2? 分布类。有广泛应用的
分布,关于参数? 有再生性,
对于有相同
值的第二章随机变量及其概率分布
§ 5 随机变量函数的分布 (Ⅰ)
§ 5 随机变量函数的分布 (Ⅰ)
在满足一定的条件下,随机变量的函数 Y=f(X)仍是 随机变量(严格的定义见 P,75)
主要讨论的问题是如何由 X的分布求 Y的分布?
一。离散型已知 X的分布列如何求 Y的分布列?举例说明。
例 5。 1 设 X的分布列为:



4/12/14/1
101
~X

2XY?
的分布列?
显然有:


4/12/14/1
101~Y
即:


2/12/1
10~Y
二。连续型已知 X的概率密度如何求 Y=f(X)的概率密度?
通常用 分布函数法 。举例说明。
例 5。 2 设,,求)1,0(~ NX 2XY? )(yp
Y
解,)()()(
2 yXPyYPyF Y
当 0)(,0 yFy
Y

)()(,0 2 yXPyFy Y )( yXyP
y xy y X dxedxxP 0 2/222)(?


0,0
0,
2
1
)(
2/2/1
y
yey
yp
y
Y?即 )1()
2
1,
2
1(~ 2Y
例 5。 3 设 ),1,0(~ UX 求 )(
1 XY 的分布。
解,))(()()(
1 yxPyYPyF Y
)1,0(~),())(( NYyyXP
例 5。 4 已知
),,(~ 2NX求
)0( abaXY
的分布。
解:
)()()( ybaXPyYPyF Y
当 )/)(()(,0 abyXPybaXPa
dxe xaby 22 2/)(/)(
2
1



22 )(2/)]([
)(2
1)(

aay
Y eayp


)/)(()(,0 abyXPybaXPa
dxe x
aby
22 2/)(
/)( 2
1



22 )(2/)]([
)(2
1)(

aay
Y eayp

因此
ye
a
yp aayY,
2
1)( 22 )(2/)]([

即 ),(~
22 abaNY?
特别,当
/.,/1 ba 时,)1,0(~ NXbaXY

作业,见习题集第二章。