1
概率论与数理统计第 三 章随机变量及其分布
2
第三章 随机变量及其分布
3.1 随机变量的概念
前面我们研究了随机事件及其概率,本章我们将在这个基础上进一步研究随机变量及其分布,
现 在先研究随机变量的概念,它是概率论中最基本的概念之一,
在随机试验中,人们观察的对象常常是一个随机取值的量,
3
在随机试验中,人们观察的对象常常是一个随机取值的量,
例如,考察某电话交换台在一段时间内接到的呼叫次数,这个量可能取的值为 0,1,2,… ;
测试灯泡的寿命,这个量可能在 [0,+∞) 中取值,
再如,在 n次打靶试验中,要观察击中目标的次数,
这个量可能取的值为 0,1,2,…,n;
在测量某物体长度的试验中,要观察测量长度与标准长度的偏差,这个量可能在 (?∞,+∞) 中取值,
4
当然也有一些试验观察的对象本身不是数量,
例如掷一枚匀质的硬币,观察正反面出现的情况这个随机试验,它的 样本空间 S是正与反的不同组合,
初看起来这个现象与数值无关,但是我们可以用下面的方法使它与数值联系起来:
更一般地,在伯努利试验中,用,1”表示成功,用
,0”表示失败,
于是,对试验结果不是数值的情况,我们可用一定的方法将它们数量化,也用数量来描述,
当出现正面时用,1”表示,而出现反面时用,0”表示,
5
在上述的各例中,如果把试验中所观察的对象用数量 X来表示,那么 X就具有这样的特点:
随着试验的重复 X可以取不同的数值,并且在每次试验中究竟取什么值在试验之前无法确切预言,是带随机性的数量,由此,自然地称 X为 随机变量,
由于 X是随着试验结果 (基本事件 e)而变化的,因此,
X是基本事件 e的函数,即 X=X(e).
例如,在 1.1节例 1将一枚均匀对称硬币投掷一次观察正反面出现情况这个随机试验中,样本空间
S={正,反 }.
若用 X表示试验结果,并按上述的方法数量化,那么 X就是基本事件的函数:
6
.,0
,,1
)(
当反面出现当正面出现
eXX
在 1.1节例 3记录某电话交换台在一段时间内接到的呼叫次数这个随机试验中,样本空间
S={0,1,2,…},
若用 X表示呼叫次数,那么
X=X(e)=e(e∈ S)
也是基本事件的函数,
7
由上所述,可以得到如下的随机变量的定义,
定义 3.1 设 E是随机试验,它的样本空间是 S,如果对 S中的每个基本事件 e,都有唯一的实数值 X(e)与之对应,则称 X(e)为 随机变量,简记为 X.
引入随机变量以后,随机事件就可以用随机变量来描述了,
例如,设 X表示电话交换台在一段时间内接到的呼叫次数,则
,0≤ X≤ 3”表示,呼叫次数不超过三次,的事件;
,X>5”表示,呼叫次数大于 5”的事件,
8
若
.,0
,,1
)(
当反面出现当正面出现
eXX
则
,X=1”表示事件,正面,,
而
,X=0”表示事件,反面,,
9
不仅如此,对任意事件 A,可以在样本空间 S上定义函数
,,0
,,1
)(
Ae
Ae
eI A
当当
称 IA(e)为 A的示性函数,
显然,IA是一个随机变量,当,IA=1”就表示 事件 A.
于是,对事件的研究就可以转化为对 随机变量 的研究了,
由此可见,随机变量 的概念的引入是很重要的,
以后我们还会看到,由于引入了 随机变量,数学分析的方法就可用来研究随机现象了,
10
在上面遇到的随机变量中,有的随机变量所能取的值是有限个 (如在 n次打靶试验中,中靶的次数 ),
有的随机变量所能取的值是可列无穷多个 (如 电话交换台在一段时间内接到的呼叫次数 ),这两种随机变量统称为 离散型随机变量,
象 灯泡的寿命和物体长度这样的 随机变量,它们所取的的值连续地充满一个区间,以后将它们称为连续型随机变量,它是非离散型随机变量中的最重要的类型,
下面先讨论离散型随机变量,
11
第三章 随机变量及其分布
3.2 离散型随机变量
3.2.1 概率分布列
如前所述,最多 取有限个值或可列无穷多个值的随机变量 X称为 离散型随机变量,
设 X的所有可能 取的值为
x1,x2,…,xk,…,
12
为了掌握 随机变量 X的统计规律,只知道它可能 取的值是远远不够地 (例如掷非均匀的色子 ),更主要的,还要了解它取各个 可能 值的概率是多少,
若 事件,X=xk”的概率为 pk,即
P(X=xk)=pk,k=1,2,…
则上式不仅告诉了我们 X所 能 取的值,而且还指出了它以多大的概率取这些值,
所以这样的式子把随机变量 取 值的概率规律完整地描述出来了,
我们称这样的式子为离散型随机变量 的 概率分布列或简称为 分布列,又称 分布律,
13
它也可以用表格的形式直观地表达如下:
X x1 x2 … xk …
P p1 p2 … pk …
由概率的基本性质可知,对任一分布列都有下面两个性质:
(ⅰ) pk≥ 0,k=1,2,… ;
(ⅱ)
.1
k
kp
14
反之,满足上述两条性质的数列 {pk},也可以作为某一个离散型随机变量的分布列,
下面介绍几种常见的分布列
15
例 自动化生产线在调整后出现废品的概率为 p,在生产过程中出现废品立即进行重新调整,以 X表示两次调整之间出现的正品数,求 X的概率分布?
解 X的概率分布为
X ① 0 1 … k …
P ② … …
或
P(X=k)=(1?p)kp,
k=0,1,…,0<p<1,q=1?p.
16
③ 验证
(1)显然
P(X=k)≥ 0,k=0,1,… ;
(2)
.1
)1(1
1
1
1)(
0
00
p
p
pp
ppkXP
k
k
k
k
k
17
例 设随机变量 (以后简记为 r.v)X的概率分布为
,2,1,
!
)( 1 ke
k
AkXP
求常数 A.
解 由分布列的性质
)1(
!
1
!
1 1
1
1
1
1
eAe
k
Aee
k
A
kk
因此
.
1?
e
eA
18
第三章 随机变量及其分布
3.2 离散型随机变量
3.2.2 0— 1分布 (伯努利分布、两点分布 )
设 随机变量 X只可能取 0和 1两个值,它的分布列是
P(X=1)=p,P(X=0)=q,0<p<1,q=1?p
则称 X服从 0— 1分布 或 伯努利分布,也称 两点分布,
记为 X~B(1,p).
19
0— 1分布 的表格形式 为
X 0 1
P q p
显然,伯努利试验可用 0— 1分布来描述,
20
第三章 随机变量及其分布
3.2 离散型随机变量
3.2.3 二项 分布 (binomial distribution)
设 随机变量 X分布列如下:
knkk
n qpCkXP
)(
k=0,1,2,…,n,0<p<1,q=1?p.
则称 X服从 二项 分布 (参数为 n,p),常用记号
X~B(n,p)表示,
21
特别地,当 n=1时,二项 分布的表达式成为
P(X=k)=pkq1?k,k=0,1
此即为 0— 1分布,
由前面的定理可知,在 n重 伯努利 试验中,成功的次数 X是服从二项 分布的,
22
对 二项 分布来说,概率分布列的两个性质也都成立,
因为
nk
qpCkXP knkkn
,,2,1
0)(
又
1)(
00
n
k
knkk
n
n
k
qpCkXP
故 分布列的两个性质都成立,
23
例 1 设有 N件产品,其中有 M件次品,现进行 n次有放回的抽样,每次抽取一件,求这 n次中共抽到的次品数 X的概率分布?
解 由于抽样是有放回的,因此这是 n重 伯努利 试验,
若以 A表示一次抽样中抽到次品这个事件,则
p=P(A)=M/N.
故 X~B(n,M/N),即
nk
N
M
N
M
CkXP knkkn
,,1,0
)1()()(
24
下面我们来考察 二项 分布的概率分布列表达式随着 k
取值的不同而变化的情况
先看一个例子
例 1 设有 20台机床,独立地各加工一件齿轮,若各机床加工齿轮的废品率都是 0.2,求得到的 20件齿轮中没有废品,恰有一件废品,……,以及全部都是废品的概率各为多少?
解 此例可看作是 n=20的 伯努利 试验问题,设 X表示
20件齿轮产品中的废品个数,则 X~B(20,0.2),于是 问题即要求,
20,,2,1,0
)2.01()2.0()( 2020
k
CkXP kkk
25
我们将计算的结果列于下表:
X 0 1 2 3 4 5 6
P 0.012 0.058 0.137 0.205 0.218 0.175 0.109
X 7 8 9 10 11 … 20
P 0.055 0.022 0.007 0.002 0.000 … 0.000
26
表 中当时 k≥11,P(X=k)<0.001.
为了对此结果有个比较直观的了解,可以将表中的数据用图形来表示 (图 3.1)
P
0 4 k8 16 202 61 3 5 7 9 1011 1312 1514 1817 19
图 3.1
27
从图中我们看到,
概率 P(X=k)先是随着 k的增加而单调上升,当 k增到
4时 P(X=k)取得最大值 0.218,然后 P(X=k)再随 k的增加而单调下降,
一般对于固定的 n和 p,二项 分布 B(n,p)都具有这一性质,
事实上,因为
28
事实上,因为
nk
kq
kpn
kq
pkn
qpC
qpC
kXP
kXP
knkk
n
knkk
n
,,2,1
)1(
1
)1(
)1(
)(
111
29
故当 k<(n+1)p时,P(X=k)>P(X=k?1),此时 P(X=k)
随着 k的增加而单调上升;
当 k>(n+1)p时,P(X=k)<P(X=k?1),此时 P(X=k)
随着 k的增加而单调下降;
当 k=(n+1)p为正整数时,P(X=k)=P(X=k?1),此时
P(X=k)在 k =(n+1)p及 k =(n+1)p?1的情况下都达到最大值,
若 (n+1)p不是整数,令 k0=[(n+1)p]表示 (n+1)p的整数部分,则 P(X=k0)为最大值,
如在例 1中,(n+1)p=21× 0.2=4.2不是整数,此时
k=4
使 P(X=k)达到最大值,
30
第三章 随机变量及其分布
3.2 离散型随机变量
3.2.4 泊松 分布 (Poisson distribution)
若 随机变量 X的分布列为
,2,1,0,0,
!
)(
k
k
ekXP k
则称 X服从 参数为 λ 的 泊松 分布,并用记号 X~P(λ )
表示,
31
由 泊松 分布的分布列表达式可知,
P(X=k)≥ 0(k=0,1,2,… )
且有
1
!
!
)(
0
00
ee
k
e
k
e
kXP
k
k
k
k
k
故 泊松 分布 P(λ )满足 分布列的两个性质,
32
泊松 分布是 1873年由法国数学家 泊松 引入的,
由前面的二项 概率的 泊松 逼近 定理可知,以 n,p为参数的 二项 分布,当 n很大 p很小时,近似于以
λ =np为参数的 泊松 分布,
这一事实,可以看成是 泊松 分布的一个来源,
33
泊松 分布的应用很广泛,在实际中有许多随机现象都服从 泊松 分布,
例如,电话交换台接到的呼叫次数,到商店去的顾客数,到达飞机场的飞机数,经过某块天空的流星数,纺纱机上线的断头数,放射性物质放射的质点数等等,都服从 泊松 分布,
上述各个 随机现象,都可用 随机地源源不断地出现的质点数来描述;这种源源不断出现的随机质点构成的序列称为随机质点流,
一种重要的随机质点流 —— 泊松 流,研究了产生 泊松 分布的一般条件,
34
第三章 随机变量及其分布
3.2 离散型随机变量
3.2.5 超几何分布 (hypergeometric distribution)
设有 N件产品,其中有 M件次品,今从中任取 n件不同产品,则 这 n件中所含的次品数 X是一个离散型的随机变量,X的分布列为
lk
C
CC
kXP n
N
kn
MN
k
M,,1,0,)(
35
3.2.5 超几何分布 (hypergeometric distribution)
设有 N件产品,其中有 M件次品,今从中任取 n件不同产品,则 这 n件中所含的次品数 X是一个离散型的随机变量,X的分布列为
lk
C
CC
kXP
n
N
kn
MN
k
M
,,1,0
)(
其中 l=min(M,n),并规定当 i>m时,Cmi=0.
由上式所确定的概率分布称为 超几何分布,
36
由前面的讨论可见二项 分布 可以用来描述有放回的抽样,而超几何分布可以用来描述不放回的抽样,
虽然二项 分布与 超几何分布二者并不相同,但当抽取对象总数 N很大,而抽取的次数 n相对很小时,它们的差别是很小的,就是说在一定的条件下,超几何分布可以用二项 分布来逼近,
37
不难证明下面的定理
定理 3.1 设在超几何分布中,n是一个取定的正整数,而
10,lim
pp
N
M
N
则
nk
ppC
C
CC knkk
nn
N
kn
MN
k
M
N
,,1,0
)1(lim
38
由上面的结果可见,对固定的 n,当 N充分大时,有
),m i n (,,1,0
)1(
nMlk
ppC
C
CC knkk
nn
N
kn
MN
k
M
在实际中,一般当 n≤ 0.1N时,就可用这个近似公式,
由于有专门的二项 分布表可查,因此就可以大大节省计算的工作量了,
39
3.2.6 几何分布 (geometric distribution)
设 在伯努利 试验中,每次试验成功的概率均为 p
(0<p<1).今独立重复试验直到出现首次成功为止,
若设 X为所需试验的次数,则 X是一个 离散型 的 随机变量,其可能取的值为 1,2,…,k,…
事件 {X=k}相当于,第一次试验不成功,第 k?1次试验不成功,第 k次试验成功,,
由于试验是独立进行的,而每次试验成功的概率为 p,
不成功的概率 1?p,故 X的分布列为
,2,1,)( 1 kpqkXP k
这个概率 分布称为 几何分布,
40
第三章 随机变量及其分布
3.3 随机变量的分布函数
对离散型随机变量,可以用分布列来描述它,但对于非离散型的随机变量,由于 它可能 取的值不可数,
所以想用分布列来描述它是不可能的,
例 如,灯泡的寿命 X就是一个可以在某一个区间上任意取值的 随机变量,它的值就不是集中在有限个或可列无穷多个点上,因此,其 概率规律就不能用分布列来描述了,这时,只有确知 X在任一个区间上取值的概率才能掌握它取值的概率分布规律,
41
由于对任意实数 x1<x2有
P(x1<X≤ x2)= P(X≤ x2)?P(X≤ x1)
故研究 X落在一个区间上的概率问题,就转化为对任意的实数 x求概率 P(X≤ x)的问题了,
而 P(X≤ x)是 x的函数,从而导出下面的定义:
定义 3.2 设 X为一个 随机变量,称
FX(x)=P(X≤ x)
为 X的 分布函数,其中 x为任意实数,
由 分布函数的 定义,事件,x1<X≤ x2”的概率可写成
P(x1<X≤ x2)=FX(x2)?FX(x1)
42
分布函数是一个普通的函数,正是由于这个缘故,
我们能用数学分析的工具来研究 随机变量,
例 1 设 随机变量 的分布列为
X?1 2 3
P 1/2 1/3 1/6
求 X的分布函数,
43
X?1 2 3
P 1/2 1/3 1/6
44
解 由 分布列可知:
当 x<?1时,FX(x)=P(X≤ x)=P(Φ)=0;
当?1≤ x<2时,FX(x)=P(X≤ x)=P(X=?1)=1/2;
当 2≤ x<3时,
FX(x)=P(X≤ x)=P(X=?1)+P(X=2)=5/6;
当 x≥ 3时,FX(x)=P(X≤ x)=P(S)=1.
于是 的 X分布函数为
.3,1
,32,65
,21,21
,1,0
)(
x
x
x
x
xF
45
FX(x)的图形如图 3.2所示,
x0
F(x)
1 2 3
1/2
5/6
1
图 3.2
46
由图 3.2可以看出,FX(x)的图形是一条阶梯形曲线,
该曲线在 x=?1,2,3处,分别有跳跃值 1/2,1/3,1/6.
该阶梯形曲线的台阶的个数等于取值的个数 +1,跳跃点为取值点,跃度为取相应值的概率,
一般地,设 离散型随机变量 X的分布列为
P(X=xk)=pk,k=1,2,…
则 X的分布函数可以通过下式求得
xx
k
k
xXPxXPxF )()()(
其中和式是对所有满足 xk≤ x的 k求和,分布函数在
X=xk处具 有跳跃值 pk,
47
例 2 向区间 (a,b]内任意掷一质点,设此试验是几何概型的,求落点的坐标 X的分布函数,
解 由题意可知:
当 x≤ a时,FX(x)=P(X≤ x)=P(Φ)=0;
当 a<x<b时,
FX(x)=P(X≤ x)=P(a<X≤ x)=(x?a)/(b?a);
当 x≥ b时,FX(x)=P(X≤ x)=P(a<X≤ b)=1.
于是 的 X分布函数为
.,1
,,
,,0
)(
bx
bxa
ab
ax
ax
xF
48
FX(x)的图形是一条连续曲线,如图 3.3所示,
O a b x
1
F(x)
图 3.3
49
分布函数具有如下的性质:
(ⅰ) 当 0≤ F(x)≤ 1时,?∞ <x<+∞ ;
(ⅱ) 对任意的 x1≤ x2,有 F(x1)≤ F(x2),即 F(x)是单调不减的;
(ⅲ)
0)(lim)(
xFF
x
1)(lim)(
xFF
x
(ⅳ) F(x+0)=F(x),即 F(x)是右连续的,
可以证明,若某一个函数 F(x)满足上面的性质,则必存在一个随机变量 X以 F(x)为其 分布函数,
50
分布函数的性质 (ⅰ),(ⅱ) 可由概率的定义和性质直接得到,而性质 (ⅲ),(ⅳ) 的证明,则需要较多的数学工具,
这些性质的正确性,可由前面的两个例子得到很好的验证,
51
第三章 随机变量及其分布
3.4 连续型随机变量 (continuous)
3.4.1 连续型随机变量、概率密度
若随机变量 X的分布 函数 F(x)是可微的,则其导数
0
}{
lim
)()(
lim)()(
0
0
x
xxXxP
x
xFxxF
xFxf
x
x
52
如果将概率比作质量,类似于物理学中质量线密度的概念,人们自然称 f(x)为随机变量 X的 概率密度,
若 f(x)还是连续的,则有
x dttfxF )()(
一般地,随机变量 X的分布 函数 F(x)当然不一定处处可微,但在实际中常遇到这样一些随机变量,也存在一个非负的函数 f(x)使上式成立,
53
例如,上节例 2中的随机变量的 分布函数
.,1
,,
,,0
)(
bx
bxa
ab
ax
ax
xF
在除了 x=a与 x=b两点外,均有导数,如令
,,0
,),(
)(
bax
baxxF
xf
或等于和不等于
54
即
.,0
,,
1
)(
其它
bxa
abxf
则
x dttfxF )()(
55
为了描述这一类随机变量的概率分布律,引入下面的定义
定义 3.3 设 F(x)是随机变量 X的分布函数,如果 存在一个非负的函数 f(x),使得对任意的实数 x,都有
x dttfxF )()(
则称 X为 连续型随机变量,同时称 f(x)为 X的 概率密度函数,简称 概率密度,
56
由 连续型随机变量 的定义,再根据积分学的知识,
可以得到下面的两个结果:
(a)在整个实数轴上,F(x)是连续的函数,即连续型随机变量 的分布函数一定是 连续的;
(b)对 f(x)的连续点 x,有
F’(x)=f(x).
前面的两个式子表示了分布函数和 概率密度 之间的两个关系,利用这两个关系,可以根据分布函数和概率密度中的一个推出另一个,
57
概率密度 f(x)具有如下的性质:
(ⅰ) f(x)≥ 0;
(ⅱ)
1)(
dxxf
(ⅲ)
dxxf
xFxFxXxP
x
x?
2
1
)(
)()()( 1221
概率密度 f(x)上面的性质,可以分别由 概率密度的定义,分布函数的 性质直接得到,
58
性质 (ⅰ),(ⅱ) 是 概率密度的基本性质,可以证明满足 性质 (ⅰ),(ⅱ) 的函数 f(x),一定是某一个随机变量 X的概率密度,
59
根据概率密度 f(x)的基本性质 (ⅰ),(ⅱ),(ⅲ),
可以画出 函数 f(x)的图形如下图 3.4.
f(x)
xO
y=f(x)
图 3.4
60
在图 3.4中,曲线 y=f(x)表示概率密度曲线,它位于
x轴的上方且与 x轴所夹的面积等于 1;
f(x)
xO
y=f(x)
图 3.4
61
以 (x1,x2]为底,以 曲线 y=f(x)为顶的曲边梯形的面积 B,表示概率 P(x1<X≤ x2)的值,
xO
f(x)
y=f(x)
x1 x2
B
62
以 (?∞,x]为底,以 曲线 y=f(x)为顶的曲边梯形的面积 A,表示 F(x)的值,
xO
f(x)
y=f(x)
A
x
63
图 3.4中 以 (x,x +Δ x]为底,以 曲线 y=f(x)为顶的曲边梯形的面积 C,表示概率 P(x<X≤ x+Δ x)的值,
xO
f(x)
y=f(x)
x x+Δ x
C
Δ x>0
64
x x+Δ x x1 x2 xO
f(x)
A BC
图 3.4
65
在图 3.4中,曲线 y=f(x)表示概率密度曲线,它位于
x轴的上方且与 x轴所夹的面积等于 1;
以 (x1,x2]为底,以 曲线 y=f(x)为顶的曲边梯形的面积 B,表示概率 P(x1<X≤ x2)的值,
这就是性质 (ⅰ),(ⅱ),(ⅲ) 的几何说明,
以 (?∞,x]为底,以 曲线 y=f(x)为顶的曲边梯形的面积 A,表示 F(x)的值,这就是 连续型随机变量 的分布函数与 概率密度之间关系式 的几何说明,
66
图 3.4中 以 (x,x+Δ x]为底,以 曲线 y=f(x)为顶的曲边梯形的面积 C,表示概率 P(x<X≤ x+Δ x)的值,
若 y=f(x)在 x处 连续,则
dxxfdttfxxXxP xx
x
)()()(
因此,概率密度 f(x)的数值反映了随机变量 X取 x的邻近值的概率的大小,
但要注意,对 连续型随机变量而言,概率 P(X=x)不能描述随机变量 X取 x值的概率分布规律,因为对任何的 x值,总有
P(X=x)=0.
67
事实上,设 X的分布函数为 F(x),则有
0≤ P(X=x)≤ P(x?Δ x<X≤ x)
= F(x)?F(x?Δ x),Δ x>0.
由于 连续型随机变量 的分布函数是处处 连续的,所以
0))()((lim
0
xxFxF
x
而前式的左端与 Δ x无关,故得
P(X=x)=0.
68
由于 连续型随机变量取个别值的概率为 0,因此想用列举连续型随机变量取某个值的概率来描述这种随机变量不但作不到,而且也毫无意义,
此外,当计算连续型随机变量落在某一个区间的概率时,区间是否包含端点,是无需考虑的,
由对连续型随机变量有
P(X=x)=0
可知,一个事件的概率等于零,这个事件不一定是不可能事件;同样,一个事件的概率等于 1,这个事件也未必是必然事件,
69
例 1 设 连续型随机变量 X的 概率密度为
.0,0
,0,
)(
2
x
xAe
xf
x
求 (a)常数 A;
(b)FX(x);
(c)P(X<1).
解,(a)A=2,
70
解,(a)
2
02
)2(
2
)(1
2
0
2
0
2
A
e
A
xde
A
dxeA
dxxf
x
x
x
71
解,(b)
0,1
0,0
0,2
0,0
)()(
2
0
2
xe
x
xdte
x
dttfxF
x
x
t
x
72
解,(c)
2
1
0
222
2
1
1
0
1
2
1)1(
)1()1(
e
eedxe
eF
XPXP
xx
下面介绍几种重要的 连续型随机变量,
均匀 分布,指数 分布,正态 分布
73
第三章 随机变量及其分布
3.4 连续型随机变量
3.4.2 均匀 分布 (Uniform distribution)
设 连续型随机变量 X的 概率密度为
)(
.,0
,,
1
)( ba
bxa
abxf?
其它
则称 随机变量 X在 区间 [a,b]上服从均匀分布 (图
3.5),记为 X~U[a,b].
74
O a x
1/(b-a)
f(x)
b
图 3.5
75
由分布函数与 概率密度之间的关系式
x dttfxF )()(
可得 在 区间 [a,b]上服从均匀分布 的 随机变量 X的相应 分布函数为
.,1
,,
,,0
)(
bx
bxa
ab
ax
ax
xF
F(x)的图形见图 3.3.
76
FX(x)的图形是一条连续曲线,如图 3.3所示,
O a b x
1
F(x)
图 3.3
77
由于 f(x)≥ 0,且
11)(?
dx
ab
dxxf
b
a
故均匀分布 的 概率密度 f(x)满足 概率密度 的 性质
(ⅰ),(ⅱ).
78
若 X~U[a,b],(x1,x2]为 [a,b]中的任意一个子区间,
则有
)(
1
1
)(
12
21
2
1
xx
ab
dx
ab
xXxP
x
x
这说明 X落在 [a,b]中的任意一个子区间上的概率与子区间的长度成正比,而与子区间的位置无关,属于几何概率;故 X落在 长度相等的各个子区间的可能性是相等的,这个结果也可由图 3.5直接看出,“均匀分布,中的,均匀,就 是,等可能,的意思,
79
在实际问题中,服从 均匀分布的例子是很多的,例如:
(a)设通过某站的汽车 10分钟一辆,那么乘客的候车时间 就是在 [0,10]上服从 均匀分布的随机变量;
(b)某电台每隔 30分钟发出一个信号,我们随手打开收音机,那么我们的等待时间就是在 [0,30]上服从均匀分布的随机变量;
(c)在计算机中的舍入误差 X,是一个在
(?0.5,0.5)
上服从 均匀分布的随机变量;
(d)随机投一根针在坐标纸上,它和坐标轴的夹角 X
是一个在 [0,?]上服从 均匀分布的随机变量,
80
第三章 随机变量及其分布
3.4 连续型随机变量
3.4.2 指数 分布 (Exponential distribution)
若 连续型随机变量 X的 概率密度为
.0,0
,0,
)(
x
xe
xf
x
其中 λ 是正常数,则称 随机变量 X服从参数为 λ 的指数分布,记为 X~E(λ ).
81
由分布函数与 概率密度之间的关系式
x dttfxF )()(
可得服从参数为 λ 的指数分布 的 随机变量 X的相应分布函数为
.0,0
,0,1
)(
x
xe
xF
x?
82
由于 f(x)≥ 0,且
1
0
][
)(
0
x
x
e
dxedxxf
故服从参数为 λ 的指数分布 的 随机变量 X的概率密度 f(x)满足 概率密度 的 性质 (ⅰ),(ⅱ).
83
指数分布有重要的应用,常用它来近似地表示各种
,寿命,的分布,
下面给出一个导出指数分布的实际例子,
例 2 设已使用了 t小时的电子管在以后的 Δ t小时内损坏的概率为 λ Δ t+o(Δ t),其中 λ 是正常数,
o(Δ t)是 Δ t的高阶无穷小,若电子管 寿命 X为零的概率为零,求 X的概率分布密度,
解 使用了 t小时以后的电子管在以后的 Δ t小时内损坏的概率,就是条件概率
P(t<X≤ t+Δ t|X>t)
按题意有
P(t<X≤ t+Δ t|X>t)=λ Δ t+o(Δ t)
84
由条件概率的定义,式
P(t<X≤ t+Δ t|X>t)=λ Δ t+o(Δ t)
左端为
)(1
)()(
)(1
)(
)(
)}(){(
tF
tFttF
tXP
ttXtP
tXP
tXttXtP
代入式 P(t<X≤ t+Δ t|X>t)=λ Δ t+o(Δ t),得
)(
)(1
)()( tot
tF
tFttF
85
即
])()][(1[)()(
t
totF
t
tFttF
令 Δ t?0,得
)](1[)( tFtF
这是关于 F(t)的可分离变量的微分方程或一阶线性微分方程,它的通解为,
1)( tCetF?
其中 C为任意的常数,
86
根据初始条件
0|)( 0ttF
得到 C=?1.于是
)0(1)( tetF t?
故 X的分布函数为
.0,1
,0,0
)(
te
t
tF t?
87
从而 X的概率分布密度 为
.0,0
,0,
)(
t
te
tf
t
由上可知,电子管 寿命 X是服从参数为 λ 的指数分布的,
88
第三章 随机变量及其分布
3.5 正态分布 (Normal distribution)
连续型随机变量中,最重要的分布是正态分布,也称高斯分布 (Gauss).
定义 3.4 若 连续型随机变量 X的 概率密度为
x
exf
x
2
2
2
)(
2
1
)(?
89
定义 3.4 若 连续型随机变量 X的 概率密度为
x
exf
x
2
2
2
)(
2
1
)(?
其中 μ,σ 为常数,且 σ >0,则称 X服从参数为 μ,
σ 的 正态分布,也称 为正态变量,记为
X~N(μ,σ 2).
),(~ 2NX
下面首先验证 服从参数为 μ,σ 的 正态 分布 的 随机变量 X的概率密度 f(x)满足 概率密度 的 性质 (ⅰ),
(ⅱ).
90
显然,f(x)≥ 0,只需证明
1)(
dxxf
证 令 t=(x?μ )/σ,则
dte
dxedxxf
t
x
2
2
)(
2
2
2
2
1
2
1
)(
91
而
dudte
duedtedte
ut
utt
2
22
2
2
22
222
2
][s i n,c o s
2
0
2
0 0
2
2
d
ddeut令
92
故
22
2
dte
t
代入前式得到
1)(
dxxf
故服从参数为 μ,σ 的 正态 分布 的 随机变量 X的概率密度 f(x)满足 概率密度 的 性质,证毕,
93
利用数学分析的知识,可以画出 y=f(x)的图形,形状如悬钟 (图 3.6).
μ xO
f(x)
图 3.6
94
当 x=μ 时,f(x)取最大值,y=f(x)的曲线关于直线
x=μ 对称,曲线 y=f(x)在 x= μ ± σ 处有拐点,当
x?± ∞ 时,曲线 y=f(x)以 x轴为渐近线,
μ -σ μ μ +σ xO
f(x)
2
1
x
95
利用数学分析的知识,可以画出 y=f(x)的图形,形状如悬钟 (图 3.6).
当 x=μ 时,f(x)取最大值,y=f(x)的曲线关于 x=μ
成对称,在 x=μ ± σ 处有拐点,当 x?± ∞ 时,曲线
y=f(x)以 x轴为渐近线,
当固定 σ 值而改变 μ 值时,y=f(x)的图形将随着 μ
值的增大而沿着 Ox轴向右平移,且不改变其形状;
当固定 μ 值而改变 σ 值时,y=f(x)的图形将随着 σ
值的减少而变得越陡峭,且对称中心不变 (图 3.7),
96
μ -σ μ μ +σ xO
f(x)
2
1
x
图 3.6
97
当固定 σ 值而改变 μ 值时,y=f(x)的图形将随着 μ
值的增大而沿着 Ox轴向右平移,且不改变其形状,
μμ xO
2
1
f(x)
98
μ xO
f(x)
σ =1
σ =2
σ =1/2
当固定 μ 值而改变 σ 值时,y=f(x)的图形将随着 σ
值的减少而变得越陡峭,且对称中心不变 (图 3.7),
99
由分布函数与 概率密度之间的关系式
x dttfxF )()(
xexf
x
,
2
1
)(
2
2
2
)(
可得 X的 分布函数为
x
t
dtexF
2
2
2
)(
2
1
)(?
它的图形见图 3.8,在图 3.6中阴影部分的面积为
F(x),
100
O μ
1/2
1
x
F(x)
图 3.8
101
图 3.6
μ -σ μ μ +σ xO
f(x)
2
1
x
102
下面介绍一个重要的特殊情况
若正态分布 N(μ,σ 2)中的参数 μ,σ 分别为 0,1时,
则得到 N(0,1),称它为 标准 正态分布,
标准 正态分布对应的概率密度和 分布函数分别用
(x)与 Φ(x)来表示,即
xex
x
,
2
1
)( 2
2
xdtex
x
t
,
2
1
)( 2
2
103
xO
(x)
2
2
2
1)( xex
104
由?(x)的表达式可知,?(x)是偶函数,即
(?x)=?(x)
进一步
Φ(?x)=1?Φ(x)
故对?(x)及 Φ(x)来说,当自变量取负值时所对应的函数值,可用自变量取相应的正值时所对应的函数值来表示,
105
Φ(?x)=1?Φ(x)
这是因为
)(1
)()(
)(
)()(
x
duuduu
duuut
dttx
x
x
x
令
106
一般的正态分布 N(μ,σ 2)的分布函数 F(x)与 标准正态分布的 分布函数 Φ(x),有下面的关系,
)()(
xxF
这是因为
x u
x
t
due
t
u
dtexF
2
2
)(
2
2
2
2
1
2
1
)(
令
107
由一般的正态分布 N(μ,σ 2)的分布函数 F(x)与 标准 正态分布的 分布函数 Φ(x)的关系,对随机变量
X~N(μ,σ 2),可得到下面的结果:
)()(
)()()(
12
1221
xx
xFxFxXxP
其中 x1<x2是任意的两个实数,
这就是说,计算 X~N(μ,σ 2)落在任意一个区间内的概率都归结为计算 Φ(x)的数值,为了计算方便,
人们编制了 x≥ 0的 Φ(x)的数值表,见附表 2,
108
例 1 设 X~N(μ,σ 2),k为 任意的正常实数,求
P(|X?μ |<kσ ).
解 利用一般正态分布和 标准 正态分布的转换关系式,
有
109
解,利用一般正态分布和 标准 正态分布的转换关系式,有
1)(2
)](1[)(
)()(
)()(
)(
)(
)|(|)|(|
k
kk
kk
kk
kXkP
kXkP
kXPkXP
110
特别,当 k=1时,有
6 8 2 6.0
18 4 1 3.02
1)1(2)|(|
XP
当 k=2时,有
9 5 4 4.0
19 7 7 2.02
1)2(2)2|(|
XP
111
特别,当 k=3时,有
9 9 7 3.0
19 9 8 7.02
1)3(2)3|(|
XP
由此可见,在一次试验中,X~N(μ,σ 2)几乎落在
(μ?3σ,μ +3σ )
之中,
本题的几何意义见图 3.9.
112图 3.9
μ xO
f(x)
μ +3σμ -3σμ -2σ μ -σ μ +σ μ +2σ
面积 0.6826
面积 0.9544
面积 0.9973
2
2
2
)(
2
1)(
x
exf
113
例 2 设从某地前往火车站,可以乘公共汽车,也可以乘地铁,
若乘公共汽车所需时间 X~N(50,102)(单位为分钟 ),
乘地铁所需时间 Y~N(60,42),那么若有 70分钟可用,
问乘公共汽车好还是乘地铁好?
若有 65分钟可用,答案又如何?
114
解 显然,两种走法中以在允许的时间内有较大的概率及时赶到 火车站的 走法为好,
若有 70分钟可用,那么比较概率 P(X≤ 70)和
P(Y≤ 70)的大小,
由一般正态分布和 标准 正态分布的转换关系式,有
9 77 2.0)2()
10
5070()70(XP
9938.0)5.2()
4
6070()70(YP
由于后者 P(Y≤ 70)较大,故乘地铁较好,
115
若有 65分钟可用,那么比较概率 P(X≤ 65)和
P(Y≤ 65)的大小,
由一般正态分布和 标准 正态分布的转换关系式,有
9 3 3 2.0)5.1()
10
5065()65(XP
8 94 4.0)25.1()
4
6065()65(YP
由于 前 者 P(X≤ 65)较大,故乘地铁较好,
116
例 2 某工厂生产的电子管的寿命 X(以小时计 )服从正态分布 N(1600,σ 2),如果要求寿命在 1200小时以外的概率不小于 0.96,求 σ 的值?
解 由题意,需
P(X>1200)≥ 0.96
而
)400()1200(XP
117
故
96.0)4 0 0(
查标准正态分布表得
76.14 0 0
故
27.2 2 7
118
)
400
(
)]
400
(1[1
)
400
(1
)
16001200
(1
)1200(1)1200(
XPXP
119
正态分布是概率论中最重要的分布,在实际中,许多随机变量都服从或近似服从这种,中间大,两头小,的正态分布,
例如,测量一个零件长度的测量误差,向一个中心点射击的横向偏差或纵向偏差,电子管的噪声电流或电压,飞机材料的疲劳应力,海洋波浪的高度,
农作物的亩产量,人的身高或体重等等,都服从正态分布,
正态分布不仅在实际应用中有重要的意义,而且在理论上也有很重要的意义,这将在后面的章节随机变量的数字特征与极限定理中说明,
120
为了数理统计的需要,人们引入了 标准 正态分布
N(0,1)的上侧分位数的概念,
设 X~N(0,1),对给定的 α (0<α <1),若数 uα
u
满足条件
)( uXP
即
1)( u
则称 uα 为 N(0,1)分布 的上侧分位数,其几何意义见图 3.10,
121
uO
(u)
u
α
图 3.10
122
利用式
1)( u
并查 Φ(x)函数表可知
57.2
96.1
645.1
005.0
025.0
05.0
u
u
u
123
第三章 随机变量及其分布
3.6 随机变量函数的分布
设 g(x)是定义在随机变量 X的一切可能值 x的集合上的函数,若随机变量 Y随着 X取 x的值而取 y=g(x),
则称随机变量 Y为随机变量 X的函数,记为 Y=g(X).
例如,设 X为分子运动的速率,则分子运动的动能
Y=1/2× mX2(m为分子的质量 )是随机变量 X的函数;
设 M为 随机地落在以原点 O为圆心 R为半径的圆周上的质点,则 M在 x轴上的投影 X=RcosZ(Z为 x轴与 OM
的夹角 )为随机变量 Z的函数,
124
对随机变量 X的函数 Y=g(X)来说,我们的问题是:
如何根据已知的随机变量 X的分布 来 寻求随机变量 Y
的分布,
当 X是离散型随机变量时,g(X)的分布可直接由 X的分布列求得,
例 1 已知的分布列为
X?1 0 1 2
P 0.1 0.2 0.3 0.4
求 Y1=2X+1和 Y2=X2的分布,
125
解,
P 0.1 0.2 0.3 0.4
X?1 0 1 2
Y1=2X+1?1 1 3 5
Y2=X2 1 0 1 4
126
因此,Y1=2X+1的分布列为
Y1=2X+1?1 1 3 5
P 0.1 0.2 0.3 0.4
至于 Y2的分布列,只需注意 Y2取的值有重复相同的,
应当把相同的值所对应的概率按概率的加法公式加起来,这样就得到 Y2=X2的分布列为
127
至于 Y2的分布列,只需注意 Y2取的值有重复相同的,
应当把相同的值所对应的概率按概率的加法公式加起来,这样就得到 Y2=X2的分布列为
Y2=X2 0 1 4
P 0.2 0.4 0.4
128
下面考虑连续型随机变量函数的分布问题
现在的问题是:已知随机变量 X的概率密度 fX(x),
求随机变量 Y=g(X)的概率密度 fY(y).
今后分别以 FX(x)和 FY(y)表示随机变量 X与 Y的分布函数,
129
首先,我们指出:如果某随机变量 X的分布函数 F(x)
连续,并且除了有限个点之外,导函数 F’(x)存在且连续,那么令
不存在时,当存在时,当
)(,0
)(),(
)(
xF
xFxF
xf
则
x dttfxF )()(
(可用牛顿 —莱布尼兹公式证明 ),故该随机变量为连续型的且其概率密度为上面确定的 f(x).
130
在求 Y=g(X)的概率密度时,只要 Y的分布函数 FY(y)
满足上述的条件,就可以先求 FY(y),然后再求其导数 FY’(y)而得到结果,
这种方法,称之为,分布函数法,,
131
例 2 设 X是连续型的随机变量,其概率密度为 fX(x),
分布函数为 FX(x),求 Y=aX+b(a,b为常数,a≠ 0)的概率密度?
解 先求 Y的分布函数 FY(y)
)(
)(
)()(
byaXP
ybaXP
yYPyF Y
当 a>0时
)()()(
a
byF
a
byXPyF
XY
132
当 a<0时
)(1
)(1
)()(
a
by
F
a
by
XP
a
by
XPyF
X
Y
由于 FY’(y)存在且连续,故
133
( ),0,
()
1 ( ),0.
X
Y
X
yb
Fa
a
Fy
yb
Fa
a
若若
134
.0),(
1
,0),(
1
)()(
a
a
by
f
a
a
a
by
f
a
yFyf
X
X
YY
若若
总之
)(
||
1)(
a
byf
a
yf XY
135
定理 设 X为连续型的随机变量其概率密度为 fX(x),
y=g(x)是严格单调的连续函数,其反函数 x=h(y)有连续的导数 h’(y),则 Y=g(X)也是连续型的随机变量,其概率密度为
|)(|))(()( yhyhfyf XY
证明 不妨设 y=g(x)是严格单调递增的连续函数,设
Y的分布函数为 FY(y),则
136
duuhuhf
uhduhf
dxxf
yhXP
yXgP
yYPyF
y
X
y
X
yh
X
Y
)())((
)())((
)(
))((
))((
)()(
)(
故 Y为连续型的随机变量,其概率密度为
|)(|))(()( yhyhfyf XY
137
定理 设 X为连续型的随机变量其概率密度为 fX(x),
y=g(x)在不相交的区间 I1,I2,…,In上是严格单调的连续函数,反函数分别为 x=h1(y),x=h2(y),…,
x=hn(y),它们都有连续的导数,则 Y=g(X)也是连续型的随机变量,其概率密度为
n
i
iiXY yhyhfyf
1
|)(|))(()(
138
例 3 设随机变量 X~N(μ,σ 2),求 Y=aX+b(a,b为常数,a≠ 0)的概率密度?
解,
22
2
2
2
2
)]([
2
)(
||2
1
2
1
||
1
)(
||
1
)(
a
bay
a
by
XY
e
a
e
a
a
by
f
a
yf
139
故 Y=aX+b~N(aμ +b,a2σ 2),这说明 正态随机变量的线性函数仍然是正态变量,
例 4 设 X~N(μ,σ 2),求 Y=(X?μ )/σ 的概率密度?
解
2
2
2
1
)(
y
Y eyf
故 Y~N(0,1).
称 Y=(X?μ )/σ 为 X的 标准化,
140
例 (31.)设随机变量 X的概率密度
其它,0
0,
2
)( 2
x
x
xf X
求 Y=sinX的概率密度?
解 函数 y=sinx在 (0,π /2)上严格单调递增 ↑,反函数 x=h1(y)=arcsiny;
函数 y=sinx在 [π /2,π )上严格单调递减 ↓,反函数
x=h2(y)=π?arcsiny,故
141
|)(|))((|)(|))(()( 2211 yhyhfyhyhfyf XXY
其它,0
a r c s i n0,a r c s i n0,
1
1)a r c s i n(2
1
1a r c s i n2
2222
yy
y
y
y
y
其它,0
10,
1
2
2
y
y?
142
例 (29.)设随机变量 X~N(0,1),求 Y=|X|的概率密度?
解
;0),(
,0),(
)|(|
)()(
yyXyP
yP
yXP
yYPyF
Y
当 y≥ 0时
143
当 y≥ 0时
1)(2
)()(
)()(
y
yy
yXyPyF
Y
故
.0,0
,0,
2
2
)(
2
2
y
ye
yf
y
Y?
144
最后,就一般情况将主要推导过程归纳如下:
( 1)为求 Y=g(X)的概率密度 fY(y),先求 Y的分布函数 FY(y)
G
X
Y
dxxf
yXgP
yYPyF
)(
})({
)()(
其中 G={x|g(x)≤ y};
145
( 2)若 FY(y)可以直接计算出来并且它是连续的,
除有限个点外均有连续的导数,则可以通过对 FY(y)
求导而得 fY(y).
若 FY(y)的具体表达式不易求出,也可以采用变量代换,将积分式化为如下的形式
yY duuhyF )()(
则
)()( yhyf Y?
146
例 5 设一质点 M随机地落在以原点 O为圆心 R为半径的圆周上,并且对弧长是均匀分布的,求质点 M的横坐标 X的概率密度? (图 3.11)
xO
y
Z
M(x,y)
R
图 3.11
147
解 设 Z为 x轴与 OM的夹角,则由题意,Z在
[?π,+π ]上服从均匀分布,概率密度为
.,0
,,
2
1
)(
其它
z
zf Z
显然,X=RcosZ.下面求 X的概率密度,
148
)( c o s
)c o s(
)()(
R
x
ZP
xZRP
xXPxF
X
;0)(,0)(, xfxFRx XX时当;0)(,1)(, xfxFRx XX时当
149
当 |x|≤ R时
)( a r c c o s1)a r c c o s(
)( a r c c o s
)a r c c o s()(
R
x
F
R
x
F
Z
R
x
P
R
x
ZPxF
ZZ
X
150
22
2
2
1
1
)(1
1
)( ar c c o s
1
)(1
1
)ar c c o s(
)()(
xR
R
R
xR
x
f
R
R
xR
x
f
xFxf
Z
Z
XX
151
故
.,0
,||,
1
)( 22
其它
Rx
xRxf X?
152
例 (23.)设 电源电压不超过 200V,在 200V~240V和超过 240V三种情况下,某种电子元件损坏的概率分别为 0.1,0.001和 0.2,假设电源电压 X服从正态分布 N(220,252),试求
(1)该电子元件损坏的概率 α ;
(2)该电子元件损坏时,电源电压在 200V~240V的概率 β,
解 设 A=“电子元件损坏,,Bi =“电源电压在第 i档,,
i=1,2,3,则
(1)
3
1
)|()()(
i
ii BAPBPAP?
153
2.0
25
2 2 02 4 0
1
0 0 1.0
25
2 2 02 0 0
25
2 2 02 4 0
1.0
25
2 2 02 0 0
2.0)2 4 0(
0 0 1.0)2 4 02 0 0(1.0)2 0 0(
XP
XPXP?
154
0 6 4 1.0
2.0)7 8 8 1.01(
0 0 1.0)17 8 8 1.02(1.0)7 8 8 1.01(
2.0
25
20
1
0 0 1.0
25
20
25
20
1.0
25
20
155
0 8 9 8.0
0 6 4 1.0
0 0 5 7 6 7.0
)(
)(
)|(
2
2
AP
ABP
ABP?
156
解 设 A=,电子元件损坏,,Bi =,电源电压在第 i
档,,i=1,2,3,则
(1) α = P(A)= P(B1)P(A|B1)+P(B2)P(A|B2)+P(B3)
P (A|B3)
157
例 22.假 设 测量的随机误差 X~N(0,102),试求在
100次重复测量中,至少有三次 测量误差的绝对值大于 19.6的概率 α,并利用泊松分布求出 α 的近似值
(要求小数点后取两位有效数字 ).
解 设 Y为测量误差的绝对值大于 19.6的测量次数,
则 Y~B(100,p),其中
05.0975.022)96.1(22
)96.1()96.1(1
)6.196.19(1
)6.19|(|
查表
XP
XPp
158
故所求的概率为
1 0 0
3
1 0 0
1 0 0 )95.0()05.0(
)3(
k
kkk
C
YP?
利用泊松逼近定理
8 7 5.0
!
5100
3
5
k
k
e
k
159
例 7.设 某商店每月销售某种商品的数量服从参数为 5
的泊松分布,问在月初要至少库存多少此种商品才能保证当月不脱销的概率为 0.99977以上,
解 设 X为该商品的销售量,N为库存量,由题意
1
5
1
!
5
1
)(1
)(1
)(9 9 9 7 7.0
Nk
k
Nk
e
k
kXP
NXP
NXP
160
即
0 0 0 2 3.0
!
5
1
5
Nk
k
e
k
查泊松分布表得
N+1=15,
故月初要库存 14件以上,才能保证当月不脱销的概率为 0.99977以上,
161
例 1.掷一枚非均质的硬币,出现正面的概率为 p
(0<p<1),若以 X表示直至掷到正、反面都出现时为止所需投掷次数,求 X的分布列.
解,X=k”表示事件:前 k?1次出现正面,第 k次出现反面,或前 k?1次出现反面,第 k次出现正面,所以
11( ) ( 1 ) ( 1 )
2,3,.
kkP X k p p p p
k
162
例 2.袋中有个 a白球,b个黑球,从袋中任意取出 r
个球,求 r个球中黑球个数 X的分布列,
解 X的分布列为
),m i n (,),,0m a x (
)(
rblark
C
CC
kXP
r
ba
kr
a
k
b
163
例 4.一汽车沿一街道行驶,需通过三个设有红绿信号灯的路口,每个信号灯为红或绿与其他信号灯为红或绿相互独立,且每一信号灯红绿两种信号显示的概率均为 1/2,以 X表示该汽车首次遇到红灯前已通过的路口的个数,求 X的概率分布,
解 设 X的概率分布为
X 0 1 2 3
P 1/2 1/4 1/8 1/8
164
其中
P(X=0)=P(第一个路口即为红灯 )=1/2
P(X=1)
=P(第一个路口为绿灯,第二个路口为红灯 )
=1/2× 1/2=1/4
165
例 13.设电子管寿命 X的概率密度为
2
100
,1 0 0,
()
0,1 0 0,
x
fx x
x
若一架收音机上装有三个这种管子,求
(1)使用的最初 150小时内,至少有两个电了管被烧坏的概率;
(2)在使用的最初 150小时内烧坏的电子管数 Y的分布列;
(3)Y的分布函数,
166
解 Y为在使用的最初 150小时内烧坏的电子管数,
则 Y~B(3,p),其中
150
2100
( 1 5 0 )
1 0 0 1
.
3
p P X
dx
x
(1)所求概率为
23
2
3
( 2 ) ( 2 ) ( 3 )
1 2 1 7
.
3 3 3 2 7
P Y P Y P Y
C
167
(2)Y的分布列为
3
3
12
( ),
33
0,1,2,3.
kk
k
P Y k C
k
即
Y 0 1 2 3
P 8/27 12/27 6/27 1/27
168
(3)Y的分布函数为
0,0,
8
,0 1
27
20
( ),1 2,
27
26
,2 3,
27
1,3.
x
x
F x x
x
x
169
例 15.设随机变量 X~U[1,6],求方程 x2 +Xx+1=0有实根的概率?
解 设 A=“方程有实根,,则事件 A发生的充要条件是 X2?4≥ 0,即
|X|≥ 2.
因 X~U[1,6],所以
6
2
( ) ( | | 2 )
( 2 ) ( 2 )
14
0,8
55
P A P X
P X P X
dx
170
例 17.设顾客在某银行窗口等待服务的时间 X (单位:
分 )服从参数为 1/5的指数分布,若等待时间超过 10分钟,则他就离开,设他一个月内要来银行 5次,以 Y
表示一个月内他没有等到服务而离开窗口的次数,
求 Y的分布列及 P(Y≥ 1)?
解 由题意 Y~B(5,p),其中
5
10
25
1
( 1 0 )
5
10
x
x
p P X e d x
ee
171
于是 Y的分布为
2 2 5
5( ) ( ) ( 1 )
0,1,2,3,4,5
k k kP Y k C e e
k
而
25
( 1 ) 1 ( 0 )
1 ( 1 ) 0,5 1 6 7
P Y P Y
e?
172
例 18,设 一大型设备在任何长为 t的时间内发生故障的次数 N(t)服从参数为 λ t的泊松分布,
(1)求相继两次故障之间时间间隔 T的概率分布;
(2)求在设备已经无故障工作了 8小时的情形下,再无故障运行 8小时 的概率,
解 (1)设 T的分布函数为 FT(t),则
FT(t)=P(T≤ t)=1?P(T>t)
而事件,T>t”表示两次故障的间隔时间超过 t,也就是说在时间 t内没有发生故障,故 N(t)=0,于是
173
0,1
!0
)(
1
)0)((1
)(1)(
0
tee
t
tNP
tTPtF
tt
T
可见,T的分布函数为
.0,0
,0,1
)(
t
te
tF
t
T
即 T服从参数为 λ 的指数分布,
174
所求 的概率 为
.
)8(
)16(
)8(
)8,16(
)8|16(
8
8
16
e
e
e
TP
TP
TP
TTP
TTP
175
例 21.某地抽样结果表明,考生的外语成绩 (百分制 )
近似服从正态分布,平均成绩 (即参数 μ 之值 )为 72
分,96分以上的占考生总数的 2.3%,试求考生的外语成绩在 60分至 84分之间的概率,
解 由题意有
0,0 2 3 ( 9 6 )
1 ( 9 6 )
9 6 7 2
1 ( )
24
1 ( )
PX
PX
176
2 4 2 4 1 2( ) 0,9 7 7,2,1,
故所求概率为
177
84 72 60 72
( 60 84) ( ) ( )
12 12
( ) ( )
12
2 ( ) 1
2 0.84 13 1
0.6826.
PX
178
例 32,设 随机变量 X的分布函数 F(x)连续,且严格单调增加,求 Y=F(X)的概率密度,
解 设 Y的分布函数为 FY(y),则
当 y<0时,
FY(y)=P(Y≤ y)=P(Φ)=0;
当 y≥ 1时,
FY(y)=P(Y≤ y)=P(S)=1;
而当 0≤ y<1时,
y
yFXP
yXFPyYPyF
Y
))((
))(()()(
1
179
于是 Y的概率密度为
.,0
10,1
)(
其它
y
yf Y
概率论与数理统计第 三 章随机变量及其分布
2
第三章 随机变量及其分布
3.1 随机变量的概念
前面我们研究了随机事件及其概率,本章我们将在这个基础上进一步研究随机变量及其分布,
现 在先研究随机变量的概念,它是概率论中最基本的概念之一,
在随机试验中,人们观察的对象常常是一个随机取值的量,
3
在随机试验中,人们观察的对象常常是一个随机取值的量,
例如,考察某电话交换台在一段时间内接到的呼叫次数,这个量可能取的值为 0,1,2,… ;
测试灯泡的寿命,这个量可能在 [0,+∞) 中取值,
再如,在 n次打靶试验中,要观察击中目标的次数,
这个量可能取的值为 0,1,2,…,n;
在测量某物体长度的试验中,要观察测量长度与标准长度的偏差,这个量可能在 (?∞,+∞) 中取值,
4
当然也有一些试验观察的对象本身不是数量,
例如掷一枚匀质的硬币,观察正反面出现的情况这个随机试验,它的 样本空间 S是正与反的不同组合,
初看起来这个现象与数值无关,但是我们可以用下面的方法使它与数值联系起来:
更一般地,在伯努利试验中,用,1”表示成功,用
,0”表示失败,
于是,对试验结果不是数值的情况,我们可用一定的方法将它们数量化,也用数量来描述,
当出现正面时用,1”表示,而出现反面时用,0”表示,
5
在上述的各例中,如果把试验中所观察的对象用数量 X来表示,那么 X就具有这样的特点:
随着试验的重复 X可以取不同的数值,并且在每次试验中究竟取什么值在试验之前无法确切预言,是带随机性的数量,由此,自然地称 X为 随机变量,
由于 X是随着试验结果 (基本事件 e)而变化的,因此,
X是基本事件 e的函数,即 X=X(e).
例如,在 1.1节例 1将一枚均匀对称硬币投掷一次观察正反面出现情况这个随机试验中,样本空间
S={正,反 }.
若用 X表示试验结果,并按上述的方法数量化,那么 X就是基本事件的函数:
6
.,0
,,1
)(
当反面出现当正面出现
eXX
在 1.1节例 3记录某电话交换台在一段时间内接到的呼叫次数这个随机试验中,样本空间
S={0,1,2,…},
若用 X表示呼叫次数,那么
X=X(e)=e(e∈ S)
也是基本事件的函数,
7
由上所述,可以得到如下的随机变量的定义,
定义 3.1 设 E是随机试验,它的样本空间是 S,如果对 S中的每个基本事件 e,都有唯一的实数值 X(e)与之对应,则称 X(e)为 随机变量,简记为 X.
引入随机变量以后,随机事件就可以用随机变量来描述了,
例如,设 X表示电话交换台在一段时间内接到的呼叫次数,则
,0≤ X≤ 3”表示,呼叫次数不超过三次,的事件;
,X>5”表示,呼叫次数大于 5”的事件,
8
若
.,0
,,1
)(
当反面出现当正面出现
eXX
则
,X=1”表示事件,正面,,
而
,X=0”表示事件,反面,,
9
不仅如此,对任意事件 A,可以在样本空间 S上定义函数
,,0
,,1
)(
Ae
Ae
eI A
当当
称 IA(e)为 A的示性函数,
显然,IA是一个随机变量,当,IA=1”就表示 事件 A.
于是,对事件的研究就可以转化为对 随机变量 的研究了,
由此可见,随机变量 的概念的引入是很重要的,
以后我们还会看到,由于引入了 随机变量,数学分析的方法就可用来研究随机现象了,
10
在上面遇到的随机变量中,有的随机变量所能取的值是有限个 (如在 n次打靶试验中,中靶的次数 ),
有的随机变量所能取的值是可列无穷多个 (如 电话交换台在一段时间内接到的呼叫次数 ),这两种随机变量统称为 离散型随机变量,
象 灯泡的寿命和物体长度这样的 随机变量,它们所取的的值连续地充满一个区间,以后将它们称为连续型随机变量,它是非离散型随机变量中的最重要的类型,
下面先讨论离散型随机变量,
11
第三章 随机变量及其分布
3.2 离散型随机变量
3.2.1 概率分布列
如前所述,最多 取有限个值或可列无穷多个值的随机变量 X称为 离散型随机变量,
设 X的所有可能 取的值为
x1,x2,…,xk,…,
12
为了掌握 随机变量 X的统计规律,只知道它可能 取的值是远远不够地 (例如掷非均匀的色子 ),更主要的,还要了解它取各个 可能 值的概率是多少,
若 事件,X=xk”的概率为 pk,即
P(X=xk)=pk,k=1,2,…
则上式不仅告诉了我们 X所 能 取的值,而且还指出了它以多大的概率取这些值,
所以这样的式子把随机变量 取 值的概率规律完整地描述出来了,
我们称这样的式子为离散型随机变量 的 概率分布列或简称为 分布列,又称 分布律,
13
它也可以用表格的形式直观地表达如下:
X x1 x2 … xk …
P p1 p2 … pk …
由概率的基本性质可知,对任一分布列都有下面两个性质:
(ⅰ) pk≥ 0,k=1,2,… ;
(ⅱ)
.1
k
kp
14
反之,满足上述两条性质的数列 {pk},也可以作为某一个离散型随机变量的分布列,
下面介绍几种常见的分布列
15
例 自动化生产线在调整后出现废品的概率为 p,在生产过程中出现废品立即进行重新调整,以 X表示两次调整之间出现的正品数,求 X的概率分布?
解 X的概率分布为
X ① 0 1 … k …
P ② … …
或
P(X=k)=(1?p)kp,
k=0,1,…,0<p<1,q=1?p.
16
③ 验证
(1)显然
P(X=k)≥ 0,k=0,1,… ;
(2)
.1
)1(1
1
1
1)(
0
00
p
p
pp
ppkXP
k
k
k
k
k
17
例 设随机变量 (以后简记为 r.v)X的概率分布为
,2,1,
!
)( 1 ke
k
AkXP
求常数 A.
解 由分布列的性质
)1(
!
1
!
1 1
1
1
1
1
eAe
k
Aee
k
A
kk
因此
.
1?
e
eA
18
第三章 随机变量及其分布
3.2 离散型随机变量
3.2.2 0— 1分布 (伯努利分布、两点分布 )
设 随机变量 X只可能取 0和 1两个值,它的分布列是
P(X=1)=p,P(X=0)=q,0<p<1,q=1?p
则称 X服从 0— 1分布 或 伯努利分布,也称 两点分布,
记为 X~B(1,p).
19
0— 1分布 的表格形式 为
X 0 1
P q p
显然,伯努利试验可用 0— 1分布来描述,
20
第三章 随机变量及其分布
3.2 离散型随机变量
3.2.3 二项 分布 (binomial distribution)
设 随机变量 X分布列如下:
knkk
n qpCkXP
)(
k=0,1,2,…,n,0<p<1,q=1?p.
则称 X服从 二项 分布 (参数为 n,p),常用记号
X~B(n,p)表示,
21
特别地,当 n=1时,二项 分布的表达式成为
P(X=k)=pkq1?k,k=0,1
此即为 0— 1分布,
由前面的定理可知,在 n重 伯努利 试验中,成功的次数 X是服从二项 分布的,
22
对 二项 分布来说,概率分布列的两个性质也都成立,
因为
nk
qpCkXP knkkn
,,2,1
0)(
又
1)(
00
n
k
knkk
n
n
k
qpCkXP
故 分布列的两个性质都成立,
23
例 1 设有 N件产品,其中有 M件次品,现进行 n次有放回的抽样,每次抽取一件,求这 n次中共抽到的次品数 X的概率分布?
解 由于抽样是有放回的,因此这是 n重 伯努利 试验,
若以 A表示一次抽样中抽到次品这个事件,则
p=P(A)=M/N.
故 X~B(n,M/N),即
nk
N
M
N
M
CkXP knkkn
,,1,0
)1()()(
24
下面我们来考察 二项 分布的概率分布列表达式随着 k
取值的不同而变化的情况
先看一个例子
例 1 设有 20台机床,独立地各加工一件齿轮,若各机床加工齿轮的废品率都是 0.2,求得到的 20件齿轮中没有废品,恰有一件废品,……,以及全部都是废品的概率各为多少?
解 此例可看作是 n=20的 伯努利 试验问题,设 X表示
20件齿轮产品中的废品个数,则 X~B(20,0.2),于是 问题即要求,
20,,2,1,0
)2.01()2.0()( 2020
k
CkXP kkk
25
我们将计算的结果列于下表:
X 0 1 2 3 4 5 6
P 0.012 0.058 0.137 0.205 0.218 0.175 0.109
X 7 8 9 10 11 … 20
P 0.055 0.022 0.007 0.002 0.000 … 0.000
26
表 中当时 k≥11,P(X=k)<0.001.
为了对此结果有个比较直观的了解,可以将表中的数据用图形来表示 (图 3.1)
P
0 4 k8 16 202 61 3 5 7 9 1011 1312 1514 1817 19
图 3.1
27
从图中我们看到,
概率 P(X=k)先是随着 k的增加而单调上升,当 k增到
4时 P(X=k)取得最大值 0.218,然后 P(X=k)再随 k的增加而单调下降,
一般对于固定的 n和 p,二项 分布 B(n,p)都具有这一性质,
事实上,因为
28
事实上,因为
nk
kq
kpn
kq
pkn
qpC
qpC
kXP
kXP
knkk
n
knkk
n
,,2,1
)1(
1
)1(
)1(
)(
111
29
故当 k<(n+1)p时,P(X=k)>P(X=k?1),此时 P(X=k)
随着 k的增加而单调上升;
当 k>(n+1)p时,P(X=k)<P(X=k?1),此时 P(X=k)
随着 k的增加而单调下降;
当 k=(n+1)p为正整数时,P(X=k)=P(X=k?1),此时
P(X=k)在 k =(n+1)p及 k =(n+1)p?1的情况下都达到最大值,
若 (n+1)p不是整数,令 k0=[(n+1)p]表示 (n+1)p的整数部分,则 P(X=k0)为最大值,
如在例 1中,(n+1)p=21× 0.2=4.2不是整数,此时
k=4
使 P(X=k)达到最大值,
30
第三章 随机变量及其分布
3.2 离散型随机变量
3.2.4 泊松 分布 (Poisson distribution)
若 随机变量 X的分布列为
,2,1,0,0,
!
)(
k
k
ekXP k
则称 X服从 参数为 λ 的 泊松 分布,并用记号 X~P(λ )
表示,
31
由 泊松 分布的分布列表达式可知,
P(X=k)≥ 0(k=0,1,2,… )
且有
1
!
!
)(
0
00
ee
k
e
k
e
kXP
k
k
k
k
k
故 泊松 分布 P(λ )满足 分布列的两个性质,
32
泊松 分布是 1873年由法国数学家 泊松 引入的,
由前面的二项 概率的 泊松 逼近 定理可知,以 n,p为参数的 二项 分布,当 n很大 p很小时,近似于以
λ =np为参数的 泊松 分布,
这一事实,可以看成是 泊松 分布的一个来源,
33
泊松 分布的应用很广泛,在实际中有许多随机现象都服从 泊松 分布,
例如,电话交换台接到的呼叫次数,到商店去的顾客数,到达飞机场的飞机数,经过某块天空的流星数,纺纱机上线的断头数,放射性物质放射的质点数等等,都服从 泊松 分布,
上述各个 随机现象,都可用 随机地源源不断地出现的质点数来描述;这种源源不断出现的随机质点构成的序列称为随机质点流,
一种重要的随机质点流 —— 泊松 流,研究了产生 泊松 分布的一般条件,
34
第三章 随机变量及其分布
3.2 离散型随机变量
3.2.5 超几何分布 (hypergeometric distribution)
设有 N件产品,其中有 M件次品,今从中任取 n件不同产品,则 这 n件中所含的次品数 X是一个离散型的随机变量,X的分布列为
lk
C
CC
kXP n
N
kn
MN
k
M,,1,0,)(
35
3.2.5 超几何分布 (hypergeometric distribution)
设有 N件产品,其中有 M件次品,今从中任取 n件不同产品,则 这 n件中所含的次品数 X是一个离散型的随机变量,X的分布列为
lk
C
CC
kXP
n
N
kn
MN
k
M
,,1,0
)(
其中 l=min(M,n),并规定当 i>m时,Cmi=0.
由上式所确定的概率分布称为 超几何分布,
36
由前面的讨论可见二项 分布 可以用来描述有放回的抽样,而超几何分布可以用来描述不放回的抽样,
虽然二项 分布与 超几何分布二者并不相同,但当抽取对象总数 N很大,而抽取的次数 n相对很小时,它们的差别是很小的,就是说在一定的条件下,超几何分布可以用二项 分布来逼近,
37
不难证明下面的定理
定理 3.1 设在超几何分布中,n是一个取定的正整数,而
10,lim
pp
N
M
N
则
nk
ppC
C
CC knkk
nn
N
kn
MN
k
M
N
,,1,0
)1(lim
38
由上面的结果可见,对固定的 n,当 N充分大时,有
),m i n (,,1,0
)1(
nMlk
ppC
C
CC knkk
nn
N
kn
MN
k
M
在实际中,一般当 n≤ 0.1N时,就可用这个近似公式,
由于有专门的二项 分布表可查,因此就可以大大节省计算的工作量了,
39
3.2.6 几何分布 (geometric distribution)
设 在伯努利 试验中,每次试验成功的概率均为 p
(0<p<1).今独立重复试验直到出现首次成功为止,
若设 X为所需试验的次数,则 X是一个 离散型 的 随机变量,其可能取的值为 1,2,…,k,…
事件 {X=k}相当于,第一次试验不成功,第 k?1次试验不成功,第 k次试验成功,,
由于试验是独立进行的,而每次试验成功的概率为 p,
不成功的概率 1?p,故 X的分布列为
,2,1,)( 1 kpqkXP k
这个概率 分布称为 几何分布,
40
第三章 随机变量及其分布
3.3 随机变量的分布函数
对离散型随机变量,可以用分布列来描述它,但对于非离散型的随机变量,由于 它可能 取的值不可数,
所以想用分布列来描述它是不可能的,
例 如,灯泡的寿命 X就是一个可以在某一个区间上任意取值的 随机变量,它的值就不是集中在有限个或可列无穷多个点上,因此,其 概率规律就不能用分布列来描述了,这时,只有确知 X在任一个区间上取值的概率才能掌握它取值的概率分布规律,
41
由于对任意实数 x1<x2有
P(x1<X≤ x2)= P(X≤ x2)?P(X≤ x1)
故研究 X落在一个区间上的概率问题,就转化为对任意的实数 x求概率 P(X≤ x)的问题了,
而 P(X≤ x)是 x的函数,从而导出下面的定义:
定义 3.2 设 X为一个 随机变量,称
FX(x)=P(X≤ x)
为 X的 分布函数,其中 x为任意实数,
由 分布函数的 定义,事件,x1<X≤ x2”的概率可写成
P(x1<X≤ x2)=FX(x2)?FX(x1)
42
分布函数是一个普通的函数,正是由于这个缘故,
我们能用数学分析的工具来研究 随机变量,
例 1 设 随机变量 的分布列为
X?1 2 3
P 1/2 1/3 1/6
求 X的分布函数,
43
X?1 2 3
P 1/2 1/3 1/6
44
解 由 分布列可知:
当 x<?1时,FX(x)=P(X≤ x)=P(Φ)=0;
当?1≤ x<2时,FX(x)=P(X≤ x)=P(X=?1)=1/2;
当 2≤ x<3时,
FX(x)=P(X≤ x)=P(X=?1)+P(X=2)=5/6;
当 x≥ 3时,FX(x)=P(X≤ x)=P(S)=1.
于是 的 X分布函数为
.3,1
,32,65
,21,21
,1,0
)(
x
x
x
x
xF
45
FX(x)的图形如图 3.2所示,
x0
F(x)
1 2 3
1/2
5/6
1
图 3.2
46
由图 3.2可以看出,FX(x)的图形是一条阶梯形曲线,
该曲线在 x=?1,2,3处,分别有跳跃值 1/2,1/3,1/6.
该阶梯形曲线的台阶的个数等于取值的个数 +1,跳跃点为取值点,跃度为取相应值的概率,
一般地,设 离散型随机变量 X的分布列为
P(X=xk)=pk,k=1,2,…
则 X的分布函数可以通过下式求得
xx
k
k
xXPxXPxF )()()(
其中和式是对所有满足 xk≤ x的 k求和,分布函数在
X=xk处具 有跳跃值 pk,
47
例 2 向区间 (a,b]内任意掷一质点,设此试验是几何概型的,求落点的坐标 X的分布函数,
解 由题意可知:
当 x≤ a时,FX(x)=P(X≤ x)=P(Φ)=0;
当 a<x<b时,
FX(x)=P(X≤ x)=P(a<X≤ x)=(x?a)/(b?a);
当 x≥ b时,FX(x)=P(X≤ x)=P(a<X≤ b)=1.
于是 的 X分布函数为
.,1
,,
,,0
)(
bx
bxa
ab
ax
ax
xF
48
FX(x)的图形是一条连续曲线,如图 3.3所示,
O a b x
1
F(x)
图 3.3
49
分布函数具有如下的性质:
(ⅰ) 当 0≤ F(x)≤ 1时,?∞ <x<+∞ ;
(ⅱ) 对任意的 x1≤ x2,有 F(x1)≤ F(x2),即 F(x)是单调不减的;
(ⅲ)
0)(lim)(
xFF
x
1)(lim)(
xFF
x
(ⅳ) F(x+0)=F(x),即 F(x)是右连续的,
可以证明,若某一个函数 F(x)满足上面的性质,则必存在一个随机变量 X以 F(x)为其 分布函数,
50
分布函数的性质 (ⅰ),(ⅱ) 可由概率的定义和性质直接得到,而性质 (ⅲ),(ⅳ) 的证明,则需要较多的数学工具,
这些性质的正确性,可由前面的两个例子得到很好的验证,
51
第三章 随机变量及其分布
3.4 连续型随机变量 (continuous)
3.4.1 连续型随机变量、概率密度
若随机变量 X的分布 函数 F(x)是可微的,则其导数
0
}{
lim
)()(
lim)()(
0
0
x
xxXxP
x
xFxxF
xFxf
x
x
52
如果将概率比作质量,类似于物理学中质量线密度的概念,人们自然称 f(x)为随机变量 X的 概率密度,
若 f(x)还是连续的,则有
x dttfxF )()(
一般地,随机变量 X的分布 函数 F(x)当然不一定处处可微,但在实际中常遇到这样一些随机变量,也存在一个非负的函数 f(x)使上式成立,
53
例如,上节例 2中的随机变量的 分布函数
.,1
,,
,,0
)(
bx
bxa
ab
ax
ax
xF
在除了 x=a与 x=b两点外,均有导数,如令
,,0
,),(
)(
bax
baxxF
xf
或等于和不等于
54
即
.,0
,,
1
)(
其它
bxa
abxf
则
x dttfxF )()(
55
为了描述这一类随机变量的概率分布律,引入下面的定义
定义 3.3 设 F(x)是随机变量 X的分布函数,如果 存在一个非负的函数 f(x),使得对任意的实数 x,都有
x dttfxF )()(
则称 X为 连续型随机变量,同时称 f(x)为 X的 概率密度函数,简称 概率密度,
56
由 连续型随机变量 的定义,再根据积分学的知识,
可以得到下面的两个结果:
(a)在整个实数轴上,F(x)是连续的函数,即连续型随机变量 的分布函数一定是 连续的;
(b)对 f(x)的连续点 x,有
F’(x)=f(x).
前面的两个式子表示了分布函数和 概率密度 之间的两个关系,利用这两个关系,可以根据分布函数和概率密度中的一个推出另一个,
57
概率密度 f(x)具有如下的性质:
(ⅰ) f(x)≥ 0;
(ⅱ)
1)(
dxxf
(ⅲ)
dxxf
xFxFxXxP
x
x?
2
1
)(
)()()( 1221
概率密度 f(x)上面的性质,可以分别由 概率密度的定义,分布函数的 性质直接得到,
58
性质 (ⅰ),(ⅱ) 是 概率密度的基本性质,可以证明满足 性质 (ⅰ),(ⅱ) 的函数 f(x),一定是某一个随机变量 X的概率密度,
59
根据概率密度 f(x)的基本性质 (ⅰ),(ⅱ),(ⅲ),
可以画出 函数 f(x)的图形如下图 3.4.
f(x)
xO
y=f(x)
图 3.4
60
在图 3.4中,曲线 y=f(x)表示概率密度曲线,它位于
x轴的上方且与 x轴所夹的面积等于 1;
f(x)
xO
y=f(x)
图 3.4
61
以 (x1,x2]为底,以 曲线 y=f(x)为顶的曲边梯形的面积 B,表示概率 P(x1<X≤ x2)的值,
xO
f(x)
y=f(x)
x1 x2
B
62
以 (?∞,x]为底,以 曲线 y=f(x)为顶的曲边梯形的面积 A,表示 F(x)的值,
xO
f(x)
y=f(x)
A
x
63
图 3.4中 以 (x,x +Δ x]为底,以 曲线 y=f(x)为顶的曲边梯形的面积 C,表示概率 P(x<X≤ x+Δ x)的值,
xO
f(x)
y=f(x)
x x+Δ x
C
Δ x>0
64
x x+Δ x x1 x2 xO
f(x)
A BC
图 3.4
65
在图 3.4中,曲线 y=f(x)表示概率密度曲线,它位于
x轴的上方且与 x轴所夹的面积等于 1;
以 (x1,x2]为底,以 曲线 y=f(x)为顶的曲边梯形的面积 B,表示概率 P(x1<X≤ x2)的值,
这就是性质 (ⅰ),(ⅱ),(ⅲ) 的几何说明,
以 (?∞,x]为底,以 曲线 y=f(x)为顶的曲边梯形的面积 A,表示 F(x)的值,这就是 连续型随机变量 的分布函数与 概率密度之间关系式 的几何说明,
66
图 3.4中 以 (x,x+Δ x]为底,以 曲线 y=f(x)为顶的曲边梯形的面积 C,表示概率 P(x<X≤ x+Δ x)的值,
若 y=f(x)在 x处 连续,则
dxxfdttfxxXxP xx
x
)()()(
因此,概率密度 f(x)的数值反映了随机变量 X取 x的邻近值的概率的大小,
但要注意,对 连续型随机变量而言,概率 P(X=x)不能描述随机变量 X取 x值的概率分布规律,因为对任何的 x值,总有
P(X=x)=0.
67
事实上,设 X的分布函数为 F(x),则有
0≤ P(X=x)≤ P(x?Δ x<X≤ x)
= F(x)?F(x?Δ x),Δ x>0.
由于 连续型随机变量 的分布函数是处处 连续的,所以
0))()((lim
0
xxFxF
x
而前式的左端与 Δ x无关,故得
P(X=x)=0.
68
由于 连续型随机变量取个别值的概率为 0,因此想用列举连续型随机变量取某个值的概率来描述这种随机变量不但作不到,而且也毫无意义,
此外,当计算连续型随机变量落在某一个区间的概率时,区间是否包含端点,是无需考虑的,
由对连续型随机变量有
P(X=x)=0
可知,一个事件的概率等于零,这个事件不一定是不可能事件;同样,一个事件的概率等于 1,这个事件也未必是必然事件,
69
例 1 设 连续型随机变量 X的 概率密度为
.0,0
,0,
)(
2
x
xAe
xf
x
求 (a)常数 A;
(b)FX(x);
(c)P(X<1).
解,(a)A=2,
70
解,(a)
2
02
)2(
2
)(1
2
0
2
0
2
A
e
A
xde
A
dxeA
dxxf
x
x
x
71
解,(b)
0,1
0,0
0,2
0,0
)()(
2
0
2
xe
x
xdte
x
dttfxF
x
x
t
x
72
解,(c)
2
1
0
222
2
1
1
0
1
2
1)1(
)1()1(
e
eedxe
eF
XPXP
xx
下面介绍几种重要的 连续型随机变量,
均匀 分布,指数 分布,正态 分布
73
第三章 随机变量及其分布
3.4 连续型随机变量
3.4.2 均匀 分布 (Uniform distribution)
设 连续型随机变量 X的 概率密度为
)(
.,0
,,
1
)( ba
bxa
abxf?
其它
则称 随机变量 X在 区间 [a,b]上服从均匀分布 (图
3.5),记为 X~U[a,b].
74
O a x
1/(b-a)
f(x)
b
图 3.5
75
由分布函数与 概率密度之间的关系式
x dttfxF )()(
可得 在 区间 [a,b]上服从均匀分布 的 随机变量 X的相应 分布函数为
.,1
,,
,,0
)(
bx
bxa
ab
ax
ax
xF
F(x)的图形见图 3.3.
76
FX(x)的图形是一条连续曲线,如图 3.3所示,
O a b x
1
F(x)
图 3.3
77
由于 f(x)≥ 0,且
11)(?
dx
ab
dxxf
b
a
故均匀分布 的 概率密度 f(x)满足 概率密度 的 性质
(ⅰ),(ⅱ).
78
若 X~U[a,b],(x1,x2]为 [a,b]中的任意一个子区间,
则有
)(
1
1
)(
12
21
2
1
xx
ab
dx
ab
xXxP
x
x
这说明 X落在 [a,b]中的任意一个子区间上的概率与子区间的长度成正比,而与子区间的位置无关,属于几何概率;故 X落在 长度相等的各个子区间的可能性是相等的,这个结果也可由图 3.5直接看出,“均匀分布,中的,均匀,就 是,等可能,的意思,
79
在实际问题中,服从 均匀分布的例子是很多的,例如:
(a)设通过某站的汽车 10分钟一辆,那么乘客的候车时间 就是在 [0,10]上服从 均匀分布的随机变量;
(b)某电台每隔 30分钟发出一个信号,我们随手打开收音机,那么我们的等待时间就是在 [0,30]上服从均匀分布的随机变量;
(c)在计算机中的舍入误差 X,是一个在
(?0.5,0.5)
上服从 均匀分布的随机变量;
(d)随机投一根针在坐标纸上,它和坐标轴的夹角 X
是一个在 [0,?]上服从 均匀分布的随机变量,
80
第三章 随机变量及其分布
3.4 连续型随机变量
3.4.2 指数 分布 (Exponential distribution)
若 连续型随机变量 X的 概率密度为
.0,0
,0,
)(
x
xe
xf
x
其中 λ 是正常数,则称 随机变量 X服从参数为 λ 的指数分布,记为 X~E(λ ).
81
由分布函数与 概率密度之间的关系式
x dttfxF )()(
可得服从参数为 λ 的指数分布 的 随机变量 X的相应分布函数为
.0,0
,0,1
)(
x
xe
xF
x?
82
由于 f(x)≥ 0,且
1
0
][
)(
0
x
x
e
dxedxxf
故服从参数为 λ 的指数分布 的 随机变量 X的概率密度 f(x)满足 概率密度 的 性质 (ⅰ),(ⅱ).
83
指数分布有重要的应用,常用它来近似地表示各种
,寿命,的分布,
下面给出一个导出指数分布的实际例子,
例 2 设已使用了 t小时的电子管在以后的 Δ t小时内损坏的概率为 λ Δ t+o(Δ t),其中 λ 是正常数,
o(Δ t)是 Δ t的高阶无穷小,若电子管 寿命 X为零的概率为零,求 X的概率分布密度,
解 使用了 t小时以后的电子管在以后的 Δ t小时内损坏的概率,就是条件概率
P(t<X≤ t+Δ t|X>t)
按题意有
P(t<X≤ t+Δ t|X>t)=λ Δ t+o(Δ t)
84
由条件概率的定义,式
P(t<X≤ t+Δ t|X>t)=λ Δ t+o(Δ t)
左端为
)(1
)()(
)(1
)(
)(
)}(){(
tF
tFttF
tXP
ttXtP
tXP
tXttXtP
代入式 P(t<X≤ t+Δ t|X>t)=λ Δ t+o(Δ t),得
)(
)(1
)()( tot
tF
tFttF
85
即
])()][(1[)()(
t
totF
t
tFttF
令 Δ t?0,得
)](1[)( tFtF
这是关于 F(t)的可分离变量的微分方程或一阶线性微分方程,它的通解为,
1)( tCetF?
其中 C为任意的常数,
86
根据初始条件
0|)( 0ttF
得到 C=?1.于是
)0(1)( tetF t?
故 X的分布函数为
.0,1
,0,0
)(
te
t
tF t?
87
从而 X的概率分布密度 为
.0,0
,0,
)(
t
te
tf
t
由上可知,电子管 寿命 X是服从参数为 λ 的指数分布的,
88
第三章 随机变量及其分布
3.5 正态分布 (Normal distribution)
连续型随机变量中,最重要的分布是正态分布,也称高斯分布 (Gauss).
定义 3.4 若 连续型随机变量 X的 概率密度为
x
exf
x
2
2
2
)(
2
1
)(?
89
定义 3.4 若 连续型随机变量 X的 概率密度为
x
exf
x
2
2
2
)(
2
1
)(?
其中 μ,σ 为常数,且 σ >0,则称 X服从参数为 μ,
σ 的 正态分布,也称 为正态变量,记为
X~N(μ,σ 2).
),(~ 2NX
下面首先验证 服从参数为 μ,σ 的 正态 分布 的 随机变量 X的概率密度 f(x)满足 概率密度 的 性质 (ⅰ),
(ⅱ).
90
显然,f(x)≥ 0,只需证明
1)(
dxxf
证 令 t=(x?μ )/σ,则
dte
dxedxxf
t
x
2
2
)(
2
2
2
2
1
2
1
)(
91
而
dudte
duedtedte
ut
utt
2
22
2
2
22
222
2
][s i n,c o s
2
0
2
0 0
2
2
d
ddeut令
92
故
22
2
dte
t
代入前式得到
1)(
dxxf
故服从参数为 μ,σ 的 正态 分布 的 随机变量 X的概率密度 f(x)满足 概率密度 的 性质,证毕,
93
利用数学分析的知识,可以画出 y=f(x)的图形,形状如悬钟 (图 3.6).
μ xO
f(x)
图 3.6
94
当 x=μ 时,f(x)取最大值,y=f(x)的曲线关于直线
x=μ 对称,曲线 y=f(x)在 x= μ ± σ 处有拐点,当
x?± ∞ 时,曲线 y=f(x)以 x轴为渐近线,
μ -σ μ μ +σ xO
f(x)
2
1
x
95
利用数学分析的知识,可以画出 y=f(x)的图形,形状如悬钟 (图 3.6).
当 x=μ 时,f(x)取最大值,y=f(x)的曲线关于 x=μ
成对称,在 x=μ ± σ 处有拐点,当 x?± ∞ 时,曲线
y=f(x)以 x轴为渐近线,
当固定 σ 值而改变 μ 值时,y=f(x)的图形将随着 μ
值的增大而沿着 Ox轴向右平移,且不改变其形状;
当固定 μ 值而改变 σ 值时,y=f(x)的图形将随着 σ
值的减少而变得越陡峭,且对称中心不变 (图 3.7),
96
μ -σ μ μ +σ xO
f(x)
2
1
x
图 3.6
97
当固定 σ 值而改变 μ 值时,y=f(x)的图形将随着 μ
值的增大而沿着 Ox轴向右平移,且不改变其形状,
μμ xO
2
1
f(x)
98
μ xO
f(x)
σ =1
σ =2
σ =1/2
当固定 μ 值而改变 σ 值时,y=f(x)的图形将随着 σ
值的减少而变得越陡峭,且对称中心不变 (图 3.7),
99
由分布函数与 概率密度之间的关系式
x dttfxF )()(
xexf
x
,
2
1
)(
2
2
2
)(
可得 X的 分布函数为
x
t
dtexF
2
2
2
)(
2
1
)(?
它的图形见图 3.8,在图 3.6中阴影部分的面积为
F(x),
100
O μ
1/2
1
x
F(x)
图 3.8
101
图 3.6
μ -σ μ μ +σ xO
f(x)
2
1
x
102
下面介绍一个重要的特殊情况
若正态分布 N(μ,σ 2)中的参数 μ,σ 分别为 0,1时,
则得到 N(0,1),称它为 标准 正态分布,
标准 正态分布对应的概率密度和 分布函数分别用
(x)与 Φ(x)来表示,即
xex
x
,
2
1
)( 2
2
xdtex
x
t
,
2
1
)( 2
2
103
xO
(x)
2
2
2
1)( xex
104
由?(x)的表达式可知,?(x)是偶函数,即
(?x)=?(x)
进一步
Φ(?x)=1?Φ(x)
故对?(x)及 Φ(x)来说,当自变量取负值时所对应的函数值,可用自变量取相应的正值时所对应的函数值来表示,
105
Φ(?x)=1?Φ(x)
这是因为
)(1
)()(
)(
)()(
x
duuduu
duuut
dttx
x
x
x
令
106
一般的正态分布 N(μ,σ 2)的分布函数 F(x)与 标准正态分布的 分布函数 Φ(x),有下面的关系,
)()(
xxF
这是因为
x u
x
t
due
t
u
dtexF
2
2
)(
2
2
2
2
1
2
1
)(
令
107
由一般的正态分布 N(μ,σ 2)的分布函数 F(x)与 标准 正态分布的 分布函数 Φ(x)的关系,对随机变量
X~N(μ,σ 2),可得到下面的结果:
)()(
)()()(
12
1221
xx
xFxFxXxP
其中 x1<x2是任意的两个实数,
这就是说,计算 X~N(μ,σ 2)落在任意一个区间内的概率都归结为计算 Φ(x)的数值,为了计算方便,
人们编制了 x≥ 0的 Φ(x)的数值表,见附表 2,
108
例 1 设 X~N(μ,σ 2),k为 任意的正常实数,求
P(|X?μ |<kσ ).
解 利用一般正态分布和 标准 正态分布的转换关系式,
有
109
解,利用一般正态分布和 标准 正态分布的转换关系式,有
1)(2
)](1[)(
)()(
)()(
)(
)(
)|(|)|(|
k
kk
kk
kk
kXkP
kXkP
kXPkXP
110
特别,当 k=1时,有
6 8 2 6.0
18 4 1 3.02
1)1(2)|(|
XP
当 k=2时,有
9 5 4 4.0
19 7 7 2.02
1)2(2)2|(|
XP
111
特别,当 k=3时,有
9 9 7 3.0
19 9 8 7.02
1)3(2)3|(|
XP
由此可见,在一次试验中,X~N(μ,σ 2)几乎落在
(μ?3σ,μ +3σ )
之中,
本题的几何意义见图 3.9.
112图 3.9
μ xO
f(x)
μ +3σμ -3σμ -2σ μ -σ μ +σ μ +2σ
面积 0.6826
面积 0.9544
面积 0.9973
2
2
2
)(
2
1)(
x
exf
113
例 2 设从某地前往火车站,可以乘公共汽车,也可以乘地铁,
若乘公共汽车所需时间 X~N(50,102)(单位为分钟 ),
乘地铁所需时间 Y~N(60,42),那么若有 70分钟可用,
问乘公共汽车好还是乘地铁好?
若有 65分钟可用,答案又如何?
114
解 显然,两种走法中以在允许的时间内有较大的概率及时赶到 火车站的 走法为好,
若有 70分钟可用,那么比较概率 P(X≤ 70)和
P(Y≤ 70)的大小,
由一般正态分布和 标准 正态分布的转换关系式,有
9 77 2.0)2()
10
5070()70(XP
9938.0)5.2()
4
6070()70(YP
由于后者 P(Y≤ 70)较大,故乘地铁较好,
115
若有 65分钟可用,那么比较概率 P(X≤ 65)和
P(Y≤ 65)的大小,
由一般正态分布和 标准 正态分布的转换关系式,有
9 3 3 2.0)5.1()
10
5065()65(XP
8 94 4.0)25.1()
4
6065()65(YP
由于 前 者 P(X≤ 65)较大,故乘地铁较好,
116
例 2 某工厂生产的电子管的寿命 X(以小时计 )服从正态分布 N(1600,σ 2),如果要求寿命在 1200小时以外的概率不小于 0.96,求 σ 的值?
解 由题意,需
P(X>1200)≥ 0.96
而
)400()1200(XP
117
故
96.0)4 0 0(
查标准正态分布表得
76.14 0 0
故
27.2 2 7
118
)
400
(
)]
400
(1[1
)
400
(1
)
16001200
(1
)1200(1)1200(
XPXP
119
正态分布是概率论中最重要的分布,在实际中,许多随机变量都服从或近似服从这种,中间大,两头小,的正态分布,
例如,测量一个零件长度的测量误差,向一个中心点射击的横向偏差或纵向偏差,电子管的噪声电流或电压,飞机材料的疲劳应力,海洋波浪的高度,
农作物的亩产量,人的身高或体重等等,都服从正态分布,
正态分布不仅在实际应用中有重要的意义,而且在理论上也有很重要的意义,这将在后面的章节随机变量的数字特征与极限定理中说明,
120
为了数理统计的需要,人们引入了 标准 正态分布
N(0,1)的上侧分位数的概念,
设 X~N(0,1),对给定的 α (0<α <1),若数 uα
u
满足条件
)( uXP
即
1)( u
则称 uα 为 N(0,1)分布 的上侧分位数,其几何意义见图 3.10,
121
uO
(u)
u
α
图 3.10
122
利用式
1)( u
并查 Φ(x)函数表可知
57.2
96.1
645.1
005.0
025.0
05.0
u
u
u
123
第三章 随机变量及其分布
3.6 随机变量函数的分布
设 g(x)是定义在随机变量 X的一切可能值 x的集合上的函数,若随机变量 Y随着 X取 x的值而取 y=g(x),
则称随机变量 Y为随机变量 X的函数,记为 Y=g(X).
例如,设 X为分子运动的速率,则分子运动的动能
Y=1/2× mX2(m为分子的质量 )是随机变量 X的函数;
设 M为 随机地落在以原点 O为圆心 R为半径的圆周上的质点,则 M在 x轴上的投影 X=RcosZ(Z为 x轴与 OM
的夹角 )为随机变量 Z的函数,
124
对随机变量 X的函数 Y=g(X)来说,我们的问题是:
如何根据已知的随机变量 X的分布 来 寻求随机变量 Y
的分布,
当 X是离散型随机变量时,g(X)的分布可直接由 X的分布列求得,
例 1 已知的分布列为
X?1 0 1 2
P 0.1 0.2 0.3 0.4
求 Y1=2X+1和 Y2=X2的分布,
125
解,
P 0.1 0.2 0.3 0.4
X?1 0 1 2
Y1=2X+1?1 1 3 5
Y2=X2 1 0 1 4
126
因此,Y1=2X+1的分布列为
Y1=2X+1?1 1 3 5
P 0.1 0.2 0.3 0.4
至于 Y2的分布列,只需注意 Y2取的值有重复相同的,
应当把相同的值所对应的概率按概率的加法公式加起来,这样就得到 Y2=X2的分布列为
127
至于 Y2的分布列,只需注意 Y2取的值有重复相同的,
应当把相同的值所对应的概率按概率的加法公式加起来,这样就得到 Y2=X2的分布列为
Y2=X2 0 1 4
P 0.2 0.4 0.4
128
下面考虑连续型随机变量函数的分布问题
现在的问题是:已知随机变量 X的概率密度 fX(x),
求随机变量 Y=g(X)的概率密度 fY(y).
今后分别以 FX(x)和 FY(y)表示随机变量 X与 Y的分布函数,
129
首先,我们指出:如果某随机变量 X的分布函数 F(x)
连续,并且除了有限个点之外,导函数 F’(x)存在且连续,那么令
不存在时,当存在时,当
)(,0
)(),(
)(
xF
xFxF
xf
则
x dttfxF )()(
(可用牛顿 —莱布尼兹公式证明 ),故该随机变量为连续型的且其概率密度为上面确定的 f(x).
130
在求 Y=g(X)的概率密度时,只要 Y的分布函数 FY(y)
满足上述的条件,就可以先求 FY(y),然后再求其导数 FY’(y)而得到结果,
这种方法,称之为,分布函数法,,
131
例 2 设 X是连续型的随机变量,其概率密度为 fX(x),
分布函数为 FX(x),求 Y=aX+b(a,b为常数,a≠ 0)的概率密度?
解 先求 Y的分布函数 FY(y)
)(
)(
)()(
byaXP
ybaXP
yYPyF Y
当 a>0时
)()()(
a
byF
a
byXPyF
XY
132
当 a<0时
)(1
)(1
)()(
a
by
F
a
by
XP
a
by
XPyF
X
Y
由于 FY’(y)存在且连续,故
133
( ),0,
()
1 ( ),0.
X
Y
X
yb
Fa
a
Fy
yb
Fa
a
若若
134
.0),(
1
,0),(
1
)()(
a
a
by
f
a
a
a
by
f
a
yFyf
X
X
YY
若若
总之
)(
||
1)(
a
byf
a
yf XY
135
定理 设 X为连续型的随机变量其概率密度为 fX(x),
y=g(x)是严格单调的连续函数,其反函数 x=h(y)有连续的导数 h’(y),则 Y=g(X)也是连续型的随机变量,其概率密度为
|)(|))(()( yhyhfyf XY
证明 不妨设 y=g(x)是严格单调递增的连续函数,设
Y的分布函数为 FY(y),则
136
duuhuhf
uhduhf
dxxf
yhXP
yXgP
yYPyF
y
X
y
X
yh
X
Y
)())((
)())((
)(
))((
))((
)()(
)(
故 Y为连续型的随机变量,其概率密度为
|)(|))(()( yhyhfyf XY
137
定理 设 X为连续型的随机变量其概率密度为 fX(x),
y=g(x)在不相交的区间 I1,I2,…,In上是严格单调的连续函数,反函数分别为 x=h1(y),x=h2(y),…,
x=hn(y),它们都有连续的导数,则 Y=g(X)也是连续型的随机变量,其概率密度为
n
i
iiXY yhyhfyf
1
|)(|))(()(
138
例 3 设随机变量 X~N(μ,σ 2),求 Y=aX+b(a,b为常数,a≠ 0)的概率密度?
解,
22
2
2
2
2
)]([
2
)(
||2
1
2
1
||
1
)(
||
1
)(
a
bay
a
by
XY
e
a
e
a
a
by
f
a
yf
139
故 Y=aX+b~N(aμ +b,a2σ 2),这说明 正态随机变量的线性函数仍然是正态变量,
例 4 设 X~N(μ,σ 2),求 Y=(X?μ )/σ 的概率密度?
解
2
2
2
1
)(
y
Y eyf
故 Y~N(0,1).
称 Y=(X?μ )/σ 为 X的 标准化,
140
例 (31.)设随机变量 X的概率密度
其它,0
0,
2
)( 2
x
x
xf X
求 Y=sinX的概率密度?
解 函数 y=sinx在 (0,π /2)上严格单调递增 ↑,反函数 x=h1(y)=arcsiny;
函数 y=sinx在 [π /2,π )上严格单调递减 ↓,反函数
x=h2(y)=π?arcsiny,故
141
|)(|))((|)(|))(()( 2211 yhyhfyhyhfyf XXY
其它,0
a r c s i n0,a r c s i n0,
1
1)a r c s i n(2
1
1a r c s i n2
2222
yy
y
y
y
y
其它,0
10,
1
2
2
y
y?
142
例 (29.)设随机变量 X~N(0,1),求 Y=|X|的概率密度?
解
;0),(
,0),(
)|(|
)()(
yyXyP
yP
yXP
yYPyF
Y
当 y≥ 0时
143
当 y≥ 0时
1)(2
)()(
)()(
y
yy
yXyPyF
Y
故
.0,0
,0,
2
2
)(
2
2
y
ye
yf
y
Y?
144
最后,就一般情况将主要推导过程归纳如下:
( 1)为求 Y=g(X)的概率密度 fY(y),先求 Y的分布函数 FY(y)
G
X
Y
dxxf
yXgP
yYPyF
)(
})({
)()(
其中 G={x|g(x)≤ y};
145
( 2)若 FY(y)可以直接计算出来并且它是连续的,
除有限个点外均有连续的导数,则可以通过对 FY(y)
求导而得 fY(y).
若 FY(y)的具体表达式不易求出,也可以采用变量代换,将积分式化为如下的形式
yY duuhyF )()(
则
)()( yhyf Y?
146
例 5 设一质点 M随机地落在以原点 O为圆心 R为半径的圆周上,并且对弧长是均匀分布的,求质点 M的横坐标 X的概率密度? (图 3.11)
xO
y
Z
M(x,y)
R
图 3.11
147
解 设 Z为 x轴与 OM的夹角,则由题意,Z在
[?π,+π ]上服从均匀分布,概率密度为
.,0
,,
2
1
)(
其它
z
zf Z
显然,X=RcosZ.下面求 X的概率密度,
148
)( c o s
)c o s(
)()(
R
x
ZP
xZRP
xXPxF
X
;0)(,0)(, xfxFRx XX时当;0)(,1)(, xfxFRx XX时当
149
当 |x|≤ R时
)( a r c c o s1)a r c c o s(
)( a r c c o s
)a r c c o s()(
R
x
F
R
x
F
Z
R
x
P
R
x
ZPxF
ZZ
X
150
22
2
2
1
1
)(1
1
)( ar c c o s
1
)(1
1
)ar c c o s(
)()(
xR
R
R
xR
x
f
R
R
xR
x
f
xFxf
Z
Z
XX
151
故
.,0
,||,
1
)( 22
其它
Rx
xRxf X?
152
例 (23.)设 电源电压不超过 200V,在 200V~240V和超过 240V三种情况下,某种电子元件损坏的概率分别为 0.1,0.001和 0.2,假设电源电压 X服从正态分布 N(220,252),试求
(1)该电子元件损坏的概率 α ;
(2)该电子元件损坏时,电源电压在 200V~240V的概率 β,
解 设 A=“电子元件损坏,,Bi =“电源电压在第 i档,,
i=1,2,3,则
(1)
3
1
)|()()(
i
ii BAPBPAP?
153
2.0
25
2 2 02 4 0
1
0 0 1.0
25
2 2 02 0 0
25
2 2 02 4 0
1.0
25
2 2 02 0 0
2.0)2 4 0(
0 0 1.0)2 4 02 0 0(1.0)2 0 0(
XP
XPXP?
154
0 6 4 1.0
2.0)7 8 8 1.01(
0 0 1.0)17 8 8 1.02(1.0)7 8 8 1.01(
2.0
25
20
1
0 0 1.0
25
20
25
20
1.0
25
20
155
0 8 9 8.0
0 6 4 1.0
0 0 5 7 6 7.0
)(
)(
)|(
2
2
AP
ABP
ABP?
156
解 设 A=,电子元件损坏,,Bi =,电源电压在第 i
档,,i=1,2,3,则
(1) α = P(A)= P(B1)P(A|B1)+P(B2)P(A|B2)+P(B3)
P (A|B3)
157
例 22.假 设 测量的随机误差 X~N(0,102),试求在
100次重复测量中,至少有三次 测量误差的绝对值大于 19.6的概率 α,并利用泊松分布求出 α 的近似值
(要求小数点后取两位有效数字 ).
解 设 Y为测量误差的绝对值大于 19.6的测量次数,
则 Y~B(100,p),其中
05.0975.022)96.1(22
)96.1()96.1(1
)6.196.19(1
)6.19|(|
查表
XP
XPp
158
故所求的概率为
1 0 0
3
1 0 0
1 0 0 )95.0()05.0(
)3(
k
kkk
C
YP?
利用泊松逼近定理
8 7 5.0
!
5100
3
5
k
k
e
k
159
例 7.设 某商店每月销售某种商品的数量服从参数为 5
的泊松分布,问在月初要至少库存多少此种商品才能保证当月不脱销的概率为 0.99977以上,
解 设 X为该商品的销售量,N为库存量,由题意
1
5
1
!
5
1
)(1
)(1
)(9 9 9 7 7.0
Nk
k
Nk
e
k
kXP
NXP
NXP
160
即
0 0 0 2 3.0
!
5
1
5
Nk
k
e
k
查泊松分布表得
N+1=15,
故月初要库存 14件以上,才能保证当月不脱销的概率为 0.99977以上,
161
例 1.掷一枚非均质的硬币,出现正面的概率为 p
(0<p<1),若以 X表示直至掷到正、反面都出现时为止所需投掷次数,求 X的分布列.
解,X=k”表示事件:前 k?1次出现正面,第 k次出现反面,或前 k?1次出现反面,第 k次出现正面,所以
11( ) ( 1 ) ( 1 )
2,3,.
kkP X k p p p p
k
162
例 2.袋中有个 a白球,b个黑球,从袋中任意取出 r
个球,求 r个球中黑球个数 X的分布列,
解 X的分布列为
),m i n (,),,0m a x (
)(
rblark
C
CC
kXP
r
ba
kr
a
k
b
163
例 4.一汽车沿一街道行驶,需通过三个设有红绿信号灯的路口,每个信号灯为红或绿与其他信号灯为红或绿相互独立,且每一信号灯红绿两种信号显示的概率均为 1/2,以 X表示该汽车首次遇到红灯前已通过的路口的个数,求 X的概率分布,
解 设 X的概率分布为
X 0 1 2 3
P 1/2 1/4 1/8 1/8
164
其中
P(X=0)=P(第一个路口即为红灯 )=1/2
P(X=1)
=P(第一个路口为绿灯,第二个路口为红灯 )
=1/2× 1/2=1/4
165
例 13.设电子管寿命 X的概率密度为
2
100
,1 0 0,
()
0,1 0 0,
x
fx x
x
若一架收音机上装有三个这种管子,求
(1)使用的最初 150小时内,至少有两个电了管被烧坏的概率;
(2)在使用的最初 150小时内烧坏的电子管数 Y的分布列;
(3)Y的分布函数,
166
解 Y为在使用的最初 150小时内烧坏的电子管数,
则 Y~B(3,p),其中
150
2100
( 1 5 0 )
1 0 0 1
.
3
p P X
dx
x
(1)所求概率为
23
2
3
( 2 ) ( 2 ) ( 3 )
1 2 1 7
.
3 3 3 2 7
P Y P Y P Y
C
167
(2)Y的分布列为
3
3
12
( ),
33
0,1,2,3.
kk
k
P Y k C
k
即
Y 0 1 2 3
P 8/27 12/27 6/27 1/27
168
(3)Y的分布函数为
0,0,
8
,0 1
27
20
( ),1 2,
27
26
,2 3,
27
1,3.
x
x
F x x
x
x
169
例 15.设随机变量 X~U[1,6],求方程 x2 +Xx+1=0有实根的概率?
解 设 A=“方程有实根,,则事件 A发生的充要条件是 X2?4≥ 0,即
|X|≥ 2.
因 X~U[1,6],所以
6
2
( ) ( | | 2 )
( 2 ) ( 2 )
14
0,8
55
P A P X
P X P X
dx
170
例 17.设顾客在某银行窗口等待服务的时间 X (单位:
分 )服从参数为 1/5的指数分布,若等待时间超过 10分钟,则他就离开,设他一个月内要来银行 5次,以 Y
表示一个月内他没有等到服务而离开窗口的次数,
求 Y的分布列及 P(Y≥ 1)?
解 由题意 Y~B(5,p),其中
5
10
25
1
( 1 0 )
5
10
x
x
p P X e d x
ee
171
于是 Y的分布为
2 2 5
5( ) ( ) ( 1 )
0,1,2,3,4,5
k k kP Y k C e e
k
而
25
( 1 ) 1 ( 0 )
1 ( 1 ) 0,5 1 6 7
P Y P Y
e?
172
例 18,设 一大型设备在任何长为 t的时间内发生故障的次数 N(t)服从参数为 λ t的泊松分布,
(1)求相继两次故障之间时间间隔 T的概率分布;
(2)求在设备已经无故障工作了 8小时的情形下,再无故障运行 8小时 的概率,
解 (1)设 T的分布函数为 FT(t),则
FT(t)=P(T≤ t)=1?P(T>t)
而事件,T>t”表示两次故障的间隔时间超过 t,也就是说在时间 t内没有发生故障,故 N(t)=0,于是
173
0,1
!0
)(
1
)0)((1
)(1)(
0
tee
t
tNP
tTPtF
tt
T
可见,T的分布函数为
.0,0
,0,1
)(
t
te
tF
t
T
即 T服从参数为 λ 的指数分布,
174
所求 的概率 为
.
)8(
)16(
)8(
)8,16(
)8|16(
8
8
16
e
e
e
TP
TP
TP
TTP
TTP
175
例 21.某地抽样结果表明,考生的外语成绩 (百分制 )
近似服从正态分布,平均成绩 (即参数 μ 之值 )为 72
分,96分以上的占考生总数的 2.3%,试求考生的外语成绩在 60分至 84分之间的概率,
解 由题意有
0,0 2 3 ( 9 6 )
1 ( 9 6 )
9 6 7 2
1 ( )
24
1 ( )
PX
PX
176
2 4 2 4 1 2( ) 0,9 7 7,2,1,
故所求概率为
177
84 72 60 72
( 60 84) ( ) ( )
12 12
( ) ( )
12
2 ( ) 1
2 0.84 13 1
0.6826.
PX
178
例 32,设 随机变量 X的分布函数 F(x)连续,且严格单调增加,求 Y=F(X)的概率密度,
解 设 Y的分布函数为 FY(y),则
当 y<0时,
FY(y)=P(Y≤ y)=P(Φ)=0;
当 y≥ 1时,
FY(y)=P(Y≤ y)=P(S)=1;
而当 0≤ y<1时,
y
yFXP
yXFPyYPyF
Y
))((
))(()()(
1
179
于是 Y的概率密度为
.,0
10,1
)(
其它
y
yf Y