第二章 随机变量及其分布
随机变量的概念
随机变量的分布函数
离散型随机变量
连续型随机变量
一维随机变量函数的分布
§ 1 随机变量例:从装有8个白球、4个黑球与2个黄球的箱中随机取出两球,每取出一个黑球得2分,白球扣1分,黄球不得分也不扣分。 以X表示得分数,
则事件{取出两个白球}与{X=-2}等价。
故P{取出两个白球}=P{X=-2}=4/13。
2白1白1黄2黄1白1黑1黄1黑2黑
X= -2 X= -1 X= 0 X= 1 X= 2 X= 4
X是一个变量,它随试验的不同结果而取不同的值。
随机变量的概念定义(p38),设S={e}是试验的样本空间。X是定义在S上的一个单值实值函数,即对于每一个e ∈S,有一实数X=X(e)与之对应,则称X为 随机变量 随机变量常用X、Y、Z 或 ξ
,η,ζ等表示。
随机变量的取值随试验结果而定,X取各个值也有一定的概率。
在随机试验中引入适当的随机变量,可以用来描述试验中的事件。也可以更方便更简洁地求概率。
2白1白1黄2黄1白1黑1黄1黑2黑
X= -2 X= -1 X= 0 X= 1 X= 2 X= 4
P{至少取到一个黑球 } = P{X≥1}
=P{X=1}+P{X=2}+P{X=4}
 =46/91。
EX.如何用随机变量表示下列随机事件?
①将3个球随机地放入三个格子中事件A={有1个空格},B={有2个空格},C={全有球}。
②进行5次试验,事件D={试验成功一次},
F={试验至少成功一次},G={至多成功3次}
解,1。 X:空格数
A,X=1,B,X=2,C,X=0。
2。 X,5次试验中成功的次数。
D,X=1,F,X≥ 1,G,X≤ 3。
随机变量与普通函数不同。
随机变量取各个值有一定的概率。普通函数则不然。
随机变量定义在样本空间上,即随机变量的
“定义域”可以不是实数值,而普通函数的定义域是实数集或它的子集。
奇异型(混合型)
连续型非离散型离散型随机变量随机变量的分类,
随机变量
§ 2 离散型随机变量及其分布律定义 若随机变量 X取值 x
1
,x
2
,…,x
n
,… 且取这些值的概率依次为 p
1
,p
2
,…,p
n
,…,则称 X为离散型随机变量,而称
P{X=x
k
}=p
k
,(k=1,2,… )
为 X的 分布律 或概率分布。可表为
X~ P{X=x
k
}=p
k
,(k=1,2,… ),或
Xx
1
x
2
… x
K

P
k
p
1
p
2
… p
k

~X
2,分布律的性质
(1) p
k
≥ 0,k= 1,2,… ;
(2)

≥1
.1
k
k
p=
.}{
3
5
3
32
C
CC
kXP
kk?
==
例 1,设袋中有 5只球,其中有 2只白 3只黑。现从中任取 3只球 (不放回 ),求抽得的白球数
X的分布律。
解,k可取值 0,1,2
X0 1 2
P
k
0.1 0.6 0.3
例2,某射手对目标独立射击5次,每次命中目标的概率为p,以X表示命中目标的次数,求X的分布律。
解:设A
i:
第i次射击时命中目标,i=1,2,3,4,5。
则A
1
,A
2,
…A
5,
相互独立且P(A
i
)=p,i=1,…5,
X可能的取值:S
X
={0,1,2,3,4,5},
(1-p)
5
=== )(}0{
54321
AAAAAPXP
...{}1{
543
2
15432
1
UU AAAAAAAAAAPXP ==
4
)1(5 pp?=
322
5
)1( PP?===,..{}2{
54
3
2
1
543
21
UU AAAAAAAAAAPXP C
5,...,1,0)1(}{
5
5
=?==
kppCkXP
kkk
·几个常用的离散型分布
(一)贝努里(Bernoulli)概型与二项分布
1,(0-1)分布 (p41)
设随机变量 X值可能取 0与 1两个值,它的分布律是,X~ P{X= k}= p
k
(1- p)
1- k
,(0<p<1) k= 0,1

X
k
p
1
0
p
p?1
则称 X服从 (0- 1)分布 (两点分布 )
X表示进行一次试验,事件 A发生的次数。
2,伯努利试验、二项分布定义 设将试验E独立地重复地进行 n次,每次试验中,事件 A发生的概率均为 p,则称这 n次试验为 n重贝努里试验,(p41-42)
重复:每次试验中P(A)= p 保持不变。
独立:各次试验的结果互不影响。参见P42(2.5)式。
随机变量X,n重贝努里试验中,事件A发生的次数
n,试验的总次数,P(X=k)= P{A发生k次}
),...,1,0(,)1(}{ nkppkXP
knk
k
n
C
=?==
若以X表示n重贝努里试验中,事件A发生的次数,
则称X服从参数为n,p的二项分布.
记作 X~ b(n,p).
分布律为:
例,从某大学到火车站途中有6个交通岗,假设在各个交通岗是否遇到红灯相互独立,并且遇到红灯的概率都是
1/3.
(1)设X为汽车行驶途中遇到的红灯数,求X的分布律.
(2)求汽车行驶途中至少遇到5次红灯的概率,
P40例 1。
解:(1)由题意,X ~ B(6,1/3),于是,X的分布律为:
6,...,1,0
3
2
3
1
}{
6
6
=
==
kCkXP
kk
k
}6{}5{}5{)2( =+==≥ XPXPXP
729
13
3
1
3
2
3
1
65
5
6
=
+
=C
例,某人射击的命中率为 0.02,他独立射击 400
次,试求其命中次数不少于 2的概率。
解,设X表示400次独立射击中命中的次数,
则X~B(400,0.02),故
P{X≥2}=1-P{X=0}-P{X=1}
=1-0.98
400

(400)(0.02)(0.98
399
)=0.9972
注1:对小概率事件的讨论 P45
注2:p43 例2。
注3:严格地讲,放回式抽样与不放回式抽样是不同的。
注4:当n=1时,b(1,p)即为0-1分布。
(二 ) 泊松 (Poisson)分布 π( λ)或 P(λ)(p46)
设随机变量X所有可能取得值为0,1,2,…,而取各个值的概率为
P{X= k}=,k= 0,1,2,…
λ>0是常数,则称 X服从参数为 λ的泊松分布。记为 X~π( λ)
λ?
λ
e
!k
k
例.设某国每对夫妇的子女数X服从参数为 λ的泊松分布,且知一对夫妇有不超过1个孩子的概率为3e
-2
.求任选一对夫妇,至少有3个孩子的概率。
解:由题意,
( )
2
3}1{}0{1),(~
==+==≤ eXPXPXPX λπQ
23
2
=?=+

λλ
λλ
eee
}2{}1{}0{1}3{ =?=?=?=≥ XPXPXPXP
323.051
!2
2
!1
2
1
22
2
2
1
2
≈?==

eeee
例6,进行独立重复试验,每次成功的概率为p,
令 X表示直到出现第m次成功为止所进行的试验次数,
求X的分布律。
解:m=1时,
,...2,1,)1(}{
1
=?==
kppkXP
k
m>1时,X的可能取值为:m,m+1,m+2,…
m
pmXP == }{
P{X=m+1}=P{第m+1次试验时成功并且 在前m次试验中成功了m-1次 }
pppC
mm
m
)1(
11
=

,...2,1,)1(}{
11
1
++=?==∴

mmmkpppCkXP
mkmm
k
考题,P150,一 /3。
§3 随机变量的分布函数一、分布函数的概念.
定义 (P47),设 X是随机变量,对任意实数 x,事件
{X≤x}的概率 P{X≤x}称为随机变量 X的 分布函数 。记为 F(x),即
F(x)= P {X≤x}.
易知,对任意实数 a,b (a<b),
P {a<X≤b}= P{X≤b}- P{X≤a}= F(b)- F(a).
x
X
二、分布函数的性质(P48)
1,单调不减性:若 x
1
<x
2
,则 F(x
1
)≤F(x
2
);
2、归一 性,对任意实数 x,0≤F(x)≤1,且;1)x(Flim)(F,0)x(Flim)(F
xx
==+∞==?∞
+∞→?∞→
).x(F)x(Flim)0x(F
0
xx
0
0
==+
+

3,右连续性:对任意实数 x,
分布函数是个普通函数 。
反之,具有上述三个性质的实函数,必是某个随机变量的分布函数。故该三个性质是分布函数的充分必要性质 。
一般地,对离散型随机变量
X~ P{X= x
k
}= p
k
,k= 1,2,…
其分布函数为


=≤=
xxk
k
k
pxXPxF
:
}{)(
例,设随机变量 X具分布律如右表
0.30.60.1P
210X

}{)( xXPxF ≤=
试求出 X的分布函数 。

<≤
<≤
<
2,1
21,7.0
10,1.0
1,0
x
x
x
x

)(xF
x0
1
1 2
例,在一个均匀陀螺的原走上均匀刻上 [0,1)的诸值。
旋转这个陀螺,求它停下时其圆周上触及桌面的点的刻度 X的分布函数。
解,F(x)=P{X≤ x}
>
≤≤
<
≤∴
1,1
10,
0,0
)()(
x
xx
x
xXPxF==
)(xF
x
10
1
当 x<0时,F(x)=0;当 x>1时,F(x)=1。
当 0≤ x≤ 1时,F(x)=x.
x=0.3,F(0.3)=P{x≤ 0.3}=0.3/1=0.3
x=0.8,F(0.8)=P{x≤ 0.8}=0.8/1=0.8
如果区间改为 [0,3],F(x)将如何改变?
x=0.3,F(0.3)=P{x≤ 0.3}=0.3/3=0.1
x=2.5,F(2.5)=P{x≤ 2.5}=2.5/3
>
≤≤
<
≤∴
3,1
30,
3
1
0,0
)()(
x
xx
x
xXPxF==
F(x)的形状没有改变,斜线部分的斜率变了。
而斜率与 F(x) 的导数有关。
F(x)的导数反映了非离散型随机变量的某些特征。
例,p50,例 2。
§4 连续型随机变量及其概率密度一、概率密度
1,定义 (p51),对于随机变量 X,若存在非负函数 f(x),使对任意实数 x,都有

∞?

x
duufxXPxF )()()(==
则称 X为连续型随机变量,f(x)为 X的 概率密度函数,简称概率密度或密度函数,常记为
X~ f(x),(-∞<x<+∞)
2,密度函数的性质
(1) 非负性 f(x)≥0,(-∞<x<∞);
(2) 归一性
.1)(=

+∞
∞?
dxxf
性质 (1),(2)是密度函数的充要性质。
设随机变量X的概率密度为答:
x
aexf
=)(
2
1
=a
求常数a.
(3),对于任意实数 a、b,(a<b)

≤<
b
a
dxxf
aFbFbXaP
)(
)()(}{


X落在区间(a,b]的概率等于区间(a,b]上曲线
y=f(x)之下的曲边梯形的面积。

≤<
b
a
du)u(f)bXa(P=
(4) 若 x是 f(x)的连续点,则
)(
)(
xf
dx
xdF
=
设随机变量X的分布函数为如下F(x),
求 f(x)
≥?
<
=
0
2
1
1
0
2
1
)(
xe
xe
xF
x
x
注意:对于连续性随机变量X来说,
对任意实数a,P{X=a}=0 。

≤≤
<≤<<
b
a
dxxfbXaP
bXaPbXaP
)(}{
}{}{
==

{X=a}不是不可能事件,但P{X=a}=0。

≤<
=≤<
bxa
k
k
pbXaP }{

=≤<
b
a
dxxfbXaP )(}{
ab
}{
}{
}{
=≤≤
=<<
=<≤
bXaP
bXaP
bXaP
}{ =≤< bXaP
例,随机变量X的概率密度如下,
1)求X的分布函数F(x),
2)求P{X ∈(0.5,1.5)}
<≤?
<≤
=
其他0
212
10
)( xx
xx
xf
1)5.02()45.04(5.0
0)2(0)(2
15.02)5.02()5.02(5.0
)2(0)(21
5.00)(10
00)(0
)()(
2
2
1
1
0
0
22
1
1
0
0
2
0
0
=×?+=
+?++=>
=+=
++=≤<
=+=≤<
==≤
=
∫∫∫∫
∫∫∫
∫∫


∞?
∞?
∞?
∞?
∞?
x
x
x
x
x
dxdxxxdxdxxFx
xxxx
dxxxdxdxxFx
xxdxdxxFx
dxxFx
dxxfxF
时,
时,
时,
时,
解:
>
≤<
≤<


=
2
21
10
0
,1
,15.02
,5.0
,0
)(
2
2
x
x
x
x
xx
x
xF
二、几个常用的连续型分布
1,均匀分布 ( p54)
若 X~ f(x)=
<<
,其它0
bxa,
ab
1
。。
0
a
b
)x(f
x
则称 X在 (a,b)内服从均匀分布。记作 X~U(a,b)
对任意实数 c,d (a<c<d<b),都有
ab
cd
dx
ab
dxxfdXcP
d
c
d
c
<<
∫∫
===
1
)(}{
设 X~U(a,b),X具有下述意义的等可能性:
它落在区间 (a,b)中等长度的子区间内的可能性是相同的。
它落在子区间内的概率只依赖于子区间的长度,
而与子区间的位置无关。
例.长途汽车起点站于每时的10分、25分、55分发车,
设乘客不知发车时间,于每小时的任意时刻随机地到达车站,求乘客候车时间超过10分钟的概率。
15
45
解:设A —乘客候车时间超过10分钟
X—乘客于某时X分钟到达,则X ~U(0,60)
}6055{}4525(}1510{)( ≤<+≤<+≤<= XPXPXPAP
2
1
60
5205
=
++
=
)x(f
2,指数分布 (p55)
若 X~

>
0,0
0,
1
)(
/
x
xe
xf
x θ
θ

x
0
则称 X服从参数为 θ>0的指数分布。
其分布函数为

>?
0,0
0,1
)(
/
x
xe
xF
x θ

例,电子元件的寿命X(年)服从参数为1/3的指数分布
(1)求该电子元件寿命超过2年的概率。
(2)已知该电子元件已使用了1.5年,求它还能使用两年的概率为多少?


>
=
,00
03
)(
3
x
xe
xf
x
,.3}2{)1(
6
2
3?


==> edxeXp
x
6
5.1
3
5.3
3
3
3
}5.1{
}5.1,5.3{
}5.1|5.3{)2(


==
>
>>
=>>


e
dxe
dxe
X
XXp
XXp
x
x
指数分布的无记忆性--p56
*例,某公路桥每天第一辆汽车过桥时刻为T,设 [0,t]时段内过桥的汽车数 X
t
服从参数为 λt的泊松分布,
求T的概率密度。
(大致了解泊松分布与指数分布之间的关系)

}{)( tTPtF ≤=
0)( =tF
}{)( tTPtF
当t≤0时,
≤=
}{1 tTP >?=
当t>0时,
=1-P{在 t时刻之前无汽车过桥 }
}0{1 =?=
t
XP
t
e
λ?
=1

>
==
00
0
)(')(
t
te
tFtf

λ
于是
3,正态分布正态分布是实践中应用最为广泛,在理论上研究最多的分布之一,故它在概率统计中占有特别重要的地位。
+∞<<?∞=
xexfX
x
,
2
1
)(~
2
2
2
)(
σ
μ
σπ
若 随机变量其中 μ为实数,σ>0,则称 X服从参数为 μ,σ
2
的正态分布,记为 N(μ,σ
2
),可表为 X~ N(μ,σ
2
).
正态分布有两个特性,
(1) 单峰对称密度曲线关于直线 x=μ对称 ;
f(μ)= maxf(x)=,
σπ2
1
μ
(2) σ的大小直接影响概率的分布
σ越大,曲线越平坦,
σ越小,曲线越陡峻,。
正态分布也称为高斯 (Gauss)分布
μ
4.标准正态分布参数 μ= 0,σ
2
= 1的正态分布称为标准正态分布,记作 X~N(0,1)。
其 密度函数 表示为
.,
2
1
)(
2
2
+∞<<?∞=
xex
x
π
分布函数表示为
+∞<<?∞=
≤=Φ

∞?
xdte
xXPx
x
t
,
}{)(
2
2
1
2
π
已知 X~N(0,1),求各个概率值
1,P{X<a}= Φ(a)。 a>0,直接查正态分布表
a<0,Φ(a)= 1- Φ(- a);
2,P{a<X<b}= Φ(b)-Φ(a),P{X>b}=1- Φ(b)。
3,P{|X|<a}=2Φ(a)-1。
例,P{X<0.5} = Φ(0.5) = 0.6915,
P{-1.24<X<2.43} =Φ(2.43)-Φ(-1.24)
=0.9925-(1-0.8925)=0.885
P{|X|<1.54} = 2 Φ(1.54)--1=0.8764
例:求 z,使P{X>z}=0.05.
解:P{X>z}=0.05,即 P{X<z}=0.95,z=0.165
分位点 (p61)
设 X ~ N(0,1),若对
α(0<α<1),存在z
α,
满足
P{X>z
α
}=α,
则称z
α
为标准正态分布的上 α
分位点。
z
α
α
αα
zz?=
1
一般正态分布与标准正态分布
1,引理(p59):若X~N( μ,σ
2
),则Z= ~N(0,1)
σ
μ?X
2,若X~N( μ,σ
2
),则它的分布函数为
).(}{)(
σ
μ?
Φ=≤=
x
xXPxF
3,若X~N( μ,σ
2
),
)()(}{
σ
μ
σ
μ?
Φ?
Φ=<<
ab
bXaP
p60,例 3
例:设随机变量X~N(-1,2
2
),求P{-2.45<X<2.45}
解:
)
2
)1(45.2
()
2
)1(45.2
(}45.245.2{

Φ?

Φ=<<? XP
7255.017673.09582.0
))725.0(1()725.1()725.0()725.1(
=?+=
ΦΦ=?Φ?Φ=
注:用下式计算是错误的。
P{|X|<2.45}=2Φ((2.45+1)/2)-1=2Φ(1.725)-1
=2*0.9582-1
9973.0}3{
9544.0}2{
6826.0}{
=<?
=<?
=<?
σμ
σμ
σμ
XP
XP
XP
3σ 原则:参见p60.
在实际应用中,通常认为P{|X|≤3}=1,忽略
P{|X|>3}的值.如在质量控制中,常用标准指标值
±3 σ作两条线,当生产过程的指标观察值落在两线之外时发出警报.表明生产出现异常.
例,一种电子元件的使用寿命X(小时)服从正态分布N(100,15
2
),某仪器上装有3个这种元件,三个元件损坏与否是相互独立的.求:使用的最初90小时内无一元件损坏的概率.
解:设Y为使用的最初90小时内损坏的元件数,
Y~B(3,p)
2514.0)67.0()
15
10090
(}90{ =?Φ≈
Φ=<= XPp

4195.0)1(}0{
3
≈?== pYP
思考:最初90小时内至少有一个元件损坏的概率是多少?
§5 随机变量的函数的分布一、离散型随机变量函数的分布律设 X一个随机变量,分布律为
X~ P{X= x
k
}= p
k
,k= 1,2,…
若 y= g(x)是一元单值实函数,则 Y= g(X)也是一个随机变量。求 Y的分布律,
求:Y=X
2
的分布律例:已知
X
-1 0 1
Y
1 0
P
k
3
1
3
1
3
1
P
k
3
1
3
2
一般地

k
xxx
21

k
ppp
21
)()()(
21 k
xgxgxg
X
P
k
Y=g(X)
其中 g(x
k
)有相同的,其对应概率合并。
例,Y=(X-1)
2
X
2101?
4.01.03.02.0
1014
P
k
Y=g(X)
Y
410
P
k
2.07.01.0
其中 g(x
k
)有相同的,其对应概率合并。
二、连续型随机变量函数的密度函数
1、一般方法若X ~f(x),Y=g(X)为随机变量X 的函数,则可先求Y的分布函数
F
Y
(y)=P{Y ≤y}=P{g(X) ≤y}
dy
ydF
yf
Y
Y
)(
)( =
然后再求 Y的密度函数此法也叫,分布函数法,
例,P62,例 2
例,设 X~U(-1,1),求Y=X
2
的分布函数与概率密度。
()
() }{}{
)(
0
112/1
2
2
yXPyYPyF
xxgy
x
xf
Y
X
≤=≤=∴
==
<<?
=
其它
0)( =yF
Y
1)( =yF
Y
当y<0时当y≥1时
ydxF
y
y
Y
==

2
1
<<
==
其它0
10
2
1
)(')(
y
y
yFyf
YY

=≤≤?=
y
y
XY
dxxfyXyPyF )(}{)(
y? y
当y≥0时当0≤y<1时例2.设X的概率密度为f
X
(x),y=g(x)关于x处处可导且是x的严格单减函数,求Y=g(X)的概率密度。
解:Y的分布函数为
F
Y
(y)=P{Y≤ y}=P{g(X)≤ y}
=P{X≥g
-1
(y)}=1-F
X
(g
-1
(y))
∴Y的概率密度为
f
Y
(y) = F′(g
-1
(y)) = - f
X
(g
-1
(y)) g
-1
(y)
dy
d
2、公式法:一般地若X~f
X
(x),y=g(x)是处处 可导,且 g’(x)>0(或
g(x)<0),则 y=g(x)是连续性随机变量,
|)(|)]([)(~)( yhyhfyfXgY
XY

==
其中h(y)为y=g(x)的反函数.
注,1。只有当g(x)是x的单调可导函数时,才可用以上公式推求Y的密度函数。
2 。注意定义域的选择(书上记为 α,β)
例.已知X ~N(μ,σ
2
),求解:
σ
μ?
=
X
Y
的概率密度
σ
μ?
=
X
Y
关于x严格单调,反函数为
μσ += yyh )(

σμσ )(|)(|)]([)( +=

= yfyhyhfyf
XXY
()
22
2
2
2
2
1
2
1
y
y
ee
+
==
ππ
σ
μμσ
上一节 p59的引理例4 设X ~U(0,1),求Y=ax+b的概率密度.(a≠0)
解,Y=ax+b关于x严单,反函数为
a
by
yh
=)(

aa
by
fyhyhfyf
XY
1
)(|)(|)]([)(
=

=

<<
=
others
x
xf
X
0
101
)(

<
<
=
others
a
by
a
yf
Y
0
10
1
)(
小结.
0-1分布
Bn,p)二项分布(
P( )泊松分布离散型——分布律归一性分布函数与分布律的互变概率计算分布函数归一性概率计算单调性正态分布的概率计算U(a,b)均匀分布
N(a,)正态分布
E )指数分布(
连续型——概率密度归一性概率计算分布函数与概率密度的互变随机变量随机变量函数的分布
λ
λ
2
σ
一、填空:
1.设随机变量X服从参数为(2,p)的二项分布,
随机变量Y服从参数(3,p)的二项分布,若
,则 P{Y≥1}=
9
5
}1{ =≥XP
2.设随机变量X服从(0,2)上的均匀分布,则随机变量Y=X
2
在(0,4)内的密度函数为f
Y
(y)=
3.设随机变量 X~N(2,σ
2
),且P(2<X<4)=0.3,
则P(X<0)=
二.从某大学到火车站途中有6个交通岗,假设在各个交通岗是否遇到红灯相互独立,并且遇到红灯的概率都是1/3.以Y表示汽车在第一次停止之前所通过的交通岗数,求Y的分布律.(假定汽车只在遇到红灯或到达火车站时停止)
三、某射手对靶射击,单发命中概率都为0.6,
现他扔一个均匀的骰子,扔出几点就对靶独立射击几发,求他恰好命中两发的概率。
*四,已知随机变量X的概率密度为
<<
=
others
xx
xf
0
12)1(
9
2
)(
求,Y=1-X
2
的概率密度
≤<
<≤?+
=
≤<+?
<≤?++?
<
=
other
y
y
y
y
yf
yy
yyy
y
yF
y
Y
Y
0
10
19
2
03
9
1
19
1
)(
11
1011
9
4
03
9
7
9
1
1
9
2
30
)(
251.01P402.0)3(
4
1
)2(
27
19
)1(
四、
三、。例二、见一、