工程中的概率方法
课程笔记 16.901
2003 年春
大卫.达尔莫法
1 概率概念概述
本节的目的是为了快速地回顾概率论中的一些基本概念。
1.1 结论和事件
我们认为试验或行为是可以多次重复进行的。每次重复进行的结果可
记为 ζ . 某事件A 是满足一定条件结果的集合, 一个基本事件仅包括一个
单一的结果。
例 :看检查涡轮喷气发动机动叶片的情形。设涡轮喷气发动机中的动
叶片总数为N ,每次检查结果的记录是因损坏而必须更换的叶片数量,
于是,结果就是一个非负整数集合 {0, 1, 2,...,N }. 假如发动机被更换的叶
片数大于某值,比如 5片,则预示该发动机可能发生了重大的损伤,需要
对其进行更为彻底的检查。在这种情况下, 我们会关注更换叶片数量在{6,
7, 8,...,N }中的事件。但这不是一个基本事件 ,因为它包含了多于一个结
果。当然,我们还会关注没有叶片更 换的情况,而该事件仅包含一个单一
的结果( 即 0),因此是一个基本事件。
1.2 概率的意义
给定某事件A , 事件A 的概率P {A}假定满足如下性质:
null P {A}≥ 0.
null 仅当事件必然发生时, P {A} = 1.
null 给定两个互斥事件A 和 B, 则
{ } { } { }
PA B PA PB+= + .
1.3 随机变量
概率论的效用在于描述随机变量的性质。用最简单的话来说,随机变
量可被定义为一个变量或参数,其值 依赖于实际试验的不同结果。因此随
机变量是一个结果的函数。我们用粗 体字母表示一个随机变量,如: x. 我
们已经知道x 的值依赖于实际发生的结果,即 x = x( ζ ).
例 :我们接着看检查动叶片的例子。随机变量的一个非常简单的例子
是实际检查中更换的叶片数,此时,随机变量就是刚好就是结果本身 ! 特
别有,
N(ζ )= ζ .
好了,让我们试试稍复杂些的。航空公司所关 心的是检修发动机的费用,
不含更换叶片的费用,航空公司仅因进行检查所需的人工工资是C
I
美元
(劳工费),更换一片叶片的费用是 C
B
(包括新叶片和劳工费),而且,
如果更换的叶片数大于5 ,则由于必须进行更为彻底的检查,费用会急剧
上升。我们将这一费用增量表示为 C
D
. 既然检修的费用依赖于检查的结
果(而且结果是随机的),显然检修费用是一个随机变量。
特别有,
, 0 5
()
, 6 .
IB
IB D
CC
C
CC C N
ζζ
ζ
+≤?
=
?
++ ≤≤
?
对于 ,
对于
1.4 概率密度函数 (PDF)
我们常关心参数为实数(即有无穷多个值)的概率。此时,概率密度
函数可用来描述参数处在某区间的概率。特别,当给定随即变量 x ,使
a ≤ x ≤ b 的概率为
{}
()
b
a
P axb fxdx≤≤ =
∫
,
其中f (x) 就是 x 的分布密度函数(PDF ) 。
一个常见的(而且可能是最简单的)分布是均匀分布。对于均匀分
布,我们假定其概率密度在某区域内是常数,在该区域外为零。
均匀分布:
1
,
()
0,
axb
fx
ba
?
≤ ≤
?
=
?
?
?
?
对于
其它。
其他的分布形式在1.9 节中有介绍。
1.5 期望值和平均值
给定PDF, 随即变量的 x 的f (x),则 x 的期望值定义为,
{}
x(Exf
+∞
?∞
≡
∫
)xd
.
x 的期望值也被看作平均值,我们也用符号 m
x
表示。
1.6 方差和标准差
x 的方差定义为
22
()()
xx
xfxdxσμ
+∞
?∞
≡?
∫
值 σ x 就是 x的标准差。方差是x 关于其平均值变化情况的一种测度,平均
值和方差之间一个经常用到的关系式是
{ }
22
x
2
x x
Eσ μ= ?
不妨试着证明一下!
1.7 累积分布函数(CDF)
x的累积分布函数(CDF) 定义为 x ≤x 的概率。特别有,
F (x) ≡ P {x ≤ x } .
由概率的基本假设条件, 可以得出F (-∞ ) = 0 (即x 变成无穷大的概率为零)
且 F (+ ∞ ) = 1 (即x 小于无穷大的概率为 1). x 的 CDF 和 PDF 有如下关
系,
() ()
a
Fa f xdx
?∞
=
∫
于是,我们可以证明,
() () ()
b
a
Fb Fa f xdx?=
∫
进一步,着隐含了
.
dF
f
dx
=
1.8 百分位数值
x 的 u百分位数值是满足下式的最小数 x
u
u = P {x ≤ x
u
} = F (x
u
).
注意,既然u 是一个概率值,其区域为 0 ≤ u ≤ 1.
1.9 常用分布类型
1.9.1 正态分布
正态分布(或高斯分布)为:
()
2
2
/2
1
()
2
xx
x
x
fx e
μ σ
σπ
??
=
我们用通用的记号 (; )xNμ σ= 表示x 是服从均值为m , 标准差为s 的正态分
布的随机变量。
1.9.2 三角分布
这个分布常用于随即变量的最小值( x
min
),最似然值( x
mpp
)和最大值
(x
max
)可以估计出来,但实际的概率密度不清楚的情形。三角分布假设概
率密度在 x
max
达最大值,密度线性地变化到在最小点 x
min
和最似然点 x
mpp
的
处的零值。让我们推导这一情形的PDF.