工程中的概率方法 课程笔记 16.901 2003 年春 大卫.达尔莫法 1 概率概念概述 本节的目的是为了快速地回顾概率论中的一些基本概念。 1.1 结论和事件 我们认为试验或行为是可以多次重复进行的。每次重复进行的结果可 记为 ζ . 某事件A 是满足一定条件结果的集合, 一个基本事件仅包括一个 单一的结果。 例 :看检查涡轮喷气发动机动叶片的情形。设涡轮喷气发动机中的动 叶片总数为N ,每次检查结果的记录是因损坏而必须更换的叶片数量, 于是,结果就是一个非负整数集合 {0, 1, 2,...,N }. 假如发动机被更换的叶 片数大于某值,比如 5片,则预示该发动机可能发生了重大的损伤,需要 对其进行更为彻底的检查。在这种情况下, 我们会关注更换叶片数量在{6, 7, 8,...,N }中的事件。但这不是一个基本事件 ,因为它包含了多于一个结 果。当然,我们还会关注没有叶片更 换的情况,而该事件仅包含一个单一 的结果( 即 0),因此是一个基本事件。 1.2 概率的意义 给定某事件A , 事件A 的概率P {A}假定满足如下性质: null P {A}≥ 0. null 仅当事件必然发生时, P {A} = 1. null 给定两个互斥事件A 和 B, 则 { } { } { } PA B PA PB+= + . 1.3 随机变量 概率论的效用在于描述随机变量的性质。用最简单的话来说,随机变 量可被定义为一个变量或参数,其值 依赖于实际试验的不同结果。因此随 机变量是一个结果的函数。我们用粗 体字母表示一个随机变量,如: x. 我 们已经知道x 的值依赖于实际发生的结果,即 x = x( ζ ). 例 :我们接着看检查动叶片的例子。随机变量的一个非常简单的例子 是实际检查中更换的叶片数,此时,随机变量就是刚好就是结果本身 ! 特 别有, N(ζ )= ζ . 好了,让我们试试稍复杂些的。航空公司所关 心的是检修发动机的费用, 不含更换叶片的费用,航空公司仅因进行检查所需的人工工资是C I 美元 (劳工费),更换一片叶片的费用是 C B (包括新叶片和劳工费),而且, 如果更换的叶片数大于5 ,则由于必须进行更为彻底的检查,费用会急剧 上升。我们将这一费用增量表示为 C D . 既然检修的费用依赖于检查的结 果(而且结果是随机的),显然检修费用是一个随机变量。 特别有, , 0 5 () , 6 . IB IB D CC C CC C N ζζ ζ +≤? = ? ++ ≤≤ ? 对于 , 对于 1.4 概率密度函数 (PDF) 我们常关心参数为实数(即有无穷多个值)的概率。此时,概率密度 函数可用来描述参数处在某区间的概率。特别,当给定随即变量 x ,使 a ≤ x ≤ b 的概率为 {} () b a P axb fxdx≤≤ = ∫ , 其中f (x) 就是 x 的分布密度函数(PDF ) 。 一个常见的(而且可能是最简单的)分布是均匀分布。对于均匀分 布,我们假定其概率密度在某区域内是常数,在该区域外为零。  均匀分布: 1 , () 0, axb fx ba ? ≤ ≤ ? = ? ? ? ? 对于 其它。 其他的分布形式在1.9 节中有介绍。 1.5 期望值和平均值 给定PDF, 随即变量的 x 的f (x),则 x 的期望值定义为, {} x(Exf +∞ ?∞ ≡ ∫ )xd . x 的期望值也被看作平均值,我们也用符号 m x 表示。 1.6 方差和标准差 x 的方差定义为 22 ()() xx xfxdxσμ +∞ ?∞ ≡? ∫ 值 σ x 就是 x的标准差。方差是x 关于其平均值变化情况的一种测度,平均 值和方差之间一个经常用到的关系式是 { } 22 x 2 x x Eσ μ= ? 不妨试着证明一下! 1.7 累积分布函数(CDF) x的累积分布函数(CDF) 定义为 x ≤x 的概率。特别有, F (x) ≡ P {x ≤ x } . 由概率的基本假设条件, 可以得出F (-∞ ) = 0 (即x 变成无穷大的概率为零) 且 F (+ ∞ ) = 1 (即x 小于无穷大的概率为 1). x 的 CDF 和 PDF 有如下关 系, () () a Fa f xdx ?∞ = ∫ 于是,我们可以证明, () () () b a Fb Fa f xdx?= ∫ 进一步,着隐含了 . dF f dx = 1.8 百分位数值 x 的 u百分位数值是满足下式的最小数 x u u = P {x ≤ x u } = F (x u ). 注意,既然u 是一个概率值,其区域为 0 ≤ u ≤ 1. 1.9 常用分布类型 1.9.1 正态分布 正态分布(或高斯分布)为: () 2 2 /2 1 () 2 xx x x fx e μ σ σπ ?? = 我们用通用的记号 (; )xNμ σ= 表示x 是服从均值为m , 标准差为s 的正态分 布的随机变量。 1.9.2 三角分布 这个分布常用于随即变量的最小值( x min ),最似然值( x mpp )和最大值 (x max )可以估计出来,但实际的概率密度不清楚的情形。三角分布假设概 率密度在 x max 达最大值,密度线性地变化到在最小点 x min 和最似然点 x mpp 的 处的零值。让我们推导这一情形的PDF.