第三讲 条件概率及其应用
? 条件概率定义
? 条件概率性质
? 全概率公式
? Bayes公式
条件概率的定义
条件概率是概率论中的一个重要概念,同时,我
们将发现它也是用来计算复杂模型中概率的重要
工具。
什么是条件概率?
例:设 1 0 张彩票中只有一张中奖票,10 人同时摸
这 10 张彩票,张三和李四各得一张。记
{A = 张三中奖 } {B = 李四中奖 }
由古典概率模型我们知
P A P B=
1
( ) ( )=
10
显然,如果已知李四中奖,那么张三就没有机会中
奖,也就是说:在事件 B 发生的条件下,事件 A 发生
的概率为 0,记 ( | ) 0P A B =,
现在设李四先刮开彩票,已知李四有没有没中奖的信
息对计算张三中奖的的可能性大小有没有影响?
如果已知李四没中奖,张三中奖的机会有多大?也就
是说:在事件 B 发生的条件下,事件 A 发生的概率为
多少?
1
( | )
9
P A B =
例:掷一颗均匀的骰子,出现 1, 2, 3, 4, 5, 6
点的可能性都一样,因此,每次出现 4 或 6 的可能
性为 1/ 3 。
也就是说
样本空间 { 1,2,3,4,5,6 }W=
事件 { 4 6 }A =,
1
3
PA =()
现在假如有人看了一眼骰子,并告诉你,骰子出现的点
数是偶数,这信息对你的判断或押赌很重要,这时你就
有多少把握断定它是 4 或者 6?
如果记 B ? { 偶数 },已知 B 发生,那么你选择的范围就限
于 { 2,4,6 },既然出现 2,4,6 是等可能的,那么出现 { 4,6 } 的
概率为 2 / 3 。 也就是说:在事件 B 发生的条件下,事件 A 发生的概率
是 2/ 3,写
( | ) 2 / 3P A B ?
回忆一下上面的计算过程,
在事件 B 发生的条件下,选择的 范围就限于
{ 2,4,6 }B =,也就是说我们把 { 2,4,6 }B¢W = = 当作
一个缩小了的新的样本空间,其中每个基本结果的出
现是等可能的。这就形成一个新的古典概率模型。这
时再考察事件 A 的概率。
()( | )
()
P A BP A B
PB
=
一般地,在古典概率 模型下,都可以这样做,当然我
们要求 ( ) 0PB > 。对一般的概率空间,我们把它作为
条件概率 的数学定义。
条件概率定义
假设 ( ?,F,P ) 是一个概率空间,A,B 是两个事
件,用 ( | )P A B 表示在事件 B 发生的条件下,A 发
生的概率大小,并定义
()
( | )
()
P A B
P A B
PB
?
当然,在上式中我 们要求 ( ) 0PB ? 。如果
( ) 0PB ?,按定义,人们几乎无法观察到 B 的发
生。
例, 一个家庭有两个孩子。
(1) 已知至少有一个男孩,求两个都是男孩的概率?
(2) 已知年纪小的是男孩,求两个都是男孩的概率?
解, ( 1 )记
{B = 至少有一个男 孩 }
{A = 两个都是男孩 }
这时
{ G G,B B,B G,G B }??,
每一种等可能发生,即 1/ 4 。而
{,,}B G B B G B B=
{}A B B=
由定义,
| P A BP A B PB= ()() ()
= 1 / 4
3 / 4
= 1
3
,
PA
PB
= ()
()
另解:将 {,,}B G B B G B B= 看作是缩小的一个新的样本空
间 ¢W,仍是一个古典概率模型,这时
|P A B =()
(2 ) 记 {B ¢ = 年纪小的是男孩 }
{A = 两个都是男孩 }
这时 {,}B G B B B¢ =,{}A B B=, 由定义,
| P A BP A B PB ¢¢ = ¢()() ()
= 1 / 4 1
2 / 4 2
=,
PA
PB
= ¢()
()
给定 B ? F 使得 ( ) 0PB ? 。 对任何 A ? F,我们都可以
定义 ( | )P A B 。
也就是说,我们可以在 F 上定义一个函数
( | ), ( | )P B A P A B??
不难按照概率定义验证
|PB ?() 也是 F 的一个新的概率
条件概率的性质
按定义
()
( | )
()
P A B
P A B
PB
?
这样,我们显然有
|P A B P A B P B?( ) ( )( )
这里同样要求 ( ) 0PB > 。
这就是 乘法公式
例, n 件产品中有 m 件废品,任取两件,求它们都是
废品的概率?
2
2
m
n
??
??
??
?
??
??
??
那么
1( ) ( ) ( | )
1
mmP A B P A P B A
nn
???
?
现在记 {A ? 第一件为废品 },{B ? 第二件为废品 },
1 2 1 2 1 1 1 2 2( ) ( | ) ( | )n n n n nP A A A P A A A A P A A A A? ? ?? ? ? ? ? ? ? ? ? ?
2 1 1( | ) ( )P A A P A???
条件概率的链式法则,
例, 假设 n 张彩票中有一张中奖票。
(1) 已知前 1k ? 个人没有摸到中奖票,求第 k 个人摸到中
奖票的概率?
(2) 求第 k 个人摸到中奖票的概率?
1 1 2 1
12
n k n n
n k n k n n
- + - -=
- + - +
gL
( 1 ) 我们要计算的条件概率是
1 2 1|)kkP A A A A - =L(
(2) 我们要计算的是无条件概率 ()
k
PA, 注意到
1 2 1k k k
A A A A A
-
= L,
由链式法则,
1 2 1( ) ( )k k kP A P A A A A-= L
1 2 1 1 1 2 2( | ) ( | )k k k kP A A A A P A A A A- - -= LL
2 1 1( | ) ( )P A A P AL
1 1 2 1
12
n k n n
n k n k n n
- + - -=
- + - +gL
1
n=
再回忆一下条件概率的定义,
()
( | )
()
P AB
P A B
PB
?
要求 ( ) 0PB ?,
如果 ( ) 0PB ?,数学上条件概率没有定义,用概率的
语言说,B 几乎不会发生,因此我们无法使用该信
息。
全概率的公式
我们再看另一个极端情形,( ) 1PB ? 。这时
()( | )
()
P A BP A B
PB
?
( ) ( ) ( )P A B P A P A B? ? ?
( ) 0P A P A? ? ? ( )
在事件 B 发生的条件下,A 发生的条件概率与
A 的无条件概率相等。 换句话说,如果
( ) 1PB ?,那么 B 几乎一定会发生,或者说该
信息是众所周知的,对我们 考察 另一事件 A 发
生的可能性大小也不会有何帮助。
能影响我们关于事件 A 的判断的 B 应该是那些
0 ( ) 1PB?? 。 这时,当然 0 ( ) 1PB?? 。 由乘法
公式,
( ) ( | ) ( )P A B P A B P B?
( ) ( | ) ( )P A B P A B P B?
注意到
BB? ? ?
A A A B A B? ? ? ?
( ) ( ) ( )P A P A B P A B??
( | ) ( ) ( | ) ( )P A B P B P A B P B??
这样,由概率的可加性
这给我们提供了一个计算概率的方法。我们把样
本空间 ? 分解成 BB ?,概率 ()PA 同样分解成两
部分分别计算,再求其和。
一般地,假设
1
,,,
n
BB ??? 是互不相容的事件,
1
i
i
B
?
?
???,且 ( ) 0
i
PB ?, ( 这样的事件列,在数
学上称为样本空间的划分,这里叫做 完备事件
组 ) 。 对任一事件 A,同样我们有
( ) ( | ) ( ),i i iP A B P A B P B? 1,2,i ?
因此
1
( ) ( | ) ( )ii
i
P A P A B P B
?
?
? ?
全概率公式
利用全概率公式计算事件 A 的概率时,
i
B 应该
是整个基本结果的分类,而 ()
i
PB 比较容易计
算;在给定
i
B 时,A 是否发生,在什么条件下
会发生也比较清楚。
例, 现有两个罐子 I 和 II,其中罐子 I 装有 2 个白
球和 3 个蓝球,罐子 II 装有 3 个白球和 4 个蓝
球,从罐子 I 中随机抽一个球放入罐子 II,接着从
罐子 II 中随机抽一个球,求抽中的是蓝球的概
率?
解, 记 {A ? 从罐子 I I 中抽中的是蓝球 },我们要计
算 ()PA 。
令 B 表示第一次从罐子 I 中抽中的是蓝球,
容易看出 ( ) 3 / 5PB ?, ( ) 2 / 5PB ? 。
另外,
( | ) 5 / 8,( | ) 1 / 2 P A B P A B??
因此
( ) ( | ) ( ) ( | ) ( )P A P A B P B P A B P B??
5 3 1 2 23
8 5 2 5 40? ? ? ? ?
例, 播种用的小麦种子中一、二、三、四等种子
的占有率分别为 9 5,5 %,2 %,1,5 %,1 % 。 已知
一、二、三、四等种子长出的穗含 50 颗以上麦
粒的概率分别为 0,5,0,1 5,0,1 0,0,0 5 。 现任选一
颗种子,求它长出 50 颗以上麦粒的概率?
解, 记 {A ? 选的种子长出 50 颗以上麦粒 },
如果已知选中的是第几号种子,那么就知道
这一概率。
故记
{iB ? 选的种子是第 i 号种子 } 。
由全概率公式,
4
1
( ) ( | ) ( )ii
i
P A P A B P B
?
? ?
0, 5 9 5, 5 % 0, 1 5 2 %? ? ? ?
0, 1 0 1, 5 % 0, 0 5 1 %? ? ? ?
=
例, 甲、乙两家工厂生产某型号车床,其中次品
率分别为 20 %,5% 。已知每月甲厂生产的数量
是乙厂的两倍,现从一个月的产品中任意抽检
一件,求该件产品为合格的概率?
解,
( ) ( | ) ( ) ( | ) ( )P A P A B P B P A B P B??
Bayes公式
4 2 19 1 51
5 3 20 3 60? ? ? ? ?
进一步考虑下列问题,如果抽检的确实件次品,那么
该件产品究竟是由哪个厂家生产的呢?当然,这同样
是个不确定性问题。另外,显然,甲的可能性要大得
多,因为甲产量多,次品率也高。 实际上
8
P ( B | A ) =
9
以上这类问题在医药领域相当重要,因为人们常常需
要从诊断的结果来寻找真正的原因。
例, 用血清甲蛋白法诊断肝癌。 以 B 表示被检验者确
实患有肝癌,A 表示临床诊断被检验者患有肝癌。
根据先前的经验,
P ( A |C ) = 0,95,
( | ) 0, 9,P A B ?
P ( C ) =0,0004
现若有一病人被此方法诊断为患有肝癌,求此人确
实患有肝癌的概率?
解,
P ( C |A ) = 0, 0 0 3 8
注:此人实际患有肝癌的可能性并不大。如果不用概
率论思想来解释,很难理解此事;如果病人知道一些
概率的话,那么他的担心会更少些。
总结以上内容,我们得到 Ba y es 公式,
1
( | ) ( )
( | )
( | ) ( )
jj
j n
ii
i
P A A P A
P A A
P A A P A
?
?
?
1,n 件产品中有 m 件废品,任取两件,求,
(1) 所取产品中至少有一件是废品的条件下,另一件
也是废品的概率;
(2) 所取产品中至少有一件不是废品的条件下,另一
件是废品的概率, ( Page 41,33 题 )
课后练习
2,某厂有甲、乙、丙三台机器生产螺丝钉,产量各占
25 %,35 %,40 %; 在各自的产品里,不合格品各占
5 %,4 %,2 %,
(1) 从产品中任取一只,求它恰是不合格品的概率,
(2) 若任取一只恰是不合格品,求它是机器甲生产的
概率
( Page 41,34 题 )
? 条件概率定义
? 条件概率性质
? 全概率公式
? Bayes公式
条件概率的定义
条件概率是概率论中的一个重要概念,同时,我
们将发现它也是用来计算复杂模型中概率的重要
工具。
什么是条件概率?
例:设 1 0 张彩票中只有一张中奖票,10 人同时摸
这 10 张彩票,张三和李四各得一张。记
{A = 张三中奖 } {B = 李四中奖 }
由古典概率模型我们知
P A P B=
1
( ) ( )=
10
显然,如果已知李四中奖,那么张三就没有机会中
奖,也就是说:在事件 B 发生的条件下,事件 A 发生
的概率为 0,记 ( | ) 0P A B =,
现在设李四先刮开彩票,已知李四有没有没中奖的信
息对计算张三中奖的的可能性大小有没有影响?
如果已知李四没中奖,张三中奖的机会有多大?也就
是说:在事件 B 发生的条件下,事件 A 发生的概率为
多少?
1
( | )
9
P A B =
例:掷一颗均匀的骰子,出现 1, 2, 3, 4, 5, 6
点的可能性都一样,因此,每次出现 4 或 6 的可能
性为 1/ 3 。
也就是说
样本空间 { 1,2,3,4,5,6 }W=
事件 { 4 6 }A =,
1
3
PA =()
现在假如有人看了一眼骰子,并告诉你,骰子出现的点
数是偶数,这信息对你的判断或押赌很重要,这时你就
有多少把握断定它是 4 或者 6?
如果记 B ? { 偶数 },已知 B 发生,那么你选择的范围就限
于 { 2,4,6 },既然出现 2,4,6 是等可能的,那么出现 { 4,6 } 的
概率为 2 / 3 。 也就是说:在事件 B 发生的条件下,事件 A 发生的概率
是 2/ 3,写
( | ) 2 / 3P A B ?
回忆一下上面的计算过程,
在事件 B 发生的条件下,选择的 范围就限于
{ 2,4,6 }B =,也就是说我们把 { 2,4,6 }B¢W = = 当作
一个缩小了的新的样本空间,其中每个基本结果的出
现是等可能的。这就形成一个新的古典概率模型。这
时再考察事件 A 的概率。
()( | )
()
P A BP A B
PB
=
一般地,在古典概率 模型下,都可以这样做,当然我
们要求 ( ) 0PB > 。对一般的概率空间,我们把它作为
条件概率 的数学定义。
条件概率定义
假设 ( ?,F,P ) 是一个概率空间,A,B 是两个事
件,用 ( | )P A B 表示在事件 B 发生的条件下,A 发
生的概率大小,并定义
()
( | )
()
P A B
P A B
PB
?
当然,在上式中我 们要求 ( ) 0PB ? 。如果
( ) 0PB ?,按定义,人们几乎无法观察到 B 的发
生。
例, 一个家庭有两个孩子。
(1) 已知至少有一个男孩,求两个都是男孩的概率?
(2) 已知年纪小的是男孩,求两个都是男孩的概率?
解, ( 1 )记
{B = 至少有一个男 孩 }
{A = 两个都是男孩 }
这时
{ G G,B B,B G,G B }??,
每一种等可能发生,即 1/ 4 。而
{,,}B G B B G B B=
{}A B B=
由定义,
| P A BP A B PB= ()() ()
= 1 / 4
3 / 4
= 1
3
,
PA
PB
= ()
()
另解:将 {,,}B G B B G B B= 看作是缩小的一个新的样本空
间 ¢W,仍是一个古典概率模型,这时
|P A B =()
(2 ) 记 {B ¢ = 年纪小的是男孩 }
{A = 两个都是男孩 }
这时 {,}B G B B B¢ =,{}A B B=, 由定义,
| P A BP A B PB ¢¢ = ¢()() ()
= 1 / 4 1
2 / 4 2
=,
PA
PB
= ¢()
()
给定 B ? F 使得 ( ) 0PB ? 。 对任何 A ? F,我们都可以
定义 ( | )P A B 。
也就是说,我们可以在 F 上定义一个函数
( | ), ( | )P B A P A B??
不难按照概率定义验证
|PB ?() 也是 F 的一个新的概率
条件概率的性质
按定义
()
( | )
()
P A B
P A B
PB
?
这样,我们显然有
|P A B P A B P B?( ) ( )( )
这里同样要求 ( ) 0PB > 。
这就是 乘法公式
例, n 件产品中有 m 件废品,任取两件,求它们都是
废品的概率?
2
2
m
n
??
??
??
?
??
??
??
那么
1( ) ( ) ( | )
1
mmP A B P A P B A
nn
???
?
现在记 {A ? 第一件为废品 },{B ? 第二件为废品 },
1 2 1 2 1 1 1 2 2( ) ( | ) ( | )n n n n nP A A A P A A A A P A A A A? ? ?? ? ? ? ? ? ? ? ? ?
2 1 1( | ) ( )P A A P A???
条件概率的链式法则,
例, 假设 n 张彩票中有一张中奖票。
(1) 已知前 1k ? 个人没有摸到中奖票,求第 k 个人摸到中
奖票的概率?
(2) 求第 k 个人摸到中奖票的概率?
1 1 2 1
12
n k n n
n k n k n n
- + - -=
- + - +
gL
( 1 ) 我们要计算的条件概率是
1 2 1|)kkP A A A A - =L(
(2) 我们要计算的是无条件概率 ()
k
PA, 注意到
1 2 1k k k
A A A A A
-
= L,
由链式法则,
1 2 1( ) ( )k k kP A P A A A A-= L
1 2 1 1 1 2 2( | ) ( | )k k k kP A A A A P A A A A- - -= LL
2 1 1( | ) ( )P A A P AL
1 1 2 1
12
n k n n
n k n k n n
- + - -=
- + - +gL
1
n=
再回忆一下条件概率的定义,
()
( | )
()
P AB
P A B
PB
?
要求 ( ) 0PB ?,
如果 ( ) 0PB ?,数学上条件概率没有定义,用概率的
语言说,B 几乎不会发生,因此我们无法使用该信
息。
全概率的公式
我们再看另一个极端情形,( ) 1PB ? 。这时
()( | )
()
P A BP A B
PB
?
( ) ( ) ( )P A B P A P A B? ? ?
( ) 0P A P A? ? ? ( )
在事件 B 发生的条件下,A 发生的条件概率与
A 的无条件概率相等。 换句话说,如果
( ) 1PB ?,那么 B 几乎一定会发生,或者说该
信息是众所周知的,对我们 考察 另一事件 A 发
生的可能性大小也不会有何帮助。
能影响我们关于事件 A 的判断的 B 应该是那些
0 ( ) 1PB?? 。 这时,当然 0 ( ) 1PB?? 。 由乘法
公式,
( ) ( | ) ( )P A B P A B P B?
( ) ( | ) ( )P A B P A B P B?
注意到
BB? ? ?
A A A B A B? ? ? ?
( ) ( ) ( )P A P A B P A B??
( | ) ( ) ( | ) ( )P A B P B P A B P B??
这样,由概率的可加性
这给我们提供了一个计算概率的方法。我们把样
本空间 ? 分解成 BB ?,概率 ()PA 同样分解成两
部分分别计算,再求其和。
一般地,假设
1
,,,
n
BB ??? 是互不相容的事件,
1
i
i
B
?
?
???,且 ( ) 0
i
PB ?, ( 这样的事件列,在数
学上称为样本空间的划分,这里叫做 完备事件
组 ) 。 对任一事件 A,同样我们有
( ) ( | ) ( ),i i iP A B P A B P B? 1,2,i ?
因此
1
( ) ( | ) ( )ii
i
P A P A B P B
?
?
? ?
全概率公式
利用全概率公式计算事件 A 的概率时,
i
B 应该
是整个基本结果的分类,而 ()
i
PB 比较容易计
算;在给定
i
B 时,A 是否发生,在什么条件下
会发生也比较清楚。
例, 现有两个罐子 I 和 II,其中罐子 I 装有 2 个白
球和 3 个蓝球,罐子 II 装有 3 个白球和 4 个蓝
球,从罐子 I 中随机抽一个球放入罐子 II,接着从
罐子 II 中随机抽一个球,求抽中的是蓝球的概
率?
解, 记 {A ? 从罐子 I I 中抽中的是蓝球 },我们要计
算 ()PA 。
令 B 表示第一次从罐子 I 中抽中的是蓝球,
容易看出 ( ) 3 / 5PB ?, ( ) 2 / 5PB ? 。
另外,
( | ) 5 / 8,( | ) 1 / 2 P A B P A B??
因此
( ) ( | ) ( ) ( | ) ( )P A P A B P B P A B P B??
5 3 1 2 23
8 5 2 5 40? ? ? ? ?
例, 播种用的小麦种子中一、二、三、四等种子
的占有率分别为 9 5,5 %,2 %,1,5 %,1 % 。 已知
一、二、三、四等种子长出的穗含 50 颗以上麦
粒的概率分别为 0,5,0,1 5,0,1 0,0,0 5 。 现任选一
颗种子,求它长出 50 颗以上麦粒的概率?
解, 记 {A ? 选的种子长出 50 颗以上麦粒 },
如果已知选中的是第几号种子,那么就知道
这一概率。
故记
{iB ? 选的种子是第 i 号种子 } 。
由全概率公式,
4
1
( ) ( | ) ( )ii
i
P A P A B P B
?
? ?
0, 5 9 5, 5 % 0, 1 5 2 %? ? ? ?
0, 1 0 1, 5 % 0, 0 5 1 %? ? ? ?
=
例, 甲、乙两家工厂生产某型号车床,其中次品
率分别为 20 %,5% 。已知每月甲厂生产的数量
是乙厂的两倍,现从一个月的产品中任意抽检
一件,求该件产品为合格的概率?
解,
( ) ( | ) ( ) ( | ) ( )P A P A B P B P A B P B??
Bayes公式
4 2 19 1 51
5 3 20 3 60? ? ? ? ?
进一步考虑下列问题,如果抽检的确实件次品,那么
该件产品究竟是由哪个厂家生产的呢?当然,这同样
是个不确定性问题。另外,显然,甲的可能性要大得
多,因为甲产量多,次品率也高。 实际上
8
P ( B | A ) =
9
以上这类问题在医药领域相当重要,因为人们常常需
要从诊断的结果来寻找真正的原因。
例, 用血清甲蛋白法诊断肝癌。 以 B 表示被检验者确
实患有肝癌,A 表示临床诊断被检验者患有肝癌。
根据先前的经验,
P ( A |C ) = 0,95,
( | ) 0, 9,P A B ?
P ( C ) =0,0004
现若有一病人被此方法诊断为患有肝癌,求此人确
实患有肝癌的概率?
解,
P ( C |A ) = 0, 0 0 3 8
注:此人实际患有肝癌的可能性并不大。如果不用概
率论思想来解释,很难理解此事;如果病人知道一些
概率的话,那么他的担心会更少些。
总结以上内容,我们得到 Ba y es 公式,
1
( | ) ( )
( | )
( | ) ( )
jj
j n
ii
i
P A A P A
P A A
P A A P A
?
?
?
1,n 件产品中有 m 件废品,任取两件,求,
(1) 所取产品中至少有一件是废品的条件下,另一件
也是废品的概率;
(2) 所取产品中至少有一件不是废品的条件下,另一
件是废品的概率, ( Page 41,33 题 )
课后练习
2,某厂有甲、乙、丙三台机器生产螺丝钉,产量各占
25 %,35 %,40 %; 在各自的产品里,不合格品各占
5 %,4 %,2 %,
(1) 从产品中任取一只,求它恰是不合格品的概率,
(2) 若任取一只恰是不合格品,求它是机器甲生产的
概率
( Page 41,34 题 )