5.3 逻辑方法建模欧几里德在不加证明而直接采用基本概念和公理的基础上,运用逻辑推理方法得出了一系列定理、推论,从而建立了完整的欧几理德几何学,
这一辉煌的成果至今仍然是人类宝贵财富,
逻辑推理建模方法是一种重要的建模方法一,合作对策模型从事某一项活动若能多方合作,往往可以获得更大的总收益 (或受到更小的损失 ).合作中应该如何分配收益(或分摊损失)?
合作对策模型基本思想,采用公理化方法,
从问题应当具有的基本属性出发,运用逻辑推理方法导出满足这些基本属性的解,
例 5.3.1 有三个位于一条河流同一侧的城镇,
三城镇的污水必须经过处理才能排入河中,三方商议共建一座污水处理厂,
城 1 城 2 城 3
20公里 38公里污水厂筹建处问题:
( 1)三个城镇怎样 建厂可使总开支最少?
( 2)每一个城镇的费用各分摊多少?
分析,有五种方案可供选择条件,建设污水处理厂的费用有公式:
)(730 712.01 万元QC?管道费用:
)(6.6 51.02 万元LQC?
(1) 三城各建一个处理厂;
(2) 城 1与城 2合建一个厂,城 3单独建一个;
(3) 城 2与城 3合建一个厂,城 1单独建一个;
(4) 城 1与城 3合建一个厂,城 2单独建一个;
(5) 三城合作建一个处理厂;
Q— 污水排放量; L— 管道长度 (公里 ).
三个城镇的污水排放量分别为
Q1=5米 3/秒,Q2=3米 3/秒,Q3=5米 3/秒,
对各个方案进行费用测算,得方案 总投资 城 1投资 城 2投资 城 3投资
( 1) 6200 2300 1600 2300
( 2) 5800?? 2300
( 3) 5950 2300??
( 4) 6230? 1600?
( 5) 5560???
方案 (5):三个城市合作建厂总投资最少,
问题,三个城市如何分摊费用?
经商讨定下几条原则:
1,建厂费用按 3个城市的污水量之比 5:3:5分摊;
2,城 2到城 3的管道费按 5:3由城 1和城 2分摊;
3,城 1到城 2的费用由城 1自行解决,
思考,他们的原则是否有道理?
城 1市长的“可行性论证”,
1,建厂总费用为 730× (5+3+5)0.712 =4530(万元 ),
城 1负担费用为 4530× 5/13≈1742(万元 );
2,城 1至城 2的管道费用为
6.6× 50.51× 20≈300(万元 );
3,城 2至城 3的管道费用为
6.6× ( 5+3) 0.51× 38≈724(万元 )
城 1负担 724× 5/8=425.5(万元 );
城 1总共负担,1742+300+425.5=2467(元 ).
市长的 结论,不能接受这样的合作,
n人合作对策模型
Shapley定理,满足公理 1~ 4 的 Ψ(V) 存在并且唯一,由下式给出:
)1(} ) ]()()[()(?
iTS
i iSVSVSWV?
)2(
!
)!()!1()(
n
SnSSW
Ti 是 I中包含 i的一切子集构成的集族,表示集合 S中的元素个数,
S
续例 1计算城市 1应承担的费用
T1={{1},{1,2},{ 1,3},{1,2,3}},
0 0 0 250V(S- {1})
0 67 0 130W( ) [V(S) - V(S- {1})]
1 2 2 3
1/3 1/6 1/6 1/3W( )
0 490 0 390V(S) - V(S- {1})
0 400 0 640V(S)
{1} {1,2} {1,3} {1,2,3}S
S
S
S
根据公式 (1)
1
} ) ]()()[()(1
TS
iSVSVSWV?
从而城市 1应承担投资额为
2300- 197=2103(万元 ).
= 67+130=197(万元 ),
二,信息模型例 5.3.2 调整气象观察站问题某地区内有 12个气象观察站(位置如图 ),有
10年各观察站的年降水量数据,为了节省开支,
想要适当减少气象站,
问题,减少哪些观察站可以使得到的降水量的 信息量 仍然足够大?
x1
x2
x3 x4x
5
x6 x7
x8
x9
x10
问题,怎样比较信息的大小?
信息的多少能不能度量?
降水量的 信息量 仍然足够大?
1,信息量认识问题的过程:
* 对一个问题毫无了解时,对它的认识是不确定的,
* 在了解过程中,通过获得信息,逐渐消除了不确定性,获得的信息越多,消除的不确定性就越大,
用消除不确定性的多少来度量信息量例 1:到影院寻找一个人,已问到:
(1) 甲告诉两条消息:他不坐在前十排,他也不坐在后十排;
(2)乙告诉一条消息:他坐在第十五排,
问题:甲、乙谁提供的消息信息量更大?
答案,乙的消息总信息量更大,因其不确定性消除得更多。
例 2.若在盛夏预报“明日无雪”,这条消息的信息量为零,因根本不存在不确定性,
美国贝尔实验室的学者香龙( Shannon) 应用概率知识和逻辑方法推出了信息量的计算公式,
他提出信息度量应满足的公理:
公理 1 信息量是该事件发生概率的连续函数;
公理 2 如果 A B,则 A发生的信息量 ≥B发生的信息量;
公理 3 若 A与 B相互独立,则 A与 B同时发生的信息量应为单独获知两事件发生的信息量之和;
公理 4 任何信息的信息量都是有限的,
将事件 A 发生的信息记为 M,概率记为 p,记信息的信息量为 I(M)
定理,满足公理 1~ 4的信息量函数必为
I(M)=- C loga p (1)
其中 C 是任意正整数,对数的底 a可取不为 1的正实数,
注 取 a=2,C=1,信息量的单位称为 比特取 a=10,C=1,信息量的单位称为 迪吉特例 3.某剧院有 1280个座位,32排,每排 40座,现从中找出某人,求以下信息的信息量,
1,A:他在第十排; 2,B,他在第 15座
3,C,他在第十排第 15座,
解 在未知任何信息的条件下,认为他坐在各排的概率是均等的,坐在各座位的概率也相等,
I(MA)= - log2 ( 比特 ),
5321?
I(MB)=- log2 ( 比特 ),
32.5401?
I(MC)=- log2 ( 比特 ),
32.101 2 8 01?
有,I(MC)=I(MA) + I(MB).
满足公理 3,对完全独立的几条信息,其总信息量等于各条信息的信息量总和,
2,平均信息量(熵)
定义,一随机试验有 N个可能结果,出现的概率分别为 p1,p2,…,pN,出现第 i 组结果的信息量为 - log2pi,该试验的不确定性可由这组信息量的平均信息量度量,
)1(l o g
1
2?
N
i
ii ppH
称 H为 熵 (或 负熵 ).
对具有连续分布 p(x) 的随机试验,熵的定义为,
dxxpxppH )(l o g)()( 2
注 1.此定义与物理中的熵仅相差一个负号,2,熵度量试验的不确定程度,熵越大试验的不确定程度越大,
例 4.有三名射手的射击情况如下:
5.05.0
AA
甲,
01.099.0
AA
乙,
3.07.0
AA
丙:
其中 A 表示射击命中目标,哪一个射手的射击情况最不确定?
解 需求三个射击试验的熵,
3 0 1 0.02lg21lg2121lg21甲H
0243.001.0lg01.099.0lg99.0乙H
2653.03.0lg3.07.0lg7.0丙H
其中,取 a=10,甲的熵值最大,乙的最小,
结论?
例 5.若 随机试验的随机变量 X~ N(0,σ2),求试验的熵值,
解 X 的 概率密度为
,,
2
1
)(
2
2
2 Rxexp
x
dxxepH x ]
2
2[ l og
2
1)(
2
2
2/ 22
.2l o g
2
12l o g e
思考 分析熵与随机变量方差的关系重要结论,
1.若试验仅有有限种结果,S1,S2,…,S n,其发生的概率分别为 p1,p2,…,pn,当
p1= p2= …= pn=1/n,
试验具有最大熵,
2,若试验是连续型随机试验,其概率密度 P(x)
在 [ a,b]以外均为零,则均匀分布具有最大熵,
3,对于一般连续型随机试验,在方差一定的前提 下,正态分布具有最大熵,
定理:(最大熵原理) 受到相互独立且均匀而小的随机因素影响的系统,其状态的概率分布将使系统的熵最大,
问题,怎样将熵用于解决气象观察站调整问题?
这一辉煌的成果至今仍然是人类宝贵财富,
逻辑推理建模方法是一种重要的建模方法一,合作对策模型从事某一项活动若能多方合作,往往可以获得更大的总收益 (或受到更小的损失 ).合作中应该如何分配收益(或分摊损失)?
合作对策模型基本思想,采用公理化方法,
从问题应当具有的基本属性出发,运用逻辑推理方法导出满足这些基本属性的解,
例 5.3.1 有三个位于一条河流同一侧的城镇,
三城镇的污水必须经过处理才能排入河中,三方商议共建一座污水处理厂,
城 1 城 2 城 3
20公里 38公里污水厂筹建处问题:
( 1)三个城镇怎样 建厂可使总开支最少?
( 2)每一个城镇的费用各分摊多少?
分析,有五种方案可供选择条件,建设污水处理厂的费用有公式:
)(730 712.01 万元QC?管道费用:
)(6.6 51.02 万元LQC?
(1) 三城各建一个处理厂;
(2) 城 1与城 2合建一个厂,城 3单独建一个;
(3) 城 2与城 3合建一个厂,城 1单独建一个;
(4) 城 1与城 3合建一个厂,城 2单独建一个;
(5) 三城合作建一个处理厂;
Q— 污水排放量; L— 管道长度 (公里 ).
三个城镇的污水排放量分别为
Q1=5米 3/秒,Q2=3米 3/秒,Q3=5米 3/秒,
对各个方案进行费用测算,得方案 总投资 城 1投资 城 2投资 城 3投资
( 1) 6200 2300 1600 2300
( 2) 5800?? 2300
( 3) 5950 2300??
( 4) 6230? 1600?
( 5) 5560???
方案 (5):三个城市合作建厂总投资最少,
问题,三个城市如何分摊费用?
经商讨定下几条原则:
1,建厂费用按 3个城市的污水量之比 5:3:5分摊;
2,城 2到城 3的管道费按 5:3由城 1和城 2分摊;
3,城 1到城 2的费用由城 1自行解决,
思考,他们的原则是否有道理?
城 1市长的“可行性论证”,
1,建厂总费用为 730× (5+3+5)0.712 =4530(万元 ),
城 1负担费用为 4530× 5/13≈1742(万元 );
2,城 1至城 2的管道费用为
6.6× 50.51× 20≈300(万元 );
3,城 2至城 3的管道费用为
6.6× ( 5+3) 0.51× 38≈724(万元 )
城 1负担 724× 5/8=425.5(万元 );
城 1总共负担,1742+300+425.5=2467(元 ).
市长的 结论,不能接受这样的合作,
n人合作对策模型
Shapley定理,满足公理 1~ 4 的 Ψ(V) 存在并且唯一,由下式给出:
)1(} ) ]()()[()(?
iTS
i iSVSVSWV?
)2(
!
)!()!1()(
n
SnSSW
Ti 是 I中包含 i的一切子集构成的集族,表示集合 S中的元素个数,
S
续例 1计算城市 1应承担的费用
T1={{1},{1,2},{ 1,3},{1,2,3}},
0 0 0 250V(S- {1})
0 67 0 130W( ) [V(S) - V(S- {1})]
1 2 2 3
1/3 1/6 1/6 1/3W( )
0 490 0 390V(S) - V(S- {1})
0 400 0 640V(S)
{1} {1,2} {1,3} {1,2,3}S
S
S
S
根据公式 (1)
1
} ) ]()()[()(1
TS
iSVSVSWV?
从而城市 1应承担投资额为
2300- 197=2103(万元 ).
= 67+130=197(万元 ),
二,信息模型例 5.3.2 调整气象观察站问题某地区内有 12个气象观察站(位置如图 ),有
10年各观察站的年降水量数据,为了节省开支,
想要适当减少气象站,
问题,减少哪些观察站可以使得到的降水量的 信息量 仍然足够大?
x1
x2
x3 x4x
5
x6 x7
x8
x9
x10
问题,怎样比较信息的大小?
信息的多少能不能度量?
降水量的 信息量 仍然足够大?
1,信息量认识问题的过程:
* 对一个问题毫无了解时,对它的认识是不确定的,
* 在了解过程中,通过获得信息,逐渐消除了不确定性,获得的信息越多,消除的不确定性就越大,
用消除不确定性的多少来度量信息量例 1:到影院寻找一个人,已问到:
(1) 甲告诉两条消息:他不坐在前十排,他也不坐在后十排;
(2)乙告诉一条消息:他坐在第十五排,
问题:甲、乙谁提供的消息信息量更大?
答案,乙的消息总信息量更大,因其不确定性消除得更多。
例 2.若在盛夏预报“明日无雪”,这条消息的信息量为零,因根本不存在不确定性,
美国贝尔实验室的学者香龙( Shannon) 应用概率知识和逻辑方法推出了信息量的计算公式,
他提出信息度量应满足的公理:
公理 1 信息量是该事件发生概率的连续函数;
公理 2 如果 A B,则 A发生的信息量 ≥B发生的信息量;
公理 3 若 A与 B相互独立,则 A与 B同时发生的信息量应为单独获知两事件发生的信息量之和;
公理 4 任何信息的信息量都是有限的,
将事件 A 发生的信息记为 M,概率记为 p,记信息的信息量为 I(M)
定理,满足公理 1~ 4的信息量函数必为
I(M)=- C loga p (1)
其中 C 是任意正整数,对数的底 a可取不为 1的正实数,
注 取 a=2,C=1,信息量的单位称为 比特取 a=10,C=1,信息量的单位称为 迪吉特例 3.某剧院有 1280个座位,32排,每排 40座,现从中找出某人,求以下信息的信息量,
1,A:他在第十排; 2,B,他在第 15座
3,C,他在第十排第 15座,
解 在未知任何信息的条件下,认为他坐在各排的概率是均等的,坐在各座位的概率也相等,
I(MA)= - log2 ( 比特 ),
5321?
I(MB)=- log2 ( 比特 ),
32.5401?
I(MC)=- log2 ( 比特 ),
32.101 2 8 01?
有,I(MC)=I(MA) + I(MB).
满足公理 3,对完全独立的几条信息,其总信息量等于各条信息的信息量总和,
2,平均信息量(熵)
定义,一随机试验有 N个可能结果,出现的概率分别为 p1,p2,…,pN,出现第 i 组结果的信息量为 - log2pi,该试验的不确定性可由这组信息量的平均信息量度量,
)1(l o g
1
2?
N
i
ii ppH
称 H为 熵 (或 负熵 ).
对具有连续分布 p(x) 的随机试验,熵的定义为,
dxxpxppH )(l o g)()( 2
注 1.此定义与物理中的熵仅相差一个负号,2,熵度量试验的不确定程度,熵越大试验的不确定程度越大,
例 4.有三名射手的射击情况如下:
5.05.0
AA
甲,
01.099.0
AA
乙,
3.07.0
AA
丙:
其中 A 表示射击命中目标,哪一个射手的射击情况最不确定?
解 需求三个射击试验的熵,
3 0 1 0.02lg21lg2121lg21甲H
0243.001.0lg01.099.0lg99.0乙H
2653.03.0lg3.07.0lg7.0丙H
其中,取 a=10,甲的熵值最大,乙的最小,
结论?
例 5.若 随机试验的随机变量 X~ N(0,σ2),求试验的熵值,
解 X 的 概率密度为
,,
2
1
)(
2
2
2 Rxexp
x
dxxepH x ]
2
2[ l og
2
1)(
2
2
2/ 22
.2l o g
2
12l o g e
思考 分析熵与随机变量方差的关系重要结论,
1.若试验仅有有限种结果,S1,S2,…,S n,其发生的概率分别为 p1,p2,…,pn,当
p1= p2= …= pn=1/n,
试验具有最大熵,
2,若试验是连续型随机试验,其概率密度 P(x)
在 [ a,b]以外均为零,则均匀分布具有最大熵,
3,对于一般连续型随机试验,在方差一定的前提 下,正态分布具有最大熵,
定理:(最大熵原理) 受到相互独立且均匀而小的随机因素影响的系统,其状态的概率分布将使系统的熵最大,
问题,怎样将熵用于解决气象观察站调整问题?