决策理论和方法（讲稿）：ch3a

分类：管理格式：doc 日期：2009年05月07日

第三章效用、损失和风险
(Utility,Loss and Risk)
本章主要参考文献：60，56，86，87，92，129，156，169，183，184
§3—1 效用的定义和公理系统一、引言
·为什么要引入效用
决策问题的特点：自然状态不确定——以概率表示；
后果价值待定,以效用度量。
1.无形后果，非数字量(如信誉、威信、出门带伞问题的后果)需以数值度量；
2.即使是数值量(例如货币)表示的后果，其价值仍有待确定，后果的价值因人而异。
例一：同是100元钱，对穷人和百万富翁的价值绝然不同；对同一个人，身无分文时的100元，与已有10000元再增加100元的作用不同，这是钱的边缘价值问题。
例二：

上图作为商业、经营中实际问题的数学模型有普遍意义有人认为打赌不如礼品,即

*由上面两个例子可知：在进行决策分析时，存在如何描述(表达)后果的实际价值，以便反映决策的人偏好次序(preference order)的问题
*偏好次序是决策人的个性与价值观的反映，与决策人所处的社会、经济地位，文化素养，心理和生理(身体)状态有关。
* 除风险偏好之外，还时间偏好。 i,折扣率 ii,其他
而效用(Utility)就是偏好的量化，是数(实值函数).
Daniel Bernoulli 在1738年指出：
若一个人面临从给定行动集(风险性展望集)中作选择的决策问题，如果他知道与给定行动有关的将来的自然状态，且这些状态出现的概率已知或可以估计，则他应选择对各种可能后果的偏好的期望值最高的行动。
二、效用的定义
1.符号
i,AB(即APB)读作A优于B：(Prefer(ed) A to B)
AB(即ARB) A不劣于B
A～B(即AIB) A无差别于B (Indifference)
ii,展望(prospect),可能的前景
即各种后果及后果出现概率的组合
P=(…… )
既考虑各种后果 (consequence)
又考虑了各种后果的概率(probability or likelihood)分布
所有P的集合记作(
iii,抽奖(lottery)与确定当量

若 ( ( ; )
则称确定性后果为抽奖 ( ; ) 的确定当量
2.效用的定义(A)
在集合(上的实值函数u，若它和(上的优先关系一致，即:
若 (, iff u()≥u()
则称u为效用函数
三、效用存在性公理理性行为公理
Von Neumann-Morenstern,1994 [169]
·公理1 连通性 (Connectivity)又称可比性
(,则  or ( or 
·公理2 传递性 (Transitivity)
(,若, 则 
·公理3 替代性公理 ( 加等量时优先关系不变)
若(, 且 0 ( ( ( 1
则对任何∈(,必有 (+(1-() (+(1-()
或者表达成：,((( 则 (+(1-()  (+(1-()
即二种后果中，决策人所偏好的后果出现机会较大的情况是决策人所喜爱的。
·公理4 连续性公理 ---- 偏好的有界性若  则存在 0(((1,0(((1,(((
使 (+(1-()   (+(1-()
由 (+(1-()  可知不是无穷劣,即 u()(((
由  (+(1-() 可知不是无穷优,即 u()( (
即使是死亡，亦不至于无穷劣例：i,过马路

若死亡为无穷劣，则不能过马路
ii,狂犬病疫苗

上述公理看来是合乎理性的，事实上并不尽然.
例：Allais 悖论（Paradox 〕
例如，1953年Allais在一次学术会议上提出如下问题，请效用理论权威Svage回答

Savage的回答是A组宁择i，
B组宁择ii，
Allais指出：B组的i,ii,均以0.89的$500,000 取代0.89的 $0，即与A组的i,ii,相对应，照公理3、A、B两组中i,ii,的优先关系应当不变。
Savage当时语塞。
·效用的公理化定义
在上述公理系统中，若(上存在实值函数u，使
i, ( 当且仅当 u() ＞u()
ii,u(α, ; 1-α,)= αu() +(1-α)u()
iii,对满足上述条件的 , 必有 () =b( )+c,其中 b,c ∈,b＞0
则u(P)称为(基数)效用函数
*关于线性：将ii,u(α, ; 1-α,)= αu() +(1-α)u() 推广到一般,
若∈( ;≥0,i=1,2,…m; =1; 则 u( )= u()
四、基数效用与序数效用 (Cardinal & Ordinal Utility)
基数：实数：1，2，3,π
序数：第一，二，…，4，3，2，1
·区别：
1.基数效用定义在展望集(上(考虑后果及其概率分布),是实数;
序数效用定义在后果集C上，不涉及概率，可以是整正数
2.基数效用反映偏好强度：(正线性变换下唯一)
原数列可变换为:b+c,2b+c,3b+c,πb+c; 其中 b,c ∈,b＞0.
而序数效用不反映偏好强度，(保序变换下唯一),原序数列可变换为
16,9,4,1;或 8,6,4,2,或10,7,6,1等.
·序数效用的存在性公理
1.连通性(可比)
2.传递性
3.对任何确定的后果x，优势集与劣势集均为闭集。(教材：P29 §3.1)
§3.2 效用函数的构造一、离散型的概率分布
后果元素有限
·各后果效用设定的步骤 NM法
由公理4,若( ( ,则可找到 0<α<1,使(α+(1-α)
第一步：
选定 , ( C,使(
令 u()=0,u()=1
所选择的、应使比较易于进行.
第二步：对((,求α(0<α<1),使 (α+(1-α)
则 u()=u(α+(1-α))= αu()+(1-α)u()
第三步：若(,求α(0<α<1),使(α+(1-α)
则u()=u(α+(1-α) )=αu()+(1-α)u( )
( u( )=α/(α-1)
第四步：若 (,求α(0<α<1),使 (α+(1-α)
则u()=u(α+(1-α))= αu()
( u()=1/α
第五步：一致性校验
设 (( 且 ,, 已知，
由 (α+(1-α) 求得u’()
若 u’() 与已知的 u() 不符，则反复进行二、三、四步，直到一致性校验通过.
例

设 (((
一、u()=0,u()=1
二、(0.7+0.3 u()=0.7
三、(0.4+0.6 u ()=0.4
校验设(0.4+0.6 u’()=0.66≠0.7
重复二、三、若u () 不变 u ()=0.5 则通过校验.
二、连续型后果集
·当C为连续变量时,u(c)是光滑的，因此可分段构造，求特征点的效用，再连成光滑曲线例1.每天学习时间的效用曲线

在10～12小时／日处效用最大
8小时／日处效率最高(效用／小时)
例2.见讲义P31之例
·注意：效用的唯一性(在正线性变换下唯一)使效用的值域为整个实轴，而不必限于[0,1]
§3.3 风险与效用一、效用函数包含的内容
1.对风险的态度

风险厌恶(Risk Aversion)
风险中立(Risk Neutralness)
风险追求(Risk Proneness) 即有冒险倾向
以上是初期对风险的解释(Pratt C.,1964)
2.对后果的偏好强度
钱的边缘价值：设某人现有积蓄为0，增加800地的作用(价值)与有了800元后再加1200元相等,则此人的财富的价值函数是凹函数。

若他认为800元((0.5,0; 0.5,2000),则与其说此人是风险厌恶不如说他是相对风险中立。为此有必要对确定性后果的偏好强度加以量化。
3.效用表示时间偏好十分复杂，我们在第八章再介绍。
二、可测价值函数
——确定性后果偏好强度的量化定义：
在后果空间X上的实值函数v，对ω，x,y,z∈X有
i,ωxyz当且仅当υ(ω)-υ(x)≥υ(y)-υ(z),且
ii,v对正线性变换是唯一确定的。
则称υ为可测价值函数说明：i，ωxyz表示ω,x之间偏好强度之差超过y,z之间偏好强度之差,

ii,由定义之ii，可测价值函数具有基数性质但与基数效用不同：VF不反映DMer的风险态度。
iii，它定在后果空间上，能起序数效用的作用但又与OUF不同：能反映后果的偏好强度.
三、相对风险态度
设效用函数u和测价值函数v在X上都是单调递增，且连续二次可微。
1.风险的局部测度
( > 0 u在x 处凹,风险厌恶
r(x)=-u”(x)/u’(x) ( = 0 u在x 处线性,风险中立
( < 0 u在x 处凸,风险追求
2.偏好强度的局部测度
>0 在x处有递减的边缘价值
m(x)=-v”(x)/v’(x)=0 在x处有不变的边缘价值
<0 在x处有递增的边缘价值
3.真正的(相对)风险态度的定义
若m(x)＜r(x)称为在X'区内相对风险厌恶
m(x)=r(x)称为在X'内相对风险中立
m(x)=r(x)称为在X'内相对风险追求四、风险酬金
kE(x)-S
这是决策人为了避免风险而顾意损失的金额
k=f(v,P)

五、钱的效用
1.性质
i,单调递增：愈多愈好
有界：全世界财富总量不足$,u()与u()几乎无差异
ii,x较小(相对于决策人资产而言)时,u(x)近乎线性
iii,x>0时u(x)通常是凹的递减的边缘价值
风险厌恶
x>0与x<0的形状不同,负债较多有追求风险的倾向.
2.钱的效用曲线的构成
设某人现有1000元存款(某商店有资产10万，企业有1000万等等)
i,NM法(见§3.2)
利用～ α+(1-α)
ii,修正的NM法
利用～0.5+0.5
例,设u(0)=0),u(1000)=1
有300～0.5<0>+0.5<1000> u(300)=0.5
又125～0.5<0>+0.5<100> u(125)=0.25
550～0.5<300>+0.5<1000> u(550)=0.75
由0～0.5<a>+0.5<500>
设 a=-250
则u(-250)=-u(500)=-0.72
-250～0.5<b>+0.5<0>

原因：i,价值函数是S型
ii,在一定范围内相对风险态度不变
iii,负债到一定程度以上有冒险倾向
Friedmann-Savage 效用曲线(1948):

§3.4 损失、风险和贝叶斯风险一、损失函数L
有些文献采用损失函数进行分析
∵u(c)=u(θ,a)
∴l(θ,a)-u(θ,a) 则损失函数与效用作用相同
为了使损失值非负，可取
l(θ,a)= u(θ,a)-u(θ,a)
二、风险函数
自然状态集 Θ -----参数空间
行动集 A -----决策空间
观察值集 X -----测度空间
决策规则 δ:x→a,,Δ为策略空间
损失l(θ,a)=l(θ,δ(x))
由于X是随机变量，对给定的θ，采用决策规则δ时定义风险函数
R(θ,δ)=[ l(θ,δ(x))]
= l(θ,δ(x)) ]f (x |θ) dx 或 l(θ,δ(x)) p (x |θ)
三、贝叶斯风险
r(π，δ)EπR(θ,δ)
含义：θ的先验分布为π，决策规则为δ时风险函数的期望值叫贝叶斯风险
即,r(π，δ)= R(θ,δ)
= l(θ,δ(x)) f (x |θ) dx ] π(θ) dθ
或 l(θ,δ(x)) p (x |θ) π(θ)

课件简介

课件名称：	决策理论和方法（讲稿）
课件分类：	管理
课件类型：	电子教案
文件大小：	0.98MB
下载次数：	23
评论次数：	3
用户评分：	7.3