第三章 效用、损失和风险 (Utility,Loss and Risk) 本章主要参考文献:60,56,86,87,92,129,156,169,183,184 §3—1 效用的定义和公理系统 一、引言 ·为什么要引入效用 决策问题的特点:自然状态不确定——以概率表示; 后果价值待定: 以效用度量。 1.无形后果,非数字量(如信誉、威信、出门带伞问题的后果)需以数值度量; 2.即使是数值量(例如货币)表示的后果,其价值仍有待确定,后果的价值因人而异。 例一:同是100元钱,对穷人和百万富翁的价值绝然不同;对同一个人,身无分文时的100元,与已有10000元再增加100元的作用不同,这是钱的边缘价值问题。 例二:  上图作为商业、经营中实际问题的数学模型有普遍意义 有人认为打赌不如礼品,即  *由上面两个例子可知:在进行决策分析时,存在如何描述(表达)后果的实际价值,以便反映决策的人偏好次序(preference order)的问题 *偏好次序是决策人的个性与价值观的反映,与决策人所处的社会、经济地位,文化素养,心理和生理(身体)状态有关。 * 除风险偏好之外,还时间偏好。 i, 折扣率 ii,其他 而效用(Utility)就是偏好的量化,是数(实值函数). Daniel Bernoulli 在1738年指出: 若一个人面临从给定行动集(风险性展望集)中作选择的决策问题,如果他知道与给定行动有关的将来的自然状态,且这些状态出现的概率已知或可以估计,则他应选择对各种可能后果的偏好的期望值最高的行动。 二、效用的定义 1.符号 i,AB(即APB)读作A优于B:(Prefer(ed) A to B) AB(即ARB) A不劣于B A~B(即AIB) A无差别于B (Indifference) ii, 展望(prospect): 可能的前景 即各种后果及后果出现概率的组合 P=(…… ) 既考虑各种后果 (consequence) 又考虑了各种后果的概率(probability or likelihood)分布 所有P的集合记作( iii,抽奖(lottery)与确定当量  若  ( (  ;  ) 则称 确定性后果 为抽奖 (  ;  ) 的确定当量 2.效用的定义(A) 在集合(上的实值函数u,若它和(上的优先关系一致,即: 若 ( ,  iff u()≥u() 则称u为效用函数 三、效用存在性公理 理性行为公理 Von Neumann-Morenstern, 1994 [169] ·公理1 连通性 (Connectivity)又称可比性 (, 则  or ( or  ·公理2 传递性 (Transitivity) (, 若, 则  ·公理3 替代性公理 ( 加等量时优先关系不变) 若(,  且 0 ( ( ( 1 则 对任何∈( ,必有 (+(1-() (+(1-() 或者表达成:,((( 则 (+(1-()  (+(1-() 即二种后果中,决策人所偏好的后果出现机会较大的情况是决策人所喜爱的。 ·公理4 连续性公理 ---- 偏好的有界性 若  则 存在 0(((1, 0(((1, ((( 使 (+(1-()    (+(1-() 由 (+(1-()   可知  不是无穷劣,即 u()((( 由   (+(1-() 可知  不是无穷优, 即 u()( ( 即使是死亡,亦不至于无穷劣 例:i,过马路  若死亡为无穷劣,则不能过马路 ii,狂犬病疫苗  上述公理看来是合乎理性的,事实上并不尽然. 例:Allais 悖论(Paradox 〕 例如,1953年Allais在一次学术会议上提出如下问题,请效用理论权威Svage回答  Savage的回答是A组宁择i, B组宁择ii, Allais指出:B组的i, ii, 均以0.89的$500,000 取代0.89的 $0,即与A组的i,ii,相对应,照公理3、A、B两组中i,ii,的优先关系应当不变。 Savage当时语塞。 ·效用的公理化定义 在上述公理系统中,若(上存在实值函数u,使 i,  (  当且仅当 u() >u() ii. u(α,  ; 1-α, )= αu() +(1-α)u() iii, 对满足上述条件的  , 必有 () =b( )+c , 其中 b, c ∈, b>0 则u(P)称为(基数)效用函数 *关于线性:将ii. u(α,  ; 1-α, )= αu() +(1-α)u() 推广到一般, 若∈( ;≥0 , i=1,2,…m; =1; 则 u( )= u() 四、基数效用与序数效用 (Cardinal & Ordinal Utility) 基数:实数:1,2,3,π 序数:第一,二,…,4,3,2,1 ·区别: 1.基数效用定义在展望集(上(考虑后果及其概率分布),是实数; 序数效用定义在后果集C上,不涉及概率,可以是整正数 2.基数效用反映偏好强度:(正线性变换下唯一) 原数列可变换为:b+c, 2b+c, 3b+c, πb+c; 其中 b, c ∈, b>0. 而序数效用不反映偏好强度,(保序变换下唯一), 原序数列可变换为 16,9,4,1;或 8,6,4,2,或10,7,6,1等. ·序数效用的存在性公理 1.连通性(可比) 2.传递性 3.对任何确定的后果x,优势集与劣势集均为闭集。(教材:P29 §3.1) §3.2 效用函数的构造 一、离散型的概率分布 后果元素有限 ·各后果效用设定的步骤 NM法 由公理4: 若( (  ,则可找到 0<α<1, 使(α+(1-α)  第一步: 选定 ,  ( C , 使( 令 u()=0, u()=1 所选择的 、 应使比较易于进行. 第二步:对(( ,求α(0<α<1), 使 (α+(1-α) 则 u()=u(α+(1-α))= αu()+(1-α)u() 第三步:若(, 求α(0<α<1), 使(α+(1-α)  则u()=u(α+(1-α) )=αu()+(1-α)u( ) ( u( )=α/(α-1) 第四步:若 (, 求α(0<α<1), 使 (α+(1-α) 则u()=u(α+(1-α))= αu() ( u()=1/α 第五步:一致性校验 设 (( 且 ,, 已知, 由 (α+(1-α) 求得u’() 若 u’() 与已知的 u() 不符,则反复进行二、三、四步,直到一致性校验通过. 例  设 ((( 一、u()=0, u()=1 二、(0.7+0.3 u()=0.7 三、(0.4+0.6 u ()=0.4 校验 设(0.4+0.6 u’()=0.66≠0.7 重复二、三、若u () 不变 u ()=0.5 则通过校验. 二、连续型后果集 ·当C为连续变量时,u(c)是光滑的,因此可分段构造,求特征点的效用,再连成光滑曲线 例1.每天学习时间的效用曲线  在10~12小时/日 处 效用最大 8小时/日处效率最高(效用/小时) 例2.见讲义P31之例 ·注意:效用的唯一性(在正线性变换下唯一)使效用的值域为整个实轴,而不必限于[0,1] §3.3 风险与效用 一、效用函数包含的内容 1.对风险的态度  风险厌恶(Risk Aversion) 风险中立(Risk Neutralness) 风险追求(Risk Proneness) 即有冒险倾向 以上是初期对风险的解释(Pratt C.,1964) 2.对后果的偏好强度 钱的边缘价值:设某人现有积蓄为0,增加800地的作用(价值)与有了800元后再加1200元相等,则此人的财富的价值函数是凹函数。  若他认为800元((0.5,0; 0.5,2000), 则与其说此人是风险厌恶不如说他是相对风险中立。为此有必要对确定性后果的偏好强度加以量化。 3.效用表示时间偏好十分复杂,我们在第八章再介绍。 二、可测价值函数 ——确定性后果偏好强度的量化 定义: 在后果空间X上的实值函数v,对ω,x, y, z∈X有 i, ωxyz当且仅当υ(ω)-υ(x)≥υ(y)-υ(z), 且 ii, v对正线性变换是唯一确定的。 则称υ为可测价值函数 说明:i,ωxyz表示ω,x之间偏好强度之差超过y,z之间偏好强度之差,  ii,由定义之ii,可测价值函数具有基数性质但与基数效用不同:VF不反映DMer的风险态度。 iii,它定在后果空间上,能起序数效用的作用但又与OUF不同:能反映后果的偏好强度. 三、相对风险态度 设 效用函数u和测价值函数v在X上都是单调递增,且连续二次可微。 1.风险的局部测度 ( > 0 u在x 处凹, 风险厌恶 r(x)=-u”(x)/u’(x) ( = 0 u在x 处线性, 风险中立 ( < 0 u在x 处凸, 风险追求 2.偏好强度的局部测度 >0 在x处有递减的边缘价值 m(x)=-v”(x)/v’(x)=0 在x处有不变的边缘价值 <0 在x处有递增的边缘价值 3.真正的(相对)风险态度的定义 若m(x)<r(x)称为在X'区内相对风险厌恶 m(x)=r(x)称为在X'内相对风险中立 m(x)=r(x)称为在X'内相对风险追求 四、风险酬金 kE(x)-S 这是决策人为了避免风险而顾意损失的金额 k=f(v,P)  五、钱的效用 1.性质 i, 单调递增:愈多愈好 有界:全世界财富总量不足$, u()与u()几乎无差异 ii, x较小(相对于决策人资产而言)时,u(x)近乎线性 iii, x>0时u(x)通常是凹的 递减的边缘价值 风险厌恶 x>0与x<0的形状不同, 负债较多有追求风险的倾向. 2.钱的效用曲线的构成 设某人现有1000元存款(某商店有资产10万,企业有1000万等等) i, NM法(见§3.2) 利用  ~ α+(1-α) ii,修正的NM法 利用  ~0.5+0.5 例: 设u(0)=0), u(1000)=1 有300~0.5<0>+0.5<1000> u(300)=0.5 又125~0.5<0>+0.5<100> u(125)=0.25 550~0.5<300>+0.5<1000> u(550)=0.75 由0~0.5<a>+0.5<500> 设 a=-250 则u(-250)=-u(500)=-0.72 -250~0.5<b>+0.5<0>  原因:i,价值函数是S型 ii,在一定范围内相对风险态度不变 iii,负债到一定程度以上有冒险倾向 Friedmann-Savage 效用曲线(1948):  §3.4 损失、风险和贝叶斯风险 一、损失函数L 有些文献采用损失函数进行分析 ∵u(c)=u(θ,a) ∴l(θ,a)-u(θ,a) 则损失函数与效用作用相同 为了使损失值非负,可取 l(θ,a)= u(θ,a)-u(θ,a) 二、风险函数 自然状态集 Θ -----参数空间 行动集 A -----决策空间 观察值集 X -----测度空间 决策规则 δ:x→a ,  , Δ为策略空间 损失l(θ,a)=l(θ,δ(x)) 由于X是随机变量,对给定的θ,采用决策规则δ时定义风险函数 R(θ,δ)=[ l(θ,δ(x))] = l(θ,δ(x)) ]f (x |θ) dx 或  l(θ,δ(x)) p (x |θ) 三、贝叶斯风险 r(π,δ)EπR(θ,δ) 含义:θ的先验分布为π,决策规则为δ时风险函数的期望值叫贝叶斯风险 即: r(π,δ)= R(θ,δ) = l(θ,δ(x)) f (x |θ) dx ] π(θ) dθ 或 l(θ,δ(x)) p (x |θ) π(θ)