第三篇 非线性规划第一章 凸分析基础
§1.非线性规划的一般形式
(一)非线性规划的例子在决策和物理等科学中常常提出含有非线性函数的优化问题,请看下面的几个例子。
例1、某饲养场拟建一排五间的猪舍,平面布置如图1所示。由于资金及材料的限制,围墙和隔墙的总长度不能超过54米,为使猪舍面积最大,应如何选择长宽尺寸?

图1
设猪舍长为米,宽为米。根据题意,变量、应满足约束条件

我们的目标是使总面积最大,即

于是化为如下规划问题:

这里与线性规划不同的是,目标函数

是关于变量的非线性函数。
例2、(确定经验公式)在经济或物理学中经常要根据实际或实验的观测值来确定出各种量之间关系的公式来(称为经验公式)。假设变量Q随时间t变化,根据观测,我们得到如下一组数据及坐标纸上的点(图2)。

















图2
注意随着时间的延伸,量Q的变化趋于平稳(即近似为常数),我们可以设想从如下形式的曲线中找出一条曲线作为它的近似:

其中、、为参数,根据图2可要求、、>0,并希望
 (1)
实际上,由于观测数据有误差,当m>3时,不管如何选择、、,(1)式一般都不会成立。只能退而求其次,即选择那样的、、使得由(1)算得的理论值与实际值尽量接近。通常大多采用最小平方和意义下的求解方法。即求解如下的规划问题:
 (2)
(2)中的目标函数也是非线性的。
例3、(最优存贮问题)设各种商品的年需求量为,为节约资金,减少存贮量,宜分批进货。已知每次订货费为,年单位存贮费为,仓库容量为,各种产品的单位价格为,希望存贮和订货的总费用不超过,问如何安排批量,使之占用的资金总额最少。
容易看出,占用资金总额等于年均存贮量与价格之积:

而总费用为订货费与存贮费之和:

若用表示单位第中材料所占用仓库容量,则有如下的模型:
 (3)
(3)中的一个约束函数是非线性的。
(二)一般形式
上面叙述的几个例子都是求一组变量,例如n个变量,使其在满足由一些等式或不等式所限定的约束条件下,求某一个目标函数的最大值或最小值。并且,其中目标函数和约束函数里至少有一个是非线性的。这样的规划问题称为非线性规划。它的一般形式为:
 (4)
其中,都是多元函数:,它们中至少有一个是非线性的。记(4)的可行解集为:
 (5)
则(4)可简写成
 (6)
求极大可以转换成求极小:

众所周知,整个世界在本质上是非线性的,因此实际中的非线性规划问题相对的要比线性规划问题更多、更普遍,也更复杂。因此,对它们的研究也显得更重要。非线性规划,又称最优化方法,其实际应用很广泛,主要表现在以下几个方面:
A最有控制,B结构设计,C机械设计,D电子网络,E水资源管理,F随机资源分配,G设施位置确定等。
(三)最优解
关于最优解,有以下定义。
定义1、设,,若存在数,,都有
 (7)
则称为的局部最优解。其中是的_邻域。特别如果对于,都有
, (8)
则称为的严格局部极小点或严格局部最优解。
若(7)式对都成立,则称为全局(或整体)极小点或全局最优解。若(8)式对,都成立,则称为严格全局极小点。
实际问题都是求全局极小点,但目前大多都是用求局部极小点近似代替之。
§2.多元函数和向量值函数
在微积分中已介绍过多元函数。例如对二元函数,其可微性定义为

= (9)
上式可等价的写成
 ()
其中,,,(9)及()的含义是

=
据此,对多元函数,自然可以给出如下形式的可微性定义:
定义2:设
 (10)
成立,则称在可微。
(有的文献称上述可微性为F-可微,还有所谓G-可微:

由可微可微,反之则不然)。(10)的等价形式为
 (11)
易证 (12)
称为在点的导数或梯度,记为,于是(11)变成
 (13)
定义(3)设,且,如果F(X)的所有分量在点都可微,则称向量值函数F(X)在点可微,即
 (14)
它等价于

其中称为向量值函数F(X)在点的导数或Jacobi矩阵,其具体形式如下:
 (15)
令,则g(x)定义了一个在区域的向量值函数,若g(X)于S上可微,则对于多元函数f(X)而言,它便在S上二次可微,就是f(X)的二阶导数,由(15)得:
 (16)
故的二阶导数是n阶矩阵,称(16)为的Hesse矩阵,记为
当的所有二阶偏导数连续时,
此时对称。
二次函数

其中,A是对称矩阵,则
例2 已知,其中,,,求证:
 (17)
 (18)
证:由连锁规则得:


定理1 设具有二阶连续偏导数,则
 (19)
其中(在X和X+P的连线上)
证:设,按一元函数的Taylor展开式把在展开,并注意(17)(18)式得

令,即得(19),公式(19)还可写成
 (20)
若连续,则中值公式成立(考虑):

3.凸集定义3 集合称为凸的,如果 总有
, (21)
这表明,对于凸集中的任意两点,连结这两点的直线段仍位于此集合之内。
设是凸集,称为凸集的顶点,如 及,,则必有 。这表明,集合的顶点不能位于 中的任何直线段的内部。
例  中的超平面: 是一个凸集,其中非零向量称为超平面的法向量,是实数。由超平面所决定的闭(开)半空间 ( )均为凸集。
定理2 集合是凸集的充要条件是:对于任意正整数,若点则它们的凸组合
 (22)
其中,
证,充分性显然(只需取)。现证必要性(数学归纳法)。
时,结论显然成立,假定时,结论成立,令,
其中,,不妨设,于是上式可写成
,
其中
。
注意,,,故由归纳假设,因为凸集,必有,证毕。
定理3 设是凸集,则下列集合亦然:
(1)
(2)
(3)
(4)任意多个凸集之交集仍为凸集。(证明留给读者)
设集合,包含的最小凸集被称为的凸包,记作。由定理3之(4)可知,的凸包就是所有包含的凸集之交。由定理2,的凸包是的一切凸组合的集合。换言之,当且仅当 。进一步还有以下定理:
定理4 设集合,则中的每一点可用中至多个点的凸组合来表示。
证,假设,,如果,只须证明也可以用个点的凸组合表示。事实上,因,故存在不全为零的实数,使。
令,则,。选取正数,使得
且,
则有

注意上式右端是的凸组合,且其中至少有一个系数是0。 证毕。
中有限个点的凸包称为一个多胞形;若是线性无关的(意味),则此凸包称为具有顶点的一个单纯形。
设是非空集合,为超平面,如果都有,则称分离(若二不等式严格成立,则称严格分离)。
定理5 设是非空闭凸集,且原点,则必存在超平面严格分离和.即存在,使
证,取集合使得。由于是有界闭集,所以连续函数在上某点达到最小值,即
注意到T是以原点为中心的超球的特性:若故知,均有,由于S的凸性,又有

从而

由此可得

此式对充分小的正数亦成立,故必有

取,便有 证毕。
定理6 (承托超平面定理)若S是一个非空凸集,y是S的边界点,则存在非0向量,使对闭包,有,亦即存在超平面它通过点y,且使S包含在它的某半闭空间之中(称H为凸集S的承托超平面)。
证,因y是集合S的边界点,故存在点列闭包由定理5可找到,,使超平面严格分离点和S闭包,即
,闭包由于是有界序列,故可设,于是便有
,闭包 。 证毕。
推论,若S是非空凸集,点,则必存在,,使得闭包有
。
定理7:若S1和S2是中两非空凸集,,则存在一非0向量p,使闭包,闭包,有

证,令S=S1-S2=由定理6之推论知存在,,使有,即有,,,于是亦有

故对所有闭包,闭包,有。 证毕。
作为分离定理的应用,现证明下面两个择一性定理,它们在数学规划中很有用。
定理8:(Farkas定理)若A是m×n矩阵,c是n维列向量,则下面二系统有且只有一个有解。
系统1: ,,
系统2: 且,.
证,若系统2有解,即存在,,使得如果存在使得则=故系统1无解。
若系统2无解,作集合,则,显然S是非空闭凸集,由定理5,知存在向量,使得有,因,故,从而
,又由,而可任取,故必,即
,从而是系统1的解。
推论1 下面二系统有且只有一个有解:
系统1:
系统2: (提示:用代替)。
推论2 下面结论恰有一个成立:
1)存在,使得 。
2)存在,使得 (提示:以乘1)、2)中不等式即变成推论1)。
定理9,(Gordan定理)设A=Am×n,则下列二系统有只有一个有解。
系统1: .
系统2: ,,.
证,设系统1有解,即存在,满足用反证法。假定系统2也有解,即存在,,,使这时由及,,可得即因之矛盾,故系统2无解。
反之,若系统1无解,令则S1与S2是非空凸集,,从而由定理7,存在向量,使得(),当时,得(),又由z<0及其任意性,立知,令得,所以,可见p是系统2的解。
§4.凸函数一、凸函数定义定义4,设是定义在非空凸集上的函数,若不等式
 (23)
对于的一切都成立,则称为S上的凸函数 。若对的一切,当时,
 (24)
总成立,则称是S上的严格凸函数。
若是凸(严格凸)函数,则称为凹(严格凹)函数,对于凹函数类(23)、(24)两式不等号的方向恰好相反。
二、凸函数性质命题1,若是凸集S上的凸函数,则亦然,其中。
命题2,若是凸集S上的凸函数,,,,则有:

命题3,设是凸集S上的凸函数,则对每一实数C,水平集

是凸集。
命题4,设是凸集S上的凸函数,则于S内部连续,且有方向导数:
,
定理10,定义在凸集S上的可微函数为凸函数的充要条件是,,均有
 (25)
证,1、必要性,
设是凸函数,则有

于是有

由可微性定义2(即(10))知上式左端等于
左端=ο
以除上式,并令,即得(25)
2、充分性.
设,(25)成立,令,应有


所以

证毕。
将(25)中的“”改为“>”,就得到严格凸的充要条件。
定理11,设于开凸集S上二次连续可微,则是凸函数的充要条件是:,在x点的Hesse 矩阵H(x)是半正定的。
证,1、必要性.
须证,总有。由Taylor公式,有

由定理10,
故 
两边除以,并令,即知
.
2、充分性,
若H(x)是半正定的,则,由Taylor公式有

由定理10,为凸函数。 证毕。
类似地可证(由Taylor公式及定理10):
定理12,设S是非空开凸集,在S上二次连续可微,若,H(x)正定,则是严格凸函数。
定理12的逆一般不成立。如=x4严格凸,但非正定。
三、凸规划定义5,设有问题
 (26)
若可行集S为凸集,目标函数为凸函数,则称问题(26)为凸规划问题。
凸规划的解有一个重要性质:
定理13,设是非空凸集S上的函数,假设是(26)的局部最优解。
1。若是凸函数,则是(26)的全局最优解。
2。若严格凸,则是(26)的唯一最优解。
证,1。用反证法。假设不是(26)的全局最优解,则应有,,对任意,由凸函数的性质应有

令充分小,则便可充分接近于,从而由上式知,不是局部最优解,矛盾。
2。假设不是唯一最优解,则存在,,于是应有,使

这同是全局最优解的假设矛盾。 证毕。
对于凸规划问题(26),据定理(13),若在某点的邻域内不能再找到更好的点,则说明全局最优解已经找到。
四、凸函数几种推广
1°拟凸函数定义6,设,S为凸集,若总有
 (27)
其中,则称是拟凸函数。
若,(27)中严格不等号成立,则称是严格拟凸函数。
若是(严格)拟凸的,则称是(严格)拟凹的。
或者
拟凹:

严格拟凹:
,。
显然,(严格)凸(凹)函数是(严格)拟凸(凹)函数,反之未必。例y=x3是(严格)拟凸(凹)函数。
命题5,设是凸集,函数是拟凸的充要条件是对任意实数C,水平集是凸集。
证明提示:令则因是凸集,必有
.
定理14,设S是凸集,可微,则是拟凸函数的充要条件是,若,必有。
证,1、必要性.
若拟凸,由假定,故有

于是有

于上式除以,并令,便得。
2、充分性.
用反证法。假如不是拟凸函数,即存在,

使得

由函数的连续性知,存在,使当时有 ·
 ·
以及 使 ·
,· 
于是,由中值定理,有
,此处,使 ·

另一方面,由于
即故>
于是由假设条件,

此处,此与前边的结果相矛盾。故必为拟凸函数。 证毕。
定理15,设函数可微,若,,,总有

则必为严格拟凸函数。
证明留作练习。
对于极值问题(26),若为严格拟凸函数,则有定理13的相应结果成立。
{于下半连续: 只要
}
定理16,设函数是严格拟凸函数,若在处达到局部最优,则是唯一全局最优解。
证,若不然,即存在,使得,由于是严格拟凸的,故对任何,有
令,则便可充分接近,此与是局部最优解矛盾。 证毕。
类似可证:若拟凸,是严格局部最优解,则是唯一全局最优解。
2°伪凸函数定义7,设于开凸集S上可微,若,只要
,便有;或者等价的,只要,则称为伪凸函数。
根据伪凸定义,若,则是的全局极小点。
可以证明[28],若,,则有,伪凸严格拟凸拟凸 。
此外还有在一点的凸性概念,例如,如果,由,可推出,则称在点是伪凸的;若,,恒有

则称在点是凸的,等等。
3°次梯度
一般说来凸函数并不具有可微性,故(25)式不能贸然使用,这是很可惜的,后来人们引入次梯度的概念,解决了这一问题。
定义8,设是凸集S上的凸函数,向量称为在的次梯度,如果,成立
 (28)
显然,若可微,则 。
人们已经证明,凸函数在其定义域内部点上至少有一次梯度,反之若对每一点,存在使(28)成立,则在上是凸的。
对于凸规划问题(26),关于次梯度有下面重要结果:
定理17,对于凸规划问题(26),点是一个最优解,当且仅当在有一个次梯度,使,有
 (29)
推论1,若S是开的,是最优解于存在一个0次梯度。
推论2,若可微,是最优解,,此外若S是开的x
最优。
§5.效用函数
凸分析理论在经济中有重要作用,效用函数就是其中之一.
—.消费者偏好
设可供消费者选择的商品有n种,一个消费方案就可以表示为一个n维向量

并称之为消费束(consumption bundle)或商品束,我们设商品集(消费集)为 
人们总是可以根据自己的喜好,对不同的消费束排出顺序,以表示他的偏好。我们用记号“”表示这种偏好,如,则“xy”表示x不比y差,如果xy,yx,则认为x与y无差异,记作:x~y;如果xy,但x~y不成立,则表示x比y好,记作:xy,称“”为消费者在X上的偏好关系,它满足以下公理:
公理1(完备性)两者至少有一个成立。
公理2(反身性), 。
公理3(传递性),如果,则 。
公理2,3说明一个理性消费者具有合乎逻辑的判断能力。
公理4(连续性)集合和是闭集。
这一公理说明消费者的极限行为,即设是一消费束序列,且其中任何,如果,则,另一方面,这一公理是为了数学上分析的需要。
二、效用函数
仅用消费者的偏好关系难以对消费者行为进行更深入的分析,人们希望用函数描述这种偏好关系。
定义9,实值函数称为表示消费者偏好关系的效用函数,若,当且仅当时,有 。
由定义可知,当且仅当x~y,有;当且仅当时,有。
问题是表示消费者偏好关系的效用函数是否存在?这一问题直到20世纪50年代才由Debreu给出肯定的结论,这为消费者行为的理论分析提供了重要的理论基础。
定理18:(Debreu,1954)如果消费者的偏好关系满足公理1—公理4,则存在相应的连续效用函数。(证明较繁详见[36])
效用函数不唯一,若是效用函数,而函数:是严格单调递增的,则亦然。
为使效用函数更能反映消费者的行为,对偏好关系还经常增加一些条件。它们是公理5 (单调性)如果且,总有此公理可解释为“多多益善”易证满足此公理的效用函数是严格递增的。
公理6 (局部不饱和性)
和,存在,,使得。
公理7(凸性)设,满足,,则对,有 。
公理8(严格凸性)设,且,如果,,则,有 。
可以证明:如果偏好关系满足凸性,则对应的效用函数在X上是拟凹的;满足严格凸性,则是严格拟凹的。
对于效用函数可以引入无差异曲面或等效用曲面

其中r为常数,即无差异曲面是效用函数值为r的所有消费束的集合。特别当n=2,是拟凹函数时,用平面u=r去截曲面,就得到等效用曲线,它在x1-x2平面上的投影是凸向原点的。

0 
在进行实证分析时,我们往往假设效用函数是二阶连续可微的,以便利用相应的数学方法。效用函数的梯度向量称为边际效用,反映增加(减少)单位商品所增加(减少)的效用。
当效用函数是可微的凹函数时,则偏导数是单调递减的。在经济学中,称此性质为边际效用递减规律。它反映了一种普遍现象,当商品数量逐次增加时,效用增量便逐次减少,可见数量经济当中对偏好关系所作的凸性假设并不算过分苛刻的限制。
例1 Cobb-Douglas效用函数,,,

可以验证是严格凹的。
二维公式:

例2,Stone-Geary效用函数,设

其中为常数,,i=1,…,n。取对数,并记

称为Stone-Geary效用函数,它比例1中的效用函数更符合实际,它也是严格凹函数。关于效用函数以后还要讨论。
还有需求函数、生产函数等它们都是满足一定凸性的重要经济函数。
例3:设商品束时,,如果消费者增加第i种商品的消费,且使效用水平保持不变,那么第j种商品的消费量应如何变化?
对求全微分,得

如果,,而,则上式可化成

或 
这里称为边际替代率(Marginal Rate of Substitution)简记为MRS,它表示保持效用水平不变时,若增加单位商品i的消费,所必须减少商品j的消费数量。边际替代率不依赖于选择的效用函数的形式,即如果和都表示同一偏好关系的效用函数,则由复合函数的求导法则,有