无条件极值
定义 12.6.1 设 D
n
R∈ 为开区域,)(xf 为定义在 D 上的函数,
0
x ),,,(
00
2
0
1 n
xxx "= ∈D。 若存在
0
x 的邻域 ),(
0
rO x,使得
)),()(()()(
00
xxxx ffff ≤≥ 或 ∈x ),(
0
rO x,
则称
0
x 为 f 的 极大值点 ( 或 极小值点); 相应地,称 )(
0
xf 为相应的 极大值( 或 极小值); 极大值点与极小值点统称为 极值点,极大值与极小值统称为极值。
§ 6 无条件极值先考察一个点为极值点的必要条件。
定理 12.6.1(必要条件) 设
0
x 为函数 f 的极值点,且 f 在
0
x 点可偏导,则 f 在
0
x 点的各个一阶偏导数都为零,即
0)()()(
000
21
==== xxx
n
xxx
fff " 。
证 只证明 0)(
0
1
=x
x
f,其他类似。考虑一元函数
),,,()(
00
211 n
xxxfx "=?,

0
1
x 是 )(
1
x? 的极值点。由于 f 在
0
x 点可偏导,因此 )(
1
x? 在
0
1
x 点可导,
由 Fermat 引理,即得到
)(
0
1
x?

= 0),,,(
00
2
0
1
1
=
nx
xxxf " 。
使函数 f 的各个一阶偏导数同时为零的点称为 f 的 驻点 。
注 首先,定理 12.6.1 的条件不是充分的,即 驻点不一 定 是极值点 。如马鞍面方程 xyyxf =),( 满足
0)0,0()0,0( ==
yx
ff,
但在 )0,0( 的任何邻域里,总同时存在使 ),( yxf 为正和为负的点。而
0)0,0( =f,因此 )0,0( 不是 f 的极值点(见图 12.6.1)。
z
y
O
x
图 12.6.1
其次,偏导数不存在的点也可能是极值点。如柱面方 程
||),( xyxf =,整 个 y 轴上的每一点 ),0( y 都是 f 的极小值点。但在 y 轴 上的任一点 ),0( y 处,f 关于 x 的偏导数都不存在(见图 12.6.2)。
z
O y
x
图 12.6.2
那么,要加上什么条件才能保证驻点是极值点呢?我们先对二元函数进行讨论。
设 ),( yxfz = 在 ),(
00
yx 点附近具有二阶连续偏导数,且 ),(
00
yx 为 f
的驻点,即
0),(),(
0000
== yxfyxf
yx
,
那么由 Taylor 公式得到
22
00 00
1
(,) (,) { () 2 () () }
2
xx xy yy
f xxyyfxy fPx fPxyfPy+Δ +Δ? = Δ + ΔΔ + Δ
 
,
其中 10),,(
~
00
<<Δ+Δ+= θθθ yyxxP 。由于 f 的二阶偏导数在 ),(
00
yx 点连续,因此
γβα +=+=+= ),()
~
(,),()
~
(,),()
~
(
000000
yxfPfyxfPfyxfPf
yyyyxyxyxxxx
,
其中 γβα,,为当 0
22
→Δ+Δ= yxρ 时的无穷小量。
于是
{}
222
0000
2
00
0000
2),(),(2),(
2
1
),(),(
yyxxyyxfyxyxfxyxf
yxfyyxxf
yyxyxx
Δ+ΔΔ+Δ+Δ+ΔΔ+Δ=
Δ+Δ+
γβα
{ })1(),(),(2),(
2
1
2
0000
2
00
2
oyxfyxfyxf
yyxyxx
+++= ηξηξρ )0( →ρ,
其中
ρ
η
ρ
ξ
yx Δ
=
Δ
=,。
由于 1
22
=+ηξ,因此,判断 ),(
00
yxf 是否为极值的问题就转化为判断二次型
2
0000
2
00
),(),(2),(),( ηξηξηξ yxfyxfyxfg
yyxyxx
++=
在单位圆周
S }1),{(
222
=+∈= ηξηξ R
上是否保号的问题。
若二次型 ),( ηξg 是正定的,那么 ),( ηξg 在 S 上的最小值一定满足
(,)
min { (,)} 0gm
ξη
ξ η

= >
S

因此当 0≠ρ 且 ρ 充分小时,
{}
{}
00 00
22 2
00 00 00
2
(,)(,)
1
(,) 2 (,) (,) (1)
2
1
(1) 0,
2
xx xy yy
fx xy y fx y
fxy fxy fxy o
mo
ρξ ξηη
ρ
+Δ +Δ?
=+++
≥+>
即 ),(
00
yxf 为极小值。
若二次型 ),( ηξg 是正定的,那么 ),( ηξg 在 S 上的最小值一定满足
(,)
min { (,)} 0gm
ξη
ξ η

= >
S

因此当 0≠ρ 且 ρ 充分小时,
{}
{}
00 00
22 2
00 00 00
2
(,)(,)
1
(,) 2 (,) (,) (1)
2
1
(1) 0,
2
xx xy yy
fx xy y fx y
fxy fxy fxy o
mo
ρξ ξηη
ρ
+Δ +Δ?
=+++
≥+>
即 ),(
00
yxf 为极小值。
类似地,若二次型 ),( ηξg 为负定的,那么 ),(
00
yxf 为极大值。
若二次型 ),( ηξg 是不定的,同样易知 ),(
00
yxf 既不是极大值,也不是极小值。
综合以上讨论,结合代数学的知识,就得到
定理 12.6.2 设 ),(
00
yx 为 f 的驻点,f 在 ),(
00
yx 附 近具有二阶连续偏导数。 记
),(),,(),,(
000000
yxfCyxfByxfA
yyxyxx
===,
并记
2
BAC
CB
BA
H?==,
那么
( 1) 若 0>H,0>A 时 ),(
00
yxf 为极小值; 0<A 时 ),(
00
yxf 为极大值 ;
( 2) 若 0<H,),(
00
yxf 不是极值。
(3) 当 0=H 时,不难举例说明,),(
00
yxf 可能是极值,也 可能不是极值。
例12.6.1 求函数 )0()(),( ≠= ayxaxyyxf 的极值。
解 先找驻点,即解方程组
==
==
.0)(
,0)(
xyyxax
y
f
xyyxay
x
f
易解出驻点为 ),0(),0,(),0,0( aa 和
3
,
3
aa

再求二阶偏导数,
x
y
f
yxa
yx
f
y
x
f
2,22,2
2
22
2
2
=
=

=
,
得到计算结果
A B
C
H
)0,0(
0 a 0
2
a?
)0,(a
0 a? a2?
2
a?
),0( a
a2? a? 0
2
a?
3
,
3
aa
a
3
2
3
a
a
3
2
2
3
1
a
从表中可以看出,)0,(),0,0( a 和 ),0( a 都不是 f 的极值点。而在
3
,
3
aa
点处,当 0>a 时,
273
,
3
3
aaa
f =
为极大值; 当 0<a 时,
273
,
3
3
aaa
f =
为极小值。
例 12.6.2 讨论
5422
2),( yyxyxyxf?+?= 的极值。
解 解方程组
=?+?=
=?=
.0544
,022
43
2
yyxy
y
f
yx
x
f
求得驻点 )0,0( 。再计算二阶偏导数,
32
2
22
2
2
20124,4,2 yyx
y
f
y
yx
f
x
f
+?=
=

=
,
在 )0,0( 处有 0
2
=? BAC,这时候无法用定理判定。
注意到 0)0,0( =f,以及
522
)(),( yyxyxf=,那么,在曲线
0,
2
>= yyx 上 0),( <yxf ; 在曲线 0,
2
<= yyx 上 0),( >yxf,因此 0)0,0( =f
不是极值(见图 12.6.3)。
y
0,
2
>= yyx
O x
2
,0xyy<=
图 12.6.3
对于一般的多元函数,可同样得出
定理 12.6.3 设 n 元函数 )(xf 在
0
x ),,,(
00
2
0
1 n
xxx "= 附 近具有二阶 连续偏导数,且
0
x 为 )(xf 的驻点 。 那么当二次型
()g ξ
0
,1
()
ij
n
x xij
ij
f ξξ
=
=

x
正定时,)(
0
xf 为极小值 ; 当 ()g ξ 负定时,)(
0
xf 为极大值 ; 当 ()g ξ 不定时,)(
0
xf 不是极值。
记 )(
0
x
ji
xxij
fa =,并记
=
kknn
n
n
k
aaa
aaa
aaa
A
"
###
"
"
21
22221
11211
,
它称为 f 的 k 阶 Hesse 矩阵。由代数学知识即可得到
推论 12.6.1 若 ),,2,1(0det nkA
k
"=>,则二次型 ()g ξ 是正定的,
此时 )(
0
xf 为极小值 ; 若 ),,2,1(0det)1( nkA
k
k
"=>?,则二次型 ()g ξ 是负定的,此时 )(
0
xf 为极大值。
例 12.6.3 设
22
2
2
1
e),,,(
21
n
xxx
n
xxxf

=
"
",讨论它的极值。
解 显然
22
2
2
1
e2),,,(
21
n
i
xxx
inx
xxxxf

=
"
",ni,,2,1 "= 。

0
21
====
n
xxx
fff ",
解得驻点为 )0,,0,0( " 。再计算二阶偏导数得到
22
2
2
1
e)21(2),,,(
2
21
n
ii
xxx
inxx
xxxxf

=
"
",ni,,2,1 "=,

22
2
2
1
e4),,,(
21
n
ji
xxx
jinxx
xxxxxf

=
"
",jinji ≠=,,,2,1," 。
那么
2)0,0,0(?="
ii
xx
f,ni,,2,1 "= 。
0)0,0,0( ="
ji
xx
f,jinji ≠=,,,2,1," 。
因此 f 的 Hesse 矩阵为
kk
IA 2
200
020
002
=
=
"
#%##
"
"
,
其中
k
I 为 k 阶单位矩阵。于是 02det)1( >=?
k
k
k
A ( nk,,2,1 "= ),因此
n
A
是负定的。由推论 12.6.1,1)0,,0,0( ="f 为极大值。
函数的最值
最值问题是求函数在其定义域内某个区域上的最大值和最小值。
最值点可能在区域内部(此时必是极值点),也可能在区域的边界上,
因此,求函数的最值时,要求出它在区域内部的所有极值以及在区域边界上的最值,再加以比较,从中找出 f 在整个区域上的最值。
例 12.6.4 在以 )0,1(),0,0( AO 和 )1,0(B 为顶点的三角形所围成的闭区域上找点,使它们到三个顶点的距离平方和分别为最大和最小,并求出最大值和最小值。
y
),( yxP
O x
图 12.6.4
B
A
函数的最值
最值问题是求函数在其定义域内某个区域上的最大值和最小值。
最值点可能在区域内部(此时必是极值点),也可能在区域的边界上,
因此,求函数的最值时,要求出它在区域内部的所有极值以及在区域边界上的最值,再加以比较,从中找出 f 在整个区域上的最值。
解 设 ABCΔ 上的一点为 ),( yxP,那么它到 BAO,,三点的距离的平方和为
22 222 2
22
(1) (1)
33222.
zx y x y x y
xyxy
= ++?+++?
=++
我们先求函数 z 在 ABCΔ 内部的驻点。解方程组
=?=
=?=
.026
,026
y
y
z
x
x
z
得到驻点
3
1
,
3
1
。由于 6,0,6
2
22
2
2
=
=

=
y
z
yx
z
x
z
,因此
036
2
>=?= BACH,06 >=A,于是
3
4
3
1
,
3
1
=
z 是极小值。
再讨论函数 z 在区域边界上的最大值与最小值。
在 OA边上,0=y,因此 10,223
2
≤≤+?= xxxz 。这个函数在区间
]1,0[ 的端点 1=x 处(即 A点)达到最大值 3,在
3
1
=x 处达到最小值
3
5

在 OB 边上,0=x,因此 10,223
2
≤≤+?= yyyz 。这个函数在区间 ]1,0[ 的端点 1=y 处 (即 B 点) 达到最大值 3,在
3
1
=y 处达到最小值
3
5

在 AB 边上,1=+ yx,故有 10,366
2
≤≤+?= xxxz 。这个函数在区间 ]1,0[ 的端点 0=x 和 1=x 处(即 A点和 B 点)达到最大值 3,在
2
1
=x
处达到最小值
2
3

综上所述,A,B 两点到 ABCΔ 的三个顶点的距离平方和最大,最大值为 3。
3
1
,
3
1
点到三个顶点的距离平方和最小,最小值为
3
4

注 事实上,
3
1
,
3
1
点就是这个三角形的三条中线的交点,即重心。读者可以证明更一般的结论:三角形的重心到它的三个顶点的距离平方和最小。
计算函数在区域边界上的最值有时较为复杂。在实际问题中,往往可以根据问题的性质,判定函数的最值就在区域内部。此时,若偏导数在区域内处处存在,只要比较函数在驻点的值就能得到最值。特别地,如果函数在区域内只有一个驻点,就可以断定,它就是函数的最值点。
例 12.6.5 有一宽为 24 厘米的长方形铁板,把它两边折起来,做成一个横截面为等腰梯形的水槽。问采用怎样的折法,才能使梯形的截面积最大。
图 12.6.5
xx
αα
24
24 2x?
解 设折起来的边长为 x 厘米,折角为 α(如图 12.6.5),那么 梯形的横截面的面积为
[]
.cossinsin2sin24
sincos2)224()224(
2
1
),(
22
αααα
ααα
xxx
xxxxxA
+?=
+?+?=
依题意,其定义域为
{ }
(,)|0 12,0 πxxαα= ≤≤ ≤≤D 。由于
).1cos2(cos2cos24
)sin(coscos2cos24
),cos212(sin2cossin2sin4sin24
222
2222
+?=
+?=
+?=+?=
ααα
αααα
α
αααααα
xxx
xxx
A
xxxx
x
A

0,0 =
=
α
A
x
A
,得到方程组
=?+?
=+?
.0)]1cos2(cos2cos24[
,0)cos212(sin2
2
ααα
αα
xxx
xx
我们求 ),( αxA 在区域 D内部的驻点。这时 0,0,πx α≠ ≠,上面的方程组就化为
=?+?
=+?
.0)1cos2(cos2cos24
,0cos212
2
ααα
α
xx
xx
解此方程组得到
π
8,
3
x α= =,即 ),( αxA 在 D内的驻点为
π
8,
3




由实际背景,截面面积的最大值一定存在,且不在边界达到。 现在面积函数 ),( αxA 在 D内只有一个驻点
π
8,
3



,因此它必为最大值点。
于是得到截面面积的最大值为
2
π
8,48 3
3
A

=


厘米。
例 12.6.6 证明,
ln e,1,0
y
xy x x x x y≤?+ ≥ ≥。
证 设 =D }0,1|),{( +∞<≤+∞<≤ yxyx,定义
(,) ln e
y
f xy x x x xy=?+?,(,)xy∈D。
对于每个 1
0
≥x,由于在半直线
0
xx =,0≥y 上,),( yxf 满足
00 0
000
(,)e 0,0 ln,
(,)e 0,ln,
y
y
f
xy x y x
y
f
xy x x y
y
=?< ≤<
=?> <<+∞
因此在半直线
0
xx =,0≥y 上,),(
0
yxf 在
00
ln xy = 达到最小值。
由于在曲线 ln ( 1)yxx= ≥ 上 ),( yxf 满足
ln
(,ln ) ln e ln 0
x
fx x x x x x x=?+? =,
因此在区域 D上总成立 0),( ≥yxf,即
ln e,1,0
y
xy x x x x y≤?+ ≥ ≥,
且等号仅在曲线 ln ( 1)yxx= ≥ 上成立。
最小二乘法
问题的一般提法是:已知一组大致满足线性关系的实验数据
x
1
x
2
x
3
x

n
x
y
1
y
2
y
3
y

n
y
要确定直线 baxy +=,使得所有观测值
i
y 与函数值 bax
i
+ 之差的平方和

=
=
n
i
ii
baxyQ
1
2
)(
最小。这种方法叫做 最小二乘法 。
将 baxy += 视为变量 y 与 x之间的近似函数关系,称为这组数据在最小二乘意义下的 拟合曲线 (实践中常称为 经验公式 )。确定常数 ba,的方法就是二元函数求极值的方法。
显然 Q是 ba,的函数,令
,0222)(2
,0222)(2
111
111
2
1
=+?==
=+?==
∑∑∑
∑∑∑∑
===
====
nbyxabaxy
b
Q
xbyxxaxbaxy
a
Q
n
i
i
n
i
i
n
i
ii
n
i
i
n
i
ii
n
i
i
n
i
iii
就得到线性方程组
=



∑∑
=
=
=
==
n
i
i
n
i
ii
n
i
i
n
i
i
n
i
i
y
yx
b
a
nx
xx
1
1
1
11
2

解这个方程组,得到
.,
2
11
2
1111
2
2
11
2
111
=
=
∑∑
∑∑∑∑
∑∑
∑∑∑
==
====
==
===
n
i
i
n
i
i
n
i
ii
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
ii
xxn
yxxyx
b
xxn
yxyxn
a
由问题的实际情况,可知 Q在 ),( ba 点取最小值。
最小二乘法广泛应用于实际生活与科学研究中,物理学、化学、
生物学、医学、经济学、商业统计等方面都要用到它来确定经验公式。
在数学上,数理统计中的回归分析方法就要用到这个工具。熟悉计算机的读者会发现,许多计算机软件也是用这种方法来作出拟合曲线的。