第13章 数值分析
每当难以对一个函数进行积分、微分或者解析上确定一些特殊的值时,就可以借助计算机在数值上近似所需的结果。这在计算机科学和数学领域,称之为数值分析。至此,可以猜到,MATLAB提供了解决这些问题的工具。本章将介绍这些工具的使用。
13.1 绘图
说到绘图,只要计算函数在某一区间的值,并且画出结果向量,这样就得到了函数的图形。在大多数情况下,这就足够了。然而,有时一个函数在某一区间是平坦的并且无激励,而在其它区间却失控。在这种情况下,运用传统的绘图方法会导致图形与函数真正的特性相去甚远。MATLAB提供了一个称为fplot的巧妙的绘图函数。该函数细致地计算要绘图的函数,并且确保在输出的图形中表示出所有的奇异点。该函数的输入需要知道以字符串表示的被画函数的名称以及2元素数组表示的绘图区间。例如:
>>fplot(‘ humps ‘ , [0 2])
>>title(‘ FPLOT OF HUMPS ‘)
在0和2之间计算函数humps,并显示该函数的图形。(见图13.1)。
图13.1 函数humps的图形
在这个例子中,‘ humps ‘是MATLAB的M文件函数。
function y=humps(x)
% HUMPS A function used by QUADDEMO, ZERODEMO and FPLOTDEMO.
% HUMPS(X) is a function with strong maxima near x= .3 and x= .9.
% See QUADDEMO, ZERODEMO and FPLOTDEMO.
% Copyright (c) 1984-93 by The MathWorks, Inc.
y=1 ./ ((x - .3) .^ 2+ .01)+1 ./ ((x - .9) .^ 2+ .04) - 6;
fplot适用于任何具有单输入和单输出向量的函数M文件。即如同humps,输出变量y返回一个与输入x同样大小的数组,在数组到数组意义上y和x有联系。在使用fplot(以及其它数值分析函数)的过程中,最普遍犯的错误是忘记把函数名加上引号。即fplot需要知道字符串形式的函数名。如果输入fplot(humps , [0 , 2]),MATLAB认为humps是工作空间中的一个变量,而不是函数的名称。注意把变量humps定义为所需要的字符串,就可避免这个问题。
>>humps=‘ humps ‘;
>>fplot(hump , [0 2])
这时,MATLAB从变量humps中获得字符串‘ humps‘。
对于可表示成一个字符串的简单的函数,如,fplot绘制这类函数的曲线时,不用建立M文件,只需把x当作自变量,把被绘图的函数写成一个完整的字符串。
>>f=‘ 2*exp(-x) .* sin(x) ‘;
式中,运用数组乘法定义了函数
>>fplot(f , [0 8]);
>>title(f) , xlabel(‘x‘)
图13.2 的曲线
在区间绘出上述函数,产生如图13.2所示的图形。
除了这些基本特性,函数fplot还有很多强大的功能,有关详细的信息,参阅《MATLAB参考指南》或在线帮助。
13.2 极小化
作图除了提供视觉信息外,还常常需要确定一个函数的其它更多的特殊属性。在许多应用中,特别感兴趣的是确定函数的极值,即最大值(峰值)和最小值(谷值)。数学上,可通过确定函数导数(斜率)为零的点,解析上求出这些极值点。检验humps的图形在峰值和谷值点上的斜率就很容易理解这个事实。显然,如果定义的函数简单,则这种方法常常奏效。然而,即使很多容易求导的函数,也常常很难找到导数为零的点。在这种情况下,以及很难或不可能解析上求得导数的情况下,必须数值上寻找函数的极值点。MATLAB提供了两个完成此功能的函数fmin和fmins。这两个函数分别寻找一维或n维函数的最小值。这里仅讨论fmin。有关fmins的详细信息,参阅《MATLAB参考指南》。因为f(x)的最大值等于-f(x)的最小值,所以,上述fmin和fmins可用来求最大值和最小值。如果还不清楚,把上述图形倒过来看,在这个状态下,峰值变成了谷值,而谷值则变成了峰值。
为了解释求解一维函数的最小值和最大值,再考虑上述例子。从图13.2可知,在xmax=0.7附近有一个最大值,并且在xmin=4附近有一个最小值。而这些点的解析值为:和。为了方便,用文本编辑器编写一个脚本M文件,并用fmin寻出数值上极值点,给出函数主体如下:
% ex_fmin.m
fn=‘ 2*exp(-x)*sin(x) ‘; % define function for min
xmin=fmin(fn , 2 , 5) % search over range 2<x<5
emin=5*pi / 4-xmin % find error
x=xmin; % need x since fn has x as its variable
ymin=eval(fn) % evaluate at xmin
fx=‘ -2*exp(-x)*sin(x) ‘; % define for max:note minus sign
xmax=fmin(fx , 0 , 3) % search over range 0<x<3
emax=pi / 4-xmax % find error
x=xmax; % need x since fn has x as its variable
ymax=eval(fn) % evaluate at xmax
下面是M文件的运行结果:
>>ex-fmin
xmin =
3.9270
emin =
1.4523e-006
ymin =
-0.0279
xmax =
0.7854
emax =
-1.3781e-005
ymax =
0.6448
这些结果与上述图形非常吻合。注意,fmin的工作方式很像fplot。要计算的函数可用一个函数M文件表达,或者只给出一个x为自变量的字符串。上述例子就是使用后一种方法。这个例子也使用了函数eval,它获取一个字符串,并解释它,如同在MATLAB提示符下输入该字符串。由于要计算的函数以x为自变量的字符串形式给出,那么设置x等于xmin和xmax,允许eval计算该函数,找到ymin和ymax。
最后,特别注意,求数值上的最小值包含一个搜索过程,fmin不断计算函数值,寻求其最小值。如果计算的函数需要很大的计算量,或者该函数在搜索区间不止一个最小值,则该搜索过程所花的时间比较长。在有些情况下,搜索过程根本找不到结果。当fmin找不到最小值时,它会停止运行并提供解释。
与函数fmin一样,函数fmins搜索最小值。不过,fmins搜索向量的标量函数的最小值。即fmins寻找
这里x是函数f(.)的向量参数,函数f(.)返回标量值。函数fmins利用单纯形法求最小值,它不需要精确的梯度计算。任何一种优化工具箱中具有更多扩展的优化算法
13.3 求零点
正如人们对寻找函数的极点感兴趣一样,有时寻找函数过零或等于其它常数的点也非常重要。一般试图用解析的方法寻找这类点非常困难,而且很多时候是不可能的。在上述函数humps的图中(如图13.3所示),该函数在x=1.2附近过零。
图13.3 humps函数的图形
MATLAB再一次提供了该问题的数值解法。函数fzero寻找一维函数的零点。为了说明该函数的使用,让我们再运用humps例子。
>>xzero=fzero(‘ humps ‘ , 1.2) % look for a zero near 1.2
xzero=
1.2995
>>yzero=humps(xzero , 1.2) % evaluate at xzero
yzero=
3.5527e-15
所以,humps的零点接近于1.3。如前所述,寻找零点的过程可能失败。如果fzero没有找到零点,它将停止运行并提供解释。
当调用函数fzero时,必须给出该函数的名称。但由于某种原因,它不能接受以x为自变量的字符串来描述的函数。这样,即使在fplot和fmin中都具有的这个特性,fzero将不工作。
fzero不仅能寻找零点,它还可以寻找函数等于任何常数值的点。仅仅要求一个简单的再定义。例如,为了寻找f(x)=c的点,定义函数g(x)=f(x)-c,然后,在fzero中使用g(x),就会找出g(x)为零的x值,它发生在f(x)=c时。
13.4 积分
一个函数的积分或面积也是它的另一个有用的属性。MATLAT提供了在有限区间内,数值计算某函数下的面积的三种函数:trap2 , quad和quad8。函数trapz通过计算若干梯形面积的和来近似某函数的积分,这些梯形如图13.4所示,是通过使用函数humps的数据点形成。
图13.4 粗略的梯形逼近曲线下的面积示意图
从图中可明显地看出,单个梯形的面积在某一段欠估计了函数真正的面积,而在其它段又过估计了函数的真正面积。如同线性插值,当梯形数目越多时,函数的近似面积越准确。例如,在图13.4中,如果我们大致增加一倍数目的梯形,我们得到如下页(如图13.5)所示的更好的近似结果。
图13.5 较好的梯形逼近曲线下的面积示意图
对如上所示的两个曲线,用trapz在区间-1<x<2上计算y=humps(x)下面的面积:
>>x=-1 : 0.17 : 2; % rough approximation
>>y=humps(x);
>>area=trapz(x , y) % call trapz just like the plot command
area =
25.9174
>>x=-1 : 0.07 : 2; % better approximation
>>y=humps(x);
>>area=trapz(x , y)
area =
26.6243
自然地,上述两个结果不同。基于对图形的观察,粗略近似可能低估了实际面积。除非特别精确,没有准则说明哪种近似效果更好。很明显,如果人们能够以某种方式改变单个梯形的宽度,以适应函数的特性,即当函数变化快时,使得梯形的宽度变窄,这样就能够得到更精确的结果。
MATLAB的函数quad和quad8是基于数学上的正方形概念来计算函数的面积,这些积分函数的操作方式一样。为获得更准确的结果,两个函数在所需的区间都要计算被积函数。此外,与简单的梯形比较,这两个函数进行更高阶的近似,而且quad8比quad更精确。这两个函数的调用方法与fzero相同,即
>>area=quad(‘ humps ‘ , -1 , 2) % find area between -1 and 2
area =
26.3450
>>area=quad8(‘ humps ‘ , -1 , 2)
area =
26.3450
注意,这两个函数返回完全相同的估计面积,而且这个估计值在两个trapz面积的估计值之间。有关MATLAB的积分函数的其它信息,参阅《MATLAB参考指南》或在线帮助。
13.5 微分
与积分相反,数值微分非常困难。积分描述了一个函数的整体或宏观性质,而微分则描述一个函数在一点处的斜率,这是函数的微观性质。因此积分对函数的形状在小范围内的改变不敏感。而微分却很敏感。一个函数小的变化,容易产生相邻点的斜率的大的改变。
由于微分这个固有的困难,所以尽可能避免数值微分,特别是对实验获得的数据进行微分。在这种情况下,最好用最小二乘曲线拟合这种数据,然后对所得到的多项式进行微分。或用另一种方法,对该数据进行三次样条拟合,然后寻找如第11章所讨论的样条微分。例如,再次考虑第11章曲线拟合的例子。
>>x=[0 .1 .2 .3 .4 .5 .6 .7 .8 .9 1]
>>y=[-.447 1.978 3.28 6.16 7.08 7.34 7.66 9.56 9.48 9.30 11.2]; % data
>>n=2; % order of fit
>>p=polyfit(x , y , n) % find polynomial coefficients
p =
-9.8108 20.1293 -0.0317
>>xi=linspace(0 , 1 , 100);
>>z=polyval(p , xi); % evaluate polynomial
>>plot(x , y , ‘ o ' , x , y , xi , z , ' : ')
>>xlabel(‘ x ‘) , ylabel(‘ y=f(x) ‘) , title(‘ Second Order Curve Fitting ‘)
在这种情况下,运用多项式微分函数polyder求得微分。
>>pd=polyder(p)
pd =
-19.6217 20.1293
图13.6 二次曲线拟合
的微分是dy/dx=-19.6217x+20.1293。由于一个多项式的微分是另一个低一阶的多项式,所以还可以计算并画出该函数的微分。
>>z=polyval(pd , xi); % evaluate derivative
>>plot(xi , z)
>>xlabel(‘ x ‘) , ylabel(‘ dy/dx ‘) , title(‘ Derivative of a curve Fit Polynimial ‘)
(微分曲线如图13.7所示)
图13.7 曲线拟合多项式微分
在这种情况下,拟合的多项式为二阶,使其微分为一阶多项式。这样,微分为一条直线,它意味该微分与x成线性变化。
给定一些描述某函数的数据,MATLAB提供了一个计算其非常粗略的微分的函数。这个函数命名为diff,它计算数组中元素间的差分。因为微分定义为:
则y=f(x)的微分可近似为:
这里h>0
它是y的有限差分除以x的有限差分。因为diff计算数组元素间的差分,所以在MATLAB中,可近似求得函数的微分。继续前一个例子:
>>dy=diff(y) ./ diff(x); % compute differences and use array division
>>xd=x(1 : length(x)-1); % create new x axis since dy is shorter than y
>>plot(xd , dy);
>>title(‘ Approximate Derivative Using DIFF ‘)
>>ylabel(‘ dy/dx ‘) , xlabel(‘ x ‘)
图13.8 用diff得到的近似微分
由于diff计算数组元素间的差分,所以,其所得输出比原数组少了一个元素。这样,画微分曲线时,必须舍弃x数组中的一个元素。当舍弃x的第一个元素时,上述过程给出向后差分近似,而舍弃x的最后一个元素,则给出向前差分近似。比较上述两条曲线,显而易见,用有限差分近似微分会导致很差的结果,特别是被噪声污染了的数据。
13.6 微分方程
一般微分方程式描述系统内部变量的变化率如何受系统内部变量和外部激励,如输入,的影响。当常微分方程式能够解析求解时,可用MATLAB的符号工具箱中的功能找到精确解。在本书的后面将介绍该工具箱的一些特点。
在微分方程难以获得解析解的情况下,可以方便地在数值上求解。为了说明起见,考虑描述振荡器的经典的范得波(Var der Pol)微分方程。
与所有的数值求解微分方程组的方法一样,高阶微分方程式必须等价地变换成一阶微分方程组。对于上述微分方程,通过重新定义两个新的变量,来实现这种变换。
令y1=x 且 y2=dy/dx
则 dy1/dt=y2
根据这个微分方程组,可用MATLAB的函数ode23和ode45求出系统随时间变化的运动情况。调用这些函数时,需要编写一个函数M文件,给定当前时间及y1和y2的当前值,该函数返回上述导数值。MATLAB中,这些导数由一个列向量给出。在本例中,这个列向量为yprime。同样,y1和y2合并写成列向量y。所得函数M文件是:
function yprime=vdpol(t , y);
% VDPOL(t , y) returns derivatives of the Van der Pol equation:
%
% x ‘‘-mu *(1-x ^2)*x ‘+x=0 (‘ = d/dx , ‘‘ = d^2/dx^2)
%
% let y(1)=x and y(2)=x‘
%
% then y(1) ‘ = y(2)
% y(2) ‘ = MU*(1-y(1)^2)*y(2)-y(1)
global MU % choose 0<MU<10 in Command workspace
yprime=[y(2) MU*(1-y(1)^2)*y(2)-y(1)]; % output must be a column
给定这个完整地描述微分方程的函数,计算结果如下:
>>global MU % define MU as a global variable in the Command Workspace
>>MU=2; % set global parameter to desired value
>>[t , y]=ode23(‘ vdpol ‘ , 0 , 30 , [1 ; 0]); % to=0 , tf=30 , yo=[1 ; 0]
>>y1=y( : , 1); % first column is y(1) versus time points in t
>>y2=y( : , 2); % second column is y(2)
>>plot(t , y1 , t , y2 , ‘ -- ‘)
>>xlabel(‘ Time , Second ‘) , ylabel(‘ Y(1) and Y(2) ‘)
>>title(‘ Van der Pol Solution for mu=2 ‘)
所得的图见图13.9。
图13.9当mu=2时的范得波方程的运动曲线
在图13.9中,y2(虚线)是y1(实线)的导数。传递给ode23的参数由ode23(f_name , to , tf , yo , to1)描述。这里f_name是计算导数的M文件函数的字符串名,to是初始时间,tf是终止时间,yo是初始条件向量。可选择的参数to1(缺省值to1=1e-3)是所需的相对精度。在上例中,起始时间是第0秒,终止时间是第30秒,初始条件为y=[1;0]。两个输出参数是列向量t和矩阵y,其中向量t包含了估计响应的时间点,而矩阵y的列数等于微分方程组的个数(本例为2),且其行数与t相同。t中的时间点不是等间隔的,因为为了保持所需的相对精度,积分算法改变了步长。
函数ode45的使用与ode23完全一样。两个函数的差别在于必须与所用的内部算法相关。两个函数都运用了基本的龙格-库塔(Runge-Kutta)数值积分法的变形。ode23运用一个组合得2/3阶龙格-库塔-芬尔格(Runge-Kutta-Fehlerg)算法,而ode45运用组合的4/5阶龙格-库塔-芬尔格算法。一般地,ode45可取较多的时间步。所以,要保持与ode23相同误差时,在to和tf之间可取较少的时间步。然而,在同一时间,ode23每时间步至少调用f_name 3次,而ode45每时间步至少调用f_name 6次。
正如使用高阶多项式内插常常得不到最好的结果一样,ode45也不总是比ode23好。如果ode45产生的结果,对作图间隔太大,则必须在更细的时间区间,对数据进行内插,比如用函数interp1。这个附加时间点会使ode23更有效。作为一条普遍规则,在所计算的导数中,如有重复的不连续点,为保持精度致使高阶算法减少时间步长,这时低阶算法更有效。正是由于这个原因,电子电路分析按缺省,就用一阶算法编程,并且最多提供二阶算法来解决暂态时间响应问题。此外,通过对tol设置更小的值,要达到更高的精度,没有必要使绝对误差更小。tol设置每时间步的相对精度,不一定引起绝对误差减少。
总之,不要盲目使用数值方法。对于给定的问题,在决定最好的方法之前,要试一试各种可能的方法。有关微分方程数值解法的更进一步信息,请参考数值分析方面的书籍。有些参考书还提供了一些关于算法选择和如何处理那些时间常数变化范围大的病态方程的非常实用的信息。
13.7 M文件举例
这里所介绍的《精通MATLAB工具箱》中的M文件可近似求解由采样值给出的函数的积分和微分。这里假定这些函数本身不存在,且独立变量也许不是线性间隔。例如,已装载到MATLAB中要分析的数据来源于实验测试。
对于所包含的数据缺乏函数描述,有许多种积分和微分的方法。如前所述,人们可以用最小二乘多项式拟合数据,然后在多项式的描述上进行操作。另一种方法是寻找数据的三次样条表示,然后运用《精通MATLAB工具箱》中的函数spintgrl和spderiv来分别寻找积分和微分的样条表示。这里所介绍的方法提供了另一种更简单的方法。积分用梯形规则计算。用加权中心差分计算微分。此外,将函数设计成在矩阵形式下工作,矩阵的列代表各与自变量有关的因变量。
正如这章前面所述,MATLAB函数trapz计算在某有限区间的梯形积分。这里我们寻找的积分是自变量为x的函数。即如果y=f(x),我们寻找:
式中的x1是向量x的第一个元素。用梯形规则,这个积分近似为:
且S(x1)=0
这样,第k个数据点的积分是上述梯形面积的累加和。函数mmintgrl实现的这个算法如下:
function z=mmintgrl(x , y)
% MMINTgrl Compute Integral using Trapezoidal Rule.
% MMINTGRL(X , Y) computes the integral of the function y=f(x) given the
% data in X and Y. X must be a vector , but Y may be a column oriented
% data matrix. The length of X must equal the length of Y if Y is a
% vector , or it must equal the number of rows in Y if Y is a matrix.
%
% X need not be equally spaced. The trapezoidal algorithm is used.
%
% See also mmderiv
% Copyrigth (c) 1996 by Prentice-Hall , Inc.
flag=0; % falg is True if y is a row
x=x( : ); nx=length(x); % make x a column
[ry , cy]=size(y);
if ry==1&cy==nx , y=y .' ; ry=cy ; cy=1 ; flag=1 ; end
if nx~=ry , error(' X and Y not the right size ') , end
dx=x(2 : nx)-x(1 : nx-1); % width of each trapezoid
dx=dx( : , ones(1 , cy)); % duplicate for each column in y
yave=(y(2 : ry , : )+y(1 : ry-1 , :))/2; % average of heights
z=[zeros(1 , cy); cumsum(dx .* yave)]; % Use cumsum to find area
if flag , z=z'; end % if y was a row , return a row
在介绍上述函数的使用之前,考虑微分。在这种情况下,人们感兴趣的就是刚给定数据点的近似斜率。这里介绍一种下述的中心差分,而不是简单的向前或向后差分:
图13.10 加权中心差分方法
从图13.11可知,在第k个点的近似微分是:
式中,
并且Mk是连接yk-1到yk的直线的斜率。这样,第k点的微分是相邻两点间斜率的加权平均,离该点越近的点权越重。在第一个和最后一个数据点上,不能简单按照上述方法进行处理,因为这两个点都没有伴随的直线段。对于这些数据点,需要用另外的方法。这里所采取的方法是用二次多项式拟合前3个点(或最后3个点),并且计算这个多项式第一个(或最后一个)点的微分。函数mmderiv实现的这个算法如下:
function z=mmderiv(x , y)
% MMDERIV Compute Derivative Using Weighted Central Differences.
% MMDERIV(X , Y) computes the derivative of the function y=f(x) given the
% data in X and Y. X must be a vector , but Y may be a column oriented
% data matrix. The length of X must equal the length of Y if Y is a
% vector , or it must equal the number of rows in Y if Y is a matrix.
%
% X need not be equally spaced.Weighted central difference are used.
% Quadratic approximation is used at the endpoints.
%
% See also mmintgrl
% Copyrigth (c) 1996 by Prentice-Hall , Inc.
flag=0; % flag is True if y is a row
x=x( : ); nx=length(x); % make x a column
[ry , cy]=size(y);
if ry==1&cy==nx , y=y .'; ry=cy; cy=1; flag=1; end
if nx~=ry , error(' X and Y not the right size ') , end
if nx<3 , error(' X and Y must have st least three elements ') , end
dx=x(2 : nx)-x(1 : nx-1); % first difference in x
dx=dx+(dx==0)*eps; % make infinite slopes finite
dxx=x(3 : nx)-x(1 : nx-2); % second difference in x
dxx=dxx+(dxx==0)*eps; % make infinite slopes finite
alpha=dx(1 : nx-2) ./ dxx % central difference weight
alpha=alpha( : , ones(1 , cy)); % duplicate for each column in y
dy=y(2 : ry , :)-y(1 : ry-1 , : ); % first difference in y
dx=dx( : , ones(1 , cy)); % duplicate dx for each column in y
% now apply weighting to dy
z=alpha .* dy(2:ry-1 , :) ./ dx(2 : nx-1 , : )+(1-alpha) .* dy(1 : ry-2 , : ) ./ dx(1 : nx-2 , : );
z1=zeros(1 , cy)>=z1;
for i=1 : cy % fit quadratic at endpoints of each column
p1=polyfit(x(1 : 3) , y(1 : 3 , i) , 2); % quadratic at first point
z1(i)=2*p1(1)*x(1)+p1(2); % evalute poly derivative
pn=polyfit(x(nx-2 : nx) , y(ry-2 : ry , i) , 2); % quadratic at last point
zn(i)=2*pn(1)*x(nx)+pn(2); % evaluate poly derivative
end
z=[z1; z; zn];
if flag , z=z'; end % if y was a row , return a row
最后,给出一个例子:
>>x=linspace(0 , 2*pi , 30)
>>y=sin(x); % create data
>>yi=mmintgrl(x , y); % find integral
>>yd=mmderiv(x , y); % find derivative
>>plot(x , y , x , yi , ‘ - ‘ , x , yd , ‘ : ‘) % plot results
注意这个积分定性地证明了等式:
而微分定性地证明了等式:
图13.11 y=sin(x)极其积分、微分曲线
13.8 小结
表13.1总结了本章所讨论的函数。
表13.1
数值分析函数
fplot(‘ fname ‘ , [lb ub])
绘出上下限之间的函数
fmin(‘ fname ‘ , [lb ub])
寻找上下限内的标量最小值
fimis(‘ fname ‘ , xo)
寻找xo附近的向量最小值
fzero(‘ fname ‘ , xo)
寻找xo附近的标量函数的零点
trapz(x , y)
给定数据点x和y,计算y=f(x)下的梯形面积积分。
diff(x)
数组元素间的差分
[t , y]=ode23(‘ fname ‘ , to , tf , yo)
用2阶/3阶龙格-库塔算法解微分方程组
[t , y]=ode45(‘ fname ‘ , to , tf , yo)
用4阶/5阶龙格-库塔算法解微分方程组