第七章 回归设计第一节 概述第二节 一次回归正交设计第三节 二次回归正交设计第四节 二次回归正交旋转设计主要内容第一节 概 述
1 古典回归分析前面我们介绍的回归分析就是古典回归分析,它只是被动地处理已有的试验(或统计)数据,对试验的安排几乎不提任何要求,因此,再进行数据处理时,运算比较复杂,尤其是对多元回归,问题就更为突出。
古典回归分析对所要求的回归方程的精度也很少考虑,这不仅盲目的增加了试验次数,而且试验数据还往往不能提供充分的信息。
2 现代回归分析随着生产的发展,特别是由于寻求最佳工艺和参数以及建立生产过程的数学模型等需要,人们越来越要求以较少的试验建立精度较高的方程。这就要求摆脱古典回归分析的被动局面,主动地把 试验的安排、数据的处理和回归方程的精度 统一起来加以考虑,就是根据试验目的和数据分析来选择试验点,不仅使得在每个试验点上获得的数据含有最大的信息,从而减少试验次数,而且使数据的统计分析具有一些较好的性质。
正交设计虽然是一种重要的科学试验设计方法,
它能够利用较少的试验次数,获得较佳的试验结果,
但是它不能在一定的试验范围内,根据数据样本,去确定变量间的相关关系及其相应的回归方程。
回归设计就是在因子空间选择适当的试验点,以较少的试验处理建立一个有效的多项式回归方程,从而解决生产中的最优化问题,这种试验设计方法就被称为回归设计。
回归设计也称为 响应曲面设计,目的是寻找试验指标与各因子间的 定量 规律,考察的 因子都是定量 的 。它是在多元线性回归的基础上用主动收集数据的方法获得具有较好性质的回归方程的一种试验设计方法。
因此,将回归和正交结合在一起进行试验设计,这就是回归正交设计。回归正交设计是回归分析与正交试验设计法有机结合而形成的一种新的试验设计方法。它是回归设计中最基本的,也是最常用的和最有代表性的设计方法。可分为一次回归正交设计和二次回归正交设计,还有二次回归正交旋转设计。下面我们分别讲述。
一 一次回归正交设计的原理二 一次回归正交设计的步骤三 一次回归正交设计的应用第二节 一次回归正交设计其回归方程为:
可见一次回归正交设计解决的是多元线性回归问题一 一次回归正交设计的原理一次回归正交设计是解决在回归模型中,变量的最高次数为一次的(不包括交叉项的次数)多元回归问题,其数学模型为:
ippii
iippiii
zbzbzbby
Ni
zzzy
221101
22110
,,2,1
一次回归正交设计主要是应用二水平正交表,例如二水平正交表 L4(23),L8(211),L16(215),L64(263)等。
用 -1和 +1代换正交表中的 1,2两个水平符号,代换后,仍可看出每列所有数字相加之和为零,每两列同行各因素相乘之和为零,这说明代换后的设计表仍然具有正交性。
试验号 1 2 3
1 1 1 1
2 1 2 2
3 2 1 2
4 2 2 1
试验号 1 2 3
1 1 1 1
2 1 -1 -1
3 -1 1 -1
4 -1 -1 1
二 一次回归正交设计的步骤
(一)确定因素的变化范围例:有 p个因素 z1,zz,…,zp与某项指标 y,设计中首先要确定每个因素 zk的变化范围。设 z1k和 z2k分别表示 zk变化的下界和上界。假如试验在水平 z1k和 z2k上进行,
那么分别称 z1k和 z2k为 zk的下水平和上水平,称他们的算术平均值为 z0k。它们差的一半为其因素 zk的 变化区间 Δk
2
21
0
kk
k
zzz
2
12 kk
k
zz
(二)对因素 zk的水平进行编码所谓编码就是对因素的取值作如下的线性变换:
k
kk
k
zz
x
0
这样建立了因素 zk和 xk取值的变换关系即:
下水平 z1k -1
0水平 z0k 0
上水平 z2k +1
从变换关系式中可以知道当因素 zk在 [z1k,z2k]内变化时,它的编码 xk就在区间 [-1,+1]内变化。
因素 zk进行编码之后,原先要求算 y对 z1,z2,…,zp
的回归方程,现在变成求算 y对 x1,x2,…,xp的回归方程。不管在一次回归设计中还是二次回归设计中,都应当先对因素 zk进行编码。
因素 z1 z2 … zp
下水平( -1) z11 z12 … z1p
上水平( +1) z21 z22 … z2p
变化区间 Δ 1 Δ 2 … Δ p
零水平 z0j z02 … z0p
因素水平编码表
(三)选择正交表列出试验方案一次回归正交设计使用二水平正交表来安排实验,但究竟用哪一张二水平正角表,这是根据因素的个数而定的。
正交表确定后,就把各变量放入正交表某些列上,各列的水平号也就表示各因素的不同状态,这样就组成了一张试验计划表,即试验方案。
如果要考察交互作用,必须按照相应的交互作用表确定各因素在表中的列号。
然后就可以按照试验方案,进行试验实施,填写数据。
(四)回归系数的计算与统计检验这一部分的详细计算步骤不再讲述,目前主要应用数据统计软件 SAS,SPSS等进行。
可以得到回归方程以及相应的显著性检验。
data abc;
input Y X1-X3 ;
cards;
(数据 );
proc reg;
model Y = X1-X3/[selection=b sls=0.05] ;
run;
在正交设计所求得回归方程中,每一个回归系数的绝对值大小,刻化了对应变量在过程中的作用。这是由于经过无量纲的编码变换后,所有变量的取值都是 1和 -1,他们在所研究的区域都是平等的,因而使得所求得回归系数不受因素的单位和取值得影响,而直接反映了该因素作用的大小,回归系数的符号反映了这种作用的性质,同时回归系数间不存在相关性,这样经回归系数显著性检验不显著的变量,可一起全部从回归方程中剔除,不需要重新建立回归方程。
ippii xbxbxbby 22110
上述用一次回归正交设计方法求得一次回归方程是简单、
易行的,但是否能真实反映实际呢?由于试验是在各因子的上水平( +1)与下水平(- 1)处进行的,即使模型在这些边界点上拟合得很好,但是在因子编码空间的中心拟合是否也好呢?这可用在零水平处增加若干重复试验,再通过检验来判断。
设在各因子均取零水平时进行了 m 次试验,记其试验结果为,其平均值为,其偏差平方和及其自由度为,
myyy 00201,,,? iy0
m
i
ii yyS
1
2
000 )( 10 mf
(五)零水平的重复(回归方程的失拟性检验)
当一次回归模型在整个编码空间上都适宜时,则按一次回归方程应有如今在零水平上进行了 m 次重复试验,其平均值为这相当于存在两个正态分布:
要检验这两个正态分布的均值是否相等,即检验为此可采用 t统计量去检验。
iyy 00?
iy0
)/,(~? 200 nNyy i
)/,(~ 200 mNy i
001000,,,HH
ippii xxxy 22110
n
i
iyn
1
0
1?
t
y y
n m
0 0
1 1
0
0?
ff
SS
总总? 2
0
1
)b(yS
n
i
i总
2
0
1
00 )y(yS
m
i
i
1 nf 总 10 mf
在 时,有对给定的显著性水平,当 时认为模型在编码空间的中心也合适,不存在因子的非线性效应,否则需要另外寻找合适的模型,譬如建立二次回归方程,这将在后面内容中介绍。
00
)(~ 0fftt?总
)(
0fftt 总?
例 1,有一实验,从某物料中提取的蛋白质数量与反应时间和反应温度有关。根绝经验反应时间的变化范围为 20~30min,反应温度为 70~78℃ 。试用一次回归正交设计法求出回归方程。
设计步骤:
( 1) 确定因素上下水平反应时间 z11=20,z21=30;反应温度 z12=70,z22=78
2
21
0
kk
k
zzz
2
12 kk
k
zz
根据上述两个公式可得 z01=25,Δ 1=5; z02=74,Δ 2=4
( 2) 对因素水平进行编码因素 z1 z2
下水平( -1) 20 70
上水平( +1) 30 78
变化区间 5 4
零水平( 0) 25 74
( 3) 选择合适的正交表本例是个两因素试验,选择 L4(23)表比较合适。试验方案如下:
试验号 x1 x2 ( x1x2) y
1 1 1 1 41.5
2 1 -1 -1 40.9
3 -1 1 -1 40.0
4 -1 -1 1 39.3
5 0 0 0 40.3
6 0 0 0 40.5
7 0 0 0 40.7
8 0 0 0 40.2
9 0 0 0 40.6
data abc;
input X1 X2 Y @@ ;
cards;
1 1 41.5
1 -1 40.9
-1 1 40.0
-1 -1 39.3;
proc reg;
model Y = X1 X2 ;
run;
( 4) 计算回归方程及统计检验
data a;
input id x @@ ;
cards;
1 41.5 1 40.9 1 40.0 1 39.3
2 40.3 2 40.5 2 40.7 2 40.2
2 40.6;
proc ttest;
class id;
var x;
run;
21 325.0775.043.40 xxy
The S AS S yst e m 11,1 6 S a tur d ay,D ece mb er 1 7,2 006 7
The R EG P roc e dur e
Mod el,M O DEL 1
Dep en den t Va r iab l e,Y
Ana ly sis of V ari a nce
Sum of Mea n
So urc e D F Sq u are s S qua r e F V alu e Pr > F
Mo del 2 2,8 250 0 1,412 5 0 5 6 5.0 0 0.0 2 97
Er ror 1 0,0 025 0 0,0 025 0
Co rre c ted Tot a l 3 2,8 275 0
Roo t MSE 0,0 500 0 R - Sq uar e 0,9 991
Dep en den t Me a n 40,4 250 0 Adj R - Sq 0,9 973
Coe ff Va r 0,1 236 9
Par am ete r Es t ima t es
Par a met e r Sta n dar d
Va ria b le D F Est i mat e E r ror t V alu e Pr > |t |
In ter c ept 1 40,4 250 0 0.0 2 500 1 61 7.0 0 0,000 4
X1 1 0,7 750 0 0.0 2 500 3 1.0 0 0,020 5
X2 1 0,325 0 0 0,0 250 0 1 3,00 0,04 8 9
( 5) 失拟性检验
073.0
5
1
4
1
34
172.083.2
46.4043.40
11?
00
mn
yyt
34
172.083.2?
0
0
ff
SS
总总?
83.2)43.403.39(...)43.405.41( 2220
1
)b(yS
n
i
i总
172.0)46.406.40(...)46.403.40( 2220
1
00
)y(yS
m
i
i
3141 nf 总 41510 mf
|t|=0.073<t0.01(3+4)=3.50
The SAS System 15:12 Saturday,December 3,2007 4
The TTEST Procedur
Statistics
Lower CL Upper CL Lower CL Upper CL
Variable id N Mean Mean Mean Std Dev Std Dev Std Dev Std Err Min Max
x 1 4 38.88 40.42 41.97 0.55 0.97 3.61 0.48 39.3 41.5
x 2 5 40.20 40.46 40.71 0.12 0.20 0.59 0.09 40.2 40.7
x Diff (1-2) -1.07 -0.03 1.00 0.43 0.65 1.33 0.43
T-Tests
Variable Method Variances DF t Value Pr > |t|
x Pooled Equal 7 -0.08 0.9387
x Satterthwaite Unequal 3.22 -0.07 0.9477
Equality of Variances
Variable Method Num DF Den DF F Value Pr > F
x Folded F 3 4 21.92 0.0121
5 还原得到试验数据方程。
21 325.0775.043.40 xxy
4
74,
5
25 2
2
1
1
zxzx将代入方程:
得到方程:
这个方程即为实际数据所得方程。
21 0 8 2.01 5 5.054.30 zzy
例,硝基蒽醌中某物质的含量 y与以下三个因子有关:
z1:亚硝酸钠(单位:克)
z2:大苏打(单位:克)
z3:反应时间(单位:小时)
为提高该物质的含量,需建立 y关于变量 z1,z2,z3的回归方程。
1.试验设计
( 1)确定因子取值范围,并对它们的水平进行编码表 因子水平编码表因子水平 编码值 z1 z2 z3
上水平 +1 9.0 4.5 3
下水平 -1 5.0 2.5 1
零水平 0 7.0 3.5 2
变化区间 Δj 2 1 1
( 2)利用二水平正交表安排试验本例有三个因子,即 p=3,为今后可能需要考察因子间的交互作用方便起见,因此选用 L8(27),将三个因子分别置于 第一、二、四 列上,从而可得试验计划,并按计划进行试验。
试验计划及试验结果见表。
data abc;
input X1 X2 x3 Y @@ ;
cards;
1 1 1 92.35
1 1 -1 86.10
1 -1 1 89.58
1 -1 -1 87.05
-1 1 1 85.70
-1 1 -1 83.26
-1 -1 1 83.95
-1 -1 -1 83.38;
proc reg;
model Y = X1- x3;
run;
2.数据分析
Dependent Variable,Y Analysis of Variance
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 3 62.99634 20.99878 9.88 0.0254
Error 4 8.49995 2.12499
Corrected Total 7 71.49629
Root MSE 1.45773 R-Square 0.8811
Dependent Mean 86.42125 Adj R-Sq 0.7919
Coeff Var 1.68678
Parameter Estimates
Parameter Standard
Variable DF Estimate Error t Value Pr > |t|
Intercept 1 86.42125 0.51539 167.68 <.0001
X1 1 2.34875 0.51539 4.56 0.0104
X2 1 0.43125 0.51539 0.84 0.4498
x3 1 1.47375 0.51539 2.86 0.0460
,,,,y x x x86 42 2 35 0 43 1 471 2 3
data abc;
input X1 X2 x3 Y @@ ;
cards;
1 1 1 92.35
1 1 -1 86.10
1 -1 1 89.58
1 -1 -1 87.05
-1 1 1 85.70
-1 1 -1 83.26
-1 -1 1 83.95
-1 -1 -1 83.38;
proc reg;
model Y = X1 x3;
run;
Dependent Variable,Y Analysis of Variance
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 2 61.50853 30.75426 15.40 0.0073
Error 5 9.98776 1.99755
Corrected Total 7 71.49629
Root MSE 1.41335 R-Square 0.8603
Dependent Mean 86.42125 Adj R-Sq 0.8044
Coeff Var 1.63542
Parameter Estimates
Parameter Standard
Variable DF Estimate Error t Value Pr > |t|
Intercept 1 86.42125 0.49969 172.95 <.0001
X1 1 2.34875 0.49969 4.70 0.0053
x3 1 1.47375 0.49969 2.95 0.0319
31 47.135.242.86? xxy
data abc;
input X1 X2 x3 Y @@ ;
cards;
1 1 1 92.35
1 1 -1 86.10
1 -1 1 89.58
1 -1 -1 87.05
-1 1 1 85.70
-1 1 -1 83.26
-1 -1 1 83.95
-1 -1 -1 83.38;
proc reg;
model Y = X1- x3/selection=b sls=0.05;
run;
The SAS System 11:16 Sa turday,D ecember 17,20 06 34
The REG Proced ure
Model,MODEL1
Dependent Vari able,Y
Backward Elimi nation,S tep 0
All Variables Entered,R - Squa re = 0,8811 a nd C (p) = 4,0000
Analysis of Va ria nce
Sum of Me a n
Source DF Squ ares Squar e F Value Pr > F
Mode l 3 62,9963 4 2 0.99 878 9.8 8 0,0254
Erro r 4 8,499 95 2.12 499
Corrected Total 7 7 1.49629
Para met er S ta ndar d
Variable E stimate Error Type II SS F Value Pr > F
Intercept 8 6.42125 0,51539 597 49 28117.4 <.0001
X1 2,34 875 0,5153 9 44.1 33 01 20,77 0,0104
X2 0,43 125 0,5153 9 1.4 87 81 0,7 0 0,449 8
x3 1,47 375 0,5153 9 17.3 75 51 8,1 8 0,046 0
Bounds on cond ition num ber,1,9
Backward Elimi nation,S tep 1
Variable X2 Re moved,R - Square = 0.8603 and C(p) = 2,70 02
Analysis of Va ria nce
Sum of Mean
Source DF Squ ares Squar e F Value Pr > F
Model 2 61,50853 30.75426 15.40 0.0073
Error 5 9,98776 1.99755
Corrected Total 7 7 1.49629
Paramet er Sta ndard
Variable E stimate Error Type II SS F Value Pr > F
Intercept 8 6.42125 0,49969 597 49 29911.1 <.0001
X1 2.34 875 0.4996 9 44.133 01 22.09 0.0053
x3 1.47 375 0.4996 9 17.375 51 8.7 0 0.031 9
Bounds on cond ition num ber,1,4
--- ----------- --------- --------- ---------- --------- --- -------------- --------- --------- -----
-
All variables left in t he model are signif icant at the 0.0500 level,
The SAS System 11:16 Sa turday,D ecember 17,20 06 35
The REG Proced ure
Model,MODEL1
Dependent Vari able,Y
Summary of Bac kward Eli mination
Variable Number P arti al Mod el
Step Rem oved Vars In R - Square R - Sq uare C(p) F Va lue Pr > F
1 X2 2 0,0208 0.86 03 2.7002 0.7 0 0,4498
在正交回归设计中,当某一变量不显著时,可以直接将它删去,此时不会改变其它的回归系数,也不会改变这些变量的偏回归平方和,这是正交回归设计的一个优点 。
现在将 x2从回归方程中删去,最后得各因子均为显著的回归方程是:
将编码式:
代入,得 y关于 z1,z3的回归方程为:
,,,y x x86 42 2 35 1 471 3
22 7 3311 zxzx,
,,,( ),,,y z z z z86 42 2 35 72 1 47 2 75 255 1 175 1 471 3 1 3
从方程知,当 z1,z3增加时,y也会相应增加。
含交互作用的模型当变量间存在交互作用时,我们可以更一般地考虑建立含两个因子间交互作用的模型,其交互作用用两个因子的编码值的乘积表示,即可假定有如下的回归模型:
只要在回归的一次正交设计中,
n(试验次数) 大于
p为因素的个数,这就可以将其看成是 k元线性回归,并且这 k项仍然是相互正交的,因此可以在表中加上诸列,按同样的计算便可求得诸回归系数,并对它们进行检验。
ji
jiij
p
j
jj xxxy
1
0
kpp
^
2
我们可以建立如下回归方程:
ji
jiij
j
jj xxbxby
3
1
0
data abc;
input X1 X2 x3 Y @@ ;
x4=x1*x2;
x5=x1*x3;
x6=x2*x3;
cards;
1 1 1 92.35
1 1 -1 86.10
1 -1 1 89.58
1 -1 -1 87.05
-1 1 1 85.70
-1 1 -1 83.26
-1 -1 1 83.95
-1 -1 -1 83.38;
proc reg;
model Y = X1 - x6;
run;
Dependent Variable,Y Analysis of Variance
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 6 71.06848 11.84475 27.69 0.1445
Error 1 0.42781 0.42781
Corrected Total 7 71.49629
Root MSE 0.65407 R-Square 0.9940
Dependent Mean 86.42125 Adj R-Sq 0.9581
Coeff Var 0.75684
Parameter Estimates
Parameter Standard
Variable DF Estimate Error t Value Pr > |t|
Intercept 1 86.42125 0.23125 373.71 0.0017
X1 1 2.34875 0.23125 10.16 0.0625
X2 1 0.43125 0.23125 1.86 0.3134
x3 1 1.47375 0.23125 6.37 0.0991
x4 1 0.02375 0.23125 0.10 0.9348
x5 1 0.72125 0.23125 3.12 0.1975
x6 1 0.69875 0.23125 3.02 0.2035
data abc;
input X1 X2 x3 Y @@ ;
x4=x1*x2;
x5=x1*x3;
x6=x2*x3;
cards;
1 1 1 92.35
1 1 -1 86.10
1 -1 1 89.58
1 -1 -1 87.05
-1 1 1 85.70
-1 1 -1 83.26
-1 -1 1 83.95
-1 -1 -1 83.38;
proc reg;
model Y = X1 - x6/selection=b sls=0.05;
run;
The S AS S yste m 11:1 6 Sa turd ay,D ecemb er 1 7,2 006 41
The R EG P roce dure
Model,MO DEL1
Depen dent Var iabl e,Y
Backw ard Elim inat ion,Ste p 0
All V aria bles Ent ered,R - Squa re = 0.9 940 and C(p) = 7,0000
Analy sis of V aria nce
Su m of Mea n
S ourc e DF Sq uare s Squa re F Valu e Pr > F
M odel 6 71,0684 8 11,844 75 27.6 9 0.1 445
E rror 1 0,4278 1 0,427 81
C orre cted Tot al 7 71,4962 9
Par amet er S tand ard
V aria ble Est imat e Err or Typ e II SS F Val ue Pr > F
I nter cept 86,4212 5 0,231 25 59 7 49 1396 62 0.00 20
X 1 2,3487 5 0,231 25 4 4.13 3 01 103,16 0.06 25
X 2 0,4312 5 0,231 25 1.48 7 81 3,48 0.31 34
x 3 1,4737 5 0,231 25 1 7.37 5 51 40,61 0.09 91
x 4 0,0237 5 0,231 25 0.00 4 51 0,01 0.93 48
x 5 0,7212 5 0,231 25 4.16 1 61 9,73 0.19 75
x 6 0,6987 5 0,231 25 3.90 6 01 9,13 0.20 35
Bound s on con diti on n umbe r,1,36
----- ---- ---- ---- ---- ---- ---- ---- ---- ---- ---- ---- ---- - ----- ---- ---- ---- ---- ---- ---- ---- ---- -
Ba ck w ar d El im in at io n,S te p 1
Va ri a bl e x4 R em ov ed,R - Sq ua re = 0,9 94 0 an d C( p) = 5,0 1 05
An al y si s of V ar ia nc e
Su m of M ea n
S ou rc e DF Sq ua re s Sq ua re F Va lu e P r > F
M od el 5 7 1,06 39 6 14,2 12 79 65,7 5 0,0 15 0
E rr or 2 0,43 23 2 0,2 16 16
C or re ct ed T ot al 7 7 1,49 62 9
P ar am et er S ta nd ar d
V ar ia bl e E st im at e E rr or T yp e II SS F V al ue Pr > F
I nt er ce pt 8 6,42 12 5 0,1 64 38 59 7 49 27 64 08 <,00 01
X 1 2,34 87 5 0,1 64 38 4 4,13 3 01 20 4,17 0,00 49
X 2 0,43 12 5 0,1 64 38 1,48 7 81 6,88 0,11 97
x 3 1,47 37 5 0,1 64 38 1 7,37 5 51 8 0,38 0,01 22
x 5 0,72 12 5 0,1 64 38 4,16 1 61 1 9,25 0,04 82
x 6 0,69 87 5 0,1 64 38 3,90 6 01 1 8,07 0,05 11
Bo un d s on c on di ti on n um be r,1,25
-- -- - -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- - -- -- - -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -
Bac kw ard Eli m ina t ion,St e p 2
The S AS S yst e m 11,1 6 S a tur d ay,D ece mb er 1 7,2 006 42
The R EG P roc e dur e
Mod el,M O DEL 1
Dep en den t Va r iab l e,Y
Bac kw ard Eli m ina t ion,St e p 2
Var ia ble X2 R emo v ed,R - Sq uar e = 0,97 3 1 a n d C ( p) = 6,4 8 83
Ana ly sis of V ari a nce
Su m of M e an
Sou r ce DF S qua r es Sq u are F Va l ue P r > F
M ode l 4 69,576 1 5 17,3 9 404 27,1 8 0,0 108
Err o r 3 1,92 0 14 0.6 4 005
Cor r ect e d T o tal 7 7 1,49 6 29
P a ram e ter Sta n dar d
Var i abl e E s tim a te E r ror T y pe I I SS F V a lue Pr > F
Int e rce p t 8 6,42 1 25 0.2 8 285 5 9 749 933 5 1.2 <,0 001
X1 2,34 8 75 0.2 8 285 44,1 3 301 6 8,95 0,0 037
x3 1,47 3 75 0.2 8 28 5 17,3 7 551 2 7,15 0,0 137
x5 0,72 1 25 0.2 8 285 4,1 6 161 6,50 0,0 839
x6 0,69 8 75 0.2 8 285 3,9 0 601 6,10 0,0 900
Bou nd s o n co n dit i on n umb e r,1,1 6
--- -- --- - --- - --- - --- - --- - --- - --- - --- - --- - --- - --- - --- - - --- -- --- - --- - --- - --- - --- - --- - --- - --- - -
Bac kw ard Eli m ina t ion,St e p 3
Var ia ble x6 R emo v ed,R - Sq uar e = 0,91 8 5 a n d C ( p) = 13,6 185
Ana ly sis of V ari a nce
S u m o f Me a n
S our c e DF S q uar e s Squ a re F Val u e Pr > F
Mod el 3 65,670 1 4 21,8 9 005 15,0 3 0,0 121
E rro r 4 5,826 1 5 1,45 6 54
C orr e cte d To t al 7 71,496 2 9
Pa r ame t er S tan d ard
V ari a ble Es t ima t e Er r or Ty p e I I SS F Va l ue Pr > F
I nte r cep t 86,421 2 5 0,42 6 69 5 9 7 49 4 102 1,3 <.0 0 01
X 1 2,348 7 5 0,42 6 69 4 4.1 3 3 01 30,30 0.0 0 53
x 3 1,473 7 5 0,42 6 69 1 7.3 7 5 51 11,93 0.0 2 60
x 5 0,721 2 5 0,42 6 69 4.1 6 1 61 2,86 0.1 6 62
Bou nd s o n co n dit i on n umb e r,1,9
--- -- --- - --- - --- - --- - --- - --- - --- - --- - --- - --- - --- - --- - - --- -- --- - --- - --- - --- - --- - --- - --- - --- - -
Bac kw ard Eli m ina t ion,St e p 4
The S AS S yst e m 11,1 6 S a tur d ay,D ece mb er 1 7,2 006 43
The R EG P roc e dur e
Mod el,M O DEL 1
Dep en den t Va r iab l e,Y
Bac kw ard Eli m ina t ion,St e p 4
Var ia ble x5 R emo v ed,R - Sq uar e = 0,86 0 3 a n d C( p) = 21,3 461
Ana ly sis of V ari a nce
Su m of Mea n
S our c e DF S q uar e s Squ a re F Val u e Pr > F
M ode l 2 61,508 5 3 30,75 4 26 15,4 0 0,0 073
E rro r 5 9,987 7 6 1,99 7 55
C orr e cte d To t al 7 71,496 2 9
P a ram e ter Sta n dar d
Var i abl e E s tim a te E r ror T y pe I I SS F V a lue Pr > F
Int e rce p t 8 6,42 1 25 0.4 9 969 5 9 749 299 1 1.1 <,0 001
X1 2,34 8 75 0.4 9 969 44,1 3 301 2 2,09 0,0 053
x3 1,47 3 75 0.4 9 969 17,3 7 551 8,70 0,0 319
Bou nd s o n co n dit i on n umb e r,1,4
--- -- --- - --- - --- - --- - --- - --- - --- - --- - --- - --- - --- - --- - - --- -- --- - --- - --- - --- - --- - --- - --- - --- - -
All v ari a ble s le f t i n th e mo d el a re s ign i fic a nt a t t h e 0,05 00 l eve l,
Sum ma ry o f B a ckw a rd E lim i nat i on
V ari a ble Num b er P art i al M od el
S tep R emo v ed Var s In R - Squ are R - Squ ar e C ( p) F V a lue P r > F
1 x 4 5 0.0 0 01 0,99 40 5,010 5 0,01 0,93 4 8
2 X 2 4 0.0 2 08 0,97 31 6,488 3 6,88 0,11 9 7
3 x 6 3 0.0 5 46 0,91 85 13,618 5 6,10 0,09 0 0
4 x5 2 0,0 582 0,8 603 21,34 6 1 2.8 6 0.1 6 62
三 一次回归正交设计的应用
(一)确定最佳工艺参数
(二)寻找最优区域一般都希望通过回归方程来进行最优控制或寻找最佳工艺参数,但假若不是在最优区域内建立的回归方程,就不能用来寻找最佳工艺参数。因为超出了实验所在的范围,回归方程可能并非是仍为一次关系,
所以进行最优控制或确定最优生产条件时,首先必须寻找各个变量变化的最优区域。
这里介绍 快速登高法 来寻求最优区域。
快速登高法来寻求最优区域的具体步骤:
例 1,有一实验,从某物料中提取的蛋白质数量与反应时间和反应温度有关。根绝经验反应时间的变化范围为 20~30min,反应温度为 70~78℃ 。试用一次回归正交设计法求出回归方程。
设计步骤:
( 1) 确定因素上下水平反应时间 z11=20,z21=30;反应温度 z12=70,z22=78
2
21
0
kk
k
zzz
2
12 kk
k
zz
根据上述两个公式可得 z01=25,Δ 1=5; z02=74,Δ 2=4
( 2) 对因素水平进行编码因素 z1 z2
下水平( -1) 20 70
上水平( +1) 30 78
变化区间 5 4
零水平( 0) 25 74
21 325.0775.043.40 xxy
下面我们以前面的例子用快速登高法寻找最优区域,
之后建立回归方程。
前面已列出因素水平编码表,建立了回归方程,找到了梯度方向,随即可安排快速登高试验计划。先选择
e,为使各因素步长整数化,并考虑到反应时间对蛋白质提取率是重要因素,应使 z1的步长取得比较合适,现取其步长为 5min,并照顾其他因素的步长。由此可确定
e=5/3.875。快速登高法的原始数据与试验计划列于表中。
21 325.0775.043.40 xxy
因素名称 Z1 Z2
零水平 z0j
变化区间 Δj
回归系数 bj
步长 Δjbj
调整步长 eΔjbj
25
5
0.775
3.875
5
74
4
0.325
1.3
1.68
试验号
1
2
3
.
.
.
10
11
Z01+keΔ1b1=z1j
25+1× 5=30
25+2× 5=35
40
.
.
.
75
80
Z02+keΔ2b2=z2j
74+1× 1.68=75.68
74+2× 1.68=77.36
79.04
.
.
.
90.8
92.48
Yi
41.3
41.6
41.9
.
.
.
80.3
79.2
有上表可以看出,当试验进行到第 10号试验时,指标 y达到 80.3,到第 11号试验时,指标 y又降为 79.2,所以这一轮实验就此停止,根据经验如指标 y仍未达到最大时,可以在将第 10号试验各因素的水平,作为新零水平,重复前面的寻优做法,直到找到满意的指标为止。
本例中 y=80.3,认为已满足需要,接下去是在小区域内建立回归方程进行显著性检验。
因素 z1 z2
下水平( -1) 70 86.8
上水平( +1) 80 94.8
变化区间 5 4
零水平 75 90.8
建立新的因素水平表试验号 x0 x1 x2 x1x2 y
1 1 1 1 1 79.5
2 1 1 -1 -1 78.0
3 1 -1 1 -1 77.0
4 1 -1 -1 1 76.5
5 0 0 0 0 79.9
6 0 0 0 0 80.3
7 0 0 0 0 80.0
8 0 0 0 0 79.7
9 0 0 0 0 79.8
试验方案表分析程序:
data abc;
input X1 X2 Y @@ ;
cards;
1 1 79.5
1 -1 78.0
-1 1 77.0
-1 -1 76.5;
proc reg;
model Y = X1 x2/selection=b sls=0.05;
run;
Th e S AS S ys te m 11,1 6 Sa tu rd ay,D ec em b er 1 7,2 00 6 4 6
Th e R EG P ro ce du re
Mo de l,MO DE L1
De pe n de nt V ar ia bl e,Y
An al y si s of V ar ia nc e
S um o f Me an
S ou rc e DF Sq ua re s Sq ua re F Va lu e P r > F
M od el 2 5,00 00 0 2,5 00 00 10,0 0 0,2 18 2
E rr or 1 0,25 00 0 0,2 50 00
C or re ct ed T ot al 3 5,25 00 0
Ro ot MS E 0,5 00 00 R - Sq ua re 0,9 52 4
De pe n de nt M ea n 77,7 50 00 Ad j R - Sq 0,8 57 1
Co ef f V ar 0,6 43 09
Pa ra m et er E st im at es
Pa r am et er S ta nd ar d
V ar ia bl e DF E st im at e E rr or t Va lu e P r > |t |
I nt er ce pt 1 7 7,75 00 0 0,2 50 00 3 11,0 0 0,0 02 0
X 1 1 1,00 00 0 0,2 50 00 4,0 0 0,1 56 0
X2 1 0,5 00 00 0,25 00 0 2,0 0 0,29 52
从上述分析的结果可知,回归方程为:
经检验是不显著的,两个因素的回归系数也是不显著的,说明回归方程在试验区间内部拟合不好,需要二次或更高次回归设计。
21 5.075.77 xxy
一 二次回归正交设计的步骤二 二次回归正交设计的应用第三节 二次回归正交设计
nixxxxxxy iiiiiiii,,2,12 2222111211222110,
一,二次回归正交设计的步骤
1、确定 Z1,Z2,……,Zp的变化范围。
2、确定 mc和 m0,确定 n=mc+2p+m0,再确定 r,列出试验计划表。 mc=2p。
m0是中心试验点的重复次数。
mc是因素分别只取 +1和 -1水平时的试验次数。
2p是只有一个因素取 +r或 -r时的试验次数。
n是总的试验次数。
2
)2( 02 ccc mmmpm
r
二次回归正交设计的参数 值表?
因素水平编码表
3、对因素水平进行编码。
因素 Z1 Z2 Z3
+r
上水平( +1)
零水平( 0)
下水平( -1)
-r
变化区间 Δj
20
rr zzz
r
zz r
j
0
j
j
zz
zz
01
01
3、确定试验计划表,进行试验的实施。
4、对试验结果利用 SAS进行统计分析。
5、建立回归方程并进行讨论。
例:某食品加香试验,3个因素,即 Z1(香精用量),Z2
(着香时间),Z3(着香温度),使进行二次回归正交组合设计,并进行统计分析。
( 1)确定因素水平变化范围香精用量 Z1 ( 6~18 mL/kg)
着香时间 Z2 ( 8~24 h)
着香温度 Z3 ( 22~48 ℃ )
( 2)确定 r,mc和 m0。
mc=2p=23=8,m0=4,r=1.414
2
)2( 02 ccc mmmpm
r
二、二次回归正交设计的应用因素 Z1 Z2 Z3
+r( 1.414) 18 24 48
上水平( +1) 16.24 21.66 44.19
零水平( 0) 12 16 35
下水平( -1) 7.76 10.34 25.81
-r( -1.414) 6 8 22
变化区间 Δj 4.24 5.66 9.19
因素水平编码表
r
zz jrj
j
0
20
rr zzz
j
j
zz
zz
01
01
3、确定试验计划表,进行试验的实施。
x1 x2 x3 y
1 1 1 2.32
1 1 -1 1.25
1 -1 1 1.93
1 -1 -1 2.13
-1 1 1 5.85
-1 1 -1 0.17
-1 -1 1 0.80
-1 -1 -1 -0.56
1.414 0 0 1.60
-1.414 0 0 0.56
0 1.414 0 5.54
0 -1.414 0 3.89
0 0 1.414 3.57
0 0 -1.414 2.52
0 0 0 5.80
0 0 0 5.70
0 0 0 5.90
0 0 0 5.75
mc=2p
2p
m0
dat a a bc ;
inp ut x 1 - x 3 y;
c ar d s ;
1 1 1 2,32
1 1 - 1 1,25
1 - 1 1 1,93
1 - 1 - 1 2,13
- 1 1 1 5,85
- 1 1 - 1 0,17
- 1 - 1 1 0,80
- 1 - 1 - 1 - 0,56
1,414 0 0 1,60
- 1,414 0 0 0,56
0 1,414 0 5,54
0 - 1,414 0 3,89
0 0 1,414 3,57
0 0 - 1,414 2,52
0 0 0 5,80
0 0 0 5,70
0 0 0 5,90
0 0 0 5,75;
p r oc s o r t ;
b y x 1 - x 3 ;
pr oc r s r e g;
m ode l y= x 1 x 2 x 3 / l ac kf it ;
r un ;
Th e S AS S ys te m 11,1 6 Sa tu rd ay,D ec em b er 1 7,2 00 6 5
Th e R SR EG P ro ce du re
Co di n g Co ef fi ci en ts f or t he I nd ep en de nt V ar ia bl es
Fa ct o r S ub tr ac te d of f D iv id ed b y
X1 0 1,4 14 00 0
X2 0 1,4 14 00 0
X3 0 1,4 14 00 0
Re sp o ns e Su rf ac e fo r Va ri ab le Y
Re sp o ns e Me an 3,0 40 00 0
Ro ot MS E 0,5 47 67 4
R - Sq u ar e 0,9 72 1
Co ef f ic ie nt o f Va ri at io n 18,0 15 6
Ty pe I Su m
Re gre s sio n D F o f Sq u are s R - Squ a re F Val u e Pr > F
Li nea r 3 1 2.8 7 136 4 0,14 99 14,3 0 0,0 014
Qu adr a tic 3 5 7.0 0 832 1 0,66 40 63,3 5 <,0 001
Cr oss p rod u ct 3 1 3.5 7 873 8 0,15 82 15,0 9 0,0 012
To tal Mod e l 9 8 3.4 5 842 3 0,97 21 30,9 2 <,0 001
Sum of
Res id ual D F Sq u are s Me a n S q uar e F Val u e Pr > F
Lac k of F it 5 2.3 7 770 2 0.4 7 554 0 65,2 2 0,0 029
Pur e E r ror 3 0,021 8 75 0,00 729 2
Tot al E rro r 8 2,399 5 77 0,29 994 7
Pa ra m et er Es t im at e
St an da rd fr om C od ed
P ar am et er DF Es ti ma te E rr or t Va lu e P r > |t | D at a
I nt er ce pt 1 5,74 05 33 0,25 81 57 22,2 4 <,0 00 1 5,7 40 53 3
X 1 1 0,23 67 37 0,15 81 08 1,5 0 0,1 72 7 0,3 34 74 6
X 2 1 0,63 53 22 0,15 81 08 4,0 2 0,0 03 9 0,8 98 34 6
X 3 1 0,78 29 70 0,15 81 08 4,9 5 0,0 01 1 1,1 07 12 0
X 1* X1 1 - 2,28 40 18 0,19 36 71 - 11,7 9 <,0 00 1 - 4,5 66 65 6
X 2* X1 1 - 0,78 37 50 0,19 36 32 - 4,0 5 0,0 03 7 - 1,5 67 02 7
X 2* X2 1 - 0,46 59 69 0,19 36 71 - 2,4 1 0,0 42 8 - 0,9 31 65 6
X 3* X1 1 - 0,77 12 50 0,19 36 32 - 3,9 8 0,0 04 0 - 1,5 42 03 4
X 3* X2 1 0,69 87 50 0,19 36 32 3,6 1 0,0 06 9 1,3 97 07 8
X 3* X3 1 - 1,30 12 21 0,19 36 71 - 6,7 2 0,0 00 1 - 2,6 01 65 6
Su m of
F act o r D F Sq u are s Me a n S q u are F Val u e Pr > F
X 1 4 5 2.0 6 228 4 1 3.0 1 5 571 43,3 9 <,0 001
X 2 4 1 5.3 9 956 6 3.8 4 9 891 12,8 4 0,0 015
X 3 4 2 9.5 6 035 2 7.3 9 0 088 24,6 4 0,0 001
The S AS S yst e m 11,1 6 S a tur d ay,D ece mb er 1 7,2 006 6
The R SRE G Pr o ced u re
Can on ica l An a lys i s o f Re s pon s e S u rfa c e B a sed on C ode d Dat a
Cri ti cal Val u e
Fac to r Cod e d U n cod e d
X1 - 0.2 624 4 0 - 0.3 710 9 0
X2 1,1 527 4 4 1,6 299 8 1
X3 0,6 000 5 7 0,8 484 8 1
Pre di cte d va l ue a t s t ati o nar y po i nt,6.5 4 655 7
E i g e n v e c t o r s
E i g e n v a l u e s X 1 X 2 X 3
- 0,4 3 1 2 1 6 - 0,2 3 9 4 3 1 0,8 9 6 2 0 2 0,3 7 3 4 9 0
- 2,7 6 3 6 8 6 - 0,1 9 5 6 1 0 - 0,4 2 1 3 1 7 0,8 8 5 5 6 7
- 4,9 0 5 0 6 6 0,9 5 1 0 0 4 0,1 3 8 9 7 4 0,2 7 6 1 8 3
S t a t i o n a r y p o i n t i s a m a x i m u m
一 二次回归正交旋转设计的步骤二 二次回归正交旋转设计的应用第四节 二次回归正交旋转设计一,二次回归正交旋转设计的步骤
1、确定 Z1,Z2,……,Zp的变化范围。
计算零水平:
20
rjrj
j
zz
z?
r
zz jr
j
01
r为待定参数,可以从参数表中查。
二次回归正交旋转组合设计参数
因素水平编码表
2、列出因素水平编码表。
因素 Z1 Z2 Z3
+r Z1r
上水平( +1)
零水平( 0) Z01
下水平( -1)
-r Z-1r
变化区间 Δj
r
zz jr
j
01
j
j
zz
zz
01
01
3、确定试验计划表,进行试验的实施。
4、对试验结果利用 SAS进行统计分析。
5、建立回归方程并进行讨论。
二、二次回归正交旋转设计的应用例:研究尿素包合法富集鱼油中的 DHA和 EPA的工艺参数(尿素与脂肪酸的比例 Z1、结晶温度 Z2、结晶时间 Z3)
对 DHA和 EPA总含量的影响。
( 1)确定因素的变化范围尿素与脂肪酸的比例,0~25
结晶温度,-25℃ ~25℃
结晶时间,3h~29h
计算零水平,Z10=(0+25)/2=12.5
Z20=(-25+25)/2=0
Z30=(3+29)/2=16
查参数表 r=1.682 由此可以按照标准表安排试验方案。
因素水平编码表
2、列出因素水平编码表。
因素 Z1 Z2 Z3
+r 1.682 25 25 29
上水平( +1) 20 15 24
零水平( 0) 12.5 0 16
下水平( -1) 5 -15 8
-r -1.682 0 -25 3
变化区间 Δj 7.5 15 8
Run Z1 Z2 Z3 Y
1 1 1 1 78.99
2 1 1 -1 79.13
3 1 -1 1 84.61
4 1 -1 -1 85.66
5 -1 1 1 42.77
6 -1 1 -1 48.02
7 -1 -1 1 56.20
8 -1 -1 -1 52.73
9 1.682 0 0 83.11
10 -1.682 0 0 27.99
11 0 1.682 0 75.89
12 0 -1.682 0 81.28
13 0 0 1.682 81.89
14 0 0 -1.682 84.50
15 0 0 0 80.44
16 0 0 0 81.23
17 0 0 0 79.64
18 0 0 0 89.33
19 0 0 0 82.47
20 0 0 0 82.02
21 0 0 0 83.45
22 0 0 0 82.73
23 0 0 0 82.60
3、确定试验计划表,进行试验的实施。
4、对试验结果利用 SAS进行统计分析。
dat a a bc ;
inp ut x 1 - x 3 y;
c ar d s ;
1 1 1 78,99
1 1 - 1 79,13
1 - 1 1 84,61
1 - 1 - 1 85,66
- 1 1 1 42,77
- 1 1 - 1 48,02
- 1 - 1 1 56,20
- 1 - 1 - 1 52,73
1,682 0 0 83,1 1
- 1,68 2 0 0 27,99
0 1,682 0 75,89
0 - 1,68 2 0 81,28
0 0 1,682 81,89
0 0 - 1,68 2 84,50
0 0 0 80,44
0 0 0 81,23
0 0 0 79,64
0 0 0 89,33
0 0 0 82,47
0 0 0 82,02
0 0 0 83,45
0 0 0 82,73
0 0 0 82,60;
p r o c s o r t ;
b y x 1 - x 3 ;
pr oc r s r e g;
m ode l y= x 1 x 2 x 3 / l ac kf it ;
r un ;
Th e S A S S y st e m
C o d i n g C o e f f i c i e n t s f o r t h e I n d e p e n d e n t V a r i a b l e s
F a c t o r S u b t r a c t e d o f f D i v i d e d b y
X 1 0 1.68 200 0
X 2 0 1.68 200 0
X 3 0 1,6 8 2 0 0 0
Th e S A S S y st e m
R e sp on s e S u r f a c e f o r V a r i a bl e Y
R e s p o n s e M e a n 7 4,2 0 3 4 7 8
R o o t M S E 3.9 018 43
R - S qu a r e 0.9 664
C o e f,o f V a r i a t i o n 5.2 583
D e g r e e s
o f T yp e I S um
R e g r e ss i o n F r e e dom of S q u a r e s R - Sq u a r e F - R a t i o P r o b > F
L i n e a r 3 370 5.67 163 1 0.62 99 81.1 3 5 0,000 0
Q u a d r a t i c 3 196 7,663 531 0.33 44 43.0 8 1 0,000 0
C r o ss p r odu c t 3 12.1 5 303 8 0.00 2 1 0.26 6 0.8 486
To t a l R e g r e ss 9 56 85.4 881 9 9 0,96 64 41.4 9 4 0,000 0
D e g r e e s
o f S um o f
R e si du a l F r e e d om S q u a r e s M e a n S qu a r e F - R a t i o P r o b > F
L a c k of F i t 5 136,256 123 2 7,251 225 3.53 6 0.05 5 4
P u r e Er r o r 8 6 1,6 6 0 8 0 0 7,707 600
To t a l Er r o r 13 197,9 169 23 15,224 379
D e g r e e s P a r a m e t e r Est i m a t e
o f P a r a m e t e r S t a n d a r d T f o r H 0,f r om C od e d
P a r a m e t e r F r e e d om Est i m a t e Er r o r P a r a m e t e r = 0 P r o b > | T| D a t a
I N T ER C EP T 1 82.7 813 71 1.29 977 1 63.6 89 0.00 00 82.7 813 71
X 1 1 16.2 086 56 1.05 5 7 77 15.3 52 0.00 00 27,262 959
X 2 1 - 2.881481 1.0 557 77 - 2.72 9 0.01 72 - 4.84 665 1
X 3 1 - 0.538870 1.0 557 77 - 0.51 0 0.61 83 - 0.90 637 9
X 1* X 1 1 - 10.7 861 79 0.97 8 660 - 1 1.02 1 0.00 00 - 30.5 15 436
X 2* X 1 1 0,748 750 1.37 95 10 0.54 3 0.59 65 2,118 307
X 2* X 2 1 - 2.64 408 2 0,978 6 60 - 2.70 2 0.01 8 1 - 7.48 0 436
X 3* X 1 1 0,073 750 1.37 951 0 0.05 35 0,958 2 0,208 648
X 3* X 2 1 - 0.97 625 0 1,379 510 - 0.70 8 0.49 1 6 - 2.76 1 932
X 3* X 3 1 - 1.01 460 3 0,978 6 60 - 1.03 7 0.31 8 8 - 2.87 0 436
De g r e e s
o f S u m o f
F a c t o r F r e e d o m S q u a r e s M e a n S q u a r e F - R a t i o P r o b > F
X1 4 5 4 4 2,1 4 6 1 2 2 1 3 6 0,5 3 6 5 3 1 8 9,3 6 6 0,0 0 0 0
X2 4 2 3 6,6 4 1 5 9 9 5 9,1 6 0 4 0 0 3,8 8 6 0,0 2 7 3
X3 4 2 7,9 9 7 3 0 0 6,9 9 9 3 2 5 0,4 6 0 0,7 6 4 0
Th e S A S S y s t e m
C a n o n i c a l An a l y s i s o f R e s p o n s e S u r f a c e
( b a s e d o n c o d e d d a t a )
C r i t i c a l V a l u e
F a c t o r C o d e d U n c o d e d
X1 0,4 3 7 6 6 7 0,7 3 6 1 5 5
X2 - 0,2 5 8 7 5 8 - 0,4 3 5 2 3 0
X3 - 0,0 1 7 4 8 7 - 0,0 2 9 4 1 3
P r e d i c t e d v a l u e a t s t a t i o n a r y p o i n t 8 9,3 8 2 3 9 5
Ei g e n v e c t o r s
Ei g e n v a l u e s X1 X2 X3
- 2,4 8 7 2 2 5 - 0,0 0 6 5 3 5 - 0,2 6 7 8 4 4 0,9 6 3 4 4 0
- 7,8 1 4 0 3 4 0,0 4 6 1 3 0 0,9 6 2 3 5 4 0,2 6 7 8 5 5
- 3 0,5 6 5 0 5 0 0,9 9 8 9 1 4 - 0,0 4 6 1 9 4 - 0,0 0 6 0 6 6
S t a t i o n a r y p o i n t i s a m a x i m u m,
经分析等到回归方程
2
33231
2
221
2
1321
01.198.007.065.275.079.1054.088.221.1678.82 xxxxxxxxxxxxy
对方程的系数进行 t 检验,剔除不显著项,得到的回归方程为
2
2
2
121
65.279.1088.221.1678.82 xxxxy
通过上述 SA S 的 r s r e g 过程的分析还可知,该数学模型具有最大值,而且知道在最大值点处的坐标。
go p t i o n s r e s e t = g l o b a l gu ni t = pc t b o r de r c b a c k= w hit e
c o l o r s = ( bl a c k)
f t e x t = s w i s s f t i t l e = s w i s s b h t i t l e = 6 h t e x t = 4 ;
da t a t e m ;
do x 1= - 1 t o 1 by 0,1;
do x 2= - 1 t o 1 by 0,1;
Y= 82,7 8 + 16,21 *x 1 - 2,88 *x 2 - 10,7 9 *X1* X 1 - 2,6 5 *x 2* x 2;
o u t pu t ;
e n d ;
e n d ;
r un;
t it l e ' F igur e 1 ';
pr o c g3d da t a = t e m ;
pl ot x 2* x 1= y/g r id
r ot at e = 45
c t op= bl ac k
c bot t om = bl ac k
x t ic k nu m = 5
yt ic k nu m = 5
z t ic k nu m = 5
z m in= 45
z m a x = 100 ;;
r un;
go p t i o n s r e s e t = g l o b a l gu ni t = pc t b o r de r c b a c k= w hit e
c o l o r s = ( b l a c k )
f t e x t = s w i s s f t i t l e = s w i s s b h t i t l e = 6 h t e x t= 4;
t it l e 1 ' F igu r e 2 ';
ax is 1 o r d e r = ( - 1 t o 1 b y 0,5) ;
ax is 2 o r d e r = ( - 1 t o 1 b y 0,5) ;
l e ge n d1 po s i t i o n = ( r i g h t m i dd l e )
l a b e l = ( p o s i t i o n = t o p )
a c r o s s = 1 ;
s y m b o l 1 h e i g h t = 2,5
f o n t = s w i s s b
v a l u e = 'l o w e s t '
c o l o r = r e d ;
s y m b o l 2 h e i g h t = 2,5
s t e p = 2 5 p c t
c o l o r = b l a c k ;
s y m b o l 3 h e i g h t = 2,5
c o l o r = b l a c k ;
s y m b o l 4 h e i g h t = 2,5
c o l o r = b l a c k ;
pr o c gc o n to ur da t a = t e m ;
p l ot x 2* x 1= y/ l e ve ls = 45 t o 95 b y 4
a u t o l a b e l = ( c h e c k = n o n e )
h a xi s = a xi s 1
v a x i s = a x i s 2
l e g e n d = l e g e n d 1 ;
r un;
data abc;
input x1-x3 y;
cards;
(数据);
proc sort;
by x1-x3;
proc rsreg;
model y=x1 x2 x3/lackfit;
ridge min max center=m1,m2,m3 radius=0 to R by i;
run;
(m1,m2,m3)中心点的坐标
R是半径,R是半径的间隔
http://www.okstate.edu/sas/v8/saspdf/stat/
1 古典回归分析前面我们介绍的回归分析就是古典回归分析,它只是被动地处理已有的试验(或统计)数据,对试验的安排几乎不提任何要求,因此,再进行数据处理时,运算比较复杂,尤其是对多元回归,问题就更为突出。
古典回归分析对所要求的回归方程的精度也很少考虑,这不仅盲目的增加了试验次数,而且试验数据还往往不能提供充分的信息。
2 现代回归分析随着生产的发展,特别是由于寻求最佳工艺和参数以及建立生产过程的数学模型等需要,人们越来越要求以较少的试验建立精度较高的方程。这就要求摆脱古典回归分析的被动局面,主动地把 试验的安排、数据的处理和回归方程的精度 统一起来加以考虑,就是根据试验目的和数据分析来选择试验点,不仅使得在每个试验点上获得的数据含有最大的信息,从而减少试验次数,而且使数据的统计分析具有一些较好的性质。
正交设计虽然是一种重要的科学试验设计方法,
它能够利用较少的试验次数,获得较佳的试验结果,
但是它不能在一定的试验范围内,根据数据样本,去确定变量间的相关关系及其相应的回归方程。
回归设计就是在因子空间选择适当的试验点,以较少的试验处理建立一个有效的多项式回归方程,从而解决生产中的最优化问题,这种试验设计方法就被称为回归设计。
回归设计也称为 响应曲面设计,目的是寻找试验指标与各因子间的 定量 规律,考察的 因子都是定量 的 。它是在多元线性回归的基础上用主动收集数据的方法获得具有较好性质的回归方程的一种试验设计方法。
因此,将回归和正交结合在一起进行试验设计,这就是回归正交设计。回归正交设计是回归分析与正交试验设计法有机结合而形成的一种新的试验设计方法。它是回归设计中最基本的,也是最常用的和最有代表性的设计方法。可分为一次回归正交设计和二次回归正交设计,还有二次回归正交旋转设计。下面我们分别讲述。
一 一次回归正交设计的原理二 一次回归正交设计的步骤三 一次回归正交设计的应用第二节 一次回归正交设计其回归方程为:
可见一次回归正交设计解决的是多元线性回归问题一 一次回归正交设计的原理一次回归正交设计是解决在回归模型中,变量的最高次数为一次的(不包括交叉项的次数)多元回归问题,其数学模型为:
ippii
iippiii
zbzbzbby
Ni
zzzy
221101
22110
,,2,1
一次回归正交设计主要是应用二水平正交表,例如二水平正交表 L4(23),L8(211),L16(215),L64(263)等。
用 -1和 +1代换正交表中的 1,2两个水平符号,代换后,仍可看出每列所有数字相加之和为零,每两列同行各因素相乘之和为零,这说明代换后的设计表仍然具有正交性。
试验号 1 2 3
1 1 1 1
2 1 2 2
3 2 1 2
4 2 2 1
试验号 1 2 3
1 1 1 1
2 1 -1 -1
3 -1 1 -1
4 -1 -1 1
二 一次回归正交设计的步骤
(一)确定因素的变化范围例:有 p个因素 z1,zz,…,zp与某项指标 y,设计中首先要确定每个因素 zk的变化范围。设 z1k和 z2k分别表示 zk变化的下界和上界。假如试验在水平 z1k和 z2k上进行,
那么分别称 z1k和 z2k为 zk的下水平和上水平,称他们的算术平均值为 z0k。它们差的一半为其因素 zk的 变化区间 Δk
2
21
0
kk
k
zzz
2
12 kk
k
zz
(二)对因素 zk的水平进行编码所谓编码就是对因素的取值作如下的线性变换:
k
kk
k
zz
x
0
这样建立了因素 zk和 xk取值的变换关系即:
下水平 z1k -1
0水平 z0k 0
上水平 z2k +1
从变换关系式中可以知道当因素 zk在 [z1k,z2k]内变化时,它的编码 xk就在区间 [-1,+1]内变化。
因素 zk进行编码之后,原先要求算 y对 z1,z2,…,zp
的回归方程,现在变成求算 y对 x1,x2,…,xp的回归方程。不管在一次回归设计中还是二次回归设计中,都应当先对因素 zk进行编码。
因素 z1 z2 … zp
下水平( -1) z11 z12 … z1p
上水平( +1) z21 z22 … z2p
变化区间 Δ 1 Δ 2 … Δ p
零水平 z0j z02 … z0p
因素水平编码表
(三)选择正交表列出试验方案一次回归正交设计使用二水平正交表来安排实验,但究竟用哪一张二水平正角表,这是根据因素的个数而定的。
正交表确定后,就把各变量放入正交表某些列上,各列的水平号也就表示各因素的不同状态,这样就组成了一张试验计划表,即试验方案。
如果要考察交互作用,必须按照相应的交互作用表确定各因素在表中的列号。
然后就可以按照试验方案,进行试验实施,填写数据。
(四)回归系数的计算与统计检验这一部分的详细计算步骤不再讲述,目前主要应用数据统计软件 SAS,SPSS等进行。
可以得到回归方程以及相应的显著性检验。
data abc;
input Y X1-X3 ;
cards;
(数据 );
proc reg;
model Y = X1-X3/[selection=b sls=0.05] ;
run;
在正交设计所求得回归方程中,每一个回归系数的绝对值大小,刻化了对应变量在过程中的作用。这是由于经过无量纲的编码变换后,所有变量的取值都是 1和 -1,他们在所研究的区域都是平等的,因而使得所求得回归系数不受因素的单位和取值得影响,而直接反映了该因素作用的大小,回归系数的符号反映了这种作用的性质,同时回归系数间不存在相关性,这样经回归系数显著性检验不显著的变量,可一起全部从回归方程中剔除,不需要重新建立回归方程。
ippii xbxbxbby 22110
上述用一次回归正交设计方法求得一次回归方程是简单、
易行的,但是否能真实反映实际呢?由于试验是在各因子的上水平( +1)与下水平(- 1)处进行的,即使模型在这些边界点上拟合得很好,但是在因子编码空间的中心拟合是否也好呢?这可用在零水平处增加若干重复试验,再通过检验来判断。
设在各因子均取零水平时进行了 m 次试验,记其试验结果为,其平均值为,其偏差平方和及其自由度为,
myyy 00201,,,? iy0
m
i
ii yyS
1
2
000 )( 10 mf
(五)零水平的重复(回归方程的失拟性检验)
当一次回归模型在整个编码空间上都适宜时,则按一次回归方程应有如今在零水平上进行了 m 次重复试验,其平均值为这相当于存在两个正态分布:
要检验这两个正态分布的均值是否相等,即检验为此可采用 t统计量去检验。
iyy 00?
iy0
)/,(~? 200 nNyy i
)/,(~ 200 mNy i
001000,,,HH
ippii xxxy 22110
n
i
iyn
1
0
1?
t
y y
n m
0 0
1 1
0
0?
ff
SS
总总? 2
0
1
)b(yS
n
i
i总
2
0
1
00 )y(yS
m
i
i
1 nf 总 10 mf
在 时,有对给定的显著性水平,当 时认为模型在编码空间的中心也合适,不存在因子的非线性效应,否则需要另外寻找合适的模型,譬如建立二次回归方程,这将在后面内容中介绍。
00
)(~ 0fftt?总
)(
0fftt 总?
例 1,有一实验,从某物料中提取的蛋白质数量与反应时间和反应温度有关。根绝经验反应时间的变化范围为 20~30min,反应温度为 70~78℃ 。试用一次回归正交设计法求出回归方程。
设计步骤:
( 1) 确定因素上下水平反应时间 z11=20,z21=30;反应温度 z12=70,z22=78
2
21
0
kk
k
zzz
2
12 kk
k
zz
根据上述两个公式可得 z01=25,Δ 1=5; z02=74,Δ 2=4
( 2) 对因素水平进行编码因素 z1 z2
下水平( -1) 20 70
上水平( +1) 30 78
变化区间 5 4
零水平( 0) 25 74
( 3) 选择合适的正交表本例是个两因素试验,选择 L4(23)表比较合适。试验方案如下:
试验号 x1 x2 ( x1x2) y
1 1 1 1 41.5
2 1 -1 -1 40.9
3 -1 1 -1 40.0
4 -1 -1 1 39.3
5 0 0 0 40.3
6 0 0 0 40.5
7 0 0 0 40.7
8 0 0 0 40.2
9 0 0 0 40.6
data abc;
input X1 X2 Y @@ ;
cards;
1 1 41.5
1 -1 40.9
-1 1 40.0
-1 -1 39.3;
proc reg;
model Y = X1 X2 ;
run;
( 4) 计算回归方程及统计检验
data a;
input id x @@ ;
cards;
1 41.5 1 40.9 1 40.0 1 39.3
2 40.3 2 40.5 2 40.7 2 40.2
2 40.6;
proc ttest;
class id;
var x;
run;
21 325.0775.043.40 xxy
The S AS S yst e m 11,1 6 S a tur d ay,D ece mb er 1 7,2 006 7
The R EG P roc e dur e
Mod el,M O DEL 1
Dep en den t Va r iab l e,Y
Ana ly sis of V ari a nce
Sum of Mea n
So urc e D F Sq u are s S qua r e F V alu e Pr > F
Mo del 2 2,8 250 0 1,412 5 0 5 6 5.0 0 0.0 2 97
Er ror 1 0,0 025 0 0,0 025 0
Co rre c ted Tot a l 3 2,8 275 0
Roo t MSE 0,0 500 0 R - Sq uar e 0,9 991
Dep en den t Me a n 40,4 250 0 Adj R - Sq 0,9 973
Coe ff Va r 0,1 236 9
Par am ete r Es t ima t es
Par a met e r Sta n dar d
Va ria b le D F Est i mat e E r ror t V alu e Pr > |t |
In ter c ept 1 40,4 250 0 0.0 2 500 1 61 7.0 0 0,000 4
X1 1 0,7 750 0 0.0 2 500 3 1.0 0 0,020 5
X2 1 0,325 0 0 0,0 250 0 1 3,00 0,04 8 9
( 5) 失拟性检验
073.0
5
1
4
1
34
172.083.2
46.4043.40
11?
00
mn
yyt
34
172.083.2?
0
0
ff
SS
总总?
83.2)43.403.39(...)43.405.41( 2220
1
)b(yS
n
i
i总
172.0)46.406.40(...)46.403.40( 2220
1
00
)y(yS
m
i
i
3141 nf 总 41510 mf
|t|=0.073<t0.01(3+4)=3.50
The SAS System 15:12 Saturday,December 3,2007 4
The TTEST Procedur
Statistics
Lower CL Upper CL Lower CL Upper CL
Variable id N Mean Mean Mean Std Dev Std Dev Std Dev Std Err Min Max
x 1 4 38.88 40.42 41.97 0.55 0.97 3.61 0.48 39.3 41.5
x 2 5 40.20 40.46 40.71 0.12 0.20 0.59 0.09 40.2 40.7
x Diff (1-2) -1.07 -0.03 1.00 0.43 0.65 1.33 0.43
T-Tests
Variable Method Variances DF t Value Pr > |t|
x Pooled Equal 7 -0.08 0.9387
x Satterthwaite Unequal 3.22 -0.07 0.9477
Equality of Variances
Variable Method Num DF Den DF F Value Pr > F
x Folded F 3 4 21.92 0.0121
5 还原得到试验数据方程。
21 325.0775.043.40 xxy
4
74,
5
25 2
2
1
1
zxzx将代入方程:
得到方程:
这个方程即为实际数据所得方程。
21 0 8 2.01 5 5.054.30 zzy
例,硝基蒽醌中某物质的含量 y与以下三个因子有关:
z1:亚硝酸钠(单位:克)
z2:大苏打(单位:克)
z3:反应时间(单位:小时)
为提高该物质的含量,需建立 y关于变量 z1,z2,z3的回归方程。
1.试验设计
( 1)确定因子取值范围,并对它们的水平进行编码表 因子水平编码表因子水平 编码值 z1 z2 z3
上水平 +1 9.0 4.5 3
下水平 -1 5.0 2.5 1
零水平 0 7.0 3.5 2
变化区间 Δj 2 1 1
( 2)利用二水平正交表安排试验本例有三个因子,即 p=3,为今后可能需要考察因子间的交互作用方便起见,因此选用 L8(27),将三个因子分别置于 第一、二、四 列上,从而可得试验计划,并按计划进行试验。
试验计划及试验结果见表。
data abc;
input X1 X2 x3 Y @@ ;
cards;
1 1 1 92.35
1 1 -1 86.10
1 -1 1 89.58
1 -1 -1 87.05
-1 1 1 85.70
-1 1 -1 83.26
-1 -1 1 83.95
-1 -1 -1 83.38;
proc reg;
model Y = X1- x3;
run;
2.数据分析
Dependent Variable,Y Analysis of Variance
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 3 62.99634 20.99878 9.88 0.0254
Error 4 8.49995 2.12499
Corrected Total 7 71.49629
Root MSE 1.45773 R-Square 0.8811
Dependent Mean 86.42125 Adj R-Sq 0.7919
Coeff Var 1.68678
Parameter Estimates
Parameter Standard
Variable DF Estimate Error t Value Pr > |t|
Intercept 1 86.42125 0.51539 167.68 <.0001
X1 1 2.34875 0.51539 4.56 0.0104
X2 1 0.43125 0.51539 0.84 0.4498
x3 1 1.47375 0.51539 2.86 0.0460
,,,,y x x x86 42 2 35 0 43 1 471 2 3
data abc;
input X1 X2 x3 Y @@ ;
cards;
1 1 1 92.35
1 1 -1 86.10
1 -1 1 89.58
1 -1 -1 87.05
-1 1 1 85.70
-1 1 -1 83.26
-1 -1 1 83.95
-1 -1 -1 83.38;
proc reg;
model Y = X1 x3;
run;
Dependent Variable,Y Analysis of Variance
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 2 61.50853 30.75426 15.40 0.0073
Error 5 9.98776 1.99755
Corrected Total 7 71.49629
Root MSE 1.41335 R-Square 0.8603
Dependent Mean 86.42125 Adj R-Sq 0.8044
Coeff Var 1.63542
Parameter Estimates
Parameter Standard
Variable DF Estimate Error t Value Pr > |t|
Intercept 1 86.42125 0.49969 172.95 <.0001
X1 1 2.34875 0.49969 4.70 0.0053
x3 1 1.47375 0.49969 2.95 0.0319
31 47.135.242.86? xxy
data abc;
input X1 X2 x3 Y @@ ;
cards;
1 1 1 92.35
1 1 -1 86.10
1 -1 1 89.58
1 -1 -1 87.05
-1 1 1 85.70
-1 1 -1 83.26
-1 -1 1 83.95
-1 -1 -1 83.38;
proc reg;
model Y = X1- x3/selection=b sls=0.05;
run;
The SAS System 11:16 Sa turday,D ecember 17,20 06 34
The REG Proced ure
Model,MODEL1
Dependent Vari able,Y
Backward Elimi nation,S tep 0
All Variables Entered,R - Squa re = 0,8811 a nd C (p) = 4,0000
Analysis of Va ria nce
Sum of Me a n
Source DF Squ ares Squar e F Value Pr > F
Mode l 3 62,9963 4 2 0.99 878 9.8 8 0,0254
Erro r 4 8,499 95 2.12 499
Corrected Total 7 7 1.49629
Para met er S ta ndar d
Variable E stimate Error Type II SS F Value Pr > F
Intercept 8 6.42125 0,51539 597 49 28117.4 <.0001
X1 2,34 875 0,5153 9 44.1 33 01 20,77 0,0104
X2 0,43 125 0,5153 9 1.4 87 81 0,7 0 0,449 8
x3 1,47 375 0,5153 9 17.3 75 51 8,1 8 0,046 0
Bounds on cond ition num ber,1,9
Backward Elimi nation,S tep 1
Variable X2 Re moved,R - Square = 0.8603 and C(p) = 2,70 02
Analysis of Va ria nce
Sum of Mean
Source DF Squ ares Squar e F Value Pr > F
Model 2 61,50853 30.75426 15.40 0.0073
Error 5 9,98776 1.99755
Corrected Total 7 7 1.49629
Paramet er Sta ndard
Variable E stimate Error Type II SS F Value Pr > F
Intercept 8 6.42125 0,49969 597 49 29911.1 <.0001
X1 2.34 875 0.4996 9 44.133 01 22.09 0.0053
x3 1.47 375 0.4996 9 17.375 51 8.7 0 0.031 9
Bounds on cond ition num ber,1,4
--- ----------- --------- --------- ---------- --------- --- -------------- --------- --------- -----
-
All variables left in t he model are signif icant at the 0.0500 level,
The SAS System 11:16 Sa turday,D ecember 17,20 06 35
The REG Proced ure
Model,MODEL1
Dependent Vari able,Y
Summary of Bac kward Eli mination
Variable Number P arti al Mod el
Step Rem oved Vars In R - Square R - Sq uare C(p) F Va lue Pr > F
1 X2 2 0,0208 0.86 03 2.7002 0.7 0 0,4498
在正交回归设计中,当某一变量不显著时,可以直接将它删去,此时不会改变其它的回归系数,也不会改变这些变量的偏回归平方和,这是正交回归设计的一个优点 。
现在将 x2从回归方程中删去,最后得各因子均为显著的回归方程是:
将编码式:
代入,得 y关于 z1,z3的回归方程为:
,,,y x x86 42 2 35 1 471 3
22 7 3311 zxzx,
,,,( ),,,y z z z z86 42 2 35 72 1 47 2 75 255 1 175 1 471 3 1 3
从方程知,当 z1,z3增加时,y也会相应增加。
含交互作用的模型当变量间存在交互作用时,我们可以更一般地考虑建立含两个因子间交互作用的模型,其交互作用用两个因子的编码值的乘积表示,即可假定有如下的回归模型:
只要在回归的一次正交设计中,
n(试验次数) 大于
p为因素的个数,这就可以将其看成是 k元线性回归,并且这 k项仍然是相互正交的,因此可以在表中加上诸列,按同样的计算便可求得诸回归系数,并对它们进行检验。
ji
jiij
p
j
jj xxxy
1
0
kpp
^
2
我们可以建立如下回归方程:
ji
jiij
j
jj xxbxby
3
1
0
data abc;
input X1 X2 x3 Y @@ ;
x4=x1*x2;
x5=x1*x3;
x6=x2*x3;
cards;
1 1 1 92.35
1 1 -1 86.10
1 -1 1 89.58
1 -1 -1 87.05
-1 1 1 85.70
-1 1 -1 83.26
-1 -1 1 83.95
-1 -1 -1 83.38;
proc reg;
model Y = X1 - x6;
run;
Dependent Variable,Y Analysis of Variance
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 6 71.06848 11.84475 27.69 0.1445
Error 1 0.42781 0.42781
Corrected Total 7 71.49629
Root MSE 0.65407 R-Square 0.9940
Dependent Mean 86.42125 Adj R-Sq 0.9581
Coeff Var 0.75684
Parameter Estimates
Parameter Standard
Variable DF Estimate Error t Value Pr > |t|
Intercept 1 86.42125 0.23125 373.71 0.0017
X1 1 2.34875 0.23125 10.16 0.0625
X2 1 0.43125 0.23125 1.86 0.3134
x3 1 1.47375 0.23125 6.37 0.0991
x4 1 0.02375 0.23125 0.10 0.9348
x5 1 0.72125 0.23125 3.12 0.1975
x6 1 0.69875 0.23125 3.02 0.2035
data abc;
input X1 X2 x3 Y @@ ;
x4=x1*x2;
x5=x1*x3;
x6=x2*x3;
cards;
1 1 1 92.35
1 1 -1 86.10
1 -1 1 89.58
1 -1 -1 87.05
-1 1 1 85.70
-1 1 -1 83.26
-1 -1 1 83.95
-1 -1 -1 83.38;
proc reg;
model Y = X1 - x6/selection=b sls=0.05;
run;
The S AS S yste m 11:1 6 Sa turd ay,D ecemb er 1 7,2 006 41
The R EG P roce dure
Model,MO DEL1
Depen dent Var iabl e,Y
Backw ard Elim inat ion,Ste p 0
All V aria bles Ent ered,R - Squa re = 0.9 940 and C(p) = 7,0000
Analy sis of V aria nce
Su m of Mea n
S ourc e DF Sq uare s Squa re F Valu e Pr > F
M odel 6 71,0684 8 11,844 75 27.6 9 0.1 445
E rror 1 0,4278 1 0,427 81
C orre cted Tot al 7 71,4962 9
Par amet er S tand ard
V aria ble Est imat e Err or Typ e II SS F Val ue Pr > F
I nter cept 86,4212 5 0,231 25 59 7 49 1396 62 0.00 20
X 1 2,3487 5 0,231 25 4 4.13 3 01 103,16 0.06 25
X 2 0,4312 5 0,231 25 1.48 7 81 3,48 0.31 34
x 3 1,4737 5 0,231 25 1 7.37 5 51 40,61 0.09 91
x 4 0,0237 5 0,231 25 0.00 4 51 0,01 0.93 48
x 5 0,7212 5 0,231 25 4.16 1 61 9,73 0.19 75
x 6 0,6987 5 0,231 25 3.90 6 01 9,13 0.20 35
Bound s on con diti on n umbe r,1,36
----- ---- ---- ---- ---- ---- ---- ---- ---- ---- ---- ---- ---- - ----- ---- ---- ---- ---- ---- ---- ---- ---- -
Ba ck w ar d El im in at io n,S te p 1
Va ri a bl e x4 R em ov ed,R - Sq ua re = 0,9 94 0 an d C( p) = 5,0 1 05
An al y si s of V ar ia nc e
Su m of M ea n
S ou rc e DF Sq ua re s Sq ua re F Va lu e P r > F
M od el 5 7 1,06 39 6 14,2 12 79 65,7 5 0,0 15 0
E rr or 2 0,43 23 2 0,2 16 16
C or re ct ed T ot al 7 7 1,49 62 9
P ar am et er S ta nd ar d
V ar ia bl e E st im at e E rr or T yp e II SS F V al ue Pr > F
I nt er ce pt 8 6,42 12 5 0,1 64 38 59 7 49 27 64 08 <,00 01
X 1 2,34 87 5 0,1 64 38 4 4,13 3 01 20 4,17 0,00 49
X 2 0,43 12 5 0,1 64 38 1,48 7 81 6,88 0,11 97
x 3 1,47 37 5 0,1 64 38 1 7,37 5 51 8 0,38 0,01 22
x 5 0,72 12 5 0,1 64 38 4,16 1 61 1 9,25 0,04 82
x 6 0,69 87 5 0,1 64 38 3,90 6 01 1 8,07 0,05 11
Bo un d s on c on di ti on n um be r,1,25
-- -- - -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- - -- -- - -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -
Bac kw ard Eli m ina t ion,St e p 2
The S AS S yst e m 11,1 6 S a tur d ay,D ece mb er 1 7,2 006 42
The R EG P roc e dur e
Mod el,M O DEL 1
Dep en den t Va r iab l e,Y
Bac kw ard Eli m ina t ion,St e p 2
Var ia ble X2 R emo v ed,R - Sq uar e = 0,97 3 1 a n d C ( p) = 6,4 8 83
Ana ly sis of V ari a nce
Su m of M e an
Sou r ce DF S qua r es Sq u are F Va l ue P r > F
M ode l 4 69,576 1 5 17,3 9 404 27,1 8 0,0 108
Err o r 3 1,92 0 14 0.6 4 005
Cor r ect e d T o tal 7 7 1,49 6 29
P a ram e ter Sta n dar d
Var i abl e E s tim a te E r ror T y pe I I SS F V a lue Pr > F
Int e rce p t 8 6,42 1 25 0.2 8 285 5 9 749 933 5 1.2 <,0 001
X1 2,34 8 75 0.2 8 285 44,1 3 301 6 8,95 0,0 037
x3 1,47 3 75 0.2 8 28 5 17,3 7 551 2 7,15 0,0 137
x5 0,72 1 25 0.2 8 285 4,1 6 161 6,50 0,0 839
x6 0,69 8 75 0.2 8 285 3,9 0 601 6,10 0,0 900
Bou nd s o n co n dit i on n umb e r,1,1 6
--- -- --- - --- - --- - --- - --- - --- - --- - --- - --- - --- - --- - --- - - --- -- --- - --- - --- - --- - --- - --- - --- - --- - -
Bac kw ard Eli m ina t ion,St e p 3
Var ia ble x6 R emo v ed,R - Sq uar e = 0,91 8 5 a n d C ( p) = 13,6 185
Ana ly sis of V ari a nce
S u m o f Me a n
S our c e DF S q uar e s Squ a re F Val u e Pr > F
Mod el 3 65,670 1 4 21,8 9 005 15,0 3 0,0 121
E rro r 4 5,826 1 5 1,45 6 54
C orr e cte d To t al 7 71,496 2 9
Pa r ame t er S tan d ard
V ari a ble Es t ima t e Er r or Ty p e I I SS F Va l ue Pr > F
I nte r cep t 86,421 2 5 0,42 6 69 5 9 7 49 4 102 1,3 <.0 0 01
X 1 2,348 7 5 0,42 6 69 4 4.1 3 3 01 30,30 0.0 0 53
x 3 1,473 7 5 0,42 6 69 1 7.3 7 5 51 11,93 0.0 2 60
x 5 0,721 2 5 0,42 6 69 4.1 6 1 61 2,86 0.1 6 62
Bou nd s o n co n dit i on n umb e r,1,9
--- -- --- - --- - --- - --- - --- - --- - --- - --- - --- - --- - --- - --- - - --- -- --- - --- - --- - --- - --- - --- - --- - --- - -
Bac kw ard Eli m ina t ion,St e p 4
The S AS S yst e m 11,1 6 S a tur d ay,D ece mb er 1 7,2 006 43
The R EG P roc e dur e
Mod el,M O DEL 1
Dep en den t Va r iab l e,Y
Bac kw ard Eli m ina t ion,St e p 4
Var ia ble x5 R emo v ed,R - Sq uar e = 0,86 0 3 a n d C( p) = 21,3 461
Ana ly sis of V ari a nce
Su m of Mea n
S our c e DF S q uar e s Squ a re F Val u e Pr > F
M ode l 2 61,508 5 3 30,75 4 26 15,4 0 0,0 073
E rro r 5 9,987 7 6 1,99 7 55
C orr e cte d To t al 7 71,496 2 9
P a ram e ter Sta n dar d
Var i abl e E s tim a te E r ror T y pe I I SS F V a lue Pr > F
Int e rce p t 8 6,42 1 25 0.4 9 969 5 9 749 299 1 1.1 <,0 001
X1 2,34 8 75 0.4 9 969 44,1 3 301 2 2,09 0,0 053
x3 1,47 3 75 0.4 9 969 17,3 7 551 8,70 0,0 319
Bou nd s o n co n dit i on n umb e r,1,4
--- -- --- - --- - --- - --- - --- - --- - --- - --- - --- - --- - --- - --- - - --- -- --- - --- - --- - --- - --- - --- - --- - --- - -
All v ari a ble s le f t i n th e mo d el a re s ign i fic a nt a t t h e 0,05 00 l eve l,
Sum ma ry o f B a ckw a rd E lim i nat i on
V ari a ble Num b er P art i al M od el
S tep R emo v ed Var s In R - Squ are R - Squ ar e C ( p) F V a lue P r > F
1 x 4 5 0.0 0 01 0,99 40 5,010 5 0,01 0,93 4 8
2 X 2 4 0.0 2 08 0,97 31 6,488 3 6,88 0,11 9 7
3 x 6 3 0.0 5 46 0,91 85 13,618 5 6,10 0,09 0 0
4 x5 2 0,0 582 0,8 603 21,34 6 1 2.8 6 0.1 6 62
三 一次回归正交设计的应用
(一)确定最佳工艺参数
(二)寻找最优区域一般都希望通过回归方程来进行最优控制或寻找最佳工艺参数,但假若不是在最优区域内建立的回归方程,就不能用来寻找最佳工艺参数。因为超出了实验所在的范围,回归方程可能并非是仍为一次关系,
所以进行最优控制或确定最优生产条件时,首先必须寻找各个变量变化的最优区域。
这里介绍 快速登高法 来寻求最优区域。
快速登高法来寻求最优区域的具体步骤:
例 1,有一实验,从某物料中提取的蛋白质数量与反应时间和反应温度有关。根绝经验反应时间的变化范围为 20~30min,反应温度为 70~78℃ 。试用一次回归正交设计法求出回归方程。
设计步骤:
( 1) 确定因素上下水平反应时间 z11=20,z21=30;反应温度 z12=70,z22=78
2
21
0
kk
k
zzz
2
12 kk
k
zz
根据上述两个公式可得 z01=25,Δ 1=5; z02=74,Δ 2=4
( 2) 对因素水平进行编码因素 z1 z2
下水平( -1) 20 70
上水平( +1) 30 78
变化区间 5 4
零水平( 0) 25 74
21 325.0775.043.40 xxy
下面我们以前面的例子用快速登高法寻找最优区域,
之后建立回归方程。
前面已列出因素水平编码表,建立了回归方程,找到了梯度方向,随即可安排快速登高试验计划。先选择
e,为使各因素步长整数化,并考虑到反应时间对蛋白质提取率是重要因素,应使 z1的步长取得比较合适,现取其步长为 5min,并照顾其他因素的步长。由此可确定
e=5/3.875。快速登高法的原始数据与试验计划列于表中。
21 325.0775.043.40 xxy
因素名称 Z1 Z2
零水平 z0j
变化区间 Δj
回归系数 bj
步长 Δjbj
调整步长 eΔjbj
25
5
0.775
3.875
5
74
4
0.325
1.3
1.68
试验号
1
2
3
.
.
.
10
11
Z01+keΔ1b1=z1j
25+1× 5=30
25+2× 5=35
40
.
.
.
75
80
Z02+keΔ2b2=z2j
74+1× 1.68=75.68
74+2× 1.68=77.36
79.04
.
.
.
90.8
92.48
Yi
41.3
41.6
41.9
.
.
.
80.3
79.2
有上表可以看出,当试验进行到第 10号试验时,指标 y达到 80.3,到第 11号试验时,指标 y又降为 79.2,所以这一轮实验就此停止,根据经验如指标 y仍未达到最大时,可以在将第 10号试验各因素的水平,作为新零水平,重复前面的寻优做法,直到找到满意的指标为止。
本例中 y=80.3,认为已满足需要,接下去是在小区域内建立回归方程进行显著性检验。
因素 z1 z2
下水平( -1) 70 86.8
上水平( +1) 80 94.8
变化区间 5 4
零水平 75 90.8
建立新的因素水平表试验号 x0 x1 x2 x1x2 y
1 1 1 1 1 79.5
2 1 1 -1 -1 78.0
3 1 -1 1 -1 77.0
4 1 -1 -1 1 76.5
5 0 0 0 0 79.9
6 0 0 0 0 80.3
7 0 0 0 0 80.0
8 0 0 0 0 79.7
9 0 0 0 0 79.8
试验方案表分析程序:
data abc;
input X1 X2 Y @@ ;
cards;
1 1 79.5
1 -1 78.0
-1 1 77.0
-1 -1 76.5;
proc reg;
model Y = X1 x2/selection=b sls=0.05;
run;
Th e S AS S ys te m 11,1 6 Sa tu rd ay,D ec em b er 1 7,2 00 6 4 6
Th e R EG P ro ce du re
Mo de l,MO DE L1
De pe n de nt V ar ia bl e,Y
An al y si s of V ar ia nc e
S um o f Me an
S ou rc e DF Sq ua re s Sq ua re F Va lu e P r > F
M od el 2 5,00 00 0 2,5 00 00 10,0 0 0,2 18 2
E rr or 1 0,25 00 0 0,2 50 00
C or re ct ed T ot al 3 5,25 00 0
Ro ot MS E 0,5 00 00 R - Sq ua re 0,9 52 4
De pe n de nt M ea n 77,7 50 00 Ad j R - Sq 0,8 57 1
Co ef f V ar 0,6 43 09
Pa ra m et er E st im at es
Pa r am et er S ta nd ar d
V ar ia bl e DF E st im at e E rr or t Va lu e P r > |t |
I nt er ce pt 1 7 7,75 00 0 0,2 50 00 3 11,0 0 0,0 02 0
X 1 1 1,00 00 0 0,2 50 00 4,0 0 0,1 56 0
X2 1 0,5 00 00 0,25 00 0 2,0 0 0,29 52
从上述分析的结果可知,回归方程为:
经检验是不显著的,两个因素的回归系数也是不显著的,说明回归方程在试验区间内部拟合不好,需要二次或更高次回归设计。
21 5.075.77 xxy
一 二次回归正交设计的步骤二 二次回归正交设计的应用第三节 二次回归正交设计
nixxxxxxy iiiiiiii,,2,12 2222111211222110,
一,二次回归正交设计的步骤
1、确定 Z1,Z2,……,Zp的变化范围。
2、确定 mc和 m0,确定 n=mc+2p+m0,再确定 r,列出试验计划表。 mc=2p。
m0是中心试验点的重复次数。
mc是因素分别只取 +1和 -1水平时的试验次数。
2p是只有一个因素取 +r或 -r时的试验次数。
n是总的试验次数。
2
)2( 02 ccc mmmpm
r
二次回归正交设计的参数 值表?
因素水平编码表
3、对因素水平进行编码。
因素 Z1 Z2 Z3
+r
上水平( +1)
零水平( 0)
下水平( -1)
-r
变化区间 Δj
20
rr zzz
r
zz r
j
0
j
j
zz
zz
01
01
3、确定试验计划表,进行试验的实施。
4、对试验结果利用 SAS进行统计分析。
5、建立回归方程并进行讨论。
例:某食品加香试验,3个因素,即 Z1(香精用量),Z2
(着香时间),Z3(着香温度),使进行二次回归正交组合设计,并进行统计分析。
( 1)确定因素水平变化范围香精用量 Z1 ( 6~18 mL/kg)
着香时间 Z2 ( 8~24 h)
着香温度 Z3 ( 22~48 ℃ )
( 2)确定 r,mc和 m0。
mc=2p=23=8,m0=4,r=1.414
2
)2( 02 ccc mmmpm
r
二、二次回归正交设计的应用因素 Z1 Z2 Z3
+r( 1.414) 18 24 48
上水平( +1) 16.24 21.66 44.19
零水平( 0) 12 16 35
下水平( -1) 7.76 10.34 25.81
-r( -1.414) 6 8 22
变化区间 Δj 4.24 5.66 9.19
因素水平编码表
r
zz jrj
j
0
20
rr zzz
j
j
zz
zz
01
01
3、确定试验计划表,进行试验的实施。
x1 x2 x3 y
1 1 1 2.32
1 1 -1 1.25
1 -1 1 1.93
1 -1 -1 2.13
-1 1 1 5.85
-1 1 -1 0.17
-1 -1 1 0.80
-1 -1 -1 -0.56
1.414 0 0 1.60
-1.414 0 0 0.56
0 1.414 0 5.54
0 -1.414 0 3.89
0 0 1.414 3.57
0 0 -1.414 2.52
0 0 0 5.80
0 0 0 5.70
0 0 0 5.90
0 0 0 5.75
mc=2p
2p
m0
dat a a bc ;
inp ut x 1 - x 3 y;
c ar d s ;
1 1 1 2,32
1 1 - 1 1,25
1 - 1 1 1,93
1 - 1 - 1 2,13
- 1 1 1 5,85
- 1 1 - 1 0,17
- 1 - 1 1 0,80
- 1 - 1 - 1 - 0,56
1,414 0 0 1,60
- 1,414 0 0 0,56
0 1,414 0 5,54
0 - 1,414 0 3,89
0 0 1,414 3,57
0 0 - 1,414 2,52
0 0 0 5,80
0 0 0 5,70
0 0 0 5,90
0 0 0 5,75;
p r oc s o r t ;
b y x 1 - x 3 ;
pr oc r s r e g;
m ode l y= x 1 x 2 x 3 / l ac kf it ;
r un ;
Th e S AS S ys te m 11,1 6 Sa tu rd ay,D ec em b er 1 7,2 00 6 5
Th e R SR EG P ro ce du re
Co di n g Co ef fi ci en ts f or t he I nd ep en de nt V ar ia bl es
Fa ct o r S ub tr ac te d of f D iv id ed b y
X1 0 1,4 14 00 0
X2 0 1,4 14 00 0
X3 0 1,4 14 00 0
Re sp o ns e Su rf ac e fo r Va ri ab le Y
Re sp o ns e Me an 3,0 40 00 0
Ro ot MS E 0,5 47 67 4
R - Sq u ar e 0,9 72 1
Co ef f ic ie nt o f Va ri at io n 18,0 15 6
Ty pe I Su m
Re gre s sio n D F o f Sq u are s R - Squ a re F Val u e Pr > F
Li nea r 3 1 2.8 7 136 4 0,14 99 14,3 0 0,0 014
Qu adr a tic 3 5 7.0 0 832 1 0,66 40 63,3 5 <,0 001
Cr oss p rod u ct 3 1 3.5 7 873 8 0,15 82 15,0 9 0,0 012
To tal Mod e l 9 8 3.4 5 842 3 0,97 21 30,9 2 <,0 001
Sum of
Res id ual D F Sq u are s Me a n S q uar e F Val u e Pr > F
Lac k of F it 5 2.3 7 770 2 0.4 7 554 0 65,2 2 0,0 029
Pur e E r ror 3 0,021 8 75 0,00 729 2
Tot al E rro r 8 2,399 5 77 0,29 994 7
Pa ra m et er Es t im at e
St an da rd fr om C od ed
P ar am et er DF Es ti ma te E rr or t Va lu e P r > |t | D at a
I nt er ce pt 1 5,74 05 33 0,25 81 57 22,2 4 <,0 00 1 5,7 40 53 3
X 1 1 0,23 67 37 0,15 81 08 1,5 0 0,1 72 7 0,3 34 74 6
X 2 1 0,63 53 22 0,15 81 08 4,0 2 0,0 03 9 0,8 98 34 6
X 3 1 0,78 29 70 0,15 81 08 4,9 5 0,0 01 1 1,1 07 12 0
X 1* X1 1 - 2,28 40 18 0,19 36 71 - 11,7 9 <,0 00 1 - 4,5 66 65 6
X 2* X1 1 - 0,78 37 50 0,19 36 32 - 4,0 5 0,0 03 7 - 1,5 67 02 7
X 2* X2 1 - 0,46 59 69 0,19 36 71 - 2,4 1 0,0 42 8 - 0,9 31 65 6
X 3* X1 1 - 0,77 12 50 0,19 36 32 - 3,9 8 0,0 04 0 - 1,5 42 03 4
X 3* X2 1 0,69 87 50 0,19 36 32 3,6 1 0,0 06 9 1,3 97 07 8
X 3* X3 1 - 1,30 12 21 0,19 36 71 - 6,7 2 0,0 00 1 - 2,6 01 65 6
Su m of
F act o r D F Sq u are s Me a n S q u are F Val u e Pr > F
X 1 4 5 2.0 6 228 4 1 3.0 1 5 571 43,3 9 <,0 001
X 2 4 1 5.3 9 956 6 3.8 4 9 891 12,8 4 0,0 015
X 3 4 2 9.5 6 035 2 7.3 9 0 088 24,6 4 0,0 001
The S AS S yst e m 11,1 6 S a tur d ay,D ece mb er 1 7,2 006 6
The R SRE G Pr o ced u re
Can on ica l An a lys i s o f Re s pon s e S u rfa c e B a sed on C ode d Dat a
Cri ti cal Val u e
Fac to r Cod e d U n cod e d
X1 - 0.2 624 4 0 - 0.3 710 9 0
X2 1,1 527 4 4 1,6 299 8 1
X3 0,6 000 5 7 0,8 484 8 1
Pre di cte d va l ue a t s t ati o nar y po i nt,6.5 4 655 7
E i g e n v e c t o r s
E i g e n v a l u e s X 1 X 2 X 3
- 0,4 3 1 2 1 6 - 0,2 3 9 4 3 1 0,8 9 6 2 0 2 0,3 7 3 4 9 0
- 2,7 6 3 6 8 6 - 0,1 9 5 6 1 0 - 0,4 2 1 3 1 7 0,8 8 5 5 6 7
- 4,9 0 5 0 6 6 0,9 5 1 0 0 4 0,1 3 8 9 7 4 0,2 7 6 1 8 3
S t a t i o n a r y p o i n t i s a m a x i m u m
一 二次回归正交旋转设计的步骤二 二次回归正交旋转设计的应用第四节 二次回归正交旋转设计一,二次回归正交旋转设计的步骤
1、确定 Z1,Z2,……,Zp的变化范围。
计算零水平:
20
rjrj
j
zz
z?
r
zz jr
j
01
r为待定参数,可以从参数表中查。
二次回归正交旋转组合设计参数
因素水平编码表
2、列出因素水平编码表。
因素 Z1 Z2 Z3
+r Z1r
上水平( +1)
零水平( 0) Z01
下水平( -1)
-r Z-1r
变化区间 Δj
r
zz jr
j
01
j
j
zz
zz
01
01
3、确定试验计划表,进行试验的实施。
4、对试验结果利用 SAS进行统计分析。
5、建立回归方程并进行讨论。
二、二次回归正交旋转设计的应用例:研究尿素包合法富集鱼油中的 DHA和 EPA的工艺参数(尿素与脂肪酸的比例 Z1、结晶温度 Z2、结晶时间 Z3)
对 DHA和 EPA总含量的影响。
( 1)确定因素的变化范围尿素与脂肪酸的比例,0~25
结晶温度,-25℃ ~25℃
结晶时间,3h~29h
计算零水平,Z10=(0+25)/2=12.5
Z20=(-25+25)/2=0
Z30=(3+29)/2=16
查参数表 r=1.682 由此可以按照标准表安排试验方案。
因素水平编码表
2、列出因素水平编码表。
因素 Z1 Z2 Z3
+r 1.682 25 25 29
上水平( +1) 20 15 24
零水平( 0) 12.5 0 16
下水平( -1) 5 -15 8
-r -1.682 0 -25 3
变化区间 Δj 7.5 15 8
Run Z1 Z2 Z3 Y
1 1 1 1 78.99
2 1 1 -1 79.13
3 1 -1 1 84.61
4 1 -1 -1 85.66
5 -1 1 1 42.77
6 -1 1 -1 48.02
7 -1 -1 1 56.20
8 -1 -1 -1 52.73
9 1.682 0 0 83.11
10 -1.682 0 0 27.99
11 0 1.682 0 75.89
12 0 -1.682 0 81.28
13 0 0 1.682 81.89
14 0 0 -1.682 84.50
15 0 0 0 80.44
16 0 0 0 81.23
17 0 0 0 79.64
18 0 0 0 89.33
19 0 0 0 82.47
20 0 0 0 82.02
21 0 0 0 83.45
22 0 0 0 82.73
23 0 0 0 82.60
3、确定试验计划表,进行试验的实施。
4、对试验结果利用 SAS进行统计分析。
dat a a bc ;
inp ut x 1 - x 3 y;
c ar d s ;
1 1 1 78,99
1 1 - 1 79,13
1 - 1 1 84,61
1 - 1 - 1 85,66
- 1 1 1 42,77
- 1 1 - 1 48,02
- 1 - 1 1 56,20
- 1 - 1 - 1 52,73
1,682 0 0 83,1 1
- 1,68 2 0 0 27,99
0 1,682 0 75,89
0 - 1,68 2 0 81,28
0 0 1,682 81,89
0 0 - 1,68 2 84,50
0 0 0 80,44
0 0 0 81,23
0 0 0 79,64
0 0 0 89,33
0 0 0 82,47
0 0 0 82,02
0 0 0 83,45
0 0 0 82,73
0 0 0 82,60;
p r o c s o r t ;
b y x 1 - x 3 ;
pr oc r s r e g;
m ode l y= x 1 x 2 x 3 / l ac kf it ;
r un ;
Th e S A S S y st e m
C o d i n g C o e f f i c i e n t s f o r t h e I n d e p e n d e n t V a r i a b l e s
F a c t o r S u b t r a c t e d o f f D i v i d e d b y
X 1 0 1.68 200 0
X 2 0 1.68 200 0
X 3 0 1,6 8 2 0 0 0
Th e S A S S y st e m
R e sp on s e S u r f a c e f o r V a r i a bl e Y
R e s p o n s e M e a n 7 4,2 0 3 4 7 8
R o o t M S E 3.9 018 43
R - S qu a r e 0.9 664
C o e f,o f V a r i a t i o n 5.2 583
D e g r e e s
o f T yp e I S um
R e g r e ss i o n F r e e dom of S q u a r e s R - Sq u a r e F - R a t i o P r o b > F
L i n e a r 3 370 5.67 163 1 0.62 99 81.1 3 5 0,000 0
Q u a d r a t i c 3 196 7,663 531 0.33 44 43.0 8 1 0,000 0
C r o ss p r odu c t 3 12.1 5 303 8 0.00 2 1 0.26 6 0.8 486
To t a l R e g r e ss 9 56 85.4 881 9 9 0,96 64 41.4 9 4 0,000 0
D e g r e e s
o f S um o f
R e si du a l F r e e d om S q u a r e s M e a n S qu a r e F - R a t i o P r o b > F
L a c k of F i t 5 136,256 123 2 7,251 225 3.53 6 0.05 5 4
P u r e Er r o r 8 6 1,6 6 0 8 0 0 7,707 600
To t a l Er r o r 13 197,9 169 23 15,224 379
D e g r e e s P a r a m e t e r Est i m a t e
o f P a r a m e t e r S t a n d a r d T f o r H 0,f r om C od e d
P a r a m e t e r F r e e d om Est i m a t e Er r o r P a r a m e t e r = 0 P r o b > | T| D a t a
I N T ER C EP T 1 82.7 813 71 1.29 977 1 63.6 89 0.00 00 82.7 813 71
X 1 1 16.2 086 56 1.05 5 7 77 15.3 52 0.00 00 27,262 959
X 2 1 - 2.881481 1.0 557 77 - 2.72 9 0.01 72 - 4.84 665 1
X 3 1 - 0.538870 1.0 557 77 - 0.51 0 0.61 83 - 0.90 637 9
X 1* X 1 1 - 10.7 861 79 0.97 8 660 - 1 1.02 1 0.00 00 - 30.5 15 436
X 2* X 1 1 0,748 750 1.37 95 10 0.54 3 0.59 65 2,118 307
X 2* X 2 1 - 2.64 408 2 0,978 6 60 - 2.70 2 0.01 8 1 - 7.48 0 436
X 3* X 1 1 0,073 750 1.37 951 0 0.05 35 0,958 2 0,208 648
X 3* X 2 1 - 0.97 625 0 1,379 510 - 0.70 8 0.49 1 6 - 2.76 1 932
X 3* X 3 1 - 1.01 460 3 0,978 6 60 - 1.03 7 0.31 8 8 - 2.87 0 436
De g r e e s
o f S u m o f
F a c t o r F r e e d o m S q u a r e s M e a n S q u a r e F - R a t i o P r o b > F
X1 4 5 4 4 2,1 4 6 1 2 2 1 3 6 0,5 3 6 5 3 1 8 9,3 6 6 0,0 0 0 0
X2 4 2 3 6,6 4 1 5 9 9 5 9,1 6 0 4 0 0 3,8 8 6 0,0 2 7 3
X3 4 2 7,9 9 7 3 0 0 6,9 9 9 3 2 5 0,4 6 0 0,7 6 4 0
Th e S A S S y s t e m
C a n o n i c a l An a l y s i s o f R e s p o n s e S u r f a c e
( b a s e d o n c o d e d d a t a )
C r i t i c a l V a l u e
F a c t o r C o d e d U n c o d e d
X1 0,4 3 7 6 6 7 0,7 3 6 1 5 5
X2 - 0,2 5 8 7 5 8 - 0,4 3 5 2 3 0
X3 - 0,0 1 7 4 8 7 - 0,0 2 9 4 1 3
P r e d i c t e d v a l u e a t s t a t i o n a r y p o i n t 8 9,3 8 2 3 9 5
Ei g e n v e c t o r s
Ei g e n v a l u e s X1 X2 X3
- 2,4 8 7 2 2 5 - 0,0 0 6 5 3 5 - 0,2 6 7 8 4 4 0,9 6 3 4 4 0
- 7,8 1 4 0 3 4 0,0 4 6 1 3 0 0,9 6 2 3 5 4 0,2 6 7 8 5 5
- 3 0,5 6 5 0 5 0 0,9 9 8 9 1 4 - 0,0 4 6 1 9 4 - 0,0 0 6 0 6 6
S t a t i o n a r y p o i n t i s a m a x i m u m,
经分析等到回归方程
2
33231
2
221
2
1321
01.198.007.065.275.079.1054.088.221.1678.82 xxxxxxxxxxxxy
对方程的系数进行 t 检验,剔除不显著项,得到的回归方程为
2
2
2
121
65.279.1088.221.1678.82 xxxxy
通过上述 SA S 的 r s r e g 过程的分析还可知,该数学模型具有最大值,而且知道在最大值点处的坐标。
go p t i o n s r e s e t = g l o b a l gu ni t = pc t b o r de r c b a c k= w hit e
c o l o r s = ( bl a c k)
f t e x t = s w i s s f t i t l e = s w i s s b h t i t l e = 6 h t e x t = 4 ;
da t a t e m ;
do x 1= - 1 t o 1 by 0,1;
do x 2= - 1 t o 1 by 0,1;
Y= 82,7 8 + 16,21 *x 1 - 2,88 *x 2 - 10,7 9 *X1* X 1 - 2,6 5 *x 2* x 2;
o u t pu t ;
e n d ;
e n d ;
r un;
t it l e ' F igur e 1 ';
pr o c g3d da t a = t e m ;
pl ot x 2* x 1= y/g r id
r ot at e = 45
c t op= bl ac k
c bot t om = bl ac k
x t ic k nu m = 5
yt ic k nu m = 5
z t ic k nu m = 5
z m in= 45
z m a x = 100 ;;
r un;
go p t i o n s r e s e t = g l o b a l gu ni t = pc t b o r de r c b a c k= w hit e
c o l o r s = ( b l a c k )
f t e x t = s w i s s f t i t l e = s w i s s b h t i t l e = 6 h t e x t= 4;
t it l e 1 ' F igu r e 2 ';
ax is 1 o r d e r = ( - 1 t o 1 b y 0,5) ;
ax is 2 o r d e r = ( - 1 t o 1 b y 0,5) ;
l e ge n d1 po s i t i o n = ( r i g h t m i dd l e )
l a b e l = ( p o s i t i o n = t o p )
a c r o s s = 1 ;
s y m b o l 1 h e i g h t = 2,5
f o n t = s w i s s b
v a l u e = 'l o w e s t '
c o l o r = r e d ;
s y m b o l 2 h e i g h t = 2,5
s t e p = 2 5 p c t
c o l o r = b l a c k ;
s y m b o l 3 h e i g h t = 2,5
c o l o r = b l a c k ;
s y m b o l 4 h e i g h t = 2,5
c o l o r = b l a c k ;
pr o c gc o n to ur da t a = t e m ;
p l ot x 2* x 1= y/ l e ve ls = 45 t o 95 b y 4
a u t o l a b e l = ( c h e c k = n o n e )
h a xi s = a xi s 1
v a x i s = a x i s 2
l e g e n d = l e g e n d 1 ;
r un;
data abc;
input x1-x3 y;
cards;
(数据);
proc sort;
by x1-x3;
proc rsreg;
model y=x1 x2 x3/lackfit;
ridge min max center=m1,m2,m3 radius=0 to R by i;
run;
(m1,m2,m3)中心点的坐标
R是半径,R是半径的间隔
http://www.okstate.edu/sas/v8/saspdf/stat/