中国原创中国科学家巧妙的将,数论方法,和“
统计试验设计,相结合,发明了一种全新的试验设计方法,这就是均匀设计法。
均匀设计法诞生於1978年。由中国著名数学家 方开泰 教授和 王元 院士合作共同发明。
华罗庚 王元主要内容第一节 均匀试验设计的概念和特点第二节 均匀试验设计表第三节 均匀试验设计的基本方法均匀设计 是一种 试验设计方法 。它可以用较少的试验次数,安排多因素、多水平的析因试 验,是在 均匀性 的度量下 最好 的析因试验设计方法。
例:考察 5个因素,每个因素有 5个水平。
全面试验设计:需做 55=3125次实验;
正交试验设计:至少要进行 25次实验。
第一节 均匀试验设计的概念和特点一、均匀试验设计的概念正交试验设计的试验次数仍然不少,正交试验设计方法的实验次数之所以不能减至更少,是因为在正交试验设计方法中,为了简化数据处理,同时考虑了试验的 均衡分散性 和 整齐可比性,每一列中,同一水平至少出现 2次。
如果不考虑试验数据的整齐可比性,只考虑让数据点在试验范围内均匀分散,则将实验次数减少至比正交试验设计方法更少还是有可能的。这种 单纯地从数据点分布均匀性出发的试验设计方法,称为均匀试验设计方法。
均匀试验设计方法是用“均匀设计表”
来安排试验,常用的均匀设计表见书附录。
均匀设计表名称的表示方法及其意义如下:
二、均匀试验设计方法的特点
( 1)试验工作量少如要考察 4个因素的影响,每个因素 5个水平。若用正交试验设计法,宜用正交表 L25( 56),需做 25次实验。
若用均匀试验设计方法,可用,均匀设计表” U5( 54)
来安排试验,只需进行 5次试验,比正交试验设计法的实验工作量少得多。实验次数明显减少的主要原因是均匀试验设计表有一个特点,在表的每一列中,每一个水平必出现且只出现一次 。
均匀试验设计表 U5( 54)
列号 1 2 3 4
试验号
1 1 2 3 4
2 2 4 1 3
3 3 1 4 2
4 4 3 2 1
5 5 5 5 5
( 2)在正交试验设计表中各列的地位是平等的,因此无交互作用时,各因素安排在任一列是允许的。 均匀设计表则不同,表中各列的地位不一定是平等的,
因此,因素安排在表中的哪一列不是随意的,需根据试验中要考察的实际因素数,依照附在每一个均匀设计表后的,使用表” 来确定因素应该放在哪几列。例如为了使用均匀设计表 U9( 96)根据 U9( 96)表的使用表得知,当因素数为 2时,可安排在第 1,3列上。
U9( 96)均匀设计表列号 1 2 3 4 5 6
试验号
1 1 2 4 5 7 8
2 2 4 8 1 5 7
3 3 6 3 6 3 6
4 4 8 7 2 1 5
5 5 1 2 7 8 4
6 6 3 6 3 6 3
7 7 5 1 8 4 2
8 8 7 5 4 2 1
9 9 9 9 9 9 9
U9( 96)表的使用表因素数 列 号
2
3
4
5
6
1,3
1,3,5
1,2,3,5
1,2,3,4,5
1,2,3,4,5,6
( 3)试验设计表之间的关系。
附录表中一般只给出了试验次数和水平数为奇数的表,如 U5( 54),U7( 76),U9( 96),…,
U31( 3130)。 如果试验次数为偶数,将试验次数为奇数的表划去最后一行就得到比它次数少 1的偶数表,
而“使用表”不变。 如将表 U7( 76)划去最后一行即可得到 U6( 66),“使用表”不变。
( 4)因为均匀设计表无整齐可比性,故在均匀试验设计中不能像正交试验那样,用方差分析方法处理数据,
而需用 回归分析方法 来处理试验数据,也正因为处理数据用的是回归分析方法,所以在试验次数为奇数时,均匀设计表最后一行的存在,虽然对数据点分布的均匀性不利,但其不良后果可以被忽略。
( 5)在正交试验中,水平数增加时,试验次数按平方的比例增加,如水平数从 9增加到 10时,试验次数则从 81增加到 100。在均匀试验设计中,随着水平数的增加,试验次数只有少量的增加,如水平从 9增加到 10时,试验次数也从 9增加到 10。这也是均匀试验设计的一个很大的优点。一般认为,当因素的水平数大于 5时,就宜选择均匀试验设计方法。
第二节 均匀试验设计表一、等水平均匀试验设计表均匀试验设计表 U5( 54)
列号 1 2 3 4
试验号
1 1 2 3 4
2 2 4 1 3
3 3 1 4 2
4 4 3 2 1
5 5 5 5 5
因素数 列号
2 1 2
3 1 2 4
4 1 2 3 4
二、混合水平均匀试验设计表
Un(t1 q1× … × t2q2 )
均匀设计试验次数 各定量因素 之水平数定量因素的最大数
1 2 3
1 1 2 3
2 1 3 2
3 2 5 1
4 2 6 4
5 3 1 2
6 3 3 1
7 4 4 4
8 4 6 3
9 5 1 1
10 5 2 4
11 6 4 3
12 6 5 2
U12(62?4)
混合水平设计表是从等水平的均匀设计表,利用拟水平的方法得到的,现举例说明:
某试验考察 A B C三个因素,A B取三个水平,
C取 2个水平。直接利用等水平均匀表肯定不行,
但可以采用拟水平法对等水平均匀表进行改造。我们选用 U6(66),按使用表的指示应该用 1 2 3列。
现将 1,2列的水平作如下改造:
( 1,2) —— 1;( 3,4) —— 2;( 5,6) —— 3
第 3列的水平作如下改造:
( 1,2,3) —— 1;( 4,5,6) —— 2
这样就可以的到一个混合水平的均匀设计表
U6( 32× 21)。把因素 A B C依次放在 U6( 32× 21)
的第 1 2 3列上即可。
列号 1 2 3 4 5 6
试验号
1 1 2 3 4 5 6
2 2 4 6 1 3 5
3 3 6 2 5 1 4
4 4 1 5 2 6 3
5 5 3 1 6 4 2
6 6 5 4 3 2 1
因素数 列号
2 1 3
3 1 2 3
4 1 2 3 6
5 1 2 3 4 6
6 1 2 3 4 5 6
U6(66)
U6(66)使用表列号 1 2 3 4 5 6
试验号
1 1 1 2 1 3 2 4 5 6
2 2 1 4 2 6 3 1 3 5
3 3 2 6 3 2 1 5 1 4
4 4 2 1 1 5 3 2 6 3
5 5 3 3 2 1 1 6 4 2
6 6 3 5 3 4 2 3 2 1
U6(66)
该表均有很好的均衡性,如第 1列和第 3列,第 2列和第 3列的所有水平组合均出现且只出现 1次。但不一定每次拟水平都这么好。
为了使用方便,一般书中的附表都给出了常用的混合水平的构造方法,按照附表的指示生成的混合水平均匀设计表的均衡性最好。当要构造的混合水平表在附表中查不到时,只好按照均匀设计表的使用表的指示去构造了,当然这样得到的混合水平表其均衡性不一定是最好的。
第三节 均匀试验设计的基本方法一、试验方案的设计
1、根据试验目的确定试验指标
2、选择试验因素
3、确定因素水平进行均匀试验设计,试验范围尽可能取得 宽一些,以防最佳条件的遗漏。 每个因素的水平可适当多选择一些,使试验点分布更均匀。若某个或某些因素多取水平有困难,可以少取几个,即进行混合水平均匀设计。
4、选择均匀设计表设计表的选择,应根据研究的因素数和试验次数来选择。
均匀试验设计采用的是 多元回归分析法,最终会找到一个关于多个自变量( x)与一个因变量( y)
的回归方程。
如果方程是线性,其模型为
mm xxxy,..22110
要求出这 m个回归系数(不包括常数项,它可以有回归系数求得),就要列出 m个方程。为了对求得方程进行检验,还要增加一次试验,共 m+1次试验,因此应选择 试验次数 n大于或等于 m+1的均匀设计表 。
如果各自变量与因变量之间的关系是非线性的,或者存在交互作用,这是的回归方程就为多元高次方程,
如为二次关系时,回归模型为:
k
i
ii
T
ji
jiT
k
i
ii xxxxy
1
2
1,11
0 2
)1( kkT
2
)1( kkkkm回归方程的系数的个数总计为:
k为因素个数,最后一项为交互作用个数。为了求得二次项和交互作用项,必须选用 试验次数 n大于回归方程系数总数 m的均匀设计表。
例:考察三个因素,
如果自变量和因变量之间是线性关系,回归方程的系数与因素个数相同,m=3,可选择试验次数为 5的均匀设计表。
如果各因素的二次项对因变量也有影响,回归方程系数的个数 m=2*3=6,试验次数至少选择 7。
如果还需要考虑交互作用对因变量的影响,回归方程系数的个数为 m=3+3+3*(3-1)/2=9,试验次数至少选择
10。
因此,因素的多少和因素的方次大小都直接影响试验工作量。为了尽量能减少试验次数,在安排试验之前,应该先用专业知识判断一下各因素对因变量影响的大致情况,
各因素之间是否存在交互作用,删去影响不显著的因素和影响小的交互作用项及二次项,以便减少回归方程的系数,
从而减少试验次数。
若各因素的水平不全不相等,则选择用混合水平均匀表。所选混合水平表的列数与试验因素的个数一致,且某水平因素的个数与均匀表具有相应水平的列数一致。
5、制定试验方案选定的均匀表若为等水平,则根据因素个数在使用表上查出可安排因素的列号,再把各因素以其重要程度为序,因此排在表上,通常先排认为是重要的,
希望首先了解的因素。
如果选用混合水平均匀设计表,则按水平把各因素分别按排在具有相应水平的列中。
各因素所在的列确定后,将按排有因素的各列的水平代码换成相应因素的具体水平值,即得试验设计方案。如果设计表的水平数多于实际因素的水平数,此时可采用拟水平法安排试验。
需要指出的是:在均匀设计表中空列既不能用于考察交互作用,也不能估计误差。
6、试验的实施进行试验,通常根据试验号重复三次,偏差
<3%,取其平均值。
二、试验结果的分析
1、直观分析法如果试验的目的只是为了寻求一个较优的工艺条件,而又缺乏计算工具,这时可采用直观分析法,即从已做的试验点中挑一个试验指标最好的点,该点相应的因素水平组合即为要寻找的较优工艺条件,由于试验点充分均匀分布,试验点中的最优工艺条件,离在试验范围内通过全面试验寻找的最优工艺条件不会很远。
2、回归分析法均匀设计的结果分析最好采用回归分析法,通过对试验结果的回归分析,可解决如下问题:
( 1)得出反映各试验因素与试验指标的关系的回归方程。
( 2)根据标准回归系数的绝对值大小,得出试验因素对试验指标影响的主次顺序。
( 3)根据方程的极值点可得出最优工艺条件。
三、均匀设计实例
1、试验指标和因素水平的确定在阿魏酸的合成工艺考察中,为了提高产量,选取了原料配比 (A)、吡啶量 (B)和反应时间 (C)三个因素,它们各取了 7个水平如下:
原料配比( A),1.0,1.4,1.8,2.2,2.6,3.0,3.4
吡啶量( B) (ml),10,13,16,19,22,25,28
反应时间( C) (h),0.5,1.0,1.5,2.0,2.5,3.0,3.5
7个水平,需要安排 7次试验,根据因素和水平,我们可以选用 U7(76)完成该试验。
1 2 3 4 5 6
1 1 2 3 6 5 6
2 2 4 6 5 3 5
3 3 6 2 4 1 4
4 4 1 5 3 6 3
5 5 3 1 2 4 2
6 6 5 4 1 2 1
7 7 7 7 7 7 7
U7(76)
列号试验号因素数 列号
2 1 3
3 1 2 3
4 1 2 3 6
5 1 2 3 4 6
6 1 2 3 4 5 6
U7(76)使用表
2、均匀试验设计表的选择
No,配比
( A)
吡啶量
( B)
反应时间
( C)
收率
( Y)
1 1.0(1) 13(2) 1.5(3) 0.330
2 1.4(2) 19(4) 3.0(6) 0.336
3 1.8(3) 25(6) 1.0(2) 0.294
4 2.2(4) 10(1) 2.5(5) 0.476
5 2.6(5) 16(3) 0.5(1) 0.209
6 3.0(6) 22(5) 2.0(4) 0.451
7 3.4(7) 28(7) 3.5(7) 0.482
制备阿魏酸的试验方案 U7(73)和结果
3、确定试验方案及实施
根据试验方案进行试验,其收率 (Y)列于表的最后一列,其中以第 7号试验为最好,其工艺条件为配比 3.4,吡啶量 28ml,反应时间 3.5h。
4、结果分析
( 1)直观分析法
( 2)回归分析法采用 SAS程序进行。
d at a a b c ;
in p u t X1 - X3 Y ;
x 4= x 1* x 1;
x 5= x 2* x 2;
x 6= x 3* x 3;
x 7= x 1* x 2;
x 8= x 1* x 3;
x 9= x 2* x 3;
c ar d s ;
1 13 1,5 0,33
1,4 19 3,0 0,366
1,8 25 1,0 0,294
2,2 10 2,5 0,476
2,6 16 0,5 0,209
3,0 22 2,0 0,451
3,4 28 3,5 0,482;
p r oc r e g;
m od e l Y = X1 - x 9/s e le c t ion = f ;
r u n ;
T h e S A S S y s t e m 1 7,2 1 M o n d a y,D e c e m b e r 1 9,2 0 0 6 5 4
T h e R E G P r o c e d u r e
M o d e l,M O D E L 1
D e p e n d e n t V a r i a b l e,Y
Forward Select ion,Step 1
V a r i a b l e X 3 E n t e r e d,R - S q u a r e = 0,6 9 0 6 a n d C ( p ) =,
A n a l y s i s o f V a r i a n c e
S u m o f M e a n
S o u r c e D F S q u a r e s S q u a r e F V a l u e P r > F
M o d e l 1 0,0 4 3 9 2 0,0 4 3 9 2 1 1,1 6 0,0 2 0 5
E r r o r 5 0,0 1 9 6 8 0,0 0 3 9 4
C o r r e c t e d T o t a l 6 0,0 6 3 6 1
P a r a m e t e r S t a n d a r d
V a r i a b l e E s t i m a t e E r r o r T y p e I I S S F V a l u e P r > F
I n t e r c e p t 0,2 1 4 1 4 0,0 5 3 0 3 0,0 6 4 2 0 1 6,3 1 0,0 0 9 9
X 3 0,0 7 9 2 1 0,0 2 3 7 1 0,0 4 3 9 2 1 1,1 6 0,0 2 0 5
B o u n d s o n c o n d i t i o n n u m b e r,1,1
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
输出结果:
Forward Select ion,Step 2
Var ia ble x6 E nte r ed,R - Sq u are = 0,80 0 7 a n d C ( p) =,
Ana ly sis of V ari a nce
Su m o f Me a n
S our c e DF S q uar e s Squ a re F Val u e Pr > F
M ode l 2 0,050 9 3 0,02 5 46 8,0 3 0,0 397
E rro r 4 0,012 6 8 0,00 3 17
C orr e cte d To t al 6 0,063 6 1
Par ame t er S tan d ard
V ari a ble Es t ima t e Er r or Ty p e II SS F Va l ue Pr > F
I nte r cep t 0,104 5 7 0,08 7 74 0.0 0 4 50 1,42 0.2 9 92
X 3 0,225 3 1 0,10 0 57 0.0 1 5 91 5,02 0.0 8 86
x 6 - 0,036 5 2 0,02 4 57 0.0 0 7 00 2,21 0.2 1 14
Bou nd s o n co n dit i on n umb e r,2 2.3 3 3,8 9.3 3 3
--- -- --- - --- - --- - --- - --- - --- - --- - --- - --- - --- - --- - --- - - --- -- --- - --- - --- - --- - --- - --- - --- - --- - -
Forward S ele ct ion,S tep 3
Var ia ble x8 E nte r ed,R - Sq uar e = 0,97 7 7 a n d C ( p) =,
The S AS S yst e m 1 7,21 Mon d ay,D ece mb er 1 9,2 006 55
The R EG P roc e dur e
Mod el,M O DEL 1
Dep en den t Va r iab l e,Y
For wa rd S ele c tio n,S t ep 3
Ana ly sis of V ari a nce
Su m of Mea n
So urc e D F Sq u are s S qua r e F V alu e Pr > F
M o del 3 0,0 621 9 0,020 7 3 4 3.8 8 0.0 0 56
Er ror 3 0,0 014 2 0.0 00 472 4 4
C o rre c ted Tot a l 6 0,0 636 1
Par a met e r S t and a rd
Va ria b le Est i mat e Err o r Typ e II S S F Val u e P r > F
I n ter c ept 0,0 623 2 0,034 9 6 0,00 1 5 0 3,1 8 0,17 2 7
X 3 0,2 511 3 0,039 1 8 0,01 9 4 1 41,0 8 0,00 7 7
x6 - 0.0 600 0 0,010 6 3 0,01 5 0 4 31,8 3 0,01 1 0
x 8 0,0 234 7 0,004 8 1 0,01 1 2 6 23,8 4 0,01 6 4
Bou nd s o n co n dit i o n n umb e r,2 8.0 7,1 6 4.8 6
--- -- --- - --- - --- - --- - --- - --- - --- - --- - --- - --- - --- - --- - - --- -- --- - --- - --- - --- - --- - --- - --- - --- - -
Forward Select ion,Step 4
Va ri a bl e x9 E nt er ed,R - Sq ua re = 0,9 96 4 an d C( p) =,
An al y si s of V ar ia nc e
Su m of M ea n
So ur c e DF Sq ua re s Sq u ar e F Va lu e P r > F
Mo de l 4 0,06 33 8 0,0 1 58 4 1 38,2 1 0,0 07 2
Er ro r 2 0,0 00 22 92 9 0,00 01 1 46 4
Co rr e ct ed T ot al 6 0,06 36 1
Pa ra m et e r St an da rd
Va ri ab le Es ti ma te Er ro r Ty pe I I S S F Va lu e P r > F
In te rc ep t 0,0 84 83 0,01 85 9 0,0 02 3 9 20,8 3 0,0 44 8
X3 0,2 31 79 0,02 02 2 0,0 15 0 7 1 31,4 8 0,0 07 5
x6 - 0,0 50 29 0,00 60 5 0,0 07 9 3 69,1 9 0,0 14 1
x8 0,0 28 42 0,00 28 2 0,0 11 6 2 1 01,3 3 0,0 09 7
x9 - 0,0 01 40 0,0 00 43 37 2 0,0 01 1 9 10,3 6 0,0 84 5
Bo un d s on c on di ti on n um be r,3 7,37 7,3 09,3 4
-- -- - -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- - -- -- - -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -
For wa rd S ele c tio n,S t ep 5
Var ia ble x5 E nte r ed,R - Sq uar e = 0,99 9 6 a n d C ( p) =,
The S AS S yst e m 1 7,21 Mon d ay,D ece mb er 1 9,2 006 56
The R EG P roc e dur e
Mod el,M O DEL 1
Dep en den t Va r iab l e,Y
For wa rd S ele c tio n,S t ep 5
Ana ly sis of V ari a nce
Su m of Mea n
S o urc e D F Sq u are s S qua r e F V alu e Pr > F
Mo del 5 0,0 635 9 0,012 7 2 5 6 8.3 7 0.0 3 18
E r ror 1 0,000 0 223 7 0.0 00 022 3 7
C orr e cte d To t al 6 0,063 6 1
Pa r ame t er S tan d ard
V ari a ble Es t ima t e Er r or Ty p e I I SS F Va l ue Pr > F
I nte r cep t 0,066 8 9 0,01 0 11 0,0 009 7 9 14 43,76 0.0 9 55
X 3 0,239 9 8 0,00 9 33 0.0 1 4 81 661,94 0.0 2 47
x 5 0,00 0 073 5 9 0.0 0 002 4 20 0,0 002 0 6 91 9,25 0.2 0 23
x 6 - 0,046 4 1 0,00 2 96 0.0 0 5 51 246,06 0.0 4 05
x 8 0,028 3 6 0,00 1 25 0.0 1 1 56 516,71 0.0 2 80
x 9 - 0,002 5 8 0.0 0 043 3 56 0,0 007 9 1 65 35,38 0.1 0 60
Bou nd s on co n dit i on n umb e r,4 6.7 2 3,6 77,0 1
--- -- --- - --- - --- - --- - --- - --- - --- - --- - --- - --- - --- - --- - - --- -- --- - --- - --- - --- - --- - --- - --- - --- - -
No ot her var i abl e me t th e 0,5 000 sig n ifi c anc e le v el f o r e nt ry i nto the mod e l,
Sum ma ry o f F o rwa r d S e lec t ion
V ari a ble Num b er P art i al M ode l
S tep E nte r ed Var s In R - Squ are R - Squ ar e C ( p) F V a lue P r > F
1 X 3 1 0.6 9 06 0,69 06,1 1,16 0,02 0 5
2 x 6 2 0.1 1 01 0,80 07,2,21 0,21 1 4
3 x 8 3 0.1 7 71 0,97 77,2 3,84 0,01 6 4
4 x 9 4 0.0 1 87 0,99 64,1 0,36 0,08 4 5
5 x 5 5 0.0 0 33 0,99 96,9,25 0,20 2 3
31233 0 2 3 5.006.025.00 6 2 3 2.0? xxxxy
结果分析:
残差图偏回归图优化 -- 寻找最佳的因素水平组合均匀设计表的设计是 73=343个全面试验的部分实施,其中最好的试验点是值为 Y= 48.2%。 它不一定是全局最好的
。我们想找到满足下式的 x1*和 x3*,
),(?m ax),(? 31*3*1 xxYxxY?
这里求取 max的区域为:
5.35.0,4.31 31 xx
3123331 0 2 3 5.006.025.00 6 2 3 2.0),(? xxxxxxY且
goptions re set=glob al gunit =pct bor der cba ck=w hite
co lors=(bl ack)
ft ext=swis s ftitle =swissb htitle= 6 ht ext=4;
data tem;
do x1=1 to 3.4 by 0,1;
do x3=0.5 t o 3.5 by 0.1;
Y=0.06232+0,25*x3 - 0,0 6 * x 3 * x 3 + 0,0 2 3 5 * x 1 * x 3 ;
output;
end;
end;
run;
title 'Figu re1';
proc g3d da ta=tem;
plot x3*x1= y/grid
r o t a t e = 4 5
c top=blac k
c bottom=b lack
x ticknum= 5
y ticknum= 5
z ticknum= 5
z min=0
z max=0.6;
run;
goptions re set=glob al gunit =pct b or de r cb a ck =w hi te
co lors=(bl ack)
ft ext=swis s ftitle =swissb htitle= 6 ht ext=4;
title1 'Fig ure2';
axis1 order =(1 to 3,4 by 0,6);
axis2 order =(0.5 to 3.5 by 0.6);
legend1 pos ition=(r ight mid dle)
lab el=(posi tion=top )
acr oss=1;
symbol1 hei ght=2.5
fon t=swissb
val ue='lowe st'
col or=red;
symbol2 hei ght=2.5
ste p=25pct
col or=black ;
symbol3 hei ght=2.5
col or=black ;
symbol4 hei ght=2.5
col or=black ;
proc gconto ur data = te m;
plot x3*x1= y/levels =0 to 0,6 by 0.0 2
aut olabel=( check=no ne)
hax is=axis1
vax is=axis2
leg end=lege nd1;
run;
x1x3的回归系数是正的,x3的回归系数也是正的,x1* = 3.4
2333 06.03 3 0 9.00 6 2 3 2.0),4.3(? xxxY
在 x3* = 2.7575达到最大值 。 在 x1* = 3.4和 x3* = 2.7575处估计响应的最大值是 51.85% 。 它比7个试验点的最好值 48.2%
还大。
讨 论因素 x2 没有给响应 Y予显著的贡献,我们可以选 x2为其中点 x2 = 19 ml.
求出的 x1* = 3.4 在边界上,我们需要扩大 x1的试验上限。
在 x1 = 3.4和 x3 = 2.7575的邻域,追加一些试验是必要的。