正交试验在医药科研中的应用
屠鹏飞(北京医科大学药学院)
一、正交试验法的作用
表1、乙酰苯胺不同磺化试验结果
试验号
反应温度(℃)
反应时间(小时)
硫酸浓度(%)
操作方法
收率(%)
1
50
1
17
搅拌
65
2
50
1
27
不搅拌
74
3
50
2
17
不搅拌
71
4
50
2
27
搅拌
73
5
70
1
17
不搅拌
70
6
70
1
27
搅拌
73
7
70
2
17
搅拌
62
8
70
2
27
不搅拌
67
从上述8种试验结果来看,第2号工艺最好,因为收率最高。4号、6号工艺比2号收率只低1%,其它5种工艺则相差较大,所以也可以说2号、4号、6号三种磺化工艺较好。
上述分析是就事论事的分析方法,分析结果的准确性不大,缺乏科学性。上述试验只能说所做的8组试验中,2号最好,但只做一次试验,可信度只有1%。如果要达到可信度95%以上,就必须做100次试验,有95次都表明2号是最好的,才能说明问题,事实上没有人会这样做。或者做较多次的试验,比如10次,再采用统计方法,如果P<0.05,则说明2号与其它各组有显著性差异,否则不能说明问题,从上面结果来看,2号与4号、 6号差距不大,4号、6号与其他各组也差距不大,很难有显著性差异(P<0.05),即使有显著性差异,也只能说明这8组中2 号最好,不能说明总体试验中,2号为最好。
如果采用正交试验法,可归纳成表2的试验方案:
表2 乙酰苯胺磺化试验正交设计
因子
水平
A
反应温度(℃)
B
反应时间(小时)
C
硫酸浓度(%)
D
操作方法
1
50
1
17
搅拌
2
70
2
27
不搅拌
表2的试验如果全面互相搭配进行,则要做16组,如果采用正交L8(27)法,只需做8组试验,就可得出二点可信度达95%的可靠结论。
①影响收率的关键是硫酸浓度,即硫酸一定要采用27%,磺化温度如果采用50℃,则时间要采用2小时;磺化温度如果采用70℃,时间要采用1小时,不然收率就低。搅拌与否,对收率没有显著的影响。
②最优化工艺不是2号,而是4号和6号。经进一步计算,4号和6号比2号平均收率高出4.73%。
从上述实例可以看出,采用正交法,既省力,又可得出科学、可信度高的结果。
二、正交试验法的基本特点
用正交法来安排试验,在于安排试验的这种正交表具备均衡分散,整齐可比特性。
(一)试验均衡分散
在说试验均衡分散之前,先介绍两种概念。
1、因子与水平
完成一项研究,或一个产品的条件叫因子(因素)。例如煮大米饭,是米、水、火三个条件参与完成的,那么米、水、火就是煮饭的三个因子(因素)。
水平是指因子(因素)所处的不同状态,即试验点。例如煮饭是早米好吃,还是用晚米好吃,早米、晚米就是不同的水平,同理每公斤米加1公斤还是加1.25公斤水好,火是大火好还是文火好,都是不同的水平。
如果要做煮饭试验,用正交试验法将因子和水平列成表3。
表3 煮饭试验的表头设计
因子
水平
A
米
B
水
C
火
1
早米
1kg
大火
2
晚米
1.25kg
文火
2、正交表
正交表是指正交试验法中安排试验,分析试验的一种得力工具,每张正交表,都有自己的名字,并反映出表的具体内容。以L4(23)为例:
2水平有:L4(23)、L8(27)、L12(211)……L64(263)
3水平有:L9(34)、L18(37)、L27(331)………L81(340)
4水平有:L16(45)、L32(48)、L64(421)
表4 L4(23)正交表
列号
试验号
1
2
3
1
1
1
1
2
1
2
2
3
2
1
2
4
2
2
1
所有正交表都具备以下两个数学性质:
①任何一列,各水平出现的次数相同。
②任何两列的同一横行,有序数对出现次数相同。上述两点,缺少任何一点,表就不正交了。
3、均衡分散:一个整体的全面试验中,用正交表挑出来的这部分试验分布均匀,代表性强,所以只要通过这部分试验,就能反映全部试验情况。
下面仍以煮饭为例:
任何一个面上都有二个试验点
任何一条线上都只有一个试验点
所有因子的水平一视同仁
(二)数据计算简单
表5 金、银、铜球重量试验
因子
水平
A
铜球
B
银球
C
金球
1
铜甲(25g)
银乙(30g)
金甲(22g)
2
铜乙(21g)
银甲(20g)
金乙(34g)
表6 金、银、铜球重量正交试验表
表头
试验号
A
1
B
2
C
3
试验结果(g)
1
1
1
1
77
2
1
2
2
79
3
2
1
2
85
4
2
2
1
63
K1
156
162
140
T=304
K2
148
142
164
=T/N=76
R
8/2
20/2
24/2
K:表示各因子的相同水平所对应的试验值之和。
R:表示极差。
从上述试验结果可以得出下列二点结论:
①比较R值大小,可以看出某因子在这些试验中起主要作用或起次要作用。
②比较K值大小,可以知道该因子不同水平对试验影响的程度。
μ优 (A1B1C2)=(A1+B1+C2)/2-2
=(156+162+164) /2-76×2=89
三、正交表的应用程序
(一)单一水平正交表应用
1、二水平正交表的应用
例:板蓝根注射液除杂质方法试验
板蓝根水煎液,用乙醇沉降,冷藏,调pH等方法去除杂质,其注射液常发生澄明度或含量不合格。用石硫醇法处理,虽然解决了澄明度问题,但含量仍不能稳定。为了摸清影响含量和澄明度的原因,将上述两种方法组成下表试验方案。
表7 板蓝根注射液除杂质方法试验
因子
水平
A
B
C
1
加20%石灰乳调pH至12过滤,加5%硫酸至pH7,过滤
加乙醇至含醇量达85%沉降
用氨调pH至9
2
加乙醇至含醇量70%沉降
0
0
表8 板蓝根注射液除杂质方法正交试验
因子
水平
A
1
B
2
C
3
试验结果
1
1
1
1
7.9
2
1
2
2
6.3
3
2
1
2
7.8
4
2
2
1
10.3
K1
14.2
15.7
18.2
K2
18.1
16.6
14.1
R
3.9/2
0.9/2
4.1/2
最佳工艺:A2B0C1
2、三水平正交表的应用
例、筋骨宁湿敷剂乙醇渗漉条件的考察
处方:当归、延胡索、赤芍、丹皮、栀子等12味药组成。
表9 因子水平表
因子
水平
醇浓度(%)
A
浸泡时间(h)
B
收集渗漉液(ml)
C
渗漉速度(ml/min)
1
60
12
4000
2
2
70
24
5000
3
3
80
48
6000
4
表10 正交试验结果(L9(34))
表头
试号
A
B
C
D
延胡索乙素总量(mg)
1
1
1
1
1
6.49
2
1
2
2
2
9.36
3
1
3
3
3
13.86
4
2
1
2
3
9.68
5
2
2
3
1
13.85
6
2
3
1
2
8.83
7
3
1
3
2
15.03
8
3
2
1
3
13.89
9
3
3
2
1
15.23
K1
29.71
31.20
29.21
35.57
K2
32.36
37.10
34.27
33.22
K3
44.15
37.92
42.74
37.42
R
4.81
2.24
4.51
1.40
影响乙素提取率的主要因素是醇浓度和收集渗漉液量
浸泡时间24小时与48小时没有明显区别
渗漉速度对含量影响很小
优化工艺:A3B2C3D3
3、四水平正交表应用
例、甘草酸提取方法实验
采用不同溶剂和不同溶剂的不同用量,从甘草中提取甘草酸,将水平、因子设计见表11。
表11 甘草酸提取实验水平因子
因子
水平
溶剂用量
A
不同溶剂
B
1
200
0.25%氯仿水
2
250
0.5%氨水
3
300
10%乙醇
4
600
蒸馏水
表11按总自由度加1计算,用正交试验法安排最少需做7组,由于A、B均是4水平,只能从4水平正交表中去找,而4水平正交表中最小者是L16(45),所以只能选L16(45)安排。
表12 甘草酸提取正交试验
表头
试号
A
1
B
2
3
4
5
甘草酸含量×100-11
1
1
1
1
1
1
-4.31
2
1
2
2
2
2
-1.50
3
1
3
3
3
3
-1.00
4
1
4
4
4
4
0.41
5
2
1
2
3
4
-4.23
6
2
2
1
4
3
-2.65
7
2
3
4
1
2
-2.01
8
2
4
3
2
1
0.26
9
3
1
3
4
2
-3.10
10
3
2
4
3
1
3.09
11
3
3
1
2
4
0.59
12
3
4
2
1
3
0.69
13
4
1
4
2
3
0.01
14
4
2
3
1
4
3.99
15
4
3
2
4
1
2.14
16
4
4
1
3
2
3.26
K1
-6.40
-11.62
-3.10
-1.63
1.19
T=-4.36
K2
-8.63
2.92
-2.91
-0.65
-3.36
K3
1.27
-0.28
0.15
1.12
-2.95
K4
9.40
4.62
1.50
-3.20
0.76
R×4
18.03
16.24
4.60
4.32
4.55
结果分析:
根据表12的R和K所示,列3、列4、列5是误差估计列,因为其R均小,用其Re=(R3+R4+R5)×1/3=4.17来衡量RA和RB,而RA、RB均超过Re的2倍以上,故可知因子A、B均是主要因子。取其好水平,其最优提取方法是:A4B4或A4B2。而最差提取方法是A2B1或A1B1。以试验对照,均与试验实际吻合。故结论为:
从甘草中提取甘草酸,用蒸馏水、0.5%氨水比用10%乙醇、0.25%氯仿水能明显提供收率。
从甘草中提取甘草酸,其溶剂用量以600ml比300、250、200ml能明显提高收率。
(二)有交互作用的试验安排
“世界上的一切事物都是互相联系、互相制约的”。我们所做试验的因子间关系也是如此。如某因子不论在其它因子的什么水平情况下,其试验值不是水平1比水平2好,就是水平2比水平1好。用正交表安排,其R值(或F值)较小者,称为该因子不与其它因子发生明显的交互作用。反之,某一因子水平好坏是依赖于其它因子水平而定,用正交表安排,其R值(或F值)一定较大者,这种情况表明这两个因子间存在有明显的交互作用。在医药科研和病例分析中,常常会遇到这样类似的情况。
当某一药物反应温度为50℃时,反应时间用2小时,会比用1小时明显提高收率。倘若反应温度改成70℃时,而反应时间还是2小时,那么其收率就会比用1小时明显的降低。但在加催化剂用量上,无论是反应温度50℃还是70℃,或是反应时间2小时,还是1小时,催化剂用量20%的收率都明显高于用10%的。因此,可以说“反应温度与反应时间存在交互作用,而反应温度与催化剂用量和反应时间与催化剂用量之间则不存在交互作用”。用正交表安排,前者的R(或F)值一定会比后两者大。
如何应用正交表来考察因子间是否存在着交互作用
定名
以上述三种交互作用为例,反应温度A、反应时间B、催化剂用量C
则:A与B的交互作用表示为:A×B
A与C的交互作用表示为:A×C
B与C的交互作用表示为:B×C
这三种交互作用如果都安排在正交表上考察,照上述说法,RA×B一定大于RB×C和RA×C。
计算自由度
用正交表安排交互作用,一对交互作用当作一个因子,但其所占正交表的列数不一定和因子所占列数完全相同,而是要看其两因子自由度乘积(即其自由度)大小来定。如二水平三因素的正交试验,如果要安排A×B,其A×B自由度即fA×B=fA×fB=(2-1)(2-1)=1,用1列安排。原用L4(23)安排,现在增加A×B,则其所做试验次数是fA+fB+fC+fA×B+1=5,在2水平正交表中没有做5组的正交表,于是改用L8(27)安排。在三水平四因素的正交试验中,fA×B=(3-1)(3-1)=4,而原来的3水平正交表每列自由度为2,故A×B不能用1列,而要用2列才能安排,如此,也不能用L9(34)安排,而要用L27(313)安排,因为fT+1=fA+fB+fC+fA×B+1=(3-1)×4+(3-1)(3-1)+1=13。
查交互作用表
L4(23)只安排了二个因子,如果A与B存在交互作用,就在另一列上反映出来,其表头设计为:
因子
A
B
A×B
列号
1
2
3
但如果要考察三因子A×B、B×A、A×C的交互作用是否存在,就要改用L8(27),在作表头设计时应查对其所选用正交表后面的交互作用表。方法如下:在表头设计时先查L8(27)的交互作用表,见表13。
表13 L8(27)交互作用表
列号
列号
1
2
3
4
5
6
7
(1)
3
2
5
4
7
6
(2)
1
6
7
4
5
(3)
7
6
5
4
(4)
1
2
3
(5)
3
2
(6)
1
如果A安排在列1,B安排在列2,那么A×B安排位置就从表13中的(1)横着向右看,(2)竖着向上看,它们的交叉点是3,此3就是A×B要安排在列3。同理,B安排在列2,C安排在列4,B×C就安排在列6。A×C安排在列5。交互作用的表头设计为:
因子
A
B
A×B
C
A×C
B×C
D
列号
1
2
3
4
5
6
7
交互作用占一列举例
例、乙酰苯胺磺化试验
乙酰苯胺磺化试验,实践表明反应温度与反应时间可能存在着交互作用,因此在原来的正交试验上加A×B,总自由度加1应改为:
fT+1=fA+fB+fC+fD+fA×B+1=(2-1)×4+(2-1)(2-1)+1=6
按此计算,仍然可以选L8(27)安排。本例是4个因子各占1列,一个A×B交互作用占1列,共计占去5列,尚有2列空出,因此表头设计应采用主效应主与交互作用混杂的设计,将A、B、C、D分别安排在列1、2、4、7,A×B安排在列3。而列5、6空着作试验误差估计。于是表头设计为:
因子
A
B
A×B
C
D
列号
1
2
3
4
5
6
7
表14 一列交互作用正交试验
表头
试号
A
1
B
2
A×B
3
C
4
5
6
D
7
实验结果
(-70) y
1
1
1
1
1
1
1
1
-5
2
1
1
1
2
2
2
2
4
3
1
2
2
1
1
2
2
1
4
1
2
2
2
2
1
1
3
5
2
1
2
1
2
1
2
0
6
2
1
2
2
1
2
1
3
7
2
2
1
1
2
2
1
-8
8
2
2
1
2
1
1
2
-3
K1
3
2
-12
-12
4
-5
-7
T=-5
K2
-8
-7
7
7
1
0
2
R
11/4
9/4
19/4
19/4
3/4
5/4
9/4
试验结果分析:
确定主要因子:由表14可见,RC和RA×B较大,取其好水平C2、(A×B)2和差水平C1、(AB)1,它们分别包括了较好的4号、6号和较差的1号、7号试验,但没有包括2号,为什么?是偶然因素造成的,还是主要作用列当作非主要作用列所致?第二步就应当把主要作用R值降低。由空着列R5、R6较小来看,可以合并当作Re,于是:Re=(R5+R6)1/2=(3/4+5/4)1/2=4/4
用Re值来衡量,A、B、D也可算主要因子,因为R因>2Re者,说明有75%的把握说该因子间的水平试验值有不同影响。所以列1、2、7也可算主要作用列。当A×B存在,而且RA×B>RA、RB,A、B的最优水平的确定要服从A×B列好水平所对应的水平。因此最优水平的组合为(A×B)2C2D2、最差水平的组合为(A×B)1C1D1。选出的最优试验,如果将D2换成D1就包括了4号、6号试验,D2>D1,可见选出的最优水平组合会比4号、6号试验更好。
交互作用因子好水平的选取:从RA、RB来说也可算主要因子列。但由于A×B的存在,其好水平的选取就不是A1和B2,而要服从于A×B的好水平2所对应的水平,即A1B2、A2B1。也就是说,A1B2、A2B1搭配一定会比A1B1、A2B2收率高。
最优试验的选取:A×B好水平确定了,再与主要因子C和D好水平组合就形成最优试验工艺为:A1B2C2D2、A2B1C2D2。
结论:
反应温度与反应时间存在交互作用。即反应温度用50℃,反应时间宜用2小时,反应温度用70℃,反应时间宜用1小时,否则收率会明显下降。
硫酸浓度用27%比用17%的收率能明显提高。
搅拌宜去掉。
在16种磺化工艺中,只有两种最优,即加硫酸27%在不搅拌情况下,用50℃反应2小时(或70℃反应1小时)。
例、复方丹参注射液的研制
临床用丹参、葛根、桑寄生、黄精、首乌和甘草组成复方丹参汤剂,治疗冠心病效果很好。要将它制成注射液,需要解决下列问题:
(1)这六种中药组成是否合理
(2)用水煎煮,还是用乙醇渗漉能提高疗效和降低毒性
(3)除去杂质是用调pH,还是用明胶能提高疗效和降低毒性
(4)注射液中需不需要加吐温-80助溶
为了解决上述问题,设计下列试验:
表15 丹参注射液试验因子、水平设计
因子
水平
A
B
C
D
E
1
甘草、桑寄生
丹参
吐温-80
调pH除杂
60%乙醇
渗漉
2
0
丹参、黄精
首乌、葛根
0
明胶除杂
水煎煮
正交试验表设计:
总自由度加1=fA+fB+fC+fD+fE+fE×C+1=7,故选L8(27) 安排试验。
表16 复方丹参注射液研制的正交试验表
表头
试号
A
1
B
2
C
3
D
4
E
5
C×E
6
7
试 验 结 果
冠脉流量 毒性
1
1
1
1
1
1
1
1
-40
4
2
1
1
1
2
2
2
2
-26
0
3
1
2
2
1
1
2
2
52
4
4
1
2
2
2
2
1
1
-2
0
5
2
1
2
1
2
1
2
-154
2
6
2
1
2
2
1
2
1
-47
1
7
2
2
1
1
2
2
1
53
0
8
2
2
1
2
1
1
2
13
0
血 K1
-16
-267
0
-89
-22
-183
-36
流 K2
-135
116
-151
-62
-129
32
-115
量 R
119/4
383/4
151/4
27/4
107/4
215/4
79/4
毒 K1
8
7
4
10
9
6
5
性 K2
3
4
7
1
2
5
6
R
5/4
3/4
3/4
9/4
7/4
1/4
1/4
结果分析:
从血流量指标的R来看,B和C×E是主要的,B宜取B2,C×E宜取C1E2或C2E1,可明显地增加冠脉血流量。其它因子R较小,其水平可以任选。
从毒性指标的R来看,因子D、E、A的R较大,宜取D2、E2、A2能降低注射液的毒性。
结论:
在上述四种药方组成中,以丹参、首乌、黄精、葛根(B2)为最优处方,再加甘草、桑寄生(A1)虽不会降低冠脉流量,但毒性增加。
用水和60%乙醇渗漉,冠脉流量没有明显的差别,但从毒性来讲,以水为好。
除杂方法,调pH与加明胶无明显差异,但从毒性考虑,以采用明胶为好。
如果用水煎煮,则应该加吐温-80。
根据上述分析,最优工艺为:A2B2C1D2E2。
交互作用占二列举例
例、抗生素培养基筛选试验
表17 因子、水平表
水平
因子
1
2
3
A、鱼粉(%)
1
0
0.5
B、胨+黄豆粉
1.5+1.5
1+2
1+1
C、KNO3
0
0.1
0.3
D、碳源1号
1.5
0
2.5
E、(NH4)2SO4
0.05
0.2
0
F、丙酸
0.02
0
0.05
G、丙二醇
0
0.05
0.2
H、正丁醇
0
0.05
0.02
fT+1=fA+……+fH+fA×C+fA×C+1=(3-1)×8+(3-1)(3-1)×2+1=25
由于8个因子均为三水平,故用L27(313)安排试验。FA×B和fA×C均是4,而L27(313)每列的自由度为2,故用两列才能安排。见表18。
结果分析:
(1)确定主要因子:R13与R因相比,R13较小,可算试验误差,同时RA×B、RE、RG和R13相近,可将其合并,计算Re。
Re=(R13+RA×B+RE+RG)1/5=0.28754
与Re相比,A、F、B、C、D、H、A×C均起主要作用因子。因此最优组合为:B1(A×C)21D2F2H1。
与试验对照,如果(A×C)21换成(A×C)12、D2换成D3就是包括了较好的12号试验。从K值(A×C)21比(A×C)12、D2比D3高来看,其B1(A×C)21D2F2H1组合应比12号试验更好。因此B、D、F、H、A×C为主要因子。
(2)交互作用因子好水平的选取:(A×C)21所对应的A、C水平是A3、C3,那么A3、C3就是最好水平的搭配。
最优试验的选取:根据上述分析,最优试验为:A3B1C3D2E0F2G0H1。
结论:
鱼粉、胨+黄豆粉、KNO3,在培养基中不可去掉,其中,鱼粉与KNO3用量配比还要注意搭配好,否则也会降低其效价。
碳源1号、丙酸、丁醇在培养基中去掉后能提高效价。
(NH4)2SO4、丙二醇在培养基中加与不加对提高效价没有明显差别。
该抗生素培养基的最优配方是鱼粉(A3)0.5%,胨1.5%、黄豆粉1.5%(B1)、KNO30.3%(C3)。
表18 抗生素L27(313)实验结果和计算
表头
A
B
A×B
C
A×C
D
E
F
G
H
实验结果
1/10000
试号
1
2
3
4
5
6
7
8
9
10
11
12
13
y
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0.2875
2
1
1
1
1
2
2
2
2
2
2
2
2
2
0.2525
3
1
1
1
1
3
3
3
3
3
3
3
3
3
0.0212
4
1
2
2
2
1
1
1
2
2
2
3
3
3
0.1740
5
1
2
2
2
2
2
2
3
3
3
1
1
1
0.0296
6
1
2
2
2
3
3
3
1
1
1
2
2
2
0.0196
7
1
3
3
3
1
1
1
3
3
3
2
2
2
0.0323
8
1
3
3
3
2
2
2
1
1
1
3
3
3
0.2775
9
1
3
3
3
3
3
3
2
2
2
1
1
1
0.3275
10
2
2
2
3
1
2
3
1
2
3
1
2
3
0.0348
11
2
2
2
3
2
3
1
2
3
1
2
3
1
0.0625
12
2
2
2
3
3
1
2
3
1
2
3
1
2
0.4075
13
2
3
3
1
1
2
3
2
3
1
3
1
2
0.1400
14
2
3
3
1
2
3
1
3
1
2
1
2
3
0.2033
15
2
3
3
1
3
1
2
1
2
3
2
3
1
0.0148
16
2
1
1
2
1
2
3
3
1
2
2
3
1
0.1262
17
2
1
1
2
2
3
1
1
2
3
3
1
2
0.0481
18
2
1
1
2
3
1
2
2
3
1
1
2
3
0.3150
19
3
3
3
2
1
3
2
1
3
2
1
3
2
0.1825
20
3
3
3
2
2
1
3
2
1
3
2
1
3
0.2405
21
3
3
3
2
3
2
1
3
2
1
3
2
1
0.3875
22
3
1
1
3
1
3
2
2
1
3
3
2
1
0.0411
23
3
1
1
3
2
1
3
3
2
1
1
1
2
0.2033
24
3
1
1
3
3
2
1
1
3
2
2
3
3
0.3040
25
3
2
2
1
1
3
2
3
2
1
2
1
3
0.2238
26
3
2
2
1
2
1
3
1
3
2
3
2
1
0.2500
27
3
2
2
1
3
2
1
2
1
3
1
3
2
0.3600
K1
1.2675
2.0208
1.8112
1.7486
1.3612
1.9216
2.1118
1.4679
2.0053
2.0969
1.9532
2.0392
1.5834
T=5.2959
K2
1.6280
1.3133
1.6451
1.6811
1.8172
2.0262
1.7114
2.2214
1.6280
2.2970
1.7085
1.5157
1.7327
K3
2.4004
1.9618
1.8396
1.8662
2.1175
1.3481
1.4727
1.6066
1.6626
0.9020
1.6342
1.7410
1.9798
R×8
1.1329
0.7075
0.1945
0.1851
0.7563
0.6781
0.6781
0.7535
0.3773
1.3950
0.3190
0.5235
0.3964
0.1898
0.6576