基础兽医学研究方法 操老师——试验设计与统计分析(基础兽医学部研究生学位课) 16学时 第一节 生物统计与试验设计基础 生物统计学的原理能指导我们在从事科学研究中,从被动走向主动,从盲目走向理智,用最小的工作量完成科学研究,并使研究结果正确可靠。 一、试验结果的表达方法及有效数字的确定 0.034m≠3.40cm 在表达科学数据结果时,既要把握数据的准确度,又要把握其精确度(准确度表示按近事物真值的程度,精确度,观测值彼此接近的程度)在科学实验中,总是在保证准确度的条件下,来提高精确度。有时不注意事物的准确性,而过于考虑其精确性是无意义的,甚至是不客观的,要出笑话的。 平均数有效数安的确定: 原则:平均数的有效位数的确定(有效位数取决于样本的变差)。原则根据1/3标准差的第一位而定。 如:3615.2±920.8g 1/3S=920.8/3=306.9g。第一位是0.3kg平均: 因此:3615.2±920.8g→3.6±0.9kg 例:3615.2+210.3g 1/3S=0.0701kg →3.62±0.21kg 二、随机变量的数字特征 1、数学期望 为了描述某一组事物的大致情况,实践中经常使用平均值这个概念。 数学期望的定义:随机变量ξ能取各个值,以取这些值的概率为加权数的加权平均来计量随机变量ξ平均取值,则称这种平均值为随机变量ξ的数学期望,用E(ξ)表示。 例:设ξ为离散型随机变量,它们的分布密度用表格表示为: ξ a1 a2 … ai …  概率 P1 P2 … Pi …  则规定的数学期望E(ξ)为:E(ξ)= 对于ξ的函数f(ξ)的数学期望的定义: 如果:绝对收敛,则 EF(ξ)=其中Pi=P{ξ=ai} (I=1.2,…) 设ξ为连续型随机变量,它的分布密度为f(x),规定ξ的数学期望Eξ为:  2、方差与标准差: 随机变量的特征除了数学期望外,还有方差与标准差。方差和标准差是反应随机变量各变数变异与离数程度大小的一个指标。 方差和标准差就是用来反映随机变量ξ的离散程度大小的一个特征值。 在数理统计中,通常用(ξ-Eξ)2来计量ξ与Eξ的偏差,这里取平方的目的是避免正负偏差相互抵消情况(离均差和为零) 如1. 2. 3. 5. 4. 其均值为=3;则∑(Xi-)=(1-3)+(2-3)+(3-3)+ ∑(ξ-Eξ) (4-3)+(5-3)=0 在概率论中通常用(ξ-Eξ)2的数学期望定义为方差,用σ2(ξ)表示,即规定 σ2(ξ)=E(ξ-Eξ)2 根据数学期望的性质,由于E(ξ)是一个常数,因此 σ2(ξ)=E(ξ-Eξ)2=E[ξ2-2(Eξ)ξ+(Eξ)2] =Eξ2-2(Eξ)(Eξ)+(Eξ)2 =Eξ2-(Eξ)2 根据连续型随机变量的数学期望公式  证明:任何随机变量经标准化转换后,数学期为0,方差与标准差恒为1。 三、实验研究中,可疑数据的取舍方法 在科学实验中,有时发现试验结果中某些数值特高或特低,异常高或异常低,我们称之为可疑值。可疑值的取舍,除了根据专业知识决定取舍外,还可依据统计学原理(标准差特性)进行取舍,其方法如下: 服从正态分布的随机变量,根据正态分布函数(概率密度函数)可知 P(-1σ≤X≤+1σ)=68.27% P(-2σ≤X≤+2σ)=95.45% P(-3σ≤X≤+3σ)=99.73% P(-4σ≤X≤+4σ)=99.993% 第一步:首先计算出变数(不包括可疑值在内)在±S 第二步:取舍原则 1、可疑值X1在±3S范围之内,X1来自抽样误差,尽管异常不应舍去; 2、可疑值X1在±3S范围之外,X1出现的机率小于千分之三(100%-99.73%),可结合专业知识决定取舍; 3、可疑值X1在X1±4S范围之外,X1出现的机率小于十万分之七,(100%-99.993%),应舍去。 例:某一试验结果的±S为2.5±0.4,现有一数据为4.2,在2.5±4×0.4范围(0.9~4.1)之外,出现的机率小于十万分之七,应舍出。 第二节 医学统计学显著性检验 一、显著性检验的分类 显著性检验可分为参数检验与非参数检验两大类最常用的参数检验包括三大检验 1、 t检验(The t-test):检验的资料类型包括计量资料与计数资料(百分数差异检验) a. 总体均数与样本均数 b. 非配对t检验 c. 配对t检验 d. 总体百分数与样本百分数检验 e. 两样本百分数检验 共同特点是检验两组均数的差异性,两两比较 检验结果的描述P>0.05 P≤0.05 P≤0.01 P>0.01 P≤0.05(即0.01<P<0.05) 过去统计结论用“差异显著,非常显著或不显著”的说法,含意不够确认,更不能使用诸如“两组均数相差差别很大,非常大或不大”。 现在正规标准表达统计学结论应该如下:差别(异)有显著意义(P<0.05)表面效应由随机误差引起的概率小于5%;差别(异)有显著意义(P<0.01)表面效应由随机误差引起的概率小于1%;差别(异)无显著意义(P>0.05)表面效应由随机误差引起的概率大于5%; 2、卡方检验(The chi-squared test) a. 检验资料类型为计数资料; b. 分独立性检验和适合性检验; c. 可进行两两比较,也可进行多重比较(卡方分割) 3、方差分析(The variance analysis) a. 检验资料类型多为计量资料; b. 分为单因素双因素与多因素方差分析; c. 平均数多重比较分析(多重比较要求用邓肯(Duncan氏)氏新复极差检验)。 二、显著性检验之间的关系 1、t检验与方差分析:方差分析是t检验的扩大,t检验是方差分析的特殊形式, t检验是进行两两比较,方差分析是进行多组均值分析比较。 a. 解决均数K为2个差异显著性检验- t检验;解决均数大于2个以上的差异性检验即K>2,只能用方差分析;在K>2时,即有K个时就有个差异性, 如K=2 有一个差异性, 如K=3 有三个差异性  X2-X3 , 如K=7 则有×7×(7-1)=21个差异性 b. t检验只能由2(n-1)自由度估计(假设n1=n2=n),而不能以K(n-1)个自由度估计:要用t检验方法来代替方差分析多重比较,误差估计的精确度降低。 比较可以用t检验完成,但? c. t检验两两检验的方法会随均数个数K的增大而加大增加犯Ⅰ型错误的概率,(以a=0.05水平作显著性检验) 如在用t检验检验两组均数的差异性时,获得正确结论的概率是(1-a)=0.95, 1代表一个差异 但对5个差异的比较用t检验,则获得正确结论的概率只是(1-a)=0.955=0.77 即5个比较中至少作出一个错误结论的概率为1-0.77=0.23 2、t检验与X2检验 t检验的资料类型为计量资料,其理论分布属于正态分布类型。 但在样本百分数检验时,资料为次数资料。n充分大时,其二次分布逐渐逼迫正态分布,即在n充分大时,计数百分资料可以用t检验中的两样本百分数差异显著性检验进行统计分析,也即计数资料卡方检验,在样本数充分大时(120左右)可用t检验代替;但样本含量较小的计数资料不得使用t检验,只能使用X2检验。 由于样本数较大(计数资料)因此可使用t检验: 三、有关百分率效应差异比较分析试验设计(样本含量确定) 某次药效试验研究,甲药组10人,治愈6人,乙药组10人,治愈3人,试比较两药的疗效。 a. 统计分析方法的选定, 由于样本数较小,不能选用两个百分数差异显著性检验中的t检验,只能选用计数资料X2检验中的独立性检验,X22×2表检验法。 b. 统计分析 药物 治愈 未愈   甲 6 4 10  乙 3 7 10   9 11 N=20    c. 统计结果分析:检验结果表明,虽然甲药痊愈率为60%,乙药 30%,但统计结果表明:两药疗效一致。试验设计与统计检验出了什么问题:①统计分析无误;②试验设计有误(样本数太少,不能说明问题);③解决问题办法,扩大试验样本数。 第三节 回归分析方法 利用最小二乘法原理,我们很容易找到直线方程y=bx+a系数b,a的表达式:  一、加权回归分析法(Analysis of Weighted Regression) 一般回归分析是指自变量和因变量都没有重复的回归分析,自变量和因变量是一一对应的。权重等于1的回归,如果各组因变量有不同的方差,即间差异有显著意义,这时每组因变量平均有权重Wi=n1/Si2,即权重与重复次数成正比,与样本方差Si2成反比,加权直线回归分析同样可利用最小二乘法(Methad of least squares)使  分别对b和a求一阶导数,然后令导数函数为零,解出方程解b和a的表达式:  二、医学上常用曲线的拟合方法 1、量反应的直接变换——倒数变换法(Reciprocal transformation) 我们知道单位体积的酶催化反应速度V与底物浓度[S]的关系为  即著名的米氏方程(双M方程:Michaelis-Menten方程) 米氏方程的重要性: 1、酶促反应动力学过程; 2、药物受体作用动力学过程; 3、非线性药物动力学过程; a.  V酶促反应速度,Vmax理论最大反应速度;[S]底物浓度,Km米氏常数。 b.  a=Emax受体最大内在活性;E效应;[A]药物浓度,KA受体配体结合解离常数。 c. 药物在体内的变化速率,Vm 最大理论速度;X 某部位的药量;Km达到最大消除速度一半时的药物浓度。 Km:单位体积中酶促反应速度达到最大反应速度一半时的底物浓度。 证明:  但可进行直线化。 Lineweaver Burk直线化  则方程变成y=bx+a直线方程 回归分析时,以表示纵轴,表示横轴,于是直线在纵轴上的截距为,斜率为,这样根据V和[S]可求出Michaelis常数Km和最大反应速度。 2、logistic生长曲线 logistic生长曲线原系比利时数学家P.F.Verhult于1838年推导出来的,但长期被淹没,直到上世纪20年代才被P.Pearl和L.J.Reed重新发现,目前已广泛应用于动植物的饲养,栽培、资源、生态、环境等方面的模拟研究。其特点是开始增长缓慢,而在以后的某一范围内迅速增长,达到某限度后,增长又缓慢下来,曲线略呈拉长的“S”。因此,也叫S型曲线。Logistic生长曲线方程为   因此,可将每一y观测值转换为y’,用y’与x进行直线回归分析即可求出a’和b’,b=-b’ a=ea’ 在转换时,必须先确定K值,K值的确定方法有两种; (1)如果y是累积频率,y无限增大的终极量为100%,显然k=100; (2)当y是生长量或繁殖量时,可取3对等间距观测值(x1, y1),(x2, y2)和(x3, y3),并将其代入式  3、半数效量及其求解方法 半数效量包括LD50 、ED50等 半数致死量(Median lethal dose)即给群体动物用药后,使半数动物死亡的剂量,是反映毒物(药物)的急性毒性的指标。半数效量(质反应的敏感性)的敏感性作为生物质反应率的一个常用指标。 一般的生物反应曲线为S型曲线,位于“S”曲线中间段Y对X的变化较快——较敏感。所以取质的半数反应量。 在取对数剂量条件下,对反应率进行变换(机率变换Probit变换)使S曲线变为一直线进行回归后即可找出50%反应率的剂量值——曲线配合法。 另外一大类方法是插值法:最常见的插值法有:a. 最大或然性法(Bliss法) b. 克贝尔法(Karber法,寇氏法) 为了启发研究者的思维,让我们看看前人是怎样着手研究,寻找出LD50的改良寇氏法(常用方法)的计算公式,从而更深刻地理解利用寇氏法计算LD50的试验条件与试验设计要求。 当横坐标为对数剂量,其差值均为i,纵坐标为死亡百分率,组内动物数相等时,S型曲线呈对称形。 在图1中可见Xk剂量BF线的左下侧小三角形面积△EDF相当于用Xk剂量时动物总效应能致死的动物数,该线右上侧三角形△BCD相当于在该剂量条件下,应能耐受动物数,如这两部分面积相等,则Xk应为X50(logLD50). X50值可用OF长度表示,由于长度为1(百分百死亡率),因此X50也可用即□OABF的面积来表达。该面积等于□OACG减去□FBCG的面积,当△EDF=△BCD时则有: X50=□OACG-□FBCG=□OACG-△ECG (1)□OACG= (2)△ECG面积是各直方条面积之和减去各小三角形面积之和。 直方图条之底均为i(对数剂量剂间比),高为各死亡百分率P1、P2…Pm,直方图条面积总和为,各小三角形之底为i,可移到图右边规堆积起来,可以看出,各小三角形面积总和实际为的一半,也即。 即 △ECG=  因此X50=□OACG-△ECG=Xm- = Xm- X50为半数致死量的对数剂量,所以 LD50=log-1[Xm-] 通过对寇氏法计算LD50的公式推算,在进行LD50试验设计时应注意的事项: 1、应按等比级数确定各组剂量,对数剂量的剂间差恒为i; 2、LD50试验设计时注意在LD50左右两边的剂量组基本相等; 3、要求设计出0%的死亡剂量组和100%的死亡剂量组; 4、小剂量一端有重复的0%死亡率或大剂量一端有重复的100%死亡率应弃去重复死亡率的极端剂量,例如X1、X2对应的死亡率为P1=P2=0,则应弃去剂量X1;同理如果Xk-1,Xk对应的死亡率Pk-1=Pk=100%, 则应充去Xk剂量。 5、当小剂量一端P1≠0而是大于0或大剂量一端PK≠1而是<1,若试验者有把握认为向下增加一个小一级的剂量X0会有P0=0,或增大一个大剂量Xk+1会有Pk+1=1,则原试验结果仍符合寇氏法计算公式的要求(本身要求P1=0,Pm=1) 证明:增加小剂量X0有P0=0  同样证明增加一个剂量XK+1有PK+1=1,也不影响公式  证 增加一个大剂量XK+1有PK+1=1  6、当小剂量一端P>0或大剂量一端PK<1,当试验者认为即使再增加一级小剂量也不会使P0=0或增大一级剂量也不会使PK+1=1时,则必须补充剂量X0或XK+1,重新完成其补充试验。 两个LD50的显著性检验(t-检验)  t0.01=2.58 t0.05=1.96 D(mg/kg) x n r p p2  0.29 0.54 10 0 0 0  0.34 0.47 10 2 0.2 0.04  0.40 0.40 10 4 0.4 0.16  0.47 0.33 10 8 0.8 .064  0.55 0.26 10 8 0.8 0.64  0.64 0.19 10 10 1.0 1.00      ∑3.2 ∑2.48  95%可信限  第四节 试验设计 一.Fisher提出的现代科学试验设计三大基本原则“随机、对照、重复”。在此基础了又提出了试验设计“四性”(4Rs原则) 1、受试对象的代表性 Representativeness(样本质量); 2、试验的可重复性 Replications 试验结果经得起重复检查; 3、试验的随机性Randomizations随机抽样,随机分组,随机处理; 4、试验设计的合理性Rationality 符合专业要求,又符合统计学原则,切合实际,方便易行。(上月亮,建一个很长很长的梯子,理论上似乎是可以,但不易实际操作。) “芝麻定律”说明试验设计的重要性。 常见实验设计的类型: 完全随机设计(Completely randomized design) 配对试验设计(Paired design) 随机区组设计(Randomized block design) 交叉试验设计(Cross-over design) 拉丁方试验设计(Latin square design) 正交试验设计(Orthogonal design) 二.交互作用又称为互作效应(Interaction) 主效应(Main effect)。生物反就是复杂的,相互作用也是存在的。有处理必有效应,即试验因素对试验指标的影响称为试验效应。如:温度增加(在一定范围内)动物的饮水量也增加,饲料中蛋白质含量增加,产蛋率增加。 效应又分为三种:简单效应,主效应(平均效应),互作效应(Simple effect)(Main effect)(Interaction)其中前两种效应在一个试验中一般都能反应出来。 在这里举一个两因素两水平的试验为例加以说明,多因素多水平试验方法见有交互作用的正交表试验设计。 指标是某种子的发芽率 饲养试验 药物相互作用药效试验等 简单效应:某因素同一水平条件下,另一因素不同水平效应的差值。 B1水平的简单效应 A2-A1=50-40=10 B2水平的简单效应 A2-A1=70-60=10 A1水平的简单效应 B2-B1=60-40=20 A2水平的简单效应 B2-B1=70-50=20 主效应(平均效应)各因素简单效应的平均值 A因素主效应=(10+10)/2=10 B因素主效应=(20+20)/2=20 互作效应(交互作用),某一因素各水平下另一因素简单效应之差的均值。 本例 A因素 A1水平条件下,B因素的简单效应=B2-B1=60-40=20 A2水平条件下,B因素的简单效应=B2-B1=70-50=20 两简单效应差的均值 即:所谓互作效应是两因素互共同作用对试验指标产生的协同或拮抗哪一部分效应。本试验的交互作用为零,无互作,以图形表示。 判断标准: ①两条直线不相交,也不平行,正互作 ②两条直线互为交叉,负互作 ③两条直线互为平行,零互作 互作效应的实践意义: 例如A、B两因素,A因素可使试验指标提高a% B因素可使试验指标提高b% 则无作用互作效应,A、B两因素可使试验指标提高(a+b)% 正互作效应时,A、B两因素同时处理可使试验指标 提高(a+b+△)% >(a+b)% 负互作效应时,A、B两因素同时处理可使试验指标 提高(a+b-△)% <(a+b)% 三. 拉丁方试验设计 1.拉丁方的组成,因为它是由拉丁字母组成的正方形—拉丁方,其条件是,拉丁方内同一行或同一列内部设有重复的字母。 例:4×4拉丁方 ABCD ABCD BADC BCDA CDBA CDAB DCAB DABC 2.要明确的是交叉设计属拉丁方设计的一个特例,最简单的拉丁方设计(Cross-over design) 交叉设计拉丁方 A B 2×2拉丁方 B A 交叉设计用于比较在同一动物或器官上的重复观察。 交叉设计的最大优点:处理是在同体上比较,从而避免了个体差异,分析动物间和顺序间的差异,必须用几个重复的2×2拉丁方来分析。 3.拉丁方设计试验的前提是根据在生物个体受到刺激可复原这一特征的基础上进行的, 如:测定药物的生物利用度  动物1先后,动物2,先,后。 现在就是这个先后间隔的时间,动物在第一次注射后,可测出AUC,经过一定时间后,药物代谢排泄—血液体内中的药浓下降至零,然后才能进行第二次用药。 又例:要比较不同剂量的胰岛素对血糖降低的影响,由于给动物机体注射一定量的胰岛素后,可使血糖暂时降低,经过一定时间后,动物体内的血糖又恢复正常—又可作为一个样本进行第二次处理。 但是有些情况下生物受刺激后则被看成(认为是)不可复原。 例如要比较某种疫苗对体内抗体的增加作用 动物接受疫苗→动物→带有抗体的动物,且机体内的免疫机能激活状态不一样 ↓ 无论经过多长时间,被看成是不是原来正常那种动物,因此不能用拉丁方设计试验。 4.拉丁方设计的优点 减少了个体差异所带来的误差 节约了动物数量 便于统计分析,得到信息丰富的统计结果 5.举例:试比较0.5、1.0、2.0、4.0 I.U/Kg B.W四种剂量的胰岛素对家兔血糖影响(例用拉丁方设计) 第一、选拉丁方表 4×4拉丁方表 第二,确定动物兔接受胰岛素后,恢复到正常状态所需的时间(>9天) 第三,确定拉丁方设计表(方案) 四种剂量胰岛素对象兔血糖影响的拉丁方设计表 注射日期 家 兔 编 号   1 2 3 4  3.1 A1 B1 C1 D1  3.10 B2 A2 D2 C2  3.20 C3 D3 B3 A3  3.30 D4 C4 A4 B4  其中A、B、C、D分别代表胰岛素的剂量0.5、1.0、2.0、4.0μ/kg,设计试验实施: 3.1号 1号兔0.5μ/kg,2号兔1.0μ/kg,3号兔2.0μ/kg,4号兔4.0μ/kg 3.10号 1号兔1.0μ/kg,2号兔0.5μ/kg,3号兔4.0μ/kg,4号兔2.0μ/kg 依次将试验进行完毕,得到数据 a11 a12 a13 a14 a21 a22 a23 a24 a31 a32 a33 a34 a41 a42 a43 a44 第四:拉丁方试验结果统计分析 本例可采用三因素多水平的统计分析——方差分析 1.SS直平方和(兔间平方和) df=4-1=3 MSR=SS/df 2.SS横平方和(时间平方和) df=4-1=3 MSt=SS/df 3.处理平方和(剂量间平方和) df=4-1=3 MSd=SS/df 处理平方和计算,必须将结果表重新排列:(μ/kg) 剂 量 A0.5 B1.0 C2.0 D4.0 平均值 a11+a22+a34+a43/4 a12+a21+a33+a44/4 a13+a24+a31+a42/4 a14+a23+a32+a41/4 4.误差平方和 SSe=SS总-SS横-SS直-SS处 dfe=df总-df横-df直-df外 =15-3-3-3=6 然后分别计算出各自的均方,进行F检验,如F检验无差异P>0.05,即可下统计学结论差异无显著性,如F检验有差异,必须进行多种比较,再下结论。 F=MS(横、直、外)/Mse df1=3 df2=6 四. 正交试验设计(Orthogonal design) 科学研究中总是寻求较少的工作量获得较多的正确可靠的试验结果,其涉及到试验条件的筛选与优化问题。 为了考察较多的因素而不扩大试验规模,可使用正交试验设计,它是利用一套规格化的表格——正交表来安排试验,适用于多因素、多水平、试验误差较大,周期长等一类型的试验,是效率较高的一种试验方法,在确定最佳反应试验条件,饲养效率最优化的饲料组方,联合用药复合制剂的最佳配方等多因素多水平的优化实验中都需要采用这一试验设计。 现以实例说明正交试验设计的用途与试验设计方法与统计分析。 某化工厂改革“潘生丁”环合反应旧工艺,其主要目的是想利用尿素与双乙烯酮来代替旧工艺中的硫脲及乙酰醋酸乙酯,其指标是6-甲基脲嘧啶的收率。 分析,本试验目的主要考察三个主要反应条件: 反应温度(A),反应时间(B)投料先分子比(C)尿素:双乙烯酮。现要找出这三个因素的最佳反应条件,使收率最高。 每个因素试验三个水平: A反应温度 A1=100℃ A2=110℃ A3=120℃  B反应时间 B1=6h B2=8h B3=10h  C投料比 C1=1:1.2 C2=1:1.6 C3=1:2.0  这是一个因素三水平的试验,现在通过正文试验的目的是找出这三个因素中,如何搭配其水平,才能获得最高的6-甲基脲嘧啶的收率? 第一种作法:——全面试验法,即对三个因素的所有水平的搭配进行全面试验,此时共有33=27次,具体是 通过全面试验一定会找到因素水平间的最好搭配条件,但是全面试验次数太多,很不经济,而且有些情况下全面试验是不可能办到的,例如一个六因素与水平的全面试验需要作56=15625次。 第二种方法——简单比较法,3因素了水平试验只要作9次试验,具有作法是,先固定两个因素,分别考察另一因素,假如先固定BB1水平,C于C1水平,考察A因素的效应,需作3次 假如试验结果发现B1C1A3收率较高,然后固定A于A3水平,C于C1水平,考察B因素效应,需作3次: 假如试验结果是A3B2C1收率最高,再再固定A于A3,B于B2水平,考察C因素效应,需做3次: 若A3B2C3收率最高,于是可以下结论:较好的搭配条件是:A3B2C3(120℃,8h, 1:2.0) 简单比较法实验次数少,在实际中一般也能取得一定的效果,但这一方法有较多的假定,即开始假定两因素于某一水平带有主观性,往往只能试验到一个侧面,代表性较差,提供的信息有限,进一步统计分析困难。 第三种方法——正交试验法: 前人通过“拓扑学”研究出了正交试验设计表,该表的特点是“无衡分散,整齐可比,代表性强”用正交表(Orthogonal layout)安排多因素并分析试验结果的方法,简称正交试验法,正交表各统计学书中都有附录记载,下面绍二种常用的正交表,说明正交表的正变性。 Ⅰ L8(27) Ⅱ L9(34) Lg(27):L正交表代号;8正交表的横行数;2正交表中字码数;7正交表的直列数。 试验号 1 2 3 4 5 6 7  1 1 1 1 2 2 1 2  2 2 1 2 2 1 1 1  3 1 2 2 2 2 2 1  4 2 2 1 2 1 2 2  5 1 1 2 1 1 2 2  6 2 1 1 1 2 2 1  7 1 2 1 1 1 1 1  8 2 2 2 1 2 1 2  正交表L8(27)有8横行,7直列,由字码“1”和“2”组成,它有两个特性: 1)每直列恰好有4个“1”和4个“2” 2)任意两列进行组排,其横方向形成8对数,恰好(1.1)(1,2),(2、1)、(2,2)各出现两次。说明正交表均匀分散,代表性强,整齐可比的特点,Lg(27)表的上述两特点称之为表的正交性(Orthogonality) L9(34) 试验号 1 2 3 4  1 1 1 1 1  2 1 2 2 2  3 1 3 3 3  4 2 1 2 3  5 2 2 3 1  6 2 3 1 2  7 3 1 3 2  8 3 2 1 3  9 3 3 2 1  正交表L9(34)有9个横行,4个直列,由字码“1,2,3”组成它也具有与L8(27)表类似的两个特性。 1)每直列中出现“1”“2”“3”的次数相同都是3次。 2)任意两直列其横方向组排,形成9个数对(1.1)(1.2) (1.3) (2.1) (2.2) (2.3) (3.1) (3.2) (3.3),出现的数次数都是一次。 选择正交表的基本原则: 正交表较多,而所试验的因素和水平也不一样,这里有一个正交表的选择问题:基本原则:最为接近原则 例:L8(27) 最多能安排7个因素,2个水平的试验,试验次数8次; L9(34) 最多能安排4个因素,3水平的试验,试验次数9次; L4(23) 最多安排3因素2水平的试验,试验次数4次; L16(45) 最多安排5因素4水平的试验,试验次数16次; 现有三因素3水平试验,L9(34)表和L16(45)表都能够满足其设计,但根据最为接近原则应选择L9(34)正交表。 正交试验设计的实验安排与统计分析 水平 因素   反应温度A 反应时间B 投料比C  1 A1100℃ B1 6h C1 1:1.2  2 A2110℃ B2 8h C2 1:1.6  3 A3120℃ B3 10h C3 1:2.0   根据最为接近原则,应该选用L9(34)正交表。 正交表的使用方法: “因素顺序上列,水平对号入座,横着做” “潘生丁”合成试验L9(34)正交表试验设计表 试验号 1反应温度A 2反应时间B 3投料比C 4 收率  1 1(A1100℃) 1(B16h) 1(C1 1:1.2) 1 40.9  2 1(A1100℃) 2(B28h) 2(C2 1:1.6) 2 58.2  3 1(A1100℃) 3(B310h) 3(C3 1:2.0) 3 71.6  4 2(A2110℃) 1(B16h) 2(C2 1:1.6) 3 40.0  5 2(A2110℃) 2(B28h) 3(C3 1:2.0) 1 73.7  6 2(A2110℃) 3(B310h) 1(C1 1:1.2) 2 39.0  7 3(A3120℃) 1(B16h) 3(C3 1:2.0) 2 62.1  8 3(A3120℃) 2(B28h) 1(C1 1:1.2) 3 43.2  9 3(A3120℃) 3(B310h) 2(C2 1:1.6) 1 57.0  步骤: 1)因素顺序上列; 2)水平对号入座,表内某列字码表示该列因素的水平数,如第一列由反应温度A占用,第一字码“1”表示A1水平,如此类推; 3)按横方向组成的条件进行试验,一共进行九次试验; 正交试验设计数据统计分析方法:1、方差分析法 2、直观分析统计判别法 直观分析统计判别法: 一、基本数据整理: 二、由极差大小决定主次因素,极差R(Range) 极差R大的因素意味着水平发生变化,对收率造成的差别较大,较敏感,通常是关键因素,控制其水平标准很重要。 在本例三个因素中极差比较顺序为Rc>Rb>RA 对收率来讲,因素C(投料比)是最重要的因素,反应时间是次重要因素,反应温度是第三重要因素。 三、某列因素的Ki的大小用衡量是该因素的各水平的优劣,本例试验指标为收率,收率高者为好,所以Ki大相应的水平为优 第一列 温度K1>K3>K12 (170.7>162.3>152.7) 选K1-A1100℃  第二列 时间K2>K3>K1 选K2-B2 8h  第三列 投料比K3>K2>K1 选K3-C3 1:2.0  因此确定的反应条件是 A因素取A1水平(A1) B因素取B2水平(B2) C因素取C3水平(C3) 即生产实践中,采用反映温度100℃,反应时间8h,投料克分子比1:2.0这一最佳条件组合进行生产。 四、因素指标关系图:以因素的平均收率()为纵轴,以因素的水平为横轴,所制出的因素与指标的关系分析图: 启示:继续增大尿素与双乙烯酮的克分子比,收率是否可能还会增加呢?只要有可能就应该再考虑C因素的另外几个水平,进行补充试验,对生产工艺进行改进。