第十二章 试验设计
试验设计(experimental design)是数理统计学的一个分支,是进行科学研究的重要工具。由于它与生产实践和科学研究紧密结合,在理论和方法上不断地丰富和发展,因而广泛地应用于各个领域。
第一节 试验设计概述

一、试验设计的基本概念
试验设计,广义理解是指试验研究课题设计,也就是整个试验计划的拟定。主要包括课题的名称、试验目的,研究依据、内容及预期达到的效果,试验方案,试验单位的选取、重复数的确定、试验单位的分组,试验的记录项目和要求,试验结果的分析方法,经济效益或社会效益估计,已具备的条件,需要购置的仪器设备,参加研究人员的分工,试验时间、地点、进度安排和经费预算,成果鉴定,学术论文撰写等内容。而狭义的理解是指试验单位(如动物试验的畜、禽)的选取、重复数目的确定及试验单位的分组。生物统计中的试验设计主要指狭义的试验设计。
试验设计的目的是避免系统误差,控制、降低试验误差,无偏估计处理效应,从而对样本所在总体作出可靠、正确的推断。
试验设计的任务是在研究工作进行之前,根据研究项目的需要,应用数理统计原理,作出周密安排,力求用较少的人力、物力和时间,最大限度地获得丰富而可靠的资料,通过分析得出正确的结论,明确回答研究项目所提出的问题。如果设计不合理,不仅达不到试验的目的,甚至导致整个试验的失败。因此,能否合理地进行试验设计,关系到科研工作的成败。
二、动物试验的任务
在畜牧、水产等试验研究中,通常以动物作为试验对象,因而将所进行的试验统称为动物试验。它的主要任务在于研究、揭示和掌握动物生长发育规律、及这些规律与饲养管理、环境条件等的关系。通过试验,鉴定新的动物品种(系),探索新的饲料配方,饲养管理方法和技术措施,找出其中的规律,并将这些规律应用到生产实践中去,以解决畜牧业、水产业等生产中存在的问题,进一步提高产品的质量和数量,取得更大的经济效益和社会效益,从而推动畜牧业、水产业等事业的发展。
三、动物试验的特点与要求
在动物试验研究中,除小部分可在严格控制的试验条件下进行外,大部分试验都与外界环境接触或要在外界环境中进行,试验的对象是生长在不同时期、各种环境中的动物。因此,动物试验结果除有试验处理的作用外,还要受到许多其它因素的干扰和制约,这些因素对试验结果可以产生较大的影响。所以,我们要在充分认识这些干扰因素的情况下,对其进行合理、有效的控制,以保证试验结果的正确性。
(一)动物试验的特点
1、试验干扰因素多 首先是动物本身存在差异,这种差异是试验中误差的重要来源。例如,在同一饲养试验中,为使供试动物均匀一致,要选择到遗传来源一致、同年龄、同体重、同性别的动物进行试验是比较困难的;其次,自然环境如温度、湿度、光照、通风等存在差异,不能完全控制一致;第三,饲养管理条件存在差异,如在试验过程中的管理方法、饲养技术、畜舍笼位的安排等不一致;第四,试验人员操作技术上的差异,如对试验动物的性状、指标进行测量时,时间、人员和仪器等不完全一致。
2、试验具有复杂性 在畜牧、水产等动物试验中所研究的各种试验对象,它们都有自己的生长发育规律和遗传特性,并与环境、饲养管理等条件密切相关,而且这些因素之间又相互影响,相互制约,共同作用于供试对象。所以在试验中,人们不可能做到对环境条件等一一加以控制,当然也就不易精确地分析出各个因素的单独作用。因此,在多变的各种条件下,不能只依据少数的或短期的试验,而必须经过不同条件下的一系列试验,才能获得比较正确的结果。
3、试验周期长 动物完成一个生活世代的时间较长,特别是大动物、单胎动物、具有明显季节性繁殖的动物更为突出。因此,有的一年内不能进行多次试验,例如动物遗传育种试验,有的需用几年的时间才能完成整个试验。应尽量克服周期长、试验年度间差异的影响,以获得正确的结论。
(二)动物试验的基本要求 由于动物试验具有上述特点,为了保证试验的质量,在试验中应尽可能地控制和排除非试验因素的干扰,合理地进行试验设计、准确地进行试验,从而提高试验的可靠程度,使试验结果在生产实际中真正发挥作用。为此,对动物试验有以下几点要求:
1、试验要有代表性 动物试验的代表性包括生物学和环境条件两个方面的代表性。生物学的代表性,是指作为主要研究对象的动物品种、个体的代表性,并要有足够的数量。例如,进行品种的比较试验时,所选择的个体必须能够代表该品种,不要选择性状特殊的个体,并根据个体均匀程度,在保证试验结果具有一定可靠性的条件下,确定适当的动物数量。环境条件的代表性是指代表将来计划推广此项试验结果的地区的自然条件和生产条件,如气候、饲料、饲养管理水平及设备等。代表性决定了试验结果的可利用性,如果一个试验没有充分的代表性,再好的试验结果也不能推广和应用,就失去了实用价值。
2、试验要有正确性 试验的正确性包括试验的准确性和试验的精确性。在进行试验的过程中,应严格执行各项试验要求,将非试验因素的干扰控制在最低水平,以避免系统误差,降低试验误差,提高试验的正确性。
3、试验要有重演性 重演性是指在相同条件下,重复进行同一试验,能够获得与原试验相类似的结果,即试验结果必须经受得起再试验的检验。试验的目的在于能在生产实践中推广试验结果,如果一个在试验中表现好的结果在实际生产中却表现不出来,那么,试验就失去了意义。由于试验受供试动物个体之间差异和复杂的环境条件等因素影响,不同地区或不同时间进行的相同试验,结果往往不同;即使在相同条件下的试验,结果也有一定出入。因此,为了保证试验结果的重演性,必须认真选择供试动物,严格把握试验过程中的各个环节,在有条件的情况下,进行多年或多点试验,这样所获得的试验结果才具有较好的重演性。
第二节 动物试验计划
一、试验计划的内容及要求
进行任何一项科学试验,在试验前必须制定一个科学的、全面的试验计划,以便使该项研究工作能够顺利开展,从而保证试验任务的完成。虽然科研项目的级别、种类等有所不同,但基本要求是一致的。试验计划的内容一般应包括以下几个方面:
(一)课题名称与试验目的 科研课题的选择是整个研究工作的第一步。课题选择正确,此项研究工作就有了很好的开端。一般来说,试验课题通常来自两个方面。一是国家或企业指定的试验课题,这些试验课题不仅确定了科研选题的方向,而且也为研究人员选题提供了依据,并以此为基础提出最终的目标和题目。二是研究人员自己选定的试验课题。研究人员自选课题时,首先应该明确为什么要进行这项科学研究,也就是说,应明确研究的目的是什么,解决什么问题,以及在科研和生产中的作用、效果如何等。例如,畜禽口服补液盐对雏鸡的影响试验,主要目的在于提高雏鸡的成活率。若用于肉鸡,则目的在于促进增重。
选题时应注意以下几点:
1、实用性 要着眼于畜牧、水产等科研和生产中急需解决的问题,同时从发展的观点出发,适当照顾到长远或不久将来可能出现的问题。
2、先进性 在了解国内外该研究领域的进展、水平等基础上,选择前人未解决或未完全解决的问题,以求在理论、观点及方法等方面有所突破。
3、创新性 研究课题要有自己的新颖之处。
4、可行性 就是完成科研课题的可能性,无论是从主观条件方面,还是客观条件方面,都要能保证研究课题的顺利进行。
(二)研究依据、内容及预期达到的经济技术指标 课题确定后,通过查阅国内外有关文献资料,阐明项目的研究意义和应用前景,国内外在该领域的研究概况、水平和发展趋势,理论依据、特色与创新之处。详细说明项目的具体研究内容和重点解决的问题,以及取得成果后的应用推广计划,预期达到的经济技术指标及预期的技术水平等。
(三)试验方案和试验设计方法 试验方案是全部试验工作的核心部分,主要包括研究的因素、水平的确定等,具体内容详述于后。方案确定后,结合试验条件选择合适的试验设计方法,具体内容详见本章第四节至第八节。
(四)供试动物的数量及要求 试验动物或试验对象选择正确与否,直接关系到试验结果的正确性。因此,试验动物应力求比较均匀一致,尽量避免不同品种、不同年龄、不同胎次、不同性别等差异对试验的影响。新引进的动物应有一个适应和习惯过程。试验动物的数量,可根据本章第十节介绍的方法来计算。
(五)试验记录的项目与要求 为了收集分析结果需要的各个方面资料,应事先以表格的形式列出需观测的指标与要求,例如,饲养试验中的定期称重,定期为1周、10天或半月称重,称重一般在清晨空腹或喂前进行等。
(六)试验结果分析与效益估算 试验结束后,对各阶段取得的资料要进行整理与分析,所以应明确采用统计分析的方法,如t检验,方差分析、回归与相关分析等。每一种试验设计都有相应的统计分析方法,统计方法应用不恰当,就不能获得正确的结论。如果试验效果显著,同时应计算经济效益。如某农场为饲养肉用仔鸡而配制的“维生素添加剂”的试验,不仅记录分析它对生长发育的效果,而且还计算出喂青料(对照组)每只鸡分担青料费用和试验组(喂维生素添加剂)每只鸡分担的费用,进而计算出饲喂维生素添加剂的肉鸡全年可节约的费用。
(七)已具备的条件和研究进度安排 已具备的条件主要包括过去的研究工作基础或预试情况,现有的主要仪器设备,研究技术人员及协作条件,从其他渠道已得到的经费情况等。研究进度安排可根据试验的不同内容按日期、分阶段进行安排,定期写出总结报告。
(八)试验所需的条件 除已具备的条件外,本试验尚需的条件,如经费、饲料、仪器设备的数量和要求等。
(九)研究人员分工 一般分为主持人、主研人、参加人。在有条件的情况下,应以学历、职称较高并有丰富专业知识和实践经验的人员担任主持人或主研人,高、中、初级专业人员相结合,老、中、青相结合,使年限较长的研究项目能够后继有人,保持试验的连续性、稳定性和完整性。
(十)试验的时间,地点和工作人员 试验的时间,地点要安排合适,工作人员要固定,并参加一定培训,以保证试验正常进行。
(十一)成果鉴定及撰写学术论文 这是整个研究工作的最后阶段,凡属国家课题应召开鉴定会议,由同行专家作出评价。个人选择课题可以撰写学术论文发表自己的研究成果,根据试验结果作出理论分析,阐明事物在内在规律,并提出自己的见解和新的学术观点。一些重要的个人研究成果,也可以申请相关部门鉴定和国家专利。
二、试验方案的拟定
(一)试验方案的基本概念 试验方案(experimental scheme)是指根据试验目的与要求而拟定的进行比较的一组试验处理的总称。试验方案是整个试验工作的核心部分,因此,须周密考虑,慎重拟定。试验方案按供试因素的多少可区分为单因素试验方案、多因素试验方案。
1、单因素试验方案 单因素试验(single-factor experiment)是指整个试验中只比较一个试验因素的不同水平的试验。单因素试验方案由该试验因素的所有水平构成。这是最基本、最简单的试验方案。例如在猪饲料中添加4种剂量的土霉素,进行饲养试验。这是一个有4个水平的的单因素试验,添加土霉素的4种剂量,即该因素的4个水平就构成了试验方案。
2、多因素试验方案 多因素试验(multiple-factor or factorial experiment)是指在同一试验中同时研究两个或两个以上试验因素的试验。多因素试验方案由该试验的所有试验因素的水平组合(即处理)构成。多因素试验方案分为完全方案和不完全方案两类。
(1)完全方案 在列出因素水平组合(即处理)时,要求每一个因素的每个水平都要碰见一次,这时,水平组合(即处理)数等于各个因素水平数的乘积。例如以3种饲料配方对3个品种肉鸭进行试验。两个因素分别为饲料配方(A)、品种(B)。饲料配方(A)分为A1、A2、A3水平,品种(B)分为B1、B2、B3水平。共有A1B1、A1B2、A1B3、A2B1、A2B2、A2B3、A3B1、A3B2、A3B3共3×3=9个水平组合(处理)。这9个水平组合(处理)就构成了这两个因素的试验方案。根据完全试验方案进行的试验称为全面试验。全面试验既能考察试验因素对试验指标的影响,也能考察因素间的交互作用,并能选出最优水平组合,从而能充分揭示事物的内部规律。多因素全面试验的效率高于多个单因素试验的效率。全面试验的主要不足是,当因素个数和水平数较多时,水平组合(处理)数太多,以至于在试验时,人力、物力、财力、场地等都难以承受,试验误差也不易控制。因而全面试验宜在因素个数和水平数都较少时应用。
(2)不完全方案 这也是一种多因素试验方案,但与上述多因素试验完全方案不同。它是将试验因素的某些水平组合在一起形成少数几个水平组合。这种试验方案的目的在于探讨试验因素中某些水平组合的综合作用,而不在于考察试验因素对试验指标的影响和交互作用。这种在全部水平组合中挑选部分水平组合获得的方案称为不完全方案。根据不完全方案进行的试验称为部分试验。动物试验的综合性试验(comprehensive experiment)、正交试验(orthogonal experiment)都属于部分试验。
综合性试验是针对起主导作用且相互关系已基本清楚的因素设置的试验,它的水平组合就是一系列经过实践初步证实的优良水平的配套。正交试验是在全部水平组合中选出有代表性的部分水平组合设置的试验,具体内容见第八节。
一个周密、完善的试验方案,不仅可以节省人力、物力,多快好省地完成试验任务,而且可以获得正确的试验结论。如果方案拟定不合理,如因素、水平选择不当,部分试验方案所包含的水平组合针对性或代表性差,试验将得不出应有的结果,甚至导致试验的失败。因此,试验方案的拟定在整个试验中占着极其重要的位置。
(二)拟定试验方案的要点 为了拟定一个正确的、切实可行的试验方案,应从以下几方面考虑:
1、根据试验的目的、任务和条件挑选试验因素 拟定方案时,在正确掌握生产中存在的问题后,对试验目的、任务进行仔细分析,抓住关键,突出重点。首先要挑选对试验指标影响较大的关键因素。若只考察一个因素,则可采用单因素试验。若是考察两个以上因素,则应采用多因素试验。如进行猪饲料添加某种微量元素的饲养试验,在拟定试验方案时,设置一个添加一定剂量微量元素的处理和不添加微量元素的对照,得到一个包含2个处理的单因素试验方案;或设置几个添加不同剂量微量元素的处理和一个不添加微量元素的对照,得到一个包含多个处理的单因素试验方案。进行微量元素不同添加剂量与不同品种猪的饲养试验,则安排一个二因素试验方案。应该注意,一个试验中研究的因素不宜过多,否则处理数太多,试验过于宠大,试验干扰因素难以控制。凡是能用简单方案的试验,就不用复杂方案。
2、根据各试验因素的性质分清水平间差异 各因素水平可根据不同课题、因素的特点及动物的反应能力来确定,以使处理的效应容易表现出来。
(1)水平的数目要适当 水平数目过多,不仅难以反映出各水平间的差异,而且加大了处理数;水平数太少又容易漏掉一些好的信息,至使结果分析不全面。
(2)水平间的差异要合理 有些因素在数量等级上只需少量的差异就反映出不同处理的效应。如饲料中微量元素的添加等。而有些则需较大的差异才能反应出不同处理效应来,如饲料用量等。
(3)试验方案中各因素水平的排列要灵活掌握 一般可采用等差法(即等间距法)、等比法和随机法3种。我们结合肉牛埋植玉米赤霉醇为例说明。
等差法是指各相邻两个水平数量之差相等,如赋形剂(不含玉米赤霉醇)各水平的排列为:10mg、20mg、30mg,其中20mg为中心水平,向上向下都相隔10mg。
等比法是指各相邻两个水平的数量比值相同,如赋形剂各水平的排列为7.5mg、15mg、30mg、60mg,相邻两水平之比为1:2。
随机法是指因素各水平随机排列,如赋形剂各水平排列为15mg、10mg、40mg、30mg各水平的数量无一定关系。
3、试验方案中必须设立作为比较标准的对照 动物试验的目的就是通过比较来鉴别处理效应大小、好坏等。为了达到这一目的,试验方案应当包括各试验处理,以及作为比较的对照。任何试验都不能缺少对照,否则就不能显示出试验的处理效果。根据研究的目的与内容,可选择不同的对照形式。例如,进行添加微量元素的饲养试验,添加微量元素为处理,不添加添加微量元素为对照,这样的对照为空白对照。进行几种微量元素添加量的比较试验,各个处理可互为对照,不必再设对照。在对某种动物作生理生化指标检验时,所得数据是否异常应与动物的正常值作比较,动物的正常值就是所谓的标准对照。在杂交试验中,要确定杂交优势的大小,必须以亲本作对照,这就是试验对照。另外,还有一种自身对照,即处理与对照在同一动物上进行,如病畜用药前与用药后生理指标的比较等。
4、试验处理(包括对照)之间应遵循唯一差异原则 这是指在进行处理间比较时,除了试验处理不同外,其它所有条件应当尽量一致或相同,使其具有可比性,才能使处理间的比较结果可靠。例如,进行不同品种猪的育肥比较试验,各参试猪除了品种不同外,其它如性别、年龄、体重等应一致,饲料和饲养管理等条件都应相同,才能准确评定品种的优劣。
5、有的试验要设置预试期 所谓预试就是正式试验开始之前根据试验设计进行的过渡试验,为正式试验做好准备工作。通过预饲,使供试的动物适应新的环境,对不合适的试验动物进行调整和淘汰,同时也使试验人员熟悉操作方法和程序。预试期的长短,可根据具体情况决定,一般以10-20天为宜。预试期间供试动物的数量应适当多于正式试验所需的数量。通过对预试所得到的数据资料的分析,还可检查试验设计的科学性、合理性和可行性,发现问题及时解决。
第三节 试验设计的基本原则
一、试验误差的来源
(一)试验误差 在畜牧、水产等科学研究中,试验处理常常受到各种非处理因素的影响,使试验处理的效应不能真实地反映出来,也就是说,试验所得到的观测值,不但有处理的真实效应,而且还包含其它因素的影响,这就出现了实测值与真值的差异,这种差异在数值上的表现称为试验误差。
由于产生误差的原因和性质不同,试验误差可分为系统误差(片面误差)、随机误差(抽样误差)两类。有关内容已在第一章第二节中详细阐述,这里不再重复。
(二)动物试验中误差的来源 系统误差影响试验的准确性,随机误差影响试验的精确性。为了提高试验的准确性与精确性,即提高试验的正确性,必须避免系统误差,降低随机误差。为了有效地避免系统误差,降低随机误差,必须了解试验误差的来源。动物试验误差的主要来源有:
1、供试动物固有的差异 是指各处理的供试动物在遗传和生长发育上或多或少的差异性。如试验动物的遗传基础、性别、年龄、体重不同,生理状况、生产性能的不一致等,即使是全同胞间或同一个体不同时期间也会存在差异。
2、饲养管理不一致所引起的差异 指在试验过程中各个处理在饲养技术、管理方法及日粮配合等在质量上的不一致,以及在观测记载时由于工作人员的认真程度,掌握的标准不同或测量时间、仪器的不同等所引起的偏差。
3、环境条件的差异 主要指那些不易控制的环境的差异,如栏舍温度、湿度、光照、通风不同所引起的差异等。
4、由一些随机因素引起的偶然差异 如偶然疾病的侵袭、饲料的不稳定等引起的差异。
二、试验设计的基本原则
在动物试验中,误差主要是由于供试动物个体之间的差异和饲养管理不一致所造成。针对误差的主要来源,应采取切实有效的措施,如尽量选择初始条件一致的试验动物,尽量做到饲养管理一致,认真细致进行观测记载等,力求避免系统误差,降低随机误差。统计学上通过合理的试验设计既能获得试验处理效应与试验误差的无偏估计,也能控制和降低随机误差,提高试验的精确性。在试验设计时必须遵循以下基本原则。
(一)重复 重复是指试验中同一处理实施在两个或两个以上的试验单位上。在动物试验中,一头动物可以构成一个试验单位,有时一组动物也可构成一个试验单位。设置重复的主要作用在于估计试验误差和降低试验误差。如果同一处理只实施在一个试验单位上,那么只能得到一个观测值,则无从看出差异,因而无法估计试验误差的大小。只有当同一处理实施在两个或两个以上的试验单位上,获得两个或两个以上的观测值时,才能估计出试验误差。在第四章已经讲到,样本标准误与标准差的关系是,即平均数抽样误差的大小与重复次数的平方根成反比,故重复次数多可以降低试验误差。但在实际应用时,重复数太多,试验动物的初始条件不易控制一致,也不一定能降低误差。重复数的多少可根据试验的要求和条件而定。如果供试动物个体间差异较大,重复数应多些,差异较小,重复数可少些。
(二)随机化 随机化是指在对试验动物进行分组时必须使用随机的方法,使供试动物进入各试验组的机会相等,以避免试验动物分组时试验人员主观倾向的影响。这是在试验中排除非试验因素干扰的重要手段,目的是为了获得无偏的误差估计量。
(三)局部控制——试验条件的局部一致性 局部控制是指在试验时采取一定的技术措施或方法来控制或降低非试验因素对试验结果的影响。在试验中,当试验环境或试验单位差异较大时,仅根据重复和随机化两原则进行设计不能将试验环境或试验单位差异所引起的变异从试验误差中分离出来,因而试验误差大,试验的精确性与检验的灵敏度低。为解决这一问题,在试验环境或试验单位差异大的情况下,根据局部控制的原则,可将整个试验环境或试验单位分成若干个小环境或小组,在小环境或小组内使非处理因素尽量一致。每个比较一致的小环境或小组,称为单位组(或区组)。因为单位组之间的差异可在方差分析时从试验误差中分离出来,所以局部控制原则能较好地降低试验误差。
以上所述重复、随机化、局部控制三个基本原则称为费雪(R.A.Fisher)三原则,是试验设计中必须遵循的原则,再采用相应的统计分析方法,就能够最大程度地降低并无偏估计试验误差,无偏估计处理的效应,从而对于各处理间的比较作出可靠的结论。试验设计三原则的关系和作用见图12-1所示。
重 复三原则
随机化局部控制
无偏估计误差降低误差估计误差


统计推断提高精确性
图12-1 试验设计三原则的关系
第四节 完全随机设计
完全随机设计(completely randomized design)是根据试验处理数将全部供试动物随机地分成若干组,然后再按组实施不同处理的设计。这种设计保证每头供试验动物都有相同机会接受任何一种处理,而不受试验人员主观倾向的影响。在畜牧、水产等试验中,当试验条件特别是试验动物的初始条件比较一致时,可采用完全随机设计。这种设计应用了重复和随机化两个原则,因此能使试验结果受非处理因素的影响基本一致,真实反映出试验的处理效应。
完全随机设计的实质是将供试动物随机分组。随机分组的方法有抽签法和用随机数字表法,以用随机数字表法为好,因为随机数字表上所有的数字都是按随机抽样原理编制的,表中任何一个数字出现在任何一个位置都是完全随机的。除从随机数字表(见附表13)可查得随机数字外,有些电脑及计算器均有此功能,用起来则更方便。下面举例说明用随机数字表将试验动物分组的方法。
一、完全随机的分组方法
(一)两个处理比较的分组
【例12.1】 现有同品种、同性别、同年龄、体重相近的健康绵羊18只,试用完全随机的方法分成甲、乙两组。
绵羊编号
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
随机数字组 别调整组别
16

07

44

99

83甲
11甲
46乙甲
32

24
乙甲
20

14

85

88

45

10

93

72

88

首先将18只绵羊依次编为1,2,……,18号,然后从随机数字表中任意一个随机数字开始,向任一方向(左、右、上、下)连续抄下18个(两位)数字,分别代表18只绵羊。令随机数字中的单数为甲组,双数为乙组。如从随机数字表(Ⅰ)第12行第7列的16开始向右连续抄下18个随机数字填入表第二行。
随机分组结果:
甲组:2 4 5 6 12 14 16
乙组:1 3 7 8 9 10 11 13 15 17 18
甲组比乙组少4只,需要从乙组调整两只到甲组。仍用随机的方法进行调整。在前面18个随机数字后再接着抄下两个数字:71、23,分别除以11(调整时乙组的绵羊只数)、10(调整1只绵羊去甲组后乙组剩余的绵羊只数),余数为5、3,则把分配于乙组的第5只绵羊(9号)和余下10只的第3只绵羊(7号)分到甲组。调整后的甲、乙两组绵羊编号为:
甲组
2
4
5
6
7
9
12
14
16
乙组
1
3
8
10
11
13
15
17
18
(二)三个以上处理比较的分组
【例12.2】 设有同品种、同性别、体重相近的健康仔猪18头,按体重大小依次编为1、2、3、…、18号,试用完全随机的方法,把它们等分成甲、乙、丙三组。
由随机数字表(Ⅱ)第10列第2个数94开始,向下依次抄下18个数,填入下表第2横行。
动物编号
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
随机数字
94
94
88
46
56
00
04
00
26
56
48
91
90
88
26
53
12
25
以3除后之余数
1
1
1
1
2
0
1
0
2
2
0
1
0
1
2
2
0
1
组 别
甲
甲
甲
甲
乙
丙
甲
丙
乙
乙
丙
甲
丙
甲
乙
乙
丙
甲
调整组别
丙
乙
一律以3(处理数)除各随机数字,若余数为1,即将该动物归于甲组;余数为2,归入乙组;商为0或余数为0,归入丙组。结果归入甲组者8头,乙组5头,丙组5头。各组头数不等,应将甲组多余的2头调整1头给乙组、1头给丙组。调整甲组的2头动物仍然采用随机的方法。从随机数字25后面接下去抄二个数63、62,然后分别以8(甲组原分配8头)、7除之(注意:若甲组原分配有9头,须将多余的3头调整给另外两组,则抄下三个随机数,分别以9、8、7除之),得第一个余数为7,第二个余数为6,则把原分配在甲组的8头仔猪中第7头仔猪即14号仔猪改为乙组;把甲组中余下的7头仔猪中的第6头仔猪即12号仔猪改为丙组。这样各组的仔猪数就相等了。调整后各组的仔猪编号如下:
组 别
仔 猪 编 号
甲 组
1
2
3
4
7
18
乙 组
5
9
10
14
15
16
丙 组
6
8
11
12
13
17
以上是用完全随机的方法,将试验动物分为两组或三组的情形,若将试验动物分为四组、五组或更多的组,方法相同。
二、试验结果的统计分析
对于完全随机试验的统计分析,由于试验处理数不同,统计分析方法也不同。
(一)处理数为2 两个处理的完全随机设计也就是非配对设计,对其试验结果进行统计分析时,无论实际所得资料两处理重复数相同与否均采用非配对设计的t检验法分析。
(二)处理数大于2 若获得的资料各处理重复数相等,则采用各处理重复数相等的单因素试验资料方差分析法分析;若在试验中,因受到条件的限制或供试动物出现疾病、死亡等使获得的资料各处理重复数不等,则采用各处理重复数不等的单因素试验资料方差分析法分析。
三、完全随机设计的优缺点
完全随机设计是一种最简单的设计方法,主要优缺点如下:
(一)完全随机设计的主要优点
1、设计容易 处理数与重复数都不受限制,适用于试验条件、环境、试验动物差异较小的试验。
2、统计分析简单 无论所获得的试验资料各处理重复数相同与否,都可采用t检验或方差分析法进行统计分析。
(二)完全随机设计的主要缺点
1、由于未应用试验设计三原则中的局部控制原则,非试验因素的影响被归入试验误差,试验误差较大,试验的精确性较低。
2、在试验条件、环境、试验动物差异较大时,不宜采用此种设计方法。
第五节 随机单位组设计
随机单位组设计(randomized block design)也称为随机区组(或窝组)设计。它是根据局部控制的原则,如将同窝、同性别、体重基本相同的动物划归一个单位组,每一单位组内的动物数等于处理数,并将各单位组的试验动物随机分配到各处理组,这种设计称为随机单位组设计。
随机单位组设计要求同一单位组内各头(只)试验动物尽可能一致,不同单位组间的试验动物允许存在差异,但每一单位组内试验动物的随机分组要独立进行,每种处理在一个单位组内只能出现一次。例如,为了比较5种不同中草药饲料添加剂对猪增重的效果,从4头母猪所产的仔猪中,每窝选出性别相同、体重相近的仔猪各5头,共20头,组成4个单位组,设计时每一单位组有仔猪5头,每头仔猪随机地喂给不同的饲料添加剂。这就是处理数为5,单位组数为4的随机单位组设计。
一、随机单位组设计方法
(一)随机单位组设计的分组方法 在畜牧、水产等动物试验中,除把初始条件相同的动物如同窝仔畜划为同一单位组外,还可根据实际情况,把不同试验场、同一场内不同畜舍、不同池塘等划分为单位组。下面结合例子说明分组的方法。
【例12.3】 前面提到的5种中草药饲料添加剂分别以A1、A2、A3、A4、A5表示,供试4窝仔猪分别按体重依次编号为:1-5号为第Ⅰ组,6-10号为第Ⅱ组,11-15号为第Ⅲ组,16-20为第Ⅳ组。试按随机单位组设计将试验仔猪分组。
表12-2 5种饲料添加剂试验随机单位组设计表仔猪编号
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
随机数字
15
50
75
25
-
71
38
86
58
-
95
98
56
85
-
99
83
21
62
-
除 数
5
4
3
2
-
5
4
3
2
-
5
4
3
2
-
5
4
3
2
-
余 数
5
2
3
1
-
1
2
2
2
-
5
2
2
1
-
4
3
3
2
-
添加剂
A5
A2
A4
A1
A3
A1
A3
A4
A5
A2
A5
A2
A3
A1
A4
A4
A3
A5
A2
A1
先从随机数字表(Ⅱ)第15行、第11列15开始,向下依次抄下16个随机数字(舍弃00),每抄4个数字留一空位,见表12-2第2行。再将同一单位组内前4个随机数字依次除以5、4、3、2(最大数5为处理数),根据余数(余数为0者,以除数代之)确定每一单位组内各供试仔猪喂给的添加剂种类。如第一单位组中,第一个余数是5,则将第1号仔猪喂给5种添加剂列于第5位的A5添加剂;第二个余数是2,则将第2号仔猪喂给剩下的4种添加剂A1、A2、A3、A4列于第二位的A2添加剂;第三个余数是3,则将第3号仔猪喂给剩下的3种添加剂A1、A3、A4列于第三位的A4添加剂;第四个余数是1,则将第4号仔猪喂给剩下的2种添加剂A1、A3列于第1位的A1添加剂;第5号仔猪只能喂给剩下的A3添加剂。用同样方法一一确定其它单位组内各仔猪喂给的添加剂,结果见表12-3。
表12-3 5种饲料添加剂试验随机单位组设计试验动物分组表添加剂
单 位 组
Ⅰ
Ⅱ
Ⅲ
Ⅳ
A1
A2
A3
A4
A5
4
2
5
3
1
6
10
7
8
9
14
12
13
15
11
20
19
17
16
18
(二)配对设计分组方法 配对设计是处理数为2的随机单位组设计。在进行配对设计时,配成对子的两个试验单位必须符合配对要求:配成对子的两个试验单位的初始条件尽量一致,不同对子间试验单位的初始条件允许有差异,每一个对子就是试验处理的一个重复,然后将配成对子的两个试验单位随机地分配到两个处理组中。
例如,现有同一品种的供试家畜18头,分别将性别、年龄相同,体重相似的两头家畜配成对子,共9对,编号为1-9号。试用随机方法将每个对子中的两头家畜分到甲、乙两个处理组中。
由随机数字表(Ⅰ)(附表13)的第16行、第8列20开始,向右依次抄下9个随机数字,将单数组中配对的第一头家畜归入甲组,第二头家畜归入乙组;双数组中配对的第一头家畜归入乙组,第二头家畜归入甲组,则9对家畜分组如下:
配对编号
1
2
3
4
5
6
7
8
9
随机数字配对中第一头家畜组别配对中第二头家畜组别
20
乙甲
38
乙甲
26
乙甲
13
甲乙
89
甲乙
51
甲乙
03
甲乙
74
乙甲
17
甲乙
二、试验结果的统计分析
(一)随机单位组试验结果的统计分析 随机单位组试验结果的统计分析采用方差分析法。分析时将单位组也看成一个因素,连同试验因素一起,按两因素单独观测值的方差分析法进行。这里需要说明的是,假定单位组因素与试验因素不存在交互作用。
若记试验处理因素为A,处理因素水平数为a;单位组因素为B,单位组数为b,对试验结果进行方差分析的数学模型为:
 (i=1,2,…,a;j=1,2,…b) (12-1)
式中μ为总体均数,为第i处理的效应,为第j单位组效应。处理效应通常是固定的,且有 ;单位组效应 通常是随机的。为随机误差,相互独立,且都服从。
平方和与自由度的划分式为:
SST = SSA+SSB+SSe
df T = dfA+dfB+dfe
对于【例12.3】,通过按表12-3试验动物分组结果进行试验后,各号仔猪增重结果列于表12-4。
表12-4 5种不同饲料添加剂对仔猪的增重效果 (单位:g)
处 理(A)
单 位 组(B)
处理合计xi.
处理平均
BⅠ
BⅡ
BⅢ
BⅣ
A1
A2
A3
A4
A5
205
230
252
200
265
168
198
248
158
275
222
242
305
183
315
230
255
260
196
282
825
925
1065
737
1137
206.25
231.25
266.25
184.25
284.25
单位组合计x.j
1152
1047
1267
1223
4689(x..)
1、计算各项平方和与自由度矫正数 C=x2../ab=46892/5×4=1099336.05
总平方和 SST=∑x2ij-C=(2052+1682+…+2822)-1099336.06=35890.95
处理间平方和 SSA=∑x 2i./b- C =(8252+9252+…+11372)/4-1099336.05=27267.2
单位组间平方和 SSB=∑x 2.j/a- C =(11522+10472+…+12232)/5-1099336.05=5530.15
误差平方和 SSe=SST-SSA-SSB=35890.95-27267.2-5530.15=3093.6
总自由度 dfT=ab-1=5×4-1=19
处理间自由度 dfA=a-1=5-1=4
单位组间自由度 dfB=b-1=4-1=3
误差自由度 dfe=dfT-dfA-dfB=(a-1)(b-1)=(5-1)(4-1)=12
2、列出方差分析表,进行F检验
表12-5 方差分析表变异原因
SS
df
MS
F
F0.01
处 理 间(A)
单位组间(B)
误 差
27267.20
5530.15
3093.6
4
3
12
6816.80
1843.38
257.8
26.44**
7.15**
5.41
5.95
总 变 异
35890.95
19
因为FA> F0.01(4,12),FB> F0.01(3,12),表明饲料添加剂对仔猪增重影响极显著,因而还需要对各不同饲料添加剂平均数间差异的显著性进行检验。单位组间的变异,虽然F值已达到0.01显著水平,由于我们采取的是随机单位组设计,已将它从误差中分离出来,达到了局部控制的目的。单位组间的变异即使显著,一般也不作单位组间的多重比较。
3、饲料添加剂间的多重比较
表12-6 饲料添加剂平均数间多重比较表(q 法)
添加剂
平均数
-184.25
-206.25
-231.25
-266.25
A5
A3
A2
A1
A4
284.25
266.25
231.25
206.25
184.25
100**
82**
47**
22
78**
60**
25*
53**
35**
18
均数标准误为:

由dfe=12、秩次距k=2,3,4,5,查附表5得临界q值:q0.05、q0.01,并与相乘求得LSR值,列于表12-7。
表12-7 q值和LSR值表
dfe
k
q0.05
q 0.01
LSR0.05
LSR0.01
12
2
3
4
5
3.08
3.77
4.20
4.51
4.32
5.04
5.50
5.84
24.73
30.27
33.72
36.21
34.68
40.46
44.15
46.88
由表12-6看出,除A5与A3,A1与A4之间差异不显著,A2与A1间差异显著外,其余平均数间差异极显著,说明采用A5、A3添加剂仔猪平均增重极显著高于A2、A1、A4添加剂;A2显著高于A1、极显著高于A4;A4添加剂对仔猪增重效果最差。
(二)配对设计试验结果的统计分析 试验结果为计量资料时,采用第五章所介绍的配对设计t检验法进行统计分析。若试验结果为次数资料,采用配对次数资料的检验法进行分析。
三、随机单位组设计的优缺点
(一)随机单位组设计的主要优点
1、设计与分析方法简单易行。
2、由于随机单位组设计体现了试验设计三原则,在对试验结果进行分析时,能将单位组间的变异从试验误差中分离出来,有效地降低了试验误差,因而试验的精确性较高。
3、把条件一致的供试动物分在同一单位组,再将同一单位组的供试动物随机分配到不同处理组内,加大了处理组之间的可比性。
(二)随机单位组设计的主要缺点 当处理数目过多时,各单位组内的供试动物数数目也过多,要使各单位组内供试动物的初始条件一致将有一定难度,因而在随机单位组设计中,处理数以不超过20为宜。
配对设计是处理数为2的随机单位组设计,其优点是结果分析简单,试验误差通常比非配对设计小,但由于试验动物配对要求严格,不允许将不满足配对要求的试验动物随意配对。
第六节 拉丁方设计
“拉丁方”的名字最初是由R、A、Fisher给出的。拉丁方设计(latin square design)是从横行和直列两个方向进行双重局部控制,使得横行和直列两向皆成单位组,是比随机单位组设计多一个单位组的设计。在拉丁方设计中,每一行或每一列都成为一个完全单位组,而每一处理在每一行或每一列都只出现一次,也就是说,在拉丁方设计中,试验处理数=横行单位组数=直列单位组数=试验处理的重复数。在对拉丁方设计试验结果进行统计分析时,由于能将横行、直列二个单位组间的变异从试验误差中分离出来,因而拉丁方设计的试验误差比随机单位组设计小,试验精确性比随机单位组设计高。
一、拉丁方简介
(一)拉丁方 以n个拉丁字母A,B,C……,为元素,作一个n阶方阵,若这n个拉丁方字母在这n阶方阵的每一行、每一列都出现、且只出现一次,则称该n阶方阵为n×n阶拉丁方。
例如:
A B
B A
B A
A B
为2×2阶拉丁方,2×2阶拉丁方只有这两个。
A B C
B C A
C A B
为3×3阶拉丁方。
第一行与第一列的拉丁字母按自然顺序排列的拉丁方,叫标准型拉丁方。3×3阶标准型拉丁方只有上面介绍的1种,4×4阶标准型拉丁方有4种,5×5阶标准型拉丁方有56种。若变换标准型的行或列,可得到更多种的拉丁方。在进行拉丁方设计时,可从上述多种拉丁方中随机选择一种;或选择一种标准型,随机改变其行列顺序后再使用。
(二)常用拉丁方 在动物试验中,最常用的有3×3,4×4,5×5,6×6阶拉丁方。下面列出部分标准型拉丁方,供进行拉丁方设计时选用。其余拉丁方可查阅数理统计表及有关参考书。
3×3
4 × 4
(1)
(2)
(3)
(4)
A
B
C
B
C
A
C
A
B
A
B
C
D
B
A
D
C
C
D
B
A
D
C
A
B
A
B
C
D
B
C
D
A
C
D
A
B
D
A
B
C
A
B
C
D
B
D
A
C
C
A
D
B
DC
B
A
A
B
C
D
B
A
D
C
C
D
AB
D
C
BA
5 × 5
(1)
(2)
(3)
(4)
A
B
C
D
E
B
A
D
E
C
C
E
A
B
D
D
C
E
A
B
E
D
B
C
A
A
B
C
D
E
B
A
E
C
D
C
D
B
E
A
D
E
A
B
C
E
C
D
A
B
A
B
C
D
E
B
A
E
C
D
C
E
D
B
A
D
C
A
E
B
E
D
B
A
C
A
B
C
D
E
B
A
D
E
C
C
D
E
B
A
D
E
A
C
B
E
C
B
A
D
6 × 6
A
B
C
D
E
F
B
F
D
A
C
E
C
D
E
F
A
B
D
C
F
E
B
A
E
A
B
C
F
D
F
E
A
B
D
C
二、拉丁方设计方法
在畜牧、水产等动物试验中,如果要控制来自两个方面的系统误差,且试验动物的数量又较少,则常采用拉丁方设计。下面结合具体例子说明拉丁方设计方法。
【例12.4】 为了研究5种不同温度对蛋鸡产蛋量的影响,将5栋鸡舍的温度设为A、B、C、D、E,把各栋鸡舍的鸡群的产蛋期分为5期,由于各鸡群和产蛋期的不同对产蛋量有较大的影响,因此采用拉丁方设计,把鸡群和产蛋期作为单位组设置,以便控制这两个方面的系统误差。拉丁方设计步骤如下:
(一)选择拉丁方 选择拉丁方时应根据试验的处理数和横行、直列单位组数先确定采用几阶拉丁方,再选择标准型拉丁方或非标准型拉丁方。此例因试验处理因素为温度,处理数为5;将鸡群作为直列单位组因素,直列单位组数为5;将产蛋期作为横行单位组因素,横行单位组数亦为5,即试验处理数、直列单位组数、横行单位组数均为5,则应选取5×5阶拉丁方。本例选取前面列出的第2个5 × 5标准型拉丁方,即:
A B C D E
B A D E C
C E B A D
D C E B A
E D A C B
(二)随机排列 在选定拉丁方之后,如是非标准型时,则可直接按拉丁方中的字母安排试验方案。若是标准型拉丁方,还应按下列要求对横行、直列和试验处理的顺序进行随机排列。
3×3标准型拉丁方:直列随机排列,再将第二和第三横行随机排列。
4×4标准型拉丁方:随机选择4个标准型拉丁方中的一个,然后再将横行、直列及处理都随机排列。
下面对选定的5×5标准型拉丁方进行随机排列。先从随机数字表(Ⅰ)第22行、第8列97开始,向右连续抄录3个5位数,抄录时舍去“0”、“6以上的数”和重复出现的数,抄录的3个五位数字为:13542,41523,34521。然后将上面选定的5×5拉丁方的直列、横行及处理按这3个五位数的顺序重新随机排列。
1、直列随机 将拉丁方的各直列顺序按13542顺序重排。
2、横行随机 再将直列重排后的拉丁方的各横行按41523顺序重排。
选择拉丁方
直列随机
横行随机
1
2
3
4
5
1
3
5
4
2
A
B
C
D
E
B
A
E
C
D
C
D
B
E
A
D
E
A
B
C
E
C
D
A
B
1
2
3
4
5
A
B
C
D
E
C
D
B
E
A
E
C
D
A
B
D
E
A
B
C
B
A
E
C
D
4
1
5
2
3
DAEBC
E
C
A
D
B
A
E
B
C
D
B
D
C
E
A
C
B
D
A
E
3、把5种不同温度按第三个5位数34521顺序排列 即:A=3,B=4,C=5,D=2,E=1,也就是说,在拉丁方中的A表示第3种温度,B表示第4种温度等,依次类推。从而得出5×5拉丁方设计,如表12-8所示。
表12-8 5种不同温度对鸡产蛋量影响的拉丁方设计产蛋期
鸡 群
一
二
三
四
五
Ⅰ




D(2)
A(3)
E(1)
B(4)
C(5)
E(1)
C(5)
A(3)
D(2)
B(4)
A(3)
E(1)
B(4)
C(5)
D(2)
B(4)
D(2)
C(5)
E(1)
A(3)
C(5)
B(4)
D(2)
A(3)
E(1)
注:括号内的数字表示温度的编号
由表12-8可以看出,第一鸡群在第Ⅰ个产蛋期用第2种温度,第二鸡群在第Ⅰ个产蛋期用第1种温度,等等。试验应严格按设计实施。
三、试验结果的统计分析
拉丁方设计试验结果的分析,是将两个单位组因素与试验因素一起,按三因素试验单独观测值的方差分析法进行,但应假定3个因素之间不存在交互作用。将横行单位组因素记为A,直列单位组因素记为B,处理因素记为C,横行单位组数、直列单位组数与处理数记为r,对拉丁方试验结果进行方差分析的数学模型为:
 (i=j=k=1,2,…,r) (12-3)
式中:μ为总平均数;为第i横行单位组效应;为第j直列单位组效应, 为第k处理效应。单位组效应、通常是随机的,处理效应通常是固定的,且有;为随机误差,相互独立,且都服从N(0,σ2)。
注意:k不是独立的下标,因为i、j一经确定,k亦随之确定。
平方和与自由度划分式为:
SST = SSA+SSB+SSC+SSe
dfT = dfA+dfB+dfc+dfe (12-4)
【例12.4】的试验结果如表12-9所示。
表12-9 5种不同温度对母鸡产蛋量影响试验结果 (单位:个)
产蛋期
鸡 群
横行和xi.
一
二
三
四
五
Ⅰ




D(23)
A(22)
E(20)
B(25)
C(19)
E(21)
C(20)
A(25)
D(22)
B(20)
A(24)
E(20)
B(26)
C(25)
D(24)
B(21)
D(21)
C(22)
E(21)
A(22)
C(19)
B(22)
D(23)
A(23)
E(19)
108
105
116
116
104
直列和x.j
109
108
119
107
106
x..=549
注:括号内数字为产蛋量
表12-10 各种温度(处理)的合计温度
A
B
C
D
E
x(k)

116
23.2
114
22.8
105
21.0
113
22.6
101
20.2
现对表12-9资料进行方差分析。
1、计算各项平方和与自由度矫正数 C=x2../r2=5492/52=12056.04
总平方和 SST =Σx 2ij(k)-C=232+212+……+192-12056.04= 12157-12056.04=100.96
横行平方和 SS A =Σx 2i./r- C =(1082+1052+……+1042)/5-12056.04=27.36
直列平方和 SS B =Σx 2.j/ r - C =(1092+1082+……+1062)/5-12056.04=22.16
处理平方和 SSC =Σx 2(K)/ r - C =(1162+1142+……+1012)/5-12056.04=33.36
误差平方和 SS e= SS T- SS A- SS B- SS c=100.96-33.36-27.36-22.16= 18.08
总自由度 dfT= r 2-1=52-1=24
横行自由度 dfA= r-1=5-1=4
直列自由度 dfB= r-1=5-1=4
处理自由度 dfC= r-1=5-1=4
误差自由度 dfe=dfT-dfA-dfB-dfC=(r-1)( r-2)=(5-1)(5-2)=12
2、列出方差分析表,进行F检验
表12-11 表12-9资料的方差分析表变异来源
SS
df
MS
F
F0.05
F0.01
横行间直列间温度间误 差
27.36
22.16
33.36
18.08
4
4
4
12
6.84
5.54
8.34
1.50
4.56*
3.69*
5.56**
3.26
3.26
3.26
5.41
5.41
5.41
总变异
100.96
24
经F检验,产蛋期间和鸡群间差异显著,温度间差异极显著。因在拉丁方设计中,横行、直列单位组因素是为了控制和降低试验误差而设置的非试验因素,所以即使显著一般也不对单位组间进行多重比较。下面对不同温度平均产蛋量间作进行多重比较。
3、多重比较列出多重比较表,见表12-12。
表12-12 不同温度平均产蛋量多重比较表(q法)
温度
平均数
-20.2
-21
-22.6
-22.8
A
B
D
C
E
23.2
22.8
22.6
21.0
20.2
3.0*
2.6*
2.4*
0.8
2.2
1.8
1.6
0.6
0.2
0.4
温度平均数标准误为:

由dfe=12和k=2,3,4,5从q值表查得临界q值:q0.05和q0.01,并与相乘得值,列于表12-13。
表12-13 q值和LSR值表
dfe
k
q0.05
q0.01
LSR0.05
LSR 0.01
12
2
3
4
5
3.08
3.77
4.20
4.51
4.32
5.04
5.50
5.84
1.69
2.07
2.31
2.48
2.38
2.77
3.03
3.21
多重比较结果表明:温度A、B、D平均产蛋量显著地高于E,即第3、4、2种温度的平均产蛋量显著高于第1种温度的平均产蛋量,其余之间差异不显著。第1种和第5种温度平均产蛋量最低。
四、拉丁方设计的优缺点
(一)拉丁方设计的主要优点
1、精确性高 拉丁方设计在不增加试验单位的情况下,比随机单位组设计多设置了一个单位组因素,能将横行和直列两个单位组间的变异从试验误差中分离出来,因而试验误差比随机单位组设计小,试验的精确性比随机单位组设计高。
2、试验结果的分析简便
(二)拉丁方设计的主要缺点 因为在拉丁设计中,横行单位组数、直列单位组数、试验处理数与试验处理的重复数必须相等,所以处理数受到一定限制。若处理数少,则重复数也少,估计试验误差的自由度就小,影响检验的灵敏度;若处理数多,则重复数也多,横行、直列单位组数也多,导致试验工作量大,且同一单位组内试验动物的初始条件亦难控制一致。因此,拉丁方设计一般用于5-8个处理的试验。在采用4个以下处理的拉丁方设计时,为了使估计误差的自由度不少于12,可采用“复拉丁方设计”,即同一个拉丁方试验重复进行数次,并将试验数据合并分析,以增加误差项的自由度。
应当注意,在进行拉丁方试验时,某些单位组因素,如奶牛的泌乳阶段,试验因素的各处理要逐个地在不同阶段实施,如果前一阶段有残效,在后一阶段的试验中,就会产生系统误差而影响试验的准确性。此时应根据实际情况,安排适当的试验间歇期以消除残效。另外,还要注意,横行、直列单位组因素与试验因素间不存在交互作用,否则不能采用拉丁方设计。
*第七节 交叉设计
交叉设计亦称反转试验设计,是指在同一试验中将试验单位分期进行、交叉反复二次以上的试验设计方法。
在动物试验中,为了提高试验的精确性,要求选用在遗传及生理上相同或相似的试验动物,但这在实践中往往不易满足。如进行奶牛的泌乳试验时,要选择若干头品种、性别、年龄、胎次等条件都相同的奶牛是很困难的。为了较好地消除试验动物个体之间以及试验时期间的差异对试验结果的影响,可采用交叉设计法。常用的有2×2和2×3交叉设计,见表12-14和12-15。
表12-14 2×2交叉设计 表12-15 2×3交叉设计群别
时 期
群别
时 期
I
II
I
II
III
1
处理
对照
1
处理
对照
处理
2
对照
处理
2
对照
处理
对照
一、2×2交叉设计与分析
2×2交叉设计就是两组试验动物分两期一次交叉的试验设计。下面举例说明试验结果的分析方法。
【例12.5】为了研究饲料新配方对奶牛产奶量的影响,设置对照饲料A1和新饲料配方A2两个处理,选择条件相近的奶牛10头,随机分为B1、B2两组,每组5头,预试期1周。试验分为C1、C2两期,每期两周,按2×2交叉设计进行试验。试验结果列于表12-16。试检验新饲料配方对提高产奶量有无效果。
对于2×2交叉试验资料,采用单因素二水平差值d的方差分析法(Lucas)或t检验法(明道绪)进行分析。两种分析方法的无效假设、备择假设均为:。
(一) 方差分析法 此例处理数k=2,重复数r=5。先计算出两个时期产奶量的差d=C1-C2,以及,见表12-16。
1、计算各项平方和与自由度
矫正数 
总平方和 
处理平方和 
误差平方和 
总自由度 
处理自由度 
误差自由度 
表12-16 【例12.5】试验结果 (单位:千克/头·日)
时 期
C1
C2
d=C1-C2
处 理
A1
A2
d1
d2
B1

B11
13.8
15.5
-1.7
B12
16.2
18.4
-2.2
B13
13.5
16.0
-2.5
B14
12.8
15.8
-3.0
B15
12.5
14.5
-2.0
处 理
A2
A1
B2

B21
14.3
13.5
0.8
B22
20.2
15.4
4.8
B23
18.6
14.3
4.3
B24
17.5
15.2
2.3
B25
14.0
13.0
1.0
总 和 T1=-11.4 T2=13.2
2、列出方差分析表,进行F检验表12-17 【例12.5】试验资料方差分析表变异来源
SS
df
MS
F
F0.01(1,8)
处 理
60.5160
1
60.52
33.16**
11.26
误 差
14.6000
8
1.83
总变异
75.116
9
因为处理F值33.16>F0.01(1,8),P<0.01,否定,接受,表明新配方饲料与对照饲料平均产奶量差异极显著,这里表现为新配方饲料的平均产奶量极显著高于对照饲料的平均产奶量。
(二) t检验法 检验公式为:
 (12-5)
其中:
——差数平均数差异标准误
r,s 分别为两组试验个体数。
此例,r=s=5,
 由df=(r-1)+(s-1)=(5-1)+(5-1)=8查临界t值得:t0.01(8)=3.355,因为|t|=5.7854> t0.01(8),P<0.01,否定,接受,表明新配方饲料与对照饲料平均产奶量差异极显著。检验结果与方差分析法一致。
二、2×3交叉设计与分析
2×3交叉设计就是将试验动物分三期两次交叉的试验设计。对于2×3交叉试验资料,亦采用方差分析法或t检验法进行分析。
【例12.6】 为了研究饲喂尿素对奶牛产奶量的影响,设置尿素配合饲料A1和对照饲料A2两个处理,选择条件相近的奶牛6头,随机分为B1、B2两组,每组3头,试验分C1、C2、C3三期(每期20天),B1组(B11,B12,B13)按A1—A2—A1顺序给予饲料,B2组(B21,B22,B23)按A2—A1—A2顺序给予饲料,预饲期1周。试验结果列于表12-8,试检验尿素对提高奶牛的产奶量有无效果。
按公式d=C1-2C2+C3分别计算出B1组的差d1和B2组的差d2及T1、T2。两种方法的无效假设与备择假设均为,。
(一) 方差分析法 此例,处理数k=2,重复数r=3。
1、计算各项平方和与自由度
矫正数 
总平方和 
处理平方和 
误差平方和 
总自由度 
处理自由度 
误差自由度 
表12-18 【例12.6】 试验结果 (单位:千克/头·日)
时 期
C1
C2
C3
d=C1-2C2-C3
处 理
A1
A2
A1
d1
d2
B1

B11
11.32
11.36
11.31
-0.09
B12
13.67
13.40
13.83
0.70
B13
18.74
16.34
16.39
2.45
处 理
A2
A1
A2
B2

B21
11.65
11.19
11.12
0.39
B22
13.57
13.87
13.41
-0.76
B23
11.54
10.97
10.66
0.26
总 和 T1=3.06 T2=-0.11
2、列出方差分析表,进行F检验表12-9 【例12.6】试验资料方差分析表变异来源
SS
df
MS
F
F0.05(1,4)
处 理
1.6748
1
1.6748
1.60ns
7.71
误 差
4.1727
4
1.0432
总变异
17.72
5
F检验结果表明,在对照饲料基础上添加尿素对提高奶牛产奶量效果不显著。
(二) t检验法 2×3交叉试验资料分析的t检验公式与2×2交叉试验资料分析的t检验相同。
此例 r=s=3,T1=3.06,T2=-0.11,
 由df=(r-1)+(s-1)=(3-1)+(3-1)=4查临界t值,得:t0.05(4)=2.776,因为t=1.2672<t0.05(4),P>0.05,表明在对照饲料上添加尿素与否,奶牛产奶量差异不显著。检验结果与方差分析法相同。
三、交叉设计的优缺点及注意事项
(一) 交叉设计的优缺点
1、主要优点 交叉设计可以消除个体间及试验时期间的差异对试验结果的影响,进一步突出处理效应,提高了试验的精确性。因此,交叉设计特别适用于个体差异较大的动物试验,如大动物和兽医学试验等。此外,交叉试验结果的分析较为简便。
2、主要缺点 与拉丁方设计相比,交叉设计不能得到关于个体差异和试验期差异大小的信息;若与有重复的多因素试验相比,还不能得到因素之间交互作用的信息。因此,交叉设计适用范围有一定的局限性。
(二) 应用交叉设计须注意的问题
1、处理因素、时期、个体间不存在交互作用 如果交叉试验中处理因素、时期、个体有交互作用,这些交互作用效应就会归入误差项中,使误差估计值增大,从而降低试验的精确性。
2、要注意试验是否有处理残效 在交叉试验中,处理轮流更换,如果前一种处理有效应残存,则观测值的线性模型条件就不能成立。为解决这个问题,可设置适当的预试期和间歇期。对于残效不能消失的处理,例如带有破坏性且不能恢复的试验,则不宜采用交叉设计。
3、采用Lucas提出的方差分析法分析2×2、2×3交叉试验资料时要求各试验组动物的头数相等 如在【例12.6】中,第一组按A1—A2—A1的顺序给予饲料,第二组按A2—A1—A2顺序给予饲料,每头奶牛被分配到哪一组,是随机确定的,但两个组的奶牛头数必须相等。只有这样才能通过Σd1j-Σd2j而使试验期的效应相互抵消。采用明道绪提出的t检验法分析2×2、2×3交叉试验资料时,不要求两组试验个体数相等。因而t检验法应用范围更广,且计算步骤也较为简明。
*第八节 正交设计
在动物试验研究中,对于单因素或两因素试验,因其因素少,试验的设计、实施与分析都比较简单。但在实际工作中,常常需要同时考察3个或3个以上的试验因素,若进行全面试验,则试验的规模将很大,往往因试验条件的限制而难于实施。正交设计就是安排多因素试验、寻求最优水平组合的一种高效率试验设计方法。
一、正交设计的概念及原理
(一) 正交设计的基本概念 正交设计是利用正交表来安排与分析多因素试验的一种设计方法。它利用从试验的全部水平组合中,挑选部分有代表性的水平组合进行试验,通过对这部分试验结果的分析了解全面试验的情况,找出最优的水平组合。
例如,影响某品种鸡的生产性能有3个因素:A因素是饲料配方,分A1、A2、A3 3个水平;B因素是光照,分B1、B2、B3 3个水平;C因素是温度,分C1、C2、C3 3个水平。这是一个3因素3水平的试验,各因素的水平之间全部可能的组合有27种。如果试验方案包含各因素的全部水平组合,即进行全面试验,可以分析各因素的效应,交互作用,也可选出最优水平组合。这是全面试验的优点。但全面试验包含的水平组合数较多,工作量大,由于受试验场地、试验动物、经费等限制而难于实施。若试验的目的主要是寻求最优水平组合,则可利用正交设计来安排试验。正交设计的基本特点是:用部分试验来代替全面试验,通过对部分试验结果的分析,了解全面试验的情况。正因为正交试验是用部分试验来代替全面试验,它不可能像全面试验那样对各因素效应、交互作用一一分析;当交互作用存在时,有可能出现交互作用的混杂。虽然正交设计有上述不足,但它能通过部分试验找到最优水平组合,因而很受实际工作者青睐。
如对于上述3因素3水平试验,若不考虑交互作用,可利用正交表L9(34)安排,试验方案仅包含9个水平组合,就能反映试验方案包含27个水平组合的全面试验的情况,找出最佳的生产条件。
(二) 正交设计的基本原理 在试验安排中,每个因素在研究的范围内选几个水平,就好比在选优区内打上网格,如果网上的每个点都做试验,就是全面试验。如上例中,3个因素的选优区可以用一个立方体表示(图12-2),3个因素各取3个水平,把立方体划分成27个格点,反映在图12-2上就是立方体内的27个“.”。若27个网格点都试验,就是全面试验,其试验方案如表12-20所示。
表12-20 3因素3水平全面试验方案
C1
C2
C3
A1
B1
A1B1C1
A1B1C2
A1B1C3
B2
A1B2C1
A1B2C2
A1B2C3
B3
A1B3C1
A1B3C2
A1B3C3
A2
B1
A2B1C1
A2B1C2
A2B1C3
B2
A2B2C1
A2B2C2
A2B2C3
B3
A2B3C1
A2B3C2
A2B3C3
A3
B1
A3B1C1
A3B1C2
A3B1C3
B2
A3B2C1
A3B2C2
A3B2C3
B3
A3B3C1
A3B3C2
A3B3C3
图12-2 3因素3水平试验的均衡分散立体图
3因素3水平的全面试验水平组合数为33=27,4因素3水平的全面试验水平组合数为34=81,5因素3水平的全面试验水平组合数为35=243,这在动物试验中是不可能做到的。正交设计就是从选优区全面试验点(水平组合)中挑选出有代表性的部分试验点(水平组合)来进行试验。图12-2中标有试验号的九个“⊙”,就是利用正交表L9(34)从27个试验点中挑选出来的9个试验点。即:
(1)A1B1C1 (2)A2B1C2 (3)A3B1C3
(4)A1B2C2 (5)A2B2C3 (6)A3B2C1
(7)A1B3C3 (8)A2B3C1 (9)A3B3C2
上述选择,保证了A因素的每个水平与B因素、C因素的各个水平在试验中各搭配一次。对于A、B、C 3个因素来说,是在27个全面试验点中选择9个试验点,仅是全面试验的三分之一。从图12-2中可以看到,9个试验点在选优区中分布是均衡的,在立方体的每个平面上,都恰是3个试验点;在立方体的每条线上也恰有一个试验点。9个试验点均衡地分布于整个立方体内,有很强的代表性,能够比较全面地反映选优区内的基本情况。
二、正交表及其特性
(一) 正交表 由于正交设计安排试验和分析试验结果都要用正交表,因此,我们先对正交表作一介绍。表12-21是一张正交表,记号为L8(27),其中“L”代表正交表;L右下角的数字“8”表示有8行,用这张正交表安排试验包含8个处理(水平组合);括号内的底数“2”表示因素的水平数,括号内2的指数“7”表示有7列,用这张正交表最多可以安排7个因素。
表12-21 L8(27)正交表试验号
列 号
1
2
3
4
5
6
7
1
1
1
1
1
1
1
1
2
1
1
1
2
2
2
2
3
1
2
2
1
1
2
2
4
1
2
2
2
2
1
1
5
2
1
2
1
2
1
2
6
2
1
2
2
1
2
1
7
2
2
1
1
2
2
1
8
2
2
1
2
1
1
2
常用的正交表已由数学工作者制定出来,供进行正交设计时选用。2水平正交表有L4(23)、L16(215);3水平正交表有L9(34)、L27(213)……等(详见附表14及有关参考书)。
(二) 正交表的特性 任何一张正交表都有如下两个特性:
1、任一列中,不同数字出现的次数相等 例如L8(27)中不同数字只有1和2,它们各出现4次;L9(34)中不同数字有1、2和3,它们各出现3次。
2、任两列中,同一横行所组成的数字对出现的次数相等 例如L8(27)中(1,1),(1,2),(2,1),(2,2)各出现两次;L9(34)中(1,1),(1,2),(1,3),(2,1),(2,2),(2,3),(3,1),(3,2),(3,3)各出现1次。即每个因素的一个水平与另一因素的各个水平互碰次数相等,表明任意两列各个数字之间的搭配是均匀的。
根据以上两个特性,我们用正交表安排的试验,具有均衡分散和整齐可比的特点。所谓均衡分散,是指用正交表挑选出来的各因素水平组合在全部水平组合中的分布是均匀的。由图12-2可以看出,在立方体中,任一平面内都包含3个“⊙”,任一直线上都包含1个“⊙”,因此,这些点代表性强,能够较好地反映全面试验的情况。整齐可比是指每一个因素的各水平间具有可比性。因为正交表中每一因素的任一水平下都均衡地包含着另外因素的各个水平,当比较某因素不同水平时,其它因素的效应都彼此抵消。如在A、B、C 3个因素中,A因素的3个水平A1、A2、A3条件下各有B、C的3个不同水平,即:
B1C1
B1C2
B1C3
A1
B2C2
A2
B2C3
A3
B2C1
B3C3
B3C1
B3C2
在这9个水平组合中,A因素各水平下包括了B、C因素的3个水平,虽然搭配方式不同,但B、C皆处于同等地位,当比较A因素不同水平时,B因素不同水平的效应相互抵消,C因素不同水平的效应也相互抵消。所以A因素3个水平间具有可比性。同样,B、C因素3个水平间亦具有可比性。
(三) 正交表的类别
1、相同水平正交表 各列中出现的最大数字相同的正交表称为相同水平正交表。如L4(23)、L8(27)、L12(211)等各列中最大数字为2,称为两水平正交表;L9(34)、L27(313)等各列中最大数字为3,称为3水平正交表。
2、混合水平正交表 各列中出现的最大数字不完全相同的正交表称为混合水平正交表。如L8(4×24)表中有一列最大数字为4,有4列最大数字为2。也就是说该表可以安排一个4水平因素和4个2水平因素。再如L16(44×23),L16(4×1212)等都混合水平正交表。
三、正交设计方法
【例12.7】 在进行矿物质元素对架子猪补饲试验中,考察补饲配方、用量、食盐3个因素,每个因素都有3个水平。试安排一个正交试验方案。
正交设计一般有以下几个步骤:
(一) 确定因素和水平 影响试验结果的因素很多,我们不可能把所有影响因素通过一次试验都予以研究,只能根据以往的经验,挑选和确定若干对试验指标影响最大、有较大经济意义而又了解不够清楚的因素来研究。同时还应根据实际经验和专业知识,定出各因素适宜的水平,列出因素水平表。【例12.7】的因素水平表如表12-22所示。
表12-22 架子猪补饲试验因素水平表
水 平
因 素
矿物质元素补饲配方(A)
用 量(g)(B)
食 盐(g)(C)
1
配方I(A1)
15(B1)
0(C1)
2
配方II(A2)
25(B2)
4(C2)
3
配方III(A3)
20(B3)
8(C3)
(二) 选用合适的正交表 确定了因素及其水平后,根据因素、水平及需要考察的交互作用的多少来选择合适的正交表。选用正交表的原则是:既要能安排下试验的全部因素,又要使部分水平组合数(处理数)尽可能地少。一般情况下,试验因素的水平数应恰好等于正交表记号中括号内的底数;因素的个数(包括交互作用)应不大于正交表记号中括号内的指数;各因素及交互作用的自由度之和要小于所选正交表的总自由度,以便估计试验误差。若各因素及交互作用的自由度之和等于所选正交表总自由度,则可采用有重复正交试验来估计试验误差。
此例有3个3水平因素,若不考察交互作用,则各因素自由度之和为因素数个数×(水平数─1)=3(3-1)=6,小于L9(34)总自由度9-1=8,故可以选用L9(34);若要考察交互作用,则应选用L27(313),此时所安排的试验方案实际上是全面试验方案。
(三) 表头设计 正交表选好后,就可以进行表头设计。所谓表头设计,就是把挑选出的因素和要考察的交互作用分别排入正交表的表头适当的列上。在不考察交互作用时,各因素可随机安排在各列上;若考察交互作用,就应按该正交表的交互作用列表安排各因素与交互作用。此例不考察交互作用,可将矿物质元素补饲配方(A)、用量(B)和食盐(C)依次安排在L9(34)的第1、2、3列上,第4列为空列,见表12-23。
表12-23 表头设计列 号
1
2
3
4
因 素
A
B
C
空
(四) 列出试验方案 把正交表中安排各因素的每个列(不包含欲考察的交互作用列)中的每个数字依次换成该因素的实际水平,就得到一个正交试验方案。表12-24就是[例12.4] 的正交试验方案。
根据表12-24,1号试验处理是A1B1C1,即配方I、用量15g、食盐为0;2号试验处理是A1B2C2,即配方II、用量25g、食盐为4g,…;9号试验处理为A3B3C2,即配方III、用量20g、食盐4g。
表12-24 正交试验方案试 验 号
因 素
A
B
C
1
2
3
1
1(配方I)
1(15)
1(0)
2
1(配方I)
2(25)
2(4)
3
1(配方I)
3(20)
3(8)
4
2(配方II)
1(15)
2(4)
5
2(配方II)
2(25)
3(8)
6
2(配方II)
3(20)
1(0)
7
3(配方III)
1(15)
3(8)
8
3(配方III)
2(25)
1(0)
9
3(配方III)
3(20)
2(4)
四、正交试验结果的统计分析
根据各号试验处理是单独观测值还是有重复观测值,正交试验可分为单独观测值正交试验和有重复观测值正交试验两种。若各号试验处理都只有一个观测值,则称之为单独观测值正交试验;若各号试验处理都有两个或两个以上观测值,则称之为有重复观测值正交试验。下面分别介绍单独观测值和有重复观测正交试验结果的方差分析。
(一) 单独观测值正交试验结果的方差分析 对例【12.7】用L9(34)安排试验方案后,各号试验只进行一次,试验结果(增重)列于表12-17。试对其进行方差分析。
该次试验的9个观测值总变异由A因素、B因素、C因素及误差变异四部分组成,因而进行方差分析时平方和与自由度的划分式为:
SST = SSA+SSB+SSC+SSe
dfT = dfA+dfB+dfC+dfe
用n表示试验(处理)号数;a、b、c表示A、B、C因素各水平重复数;ka、kb、kc表示A、B、C因素的水平数。本例,n=9、a=b=c=3,ka=kb=kc=3。
表12-17 正交试验结果计算表试验号
因 素
增重(kg)
A
B
C
(1)
(2)
(3)
1
1
1
1
63.4 (y1)
2
1
2
2
68.9 (y2)
3
1
3
3
64.9 (y3)
4
2
1
2
64.3 (y4)
5
2
2
3
70.2 (y5)
6
2
3
1
65.8 (y6)
7
3
1
3
71.4 (y7)
8
3
2
1
69.5 (y8)
9
3
3
2
73.7 (y9)
T1
197.2
199.1
198.7
612.1(T)
T2
200.3
208.6
206.9
T3
214.6
204.4
206.5

65.7333
66.3667
66.2333

66.7667
69.5333
68.9667

71.5333
68.1333
68.8333
表12-17中,Ti为各因素同一水平试验指标(增重)之和。如A因素第1水平T1=y1+y2+y3=63.4+68.9+64.9=197.2,A因素第2水平T2=y4+y5+y6=64.3+70.2+65.8=200.3,A因素第3水平T3=y7+y8+y9=71.4+69.5+73.7=214.6;B因素第1水平T1=y1+y4+y7=63.4+64.3+71.4=199.1,……,B因素第3水平T3=y3+y6+y9=64.9+65.8+73.7=204.4。同理可求得C因素各水平试验指标之和。
为各因素同一水平试验指标的平均数。如A因素第1水平=197.2/3=65.7333,A因素第2水平=200.3/3=66.7667,A因素第3水平=214.6/3=71.5333。同理可求得B、C因素各水平试验指标的平均数。
1、计算各项平方和与自由度
矫正数 C=T2/n=612.12/9=41629.6011
总平方和 SST=Σy2-C=63.42+68.92+…+73.72-41629.6011=101.2489
A因素平方和 SSA=ΣT2A/a-C=(197.22+200.32+214.62)/3-41629.6011=57.4289
B因素平方和 SSB=ΣT2B/b-C=(199.12+208.62+204.42)/3-41629.6011=15.1089
C因素平方和 SSC=ΣT2C/c-C=(198.72+206.92+206.52)/3-41629.6011=14.2489
误差平方和 SSe=SST-SSA-SSB-SSC=101.2489-57.4289-15.1089-14.2489=14.4622
总自由度 dfT=n-1=9-1=8
A因素自由度 dfA=ka-1=3-1=2
B因素自由度 dfB=kb-1=3-1=2
C因素自由度 dfC=kc-1=3-1=2
误差自由度 dfe=dfT-dfA-dfB-dfC=8-2-2-2=2
2、列出方差分析表,进行F检验表12-26 方差分析表变异来源
SS
df
MS
F
F0.05(2,2)
配方(A)
57.4289
2
28.71
3.97ns
19.00
用量(B)
15.1089
2
7.55
1.05ns
食盐(C)
14.2489
2
7.12
<1
误差
14.4622
2
7.23
总变异
101.25
8
F检验结果表明,三个因素对增重的影响都不显著。究其原因可能是本例试验误差大且误差自由度小(仅为2),使检验的灵敏度低,从而掩盖了考察因素的显著性。由于各因素对增重影响都不显著,不必再进行各因素水平间的多重比较。此时,可直观地从表12-17中选择平均数大的水平A3、B3、C2组合成最优水平组合A3B3C2。
上述无重复正交试验结果的方差分析,其误差是由“空列”来估计的。然而“空列”并不空,实际上是被未考察的交互作用所占据。这种误差既包含试验误差,也包含交互作用,称为模型误差。若交互作用不存在,用模型误差估计试验误差是可行的;若因素间存在交互作用,则模型误差会夸大试验误差,有可能掩盖考察因素的显著性。这时,试验误差应通过重复试验值来估计。所以,进行正交试验最好能有二次以上的重复。正交试验的重复,可采用完全随机或随机单位组设计。
(二) 有重复观测值正交试验结果的方差分析 假定【例12.7】试验重复了两次,且重复采用随机单位组设计,试验结果列于表12-27。试对其进行方差分析。
用n表示试验(处理)号数,r表示试验处理的重复数。a、b、c、ka、kb、kc的意义同上。此例n=9、r=2、a=b=c=3、ka=kb=dc=3
表12-27 有重复观测值正交试验结果计算表试验号
因 素 增 重 (kg)
A
B
C
空
单位组I
单位组II
Tt
(1)
(2)
(3)
(4)
1
1
1
1
1
63.4
67.4
130.8
2
1
2
2
2
68.9
87.2
156.1
3
1
3
3
3
64.9
66.3
131.2
4
2
1
2
3
64.3
86.3
150.6
5
2
2
3
1
70.2
88.5
158.7
6
2
3
1
2
65.8
66.6
132.4
7
3
1
3
2
71.4
89.0
160.4
8
3
2
1
3
69.5
91.2
160.7
9
3
3
2
1
73.7
92.8
166.5
T1
418.1
441.8
423.9
456
612.1
735.3
1347.4(T)
T2
441.7
475.5
473.2
448.9
T3
487.6
430.1
450.3
442.5

69.68
73.63
70.65
76.00

73.62
79.25
78.87
74.82

81.26
71.68
75.05
73.75
对于有重复、且重复采用随机单位组设计的正交试验,总变异可以划分为处理间、单位组间和误差变异三部分,而处理间变异可进一步划分为A因素、B因素、C因素与模型误差变异四部分。此时,平方和与自由度划分式为:
SST=SSt+SSr+SSe2
dfT=dft+dfr+dfe2
而 SSt=SSA+SSB+SSC+SSe1
dft=dfA+dfB+dfC+dfe1
于是 SST=SSA+SSB+SSC+SSr+SSe1+SSe2 (12-7)
dfT=dfA+dfB+dfC+dfr+dfe1+dfe2
式中:SSr为单位组间平方和;SSe1为模型误差平方和;SSe2为试验误差平方和;SSt为处理间平方和;dfr、dfe1、dfe2,dft为相应自由度。
注意,对于重复采用完全随机设计的正交试验,在平方和与自由度划分式中无SSr、dfr项。
1、计算各项平方和与自由度
矫正数 C=T2/rn=1347.42/2×9=100860.3756
总平方和 SST=Σy2-C=63.42+68.92+…+92.82-100860.3756=1978.5444
单位组间平方和 SSr=ΣT2r/n-C=(612.12+735.32)/9-100860.3756=843.2355
处理间平方和 SSt=ΣT2t/r-C=(130.82+156.12+…+166.52)/2-100860.3756=819.6244
A因素平方和 SSA=ΣT2A/ar-C=(418.12+441.72+487.62)/3×2-100860.3756=416.3344
B因素平方和 SSB=ΣT2B/br-C=(411.82+475.52+430.12)/3×2-100860.3756=185.2077
C因素平方和 SSC=ΣT2C/cr-C=(423.92+473.22+450.32)/3×2-100860.3756=202.8811
模型误差平方和 SSe1=SSt-SSA-SSB-SSC=819.6244-416.3344-185.2077-202.8811=15.2012
试验误差平方和 SSe2=SST-SSr-SSt=1978.5444-843.2355-819.6244=315.6845
总自由度 dfT=rn-1=2×9-1=17
单位组自由度 dfr=r-1=2-1=1
处理自由度 dft=n-1=9-1=8
A因素自由度 dfA=a-1=3-1=2
B因素自由度 dfB=b-1=3-1=2
C因素自由度 dfC=c-1=3-1=2
模型误差自由度 dfe1=dft-dfA-dfB-dfC=8-2-2-2-2=2
试验误差自由度 dfe2=dfT-dft=17-1-8=8
2、列出方差分析表,进行F检验
表12-8 有重复观测值正交试验结果方差分析表变异来源
SS
df
MS
F
F0.05
F0.01
A
416.3344
2
208.17
6.29*
4.10
7.55
B
185.2077
2
92.60
2.80
4.10
7.55
C
202.8811
2
101.44
3.07
4.10
7.55
单位组
843.2355
1
843.24
25.48**
4.96
10.01
误差(e1)
15.2012
2
7.60
误差(e2)
315.6845
8
39.46
合并误差
330.8857
10
33.09
总 的
1978.5444
17
首先检验MSe1与MSe2差异的显著性,若经F检验不显著,则可将其平方和与自由度分别合并,计算出合并的误差均方,进行F检验与多重比较,以提高分析的精度;若F检验显著,说明存在交互作用,二者不能合并,此时只能以MSe2进行F检验与多重比较。本例MSe1/ MSe2<1,MSe1与MSe2差异不显著,故将误差平方和与自由度分别合并计算出合并的误差均方MSe,即MSe=( SSe1+ SSe2)/(dfe1+ dfe2)=(15.2012+315.6845)/(2+8)=33.09,并用合并的误差均方MSe进行F检验与多重比较。
F检验结果表明,矿物质元素配方对架子猪增得有显著影响,另外两个因素作用不显著;二个单位组间差异极显著。
3,A因素各水平平均数的多重比较
表12-9 A因素各水平平均数多重比较表(SSR法) 单位:kg
A因素
平均数
-69.68
-73.62
A3
81.26
11.58**
7.64*
A2
73.62
3.94
A1
69.68
因为,
由dfe=10和k=2,3,查得SSR值并计算出LSR值列于表12-30。
表12-30 SSR值与LSR值表
dfe
k
SSR0.05
SSR0.01
LSR0.05
LSR0.01
10
2
3.15
4.48
7.40
10.53
3
3.30
4.73
7.76
11.12
多重比较结果表明:A因素A3水平的平均数显著或极显著地高于A2、A1;A2与A1间差异不显著。
此例因模型误差不显著,可以认为因素间不存在显著的交互作用。可由A、B、C因素的最优水平组合成最优水平组合。A因素的最优水平为A3;因为B、C因素水平间差异均不显著,故可任选一水平。如B、C因素选择使增重达较高水平的B2及C2,则得最优水平组合为A3B2C2,即配方III、用量25克、食盐4克。
若模型误差显著,表明因素间交互作用显著,则应进一步试验,以分析因素间的交互作用。
五、因素间有交互作用的正交设计与分析
在实际研究中,有时试验因素之间存在交互作用。对于既考察因素主效应又考察因素间交互作用的正交设计,除表头设计和结果分析与前面介绍略有不同外,其它基本相同。
【例12.8】 某一种抗菌素的发酵培养基由A、B、C 3种成分组成,各有两个水平,除考察A、B、C三个因素的主效外,还考察A与B、B与C的交互作用。试安排一个正交试验方案并进行结果分析。
(一) 选用正交表,作表头设计 由于本试验有3个两水平的因素和两个交互作用需要考察,各项自由度之和为:3×(2-1)+2×(2-1)×(2-1)=5,因此可选用L8(27)来安排试验方案。
正交表L8(27)中有基本列和交互列之分,基本列就是各因素所占的列,交互列则为两因素交互作用所占的列。可利用L8(27)二列间交互作用列表(见表12-31)来安排各因素和交互作用。
表12-31 L8(27)二列间交互作用列表列号
1
2
3
4
5
6
7
1
(1)
3
2
5
4
7
6
2
(2)
1
6
7
4
5
3
(3)
7
6
5
4
4
(4)
1
2
3
5
(5)
3
2
6
(6)
1
如果将A因素放在第1列,B因素放在第2列,查表12-31可知,第1列与第2列的交互作用列是第3列,于是将A与B的交互作用A×B放在第3列。这样第3列不能再安排其它因素,以免出现“混杂”。然后将C放在第4列,查表12-31可知,B×C应放在第6列,余下列为空列,如此可得表头设计,见表12-32。
表12-32 表头设计列号
1
2
3
4
5
6
7
因素
A
B
A×B
C
空
B×C
空
(二) 列出试验方案 根据表头设计,将A、B、C各列对应的数字“1”、“2”换成各因素的具体水平,得出试验方案列于表12-33。
表12-33 正交试验方案试 验 号
因
素
1(A)
2(B)
3(C)
1
1(A1)
1(B1)
1(C1)
2
1(A1)
1(B1)
2(C2)
3
1(A1)
2(B2)
1(C1)
4
1(A1)
2(B2)
2(C2)
5
2(A2)
1(B1)
1(C1)
6
2(A2)
1(B1)
2(C2)
7
2(A2)
2(B2)
1(C1)
8
2(A2)
2(B2)
2(C2)
(三) 结果分析 按表12-33所列的试验方案进行试验,其结果见表12-34。
表中Ti、计算方法同前。此例为单独观测值正交试验,总变异划分为A因素、B因素、C因素、A×B、B×C、与误差变异5部分,平方和与自由度划分式为:
SST=SSA+SSB+SSC+SSA×B+SSB×C+SSe
dfT=dfA+dfB+dfC+dfA×B+dfB×C+dfe (12-8)
1、计算各项平方和与自由度
矫正数 C=T2/n=6652/8=55278.1250
总平方和 SST=Σy2-C=552+382+…+612-55278.1250=6742.8750
A因素平方和 SSA=ΣT2A/a-C=(2792+3862)/4-55278.1250=1431.1250
B因素平方和 SSB=ΣT2B/b-C=(3392+3262)/4-55278.1250=21.1250
C因素平方和 SSC=ΣT2C/c-C=(3532+3122)/4-55278.1250=210.1250
A×B平方和 SSA×B =ΣT2A×B /4-C=(2332+4322)/4-55278.1250=4950.1250
B×C平方和 SSB×C =ΣT2B×C /4-C=(3272+3382)/4-55278.1250=15.1250
误差平方和 SSe=SST-SSA-SSB-SSA×B-SSB×C=6742.8750-1431.1250-21.1250
-210.1250-4950.1250-15.1250=115.2500
总自由度 dfT=n-1=8-1=7
各因素自由度 dfA=dfB=dfC=2-1=1
交互作用自由度 dfA×B=dfB×C=(2-1)(2-1)=1
误差自由度 dfe=dfT-dfA-dfC-dfA×B-dfB×C=7-1-1-1-1-1=2
表12-34 有交互作用的正交试验结果计算表试验号
因 素
试验结果(%)*
A
B
A×B
C
B×C
1
1
1
1
1
1
55(y1)
2
1
1
1
2
2
38(y2)
3
1
2
2
1
2
97(y3)
4
1
2
2
2
1
89(y4)
5
2
1
2
1
1
122(y5)
6
2
1
2
2
2
124(y6)
7
2
2
1
1
2
79(y7)
8
2
2
1
2
1
61(y8)
T1
279
339
233
353
327
665(T)
T2
386
326
432
312
338

69.75
84.75
58.25
88.25
81.75

96.50
81.50
108.00
78.00
84.50
*试验结果以对照为100计
2、列出方差分析表,进行F检验表12-35 方差分析表变异来源
SS
df
MS
F
F0.05(1,2)
F0.01(1,2)
A
1431.1250
1
1431.1250
24.84*
18.51
98.49
B
21.1250
1
21.1250
<1
C
210.1250
1
210.1250
3.65
A×B
4950.1250
1
4950.1250
85.90*
B×C
15.1250
1
12.1250
<1
误差
115.1250
2
57.6250
总的
6742.8750
7
F检验结果表明:A因素和交互作用A×B显著,B、C因素及B×C交互作用不显著。因交互作用A×B显著,应对A与B的水平组合进行多重比较,以选出A与B的最优水平组合。
3、A与B各水平组合的多重比较
先计算出A与B各水平组合的平均数:
A1B1水平组合的平均数=(55+38)/2=46.50
A1B2水平组合的平均数=(97+89)/2=93.00
A2B1水平组合的平均数=(122+124)/2=123.00
A2B2水平组合的平均数=(79+61)/2=70.00
列出A、B因素各水平组合平均数多重比较表,见表12-36。
表12-36 A、B因素各水平组合平均数多重比较表(q法)
水平组合
平均数
-46.5
-70
-93
A2B1
123.00
76.5*
53*
30
A1B2
93.00
46.5*
23
A2B2
70.00
23.5
A1B1
46.50
因为,,由dfe=2与k=2,3,4,查临界q值,并计算出LSR值,见表12-37。
表12-37 q值与LSR值表
dfe
k
q0.05
q0.01
LSR0.05
LSR0.01
2
6.09
14.0
32.70
75.18
2
3
8.28
19.0
44.46
102.03
4
9.80
22.3
52.63
119.75
多重比较结果表明,A2B1显著优于A2B2,A1B1;A1B2显著优于A1B1,其余差异不显著。最优水平组合为A2B1。
从以上分析可知,A因素取A2,B因素取B1,若C因素取C1,则本次试验结果的最优水平组合为A2B1C1。
注意,此例因dfe=2,F检验与多重比较的灵敏度低。为了提高检验的灵敏度,可将F<1的SSB、dfB,SSB×C、dfB×C合并到SSe、dfe中,得合并的误差均方,再用合并误差均方进行F检验与多重比较。这一工作留给读者完成。
第九节 调查设计
在科学研究中,除了进行控制试验外,有时也要进行调查研究。调查研究是对已有的事实通过各种方式进行了解,然后用统计的方法对所得数据进行分析,从而找出其中的规律性。例如,了解畜禽品种及水产资源状况;探索和分析对某种疾病有效的防治规律、措施以及新的检验手段和方法等。由于现场调查立足于生产实际,所以它是研究和解决实际问题的一种重要研究方法。同时,控制试验的研究课题,往往是在调查研究的基础上确定的;试验研究的成果,又必须在其推广应用后经调查得以验证。
为了使调查研究工作有目的、有计划、有步骤地顺利开展,必须事先拟定一个详细的调查计划。调查计划应包括以下几个内容:
(一) 调查研究的目的 任何一项调查研究都要有明确的目的,即通过调查了解什么问题,解决什么问题。例如,家畜健康状况的调查的目的是评定家畜健康水平;畜禽品种资源调查的目的是了解畜禽品种的数量、分布与品种特征特性等情况。同时,调查研究的目的还应该突出重点,一次调查应针对主要问题收集必要的数据,深入分析,为主要问题的解决提出相应的措施和办法。
(二) 调查的对象与范围 根据调查的目的,确定调查的对象、地区和范围,划清调查总体的同质范围、时间范围和地区范围。例如,四川省家禽品种资源调查,调查地区为四川省,调查总体和对象为全省各市、县的家禽,调查时间从2000年1月到2000年12月。
(三) 调查的项目 调查项目的确定要紧紧围绕调查目的。调查项目确定的正确与否直接关系到调查的质量。因此,项目应尽量齐全,重要的项目不能漏掉;项目内容要具体、明确,不能模棱两可。应按不同的指标顺序以表格形式列示出来,以达到顺利完成搜集资料的目的。例如,家禽品种资源调查项目有:种类(鸡、鸭、鹅等)、品种(柴鸡、来航、白洛克等),数量、体重、产蛋性能等项目。
调查项目有一般项目和重点项目之分。一般项目主要是指调查对象的一般情况,用于区分和查找,如畜主姓名、住址及编号等。重点项目是调查的核心内容,如品种资源调查中的品种、数量及生产性能等。
调查表的形式分为一览表和卡片,当调查的指标较少时多采用一览表的形式,它可以填入许多调查动物情况。若调查的内容多而复杂时可采用卡片的形式,一张卡片只填一个对象,以便汇总和整理,或输入计算机。
(四) 样本含量 在抽样调查研究时,样本含量的大小关系到调查结果的精确性。样本含量太大,需耗费较多的人力、物力及资金;样本含量太小,增大了偶然性,使抽样误差大,影响调查结果的精确性。确定样本含量的方法将在本章第十节介绍。
(五) 调查方法 调查分为全面调查和抽样调查两种。全面调查就是对总体的每一个个体逐一调查,其涉及的范围广、时间长、工作量大,因而需耗费大量的人力、物力和时间。
抽样调查是指在全体调查对象中,通过某种方法抽取部分的有代表性的对象作调查,并以样本去推断总体。抽样方法常用的有以下5种:
1、完全随机抽样 首先将有限总体内的所有个体全部编号,然后用抽签或用随机数字表的方法,随机抽取若干个个体作为样本。如欲抽样调查某猪场母猪繁殖性能,应先将母猪逐一编号,再用抽签或随机数字表按所需数量抽样,抽取的每一个体均为调查对象。完全随机抽样适用于个体均匀程度较好的总体。
2、顺序抽样 也称系统抽样或机械抽样。先将有限总体内的每个个体按其自然状态编号,然后根据调查所需的数量,按一定间隔顺序抽样。如对某牧场500只奶山羊进行传染性无乳症的调查,抽查50只。可按编号顺序每隔10只抽一只,但第一个调查号应从1——10中随机选取。此法简便易行,适用于个体分布均匀的总体。
3、分等按比例随机抽样 分等按比例随机抽样又称分层按比例随机抽样。先按某些特征或变异原因将抽样总体分成若干等次(层次),在各等次(层次)内按其占总体的比例随机抽得各等次(层次)的样本,然后将各等次(层次)抽取的样本合并在一起即为整个调查样本。如对某地奶山羊传染性无乳症的调查,经初步了解得知,在欲调查的整个地区中,该病感染率为80%-90%的地区占10%,感染率为60%-80%的地区占60%,感染率为20%-50%的地区占30%。若调查200只山羊,则应采用按比例分等抽样,在感染率为80%-90%的地区随机抽取20只,感染率为60%-80%的地区随机抽取120只,感染率为20%-50%的地区随机抽取60只。分等按比例随机抽样法能有效地降低抽样误差,适用于总体分布不太均匀或个体差异较大的总体。但分等不正确,会影响抽样的精确性。
4、随机群组抽样 此种抽样是把总体划分成若干个群组,然后以群组为单位随机抽样。即每次抽取的不是一个个体,而是一群动物。每次抽取的群体可大小不等,但应对被抽取群体的每一个个体逐一进行调查。随机群组抽样容易组织,节省人力、物力,适用于群体差异较大,分布不太均匀的总体。
5、多级随机抽样 当调查的总体很大、并可以系统分组时,常采用多级随机抽样的方法。例如,调查某城市奶牛305天的1胎产奶量,可采用三级抽样:农场为初级抽样单位,分场为二级抽样单位,奶牛个体为三级抽样单位。多级抽样可以估计各级的抽样误差和探讨合理的抽样方案。
(六) 调查的组织工作 调查研究是一项比较复杂的工作,要动员组织大量的人力,需要一定的经费,安排一定的时间,因此,应做好人员分工、经费预算、调查进程安排、调查表的准备及调查资料的整理等项工作,如此才能保证调查研究工作有计划、有步骤地完成。一般在正式调查前,需进行预调查,以检验调查设计的可行性,并培训参予调查的工作人员,以统一标准和方法。
调查时若发现问题,应立即解决。特别要对资料进行检查,保证资料完整、正确,如发现遗漏、错误应及时补充、纠正。资料检查无误后,应妥善保存,避免丢失。
第十节 样本含量的确定
如果我们要求调查研究或试验结果精确性高,则样本含量就要大,并且越大越好。但若样本太大,就会花费过多的人力、物力和时间。特别是破坏性试验,如畜牧试验中猪、牛羊等动物的屠宰试验。即使不是破坏性试验,如在农村进行活猪体重调查时,抓猪、拴猪也容易发生掉膘现象。所以,在实际调查与试验研究中,却要求样本越小越好。但样本太小必然影响精确性。因此,需要研究在一次调查或试验中如何确定适宜样本含量的问题。
一、调查研究中样本含量的估计
(一) 平均数抽样调查的样本含量估计 目前对调查研究所需样本含量,还没有一个精确的估计方法。根据以往研究,一般要求样本含量占抽样总体的5%为最小量,对变异较小的群体,则可低于5%。斯丹(C,Stein)认为,调查样本含量与调查要求的准确性高低及所研究对象的变异度大小有关。因此,需要提出我们能够接受的允许误差,并初步了解调查指标变异度的大小。
由标本平均数与总体平均数差异显著性检验的t检验公式推出的样本含量计算公式为:
 (12-9)
式中:n为样本含量;
为自由度n-1、两尾概率为的临界t值;
S为标准差,由经验或小型调查估得;
d为允许误差,可根据调查要求的准确性确定;
1-为置信度。
在首次计算时,可先用df=∞时 (当置信度为95%时,tα= t0.05=1.96;置信度为99%时,= t0.01=2.58)值代入,若算得n<30,再用df=n-1的代入计算,直到n稳定为止。
【例12.9】 进行南阳黄母牛体高调查,已测得南阳黄母牛的体高的标准差S=4.07cm,今欲以95%的置信度使调查所得的样本平均数与总体平均数的允许误差不超过0.5cm,问需要抽取多少头黄牛组成样本才合适?
已知:S=4.07,d=0.5,1-=0.95,先取t0.05=1.96,代入(12-9)式,得:
n=1.962×4.072/0.52=254.54≈255 (头)
即对南阳黄母牛体高进行调查,至少需要调查255头,才能以95%的置信度使调查所得样本平均数与总平均数相差不超过5cm。
(二) 百分数抽样调查样本含量估计 如果我们调查的目的是对服从二项分布的总体百分数作出估计,由样本百分数与总体百分数差异显著性检验检验公式推出样本含量计算公式为:
 (12-10)
式中:n为样本含量;
p为总体的百分数;
q=1-p;
为两尾概率为的临界值,0.05=1.96,0.01=2.58;
d为允许误差(-p),为样本百分率,可由经验得出;
1-为置信度。
总体百分数如果事先未知,可先从总体中调查一个样本估计。或令p=0.5进行估算。
【例12.10】 欲了解某地区鸡新城疫感染率,已知道通常感染率约60%,若规定允许误差为3%,取置信度1-=0.95,问至少需要调查多少只鸡?
将 p=0.6,q=1-p=1-0.6=0.4,d=0.03,=1.96,代入 (12-10) 式,得:
n=1.962×0.6×0.4/0.033≈1025 (只)
即至少需要调查1025只鸡,才能以95%的置信度使调查所得的样本百分数与总体百分数相差不超过0.03。
此外,当样本百分数接近0%或100%时,分布呈偏态,应对x作转换。此时估算公式为:
 (12-11)
【例12.11】 某地需抽样调查牛结膜炎发病率,已知通常发病率为2%,若规定允许误差为0.1%,取置信度1-=0.95,问至少需要调查多少头牛?
将 p=0.02,d=0.001,=1.96,代入(12-11)式,得:
(头)
即至少需要调查1505头牛,才能以95%的置信度使估计出的牛结膜炎发病率误差不超过0.1%。
二、试验研究中重复数的估计
(一) 配对设计中重复数的估计 由配对设计t检验公式导出:
 (12-12)
式中:n为试验所需动物对子数,即重复数;
为差数标准误,根据以往的试验或经验估计;
为自由度n-1、两尾概率为的临界t值;
为要求预期达到差异显著的平均数差值();
1-为置信度。
首次计算时以df=∞的值代入计算,若n≤15,则以df=n-1的tα值代入再计算,直到n稳定为止。
【例12.12】 比较两个饲料配方对猪增重的影响,配对设计,希望以95%的置信度在平均数差值达到1.5 kg时,测出差异显著性。根据以往经验=2 kg,问需要多少对试验家畜才能满足要求?
将t0.05(∞)=1.96,=2,=1.5代入 (12-12) 式,得:
n=1.962×22/1.52≈7(对)
因为n<15,再以df=7-1=6时,t0.05=2.477代入 (12-12) 式:
n=2.4772×22/1.52≈11(对)
再以n=11,df=11-1=10时,t0.05=2.2代入 (12-12) 式:
n=2.22×22/1.52≈9(对)
再以n=9,df=8时,t0.05=2.3代入(12-12) 式:
n=2.32×22/1.52≈9(对)
n已稳定为9,故该配对试验至少需9对试验家畜才能满足试验要求。
(二) 非配对试验重复数的估计 对于随机分为两组的试验,若n1=n2,可由非配对t检验公式导出:
 (12-13)
式中:n为每组试验动物头数,即重复数;
为df=2(n-1)、两尾概率为的临界t值;
为标准差,根据以往的试验或经验估计;
()为预期达到差异显著的平均数差值;
1-为置信度。
首次计算时,以df=∞时的值代入计算,若算出的n≤15,则以df=2(n-1)的值代入再计算,直到n稳定为止。
【例12.13】 对【例12.12】,若采用非配对设计,根据以往经验S=2 kg,希望以95%的置信度在平均数差值达到1.5 kg时,测出差异显著性,问每组至少需要多少头试验家畜才能满足要求?
将t0.05(∞)=1.96,=2,=1.5代入 (12-13) 式得:
n=2×1.962×22/1.52=13.66≈14 (头)
以n=14,df=2(14-1)=26的t0.05=2.056代入(12-9) 式:
n=2×2.0562×22/1.52=15.03≈15 (头)
再以n=15,df=2(15-1)=28的t0.05=2.048代入 (12-9) 式:
n=2×2.0482×22/1.52=14.91≈15 (头)
n已稳定在15,即本次试验两组均至少需15头试验家畜才能满足要求。
(三) 多个处理比较试验中重复数的估计 当试验处理数k≥3时,各处理重复数可按误差自由度过dfe≥12的原则来估计。因为当dfe超过12时,F表中的F值减少的幅度已很小了。
1、完全随机设计 由dfe =k(n-1)≥12,得重复数的估算公式为:
n≥12/k+1 (12-14)
由(12-14) 式可知,若k=3,则n≥5;k=4,则n≥4;……。但当处理数k>6时,重复数仍应不少于3。
2、随机单位组设计 以dfe =(k-1) (n-1)≥12,得重复数的估算公式为:
n≥12/(k-1)+1 (12-15)
由公式(12-15)可知,若k=3,则n≥7;k=4,则n≥5;……。但当处理数k>7时,重复数仍应不少于3。
3、拉丁方设计 若要求dfe=(k-1) (k-2)≥12,则重复数(此时等于处理数)≥5。
所以,为了使误差自由度不小于12,则应进行处理数(即重复数)≥5的拉丁方试验,即进行5×5以上的拉丁方试验。当进行处理数为3、4的拉丁方试验时可将3×3拉丁方试验重复6次,4×4拉丁方试验重复2次,以保证dfe=12。
(四) 两个百分数比较试验中样本含量估计 设两样本含量相等:n1=n2=n,n的计算公式可由两个样本百分数差异显著性检验u检验公式推得:
 (12-16)
式中:n为每组试验的动物头数;
为合并百分数,由样本百分数计算,;
为预期达到差异显著的百分数差值;
为自由度等于∞、两尾概率为的临界值:0.05=1.96,0.01=2.58;
1-为置信度。
【例12.14】 两种痢疾菌苗对鸡白痢病的免疫效果,初步试验表明,甲菌苗有效率为22/50 = 44%,乙菌苗有效率为28/50 = 56%,今欲以95%的置信度在样本的百分数差值达到10%时检验出两种菌苗免疫效果有显著差异,问试验时每组至少需接种多少只鸡?
已知=22/50 = 44%,=28/50 = 56%,则两个样本百分数的合并百分数为:
= (22+28) /(50+50)= 0.50,=1-0.50=0.50
将代入 (12-16) 式算得:
n=2×1.962×0.50×0.50/0.102 = 192,08193(只)
即在正式接种试验时,每组至少需接种193只鸡方可满足试验要求。
注意,在配对试验、非配对试验和多个处理比较试验中,同一处理的不同重复意味着同一处理实施在不同的试验单位上。若试验以个体为试验单位,则同一处理的不同重复是指同一处理实施在不同个体上;若以群体为一个试验单位,则同一处理的不同重复是指同一处理实施在不同群体上,这时如果每处理只实施在一个群体上,不管这群动物的数量有多少,实际上相当于只实施在一个试验单位上,只能获得一个观测值,也就无法估计试验误差。
习 题
1,动物试验的任务是什么?动物试验计划包括哪些内容?
2,什么是试验方案?如何拟定一个正确的试验方案?
3,产生试验误差的主要原因是什么?如何避免系统误差、降低随机误差?
4,试验设计应遵循哪三条基本原则?这三条基本原则的相互关系与作用为何?
5,常用的试验设计方法有哪几种?各有何优缺点?各在什么情况下应用?
6,调查研究中常用的抽样方法有哪几种?各适用于什么情况?
7,为了研究不同种类饲料对奶牛产奶量的影响,设置了A、B、C、D、E 5种饲料,用5头奶牛进行试验,试验根据泌乳阶段分为5期,每期4周,采用5×5拉丁方设计。试验结果列于下表,试对其进行方差分析。(饲料间F=20.61)
饲料种类对奶牛产奶量影响的试验结果 (单位:kg)
牛 号
时 期
一
二
三
四
五
Ⅰ
E(300)
A(320)
B(390)
C(390)
D(380)
II
D(420)
C(390)
E(280)
B(370)
A(270)
III
B(350)
E(360)
D(400)
A(260)
C(400)
IV
A(280)
D(400)
C(390)
E(280)
B(370)
V
C(400)
B(380)
A(350)
D(430)
E(320)
8,采用2×2交叉设计以研究降温对奶牛产奶量的影响。设置通风和洒水降温处理A1和对照A2,选用胎次、产犊日期相近的泌乳中期奶牛8头,随机分为B1、B2两组,每组4头,试验分为C1、C2两期,每期4周,试验结果列于下表。试分析通风和洒水对产奶量有无显著影响。(F=19.86或t=4.57)
降温对奶牛产奶量影响的2×2交叉试验结果 (千克/头·日)
时 期
C1
C2
处 理
A1
A2
B1组
1
16.40
16.46
2
19.50
14.20
3
18.45
13.05
4
14.15
13.55
处 理
A2
A1
B2组
1
13.75
20.10
2
15.25
17.05
3
15.05
18.55
4
12.30
13.95
9,有一多因素试验,考察因素A、B、C、D分别有2个水平,同时要考察B与C的交互作用,若用正交表L8(27)安排试验,请作出表头设计。
10,为了研究粗蛋白、消化能和粗纤维三个因素对30—50kg育肥猪增重的影响,用正交表L9(34)安排了正交试验,获得下列资料。对试验结果进行方差分析。(FA和FB均<1,FC=1.61)
试验方案及结果表
试验号
因 素
A
粗蛋白(%)
B
消化能(kJ)
C
粗纤维(%)
日增重(g)
1
1(18)
1(12970)
1(5)
475
2
1(18)
2(11715)
2(7)
394
3
1(18)
3(11460)
3(9)
362
4
2(15)
1(12970)
2(7)
445
5
2(15)
2(11715)
3(9)
392
6
2(15)
3(11460)
1(5)
409
7
3(12)
1(12970)
3(9)
354
8
3(12)
2(11715)
1(5)
378
9
3(12)
3(11460)
2(7)
423
11,欲抽样调查某一地区仔猪断奶体重,已知S=3.4kg,若估计断奶体重的置信度为99%,允许误差为0.5kg,问样本含量多少为宜?(n=308头)
12,某地需抽样调查猪蛔虫感染率。根据以往经验,感染率一般为45%左右。若规定允许误差为3.2%,选定α=0.05,试求出样本含量。(n=929头)
13,某试验比较4个饲料配方对蛋鸡产蛋量的影响,采用随机单位组设计,若以20只鸡为一个试验单位,问该试验至少需要多少只鸡方可满足误差自由度不小于12的要求?(400只)