第十二章 试验设计下一张 主 页 退 出上一张第一节 试验设计概述一、试验设计的基本概念试验设计,广义理解是指试验研究课题设计,也就是整个试验计划的拟定 。主要包括课题的名称、试验目的,研究依据、内容及预期达到的效果,试验方案,试验单位的选取、重复数的确定、试验单位的分组,试验的记录项目和要求,试 验 结 果 的 分析方法,经济效益或社 会 效 益 估 计,已 具 备 的 条 件,
下一张 主 页 退 出上一张需要购置的仪器设备,参加研究人员的分工,试验时间,地点,进度安排和经费预算,成果鉴定,
学术论文撰写等内容 。 而 狭义的理解是指试验单位 ( 如动物试验的畜,禽 ) 的选取,重复数目的确定及试验单位的分组 。 生物统计中的试验设计主要指狭义的试验设计 。
试验设计的目的是避免系统误差,控制、降低试验误差,无偏估计处理效应,从而对样本所在总体作出可靠、正确的推断。
下一张 主 页 退 出上一张二、动物试验的任务在畜牧、水产等试验研究中,通常以动物作为试验对象,因而将所进行的试验统称为动物试验。它的 主要任务在于研究、揭示和掌握动物生长发育规律、及这些规律与饲养管理、
环境条件等的关系 。通过试验,鉴定新的动物品种(系),探索新的饲料配方,饲养管理方法和技术措施,找出其中的规律,并将这些规律应用到生产实践中去,以解决畜牧业、水产业等生产中存在的问题,进一步提高产品的质量和数量,取得更大的经济效益和社会效益,
从而推动畜牧业、水产业等事业的发展。
下一张 主 页 退 出上一张三、动物试验的特点与要求下一张 主 页 退 出上一张
(一)动物试验的特点
1、试验干扰因素多首先 是动物本身存在差异,这种差异是试验中误差的重要来源。 例如,在同一饲养试验中,为使供试动物均匀一致,要选择到遗传来源一致、同年龄、同体重、同性别的动物进行试验是比较困难的; 其次,自然环境如温度、
湿度、光照、通风等存在差异,不能完全控制一致; 第三,饲养管理条件存在差异,如在试验过程中的管理方法、饲养技术、畜舍笼位的安排等不一致; 第四,试验人员操作技术上存在差异,如对试验动物的性状、指标进行测量时,时间、人员和仪器等不完全一致。这些差异对试验产生干扰。
下一张 主 页 退 出上一张
2、试验具有复杂性在畜牧、水产等动物试验中所研究的各种试验对象,它们都有自己的生长发育规律和遗传特性,并 与 环 境、饲养管理等条件密切相关,而 且 这 些因素之间又相互影响,相互 制约,共同作用于供试对象,因而动物试验具有复杂性。
下一张 主 页 退 出上一张
3、试验周期长动物完成一个生活世代的时间较长,特别是大动物,单胎动物,具有明显季节性繁殖的动物更为突出。
下一张 主 页 退 出上一张
(二)动物试验的基本要求由于动物试验具有上述特点,为了保证试验的质量,在试验中应尽可能地控制和排除非试验因素的干扰,合理地进行试验设计、准确地进行试验,从而提高试验的可靠程度,使试验结果在生产实际中真正发挥作用。为此,对动物试验有以下几点要求:
下一张 主 页 退 出上一张
1、试验要有代表性动物试验的代表性包括生物学和环境条件两个方面的代表性。
生物学的代表性,是指作为主要研究对象的动物品种、个体的代表性,并要有足够的数量。例如,进行品种的比较试验时,所选择的个体必须能够代表该品种,不要选择性状特殊的个体,并根据个体均匀程度,在保证试验结果具有一定可靠性的条件下,确定适当的动物数量。
下一张 主 页 退 出上一张环境条件的代表性,是指代表将来计划推广此项试验结果的地区的自然条件和生产条件,如气候、饲料、饲养管理水平及设备等。
代 表 性 决定了试验结果的可利用性,如果一个试验没有充分的代表性,
再好的试验结果也不能推广和应用,就失去了实用价值。
2,试验要有正确性试验的正确性包括试验的准确性和试验的精确性 。
在进行试验的过程中,应严格执行各项试验要求,
将非试验因素的干扰控制在最低水平,以避免系统误差,降低试验误差,提高试验的正确性 。
下一张 主 页 退 出上一张
3,试验要有重演性重演性是指在相同条件下,重复进行同一试验,能够获得与原试验相类似的结果,
即试验结果必须经受得起再试验的检验 。
由于试验受供试动物个体之间差异和复杂的环境条件等因素影响,不同地区或不同时间进行的相同试验,结果往往不同;即使在相同条件下的试验,结果也有一定出入 。
因此,为了保证试验结果的重演性,必须认真选择供试动物,严格把握试验过程中的各个环节,在有条件的情况下,进行多年或多点试验,这样所获得的试验结果才具有较好的重演性 。 下一张 主 页 退 出上一张第二节 动物试验计划一、试验计划的内容及要求进行任何一项科学试验,在试验前必须制定一个科学的、全面的试验计划,以便使该项研究工作能够顺利开展,从而保证试验任务的完成。试验计划的内容一般应包括以下几个方面:
下一张 主 页 退 出上一张
(一)课题 选择 与试验目的科研课题的选择是 整个 研究工作的 第一步。课题选择正确,此项研究工作就有了很好的开端。
一般来说,试验课题通常来自两个方面。
一是国家或企业指定的试验课题,这些试验课题不仅确定了科研选题的方向,而且也为研究人员选题提供了依据,并以此为基础提出最终的目标和题目。
二是研究人员自己选定的试验课题。
下一张 主 页 退 出上一张研究人员自选课题时,首先应该明确为什么要进行这项科学研究,也就是说,应明确研究的目的是什么,解决什么问题,以及在科研和生产中的作用、
效果如何等。
例如,畜禽口服补液盐对雏鸡的影响试验,主要目的在于提高雏鸡的成活率。 若用于肉鸡,则 目的 在于促进增重。
选题时应注意以下几点:
1、实用性要着眼于畜牧、水产等科研和生产中急需解决的问题,同时从发展的观点出发,适当照顾到长远或不久将来可能出现的问题。
2,先进性在了解国内外该研究领域的进展,水平等基础上,选择前人未解决或未完全解决的问题,
以求在理论,观点及方法等方面有所突破 。
下一张 主 页 退 出上一张
3、创新性研究课题要有自己的新颖之处。
4、可行性就是完成科研课题的可能性,无论是从主观条件方面,还是客观条件方面,都要能保证研究课题的顺利进行。
(二)研究依据、内容及预期达到的经济技术指标课题确定后,通过查阅国内外有关文献资料,明确项目的研究意义和应用前景,国内外在该领域的研究概况、水平和发展趋势,理论依据、特色与创新之处 ;明确项目 的具体研究内容 和重点解决的问题,
以及取得成果后的应用推广计划,预期达到的经济技术指标及预期的技术水平等。
下一张 主 页 退 出上一张
(三)试验方案和试验设计方法试验方案是全部试验工作的核心部分,主要包括研究的因素、水平的确定等(具体内容详述于后)。
方案确定后,结合试验条件选择合适的试验设计方法
(具体内容详见 本章第四节至第八节)。
下一张 主 页 退 出上一张
(四)供试动物的数量及要求试验动物或试验对象选择正确与否,
直接关系到试验结果的正确性。因此,试验动物应力求比较均匀一致,尽量避免不同品种、不同年龄、不同胎次、不同性别等差异对试验的影响。新引进的动物应有一个适应和习惯过程。试验动物的数量,
可根据本章第十节介绍的方法来计算。
下一张 主 页 退 出上一张
(五)试验记录的项目与要求为了收集分析结果需要的各个方面资料,应事先以表格的形式列出需观测的指标与要求,例如,饲养试验中的定期称重,定 期 为 1周,10 天或半月称重,称 重 一般在清晨空腹或喂前进行等。
(六)试验结果分析与效益估算试验结束后,对 各阶段取得的资料要进行整理与分析,所以应明确采用统计分析的方法,如 t检验,方差分析,回归与相关分析等 。
如果试验效果显著,同时应计算经济效益 。
如某农场为饲养肉用仔鸡而配制的,维生素添加剂,的 试验,不仅记录分析它对生长发育的效果,而且还计算出喂青料 ( 对照组 )
每 只 鸡分担青料费用和试验组 ( 喂维生素添加剂 ) 每只鸡分担的费用,进而 计 算 出 饲喂维生素添加剂的肉鸡全年可节约的费 。
下一张 主 页 退 出上一张
( 七 ) 已具备的条件和研究进度安排已具备的条件主要包括过去的研究工作基础或预试情况,现有的主要仪器设备,研究技术人员及协作条件,从其他渠道已得到的经费情况等 。 研究进度安排可根据试验的不同内容按日期,分阶段进行安排,
定期写出总结报告 。
(八)试验所需的条件除已具备的条件外,本 试验尚需的条件,如经费、饲料、仪器设备的数量和要求等。
下一张 主 页 退 出上一张
( 九 ) 研究人员分工一般分为主持人,主研人,参加人 。 在有条件的情况下,应以学历,职称较高并有丰富专业知识和实践经验的人员担任主持人或主研人,高,中,初级专业人员相结合,老,中,青相结合,使年限较长的研究项目能够后继有人,保持试验的连续性,稳定性和完整性 。
(十)试验的时间,地点和工作人员试验的时间,地点要安排合适,工作人员要固定,
并参加一定培训,以保证试验正常进行。
下一张 主 页 退 出上一张
(十一)成果鉴定及撰写学术论文这是整个研究工作的最后阶段,凡属国家课题应召开鉴定会议,由同行专家作出评价。个人选择课题可以撰写学术论文发表自己的研究成果,根据试验结果作出理论分析,阐明事物在内在规律,并提出自己的见解和新的学术观点。一些重要的个人研究成果,
也可以申请相关部门鉴定和国家专利。
下一张 主 页 退 出上一张二、试验方案的拟定
(一)试验方案的基本概念试验方案( experimental scheme)
是指根据试验目的与要求而拟定的进行比较的一组试验处理的总称。 试验方案是整个试验工作的核心部分,因此,须周密考虑,慎重拟定。
试验方案按供试因素的多少可区分为单因素试验方案、多因素试验方案。
下一张 主 页 退 出上一张
1,单因素试验方案单因素试验 ( single-factor experiment) 是指整个试验中只比较一个试验因素的不同水平的试验 。 单因素试验方案由该试验因素的所有水平构成 。 这是最基本,最简单的试验方案 。
例如在猪饲料中添加 4种剂量的土霉素,进行饲养试验 。 这是一个有 4个水平的的单因素试验,
添加土霉素的 4种剂量,即该因素的 4个水平就构成了试验方案 。
下一张 主 页 退 出上一张
2、多因素试验方案多 因素试验 是指在同一试验中同时研究两 个 或两个以上试验因素的试验。
多因素试验方案由该试验的所有试验因素的水平组合(即处理)构成。
多因素试验方案分为完全方案和不完全方案两类。
( 1)完全方案在列出因素水平组合(即处理)时,要求每一个因素的每个水平都要碰见一次,这时,水平组合(即处理)数等于各个因素水平数的乘积。
例如以 3种饲料配方对 3个品种肉鸭进行试验。两个因素分别为饲料配方( A)、品种( B)。饲料配方
( A)分为 A1,A2,A3水平,品种( B)分为 B1、
B2,B3水平 。共有 A1B1,A1B2,A1B3,A2B1、
A2B2,A2B3,A3B1,A3B2,A3B3 共 3× 3=9 个水平组合(处理)。这 9个水平组合(处理)就构成了这两个因素的试验方案。
下一张 主 页 退 出上一张根据完全试验方案进行的试验称为 全面试验 。全面试验既能考察试验因素对试验指标的影响,也能考察因素间的交互作用,并能选出最优水平组合,从而能充分揭示事物的内部规律。
多因素全面试验的效率高于多个单因素试验的效率。全面试验的主要不足是,当因素个数和水平数较多时,水平组合(处理)数太多,以至于在试验时,
人力、物力、财力、场地等都难以承受,试验误差也不易控制。因而全面试验宜在因素个数和水平数都较少时应用。
下一张 主 页 退 出上一张
( 2)不完全方案它是将试验因素的某些水平组合在一起形成少数几个水平组合。这种试验方案的目的在于探讨试验因素中某些水平组合的综合作用,
而不在于考察试验因素对试验指标的影响和交互作用。 这种在全部水平组合中挑选部分水平组合获得的方案称为 不完全方案 。根据不完全方案进行的试验称为 部分试验 。动物试验的 综合性试验,正交试验 都属于部分试验。
下一张 主 页 退 出上一张综合性试验 是针对起主导作用且相互关系已基本清楚的因素设置的试验,它的水平组合就是一系列经过实践初步证实的优良水平的配套 。
正交试验 是在全部水平组合中选出有代表性的部分水平组合设置的试验,具体内容见第八节 。
下一张 主 页 退 出上一张
(二)拟定试验方案的要点
1、根据试验的目的、任务和条件挑选试验因素拟定方案时,在正确掌握生产中存在的问题后,
对试验目的、任务进行仔细分析,抓住关键,突出重点。首先 要挑选对试验指标影响较大的关键因素 。若只考察一个因素,则可采用单因素试验。若是考察两个以上因素,则应采用多因素试验。如进行猪饲料添加某种微量元素的饲养试验,在拟定试验方案时,设置一个添加一定剂量微量元素的处理和不添加微量元素的对照,得到 一 个 包 含 2个处理的单因素试验 方案;
下一张 主 页 退 出上一张或设置几个添加不同剂量微量元素的处理和一个不添加微量元素的对照,得到一个包含多个处理的单因素试验方案 。 进行微量元素不同添加剂量与不同品种猪的饲养试验,则安排一个二因素试验方案 。
应该注意,一个试验中研究的因素不宜过多,否则处理数太多,试验过于宠大,试验干扰因素难以控制 。 凡是能用简单方案的试验,就不用复杂方案 。
2,根据各试验因素的性质分清水平间差异各因素水平可根据不同课题,因素的特点及动物的反应能力来确定,以使处理的效应容易表现出来 。
下一张 主 页 退 出上一张
( 1) 水平的数目要适当水平数目过多,不仅难以反映出各水平间的差异,而且加大了处理数;水平数太少又容易漏掉一些好的信息,至使结果分析不全面 。
( 2) 水平间的差异要合理有些因素在数量等级上只需少量的差异就反映出不同处理的效应。如饲料中微量元素的添加等。而有些则需较大的差异才能反应出不同处理效应来,如饲料用量等。
下一张 主 页 退 出上一张
( 3) 试验方案中各因素水平的排列要灵活掌握一般可采用等差法 ( 即等间距法 ),等比法和随机法 3种 。 我们结合肉牛埋植玉米赤霉醇为例说明 。
等差法 是指各相邻两个水平数量之差相等,如赋形剂 ( 不含玉米赤霉醇 ) 各水平的排列为,10mg、
20mg,30mg,其中 20mg为中心水平,向上向下都相隔 10mg。
等比法 是指各相邻两个水平的数量比值相同,如赋形剂各水平的排列为 7.5mg,15mg,30mg,
60mg,相邻两水平之比为 1:2。
下一张 主 页 退 出上一张随机法 是指因素各水平随机排列,如赋形剂各水平排列为 15mg,10mg,40mg,30mg各水平的数量无一定关系 。
3、试验方案中必须设立作为比较标准的对照动物试验 的目的就是通过比较来鉴别处理效应大小、好坏等。为了达到这一目的,试验方案应当包括各试验处理,以及作为比较的对照 。 任何试验都不能缺少对照,否则就不能显示出试验的处理效果 。根据研究的目的与内容,可选择不同的对照形式。
例如,进行添加微量元素的饲养试验,添加微量元素为处理,不添加添加微量元素为对照,这样的对照为 空白对照 。进行几微量元素添加量的比较试 验,
各个处理可 互为对照,不必再设对照 。 在对某种动物作生理生化指标检验时,所得数据是否异常应与动物的正常值作比较,动物的正常值就是所谓的 标准对照 。 在杂交试验中,要确定杂交优势的大小,必须以亲本作对照,这就是试验对照 。 另外,还有一种 自身对照,即处理与对照在同一动物上进行,如病畜用药前与用药后生理指标的比较等 。
下一张 主 页 退 出上一张
4、试验处理(包括对照)之间应遵循唯一差异原则这是指在进行处理间比较时,除了试验处理不同外,其它所有条件应当尽量一致或相同,使其具有可比性,才能使处理间的比较结果可靠。例如,进行不同品种猪的育肥比较试验,各 参 试猪除了品种不同外,其它如性别、年龄、体重等应一致,饲料和饲养管理等条件都应相同,才能准确评定品种的优劣。
下一张 主 页 退 出上一张
5、有的试验要设置预试期所谓预试就是正式试验开始之前根据试验设计进行的过渡试验,为正式试验做好准备工作 。
通 过 预饲,使供试的动物适应新的环境,对不合适的试验动物进行调整和淘汰,同时也使试验人员熟悉操作方法和程序。
预试期的长短,可根据具体情况决定,一般以
10-20天为宜 。预试期间供试动物的数量应适当多于正式试验所需的数量 。通过对预试所得到的数据资料的分析,还可检查试验设计的科学性,合理性和可行性,发现问题及时解决。
下一张 主 页 退 出上一张第三节 试验设计的基本原则一、试验误差的来源
(一)试验误差在畜牧、水产等科学研究中,试验处理常常受到各种非处理因素的影响,使试验处理的效应不能真实地反映出来,也就是说,试验所得到的观测值,不但有处理的真实效应,而且还包含其它因素的影响,这就出现了实测值与真值的差异,这种差异在数值上的表现称为试验误差。
下一张 主 页 退 出上一张由于产生误差的原因和性质不同,试验误差可分为 系统误差 ( 片面误差 ),随机误差
( 抽样误差 ) 两类 。
(二)动物试验中误差的来源系统误差影响试验的准确性,随机误差影响试验的精确性 。为了提高试验的准确性与精确性,即提高试验的正确性,必须避免系统误差,降低随机误差 。为了 有效地避免系统误差,降低随机误差,必 须了解试验误差的来源。动物试验误差的主要来源有:
下一张 主 页 退 出上一张
1,供试动物固有的差异是指各处理的供试动物在遗传和生长发育上或多或少的差异性 。 如试验动物的遗传基础,性别,年龄,
体重不同,生理状况,生产性能的不一致等,即使是全同胞间或同一个体不同时期间也会存在差异 。
2,饲养管理不一致所引起的差异指在试验过程中各个处理在饲养技术,管理方法及日粮配合等在质量上的不一致,以及在观测记载时由于工作人员的认真程度,掌握的标准不同或测量时间,仪器的不同等所引起的偏差 。
3,环境条件的差异主要指那些不易控制的环境的差异,如栏舍温度,
湿度,光照,通风不同所引起的差异等 。
4、由一些随机因素引起的偶然差异如偶然疾病的侵袭、饲料的不稳定等引起的差异。
二、试验设计的基本原则下一张 主 页 退 出上一张在动物试验中,误差主要是由于供试动物个体之间的差异和饲养管理不一致所造成 。针对误差的主要来源,应采取切实有效的措施,如尽量选择初始条件一致的试验动物,尽量做到饲养管理一致,认真细致进行观测记载等,力求避免系统误差,降低随机误差。
统计学上通过合理的试验设计既能获得试验处理效应与试验误差的无偏估计,也能控制和降低随机误差,提高试验的精确性。在试验设计时必须遵循以下基本原则。
下一张 主 页 退 出上一张
(一) 重复重复是指试验中同一处理实施在两个或两个以上的试验单位上。
在动物试验中,一头动物可以构成一个试验单位,有时一组动物也可构成一个试验单位。
设置重复的主要作用在于估计试验误差和降低试验误差 。如 果 同一处理只实施在一个试验单位上,那么只能得到一个观测值,则无从看出差异,
因而无法估计试验误差的大小。只有当同一处理实施在两个或两个以上的试验单位上,获得两个或两个以上的观测值时,才能估计出试验误差。
下一张 主 页 退 出上一张在第四章 已 经 讲 到,样 本 标 准误与标准差的关系是
nSS x?
即平均数抽样误差的大小与重复次数的平方根成反比,故 重复次数多可以降低试验误差 。但在实际应用时,重复数太多,试验动物的初始条件不易控制一致,也不一定能降低误差。重复数的多少可根据试验的要求和条件而定。如果供试动物个体间差异较大,重复数应多些; 差 异 较小,重复数可少些。
(二)随机化随机化是指在对试验动物进行分组时必须使用随机的方法,使供试动物进入各试验组的机会相等,以避免试验动物分组时试验人员主观倾向的影响。这是在试验中排除非试验因素干扰的重要手段,目的是为了获得无偏的误差估计量 。
下一张 主 页 退 出上一张
( 三 ) 局部控制 ─ 试验条件的局部一致性在试验中,当试验环境或试验单位差异较大时,
仅根据重复和随机化两原则进行设计不能将试验环境或 试 验 单 位 差 异 所 引 起 的变异从试验误差中分离出来,因 而 试 验 误 差 大,试 验 的 精 确 性 与检 验的灵敏度低 。 为 解 决 这 一 问 题,在 试 验 环境 或 试 验单位差异大的 情 况 下,可 将 整 个 试 验环 境 或 试 验 单 位 分 成 若 干 个 小 环 境 或 小组,在 小 环 境 或小组内使 非 处 理 因 素 尽 量 一致,这就是 局部控制 。 每 个 比 较 一 致 的 小 环 境下一张 主 页 退 出上一张或小组,称为 单位组 ( 或 区组 ) 。 因为单位组之间的差异可在方差分析时从试验误差中分离出来,所以局部控制能较好地降低试验误差 。
重复,随 机 化,局 部 控 制 称 为 费 雪
( R.A.Fisher) 三原则,是试验设计中必须遵循的原则 。
试验设计三原则的关系和作用见 图 12-1所示 。
下一张 主 页 退 出上一张第四节 完全随机设计完 全 随机设计是 根据试验处理数将全部供试动物随机地分成若干组,然后再按组实施不同处理的设计 。这种设计保证每头供试验动物都有相同机会接受任何一种处理,而不受试验人员主观倾向的影响。
在畜牧、水产等试验中,当试验条件特别是试验动物的初始条件比较一致时,可采用完全随机设计。这种设计应用了重复和随机两个原则,因此能使试验结果受非处理因素的影响基本一致,真实反映出试验的处理效应。
下一张 主 页 退 出上一张随机分组的方法有抽签法和用随机数字表法 。 下面举例说明用随机数字表将试验动物分组的方法 。
下一张 主 页 退 出上一张一、完全随机的分组方法
(一)两个处理比较的分组
【 例 12.1】 现有同品种,同性别,同年龄,
体重相近的健康绵羊 18只,试用完全随机的方法分成甲,乙两组 。
下一张 主 页 退 出上一张首先将 18只绵羊依次编为 1,2,,
18号,然后从随机数字表中任意一个随机数字开始,向任一方向(左、右、上、下)连续抄下 18个(两位)数字,分别代表 18只绵羊。
令随机数字中的单数为甲组,双数为乙组 。如从随机数字表( Ⅰ )第 12行第 7列的 16开始向右连续抄下 18个随机数字填入表第二行。
随机分组结果:
甲组,2 4 5 6 12 14 16
乙组,1 3 7 8 9 10 11 13 15
17 18
下一张 主 页 退 出上一张甲组比乙组少 4只,需要从乙组调整两只到甲组 。 仍用随机的方法进行调整 。 在前面 18个随机数字后再接着抄下两个数字,71,23,分别除以
11( 调整时乙组的绵羊只数 ),10( 调整 1只绵羊去甲组后乙组剩余的绵羊只数 ),余数为 5,3,
则把分配于乙组的第 5只绵羊 ( 9号 ) 和余下 10只的第 3只绵羊 ( 7号 ) 分到甲组 。 调整后的甲,乙两组绵羊编号为:
下一张 主 页 退 出上一张
(二)三个以上处理比较的分组
【 例 12.2】 设有同品种、同性别、体重相近的健康仔猪 18头,按体重大小依次编为 1,2、
3,…,18号,试用完全随机的方法,把它们等分成甲、乙、丙三组。
由随机数字表( Ⅱ )第 10列第 2个数 94开始,
向下依次抄下 18个数,填入下表第 2横行。
下一张 主 页 退 出上一张一律以 3(处理数)除各随机数字,若余数为 1,即将该动物归于甲组;余数为 2,归入乙组;商为 0或余数为 0,归入丙组。 结果归入甲组者 8头,乙组 5头,丙组 5头 。 各组头数不等,应将甲组多余的 2头调整 1头给乙组,1头给丙组。调整甲组的 2头动物仍然采用随机的方法。从随机数字 25后面接下去抄 二个数 63、
62,然后分别以 8(甲组原分配 8头),7除之
(注意:若甲组原分配有 9头,须将多余的 3头调整给另外两组,则抄下三个随机数,分别以
9,8,7除之),得第一个余数为 7,第二个下一张 主 页 退 出上一张余数为 6,则把原分配在甲组的 8头仔猪中第 7
头仔猪即 14号仔猪改为乙组;把甲组中余下的
7 头 仔 猪 中的第 6头仔猪即 12号仔猪改为丙组。这样各组的仔猪数就相等了 。调整后各组的仔猪编号如下:
下一张 主 页 退 出上一张用完全随机的方法将试验动物分为四组,
五组或更多的组,方法相同 。
二、试验结果的统计分析对于完全随机试验的统计分析,由于试验处理数不同,统计分析方法也不同 。
( 一 ) 处理数为 2 两个处理的完全随机设计也就是非配对设计,对其试验结果采用非配对设计的 t检验法进行统计分析 。
下一张 主 页 退 出上一张
(二)处理数大于 2 若获得的资料各处理重复数相等,则采用各处理重复数相等的单因素试验资料方差分析法分析;若在试验中,因受到条件的限制或供试动物出现疾病、死亡等使获得的资料各处理重复数不等,则采用各处理重复数不等的单因素试验资料方差分析法分析。
三、完全随机设计的优缺点完全随机设计是一种最简单的设计方法,主要优缺点如下:
( 一 ) 完全随机设计的主要优点
1、设计容易 处理数与重复数都不受限制,适用于试验条件、环境、试验动物差异较小的试验。
下一张 主 页 退 出上一张
2、统计分析简单 无论所获得的试验资料各处理重复数相同与否,都可采用 t检验或方差分析法进行统计分析。
(二)完全随机设计的主要缺点
1、由于未应用试验设计三原则中的局部控制原则,非 试 验因素的影响被归入试验误差,试验误差较大,试验的精确性较低。
2、在试验条件、环境、试验动物差异较大时,不宜采用此种设计方法。
下一张 主 页 退 出上一张第五节 随机单位组设计随机单位组设计 ( randomized block
design) 也称为随机区组 ( 或窝组 ) 设计 。
它是根据局部控制的原则,如将同窝,同性别,体重基本相同的动物划归一个单位组,
每一单位组内的动物数等于处理数,并将各单位组的试验动物随机分配到各处理组,这种设计称为随机单位组设计 。
下一张 主 页 退 出上一张随 机 单 位 组 设计要 求 同 一 单位组内 各 头
(只)试验动物尽可能一致,不同单位组间的试验动物允许存在差异,但每一单位组内试验动物的随机分组要独立进行,每种处理在一个单位组内只能出现 一次。
例如,为 了比较 5种不同中草药饲料添加剂对猪增重的效果,从 4头母猪所产的仔猪中,每窝选出性别相同、体重相近的仔猪各 5头,共 20头,组成 4个单位组,设计时每一单位组有仔猪 5头,每头仔猪随机地喂给不同的饲料添加剂。这就是处理数为 5,单位组数为 4的随机单位组设计。
下一张 主 页 退 出上一张一、随机单位组设计方法
(一)随机单位组设计的分组方法在畜牧、水产等动物试验中,除把初始条件相同的动物如同窝仔畜划为同一单位组外,还可根据实际情况,把不同试验场、同一场内不同畜舍、不同池塘等划分为单位组。下面结合例子说明分组的方法。
【 例 12.3】 前面提到的 5种中草药饲料添加剂分别以 A1,A2,A3,A4,A5表示,供试 4窝仔猪分别按体重依次编号为,1-5号为第 Ⅰ 组,6-10号为第 Ⅱ 组,
11-15号为第 Ⅲ 组,16-20为第 Ⅳ 组。试按随机单位组设计将试验仔猪分组。
下一张 主 页 退 出上一张下一张 主 页 退 出上一张先从随机数字表 ( Ⅱ ) 第 15行,第 11列
15开始,向下依次抄下 16个随机数字 ( 舍弃
00),每抄 4个数字留一空位,见表 12-2第 2行 。
再将同一单位组内前 4个随机数字依次除以 5、
4,3,2( 最大数 5为处理数 ),根据余数 ( 余数为 0者,以除数代之 ) 确定每一单位组内各供试仔猪喂给的添加剂种类 。 如第一单位组中,
第一个余数是 5,则将第 1号仔猪喂给 5种添加剂列于第 5位的 A5添加剂;第二个余数是 2,则将第 2号仔猪喂给剩下的 4种添加剂 A1,A2,A3、
A4列于第二位的 A2添加剂;第三个余数是 3,
则将第 3 号 仔 猪 喂 给 剩 下 的 3 种下一张 主 页 退 出上一张添加剂 A1,A3,A4列于第三 位的 A4添加剂;第四个余数是 1,则将第 4号仔猪喂给剩下的 2种添加剂 A1、
A3列于第 1位的 A1添加剂;第 5号仔猪只能喂给剩下的 A3添加剂 。 用同样方法一一确定其它单位组内各仔猪喂给的添加剂,结果见表 12-3。
表 12-2 5种饲料添加剂试验随机单位组设计试验动物分组表
( 二 ) 配对设计分组方法 配对设计是处理数为 2的随机单位组设计 。 在进行配对设计时,配成对子的两个试验单位必须符合配对要求:配成对子的两个试验单位的初始条件尽量一致,不同对子间试验单位的初始条件允许有差异,每一个对子就是试验处理的一个重复,然后将配成对子的两个试验单位随机地分配到两个处理组中 。
例如,现有同一品种的供试家畜 18头,分别将性别、年龄相同,体重相似的两头家畜配成对子,
共 9对,编号为 1-9号。试用随机方法将每个对子中的两头家畜分到甲、乙两个处理组中。
下一张 主 页 退 出上一张由随机数字表 ( Ⅰ ) ( 附表 13) 的第 16行,
第 8列 20开始,向右依次抄下 9个随机数字,将单数组中配对的第一头家畜归入甲组,第二头家畜归入乙组;双数组中配对的第一头家畜归入乙组,第二头家畜归入甲组,则 9对家畜分组如下:
下一张 主 页 退 出上一张二、试验结果的统计分析
(一)随机单位组试验结果的统计分析随机单位组试验结果的统计分析采用方差分析法。分析时将单位组也看成一个因素,连同试验因素一起,按两因素单独观测值的方差分析法进行。这里需要说明的是,假定单位组因素与试验因素不存在交互作用。
若记试验处理因素为 A,处理因素水平数为 a;单位组因素为 B,单位组数为 b,对试验结果进行方差分析的数学模型为:
下一张 主 页 退 出上一张
( i=1,2,…,a;j=1,2,… b) ( 12-1)
式中 μ 为总体均数,
为第 i处理的效应,
为第 j单位组效应 。
处理效应 通常是固定的,且有 ;
单位组效应 通常是随机的 。
为随机误差,相互独立,且都服从 。
ijjiijx
i?
j?
i?
0
1

a
i i
j?
ij?
),0( 2?N
下一张 主 页 退 出上一张平方和与自由度的划分式为:
SST = SSA+SSB+Sse
df T = dfA+dfB+dfe (12-2)
对于 【 例 12.3】,通过按表 12-3试验动物分组结果进行试验后,各号仔猪增重结果列于表 12-3。
下一张 主 页 退 出上一张
1、计算各项平方和与自由度矫正数
C=x2../ab=46892/5× 4=1099336.05
总平方和
SST=∑x2ij-C=( 2052+1682+… +2822)
- 1099336.05=35890.95
处理间平方和
SSA=∑x 2i./b- C =(8252+9252+… +11372)/4
-1099336.05=27267.2
下一张 主 页 退 出上一张单位组间平方和
SSB=∑x 2.j/a- C
=(11522+10472+… +12232)/5
-1099336.05=5530.15
误差平方和
SSe=SST-SSA-SSB=35890.95
-27267.2-5530.15=3093.6
总自由度 dfT=ab-1=5× 4-1=19
处理间自由度 dfA=a-1=5-1=4
单位组间自由度 dfB=b-1=4-1=3
误差自由度 dfe=dfT-dfA-dfB
=(a-1)(b-1)
=( 5-1) (4-1)=12
2,列出方差分析表,进行 F检验下一张 主 页 退 出上一张下一张 主 页 退 出上一张因为 FA> F0.01(4,12),FB> F0.01(3,12),表明饲料添加剂对仔猪增重影响极显著,因而还需要对各不同饲料添加剂平均数间差异的显著性进行检验。
单位组间的变异,虽然 F值已达到 0.01显著水平,
由于我们采取的是随机单位组设计,已将它从误差中分离出来,达到了局部控制的目的。单位组间的变异即使显著,一般也不作单位组间的多重比较。
3,饲料添加剂间的多重比较下一张 主 页 退 出上一张标准误为,
0 2 8.848.2 5 7 nMSS ex
下一张 主 页 退 出上一张由 dfe=12、秩次距 k=2,3,4,5,查附表 5得临界 q值,q0.05,q0.01,并与 相乘求得 LSR值,列于表 12-6。
下一张 主 页 退 出上一张
xS
xS
由表 12-6看出,除 A5与 A3,A1与 A4之间差异不显著,A2与 A1间差异显著外,其余平均数间差异极显著,说明采用 A5,A3添加剂仔猪平均增重极显著高于 A2,A1,A4添加剂; A2显著高于 A1,极显著高于 A4; A4添加剂对仔猪增重效果最差 。
(二)配对设计试验结果的统计分析试验结果为计量资料时,采用第五章所介绍的配对设计 t检验法进行统计分析。
下一张 主 页 退 出上一张三、随机单位组设计的优缺点
(一)随机单位组设计的主要优点
1,设计与分析方法简单易行 。
2,由于随机单位组设计体现了试验设计三原则,
在对试验结果进行分析时,能将单位组间的变异从试验误差中分离出来,有效地降低了试验误差,因而试验的精确性较高 。
3、把条件一致的供试动物分在同一单位组,再将同一单位组的供试动物随机分配到不同处理组内,
加大了处理组之间的可比性。
下一张 主 页 退 出上一张
( 二 ) 随机单位组设计的主要缺点当处理数目过多时,各单位组内的供试动物数数目也过多,要使各单位组内供试动物的初始条件一致将有一定难度,因而在随机单位组设计中,处理数以不超过 20为宜 。
配对设计是处理数为 2的随机单位组设计,其优点是结果分析简单,试验误差通常比非配对设计小,
但由于试验动物配对要求严格,不允许将不满足配对要求的试验动物随意配对 。
第六节 拉丁方设计拉丁方设计是从横行和直列两个方向进行双重局部控制,使得横行和直列两向皆成单位组的设计 。 在拉丁方设计中,每一行或每一列都成为一个完全单位组,而每一处理在每一行或每一列都只出现一次,
也就是说,在拉丁方设计中,试验处理数
=横行单位组数 =直列单位组数 =试验处理的重复数 。
下一张 主 页 退 出上一张在对拉丁方设计试验结果进行统计分析时,
由于能将横行,直列二个单位组间的变异从试验误差中分离出来,因而拉丁方设计的试验误差比随机单位组设计小,试验精确性比随机单位组设计高 。
一、拉丁方简介
(一) 拉丁方 以 n 个 拉 丁 字 母
A,B,C,为元素,列出一个 n阶方阵,
若这 n个拉丁方字母在这 n 阶方阵的每一行、
每一列都出现、且只出现一次,则称该 n阶方阵 为 n× n阶 拉 丁方 。
下一张 主 页 退 出上一张例如:
A B B A
B A A B
为 2× 2阶拉丁方,2× 2阶拉丁方只有这两个 。
A B C
B C A
C A B
为 3× 3阶拉丁方。
下一张 主 页 退 出上一张第一行与第一列的拉丁字母按自然顺序排列的拉丁方,叫 标准型拉丁方 。 3× 3阶标准型拉丁方只有上面介绍的 1种,4× 4阶标准型拉丁方有 4种,5× 5阶标准型拉丁方有 56种 。 若变换标准型的行或列,可得到更多种的拉丁方 。
在进行拉丁方设计时,可从上述多种拉丁方中随机选择一种;或选择一种标准型,随机改变其行列顺序后再使用 。
下一张 主 页 退 出上一张
(二)常用拉丁方在 动 物 试 验 中,最 常 用 的 有 3× 3,
4× 4,5× 5,6× 6阶拉丁方。下面列出部分标准型拉丁方,供进行拉丁方设计时选用。
下一张 主 页 退 出上一张下一张 主 页 退 出上一张二、拉丁方设计方法下面结合具体例子说明拉丁方设计方法 。
【 例 12.4】 为了研究 5种不同 温度 对蛋鸡产蛋量的影响,将 5栋鸡舍的温度设为 A,B、
C,D,E,把各栋鸡舍的鸡群的产蛋期分为 5
期,由于各 鸡群 和 产蛋期 的不同对产蛋量有较大的影响,因此采用拉丁方设计,把鸡群和产蛋期作为单位组设置,以便控制这两个方面的系统误差 。
拉丁方设计步骤如下:
下一张 主 页 退 出上一张
( 一 ) 选择拉丁方选择拉丁方时应根据试验的处理数即横行,
直列单位组数先确定采用几阶拉丁方,再选择标准型拉丁方或非标准型拉丁方 。
此例因试验因素为温度,处理数为 5;将鸡群作为直列单位组因素,直列单位组数为 5;将产蛋期作为横行单位组因素,横行单位组数亦为 5,即试验处理数,直列单位组数,横行单位组数均为 5,则应选取 5× 5阶拉丁方 。 本例选取前面列出的第 2个 5× 5标准型拉丁方,即:
A B C D E
B A D E C
C E B A D
D C E B A
E D A C B
( 二 ) 随机排列在选定拉丁方之后,若是非标准型,则可直接由拉丁方中的字母获得试验设计 。 若是标准型拉丁方,还应按下列要求对直列,横行和试验处理的顺序进行随机排列 。
3× 3标准型拉丁方,直列随机排列,再将第二和第三横行随机排列 。
4× 4标准型拉丁方,先随机选择 4个标准型拉丁方中的一个;然 后 将 所 有的直列和第二、三、四横行随机排列,或 者 将 所 有的直列、横行随机排列;最后将处理随机排列。
下一张 主 页 退 出上一张
5× 5标准型拉丁方,先随机选择 4个标准型拉丁方中的一个;然后将所有的直列,横行及处理都随机排列 。
下面对选定的 5× 5标准型拉丁方进行随机排列 。 先从随机数字表 ( Ⅰ ) 第 22行,第 8列
97开始,向右连续抄录 3个 5位数,抄录时舍去
,0”,,6以上的数,和重复出现的数,抄录的
3个五位数字为,13542,41523,34521。 然后将上面选定的 5× 5拉丁方的直列,横行及处理按这 3个五位数的顺序重新随机排列 。
下一张 主 页 退 出上一张
1,直列随机 将拉丁方的各直列顺序按
13542顺序重排 。
2、横行随机 再 将直列重排后的拉丁方的各横行按 41523顺序重排。
下一张 主 页 退 出上一张
3,把 5种不同温度按第三个 5位数 34521顺序排列 即,A=3,B=4,C=5,D=2,E=1,
从而得出 5× 5拉丁方设计,如表 12-8所示 。
注:括号内的数字表示温度的编号由表 12-8可以看出,第一鸡群在第 Ⅰ 个产蛋期用第 2种温度,第二鸡群在第 Ⅰ 个产蛋期用第 1种温度,
等等 。 试验应严格按设计实施 。
三、试验结果的统计分析拉丁方设计试验结果的分析,是 将两个单位组因素与试验因素一起,按 三因素试验单独观测值的方差分析法进行,但 应 假 定 3个因素之间不存在交互作用。将横行单位组因素记为 A,直列单位组因素记为
B,处理因素记为 C,横行单位组数、直列单位组数与处理数记为 r,对拉丁方试验结果进行方差分析的数学模型 为:
下一张 主 页 退 出上一张
( i=j=k=1,2,?,r) ( 12-3)
式中:
μ 为总平均数;
ai 为第 i横行单位组效应;
为第 j直列单位组效应,
为第 k处理效应。
单位组效应 ai,通常是随机的,处理效应 通常是固定的,且有 ;
为随机误差,相互独立,且都服从 N( 0,σ2)。
)()()( kijkjikijx
j?
)(k?j?
)(k?
0
1
)(

k
k
)(kij?
注意:
k不是独立的下标,因为 i,j一经确定,
k亦随之确定。
平方和与自由度划分式为:
SST = SSA+SSB+SSC+SSe
dfT = df A+ dfB+ dfc+dfe ( 12-4)
【 例 12.4】 的试验结果如表 12-8所示。
下一张 主 页 退 出上一张现对表 12-8资料进行方差分析:
1、计算各项平方和与自由度矫正数 C=x2../r2=5492/52=12056.04
总平方和 SST =Σx 2ij(k)-C=232+212+…… +192
-12056.04= 12157-12056.04
=100.96 下一张 主 页 退 出上一张横行平方和
SS A =Σx 2i./r- C
=(1082+1052+…… +1042)/5-12056.04
=27.36
直列平方和
SS B =Σx 2.j/ r – C
=(1092+1082+…… +1062)/5-12056.04
=22.16
处理平方和
SSC =Σx 2(k)/ r - C
=(1162+1142+…… +1012)/5-12056.04
=33.36
下一张 主 页 退 出上一张总自由度 dfT= r 2-1=52-1=24
横行自由度 dfA= r-1=5-1=4
直列自由度 dfB= r-1=5-1=4
误差平方和
SS e= SS T- SS A- SS B- SS c
=100.96-33.36-27.36-22.16
= 18.08
处理自由度 dfC= r-1=5-1=4
误差自由度 dfe=dfT-dfA-dfB-dfC
=(r-1)( r-2)=(5-1)(5-2)=12
2、列出方差分析表,进行 F检验下一张 主 页 退 出上一张经 F检验,产蛋期间和鸡群间差异显著,温度间差异极显著 。 因在拉丁方设计中,横行,
直列单位组因素是为了控制和降低试验误差而设置的非试验因素,即使显著一般也不对单位组间进行多重比较 。 下面对不同温度平均产蛋量间作进行多重比较 。
3,多重比较列出多重比较表,见表 12-11。
下一张 主 页 退 出上一张标准误为,
由 dfe=12和 k=2,3,4,5从 q值表查得临界
q值,q0.05和 q0.01,并与 相乘得 值,列于表 12-12。
55.055.1 nMSS ex
xS?LSR
下一张 主 页 退 出上一张多重比较结果表明:温度 A,B,D平均产蛋量显著地高于 E,即第 3,4,2种温度的平均产蛋量显著高于第 1种温度的平均产蛋量,其余之间差异不显著 。 第 1种和第 5种温度平均产蛋量最低 。
下一张 主 页 退 出上一张四、拉丁方设计的优缺点
(一)拉丁方设计的主要优点
1、精确性高拉丁方设计在不增加试验单位的情况下,
比随机单位组设计多设置了一个单位组因素,
能将横行和直列两个单位组间的变异从试验误差中分离出来,因而试验误差比随机单位组设计小,试验的精确性比随机单位组设计高。
2、试验结果的分析简便下一张 主 页 退 出上一张
(二)拉丁方设计的主要缺点因为在拉丁设计中,横行单位组数,直列单位组数、试验处理数与试验处理的重复数必须相等,所以处理数受到一定限制。若处理数少,则重复数也少,估计试验误差的自由度就小,影响检验的灵敏度;若处理数多,则重复数也多,横行、直列单位组数也多,导致试验工作量大,且同一单位组内试验动物的初始条件亦难控制一致。因此,拉丁方设计一般用于 5-8个处理的试验。在采用 4个以下处理的拉丁方设计时,为了使估计误差的自由度不少于 12,可采用,复拉丁方设计,,
即同一个拉丁方试验重复进行数次,并将试验数据合并分析,以增加误差项的自由度。
下一张 主 页 退 出上一张应当注意,在进行拉丁方试验 时,某些单位组因素,如奶牛的泌乳阶段,试验因素的各处理要逐个地在不同阶段实施,如果前一阶段有残效,在后一阶段的试验中,就 会 产 生系统误差而影响试验的准确性。此时应根据实际情况,安排适当的试验间歇期以消除残效。另外,还要注意,横行、直列单位组因素与试验因素间不存在交互作用,否 则 不能采用拉丁方设计。
下一张 主 页 退 出上一张
*第八节 正交设计在动物试验研究中,对于单因素或两因素试验,因其因素少,试验的设计,实施与分析都比较简单 。但在实际工作中,常常需要同时考察 3个或 3个以上的试验因素,若进行全面试验,则试验的规模将很大,往往因试验条件的限制而难于实施 。 正 交设计就是安排多因素试验,寻求最优水平组合 的一种高效率试验设计方法。
下一张 主 页 退 出上一张一、正交设计的概念及原理
(一 ) 正交设计的基本概念正交设计是利用正交表来安排与分析多因素试验的一种设计方法。它利用从试验的全部水平组合中,挑选部分有代表性的水平组合进行试验,通过对这部分试验结果的分析了解全面试验的情况,找出最优的水平组合。
下一张 主 页 退 出上一张例如,影响某品种鸡的生产性能有 3个因素:
A因素是饲料配方,设 A1,A2,A3 3个水平; B因素是光照,设 B1,B2,B3 3个水平; C因素是温度,
设 C1,C2,C3 3个水平。这是一个 3因素 3水平的试验,
各因素的水平之间全部可能的组合有 27种 。
如果试验方案包含各因素的全部水平组合,即进行全面试验,可以分析各因素的效应,交互作用,也可选出最优水平组合。这是全面试验的优点 。但全面试验包含的水平组合数较多,工作量大,由于受试验场地、试验动物、经费等限制而难于实施 。
若试验的主要目的是 寻 求 最 优水平组合,则可利用正交 设 计来安排试验。
正交设计的 基本特点 是,用部分试验来代替全面试验,通过对部分试验结果的分析,了解全面试验的情况。
正因为正交试验是用部分试验来代替全面试验,它 不 可 能像全面试验那样对各因素效应、交互作用一一分析; 当交互作用存在时,
有可能出现交互作用的混杂 。虽然正交设计有上述不足,但它能通过部分试验找到最优水平组合,因 而 很 受实际工作者青睐。
下一张 主 页 退 出上一张如对于上述 3因素 3水平试验,若不考虑交互作用,
可利用正交表 L9(34)安排,试验方案仅包含 9个水平组合,就能反映试验方案包含 27个水平组合的全面试验的情况,找出最佳的生产条件 。
(二 ) 正交设计的基本原理在试验安排中,每个因素在研究的范围内选几个水平,就好比在选优区内打上网格,如果网上的每个点都做试验,就是全面试验。如上例中,3个因素的选优区可以用一个立方体表示 (图 12-2),3个因素各取 3
个水平,把立方体划分成 27个格点,反映在 图 12-2上就是立方体内的 27个,.”。若 27个网格点都试验,就是全面试验,其试验方案如表 12-20所示 。
下一张 主 页 退 出上一张
3 因 素 3 水 平 的 全 面试验水平组合数为
33=27,4 因素 3水平的全面试验水平组合数为
34=81,5因素 3水平的全面试验水平组合数为
35=243,这在动物试验中是不可能做到的。
下一张 主 页 退 出上一张正交设计就是从选优区全面试验点 ( 水平组合 ) 中挑选出有代表性的部分试验点 ( 水平组合 ) 来进行试验 。 图 12-2中标有试验号的九个,(·)”,就是利用正交表 L9(34)从 27个试验点中挑选出来的 9个试验点 。 即:
(1)A1B1C1 (2)A2B1C2 (3)A3B1C3
(4)A1B2C2 (5)A2B2C3 (6)A3B2C1
(7)A1B3C3 (8)A2B3C1 (9)A3B3C2
下一张 主 页 退 出上一张上述选择,保证了 A因素的每个水平与 B因素,C
因素的各个水平在试验中各搭配一次 。对于 A,B,C
3个因素来说,是在 27个全面试验点中选择 9个试验点,仅 是全面试验的 三分之一。
从图 12-2中可以看到,9个试验点在选优区中分布是均衡的,在立方体的每个平面上,都恰是 3个试验点;在立方体的每条线上也恰有一个试验点。
9个试验点均衡地分布于整个立方体内,有很强的代表性,能 够比较全面地反映选优区内的基本情况。
下一张 主 页 退 出上一张二、正交表及其特性
(一 ) 正交表由于正交设计安排试验和分析试验结果都要 用 正交表,因此,我们先对正交表作一介绍。
表 12-20是一张正交表,记号为 L8(27),其中,L”
代表正交表; L右下角的数字,8”表示有 8行,用这张正交表安排试验包含 8个处理 (水平组合 ) ;括号内的底数,2” 表示因素的水平数,括号内 2的指数,7”表示有 7列,用这张正交表最多可以安排 7个 2水平因素。
下一张 主 页 退 出上一张下一张 主 页 退 出上一张常用的正交表已由数学工作者制定出来,供进行正交设计时选用 。 2水平正交表除 L8(27)外,还有 L4(23)、
L16(215)等; 3水平正交表有 L9(34),L27(213)…… 等
( 详见附表 14及有关参考书 ) 。
(二 ) 正交表的特性任何一张正交表都有如下两个特性:
1,任一列中,不同数字出现的次数相等例如 L8(27)中不同数字只有 1和 2,它们各出现 4次;
L9(34)中不同数字有 1,2和 3,它们各出现 3次 。
下一张 主 页 退 出上一张
2,任两列中,同一横行所组成的数字对出现的次数相等例如 L8(27)中 (1,1),(1,2),(2,1),(2,2)各出现两次; L9(34) 中 (1,1),(1,2),(1,3),(2,1),(2,2),(2,
3),(3,1),(3,2),(3,3)各出现 1次。即每个因素的一个水平与另一因素的各个水平互碰次数相等,表明任意两列各个数字之间的搭配是均匀的。
下一张 主 页 退 出上一张根据以上两个特性,我们用正交表安排的试验,具有 均衡分散 和 整齐可比 的特点。
所谓均衡分散,是指用正交表挑选出来的各因素水平组合在全部水平组合中的分布是均匀的 。 由 图 12-2可以看出,在立方体中,任一平面内都包含 3 个,(·)”,任一直线上都包含 1个,(·)”,因此,这些点代表性强,能够较好地反映全面试验的情况。
下一张 主 页 退 出上一张整齐可比是指 每 一个因素的各水平间 具 有可 比性。因为正交表中每一因素的任一水平下都均衡地包含着另外因素的各个水平,当比较某因素不 同 水平时,
其它 因素 的 效 应 都 彼 此 抵消。如在
A,B,C 3个因素中,A因素的 3个水平
A1,A2,A3 条件下各有 B,C 的 3 个不同水平,即:
在这 9个水平组合中,A因素各水平下包括了 B,C因素的 3个水平,虽然搭配方式不同,
但 B,C皆处于同等地位,当比较 A因素不同水平时,B因素不同水平的效应相互抵消,C因素不同水平的效应也相互抵消 。 所以 A因素 3个水平间具有可比性 。 同样,B,C因素 3个水平间亦具有可比性 。
下一张 主 页 退 出上一张
(三 ) 正交表的类别
1,相同水平正交表 各列中出现的最大数字相同的正交表称为相同水平正交表 。 如 L4(23)、
L8(27),L12(211)等各列中最大数字为 2,称为两水平正交表; L9(34),L27(313)等各列中最大数字为 3,称为 3水平正交表 。
2,混合水平正交表 各列中出现的最大数字不完全相同的正交表称为混合水平正交表 。
如 L8(4× 24)表中有一列最大数字为 4,有 4列最大数字为 2。 也就是说该表可以安排一个 4水平因素和 4个 2水平因 素 。 再如 L16(44× 23),
L16(4× 212)等都混合水平正交表 。
下一张 主 页 退 出上一张三、正交设计方法
【 例 12.7】 在进行矿物质元素对架子猪补饲试验中,考察补饲配方、用量、食盐 3个因素,每个因素都有 3个水平。试安排一个正交试验方案。
正交设计一般有以下几个步骤:
(一 ) 确定因素和水平影响试验结果的因素很多,我们不可能把所有影响因素通过一次试验都予以研究,只能根据以往的经验,
挑选和确定若干对试验指标影响最大、有较大经济意义而又了解不够清楚的因素来研究。同时还应根据实际经验和专业知识,定出各因素适宜的水平,列出因素水平表。 【 例 12.7】 的因素水平表如表 12-22所示。
下一张 主 页 退 出上一张
(二 ) 选用合适的正交表确定了因素及其水平后,根据因素,水平及需要考察的交互作用的多少来选择合适的正交表 。 选用正交表的原则是:既要能安排下试验的全部因素,又要使部分水平组合数 ( 处理数 ) 尽可能地少 。 一般情况下,试验因素的水平数应恰好等于正交表记号中括号内的底数;因素的个数 ( 包括交互作用 ) 应不大于正交表记号中括号内的指数;各因素及交互作用的自由度之和要小于所选正交表的总自由度,以便估计试验误差 。 若各因素及交互作用的自由度之和等于所选正交表总自由度,则可采用有重复正交试验来估计试验误差 。
此例有 3个 3水平因素,若不考察交互作用,则各因素自由度之和为因素数个数
× (水平数 -1)=3(3-1)=6,小于 L9(34)总自由度 9-1=8,故可以选用 L9(34);若要考察交互作用,则应选用 L27(313),此时所安排的试验方案实际上是全面试验方案 。
下一张 主 页 退 出上一张
(三 ) 表头设计所谓表头设计,就是把挑选出的因素和要考察的交互作用分别排入正交表的表头适当的列上。
在不考察交互作用时,各因素可随机安排在各列上;若考察交互作用,就应按该正交表的交互作用列表安排 各 因 素与交互作用。
此例不考察交互作用,可将矿物质元素补饲配方 (A)、用量 (B)和食盐 (C)依次安排在 L9(34)的第 1,2,3列上,第 4 列为空列,见表 12-23。
(四 ) 列出试验方案把正交表中安排各因素的每个列 (不包含欲考察的交互作用列 )中的每个数字依次换成该因素的实际水平,就得到一个正交试验方案。表
12-23就是 [例 12.4] 的正交试验方案。
下一张 主 页 退 出上一张根据表 12-23,1 号试验处理是 A1B1C1,即配 方
I、用量 15g、食盐为 0; 2号试验处理是 A1B2C2,即配方 II,用 量 25g,食 盐 为 4g,… ; 9号试验处理为
A3B3C2,即配方 III、用量 20g、食盐 4g。
四、正交试验结果的统计分析若各号试验处理都只有一个观测值,则称之为单独观测值正交试验;若各号试验处理都有两个或两个以上观测值,则称之为有重复观测值正交试验 。
下面分别介绍单独观测值和有重复观测正交试验结果的方差分析 。
下一张 主 页 退 出上一张
(一 ) 单独观测值正交试验结果的方差分析对 【 例 12.7】 用 L9(34)安排试验方案后,
各号试验只进行一次,试验结果 (增重 )列于表
12-24。 试对其进行方差分析 。
该次试验的 9个观测值总变异由 A因素,B
因素,C因素及误差变异四部分组成,因而进行方差分析时平方和与自由度的划分式为:
SST = SSA+SSB+SSC+SSe
dfT = dfA + dfB + dfC + dfe (12-6)
下一张 主 页 退 出上一张用 n表示试验 (处理 )号数; a,b,c表示 A,B,C
因素各水平重复数; ka,kb,kc表示 A,B,C因素的水平数。本例,n=9,a=b=c=3,ka=kb=kc=3。
下一张 主 页 退 出上一张表 12-24中,Ti为各因素同一水平试验指标
( 增重 ) 之和 。
如 A因素第 1水平
T1=y1+y2+y3=63.4+68.9+64.9=197.2,
A因素第 2水平
T2=y4+y5+y6=64.3+70.2+65.8=200.3,
A因素第 3水平
T3=y7+y8+y9=71.4+69.5+73.7=214.6;
下一张 主 页 退 出上一张
B因素第 1水平
T1=y1+y4+y7=63.4+64.3+71.4=199.1,……,
B因素第 3水平
T3=y3+y6+y9=64.9+65.8+73.7=204.4。
同理可求得 C因素各水平试验指标之和。
为各因素同一水平试验指标的平均数 。
如 A因素第 1水平
=197.2/3=65.7333,
A因素第 2水平
=200.3/3=66.7667,
A因素第 3水平
=214.6/3=71.5333。
同理可求得 B,C因素各水平试验指标的平均数 。
1x
2x
x
3x
下一张 主 页 退 出上一张
1,计算各项平方和与自由度矫正数
C = T2/n = 612.12/9 = 41629.6011
总平方和
SST =Σy2-C
=63.42+68.92+…+73.7 2 - 41629.6011
=101.2489
A因素平方和
SSA=Σ /a-C
=(197.22+200.32+214.62)/3 –
41629.6011=57.4289
B因素平方和
SSB = Σ /b-C
=(199.12+208.62+204.42)/3 -
41629.6011 =15.1089
2AT
2BT
C因素平方和
SSC=ΣT2C/c-C
=(198.72+206.92+206.52)/3 –
误差平方和
SSe=SST-SSA-SSB-SSC
=101.2489-57.4289-15.1089 -
下一张 主 页 退 出上一张
41629.6011 =14.2489
14.2489 =14.4622
总自由度 dfT =n-1=9-1=8
A因素自由度 dfA =ka-1=3-1=2
B因素自由度 dfB =kb-1=3-1=2
C因素自由度 dfC =kc-1=3-1=2
误差自由度 dfe = dfT-dfA-dfB-dfC
= 8-2-2-2 = 2
2,列出方差分析表,进行 F检验下一张 主 页 退 出上一张
F 检验结果表明,三个因素对增重的影响都不显著 。 究其原因可能是本例试验误差大且误差自由度小 (仅为 2),使检验的灵敏度低,从而掩盖了考察因素的显著性 。 由于各因素对增重影响都不显著,不必再进行各因素水平间的多重比较 。 此时,可直观地从表 12-17中选择平均数大的水平 A3,B3,C2组合成最优水平组合
A3B3C2。
下一张 主 页 退 出上一张上述无重复正交试验结果的方差分析,其误差是由,空列,来估计的 。 然而,空列,并不空,实际上是被未考察的交互作用所占据 。
这种误差既包含试验误差,也包含交互作用,
称为 模型误差 。 若交互作用不存在,用模型误差估计试验误差是可行的;若因素间存在交互作用,则模型误差会夸大试验误差,有可能掩盖考察因素的显著性 。 这时,试验误差应通过重复试验值来估计 。 所以,进行正交试验最好能有二次以上的重复 。 正交试验的重复,可采用完全随机或随机单位组设计 。
下一张 主 页 退 出上一张
(二 ) 有重复观测值正交试验结果的方差分析
【 例 12.7】 试验重复了两次,且重复采用随机单位组设计,试验结果列于表 12-26。 试对其进行方差分析 。
用 n表示试验 (处理 )号数,r表示试验处理的重复数 。 a,b,c,ka,kb,kc的意义同上 。 此例 n=9、
r=2,a=b=c=3,ka=kb=dc=3。
下一张 主 页 退 出上一张下一张 主 页 退 出上一张对于有重复,且重复采用随机单位组设计的正交试验,总变异可以划分为处理间,单位组间和误差变异三部分,而处理间变异可进一步划分为 A因素,B因素,C因素与模型误差变异四部分 。 此时,平方和与自由度划分式为:
SST=SSt+SSr+SSe2
dfT = dft + dfr + dfe2
而 SSt=SSA+SSB+SSC+SSe1
dft = dfA + dfB + dfC + dfe1
于是 SST=SSA+SSB+SSC+SSr+SSe1+SSe2
dfT = dfA + dfB + dfC + dfr + dfe1 + dfe2 (12-7)
下一张 主 页 退 出上一张式中,SSr为单位组间平方和; SSe1为模型误差平方和; SSe2为试验误差平方和; SSt为处理间平方和; dfr,dfe1,dfe2,dft为相应自由度。
注意,对于重复采用完全随机设计的正交试验,在平方和与自由度划分式中无 SSr,dfr
项。
1、计算各项平方和与自由度矫正数
C =T2/ r n = 1347.42/2× 9
=100860.3756
下一张 主 页 退 出上一张总平方和
SST=Σy2-C
=63.42+68.92+…+92.8 2 - 100860.3756
=1978.5444
单位组间平方和
SSr=ΣT2r/n-C
=(612.12+735.32)/9 - 100860.3756
=843.2355
处理间平方和
SSt = ΣT2t / r - C
= (130.82+156.12+…+166.5 2)/2 -100860.3756
= 819.6244
A因素平方和
SSA = ΣT2A / ar - C
= (418.12+441.72+487.62)/3× 2 -100860.3756
= 416.3344
B因素平方和
SSB =ΣT2B / br - C
=(411.82+475.52+430.12)/3× 2 -100860.3756
=185.2077
C因素平方和
SSC = ΣT2C / cr - C
= (423.92+473.22+450.32)/3× 2 -100860.3756
= 202.8811
模型误差平方和
SSe1 = SSt – SSA – SSB - SSC
=819.6244-416.3344-185.2077 -202.8811
=15.2012
试验误差平方和
SSe2 =SST – SSr - SSt
=1978.5444-843.2355 - 819.6244
=315.6845
总自由度 dfT=rn-1=2× 9-1=17
单位组自由度 dfr=r-1=2-1=1
处理自由度 dft=n-1=9-1=8
A因素自由度 dfA=ka-1=3-1=2
B因素自由度 dfB=kb-1=3-1=2
C因素自由度 dfC=kc-1=3-1=2
下一张 主 页 退 出上一张模型误差自由度 dfe1= dft-dfA-dfB-dfC
= 8-2-2-2-2 = 2
试验误差自由度 dfe2=dfT-dft =17-1-8 = 8
2,列出方差分析表,进行 F检验下一张 主 页 退 出上一张首先检验 MSe1与 MSe2差异的显著性,若经 F检验不显著,则可将其平方和与自由度分别合并,计算出合并的误差均方,进行 F检验与多重比较,以提高分析的精度;若 F检验显著,说明存在交互作用,二者不能合并,此时只能以 MSe2进行 F检验与多重比较。
本例 MSe1/ MSe2<1,MSe1与 MSe2差异不显著,故将误差平方和与自由度分别合并计算出合并的误差均方
MSe,即
MSe = ( SSe1+ SSe2)/(dfe1+ dfe2)
= (15.2012+315.6845)/(2+8)
= 33.09
并用合并的误差均方 MSe进行 F检验与多重比较。
下一张 主 页 退 出上一张
F检验结果表明,矿物质元素配方对架子猪增得有显著影响,另外两个因素作用不显著;
二个单位组间差异极显著 。
3,A因素各水平平均数的多重比较表 12-28 A因素各水平平均数多重比较表
(SSR法 ) 单位,kg
下一张 主 页 退 出上一张因为,
由 dfe=10和 k=2,3,查得 SSR值并计算出 LSR
值列于表 12-30。
表 12-29 SSR值与 LSR值表多重比较结果表明,A因素 A3水平的平均数显著或极显著地高于 A2,A1; A2与 A1间差异不显著。
35.2)23/(09.33/ arMSS ex
下一张 主 页 退 出上一张此例因模型误差不显著,可以认为因素间不存在显著的交互作用。可由 A,B,C因素的最优水平组合成最优水平组合。 A因素的最优水平为 A3;因为 B,C
因素水平间差异均不显著,故可任选一水平。如 B,C
因素选择使增重达较高水平的 B2及 C2,则得最优水平组合为 A3B2C2,即配方 III、用量 25克、食盐 4克。
若模型误差显著,表明因素间交互作用显著,则应进一步试验,以分析因素间的交互作用 。
下一张 主 页 退 出上一张五、因素间有交互作用的正交设计与分析在实际研究中,有时试验因素之间存在交互作用 。 对于既考察因素主效应又考察因素间交互作用的正交设计,除表头设计和结果分析与前面介绍略有不同外,其它基本相同 。
【 例 12.8】 某一种抗菌素的发酵培养基由
A,B,C 3种成分组成,各有两个水平,除考察 A,B,C三个因素的主效外,还考察 A与 B、
B与 C的交互作用。试安排一个正交试验方案并进行结果分析。
下一张 主 页 退 出上一张
(一 ) 选用正交表,作表头设计 由于本试验有 3个两水平的因素和两个交互作用需要考察,
各项自由度之和为,3× (2-1)+2× (2-1)× (2-
1)=5,因此可选用 L8(27)来安排试验方案 。
正交表 L8(27)中有基本列和交互列之分,基本列就是各因素所占的列,交互列则为两因素交互作用所占的列 。 可利用 L8(27)二列间交互作用列表 (见表 12-30)来安排各因素和交互作用 。
下一张 主 页 退 出上一张下一张 主 页 退 出上一张如果将 A因素放在第 1列,B 因素 放在第 2
列,查表 12-30可知,第 1列与第 2列的交互作用列是第 3列,于是将 A与 B 的交互作用 A× B放在第 3列。这样第 3列不能再安排其它因素,以免出现“混杂”。然后将 C放在第 4列,查表
12-30 可知,B× C应放在第 6列,余下列为空列,如此可得表头设计,见表 12-31。
下一张 主 页 退 出上一张
(二 ) 列出试验方案根据表头设计,将 A,B,C各列对应的数字,1”,,2”换成各因素的具体水平,得出试验方案列于表 12-32。
下一张 主 页 退 出上一张下一张 主 页 退 出上一张
(三 ) 结果分析 按表 12-33所列的试验方案进行试验,其结果见表 12-34。
表中 Ti,计算方法同前。此例为单独观测值正交试验,总变异划分为 A因素,B因素,C
因素,A× B,B× C、与误差变异 5部分,平方和与自由度划分式为:
SST=SSA+SSB+SSC+SSA× B+SSB× C+SSe
dfT = dfA + dfB + dfC +dfA× B + dfB× C + dfe
(12-8)
ix
下一张 主 页 退 出上一张
1,计算各项平方和与自由度矫正数
C=T2/n=6652/8=55278.1250
总平方和
SST=Σy2-C
=552+382+…+61 2 -55278.1250
=6742.8750
A因素平方和
SSA=ΣT2A/a-C=(2792+3862)/4
-55278.1250=1431.1250
B因素平方和
SSB=ΣT2B/b-C
=(3392+3262)/4-55278.1250
=21.1250
C因素平方和
SSC=ΣT2C/c-C
=(3532+3122)/4-55278.1250
=210.1250
A× B平方和
SSA× B=ΣT2A× B/4-C
=(2332+4322)/4 -55278.1250
=4950.1250
下一张 主 页 退 出上一张
B× C平方和
SSB× C =ΣT2B× C /4 - C
= (3272+3382)/4 - 55278.1250
= 15.1250
误差平方和
SSe = SST-SSA-SSB-SSA× B-SSB× C
= 6742.8750-1431.1250-21.1250
-210.1250-4950.1250-15.1250
=115.2500
下一张 主 页 退 出上一张总自由度 dfT=n-1=8-1=7
各因素自由度 dfA=dfB=dfC=2-1=1
交互作用自由度 dfA× B=dfB× C
=(2-1)(2-1)=1
误差自由度 dfe=dfT-dfA-dfC-dfA× B -dfB× C
=7-1-1-1-1-1
=2
下一张 主 页 退 出上一张
*试验结果以对照为 100计。
2,列出方差分析表,进行 F检验下一张 主 页 退 出上一张
F检验结果表明,A因素和交互作用 A× B显著,B,C因素及 B× C交互作用不显著。因交互作用 A× B显著,应对 A与 B的水平组合进行多重比较,以选出 A与 B的最优水平组合。
3,A与 B各水平组合的多重比较先计算出 A与 B各水平组合的平均数:
A1B1水平组合的平均数 =(55+38)/2=46.50
A1B2水平组合的平均数 =(97+89)/2=93.00
A2B1水平组合的平均数 =(122+124)/2=123.00
A2B2水平组合的平均数 =(79+61)/2=70.00
下一张 主 页 退 出上一张列出 A,B因素各水平组合平均数多重比较表,见表 12-35。
下一张 主 页 退 出上一张因为由 dfe=2与 k=2,3,4,查临界 q值,并计算出 LSR值,见表 12-36。
37.52/625.572/ ex MSS
多重比较结果表明,A2B1显著优于 A2B2,
A1B1; A1B2显著优于 A1B1,其余差异不显著 。
最优水平组合为 A2B1。
从以上分析可知,A因素取 A2,B因素取 B1,
若 C因素取 C1,则本次试验结果的最优水平组合为 A2B1C1。
下一张 主 页 退 出上一张注意,此例因 dfe=2,F检验与多重比较的灵敏度低 。 为了提高检验的灵敏度,可将
F<1的 SSB,dfB,SSB× C,dfB× C合并到 SSe、
dfe中,得合并的误差均方,再用合并误差均方进行 F检验与多重比较 。 这一工作留给读者完成 。
下一张 主 页 退 出上一张第九节 调查设计在科学研究中,除了进行控制试验外,
有时也要进行调查研究。调查研究是对已有的事实通过各种方式进行了解,然后用统计的方法对所得数据进行分析,从而找出其中的规律性。例如,了解畜禽品种及水产资源状况;探索和分析对某种疾病有效的防治规律、措施以及新的检验手段和方法等。由于现场调查立足于生产实际,所以它是研究和下一张 主 页 退 出上一张解决实际问题的一种重要研究方法 。 同时,控制试验的研究课题,往往是在调查研究的基础上确定的;试验研究的成果,又必须在其推广应用后经调查得以验证 。
为了使调查研究工作有目的、有计划、有步骤地顺利开展,事先必须拟定一个详细的调查计划。调查计划应包括以下几个内容:
下一张 主 页 退 出上一张
(一 ) 调查研究的目的任何一项调查研究都要有明确的目的,即通过调查了解什么问题,解决什么问题 。 例如,家畜健康状况的调查 的目的是评定家畜健康水平; 畜禽品种资源调查 的目的是了解畜禽品种的数量,分布与品种特征特性等情况 。 同时,调查研究的目的还应该突出重点,
一次调查应针对主要问题收集必要的数据,深入分析,
为主要问题的解决提出相应的措施和办法 。
下一张 主 页 退 出上一张
(二 ) 调查的对象与范围根据调查的目的,确定调查的对象,地区和范围,划清调查总体的同质范围,时间 范围和地区范围。例如,四川省家禽品种资源调查,调查地区为四川省,调查总体和对象为全省各市、县的家禽,调查时间从 2000年 1月到 2000年 12月。
下一张 主 页 退 出上一张
(三 ) 调查的项目调查项目的确定要紧紧围绕调查目的 。 调查项目确定的正确与否直接关系到调查的质量 。 因此,项目应尽量齐全,重要的项目不能漏掉;项目内容要具体,
明确,不能模棱两可 。 应按不同的指标顺序以表格形式列示出来,以达到顺利完成搜集资料的目的 。
例如,家禽品种资源调查项目有:种类 (鸡,鸭,
鹅等 ),品种 (柴鸡,来航,白洛克等 ),数量,体重,
产蛋性能等项目 。
下一张 主 页 退 出上一张调查项目有一般项目和重点项目之分 。 一般项目主要是指调查对象的一般情况,用于区分和查找,如畜主姓名,住址及编号等 。 重点项目是调查的核心内容,如品种资源调查中的品种,数量及生产性能等 。
调查表的形式分为一览表和卡片,当调查的指标较少时多采用一览表的形式,它可以填入许多调查动物情况 。 若调查的内容多而复杂时可采用卡片的形式,一张卡片只填一个对象,
以便汇总和整理,或输入计算机 。
下一张 主 页 退 出上一张
(四 ) 样本含量在抽样调查研究时,样本含量的大小关系到调查结果的精确性 。 样本含量太大,需耗费较多的人力,
物力及资金;样本含量太小,抽样误差大,影响调查结果的精确性 。 确定样本含量的方法将在本章第十节介绍 。
(五 ) 调查方法调查分为全面调查和抽样调查两种。 全面调查 就是对总体的每一个个体逐一调查,其涉及的范围广、
时间长、工作量大,因而需耗费大量的人力、物力和时间。
下一张 主 页 退 出上一张抽样调查 是指在全体调查对象中,通过某种方法抽取部分的有代表性的对象作调查,并以样本去推断总体 。 抽样方法常用的有以下 5种:
1,完全随机抽样首先将有限总体内的所有个体全部编号,然后用抽签或用随机数字表的方法,随机抽取若干个个体作为样本。如欲抽样调查某猪场母猪繁殖性能,应先将母猪逐一编号,再用抽签或随机数字表按所需数量抽样,抽取的每一个体均为调查对象。完全随机抽样适用于个体均匀程度较好的总体。
下一张 主 页 退 出上一张
2,顺序抽样也称系统抽样或机械抽样 。 先将有限总体内的每个个体按其自然状态编号,然后根据调查所需的数量,
按一定间隔顺序抽样 。 如对某牧场 500只奶山羊进行传染性无乳症的调查,抽查 50只 。 可按编号顺序每隔
10只抽一只,但第一个调查号应从 1—— 10中随机选取 。 此法简便易行,适用于个体分布均匀的总体 。
下一张 主 页 退 出上一张
3,分等按比例随机抽样分等按比例随机抽样又称分层 按比例随机抽样 。 先按某些特征或变异原因将抽样总体分成若干等次 (层次 ),在各等次 (层次 )
内按其占总体的比例随机抽得各等次 (层次 )的样本,然后将各等次 ( 层次 ) 抽取的样本合并在一起即为整个调查样本 。
如对某地奶山羊传染性无乳症的调查,经初步了解得知,
在欲调查的整个地区中,该病感染率为 80%-90%的地区占 10%,
感染率为 60%-80%的地区占 60%,感染率为 20%-50%的地区占
30%。 若调查 200只山羊,则应采用按比例分等抽样,在感染率为 80% - 90% 的 地 区 随 机 抽 取 20只,
感染率为 60%-80% 的地区随机抽取 120只,感染率为 20%-50%的地区随机抽取 60只。分等按比例随机抽样法能有效地降低抽样误差,适用于总体分布不太均匀或个体差异较大的总体。但分等不正确,会影响抽样的精确性。
4,随机群组抽样此种抽样是把总体划分成若干个群组,然后以群组为单位随机抽样 。 即每次抽取的不是一个个体,而是一群动物 。 每次抽取的群体可大小不等,但应对被抽取群体的每一个个体逐一进行调查 。 随机群组抽样容易组织,节省人力,物力,适用于群体差异较大,
分布不太均匀的总体 。
下一张 主 页 退 出上一张
5,多级随机抽样当调查的总体很大,并可以系统分组时,
常采用多级随机抽样的方法 。 例如,调查某城市奶牛 305天的 1胎产奶量,可采用三级抽样:
农场为初级抽样单位,分场为二级抽样单位,
奶牛个体为三级抽样单位 。 多级抽样可以估计各级的抽样误差和探讨合理的抽样方案 。
下一张 主 页 退 出上一张
(六 ) 调查的组织工作调查研究是一项比较复杂的工作,要动员组织大量的人力,需要一定的经费,安排一定的时间,因此,
应做好人员分工,经费预算,调查进程安排,调查表的准备及调查资料的整理等项工作,如此才能保证调查研究工作有计划,有步骤地完成 。 一般在正式调查前,需进行预调查,以检验调查设计的可行性,并培训参予调查的工作人员,以统一标准和方法 。
调查时若发现问题,应立即解决 。 特别要对资料进行检查,保证资料完整,正确,如发现遗漏,错误应及时补充,纠正 。 资料检查无误后,应妥善保存,
避免丢失 。
下一张 主 页 退 出上一张第十节 样本含量的确定如果我们要求调查研究或试验结果精确性高,则样本含量就要大,并且越大越好。但若样本太大,就会花费过多的人力,物力 和 时间。特别是破坏性试验,如畜牧试验中猪、牛羊等动物的屠宰试验。即使不是破坏性试验,
如在农村进行活猪体重调查时,抓猪、拴猪也容易发生掉膘现象。所以,在实际调查与试验研究中,却要求样本越小越好。但样本太小必然影响精确性。因此,需要研究在一次调查或试验中如何确定适宜样本含量的问题。
下一张 主 页 退 出上一张一、调查研究中样本含量的估计
(一 ) 平均数抽样调查的样本含量估计目前对调查研究所需样本含量,还没有一个精确的估计方法。根据以往研究,一般要求样本含量占抽样总体的 5%为最小量,对变异较小的群体,则可低于 5%。斯丹 (C,Stein)认为,
调查样本含量与调查要求的准确性高低及所研究对象的变异度大小有关。因此,需要提出我们能够接受的允许误差,并初步了解调查指标变异度的大小。 下一张 主 页 退 出上一张由样本平均数与总体平均数差异显著性检验的 t检验公式推出的样本含量计算公式为:
( 12-9)
式中,n为样本含量;
为自由度 n-1,两尾概率为 a的临界 t值;
S为标准差,由经验或小型调查估得;
δ为允许误差,可根据调查要求的准确性确定;
1-a为置信度 。
222 / dStn
t
)(x
下一张 主 页 退 出上一张在首次计算时,可先用 df =∞时 (当置信度为 95%时,tα= t0.05=1.96;置信度为 99%时,
tα = t0.01=2.58)值代入,若算得 n<30,再用
df=n-1的 ta代入计算,直到 n稳定为止 。
【 例 12.9】 进行南阳黄母牛体高调查,已测得南阳黄母牛的体高的标准差 S=4.07cm,今欲以 95%的置信度使调查所得的样本平均数与总体平均数的允许误差不超过 0.5cm,问需要抽取多少头黄牛组成样本才合适?
下一张 主 页 退 出上一张已知,S = 4.07,δ= 0.5,1-a = 0.95,先 取
t0.05=1.96,代入 (12-9)式,得:
n =1.962× 4.072 / 0.52 = 254.54 ≈ 255 (头 )
即对南阳黄母牛体高进行调查,至 少 需 要 调查
255头,才能以 95%的置信度使调查所得样本平均数与总平均数相差不超过 5cm。
(二 ) 百分数抽样调查样本含量估计如果我们调查的目的是对服从二项分布的总体百分数作出估计,由样本百分数与总体百分数差异显著性检验检验公式推出样本含量计算公式为:
下一张 主 页 退 出上一张
(12-10)
式中,n为样本含量;
ρ 为总体的百分数;
q =1-p;
为两尾概率为 a的临界 u值:
u0.05=1.96,u0.01=2.58;
δ为允许误差 ( -p),为样本百分率,
可由经验得出;
1-a为置信度。
22 / dpqun

u
p?
下一张 主 页 退 出上一张
p?
总体百分数如果事先未知,可先从总体中调查一个样本估计 。 或令 ρ =0.5进行估算 。
【 例 12.10】 欲了解某地区鸡新城疫感染率,已知道通常感染率约 60%,若规定允许误差为 3%,取置信度 1-a=0.95,问至少需要调查多少只鸡?
将 ρ =0.6,q=1-p=1-0.6=0.4,δ=0.03,
ua=1.96,代入 (12-10) 式,得:
n =1.962× 0.6× 0.4/0.033≈1025 (只 )
下一张 主 页 退 出上一张即至少需要调查 1025只鸡,才能以 95%的置信度使调查所得的样本百分数与总体百分数相差不超过 0.03。
此外,当样本百分数接近 0%或 100%时,
分布呈偏态,应对 x作 转换 。 此时估算公式为:
(12-11)
【 例 12.11】 某地需抽样调查牛结膜炎发病率,已知通常发病率为 2%,若规定允许误差为 0.1%,取置信度 1-a=0.95,问至少需要调查多少头牛?
1sin? x
21 )]1/(s in/3.57[ ppdun
下一张 主 页 退 出上一张将 ρ =0.02,δ=0.001,ua=1.96,代入 (12-
11)式,得:
即至少需要调查 1505头牛,才能以 95%的置信度使估计出的牛结膜炎发病率误差不超过
0.1%。
二、试验研究中重复数的估计
(一 ) 配对设计中重复数的估计由配对设计 t检验公式导出:
(12-12)
1 5 0 5]})02.01(02.0/001.0[s in/96.13.57{ 21n
222 / dStn
d
下一张 主 页 退 出上一张式中:
n 为试验所需动物对子数,即重复数;
Sd 为差数标准误,根据以往的试验或经验估计;
ta 为自由度 n-1,两尾概率为 a的临界 t值;
为要求预期达到差异显著的平均数差值
( );
1-a 为置信度 。
d
21 xx?
下一张 主 页 退 出上一张首次计算时以 df = ∞的 ta值代入计算,若
n≤15,则以 df = n-1的 tα值代入再计算,直到 n
稳定为止 。
【 例 12.12】 比较两个饲料配方对猪增重的影响,配对设计,希望以 95%的置信度在平均数差值达到 1.5 kg时,测出差异显著性 。根据以往经验 sd=2 kg,问需要多少对试验家畜才能满足要求?
下一张 主 页 退 出上一张将 t0.05(∞)=1.96,sd=2,=1.5代入 (12-12) 式,
得:
n = 1.962× 22/1.52≈7(对)
因为 n<15,再以 df = 7-1=6时,t0.05=2.477
代入 (12-12) 式:
n = 2.4772× 22/1.52≈11( 对 )
再以 n =11,df =11-1=10时,t0.05=2.228代入 (12-12) 式:
n = 2.2282× 22/1.52≈9(对)
再以 n=9,df=8时,t0.05=2.306代入 (12-12)
式:
n = 2.3062× 22/1.52≈9(对 )
d
下一张 主 页 退 出上一张
n已稳定为 9,故该配对试验至少需 9对试验家畜才能满足试验要求 。
(二 ) 非配对试验重复数的估计对于随机分为两组的试验,若 n1=n2,可由非配对 t
检验公式导出:
( 12-13)
式中,n 为每组试验动物头数,即重复数;
ta 为 df = 2(n-1),两尾概率为 a的临界 t值;
S 为标准差,根据以往的试验或经验估计;
( ) 为预期达到差异显著的平均数差值;
1-a为置信度 。
22122 )/(2 xxStn
21 xx?
下一张 主 页 退 出上一张首次计算时,以 df =∞时的 ta值代入计算,
若算出的 n≤15,则以 df =2(n-1)的 ta值代入再计算,直到 n稳定为止 。
【 例 12.13】 对 【 例 12.12】,若采用非配对设计,根据以往经验 S=2 kg,希望以 95%
的置信度在平均数差值达到 1.5 kg时,测出差异显著性,问每组至少需要多少头试验家畜才能满足要求?
下一张 主 页 退 出上一张将 t0.05(∞)=1.96,S=2,=1.5代入
(12-13) 式得
n=2× 1.962× 22/1.52=13.66≈14 (头 )
以 n=14,df=2(14-1)=26的 t0.05=2.056代入
(12-9) 式:
n=2× 2.0562× 22/1.52=15.03≈15 (头 )
再以 n=15,df=2(15-1)=28的 t0.05=2.048代入 (12-9) 式:
n=2× 2.0482× 22/1.52=14.91≈15 (头 )
n已稳定在 15,即本次试验两组均至少需
15头试验家畜才能满足要求。
21 xx?
下一张 主 页 退 出上一张
(三 ) 多个处理比较试验中重复数的估计当试验处理数 k≥3时,各处理重复数可按误差自由度 dfe≥12的原则来估计。因为当 dfe超过 12时,F表中的 F值减少的幅度已很小了。
1,完全随机设计由 dfe =k(n-1)≥12,得重复数的估算公式为:
n≥12/k+1 ( 12-14)
由 (12-14) 式可知,若 k=3,则 n≥5; k=4,则
n≥4; …… 。 但当处理数 k>6时,重复数仍应不少于 3。
下一张 主 页 退 出上一张
2,随机单位组设计以 dfe =(k-1) (n-1)≥12,得重复数的估算公式为:
n≥12/(k-1)+1 ( 12-15)
由公式 (12-15)可知,若 k=3,则 n≥7; k=4,
则 n≥5; …… 。但当处理数 k>7时,重复数仍应不少于 3。
下一张 主 页 退 出上一张
3,拉丁方设计若要求 dfe=(k-1) (k-2)≥12,则重复数 (此时等于处理数 )≥5。
所以,为了使误差自由度不小于 12,则应进行处理数 (即重复数 )≥5的拉丁方试验,即进行 5× 5以上的拉丁方试验。当进行处理数为 3,4的拉丁方试验时可将 3× 3拉丁方试验重复 6次,4× 4 拉丁方试验重复 2
次,以保证 dfe=12。
下一张 主 页 退 出上一张
(四 ) 两个百分数比较试验中样本含量估计设两样本含量相等,n1=n2=n,n的计算公式可由两个样本百分数差异显著性检验 u检验公式推得:
( 12-16)
式中,n为每组试验的动物头数;
为合并百分数,由样本百分数计算,;
为预期达到差异显著的百分数差值;
ua为自由度等于 ∞,两尾概率为 a的临界 u值:
u0.05=1.96,u0.01=2.58;
1-a 为置信度 。
22 /2 qpun?
p pq1
下一张 主 页 退 出上一张
【 例 12.14】 两种痢疾菌苗对鸡白痢病的免疫效果,初步试验表明,甲菌苗有效率为 22
/ 50 = 44%,乙菌苗有效率为 28/ 50 = 56%,
今欲以 95%的置信度在样本的百分数差值达到
10%时检验出两种菌苗免疫效果有显著差异,
问试验时每组至少需接种多少只鸡?
已知 =22/ 50 = 44%,=28/ 50 = 56%,
则两个样本百分数的合并百分数为:
1?p
2?p
= (22+28) /( 50+50) = 0.50,
=1-0.50=0.50
将代入 (12-16) 式算得:
n=2× 1.962× 0.50× 0.50/0.102=192,08193(只 )
即在正式接种试验时,每组至少需接种 193
只鸡方可满足试验要求。
p
pq 1
10.0,50.0,50.0,96.105.0qpu
下一张 主 页 退 出上一张注意,在配对试验,非配对试验和多个处理比较试验中,同一处理的不同重复意味着同一处理实施在不同的试验单位上 。 若试验以个体为试验单位,则同一处理的不同重复是指同一处理实施在不同个体上;若以群体为一个试验单位,则同一处理的不同重复是指同一处理实施在不同群体上,这时如果每处理只实施在一个群体上,不管这群动物的数量有多少,实际上相当于只实施在一个试验单位上,只能获得一个观测值,也就无法估计试验误差 。