第五章 t检验 (t-test)
前面第四章第六节讲了样本平均数抽样分布的问题 。 抽样研究的目的是用样本信息来推断总体特征,这就是我们将重点讨论的统计推断问题 。
所谓 统计推断 是指根据样本以及问题的条件和假定模型对未知事物 (即总体 )作出的 以概率形式表述的 推断,它主要包括 假设检验 和 参数估计两个内容 。
假设检验 又叫 显著性检验,其方法很多,常用的有 t检验,F检验 和 χ 2检验 等 。
尽管这些检验方法的用途及使用条件不同,但其检验的基本原理是相同的 。
本章以 平均数的差异显著性检验 为例阐明显著性检验的原理,介绍 几种 t检验的方法,然后介绍 总体均数的区间估计 。
第一节 显著性检验的基本原理
第二节 样本均数与总体均数的差异显著性检验
第三节 两样本平均数的差异显著性检验
第四节 显著性检验中应注意的问题
第五节 总体均数的区间估计第一节 显著性检验的基本原理
一、显著性检验的意义
二、显著性检验的基本步骤
三、显著水平与两类错误
四、双侧检验与单侧检验一、显著性检验的意义
本节的内容主要是解决这样几个问题,即进行显著性检验的目的、检验对象、基本思想和基本前提是 什么?下面结合具体例子来说明。
(一 )为什么要进行显著性检验?
在某种猪场随机抽测了甲,乙两品种经产母猪各 10头的产仔初生窝重:
甲品种 10头母猪产仔平均初生窝重
标准差 ;
乙品种 10头母猪产仔平均初生窝重,
标准差 。
kgx 50.131?
kgS 81.11?
kgx 63.111?
kgS 63.12?
问题,能否仅凭这两个样本均数差值
立即得出甲、乙两品种母猪经产仔初生窝重不同的结论呢?
统计学认为,这样得出的结论是不可靠的。
这是因为 试验指标既受处理因素的影响,又受试验误差 (或抽样误差 )的影响。如果我们再分别随机抽测 10头甲、乙两品种猪母猪产仔初生窝重,
又可得到两个样本资料。两样本均数就不一定是
13.5kg和 11.63kg,其差值也不一定是 1.87kg。
怎样通过样本来推断总体呢?—— 这正是显著性检验要 解决的问题 。
kgxx 87.121
(二)检验对象
设甲品种猪经产母猪产仔初生窝重的总体均数为,乙品种的总体均数为 。
试验研究 (本例为抽样比较 )的目的,就是要给,是否相同做出推断,由于总体均数,未知,在进行显著性检验时只能以样本均数,作为检验对象,更确切地说,是以 作为检验对象 。 事实上,因为样本均数具有下述特征,
离均差的平方和 最小 。 说明样本平均数与样本各个观察值最接近,平均数是资料的代表数 。
1? 2?
1? 2? 1? 2?
)( 21 xx?
21 xx、
2)( xx
样本平均数是总体均数的无偏估计值,
统计学中心极限定理,样本平均数 服从或逼近正态分布 。
所以,以样本平均数作为检验对象,由两个样本均数差异的大小去推断样本所属总体平均数是否相同是有其依据的。
由上所述,一方面我们有依据 由样本均数的差异来推断总体均数,相同与否,另一方面又不能 仅据样本均数表面上的差异直接作出结论,其根本原因在于试验误差 (或抽样误差 )的不可避免性。
)(xE
x
1? 2?
21 xx、
(三)基本思想
我们所得到的观察值由两部分组成,即
若样本含量为 n,则可得到 n个观察值 。
于是样本平均数 。 说明 样本均数并非总体均数,它还包含试验误差的成分 。
对于接受不同处理的两个样本来说,则有:
iix
nxxx,...,,21
x
222111, xx
)()()( 212121 xx
两个样本均数之差
试验的处理效应
试验误差样本平均数的差 包含有试验误差,
它不只是试验的表面效应 。 因此,仅凭 就对总体均数,是否相同下结论是不可靠的 。
只有通过显著性检验才能从 中提取结论 。
对 进行显著性检验就是要分析:
主要由处理效应 引起的,还是主要由试验误差所造成?
虽然 处理效应 未知,但 试验的表面效应 是 可以计算 的,借助数理统计方法 试验误差 又是 可以估计 的 。
)( 21 xx?
)( 21 xx?
1? 2?
)( 21 xx?
)( 21 xx?
)( 21 xx? )( 21
)( 21
所以,可从试验的表面效应与试验误差的 权衡比较 中 间接地推断 处理效应是否存在,这就是 显著性检验的基本思想 。
(四)基本前提
为了通过样本对其所在的总体作出符合实际的推断,要求合理进行试验设计,准确地进行试验与观察记载,尽量降低试验误差,避免系统误差,使样本尽可能代表总体 。
只有从正确,完整而又足够的资料中才能获得可靠的结论 。 若资料中包含有较大的试验误差与系统误差,有许多遗漏,缺失甚至错误,再好的统计方法也无济于事 。
因此,收集到正确,完整而又足够的资料是通过显著性检验获得可靠结论的基本前提 。
小结:
(一)显著性检验要 解决的问题 —— 如何通过样本来推断估计总体。
(二)检验的 对象及其依据 —— 样本平均数(根据有三条)。
(三)显著性检验的 基本思想 —— 从试验的表面效应与试验误差的权衡比较中间接地推断处理效应是否存在。
(四)通过检验获得可靠结论的 基本前提 —— 收集到正确、完整而又足够的资料 。
二、显著性检验的基本步骤
(一 )首先对试验样本所在的 总体 作假设 。
这里假设,即假设甲,乙两品种猪经产母猪仔猪初生重的总体均数相等,其意义是试验的表面效应 系试验误差,
处理无效,故称为 无效假设 (null hypothesis),
记作 。
无效假设 是被检验的假设,通过检验可能被接受,也可能被否定 。
提出 的同时,相应地有一对应假设,称为 备择假设 (alternative hypothesis),
记作 。
02121 或
kgxx 87.121
0H
210,H
AH
备择假设 是在无效假设被否定时准备接受的假设。
本例的备择假设是,甲,乙两品种猪经产母猪仔猪初生窝重的总体均数不相等,记作
亦即存在处理效应,试验的表面效应除包含试验误差外,主要的是含有处理效应在内 。
( 二 ) 在无效假设成立的前提下,构造合适的统计量,并研究试验所得统计量的抽样分布 。
就我们的例子,研究在无效假设 成立的前提下,统计量 的抽样分布 。 经统计学研究,得到一个 的 t分布 。
( 请联系上一章的内容思考如何得出该结论的?? )
21,AH
210,H
)( 21 xx?
)1()1( 21 nndf
其中
为均数差异标准误;
分别为 两样本的含量、平均数、
均方。
根据前面两个样本的数据,计算得:
)11(
)1()1(
)1()1(
2121
2
22
2
11
21 nnnn
snsnS
xx

21 xxS?
22212121,,ssxxnn,、、
87.163.115.1321 xx
8 3 7.0)
10
1
10
1(
)110()110(
93.1)110(81.1)110( 22
21



xxS
于是
下面进一步估计出 的两尾概率,即估计 是多少 。
查附表 3,在 时,两尾概率为 0.05的临界 t值,两尾概率为
0.01的临界 t值,即:
由于根据两样本数据计算所得的 t值为 2.234,
介于二个临界 t值之间,
*234.2
837.0
87.1
21
21
xxS
xxt
)2 3 4.2(?tP
234.2?t
18)110()110(df
1 0 1.2)18(05.0?t
8 7 8.2)18(01.0?t
05.0)101.2()101.2()101.2( tPtPtP
01.0)878.2()878.2()878.2( tPtPtP
01.005.0 2 3 4.2 tt
所以,|t|≥2.234 的概率 P介于 0.01和 0.05
之间,即:
0.01< P< 0.05
(三)根据,小概率事件实际不可能性原理,
否定或接受无效假设。
当一事件发生的概率很小 (例如小于 0.05或
0.01)时,在一次试验中可以认为其实际上不可能发生,这叫 小概率事件实际不可能性原理。
|t|≥2.234的两尾概率说明试验处理效应不存在,即 试验的表面效应为试验误差的可能性在 0.01~
0.05之间。
在生物学研究中常以 0.05和 0.01两个概率作为
某事件是否是小概率事件的标准。

本例中,按所建立的,表面效应为试验误差的概率在 0.01~ 0.05之间,即无效假设属于小概率事件,根据小概率原理,故有理由否定,从而接受 可以认为甲、
乙两品种经产母猪的仔猪初生窝重总体平均数不相同。
05.001.0
01.0

P
P 或
小概率事件
05.0?P?
不认为是 小概率事件
0H
0H
210,H 21,AH
小结 ( 显著性检验的基本步骤 ),
首先对试验样本所在的总体作假设 ( 无效假设和备择假设 ) 。
在无效假设成立的前提下,构造合适的统计量,并研究试验所得统计量的抽样分布 。 ( 得出无效假设成立的概率 )
根据,小概率事件实际不可能性原理,否定或接受无效假设 。 ( 在一定的概率保证下,对无效假设是否成立作出判断 )
综上所述,显著性检验,从建立假设到最后依概率的大小来决定接受还是否定假设,这一过程实际上应用所谓,概率性质的反证法,对试验样本所属 总体所作假设 的统计证明。
对于各种显著性检验的方法,除明确其 应用条件,掌握 有关统计运算方法 外,正确的逻辑推理 是不可忽视的。
三、显著水平与两类错误
(一)显著水平 (Significance level)
在显著性检验中,否定或接受无效假设的依据是,小概率事件实际不可能性原理,。
用来确定否定或接受无效假设的概率标准叫显著水平,记作 α。在生物学研究中常取
α=0.05 或 α=0.01。
(二 )显著水平 α在显著性检验 (t检验 )中的应用
若,则说明试验的表面效应属于试验误差的概率 P> 0.05,即表面效应属于试验误差的可能性大,不能否定 。
05.0tt?
0H
这时称,差异不显著,,记为,ns”或不标记;
若,则说明试验的表面效应属于试验误差的概率 P在 0.01~ 0.05之间,即
0.01< P< 0.05,亦即表面效应属于试验误差的可能性较小,应否定,接受,这时称,差异显著,,记为,*” ;
若,则说明试验的表面效应属于试验误差的概率 P不超过 0.01,即 P≤ 0.01。
亦即表面效应属于试验误差的可能性更小,应否定,接受,这时称,差异极显著,,记为
,**” 。
01.005.0 ttt
0H AH
01.0tt?
0H AH
(三)两类错误
因为显著性检验是根据,小概率事件实际不可能性原理,来否定或接受无效假设的,所以 不论是接受还是否定无效假设,都没有 100%的把握 。也就是说,在检验一个假设时可能犯两类错误。
第一类错误是真实情况为 成立,却否定了它,犯了,弃真,错误,也叫 Ⅰ 型错误
(type Ⅰ error)
犯 Ⅰ 型错误的概率不会超过 α,Ⅰ 型错误也叫
α错误,在医学上还称为 假阳性错误 。
0H
第二类错误是 实际不成立,却接受了它,
犯了,纳伪,错误,也叫 Ⅱ 型错误 (type Ⅱ
error)。
犯 Ⅱ 型错误的概率记为 β。 Ⅱ 型错误又叫 β
错误,在医学上还称为 假阴性错误 。 犯 Ⅱ 型错误可能性 β 的大小与 α取值的大小,两均数差异大小等因素有关 。
两类错误间的关系
如图所示,图中左边曲线是 为真时,
的 分布密度曲线;右边曲线是
为真时,的分布密度曲线 ( ) 。
0H
210,H
)( 21 xx?
210,H
)( 21 xx? 21
因此,在检验选用显著水平时,应考虑到这两种错误 推断后果的严重性大小,还应考虑到 试验的难易,试验结果的重要程度 。
两类错误示意图由图不难看出,
当 α值变小时,β 值变大;反之,α值变大时,β 值变小。也就是说 Ⅰ 型错误 α的降低必然伴随着 Ⅱ 型错误 β 的升高。
若一个试验耗费大,可靠性要求高,不允许
反复,那么 α 值应取小些;当一个试验结论的使用事关重大,容易产生严重后果,如药物的毒性试验,α 值亦应取小些。
对于一些试验条件不易控制,试验误差较大的试验,可将 α 值放宽到 0.1,甚至放宽到 0.25。
在提高显著水平,即减小 α 值时,为了减小犯 Ⅱ 型错误的概率,可适当增大样本含量。 增大样本含量可以同时降低犯两类错误的可能性 。
两 类 错 误 的 关 系客观实际 否 定 接 受成 立 Ⅰ 型错误 (α) 推断正确 (1-α)
不成立 推断正确 (1-β) Ⅱ 型错误 (β)
0H
0H
0H0H
小结:
因为显著性检验是根据,小概率事件实际不可能性原理,来否定或接受无效假设的,所以 不论是接受还是否定无效假设,都没有 100%的把握 。
若经 t检验,差异显著,,对此结论有 95%的把握,同时要冒 5%下错结论的风险;
,差异极显著,,对此结论有 99%的把握,同时要冒 1%下错结论的风险;
,差异不显著,,是指在本次试验条件下,
无效假设未被否定。
,差异不显著,并一定是,没有差异,。 这有两种可能,?或者这两个样本所在的总体确实没有差异;?或者这两个样本所在总体平均数有差异而因为试验误差大被掩盖了。
因而不能仅凭统计推断就作出绝对肯定或绝对否定的结论。,有很大的可靠性,但有一定的错误率”,这是统计推断的基本特点。
四、双侧检验与单侧检验
(一)双侧检验 (two-sided test)
在显著性检验中,无效假设为,备择假设为 。此时备择假设包括了或 两种可能。这个假设的目的在于判断与有无差异,而不考虑谁大谁小。
此时,在 α 水平上 否定域 为 (-≦,- )和 [,
+≦],对称地分配在 t分布曲线的两侧尾部,每侧的概率为 α/2,如下图所示。
这种利用两尾概率进行的检验叫 双侧检验,
也叫 双尾检验,为双侧检验的临界 t值。
210,H
21,AH 21
21
t?t
t
单侧检验双侧检验图
A

B
(二)单侧检验 (one-sided test)
但在有些情况下,双侧检验不一定符合实际情况 。 如采用某种新的配套技术措施以期提高鸡的产蛋量,已知此种配套技术的实施不会降低产蛋量 。 若进行新技术与常规技术的比较试验,无效假设应为,即假设新技术的实施没有提高产蛋量,备择假设应为,即新配套技术的实施使产蛋量有所提高 。
检验目的 在于推断实施新技术是否提高了产蛋量,这时的否定域在 t分布曲线的右尾 。
210,H
21,AH
在 α 水平上,的否定域为 [,+≦],右侧
的概率为 α,如图 A所示 。
若无效假设为,备择假设为,此时的否定域在 t分布曲线的左尾 。
在 α 水平上,的否定域为 (-≦,- ),左侧的概率为 α 。 如图 B所示 。
这种利用一尾概率进行的检验叫 单侧检验 也叫 单尾检验 。 此时 为单侧检验的临界 t值 。
(三 )单侧检验与双侧检验的关系
单侧检验的 tα =双侧检验的 t2α
0H?t
210,H
21,AH
t0H
t
若对同一资料进行双侧检验也进行单侧检验,
那么在 α 水平上单侧检验显著,只相当于双侧检验在 2α 水平上显著。
所以,同一资料双侧检验与单侧检验所得的结论不一定相同 。双侧检验显著,单侧检验一定显著;反之,单侧检验显著,双侧检验未必显著。
(四)应用
选用单侧检验还是双侧检验应根据专业知识及问题的要求(分析的目的)在试验设计时就确定。
一般若事先不知道所比较的两个处理效果谁好谁坏,分析的目的 在于推断两个处理效果有无差别,则选用双侧检验;
若根据理论知识或实践经验判断甲处理的效果不会比乙处理的效果差 ( 或相反 ),分析的目的 在于推断甲处理是否比乙处理好 (或差 ),则用单侧检验。
一般情况下,如不作特殊说明均指双侧检验 。
第二节 样本均数与总体均数的差异显著性检验 —— t检验
在实际工作中往往需要检验一个样本均数与已知总体均数 是否有显著差异,即检验样本是否属于某一总体。
这里的 一般为一些公认的指标。如畜禽正常生理生化指标、生产性能指标、经大量调查所得的平均值、经验数或规定的某种指标值。
检验的基本步骤:
(一)建立假设
x
0?
0?
,其中 μ 为样本所在总体均值。
(二)在无效假设成立的条件下,计算 t 值。
其中,n为样本含量,为 样本标准误 。
( 三 ) 根据计算出的自由度,查得临界值,。 将计算所得 t值的绝对值与其比较,
作出推断 。
若,则 P> 0.05,不能否定,
表明样本均数与总体均数差异不显著;
若,则 0.01< P≤ 0.05,
000,;, AHH
1,0 ndf
S
xt
x
nSS x /?
01.005.0,tt
05.0tt?
01.005.0 ttt
0H
否定,接受,表明样本均数 与总体均数差异显著;
若,则 P≤ 0.01,否定,接受,表明样本均数 与总体均数 差异极显著 。
【 例 】 在鱼塘中 10个点取水样,测定水中含氧量,
得数据,4.33,4.62,3.89,4.14,4.78,4.64,
4.52,4.48,4.55,4.26(mg/l),能否认为该鱼塘中平均含氧量为 4.50(mg/l)。
显然,本例应进行双侧 t检验 。
1,建立假设
0H AH x 0?
01.0tt?
0H
AH x 0?
50.4:;50.4:0 AHH
2.计算 t值
经计算得,=4.421,S=0.267
所以
3,查临界 t值,并作出推断
由 df=10-1=9查 t值表 (附表 3)得,=2.262。
因为,P> 0.05,故不能否定,
可以认为该鱼塘中平均含氧量为 4.50(mg/l).
x
940.0
084.0
079.0
10/267.0
50.4421.40
xS
xt?
05.0t
05.0tt?
50.4:0H
第三节 两样本均数差异显著性检验
在实际工作中还经常会遇到推断两个样本均数差异是否显著的问题,以了解两样本所属总体的均数是否相同 。
对于两样本均数的显著性检验,因条件或试验设计不同,一般可分为两种情况:一 是非配对设计 或 成组设计 两样本平均数的比较;二是 配对设计 两样本平均数的比较 。
(同学们在学习时要注意理解和掌握 基本概念,
同时注意区分 两种情况显著性检验的区别 。 )
一,非配对设计 两样本平均数差异显著性检验 —— t检验
(一)概念
非配对设计或成组设计 是指当进行只有二个处理的试验时,将试验 单位完全随机 地分成两个组,然后对两组随机施加一个处理。
在这种设计中两组的试验单位相互独立,所得到的两个样本相互独立,其含量不一定相等。
(二)步骤
建立假设;
2110,;,2 AHH
计算均数差异标准误,t值和自由度。
当 时,
为 均数差异标准误 ; 分别为两样本的含量、平均数、均方。
)1()1(,2121
21

nndf
s
xxt
xx
)11(
)1()1(
)1()1(
2121
2
22
2
11
21 nnnn
snsnS
xx

nnn 21
n
ss
S xx
2
2
2
1
21

21 xxS?
22212121,,SSxxnn,、、
根据 df=(n1-1)+(n2-1)或 2(n-1),查表得临界
t值,将计算所得 t值的绝对值与其比较,
作出统计推断。
【 例 】 分别测定两个品种的家兔停食 18小时后正常血糖值,测定结果如表 5-2所示 。 设两品种家兔正常血糖值服从正态分布,且方差相等,问该两个品种家兔的正常血糖值有无差异?
两个不同品种家兔的正常血糖值
01.005.0,tt
品种 n 血糖值( mg/100ml血)
大耳白 11 57 120 101 137 119 117 104 73 53 68 118
青紫蓝 10 89 36 82 50 39 32 57 82 96 31
1.建立假设
2,计算 t值
此例,经计算得,
,于是
2110,;,2 AHH
111?n 102?n 2.847,0.97 211 Sx
3.6 5 0,4.59 222 Sx
)
11
(
)1()1(
)1()1(
2121
2
22
2
11
21 nnnn
snsn
S xx?



0.12)
10
1
11
1(
)111()110(
3.65092.84710


**133.3
0.12
4.590.97
21
21
xxs
xxt
3.查临界 t值,作出推断查 t值表,由 df=11+10-2=19得,|t|
> 2.861,P< 0.01,表明两品种家兔正常血糖值差异极显著,这里表现为大耳白品种家兔的正常血糖值极显著高于青紫兰品种家兔的正常血糖值 。
6 8 1.201.0?t
二,配对设计两样本平均数的差异显著性检验 —— t检验
非配对设计 要求试验单位尽可能一致 。 如果试验单位变异较大,如试验动物的年龄,体重相差较大,若采用上述方法就有可能使处理效应受到系统误差的影响而降低试验的准确性与精确性 。
为了消除试验单位初使条件不一致对试验结果的影响,正确地估计处理效应,减少系统误差,
降低试验误差,提高试验的准确性与与精确性,
可以利用 局部控制 的原则,采用 配对设计 。
(一)配对设计的概念和分类
配对设计 是指试验单位先根据 配对的要求 两两配对,然后将配成对子的两个试验单位随机地分配到两个处理中。
配对的要求是,配成对子的两个试验单位
( 对子内 )的初始条件尽量一致,不同对子间 试验单位的初始条件允许有差异。每一个对子就是试验处理的一个重复。
配对的方式有两种:
同源配对
自身配对
1.自身配对 指同一试验单位?在 二个不同时间
上分别接受前后两次处理,用其前后两次的观察值进行自身对照比较;?或在 空间上用其不同部位 的观察值或?不同方法 的观察值进行自身对照比较 。
如观察某种病畜治疗前后临床检查结果的变化;
观察用两种不同方法对畜产品中毒物或药物残留量的测定结果变化等 。
2.同源配对 指将 来源相同,性质相同 的两个个体配成一对 (如将畜别,品种,窝别,性别,年龄,体重相同的两个试验动物配成一对 ),
然后对配对的两个个体 随机地 实施不同处理。
(二)配对设计显著性检验的步骤
在配对设计中,由于各对试验单位间存在系统误差,对内两个试验单位存在相似性,所以其资料的显著性检验 不同于非配对设计 。检验的步骤是:
1,建立假设
其中 为 两样本配对数据差值 d总体均数,它等于两样本所属总体平均数 与 之差,即
。 所设无效假设,备择假设相当于 。
0:;0:0 dAd HH
d?
1? 2?
21d
21210,;, AHH
2、计算差异标准误,t值和自由度;
其中,为差异标准误,计算公式为:
d为两个样本各对数据之差:,
(i=1,2,…,n); 为 d的标准差; n为配对的对子数,即试验的重复数 。
( 注意,实际计算过程中,运用计算器的统计功能键,在计算 时,即可同时计算出 。 )
1, ndf
s
dt
d
ds
)1(
)( 2

nn
dd
n
s
s dd
iii xxd 21d s
d
d s
3.根据自由度 df=n-1查 t值表,得临界 t值
,然后将计算所得 t值的绝对值与其比较,作出推断。
【 例 】 在比较国产与进口的膘厚测定仪时,对 14
头活体肥猪进行了测定,资料如下 (单位,mm)
试检验两种仪器测定的结果有无显著差异?
1,建立假设
,即假定两种仪器测定的结果相等;
,即假定两种仪器测定的结果不等。
)1(01.0)1(05.0, nn tt
进口 32 40 27 37 32 35 28 43 40 41 41 35 49 34
国产 43 44 30 34 30 31 26 26 42 40 42 43 37 43
0,?dAH?
0:0?dH?
2.计算 t值
经计算得 = -11,-4,-3,3,2,4,
2,17,-2,1,-1,-8,12,-9
(将以上数据输入计算器,运用统计功能键)
=0.214,=7.658,n=14
3.查临界 t值,作出推断 。
由 df=n-1=13,查 t值表得,
P>0.05,表明国产和进口测定仪测定的猪活体背膘厚差异不显著 。
iii xxd 21
d
d s
047.214/658.7/ nss dd
ns
dsdt 105.0047.2/214.0/
05.0)13(05.0,1 0 6.2 ttt
讨论:
配对设计与非配对设计的显著性检验有那些区别?
如果将非配对设计资料错误地用配对设计的显著性检验方法(或者将配对设计资料用非配对设计的显著性检验方法)进行检验,结果会怎样呢?
一般说来,相对于非配对设计,配对设计能够提高试验的精确性。 (???)
第四节 显著性检验中应注意的问题
(一)要有严密合理的试验或抽样设计。
(二)选用的显著性检验方法应符合其应用条件。
( 三 ) 要正确理解差异显著或极显著的统计意义 。
显著性检验结论中的,差异显著,或,差异极显著,不应该误解为相差很大或非常大,也不能认为在专业上一定就有重要或很重要的价值 。
,显著,或,极显著,是指表面上如此差别的不同样本来自同一总体的可能性小于 0.05或 0.01,
已达到了可以认为它们有实质性差异的显著水平 。
有些试验结果虽然差别大,但由于试验误差也大,也许还不能得出,差异显著,的结论,而有些试验结果间的差异虽小,但试验误差也小,反而可能推断为,差异显著,。
显著水平的高低只表示下结论的可靠程度的高低,即在 0.01水平下否定无效假设的可靠程度为 99%,而在 0.05水平下否定无效假设的可靠程度为 95% 。
,差异不显著,是指表面上的这种差异在同一总体中出现的可能性并不小于统计上公认的概率水平 (如 0.05和 0.01),不能理解为 试验结果间没有差异。下,差异不显著,结论时,客观上存在两种可能:一是本质上有差异,但被试验误差所掩盖,表现不出差异的显著性来。如果减小试验误差或增大样本含量,则可能表现出差异显著性;
二是可能确无本质上差异。
显著性检验只是用来确定无效假设能否被推翻,而不能证明无效假设是正确的 。
(四)合理建立统计假设,正确计算检验统计量。
(五)结论不能绝对化。
第五节 对数转换
一、对数转换的目的
在用 t检验法进行均数显著性检验时 要求均数所在的总体服从正态分布 。但在科学研究中,往往有些资料不服从正态分布,如传染病的潜伏期、
抗体滴度、细菌计数等,其分布呈偏态分布,资料的代表数是几何平均数而不是算术平均数。
因此对这 类资料须先进行 对数转换,使其近似正态分布,然后进行 t检验。
二、步骤
1、先对数据进行 对数转换 ;
2、建立假设;
3、计算两样本均数(几何平均数)、标准差
(对数转换后的数据标准差)、均数差异标准误、
t值、自由度。
4、查临界 t值表,作结论。
第六章 参数的区间估计
参数估计 就是用样本统计量来估计总体参数,有点估计 (point estimation)和区间估计 (interval estimation)之分。
将样本统计量直接作为总体相应参数的估计值叫 点估计 。
点估计只给出了未知参数估计值的大小,没有考虑试验误差的影响,也没有指出估计的可靠程度,故不尽合理。
区间估计 是在一定概率保证下指出总体参数的可能范围,所给出的可能范围叫 臵信区间,给出概率保证称为 臵信度或臵信概率 (confidence probability)。
一、正态总体平均数 μ 及二项总体百分率 p的置信区间
设有一来自正态总体的样本,包含 n个变数,
样本平均数 =∑x/n,标准误 。 总体均数为 μ 。 现对 μ 作区间估计 。
因为 服从自由度为 n-1的 t分布,
当?=0.05时,也即是:
对 变形有:
x nSS x /?
xSxt /)(
95.0)( 05.005.0 tttP
95.0)( 05.005.0 t
S
xtp
x
05.005.0 tS
xt
x

..................(6-1)

式( 6-1)称为 总体平均数 μ 的 95%臵信区间 。
其中 称为臵信半径;
叫臵信下限; 叫臵信上限;
臵信上、下限之差 叫臵信距; 95%叫臵信度。
同样可得 总体平均数 μ 的 99%臵信区间
xx StxStx 05.005.0
95.0)( 05.005.0 xx StxStxP?
)26(..........01.001.0 xx StxStx?
xStx 05.0? xStx 05.0?
xSt 05.0
xSt 05.02
二、二项总体百分率 p的臵信区间
率的臵信区间是在一定臵信度下对总体率作出区间估计。求总体率的臵信区间有两种方法:
(一)正态近似法
当 n>1000,p?1%时,总体率 P 的 95%,99%臵信区间为:
其中,为样本率,为样本率标准误,计算公式为
)46...(..........58.258.2
)36...(..........96.196.1




PP
PP
SPPSP
SPPSP


P?
PS?
)56..(.,,,,,,,,,
)1(
n
PP
S P

(二)查表法
当 n?1000时,P?1%时,可以直接查表,得到总体率的臵信区间。(附表 6)
当 1?n?50时,查表 6.1;
当 50?n?100时,查表 6.2;
当 100?n?1000时,查表 6.3。
若不能从表上查到,可用 线性内插法 求出。
第二节 正常值范围的确定(自学)