第三章 总体均数的估计和假设检验第一节 均数的抽样误差与标准误
1,均数的抽样误差与样本均数的分布:
( 1) 均数的抽样误差 是指样本均数与总体均数之间的差异以及来自同一总体的样本均数之间的差异。
例 3-1 若某市 1999年 18岁男生身高服从均数为
167.7cm,标准差为 5.3cm的正态分布。从该正态分布 N(167.7,5.32)cm总体中随机抽样 100次即共抽取样本 g=100个,,每次样本含量 =10人,得到每个样本均数及标准差如图 3-1和表 3-1所示。
167.41 2.74
jx
jS
165.56 6.57
168.20 5.36
165.69 5.09
… … 100个
n= 10
Ni XXXXX
cm
cm
......,,
3.5
7.1 6 7
321
图 3- 1 1999年某市 18岁男生身高 X~ N (167.7,5.32 )抽样示意图
-
表 3-1资料
1 6 7,6 9
1,6 9
i
i
x
x cm
S cm
组段 频数 频率(%) 累计频数 累计频率(%)
163~ 1 1 1 1
164~ 3 3 4 4
165~ 13 13 17 17
166~ 19 19 36 36
167~ 22 22 58 58
168~ 20 20 78 78
169~ 14 14 92 92
170~ 4 4 96 96
172~ 3 3 99 99
172~ 173 1 1 100 100
合 计 100 100 —— ——
随机 抽样所得 100个样本均数的频数分布图 3- 2 从正态分布总体 X~ N (167.7,5.32 )
随机 抽样所得样本均数分布平均身高 ( cm)
163 164 165 166 167 168 169 170 171 172 173
25 –
20 –
15 –
10 –
5 –
0
样本数
( 2) 样本均数的分布:
如果总体中的观察值的分布为正态分布,
则样本均数的分布也是正态分布。
如果总体中的观察值的分布为非正态分布,只要样本例数足够大( n>60),则均数的分布仍近似正态分布。
2.均数的标准误 ( standard error of mean),
(1)意义,
均数的标准误 简称标准误,是指样本均数的标准差,
衡量样本均数的离散程度。
(2)标准误的计算:
或
(3)标准误与标准差及 n的关系,
n大 小; S小 小。
nx / nss x /?
xS
nkx jx /)1/()( 2
xS
思考:如何降低均数的抽样误差?
(4)标准误的应用,
① 衡量均数的抽样误差
②衡量样本均数的可靠性
③估计总体均数的可信区间
④均数的假设检验。
思考:如何区别标准差和标准误?
3.标准误与标准差之间的区别与联系:
标准误 标准差说明 的离散度,说明 x 的离散度,
衡量抽样误差,衡量个体差异,
表示 的可靠性,表示 的代表性,
n大,小,n大,s 趋于稳定,
估计 μ的可信区间,估计参考值范围,
均数的假设检验。 计算 CV 和 。
联系 n不变时,s 越大,越大。
区别
x
x x
xS
xS
xS
第二节 t 分布一,t 分布的概念
t 值的公式为,
从同一总体中抽取若干 n 相同的样本,并求出样本均数,再代入 t 值公式求得若干个 t 值,将 t 值看成观察值,其分布称为 t 分布。
u 分布,
t 分布:
xsxt /)(
xxu /)(
/)( xu
xsxt /)(
t 值为样本均数与总体均数之差与样本标准误的比值重要概念:
自由度用 υ表示,指计算某一统计量时变量取值不受限制的个数。
一般情况下,υ = n – m
n为计算某一统计量时用到的数据个数,
m为计算该统计量时用到的其他独立统计量个数,
或者计算该统计量时受到限制的条件数。
,υ”为小写希腊字母读作[ nju,]
自由度
t 分布的用途
1.小样本时总体均数的估计,
2.均数比较时的假设检验,
3.相关系数的假设检验。
二,t 分布的特征,
(1)单峰;
(2) t 值有正有负,均数为 0;
(3)以 0为中心左右对称;
(4)一簇曲线,每个自由度为一条曲线;
(5)自由度越小,峰越矮,尾越翘,随着自由度增加,t 分布曲线逐渐逼近标准正态分布曲线;
(6)当自由度为无穷大时,t 分布曲线和标准正态分布曲线完全吻合。
f(t)?=∞(标准正态曲线 )
=5
=1
0.1
0.2
-4 -3 -2 -1 0 1 2 3 4
0.3
自由度分别为 1,5,∞时的 t 分布三,t 分布的图形 (
四,t 分布曲线下的面积分布
t 界值表:见附表 2( 804页)。
左侧为自由度,从 1~ ∞;
上方为概率,指曲线下尾部面积,分为单侧和双侧(单尾和双尾);
中间为 t 值的绝对值,即图形中横坐标的位置。
单侧 t 界值的表示方法:
双侧 t 界值的表示方法:
,t
,2/t
- t 0 t
t 值表示意图同一自由度时,P值越小 t 值越大;
同一 P值时,自由度越大 t 值越小;
自由度= ∞时,t 值= u 值;
812.110,05.0?t
当自由度= 10,单侧曲线下面积概率为 0.05
时,t 值在横坐标上的位置是 1.812。
或者理解为:在上述条件下进行抽样研究,
95%的 t 值应小于 1.812,大于和等于 1.812
者仅有 5%。
的含义为:
228.210,2/05.0?t
的含义?
0 1.812
5%
0 2.228
2.5%
- 1.812
- 2.228 1 2
第三节 总体均数 (μ)的估计一,可信区间的概念用样本指标估计总体指标称为参数估计,
方法有点值估计和区间估计两种。
μ的点值估计:
将样本均数作为 μ的估计值,由于抽样误差的存在,所以 μ的点值估计准确度较低。
μ的 区间估计,
考虑抽样误差并按一定的可信度计算包含
μ在内的一个范围,称为 区间估计,该范围称为可信区间,常用双侧 95%。
可信限是指两个界值二、总体均数可信区间的计算
1.单一总体均数的可信区间
( 1) σ未知,n ≤60,按 t 分布。
双侧 1- α可信区间 (95%,)
单侧 1- α可信区间或
),(,2/05.0,2/05.0 XX StXStX
XStX,05.0XStX,05.0
0,0 5
例 3-2 在例 3-1中抽得第 15号样本的均数
(cm),标准差 (cm),试求其总体均数的 95%可信区间。
故该地 18岁男生身高均数的 95%
可信区间为( 164.35,169.55) (cm)。
)(1 5 1 1.1
10
64.3 cmS
x
3,6 4S?1 6 6,9 5X?
)1 5 1 1.1262.295.166,1 5 1 1.1262.295.166(
262.29,2/05.0
t
例:随机检查了 20名慢性胃炎脾虚男病人,其脉搏均数为 74.3次 /分,标准差为 6.4次 /分,试估计该类病人脉搏总体均数的 95%可信区间。
本例 n=20,ν=19,t0.05/2,19= 2.093,95%可信区为:
( 74.3-2.093× 6.4 /,74.3+ 2.093× 6.4 / )
即 ( 71.3次 /分,77.3次 /分 )。
20 20
(2) σ未知,n >60,按 u分布。
双侧 1- α可信区间单侧 1- α可信区间或
),( 2/2/ xx suXsuX
XSuXXSuX
/xS S n?
例,随机检查 140例成年男子的红细胞数得:
试估计该地成年男子红细胞数 95%可信区间。
( 4.79 - 1.96× 0.42 /,4.79 +1.96× 0.42 / )
= (4.72 ×,4.86 × )L/10 12
140140
LsLx /1042.0,/1079.4 1212
L/10 12
例 3-3 某地抽得正常成人 200名,测得其血清胆固醇的均数为 3.64 mmol/L,标准差为 1.20mmol/L,
试估计该地正常成人血清胆固醇均数的 95%可信区间。
0849.0
200
20.1
xS
)+,-( 0 8 4 9.096.164.30 8 4 9.096.164.3
故该地正常成人血清胆固醇均数的 95%可信区间为( 3.47,3.91) mmol/L 。
(3)σ已知,按 u 分布双侧 1- α可信区间单侧 1- α可信区间或
),( 2/2/ xx uXuX
XuXXuX
/x n
2.两总体均数之差的可信区间双侧 1- α可信区间单侧 1- α可信区间或
)(,2/21 21)( XXStXX
)(,21 21)( XXStXX
)(,21 21)( XXStXX
为两均数之差标准误,计算公式:
为合并方差
2
)1()1(
)
11
(
21
2
22
2
112
21
2
)(
2
1
nn
SnSn
S
nn
SS
c
cXX
2
cS
)( 21 XXS?
当两样本含量均大于 60,可用 u值代替 t值进行估计,也可用以下公式计算:
)( 21 XXS?
2
2
2
1
2
1
)( 21
n
S
n
S
S
XX
例 3-4 为了解甲氨蝶呤 (MTX)对外周血 IL-2水平的影响,某医生将 61名哮喘患者随机分为两组。
其中对照组 29例 ( ),采用安慰剂;试验组 32例
( ),采用小剂量甲氨蝶呤 (MTX)进行治疗。
测得对照组治疗前 IL-2的均数为 20.10 IU/ml ( ),
标准差为 7.02 IU/ml ( );试验组治疗前 IL-2的均数为 16.89 IU/ml ( ),标准差为 8.46 IU/ml
( )。问两组治疗前基线的 IL-2总体均数相差有多大?
1S
1n
2n
1X
2X
0 0 2 3.2)321291(23229 46.8)132(02.7)129(
22
)( 21
XXS
mlIU
t
/)21.7,79.0(
0 0 2 3.2000.2)89.1610.20(
000.2
60,2/05.0
故两组治疗前基线的 IL-2总体均数之差的 95%
可信区间为(- 0.79,7.21) IU/ml。
三、可信区间的确切含义和两个要素如果能够进行重复抽样试验,平均有 1- α
的可信区间包含了总体参数,而不是总体参数落在该范围的可能性为 1- α。
可信区间的 两个要素,
(1)准确度:包含总体参数的概率大小;
(2)精密度:可信区间的长度。
注意准确度和精密度的关系增加样本含量可提高精密度四、总体均数可信区间与参考值范围的区别;
可信区间 参考值范围含义计算用途
(
双侧大样本
)
XSX 96.1?
SX 96.1?
( 95%)
估计总体均数 判断个体指标正常与否是指包含 μ在内的范围,或样本均数的分布范围。
是指正常人某指标(观察值)
的波动 范围。
第四节 假设检验 (hypothesis test)
例 3-5 某医生测量了 36名从事铅作业男性工人的血红蛋白含量,算得其均数为 130.83g/L,标准差为 25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值 140g/L?
已知总体 未知总体
30
/74.25
/3.130
n
LgS
LgXLg /140
0
≠
?
图 3- 4 例 3- 5示意图一、假设检验的概念:
先对总体参数或分布作出某种假设,然后用适当的方法计算检验统计量,根据该检验统计量的分布理论,推断假设 是否拒绝 。
二、假设检验的种类:
根据检验目的分为,差别性检验,方差齐性检验、
拟合优度检验、正态性检验、均衡性检验等。
根据检验统计量命名分为,
检验、秩和检验等。检验、检验、检验,2?Fut
三、假设检验的意义,
通过对事物 数量差异 的比较分析,判断事物间有无 质量区别 。
四、假设检验的基本思想:
小概率反证法思想。
五,假设检验的一般步骤以例 3-5为例,说明假设检验的一般步骤:
1,建立假设,确定检验检验水准:
( 1)检验假设 H0,μ=μ0,
( 2)备择假设 H1,μ≠μ0,双侧检验。
注意,①针对总体;
②相互联系、相互对立,缺一不可;
③情况不同假设不同;
④单、双侧检验时 H1 不同。
单、双侧检验两个指标 比较时,从 专业 角度考虑:
如果甲指标大于乙指标或甲指标小于乙指标都可能发生则为 双侧检验 ;
如果甲指标不可能大于(或小于)乙指标,只需检验是否小于(或大于)乙指标则为 单侧检验 。
表 3- 3 样本均数(代表未知 )与已知总体均数 比较的 t 检验?
0?
目的
0
0
1H0H
0
0
0
0 0
0
0
双侧检验 是否单侧检验是否是否检验水准符号为 α,它是人为规定的小概率事件的判断标准,即 H0拒绝与否的概率界限,或犯第一类错误的概率,一般取 0.05。
2.选定检验方法,计算检验统计量:
检验方法的选择依据有:资料类型、设计方案、检验目的、样本大小、分布类型、方差齐性以及检验方法的适用条件等等。
本例选择单样本 t 检验,( 为什么? )
( 3)检验水准
138.2
36/74.25
14083.130
/
0
nS
X
t
3,确定 P值,作出推断和结论:
P值的大小根据检验统计量的理论界值表查得。
本例自由度 ν= 35,查 t 值表得
t0.05/2,35 = 2.030,t0.02/2,35 = 2.438,
2.030< 2.138< 2.438,故 0.02<P < 0.05。
当 P >α时,无统计学意义,不拒绝 H0;
P ≤ α时,有统计学意义,拒绝 H0,接受 H1 。
本例 P <0.05,即 P <α,故拒绝 H0,接受 H1 。
结论:可以认为从事铅作业的男性工人平均血红蛋白含量低于正常男性。
第五节 t 检验一、单样本 t 检验
(样本均数与总体均数比较)
二、配对样本 t 检验
(配对设计比较)
1,
/
n
nS
d
t
d
d
1,
/
0
n
nS
X
t?
三、两样本 t 检验
(成组比较)
四,几何均数比较的 t 检验先将观察值进行对数变换,再用上述均数比较的方法进行检验。( 52页)
2,21
)(
21
21
nn
S
XX
t
XX
五,t 检验的条件,
1.小样本资料;
2.正态分布资料;
3.组间比较时要求总体方差相等。
六,u 检验( 48页),当 n > 60,t 分布接近 u分布,
或者已知总体标准差( σ)时均可采用 u 检验。
000.2960.1
96.1,000.2 2/05.060,2/05.0
ut
一、样本均数与总体均数比较
1,总体标准差已知:
2,总体标准差未知,样本较大( n > 60):
3,总体标准差未知,样本较小 (例 3- 5)
)//(0 nsXt
)//(0 nsXu
)//(0 nXu
二,配对设计资料的 t 检验配对设计 包括异体配对和同体配对两种。
异体配对是将两个条件相近的对象配成一对,
然后随机化地接受两种处理;
模式:
甲组 ……
乙组 ……
随机同体配对 是对同一观察对象分别接受两种处理后的结果进行比较,又称自身配对,包括:
①在两个部位用两种不同方法处理后进行比较;
②先后用两种方法处理后进行比较;
③同一对象的检测标本用两种方法检测;
④ 同一对象接受一种处理前后比较等。
关于一种处理前后的比较是一种特殊的同体配对设计,
又可称为前后测量设计,见第十二章,262页。
配对 t 检验步骤如下,(设定 d为正态分布 )
补充例子:
1,H0,= 0; H1,> 0,单侧检验,
α=0.05,单侧。
2,计算 t 值:
cmndd 16.2106.21/
d? d
ns
d
s
d
t
dd
d
/
0?
三棱莪术液抑瘤实验的结果对子数 对照组 注射药液组 差值( )
1 3.6 3.0 0.6 0.36
2 4.5 2.3 2.2 4.84
3 4.2 2.4 1.8 3.24
4 4.4 1.1 3.3 10.89
5 3.7 4.0 -0.3 0.09
6 5.6 3.7 1.9 3.61
7 7.0 2.7 4.3 18.49
8 4.1 1.9 2.2 4.84
9 5.0 2.6 2.4 5.75
10 4.5 1.3 3.2 10.24
合计 --- --- 21.6 62.36
2dd
167.5418.0/16.2
0
d
s
d
t
110
10/)6.21(36.62
1
/)( 222
n
ndd
s d
cmnss dd 418.010/321.1/
cm321.1?
3.确定 P值,作出判断和结论:
计算自由度 =10 - 1= 9,查 t 值表得单侧因 5.167>1.833,故 P < 0.05 。
按 = 0.05水准,拒绝 H0,接受 H1 。可以认为三棱莪术液有抑瘤作用。
,8 3 3.19,05.0?t
例 3-6 为比较两种方法对乳酸饮料中脂肪含量测定结果是否不同,随机抽取了 10份乳酸饮料制品,分别用脂肪酸水解法和哥特里-罗紫法测定其结果如表 3-5第 (1)~(3)栏。问两法测定结果是否不同?
编号 哥特里-罗紫法 脂肪酸水解法 差值 d
(1 ) (2) (3) (4)=(2)? ( 3)
1 0.840 0.580 0.260
2 0.591 0.509 0.082
3 0.674 0.500 0.174
4 0.632 0.316 0.316
5 0.687 0.337 0.350
6 0.978 0.517 0.461
7 0.750 0.454 0.296
8 0.730 0.512 0.218
9 1.200 0.997 0.203
10 0.870 0.506 0.364
2.724
表 3-5 两种方法对乳酸饮料中脂肪含量测定结果
( 1)建立检验假设,确定检验水准
H0,= 0; H1,≠ 0,
α=0.05,双侧检验。
( 2)计算检验统计量:
d? d
20,8 4 8 3 ( 2,7 2 4 ) / 1 0
0,1 0 8 7
1 0 1d
s
0,2 7 2 4 7,9 2 5
0,1 0 8 7 / 1 0
t
21 0,2,7 2 4,0,8 4 8 3,0,2 7 2 4n d d d本例 。
( 3) 确定 P值,作出判断和结论:
查 t值表得,
按 α =0.05水准拒绝 H0,接受 H1,可以认为两种方法对脂肪含量的测定结果不同,哥特里 -罗紫法的测定结果高于脂肪酸水解法。
0,0 0 1/ 2 9 4,7 8 1 7,9 2 5 4,7 8 1,0,0 0 1tP,,。
100例 随机化甲组乙组
……
……
分为两组的简化模式完全随机设计,
三、完全随机设计两小样本均数比较本设计是单因素两水平或多水平的实验设计类型。它是将受试对象完全按随机原则分配到各处理组,试验结束后比较各组均数(或率)之间的差别有无统计学意义,推论处理因素的效应
。 因素视为分组,水平即为组数。
1.总体方差相等 ( 且呈正态分布 ) 两小样本均数比较表 3- 6 试验组和对照组空腹血糖下降值( mmol/L)
试验组 X1 - 0.70 - 5.60 2.00 2.80 0.70 3.50 4.00 5.85 7.10 - 0.50
n1=20 2.50 - 1.60 1.70 3.00 0.40 4.50 4.60 2.50 6.00 - 1.40
对照组 X2 3.70 6.50 5.00 5.20 0.80 0.20 0.60 3.40 6.60 - 1.10
n2=20 6.00 3.80 2.00 1.60 2.00 2.20 1.20 3.10 1.70 - 2.00
例 3-7 为研究国产四类新药阿卡波糖胶囊的降血糖效果,
某医院用 40名 2型糖尿病病人进行同期随机对照试验。试验者将这些病人随机等分到试验组 (用阿卡波糖胶囊 )和对照组 (用拜糖平胶囊 ),分别测得试验开始前和 8周后的空腹血糖,算得空腹血糖下降值见表 3-6,能否认为该国产四类新药阿卡波糖胶囊与拜糖平胶囊对空腹血糖的降糖效果不同?
(1)H0,μ1= μ2; H1,μ1≠ μ2,α=0.05,双侧检验。
(2)求 t值:
)(
11
)(
2111
2222
)()(
XXXX
S
XX
S
XX
t
)
11
(
2
)1()1(
)
11
(
2121
2
22
2
11
21
2
)( 21 nnnn
SnSn
nn
SS c
XX
本例 n1=20,,S1= 3.0601;
n2=20,,S2= 2.4205。
代入公式,最终求得 t = 0.642
(3)确定 P值,判断结论:
本例自由度为 38,查 t 值表双侧得 t0.5/2,38= 0.681。
0.642 < 0.681,P > 0.50。
按 α=0.05水准不拒绝 H0,无统计学意义,还不能认为两组降血糖效果不同。
0650.21?X
6 2 5 0.22?X
两大样本均数比较:
当两样本较大,如均大于 60,可按正态分布原理采用 u检验。
2
2
2
1
2
1
21
n
S
n
S
XX
u
2.方差不齐时的 Cochran&Cox近似 t 检验统计量界值
2
2
2
1
2
1
21
n
S
n
S
xx
)(
11
,
22 XX
S
XX
t
12
22
1 1,2 2,
22
1 1 2 2
//
//
S n t S n t
t
S n S n
,
,t
说明:
( 1) 检验是在方差不齐时需对 t 值的 界值 作校正的检验方法,
( 2)当 n1= n2时,可用 t 检验代替 检验,但是查
t 值表时自由度应改用( n-1)。
( 3)当 n1= n2都较大时,可直接用 t 检验或 u 检验。
,t
,t
当 n1= n2 时,公式变为:
22
,1 1 2 2
22
1 1 2 2
( / / )
//
t S n S n
t
S n S n
,
12
22
1 1,2 2,
22
1 1 2 2
//
//
S n t S n t
t
S n S n
,
,t?
,
t
22
1 1 2 2
1 2 1 2
22
12
22
12
2 2 2 2
1 2 1 2
12
( 1 ) ( 1 ) 11
()
2
( 1 ) ( ) 2
()
22
( 1 ) ( ) 2
()
2 ( 1 )
()
n S n S
n n n n
n S S
nn
n S S
nn
S S S S
n n n
当 n1= n2 时,
例 3-8 在上述例 3-7国产四类新药阿卡波糖胶囊的降血糖效果研究中,测得用拜糖平胶囊的对照组
20例病人和用阿卡波糖胶囊的试验组 20例病人,其
8周时糖化血红蛋白 HbA1c(%)下降值如表 3-7。问用两种不同药物的病人其 HbA1c下降值是否不同?
分组 n
对照组 20 1.46 1.36
试验组 20 1.13 0.70
表 3-7 对照组和试验组 HbA1c下降值 (%)
X S
( 1)建立检验假设,确定检验水准
H0,μ1= μ2; H1,μ1≠ μ2,α=0.05,双侧检验。
( 2)计算检验统计量:
965.0
20
70.0
20
36.1
13.146.1
=
)(
11
,
22 XX
S
XX
t
(3)确定 P值,判断结论:
本例 n1= n2,故直接取自由度为 19,查 t 值表双侧得 t0.05/2,19=2.093。
0.965 < 2.093,P > 0.05。
按 α=0.05水准不拒绝 H0,无统计学意义,还不能认为两组病人的 HbA1c下降值 不同。
3.方差不齐时的 Satterthwaite近似 t 检验(略)
4.方差不齐时的 Welch近似 t 检验(略)
以上两种方法是对 自由度进行校正 的近似 t 检验。
第六节 假设检验的注意事项一,Ⅰ 型错误和 Ⅱ 型错误由于假设检验结果的判断是采用小概率原理,在某个 α水准上作出的,具有概率性质,因此结果的判断不可能绝对准确。
将拒绝假设时所犯错误称为 Ⅰ 型错误,用 α表示;
将接受假设时所犯错误称为 Ⅱ 型错误,用 β表示。
两类错误的 关系,α小 β大; α大 β小。
两类错误的 控制,
差别性检验,减少 α控制 Ⅰ 型错误。
方差齐性检验、拟合优度检验、正态性检验、
均衡性检验等需要控制 Ⅱ 型错误,应加大 α,一般取 0.10或 0.20。
增大样本含量可同时减少两型错误。
( 1- β )称为检验效能,其意义为,如果两总体确有差异,按 α 水准所能发现该差异的能力。
α β
成立 1- α1- β
01,H
0?
00,H
图 3- 6 Ⅰ 型错误和 Ⅱ 型错误示意图
(以单侧 u检验为例 )
界值成立表 3- 8 可能发生的两类错误假设检验的结果拒绝,接受”
成立 Ⅰ 型错误 ( α) 推断正确 ( 1- α)
成立 推断正确 ( 1- β) Ⅱ 型错误 ( β)
客观实际
0H
1H
0H 0H
二,假设检验中应注意的问题
1,注意假设检验的前提:可比性。
2,注意正确选择检验方法检验方法的选择依据有:资料类型、设计方案、检验目的、样本大小、分布类型、方差齐性以及检验方法的适用条件等等。
3,注意合理确定单、双侧检验:
单、双侧的确定完全取决于专业知识,用于两个指标比较的 t 检验 u 检验。单侧检验更容易拒绝 H0。
4,注意科学地解释假设检验的结论:
(1)假设检验的结论并非绝对正确。
(2)P值大小不代表差别大小。
(3)注意差别大小有无专业上的实际意义。
6,影响假设检验结论的因素:
( 1)差别大小、( 2)个体差异大小、( 3) n大小,( 4) 单、双侧检验,( 5)检验水准等。
7,注意可信区间与假设检验的区别和联系
( 1)可信区间是推断包含总体均数的范围,假设检验是推断两总体均数是否不等。
( 2)可信区间与假设检验的结论一致例 3- 5 资料从事铅作业工人血红蛋白总体均数的 95%可信区间为
( 122.12,139.54)不包括正常成年男性血红蛋白总体均数 140g/L,故可认为,从事铅作业工人血红蛋白平均含量低于正常成年男性血红蛋白。
( 3)可信区间计算应预先规定概率,假设检验则可获得较为确切的概率。
( 4)可信区间比与假设检验能提供更多的信息
H0
1
图 3- 7 可信区间在统计推断上提供的信息有实际专业意义的值
6
5
4
3
2
第七节 正态性检验检验与方差齐性检验一、正态性检验
1.图示法
( 1)概率图( P-P图)图 3- 8
( 1)分位数图( Q-Q图)图 3- 9
2.计算法
( 1)矩法
( 2) W检验法
( 3) W’ 检验法
( 3) D检验法偏度系数( coefficient of skewness)
偏度是指分布不对称的程度和方向。
322
323
1
)1/(/)()2)(1(
/)(23
nnfXfXnn
nfXfXfXfXn
g
矩法检验
)3)(2(
)1(3
)1/(/)()3)(2)(1(
/)(3/)(64)1(
2
222
242234
2
nn
n
nnfXfXnnn
nfXnfXfXfXfXfXnn
g
峰度系数( coefficient of kurtosis)
峰度是指与正态分布相比峰的冒尖或扁平程度。
在理想状态下,
对称分布,大于 0为正偏态,小于 0为负偏态;
对称分布,大于 0为尖峭峰,小于 0为平阔峰。
- u 检验的检验和 21 gg
11 /1 gg gu
22 /2 gg gu
,0
,0
2
1
g
g
偏度系数标准误峰度系数标准误 )3)(1)(2(
)1(6
1
nnn
nn
g?
)5)(3)(2)(3(
)1(24
2
nnnn
nn
g?
例 3- 9 对模拟随机抽样所得 100个样本均数进行正态性检验:
本例求得:
经查表,两者 u值均小于 0.684,
故 P大于 0.50,不拒绝 H0,还不能认为该资料不服从正态分布。
)总体服从正态分布,( 0,0,210H
)(总体不服从正态分布,0,0,211H
。10.0
599.0,2 4 1 4.0,1 4 4 5.0 111 gg uSg
231.0,4783.0,1104.0 122 gg uSg
,6 8 4.02/5.0?u
二、两组方差齐性检验采用 F检验,F 值计算公式如下,
如果经检验方差齐性,则可采用 t 检验,否则应采用 检验,秩和检验或采用变量变换的法。
(较小)
较大
2
2
2
1 )(
S
S
F?
,t
1
1
22
11
n
n
F 分布,
( 1) 定义公式:
,分别为两个相互独立的随机变量,
,分别为它们的自由度。
2
2?
2?
2
11
2
22
/
/
F
1?
2
1?
分母自由度为 10,分子自由度 (m)分别为
4,10,50,? 时F分布密度函数图形
f(F)
F
( 2)分布曲线,F 分布为一簇单峰正偏态分布曲线,取决于分子和分母两个自由度。
分子自由度为 10,分母自由度 (n)分别为
4,10,50,?时F分布密度函数的图形
f(F)
F
( 3)实际分析时 F 值的计算:
( 4) F 分布与 t 分布,u 分布的关系为:
( 5) F分布曲线下的面积分布附表 3 F界值表( 806页)
2
1
2
2
S
F
S
MS
F
MS
组间组内
96.12/05.0,2/05.0,1 utF
等。、
MS为平均方差例 3- 10 对例 3- 7资料作方差齐性检验
,,
191201 191202
22210,H 22211,H
5 9 8.14 2 0 5.2/0 6 0 1.3 22F
。10.0
查 F 界值表得,1.598<2.15,
故 P大于 0.10,不拒绝 H0,还不能认为两组总体方差不等。(故该资料可采用 t 检验)
注意:
15.2)19,20(,2/10.0?F
)19,19(,2/10.0)19,20(,2/10.0 FF?
例 3- 11 对例 3- 8资料作方差齐性检验查 F 界值表得,3.775 > 2.15,
故 P小于 0.10,拒绝 H0,接受 H1可以认为两组总体方差不等。 (故该资料应采用 检验)
15.2)19,20(,10.0?F
,t
22210,H 2
2211,H
。10.0
775.370.0/36.1 22F
191201 191202
,,
,,
三,变量变换
1,变量变换的意义:
变量变换是指将原变量(原始数据)变换成某种函数值,达到正态分布、方差齐性、曲线的直线化等目的,以满足分析方法对资料的要求。
常用的变量变换方法有对数变换、平方根变换、倒数变换、平方根反正 弦 变换等 。
2,变量变换的方法:
( 1) 对数变换:
用于:
正态化变换 - 对数正态分布资料。
方差齐性变换 - 标准差与均数成比例或变异系数接近某常数时的方差不齐资料。
直线化变换 - 曲线关系资料。
有正负时。,当-或时。有,当
XKXXKXX
XXX
XX
)l g ()l g (
0)1l g (
lg
,,
,
,
( 2) 平方根变换:
或用于:
正态化变换 - 泊松分布资料、轻度偏态资料。
方差齐性变换 - 方差与均数呈正比关系时的方差不齐资料。
1,
,
XX
XX
( 3)平方根反正弦变换:
( 1)用角度表示:
( 2)用弧度表示:
用于观察值为百分数且分布较偏的资料,特别是百分数离散度大的资料,可使资料接近正态分布,并达到方差齐性要求。
XX
XX
1,
1,
s in)
180
(
s in
( 3)倒数变换:
用于数据两端波动较大的资料,
减少极端值的影响。
XX /1,?
结束
1,均数的抽样误差与样本均数的分布:
( 1) 均数的抽样误差 是指样本均数与总体均数之间的差异以及来自同一总体的样本均数之间的差异。
例 3-1 若某市 1999年 18岁男生身高服从均数为
167.7cm,标准差为 5.3cm的正态分布。从该正态分布 N(167.7,5.32)cm总体中随机抽样 100次即共抽取样本 g=100个,,每次样本含量 =10人,得到每个样本均数及标准差如图 3-1和表 3-1所示。
167.41 2.74
jx
jS
165.56 6.57
168.20 5.36
165.69 5.09
… … 100个
n= 10
Ni XXXXX
cm
cm
......,,
3.5
7.1 6 7
321
图 3- 1 1999年某市 18岁男生身高 X~ N (167.7,5.32 )抽样示意图
-
表 3-1资料
1 6 7,6 9
1,6 9
i
i
x
x cm
S cm
组段 频数 频率(%) 累计频数 累计频率(%)
163~ 1 1 1 1
164~ 3 3 4 4
165~ 13 13 17 17
166~ 19 19 36 36
167~ 22 22 58 58
168~ 20 20 78 78
169~ 14 14 92 92
170~ 4 4 96 96
172~ 3 3 99 99
172~ 173 1 1 100 100
合 计 100 100 —— ——
随机 抽样所得 100个样本均数的频数分布图 3- 2 从正态分布总体 X~ N (167.7,5.32 )
随机 抽样所得样本均数分布平均身高 ( cm)
163 164 165 166 167 168 169 170 171 172 173
25 –
20 –
15 –
10 –
5 –
0
样本数
( 2) 样本均数的分布:
如果总体中的观察值的分布为正态分布,
则样本均数的分布也是正态分布。
如果总体中的观察值的分布为非正态分布,只要样本例数足够大( n>60),则均数的分布仍近似正态分布。
2.均数的标准误 ( standard error of mean),
(1)意义,
均数的标准误 简称标准误,是指样本均数的标准差,
衡量样本均数的离散程度。
(2)标准误的计算:
或
(3)标准误与标准差及 n的关系,
n大 小; S小 小。
nx / nss x /?
xS
nkx jx /)1/()( 2
xS
思考:如何降低均数的抽样误差?
(4)标准误的应用,
① 衡量均数的抽样误差
②衡量样本均数的可靠性
③估计总体均数的可信区间
④均数的假设检验。
思考:如何区别标准差和标准误?
3.标准误与标准差之间的区别与联系:
标准误 标准差说明 的离散度,说明 x 的离散度,
衡量抽样误差,衡量个体差异,
表示 的可靠性,表示 的代表性,
n大,小,n大,s 趋于稳定,
估计 μ的可信区间,估计参考值范围,
均数的假设检验。 计算 CV 和 。
联系 n不变时,s 越大,越大。
区别
x
x x
xS
xS
xS
第二节 t 分布一,t 分布的概念
t 值的公式为,
从同一总体中抽取若干 n 相同的样本,并求出样本均数,再代入 t 值公式求得若干个 t 值,将 t 值看成观察值,其分布称为 t 分布。
u 分布,
t 分布:
xsxt /)(
xxu /)(
/)( xu
xsxt /)(
t 值为样本均数与总体均数之差与样本标准误的比值重要概念:
自由度用 υ表示,指计算某一统计量时变量取值不受限制的个数。
一般情况下,υ = n – m
n为计算某一统计量时用到的数据个数,
m为计算该统计量时用到的其他独立统计量个数,
或者计算该统计量时受到限制的条件数。
,υ”为小写希腊字母读作[ nju,]
自由度
t 分布的用途
1.小样本时总体均数的估计,
2.均数比较时的假设检验,
3.相关系数的假设检验。
二,t 分布的特征,
(1)单峰;
(2) t 值有正有负,均数为 0;
(3)以 0为中心左右对称;
(4)一簇曲线,每个自由度为一条曲线;
(5)自由度越小,峰越矮,尾越翘,随着自由度增加,t 分布曲线逐渐逼近标准正态分布曲线;
(6)当自由度为无穷大时,t 分布曲线和标准正态分布曲线完全吻合。
f(t)?=∞(标准正态曲线 )
=5
=1
0.1
0.2
-4 -3 -2 -1 0 1 2 3 4
0.3
自由度分别为 1,5,∞时的 t 分布三,t 分布的图形 (
四,t 分布曲线下的面积分布
t 界值表:见附表 2( 804页)。
左侧为自由度,从 1~ ∞;
上方为概率,指曲线下尾部面积,分为单侧和双侧(单尾和双尾);
中间为 t 值的绝对值,即图形中横坐标的位置。
单侧 t 界值的表示方法:
双侧 t 界值的表示方法:
,t
,2/t
- t 0 t
t 值表示意图同一自由度时,P值越小 t 值越大;
同一 P值时,自由度越大 t 值越小;
自由度= ∞时,t 值= u 值;
812.110,05.0?t
当自由度= 10,单侧曲线下面积概率为 0.05
时,t 值在横坐标上的位置是 1.812。
或者理解为:在上述条件下进行抽样研究,
95%的 t 值应小于 1.812,大于和等于 1.812
者仅有 5%。
的含义为:
228.210,2/05.0?t
的含义?
0 1.812
5%
0 2.228
2.5%
- 1.812
- 2.228 1 2
第三节 总体均数 (μ)的估计一,可信区间的概念用样本指标估计总体指标称为参数估计,
方法有点值估计和区间估计两种。
μ的点值估计:
将样本均数作为 μ的估计值,由于抽样误差的存在,所以 μ的点值估计准确度较低。
μ的 区间估计,
考虑抽样误差并按一定的可信度计算包含
μ在内的一个范围,称为 区间估计,该范围称为可信区间,常用双侧 95%。
可信限是指两个界值二、总体均数可信区间的计算
1.单一总体均数的可信区间
( 1) σ未知,n ≤60,按 t 分布。
双侧 1- α可信区间 (95%,)
单侧 1- α可信区间或
),(,2/05.0,2/05.0 XX StXStX
XStX,05.0XStX,05.0
0,0 5
例 3-2 在例 3-1中抽得第 15号样本的均数
(cm),标准差 (cm),试求其总体均数的 95%可信区间。
故该地 18岁男生身高均数的 95%
可信区间为( 164.35,169.55) (cm)。
)(1 5 1 1.1
10
64.3 cmS
x
3,6 4S?1 6 6,9 5X?
)1 5 1 1.1262.295.166,1 5 1 1.1262.295.166(
262.29,2/05.0
t
例:随机检查了 20名慢性胃炎脾虚男病人,其脉搏均数为 74.3次 /分,标准差为 6.4次 /分,试估计该类病人脉搏总体均数的 95%可信区间。
本例 n=20,ν=19,t0.05/2,19= 2.093,95%可信区为:
( 74.3-2.093× 6.4 /,74.3+ 2.093× 6.4 / )
即 ( 71.3次 /分,77.3次 /分 )。
20 20
(2) σ未知,n >60,按 u分布。
双侧 1- α可信区间单侧 1- α可信区间或
),( 2/2/ xx suXsuX
XSuXXSuX
/xS S n?
例,随机检查 140例成年男子的红细胞数得:
试估计该地成年男子红细胞数 95%可信区间。
( 4.79 - 1.96× 0.42 /,4.79 +1.96× 0.42 / )
= (4.72 ×,4.86 × )L/10 12
140140
LsLx /1042.0,/1079.4 1212
L/10 12
例 3-3 某地抽得正常成人 200名,测得其血清胆固醇的均数为 3.64 mmol/L,标准差为 1.20mmol/L,
试估计该地正常成人血清胆固醇均数的 95%可信区间。
0849.0
200
20.1
xS
)+,-( 0 8 4 9.096.164.30 8 4 9.096.164.3
故该地正常成人血清胆固醇均数的 95%可信区间为( 3.47,3.91) mmol/L 。
(3)σ已知,按 u 分布双侧 1- α可信区间单侧 1- α可信区间或
),( 2/2/ xx uXuX
XuXXuX
/x n
2.两总体均数之差的可信区间双侧 1- α可信区间单侧 1- α可信区间或
)(,2/21 21)( XXStXX
)(,21 21)( XXStXX
)(,21 21)( XXStXX
为两均数之差标准误,计算公式:
为合并方差
2
)1()1(
)
11
(
21
2
22
2
112
21
2
)(
2
1
nn
SnSn
S
nn
SS
c
cXX
2
cS
)( 21 XXS?
当两样本含量均大于 60,可用 u值代替 t值进行估计,也可用以下公式计算:
)( 21 XXS?
2
2
2
1
2
1
)( 21
n
S
n
S
S
XX
例 3-4 为了解甲氨蝶呤 (MTX)对外周血 IL-2水平的影响,某医生将 61名哮喘患者随机分为两组。
其中对照组 29例 ( ),采用安慰剂;试验组 32例
( ),采用小剂量甲氨蝶呤 (MTX)进行治疗。
测得对照组治疗前 IL-2的均数为 20.10 IU/ml ( ),
标准差为 7.02 IU/ml ( );试验组治疗前 IL-2的均数为 16.89 IU/ml ( ),标准差为 8.46 IU/ml
( )。问两组治疗前基线的 IL-2总体均数相差有多大?
1S
1n
2n
1X
2X
0 0 2 3.2)321291(23229 46.8)132(02.7)129(
22
)( 21
XXS
mlIU
t
/)21.7,79.0(
0 0 2 3.2000.2)89.1610.20(
000.2
60,2/05.0
故两组治疗前基线的 IL-2总体均数之差的 95%
可信区间为(- 0.79,7.21) IU/ml。
三、可信区间的确切含义和两个要素如果能够进行重复抽样试验,平均有 1- α
的可信区间包含了总体参数,而不是总体参数落在该范围的可能性为 1- α。
可信区间的 两个要素,
(1)准确度:包含总体参数的概率大小;
(2)精密度:可信区间的长度。
注意准确度和精密度的关系增加样本含量可提高精密度四、总体均数可信区间与参考值范围的区别;
可信区间 参考值范围含义计算用途
(
双侧大样本
)
XSX 96.1?
SX 96.1?
( 95%)
估计总体均数 判断个体指标正常与否是指包含 μ在内的范围,或样本均数的分布范围。
是指正常人某指标(观察值)
的波动 范围。
第四节 假设检验 (hypothesis test)
例 3-5 某医生测量了 36名从事铅作业男性工人的血红蛋白含量,算得其均数为 130.83g/L,标准差为 25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值 140g/L?
已知总体 未知总体
30
/74.25
/3.130
n
LgS
LgXLg /140
0
≠
?
图 3- 4 例 3- 5示意图一、假设检验的概念:
先对总体参数或分布作出某种假设,然后用适当的方法计算检验统计量,根据该检验统计量的分布理论,推断假设 是否拒绝 。
二、假设检验的种类:
根据检验目的分为,差别性检验,方差齐性检验、
拟合优度检验、正态性检验、均衡性检验等。
根据检验统计量命名分为,
检验、秩和检验等。检验、检验、检验,2?Fut
三、假设检验的意义,
通过对事物 数量差异 的比较分析,判断事物间有无 质量区别 。
四、假设检验的基本思想:
小概率反证法思想。
五,假设检验的一般步骤以例 3-5为例,说明假设检验的一般步骤:
1,建立假设,确定检验检验水准:
( 1)检验假设 H0,μ=μ0,
( 2)备择假设 H1,μ≠μ0,双侧检验。
注意,①针对总体;
②相互联系、相互对立,缺一不可;
③情况不同假设不同;
④单、双侧检验时 H1 不同。
单、双侧检验两个指标 比较时,从 专业 角度考虑:
如果甲指标大于乙指标或甲指标小于乙指标都可能发生则为 双侧检验 ;
如果甲指标不可能大于(或小于)乙指标,只需检验是否小于(或大于)乙指标则为 单侧检验 。
表 3- 3 样本均数(代表未知 )与已知总体均数 比较的 t 检验?
0?
目的
0
0
1H0H
0
0
0
0 0
0
0
双侧检验 是否单侧检验是否是否检验水准符号为 α,它是人为规定的小概率事件的判断标准,即 H0拒绝与否的概率界限,或犯第一类错误的概率,一般取 0.05。
2.选定检验方法,计算检验统计量:
检验方法的选择依据有:资料类型、设计方案、检验目的、样本大小、分布类型、方差齐性以及检验方法的适用条件等等。
本例选择单样本 t 检验,( 为什么? )
( 3)检验水准
138.2
36/74.25
14083.130
/
0
nS
X
t
3,确定 P值,作出推断和结论:
P值的大小根据检验统计量的理论界值表查得。
本例自由度 ν= 35,查 t 值表得
t0.05/2,35 = 2.030,t0.02/2,35 = 2.438,
2.030< 2.138< 2.438,故 0.02<P < 0.05。
当 P >α时,无统计学意义,不拒绝 H0;
P ≤ α时,有统计学意义,拒绝 H0,接受 H1 。
本例 P <0.05,即 P <α,故拒绝 H0,接受 H1 。
结论:可以认为从事铅作业的男性工人平均血红蛋白含量低于正常男性。
第五节 t 检验一、单样本 t 检验
(样本均数与总体均数比较)
二、配对样本 t 检验
(配对设计比较)
1,
/
n
nS
d
t
d
d
1,
/
0
n
nS
X
t?
三、两样本 t 检验
(成组比较)
四,几何均数比较的 t 检验先将观察值进行对数变换,再用上述均数比较的方法进行检验。( 52页)
2,21
)(
21
21
nn
S
XX
t
XX
五,t 检验的条件,
1.小样本资料;
2.正态分布资料;
3.组间比较时要求总体方差相等。
六,u 检验( 48页),当 n > 60,t 分布接近 u分布,
或者已知总体标准差( σ)时均可采用 u 检验。
000.2960.1
96.1,000.2 2/05.060,2/05.0
ut
一、样本均数与总体均数比较
1,总体标准差已知:
2,总体标准差未知,样本较大( n > 60):
3,总体标准差未知,样本较小 (例 3- 5)
)//(0 nsXt
)//(0 nsXu
)//(0 nXu
二,配对设计资料的 t 检验配对设计 包括异体配对和同体配对两种。
异体配对是将两个条件相近的对象配成一对,
然后随机化地接受两种处理;
模式:
甲组 ……
乙组 ……
随机同体配对 是对同一观察对象分别接受两种处理后的结果进行比较,又称自身配对,包括:
①在两个部位用两种不同方法处理后进行比较;
②先后用两种方法处理后进行比较;
③同一对象的检测标本用两种方法检测;
④ 同一对象接受一种处理前后比较等。
关于一种处理前后的比较是一种特殊的同体配对设计,
又可称为前后测量设计,见第十二章,262页。
配对 t 检验步骤如下,(设定 d为正态分布 )
补充例子:
1,H0,= 0; H1,> 0,单侧检验,
α=0.05,单侧。
2,计算 t 值:
cmndd 16.2106.21/
d? d
ns
d
s
d
t
dd
d
/
0?
三棱莪术液抑瘤实验的结果对子数 对照组 注射药液组 差值( )
1 3.6 3.0 0.6 0.36
2 4.5 2.3 2.2 4.84
3 4.2 2.4 1.8 3.24
4 4.4 1.1 3.3 10.89
5 3.7 4.0 -0.3 0.09
6 5.6 3.7 1.9 3.61
7 7.0 2.7 4.3 18.49
8 4.1 1.9 2.2 4.84
9 5.0 2.6 2.4 5.75
10 4.5 1.3 3.2 10.24
合计 --- --- 21.6 62.36
2dd
167.5418.0/16.2
0
d
s
d
t
110
10/)6.21(36.62
1
/)( 222
n
ndd
s d
cmnss dd 418.010/321.1/
cm321.1?
3.确定 P值,作出判断和结论:
计算自由度 =10 - 1= 9,查 t 值表得单侧因 5.167>1.833,故 P < 0.05 。
按 = 0.05水准,拒绝 H0,接受 H1 。可以认为三棱莪术液有抑瘤作用。
,8 3 3.19,05.0?t
例 3-6 为比较两种方法对乳酸饮料中脂肪含量测定结果是否不同,随机抽取了 10份乳酸饮料制品,分别用脂肪酸水解法和哥特里-罗紫法测定其结果如表 3-5第 (1)~(3)栏。问两法测定结果是否不同?
编号 哥特里-罗紫法 脂肪酸水解法 差值 d
(1 ) (2) (3) (4)=(2)? ( 3)
1 0.840 0.580 0.260
2 0.591 0.509 0.082
3 0.674 0.500 0.174
4 0.632 0.316 0.316
5 0.687 0.337 0.350
6 0.978 0.517 0.461
7 0.750 0.454 0.296
8 0.730 0.512 0.218
9 1.200 0.997 0.203
10 0.870 0.506 0.364
2.724
表 3-5 两种方法对乳酸饮料中脂肪含量测定结果
( 1)建立检验假设,确定检验水准
H0,= 0; H1,≠ 0,
α=0.05,双侧检验。
( 2)计算检验统计量:
d? d
20,8 4 8 3 ( 2,7 2 4 ) / 1 0
0,1 0 8 7
1 0 1d
s
0,2 7 2 4 7,9 2 5
0,1 0 8 7 / 1 0
t
21 0,2,7 2 4,0,8 4 8 3,0,2 7 2 4n d d d本例 。
( 3) 确定 P值,作出判断和结论:
查 t值表得,
按 α =0.05水准拒绝 H0,接受 H1,可以认为两种方法对脂肪含量的测定结果不同,哥特里 -罗紫法的测定结果高于脂肪酸水解法。
0,0 0 1/ 2 9 4,7 8 1 7,9 2 5 4,7 8 1,0,0 0 1tP,,。
100例 随机化甲组乙组
……
……
分为两组的简化模式完全随机设计,
三、完全随机设计两小样本均数比较本设计是单因素两水平或多水平的实验设计类型。它是将受试对象完全按随机原则分配到各处理组,试验结束后比较各组均数(或率)之间的差别有无统计学意义,推论处理因素的效应
。 因素视为分组,水平即为组数。
1.总体方差相等 ( 且呈正态分布 ) 两小样本均数比较表 3- 6 试验组和对照组空腹血糖下降值( mmol/L)
试验组 X1 - 0.70 - 5.60 2.00 2.80 0.70 3.50 4.00 5.85 7.10 - 0.50
n1=20 2.50 - 1.60 1.70 3.00 0.40 4.50 4.60 2.50 6.00 - 1.40
对照组 X2 3.70 6.50 5.00 5.20 0.80 0.20 0.60 3.40 6.60 - 1.10
n2=20 6.00 3.80 2.00 1.60 2.00 2.20 1.20 3.10 1.70 - 2.00
例 3-7 为研究国产四类新药阿卡波糖胶囊的降血糖效果,
某医院用 40名 2型糖尿病病人进行同期随机对照试验。试验者将这些病人随机等分到试验组 (用阿卡波糖胶囊 )和对照组 (用拜糖平胶囊 ),分别测得试验开始前和 8周后的空腹血糖,算得空腹血糖下降值见表 3-6,能否认为该国产四类新药阿卡波糖胶囊与拜糖平胶囊对空腹血糖的降糖效果不同?
(1)H0,μ1= μ2; H1,μ1≠ μ2,α=0.05,双侧检验。
(2)求 t值:
)(
11
)(
2111
2222
)()(
XXXX
S
XX
S
XX
t
)
11
(
2
)1()1(
)
11
(
2121
2
22
2
11
21
2
)( 21 nnnn
SnSn
nn
SS c
XX
本例 n1=20,,S1= 3.0601;
n2=20,,S2= 2.4205。
代入公式,最终求得 t = 0.642
(3)确定 P值,判断结论:
本例自由度为 38,查 t 值表双侧得 t0.5/2,38= 0.681。
0.642 < 0.681,P > 0.50。
按 α=0.05水准不拒绝 H0,无统计学意义,还不能认为两组降血糖效果不同。
0650.21?X
6 2 5 0.22?X
两大样本均数比较:
当两样本较大,如均大于 60,可按正态分布原理采用 u检验。
2
2
2
1
2
1
21
n
S
n
S
XX
u
2.方差不齐时的 Cochran&Cox近似 t 检验统计量界值
2
2
2
1
2
1
21
n
S
n
S
xx
)(
11
,
22 XX
S
XX
t
12
22
1 1,2 2,
22
1 1 2 2
//
//
S n t S n t
t
S n S n
,
,t
说明:
( 1) 检验是在方差不齐时需对 t 值的 界值 作校正的检验方法,
( 2)当 n1= n2时,可用 t 检验代替 检验,但是查
t 值表时自由度应改用( n-1)。
( 3)当 n1= n2都较大时,可直接用 t 检验或 u 检验。
,t
,t
当 n1= n2 时,公式变为:
22
,1 1 2 2
22
1 1 2 2
( / / )
//
t S n S n
t
S n S n
,
12
22
1 1,2 2,
22
1 1 2 2
//
//
S n t S n t
t
S n S n
,
,t?
,
t
22
1 1 2 2
1 2 1 2
22
12
22
12
2 2 2 2
1 2 1 2
12
( 1 ) ( 1 ) 11
()
2
( 1 ) ( ) 2
()
22
( 1 ) ( ) 2
()
2 ( 1 )
()
n S n S
n n n n
n S S
nn
n S S
nn
S S S S
n n n
当 n1= n2 时,
例 3-8 在上述例 3-7国产四类新药阿卡波糖胶囊的降血糖效果研究中,测得用拜糖平胶囊的对照组
20例病人和用阿卡波糖胶囊的试验组 20例病人,其
8周时糖化血红蛋白 HbA1c(%)下降值如表 3-7。问用两种不同药物的病人其 HbA1c下降值是否不同?
分组 n
对照组 20 1.46 1.36
试验组 20 1.13 0.70
表 3-7 对照组和试验组 HbA1c下降值 (%)
X S
( 1)建立检验假设,确定检验水准
H0,μ1= μ2; H1,μ1≠ μ2,α=0.05,双侧检验。
( 2)计算检验统计量:
965.0
20
70.0
20
36.1
13.146.1
=
)(
11
,
22 XX
S
XX
t
(3)确定 P值,判断结论:
本例 n1= n2,故直接取自由度为 19,查 t 值表双侧得 t0.05/2,19=2.093。
0.965 < 2.093,P > 0.05。
按 α=0.05水准不拒绝 H0,无统计学意义,还不能认为两组病人的 HbA1c下降值 不同。
3.方差不齐时的 Satterthwaite近似 t 检验(略)
4.方差不齐时的 Welch近似 t 检验(略)
以上两种方法是对 自由度进行校正 的近似 t 检验。
第六节 假设检验的注意事项一,Ⅰ 型错误和 Ⅱ 型错误由于假设检验结果的判断是采用小概率原理,在某个 α水准上作出的,具有概率性质,因此结果的判断不可能绝对准确。
将拒绝假设时所犯错误称为 Ⅰ 型错误,用 α表示;
将接受假设时所犯错误称为 Ⅱ 型错误,用 β表示。
两类错误的 关系,α小 β大; α大 β小。
两类错误的 控制,
差别性检验,减少 α控制 Ⅰ 型错误。
方差齐性检验、拟合优度检验、正态性检验、
均衡性检验等需要控制 Ⅱ 型错误,应加大 α,一般取 0.10或 0.20。
增大样本含量可同时减少两型错误。
( 1- β )称为检验效能,其意义为,如果两总体确有差异,按 α 水准所能发现该差异的能力。
α β
成立 1- α1- β
01,H
0?
00,H
图 3- 6 Ⅰ 型错误和 Ⅱ 型错误示意图
(以单侧 u检验为例 )
界值成立表 3- 8 可能发生的两类错误假设检验的结果拒绝,接受”
成立 Ⅰ 型错误 ( α) 推断正确 ( 1- α)
成立 推断正确 ( 1- β) Ⅱ 型错误 ( β)
客观实际
0H
1H
0H 0H
二,假设检验中应注意的问题
1,注意假设检验的前提:可比性。
2,注意正确选择检验方法检验方法的选择依据有:资料类型、设计方案、检验目的、样本大小、分布类型、方差齐性以及检验方法的适用条件等等。
3,注意合理确定单、双侧检验:
单、双侧的确定完全取决于专业知识,用于两个指标比较的 t 检验 u 检验。单侧检验更容易拒绝 H0。
4,注意科学地解释假设检验的结论:
(1)假设检验的结论并非绝对正确。
(2)P值大小不代表差别大小。
(3)注意差别大小有无专业上的实际意义。
6,影响假设检验结论的因素:
( 1)差别大小、( 2)个体差异大小、( 3) n大小,( 4) 单、双侧检验,( 5)检验水准等。
7,注意可信区间与假设检验的区别和联系
( 1)可信区间是推断包含总体均数的范围,假设检验是推断两总体均数是否不等。
( 2)可信区间与假设检验的结论一致例 3- 5 资料从事铅作业工人血红蛋白总体均数的 95%可信区间为
( 122.12,139.54)不包括正常成年男性血红蛋白总体均数 140g/L,故可认为,从事铅作业工人血红蛋白平均含量低于正常成年男性血红蛋白。
( 3)可信区间计算应预先规定概率,假设检验则可获得较为确切的概率。
( 4)可信区间比与假设检验能提供更多的信息
H0
1
图 3- 7 可信区间在统计推断上提供的信息有实际专业意义的值
6
5
4
3
2
第七节 正态性检验检验与方差齐性检验一、正态性检验
1.图示法
( 1)概率图( P-P图)图 3- 8
( 1)分位数图( Q-Q图)图 3- 9
2.计算法
( 1)矩法
( 2) W检验法
( 3) W’ 检验法
( 3) D检验法偏度系数( coefficient of skewness)
偏度是指分布不对称的程度和方向。
322
323
1
)1/(/)()2)(1(
/)(23
nnfXfXnn
nfXfXfXfXn
g
矩法检验
)3)(2(
)1(3
)1/(/)()3)(2)(1(
/)(3/)(64)1(
2
222
242234
2
nn
n
nnfXfXnnn
nfXnfXfXfXfXfXnn
g
峰度系数( coefficient of kurtosis)
峰度是指与正态分布相比峰的冒尖或扁平程度。
在理想状态下,
对称分布,大于 0为正偏态,小于 0为负偏态;
对称分布,大于 0为尖峭峰,小于 0为平阔峰。
- u 检验的检验和 21 gg
11 /1 gg gu
22 /2 gg gu
,0
,0
2
1
g
g
偏度系数标准误峰度系数标准误 )3)(1)(2(
)1(6
1
nnn
nn
g?
)5)(3)(2)(3(
)1(24
2
nnnn
nn
g?
例 3- 9 对模拟随机抽样所得 100个样本均数进行正态性检验:
本例求得:
经查表,两者 u值均小于 0.684,
故 P大于 0.50,不拒绝 H0,还不能认为该资料不服从正态分布。
)总体服从正态分布,( 0,0,210H
)(总体不服从正态分布,0,0,211H
。10.0
599.0,2 4 1 4.0,1 4 4 5.0 111 gg uSg
231.0,4783.0,1104.0 122 gg uSg
,6 8 4.02/5.0?u
二、两组方差齐性检验采用 F检验,F 值计算公式如下,
如果经检验方差齐性,则可采用 t 检验,否则应采用 检验,秩和检验或采用变量变换的法。
(较小)
较大
2
2
2
1 )(
S
S
F?
,t
1
1
22
11
n
n
F 分布,
( 1) 定义公式:
,分别为两个相互独立的随机变量,
,分别为它们的自由度。
2
2?
2?
2
11
2
22
/
/
F
1?
2
1?
分母自由度为 10,分子自由度 (m)分别为
4,10,50,? 时F分布密度函数图形
f(F)
F
( 2)分布曲线,F 分布为一簇单峰正偏态分布曲线,取决于分子和分母两个自由度。
分子自由度为 10,分母自由度 (n)分别为
4,10,50,?时F分布密度函数的图形
f(F)
F
( 3)实际分析时 F 值的计算:
( 4) F 分布与 t 分布,u 分布的关系为:
( 5) F分布曲线下的面积分布附表 3 F界值表( 806页)
2
1
2
2
S
F
S
MS
F
MS
组间组内
96.12/05.0,2/05.0,1 utF
等。、
MS为平均方差例 3- 10 对例 3- 7资料作方差齐性检验
,,
191201 191202
22210,H 22211,H
5 9 8.14 2 0 5.2/0 6 0 1.3 22F
。10.0
查 F 界值表得,1.598<2.15,
故 P大于 0.10,不拒绝 H0,还不能认为两组总体方差不等。(故该资料可采用 t 检验)
注意:
15.2)19,20(,2/10.0?F
)19,19(,2/10.0)19,20(,2/10.0 FF?
例 3- 11 对例 3- 8资料作方差齐性检验查 F 界值表得,3.775 > 2.15,
故 P小于 0.10,拒绝 H0,接受 H1可以认为两组总体方差不等。 (故该资料应采用 检验)
15.2)19,20(,10.0?F
,t
22210,H 2
2211,H
。10.0
775.370.0/36.1 22F
191201 191202
,,
,,
三,变量变换
1,变量变换的意义:
变量变换是指将原变量(原始数据)变换成某种函数值,达到正态分布、方差齐性、曲线的直线化等目的,以满足分析方法对资料的要求。
常用的变量变换方法有对数变换、平方根变换、倒数变换、平方根反正 弦 变换等 。
2,变量变换的方法:
( 1) 对数变换:
用于:
正态化变换 - 对数正态分布资料。
方差齐性变换 - 标准差与均数成比例或变异系数接近某常数时的方差不齐资料。
直线化变换 - 曲线关系资料。
有正负时。,当-或时。有,当
XKXXKXX
XXX
XX
)l g ()l g (
0)1l g (
lg
,,
,
,
( 2) 平方根变换:
或用于:
正态化变换 - 泊松分布资料、轻度偏态资料。
方差齐性变换 - 方差与均数呈正比关系时的方差不齐资料。
1,
,
XX
XX
( 3)平方根反正弦变换:
( 1)用角度表示:
( 2)用弧度表示:
用于观察值为百分数且分布较偏的资料,特别是百分数离散度大的资料,可使资料接近正态分布,并达到方差齐性要求。
XX
XX
1,
1,
s in)
180
(
s in
( 3)倒数变换:
用于数据两端波动较大的资料,
减少极端值的影响。
XX /1,?
结束