医疗等本科班,医学统计学,Dr,宇传华 制作第三章两组资料均数的比较 2
2009年 7月 28日第四军医大学卫生统计学教研室第三节 t检验( t test)
t检验,亦称 student t检验( Student’s t
test),主要用于样本含量较小(例如 n<30),
总体标准差 σ 未知的正态分布资料。
一、样本均数与总体均数的比较二、配对资料的比较三、两 样本均数的比较四、大样本均数比较的 u检验五、正态性检验与两方差齐性检验
2009年 7月 28日第四军医大学卫生统计学教研室一、样本均数与总体均数的比较推断样本所代表的未知总体均数 μ与已知总体均数 μ0有无差别。
已知总体均数 μ0一般为理论值、标准值或经大量观察所得的稳定值。
统计量 t的计算公式:
1,
|||| 00

n
nS
X
S
X
t
X

2009年 7月 28日第四军医大学卫生统计学教研室实 例例 3 - 7 难 产 儿 出 生 体 重 n =35,X =3.42,S =0.40,
一 般 婴 儿 出 生 体 重
0
= 3.30 ( 大 规 模 调 查 获 得 ),问 相 同 否?
解,1,建 立 假 设,确 定 检 验 水 准 α
H 0,
0
( 无 效 假 设,n ull hypothesis )
H 1,
0
( 备 择 假 设,alter native hypothesis,)
双 侧 检 验,检 验 水 准,α = 0,05
2,计 算 检 验 统 计 量
77.1
35/40.0
30.342.3
t,341351 n?
3,查 相 应 界 值 表,确 定 P 值,下 结 论查 附 表 2,032.2
34,2/05.0
t,
34,2/05.0
tt?,P >0.05,
按 α = 0.05 水 准,不 拒 绝 H 0,两 者 的 差 别 无 统 计 学 意 义
2009年 7月 28日第四军医大学卫生统计学教研室附表 2 t界值表
2009年 7月 28日第四军医大学卫生统计学教研室可信区间方法解答例 3-7
难 产 儿 出 生 体 重 的 9 5 % 可 信 区 间 为,
nStXStX
x
/
34,2/05.0,2/05.0

=3.28 ~ 3.55,
而 30.3
0
,在 可 信 区 间 范 围 内,故 不 能 认 为难 产 儿 出 生 体 重 的 总 体 均 数 与 一 般 婴 儿 不 同 。
反 之,若 可 信 区 间 范 围 不 包 含
0
,则 认 为 难 产儿 平 均 出 生 体 重 与 一 般 婴 儿 的 出 生 体 重 不 同 。
2009年 7月 28日第四军医大学卫生统计学教研室根据专业知识确定单、双侧检验如 果 有 理 由 认 为 难 产 儿 出 生 体 重 的 总 体 均 数 一 定 大 于 一 般婴 儿 则 可 用 单 侧 检 验 ( o ne - s i d e d ),即,
H 0,30.3 ( 难 产 儿 出 生 体 重 的 总 体 均 数 与 一 般 婴 儿 相 等 )
H 1,30.3 ( 难 产 儿 出 生 体 重 的 总 体 均 数 大 于 一 般 婴 儿 )
单 侧 检 验,检 验 水 准,α = 0,0 5
查 附 表 2 单 侧 t 界 值 691.1
34,05.0
t,
34,05.0
77.1 tt,P < 0,0 5,
按 α = 0,0 5 水 准,拒 绝 H 0,接 受 H 1,两 者 的 差 别 有 统 计 学 意 义,
难 产 儿 平 均 出 生 体 重 大 于 一 般 婴 儿 。
以 上 双 侧 检 验 和 单 侧 检 验 的 结 论 截 然 不 同 。 所 以 选 择 单 侧 检 验一 定 要 有 过 硬 的 专 业 依 据,而 且 在 发 表 论 文 时 要 特 别 注 明 。 一 般 情况 都 一 律 采 用 双 侧 检 验 ( two - s i d e d ) 。
2009年 7月 28日第四军医大学卫生统计学教研室二、配对资料的比较两种情况,1.随机配对设计 (randomized
paired design)是将受试对象按某些混杂因素(如性别、年龄、窝别等) 配成对子,每对中的两个个体随机分配给两种处理(如处理组与对照组); 2.或者 同一受试对象 作两次不同的处理 (自身对照 )。
优点,配对设计 减少了个体差异 。
特点,资料成对,每对数据不可拆分。
计算出各对 子 差值 d 的均数 d 。当 比较 组 间 效果相 同时,
d 的总体均数
d
= 0,故可将配对 设计资料的假 设检验视为样本均数 d 与总体均 数
d
=0 的比较,所用 方法 称 为配对 t 检验
( p a i r e d t - te s t )方法 。 1,
/
||||

n
nS
d
S
d
t
dd
d
2009年 7月 28日第四军医大学卫生统计学教研室表 3-3 两法测定 12份尿铅含量的结果
2d样品号尿铅含量( μmol.L - 1)
简便法 常规法 差值( d )
1 2.41 2.80 -0.39 0.1521
2 2.90 3.04 -0.14 0.0196
3 2.75 1.88 0.87 0.7569
4 3.23 3.43 -0.20 0.0400
5 3.67 3.81 -0.14 0.0196
6 4.49 4.00 0.49 0.2401
7 5.16 4.44 0.72 0.5184
8 5.45 5.41 0.04 0.0016
9 2.06 1.24 0.82 0.6724
10 1.64 1.83 -0.19 0.0361
11 1.06 1.45 -0.39 0.1521
12 0.77 0.92 -0.15 0.0225
合 计 -- -- 1.34 2.6314
2009年 7月 28日第四军医大学卫生统计学教研室表 3-3 两法测定 12份尿铅含量的结果
1,建 立 假 设,确 定 检 验 水 准 α
H 0,0?
d
H 1,0?
d
( 双 侧 检 验 ) α = 0,0 5
2,计 算 检 验 统 计 量
112.01234.1d, 34.1d, 6314.2
2
d,
475.0
112
12/34.16314.2
1
/)(
222

n
ndd
S
d
111121,817.0
12/475.0
112.0
/
||
n
nS
d
t
d
3,查 相 应 界 值 表,确 定 P 值,下 结 论 。
查 表 201.2
11,2/05.0
t,
11,2/05.0
tt?,P > 0,0 5,按 α = 0,0 5 水 准,
不 拒 绝 H 0,两 种 方 法 的 测 量 结 果 差 值 无 统 计 学 意 义 。
2009年 7月 28日第四军医大学卫生统计学教研室三、两样本均数的比较完全随机设计 (completely random design),把受试对象完全随机分为两组,分别给予不同处理,然后比较独立的两组样本均数。各组对象数不必严格相同。
目的,比较两总体均数是否相同。
条件:假定资料来自正态总体,σ 12=σ 22
计算公式:
)11(
21
2
- 21 nnSS cXX
2-
)1-()1-(
1-1-
/)(-/)(-
21
2
22
2
11
21
2
2
2
2
21
2
1
2
12
nn
SnSn
nn
nXXnXXS
c?

∑ ∑∑∑
2-1-1-,- 2121
-
21
21
nnnnS XXt
XX

其中,均数差的标准误
2009年 7月 28日第四军医大学卫生统计学教研室实 例例 3 - 9 白 血 病 组 )(
1
X,1 2,3 13,2 13,7 15,2 15,4 15,8 1 6,9
正 常 组 )(
2
X,1 0.8 11,6 12,3 12,7 13,5 13,5 14,8
问 正 常 鼠 和 白 血 病 鼠 脾 脏 中 DNA 平 均 含 量 ( mg/g ) 是 否 不 同?
解,本 例,
1
n = 7,
1
X =1 4.6 4,
1
S = 1,62,
2
n = 7,
2
X =1 2,74,
2
S = 1,33
1,建 立 假 设,确 定 检 验 水 准 α 。
H 0,
21
H
1,
21
α =0,0 5
2,计 算 检 验 统 计 量 。
22
2
( 7 1 ) 1.62 ( 7 1 ) 1.33
2.20
772
c
S



12
2
12
|| | 14.6 4 12.7 4 |
2.39
1 1 1 1
( ) 2.20 ( )
77
c
XX
t
S
nn



,12277
3,查 相 应 界 值,确 定 P 值,下 结 论 。
查 表 179.2
12,2/05.0
t,
0,0 5 / 2,1 2
tt?,P < 0,0 5,不 拒 绝 H
0,…
2009年 7月 28日第四军医大学卫生统计学教研室四、大样本均数比较的 u检验两样本均数比较时 当每组样本量大于 30(
或 50)时,可采用 u检验;但只是 近似方法 。
优点:简单,u界值与自由度无关,
u0.05= 1.96,u0.01= 2.58
22
21
2
2
2
1
2
1
2121
21
21 XXXX SS
XX
n
S
n
S
XX
S
XX
u
2009年 7月 28日第四军医大学卫生统计学教研室五、正态性检验与两方差齐性检验
1,正态性检验( normality test):
统计指标,偏度系数、峰度系数; W
值,D值等统计图,P- P图,Q- Q图、直方图、
茎叶图、箱图等
2,方差齐性检验
2009年 7月 28日第四军医大学卫生统计学教研室
2,方差齐性检验例 3 - 1 0 在 例 3 - 9 中 两 总 体 方 差 是 否 相 等?
解,1,建 立 假 设,确 定 检 验 水 准 α 。
H 0,
2
2
2
1
H 1,
2
2
2
1
α = 0,0 5
2,计 算 检 验 统 计 量 。
61,61,484.1
33.1
62.1)(
22112
2
2
2
2
1
nn
S
S
F
(小)

3,查 相 应 界 值 表,确 定 P 值,下 结 论 。
查 附 表 3( 方 差 齐 性 检 验 用 ) 双 侧 界 值 的 F 界 值 表,得 82.5
6,6,2/05.0
F,

6,6,2/05.0
484.1 FF,P > 0,0 5,按 α = 0,0 5 水 准,不 拒 绝 H 0,两 组 总 体方 差 的 差 别 无 统 计 学 意 义,尚 不 能 认 为 两 组 总 体 方 差 不 等 。 若 两 总 体 方 差 不 等,即 2
2
2
1 时,
1,近 似 t 检 验 ( s e p a r a t e v a r i a n c e e s t i m a t i o n t - t e s t ) t ' 检 验
2,采 用 数 据 变 换
3,非 参 数 检 验
Y= log (X+a) Y= Y=x
Y=
p1sin -
2009年 7月 28日第四军医大学卫生统计学教研室方差齐性检验附 表 3 F 界 值 表 ( 方 差 齐 性 检 验 用,双 侧 界 值 )
P =0.05
分 子 的 自 由 度,υ 1 分 母 自由 度 υ 2 1 2 3 4 5 6 7 8
1 64 8 800 864 900 92 2 937 948 95 7
2 38.51 39.00 39.17 39.25 39.30 39.33 39.36 39.37
3 17.44 16.04 15.44 15.10 14.88 14.73 14.62 14.54
4 12.22 10.65 9.98 9.60 9.36 9.20 9.07 8.98
5 10.01 8.43 7.76 7.39 7.15 6.98 6.85 6.76
6 8.81 7.26 6.60 6.23 5.99 5.82 5.70 5.60
7 8.07 6.54 5.89 5.52 5.29 5.12 4.99 4.90
8 7.57 6.06 5.42 5.05 4.82 4.65 4.53 4.43
2009年 7月 28日第四军医大学卫生统计学教研室方差不齐 Satterthwaite t检验
S a t t e r t h w a i t e 法 ( 1 9 4 6 ) 对 自 由 度 校 正 。
最 终 结 果 查 附 表 2 的 t 界 值 表 。
12 11
22
22
12
12
1
'
1
nXX
t
nSS
nn


12
12
22
212
2 2 2
' 12
4 4 2 2
2212
12
12
12
()
()
( ) ( )
11
11
XX
XX
SS
SS nn
tt
S S S S
nnnn
nn



2009年 7月 28日第四军医大学卫生统计学教研室第四节 假设检验的步骤及有关概念总体间差异,1,个体差异,抽样误差所致;
2,总体间固有差异判断差别属于哪一种情况的统计学检验,
就是假设检验( test of hypothesis)。
t检验是最常用的一种假设检验之一。
小概率思想,P<0.05(或 P<0.01)是小概率事件。在一次试验中基本上不会发生。 P≤ α (0.05) 样本差别有统计学意义; P >α (0.05) 样本差别无统计学意义
2009年 7月 28日第四军医大学卫生统计学教研室
1、建立假设与确定检验水准( α )
H0,μ 1= μ 2 无效假设( null hypothesis)
H1,μ 1≠μ 2 备择假设( alternative hypothesis)
检验水准( level of a test),α=0.05( 双侧 )
2、选定方法和计算统计量:
根据统计推断目的、设计、资料组数、样本含量、等选择方法。如两组小样本比较用 t检验、大样本比较 u
检验、方差齐性检验用 F检验。
3、确定 P值,作出判断
P≤α(0.05) 样本差别有统计学意义;
P >α(0.05) 样本差别无统计学意义假设检验的步骤
P P t t( )统计量当前值的绝对值
2009年 7月 28日第四军医大学卫生统计学教研室
Ⅰ 型错误和 Ⅱ 型错误由样本推断的结果真实结果 拒绝 H0 不拒绝 H0
H0成立 Ⅰ 型错误 a 推断正确 (1- a)
H0不成立 推断正确( 1- b) Ⅱ 型错误 b
( 1- b)即 把握度 ( power of a test):两总体确有差别,被检出有差别的能力
( 1- a)即 可信度 ( confidence level):重复抽样时,样本区间包含总体参数(?)的百分数
2009年 7月 28日第四军医大学卫生统计学教研室对于一般的假设检验,
a定为 0.05( 或 0.01),b的大小取决于 H1。 通常情况下,比较总体间有无差异并不知道,即 H1不明确,b值的大小无法确定,也就是说,对于一般的假设检验,我们并不知道犯 Ⅱ 型错误的概率 b有多大 。
通常情况下 Ⅱ 型错误未知
2009年 7月 28日第四军医大学卫生统计学教研室
2009年 7月 28日第四军医大学卫生统计学教研室
a
b
减少(增加) I型错误,将会增加(减少) II型错误增大 n 同时降低 a 与 b
a 与 b 间的关系
2009年 7月 28日第四军医大学卫生统计学教研室假设检验注意事项
( 1)可比性
( 2)正确选用假设检验方法
( 3)差别的实际意义
( 4)判断结论时不能绝对化
( 5)单侧检验与双侧检验
( 6)报告结果应写出统计量值、具体 P值(
Excel函数,P=tdist(t值,自由度,2)),
单侧时应注明; 95% CI既能说明差别的大小
,也具有检验的作用,建议使用 。