Meta分析在医学研究中,绝大多数的医学现象都呈一定的随机性,因此医学研究的结果都受随机抽样误差影响而有所差异。所以对于同一研究问题的多个研究结果往往不全相同,有些研究的结论甚至相反。因此如何从结果不一的同类研究中综合出一个较为可靠的结论是医学研究中常常需要面临的问题。Meta分析就是研究如何综合同类研究结果的一种统计分析方法。
Meta分析就是把相同研究问题的多个研究结果视为一个多中心研究的结果,运用多中心研究的统计方法进行综合分析。Meta统计分析可以分为确定性模型分析方法和随机模型分析方法。较常用的确定性模型Meta分析有Mantel-Haeszel统计方法(仅适用于效应指标为OR)和General-Variance-Based统计方法。然而所有的确定性模型统计方法都要求Meta分析中的各个研究的总体效应指标(如:两组均数的差值等)是相等的,并称为齐性的(Homogeneity),而随机模型对效应指标没有齐性要求。因此Meta分析可以采用下列分析策略:
1)如果各个研究的效应指标是齐性的,则选用确定性模型统计方法:
效应指标为OR,则采用Mantel-Haeszel统计方法效应指标为两个均数的差值、两个率的差值、回归系数、对数RR等近似服从正态分布的效应指标,则采用General-Variacne-Based方法进行Meta统计分析。
2)如果各个研究的效应指标不满足齐性条件或者研究背景无法用确定性模型进行解释的,则采用随机模型进行Meta统计分析。
为了使读者较容易地掌握Meta分析方法,以下将结合STATA软件的Meta分析操作命令,通过实例介绍Meta分析步骤和软件操作以及相应的统计分析结果解释,然后对Meta分析中所涉及的统计公式进行分类汇总小结。
确定性模型的Meta分析方法例1:为了研究Aspirin预防心肌梗塞(MI)后死亡的发生,美国在1976年-1988年间进行了7个关于Aspirin预防MI后死亡的研究,其结果见表1,其中6次研究的结果表明Aspirin组与安慰剂组的MI后死亡率的差别无统计意义,只有一个研究的结果表明Aspirin在预防MI后死亡有效并且差别有统计意义。现根据表1所提供的资料作Meta分析。
表1 Aspirin预防心肌梗塞后死亡的研究结果研究
Aspirin组
安慰剂组
编号
观察人数
死亡人数
死亡率PE(%)
观察人数
死亡人数
死亡率PC(%)
P值
OR*
1
615
49
7.97
624
67
10.74
0.094
0.720
2
758
44
5.80
771
64
8.30
0.057
0.681
3
832
102
12.26
850
126
14.82
0.125
0.803
4
317
32
10.09
309
38
12.30
0.382
0.801
5
810
85
10.49
406
52
12.81
0.229
0.798
6
2267
246
10.85
2257
219
9.70
0.204
1.133
7
8587
1570
18.28
8600
1720
20.00
0.004
0.895
注:。可以证明:OR>1对应PE>PC;OR<1对应PE<PC;OR=1对应PE=PC。
具体分析和计算步骤如下:
把表1资料改写为表2形式的资料
表2 Mantel-Haeszel计算用表
Aspirin组
安慰剂组
研究编号
死亡人数
(a)
存活人数
(b)
死亡人数
(c)
存活人数
(d)
样本量
(n)
权重
(w)
OR
w×OR
1
49
566
67
557
1239
0.0389
0.7197
0.0280
2
44
714
64
707
1529
0.0412
0.6808
0.0280
3
102
730
126
724
1682
0.0205
0.8029
0.0165
4
32
285
38
271
626
0.0648
0.8007
0.0519
5
85
725
52
354
1216
0.0352
0.7981
0.0281
6
246
2021
219
2038
4524
0.0096
1.1327
0.0109
7
1570
7017
1720
6880
17187
0.0015
0.8950
0.0013
合计
0.2116
0.1647
其中括号中的a,b,c,d,w为统计计算公式中所对应的符号。如:权重
计算Mantel-Haeszel OR:
OR的齐性检验H0:各个研究的总体OR相同 vs H1:各个研究的总体OR不全相同。OR的齐性检验在统计软件中一般采用Breslow-Day齐性检验[]。由于Breslow-Day齐性检验方法计算步骤较为复杂,所以本书将仅给出参考文献供读者查阅。
如果OR齐性,则用Mantel-Haeszel方法计算总体ORMH的95%可信区间以及检验H0:总体ORMH=1。Mantel-Haeszel方法计算OR的可信区间比较误差,故在汇总中给出计算公式。
用STATA软件对上述资料进行统计分析操作步骤如下:
资料输入的格式:其中no为研究编号,group=1表示Aspirin组,group=0表示安慰剂组;dead=1表示死亡,dead=0表示活着;w表示频数。
no
group
dead
w
1
1
1
1
49
第一个研究的资料
2
1
1
0
566
3
1
0
1
67
4
1
0
0
557
5
2
1
1
44
第二个研究的资料
6
2
1
0
714
7
2
0
1
64
8
2
0
0
707
…
…
…
…
28
7
0
0
6880
第七个研究的资料
操作命令:cc group dead [freq=w],by(no) 其中group是分组变量 dead 是结果变量
STATA软件输出结果如下:
no | OR [95% Conf,Interval] M-H Weight
-------------+-------------------------------------------------
1 |,7197142,4784951 1.077403 30.60694 (exact)
2 |,6807598,4466625 1.030826 29.8862 (exact)
3 |,8028702,5999124 1.072974 54.6849 (exact)
4 |,8007387,4700106 1.358464 17.30032 (exact)
5 |,7981432,5449685 1.177104 31.00329 (exact)
6 | 1.132736,9304 1.379135 97.83355 (exact)
7 |,8949694,8288006,9664191 702.2308 (exact)
-------------+-------------------------------------------------
Crude |,890199,8342979,9498448 (exact)
M-H combined |,8968656,8405144,9569947
---------------------------------------------------------------
Test of homogeneity (M-H) chi2(6) = 9.95 Pr>chi2 = 0.1269
Test that combined OR = 1:
Mantel-Haenszel chi2(1) = 10.82
Pr>chi2 = 0.0010
各个研究的OR齐性检验(H0:总体OR1=总体OR2=…=总体OR7=公共总体OR)
设齐性检验的检验水平(=0.1,齐性检验的卡方值为9.95,自由度为6,相应的P值=0.1269>0.1,因此可近似认为OR是齐性的。
综合效应的统计检验H0:公共的总体OR=1 vs H1:公共的总体OR(1
设综合效应的统计检验水平(=0.05,对应的Mantel-Haeszel卡方=10.82,自由度为1,相应的P值=0.0010<0.05,因此可以推断综合分析中公共总体OR不等于1,公共OR的Mantel-Haeszel估计值=0.8968,相应的95%可信区间为(0.8405,0.9570),因此在95%可信意义下可以推断综合分析的总体OR<1(或者说:可以断定总体OR<1的概率大于0.95)。
由于本研究的,因此可以推断:Aspiring组的死亡率低于安慰剂组的死亡率,并且差别有统计意义。
结论:服用Aspiring有助于降低心肌梗塞后的死亡率。
例2:为了研究某减肥药的疗效,现以身高体重指数BMI为疗效观察指标,为了避免其它的混杂作用,故限定所有研究对象均为45岁至55岁的健康女性(其它体检指标均正常)。研究问题为:通过一个疗程的治疗,该药物是否能降低45岁至55岁的健康女性的BMI? 因此需要检验治疗组和对照组所对于BMI总体均数是否相同?
现收集了6个研究的结果如下所收集研究
治疗组
对照组
两个样本均数的差值
d
两个样本均数差值的标准误
se
P值
结果的编号(no)
均数
(meanE)
标准差
(SE)
样本量
(nE)
均数
(meanC)
标准差
(SC)
样本量
(nC)
1
28.0
3.3
30
29.0
2.8
35
-1.0
0.766159
0.1910
2
25.5
2.9
34
27.4
2.7
31
-1.9
0.694632
0.0083
3
26.5
2.7
32
27.5
2.9
31
-1.0
0.706472
0.1615
4
27.8
3.4
33
29.8
2.6
31
-2.0
0.753902
0.0107
5
27.2
3.0
30
28.1
2.9
32
-0.9
0.750208
0.2345
6
28.0
2.8
60
29.2
3.1
50
-1.2
0.568214
0.0353
在这6个研究中,研究结果表明:有3组BMI的差异有统计意义(P值<0.05),但是另外3组BMI的差异无统计意义。因此存在较大的争议,所以有必要通过Meta分析综合这6个研究的结果。
总体效应指标为治疗组BMI的总均数-对照组BMI的总体均数:,相应的样本效应指标为meanD=meanE-meanC,标准误,由于计算较为简单而且表中已给出,故不详细叙述。以均数差值为效应指标的Meta分析可以用General Variance-Based方法进行综合分析。计算步骤简述如下:
计算各个研究的权重:
研究编号i
1
2
3
4
5
6
标准误sei
0.766159
0.694632
0.706472
0.753902
0.750208
0.568214
权重wi
1.703579
2.07248
2.003596
1.759423
1.776792
3.097249
计算加权平均的均数差和相应的方差
研究编号i
1
2
3
4
5
6
合计
两个均数差值di
-1.0000
-1.9000
-1.0000
-2.0000
-0.9000
-1.2000
权重wi
1.7036
2.0725
2.0036
1.7594
1.7768
3.0972
12.4131
wi×di
-1.7036
-3.9377
-2.0036
-3.5188
-1.5991
-3.7167
-16.4795
加权平均的均数差
加权平均的均数差的方差
齐性检验:。如果各个研究的两个总体均数的差值(d是相等的,则Q近似服从自由度为5的卡方分布(自由度=研究个数-1,本例df=6-1=5)。设齐性检验的统计检验水平(=0.1。
研究编号i
1
2
3
4
5
6
合计
两个均数差值di
-1.0000
-1.9000
-1.0000
-2.0000
-0.9000
-1.2000
效应差异
0.3276
-0.5724
0.3276
-0.6724
0.4276
0.1276
权重wi
1.7036
2.0725
2.0036
1.7594
1.7768
3.0972
12.4131
wi×()2
0.1828
0.6791
0.2150
0.7955
0.3249
0.0504
2.2477
齐性检验统计量=2.2477<,P值>0.1。因此可以近似认为各个研究的效应是齐性的。
计算的95%可信区间
综合的总体均数差值(d的下限
综合的总体均数差值(d的上限
因此综合的总体均数差值(d的95%可信区间为(-1.8839,-0.7713)
假设检验H0:综合的总体均数差值(d=0 vs H1:综合的总体均数差值(d(0
检验统计量,|Z|>0.96,对应P值<0.05,因此可以认为治疗组BMI低于对照组的BMI,并且差别有统计意义。
并可用STATA软件进行统计分析。资料输入的格式如下:
均数差值
均数差值的标准误
d
se
1
-1
0.766159
第1个研究
2
-1.9
0.694632
第2个研究
3
-1
0.706472
第3个研究
4
-2
0.753902
第4个研究
5
-0.9
0.750208
第5个研究
6
-1.2
0.568214
第6个研究
用STATA命令:
meta d se
其中d为效应指标统计量 se是均数的差值的标准误
得到下列确定性模型的输出部分(Stata软件同时输出随机模型部分,但下面没有给出)
Meta-analysis of 6 studies
----------------------------
Fixed and random effects pooled estimates,
lower and upper 95% confidence limits,and
asymptotic z-test for null hypothesis that true effect=0
Fixed effects estimation(确定性效应估计)
Est Lower Upper z_va~e p_va~e
-1.328 -1.884 -0.771 -4.677 0.000
Test for heterogeneity,Q= 2.248 on 5 degrees of freedom (p= 0.814)
STATA软件Meta分析输出中,
效应齐性检验的卡方值Q=2.248,自由度df=5,P值=0.814>0.1,因此可以认为各个研究之间的效应是齐性的。
均数差的加权平均值Est=-1.328
总体均数差值的95%下限Lower=-1.884,总体均数差值的95%上限Upper=-0.771
检验统计量Z=-4.677,相应P值<0.001
STATA软件输出结果与上述计算一致,结论与上述相同。
General Variance-Based方法进行Meta分析都可以用STATA软件中的Meta命令,但要求效应指标统计量近似服从正态分布,常见的效应指标统计量有:取对数的相对危险度ln(RR),回归系数b,两个率的差值(要求率比较大,接近0.5),对数OR,效应指标及其标准误计算见下表
效应指标D
效应指标的标准误se(d)
有关两个率比较的统计量
,,
d=ln(RR)
d=P1-P2
d=ln(OR)*
回归系数
d=b
se(b)
两个样本均数的差值
*虽然OR可以通过取对数后,再用General Variance-Based方法进行Meta分析,但是有关研究表明:对于OR为效应指标而言(四格表资料),Mantel-Haeszel方法要优于General Variance-Based方法,所以我们还是建议用Mantel-Haeszel方法对OR的四格表资料进行Meta分析。
在STATA软件Meta分析操作命令为
meta 效应指标 效应指标的标准误
随机模型的Meta分析方法为了帮助读者较好地理解Meta分析的随机模型,先举一个比较容易理解的收缩血压观察的随机模型例子(非Meta分析)。例如,任一正常人的收缩血压随着时间变化呈随机性的变化,因此对于任一观察对象的一次收缩压观察值与该对象自身平均收缩压之间存在一个随机变异并称为个体自身内部随机变异(个体内变异)。而任一正常人的平均收缩压与所有正常人平均收缩压的总体均数(正常人群的总体均数)之间也存在随机变异的并称为个体之间的随机变异(简称个体间变异)。所以正常人收缩压的一次观察值与正常人群的收缩压总体均数之间含有两个层次的随机变异:个体内变异和个体间变异。
Meta分析中随机模型把随机变异分为2个层次。在第一个层面上,任一研究的总体均数(简称均数)与该研究的样本均数之间都存在抽样误差,因此这种抽样误差视为个体内变异(该研究内的变异);在第二个层面上,首先假定存在许许多多同一研究问题的的研究,由于研究之间在许多因素上存在微小差异,并且导致各个研究的总体均数之间存在差异并视为随机变异。同一研究问题的所有这些研究的总体均数构成了一个集合可视为一个总体以及这些(研究)总体均数的平均数就是它们的总体均数,为了叙述方便称为群体总体均数。并且认为Meta分析所收集的若干个研究仅是许许多多个研究中的一个随机抽样,这些研究的总体均数与群体总体均数之间的变异为随机变异(个体间变异)。因此任意一个研究中的效应指标的样本估计值与该研究的总体均数之间存在个体内变异,而该研究的总体均数与群体总体均数之间存在个体间变异,所以在Meta分析的随机模型中,任一研究中的样本均数与群体总体均数之间也含有两种随机成分:研究内部的抽样误差(个体内变异)和研究之间的随机变异(个体间变异)。Meta分析中的随机模型的统计分析就是对群体总体均数进行统计推断。
随机模型也要求效应指标近似服从正态分布或变换后的效应指标近似服从正态分布。一般采用Der Simonian and Laird方法对(进行估计和检验。
例3:为了评价A药和B种药治疗骨质疏松症。经检索,共有12个医疗单位做了临床药物疗效观察观察。疗程为12个月,并以骨密度改变比例作为效应指标。但各个研究效果不一致,故需做Meta分析。
研究
均数
标准差
样本量
均数
标准差
样本量
两个均数
均数差值
编号
meana
Sa
na
meanb
Sb
nb
的差值d
标准误se
P值
1
2.6
0.474
26
8.73
1.587
29
-6.13
0.309
<0.05
2
2.41
0.639
27
3.94
1.541
32
-1.53
0.299
<0.05
3
1.4
0.639
28
6.2
1.574
27
-4.80
0.326
<0.05
4
3.58
0.144
21
5.39
1.209
23
-1.81
0.254
<0.05
5
2.22
0.277
26
7.54
1.246
22
-5.32
0.271
<0.05
6
1.99
0.208
25
0.74
0.154
33
1.25
0.049
<0.05
7
1.48
0.671
27
3.98
1.606
31
-2.50
0.316
<0.05
8
1.08
0.869
29
1.23
0.856
23
-0.15
0.241
0.536
9
3.24
0.603
25
4.51
0.416
28
-1.27
0.144
<0.05
10
0.44
0.523
20
3.81
1.787
20
-3.37
0.416
<0.05
11
3.74
0.773
20
10.62
1.233
33
-6.88
0.276
<0.05
12
1.89
0.942
28
6.7
1.132
30
-4.81
0.273
<0.05
两个均数的差值和均数差值的标准误的计算方法与General-Variacne-Based方法中两个均数比较相同,故不再重复。由于Meta分析的随机模型统计方法较为复杂,故现用STATA软件进行Meta分析上述资料。STATA命令与上述相同。
meta d se
得到下列结果
Meta-analysis of 12 studies
----------------------------
Fixed and random effects pooled estimates,
lower and upper 95% confidence limits,and
asymptotic z-test for null hypothesis that true effect=0
Fixed effects estimation确定性模型统计分析
Est Lower Upper z_va~e p_va~e
0.052 -0.029 0.133 1.259 0.208
Test for heterogeneity,Q= 2860.070 on 11 degrees of freedom (p= 0.000)齐性检验
Der Simonian and Laird estimate of between studies variance = 10.137
Random effects estimation随机模型统计分析
Est Lower Upper z_va~e p_va~e
-3.105 -4.914 -1.297 -3.366 0.001
由于齐性检验的卡方值Q=2860.070,自由度df=11,P值<0.001,故认为各个研究之间的效应是不齐的。因此General-Variacne-Based方法不适合用,所以只有用随机模型的meta分析方法。
随机模型统计分析中,各个研究之间的随机效应的方差=10.137,各个研究的(群体)总体均数的平均值=-3.105,95%可信区间为(-4.914,-1.297)
H0:(=0 vs H1:((0,检验统计量Z=-3.366,P值=0.001,因此认为B药使骨密度改善的比例高于A药骨密度改善的比例,并且差别有统计意义。
Meta分析就是把相同研究问题的多个研究结果视为一个多中心研究的结果,运用多中心研究的统计方法进行综合分析。Meta统计分析可以分为确定性模型分析方法和随机模型分析方法。较常用的确定性模型Meta分析有Mantel-Haeszel统计方法(仅适用于效应指标为OR)和General-Variance-Based统计方法。然而所有的确定性模型统计方法都要求Meta分析中的各个研究的总体效应指标(如:两组均数的差值等)是相等的,并称为齐性的(Homogeneity),而随机模型对效应指标没有齐性要求。因此Meta分析可以采用下列分析策略:
1)如果各个研究的效应指标是齐性的,则选用确定性模型统计方法:
效应指标为OR,则采用Mantel-Haeszel统计方法效应指标为两个均数的差值、两个率的差值、回归系数、对数RR等近似服从正态分布的效应指标,则采用General-Variacne-Based方法进行Meta统计分析。
2)如果各个研究的效应指标不满足齐性条件或者研究背景无法用确定性模型进行解释的,则采用随机模型进行Meta统计分析。
为了使读者较容易地掌握Meta分析方法,以下将结合STATA软件的Meta分析操作命令,通过实例介绍Meta分析步骤和软件操作以及相应的统计分析结果解释,然后对Meta分析中所涉及的统计公式进行分类汇总小结。
确定性模型的Meta分析方法例1:为了研究Aspirin预防心肌梗塞(MI)后死亡的发生,美国在1976年-1988年间进行了7个关于Aspirin预防MI后死亡的研究,其结果见表1,其中6次研究的结果表明Aspirin组与安慰剂组的MI后死亡率的差别无统计意义,只有一个研究的结果表明Aspirin在预防MI后死亡有效并且差别有统计意义。现根据表1所提供的资料作Meta分析。
表1 Aspirin预防心肌梗塞后死亡的研究结果研究
Aspirin组
安慰剂组
编号
观察人数
死亡人数
死亡率PE(%)
观察人数
死亡人数
死亡率PC(%)
P值
OR*
1
615
49
7.97
624
67
10.74
0.094
0.720
2
758
44
5.80
771
64
8.30
0.057
0.681
3
832
102
12.26
850
126
14.82
0.125
0.803
4
317
32
10.09
309
38
12.30
0.382
0.801
5
810
85
10.49
406
52
12.81
0.229
0.798
6
2267
246
10.85
2257
219
9.70
0.204
1.133
7
8587
1570
18.28
8600
1720
20.00
0.004
0.895
注:。可以证明:OR>1对应PE>PC;OR<1对应PE<PC;OR=1对应PE=PC。
具体分析和计算步骤如下:
把表1资料改写为表2形式的资料
表2 Mantel-Haeszel计算用表
Aspirin组
安慰剂组
研究编号
死亡人数
(a)
存活人数
(b)
死亡人数
(c)
存活人数
(d)
样本量
(n)
权重
(w)
OR
w×OR
1
49
566
67
557
1239
0.0389
0.7197
0.0280
2
44
714
64
707
1529
0.0412
0.6808
0.0280
3
102
730
126
724
1682
0.0205
0.8029
0.0165
4
32
285
38
271
626
0.0648
0.8007
0.0519
5
85
725
52
354
1216
0.0352
0.7981
0.0281
6
246
2021
219
2038
4524
0.0096
1.1327
0.0109
7
1570
7017
1720
6880
17187
0.0015
0.8950
0.0013
合计
0.2116
0.1647
其中括号中的a,b,c,d,w为统计计算公式中所对应的符号。如:权重
计算Mantel-Haeszel OR:
OR的齐性检验H0:各个研究的总体OR相同 vs H1:各个研究的总体OR不全相同。OR的齐性检验在统计软件中一般采用Breslow-Day齐性检验[]。由于Breslow-Day齐性检验方法计算步骤较为复杂,所以本书将仅给出参考文献供读者查阅。
如果OR齐性,则用Mantel-Haeszel方法计算总体ORMH的95%可信区间以及检验H0:总体ORMH=1。Mantel-Haeszel方法计算OR的可信区间比较误差,故在汇总中给出计算公式。
用STATA软件对上述资料进行统计分析操作步骤如下:
资料输入的格式:其中no为研究编号,group=1表示Aspirin组,group=0表示安慰剂组;dead=1表示死亡,dead=0表示活着;w表示频数。
no
group
dead
w
1
1
1
1
49
第一个研究的资料
2
1
1
0
566
3
1
0
1
67
4
1
0
0
557
5
2
1
1
44
第二个研究的资料
6
2
1
0
714
7
2
0
1
64
8
2
0
0
707
…
…
…
…
28
7
0
0
6880
第七个研究的资料
操作命令:cc group dead [freq=w],by(no) 其中group是分组变量 dead 是结果变量
STATA软件输出结果如下:
no | OR [95% Conf,Interval] M-H Weight
-------------+-------------------------------------------------
1 |,7197142,4784951 1.077403 30.60694 (exact)
2 |,6807598,4466625 1.030826 29.8862 (exact)
3 |,8028702,5999124 1.072974 54.6849 (exact)
4 |,8007387,4700106 1.358464 17.30032 (exact)
5 |,7981432,5449685 1.177104 31.00329 (exact)
6 | 1.132736,9304 1.379135 97.83355 (exact)
7 |,8949694,8288006,9664191 702.2308 (exact)
-------------+-------------------------------------------------
Crude |,890199,8342979,9498448 (exact)
M-H combined |,8968656,8405144,9569947
---------------------------------------------------------------
Test of homogeneity (M-H) chi2(6) = 9.95 Pr>chi2 = 0.1269
Test that combined OR = 1:
Mantel-Haenszel chi2(1) = 10.82
Pr>chi2 = 0.0010
各个研究的OR齐性检验(H0:总体OR1=总体OR2=…=总体OR7=公共总体OR)
设齐性检验的检验水平(=0.1,齐性检验的卡方值为9.95,自由度为6,相应的P值=0.1269>0.1,因此可近似认为OR是齐性的。
综合效应的统计检验H0:公共的总体OR=1 vs H1:公共的总体OR(1
设综合效应的统计检验水平(=0.05,对应的Mantel-Haeszel卡方=10.82,自由度为1,相应的P值=0.0010<0.05,因此可以推断综合分析中公共总体OR不等于1,公共OR的Mantel-Haeszel估计值=0.8968,相应的95%可信区间为(0.8405,0.9570),因此在95%可信意义下可以推断综合分析的总体OR<1(或者说:可以断定总体OR<1的概率大于0.95)。
由于本研究的,因此可以推断:Aspiring组的死亡率低于安慰剂组的死亡率,并且差别有统计意义。
结论:服用Aspiring有助于降低心肌梗塞后的死亡率。
例2:为了研究某减肥药的疗效,现以身高体重指数BMI为疗效观察指标,为了避免其它的混杂作用,故限定所有研究对象均为45岁至55岁的健康女性(其它体检指标均正常)。研究问题为:通过一个疗程的治疗,该药物是否能降低45岁至55岁的健康女性的BMI? 因此需要检验治疗组和对照组所对于BMI总体均数是否相同?
现收集了6个研究的结果如下所收集研究
治疗组
对照组
两个样本均数的差值
d
两个样本均数差值的标准误
se
P值
结果的编号(no)
均数
(meanE)
标准差
(SE)
样本量
(nE)
均数
(meanC)
标准差
(SC)
样本量
(nC)
1
28.0
3.3
30
29.0
2.8
35
-1.0
0.766159
0.1910
2
25.5
2.9
34
27.4
2.7
31
-1.9
0.694632
0.0083
3
26.5
2.7
32
27.5
2.9
31
-1.0
0.706472
0.1615
4
27.8
3.4
33
29.8
2.6
31
-2.0
0.753902
0.0107
5
27.2
3.0
30
28.1
2.9
32
-0.9
0.750208
0.2345
6
28.0
2.8
60
29.2
3.1
50
-1.2
0.568214
0.0353
在这6个研究中,研究结果表明:有3组BMI的差异有统计意义(P值<0.05),但是另外3组BMI的差异无统计意义。因此存在较大的争议,所以有必要通过Meta分析综合这6个研究的结果。
总体效应指标为治疗组BMI的总均数-对照组BMI的总体均数:,相应的样本效应指标为meanD=meanE-meanC,标准误,由于计算较为简单而且表中已给出,故不详细叙述。以均数差值为效应指标的Meta分析可以用General Variance-Based方法进行综合分析。计算步骤简述如下:
计算各个研究的权重:
研究编号i
1
2
3
4
5
6
标准误sei
0.766159
0.694632
0.706472
0.753902
0.750208
0.568214
权重wi
1.703579
2.07248
2.003596
1.759423
1.776792
3.097249
计算加权平均的均数差和相应的方差
研究编号i
1
2
3
4
5
6
合计
两个均数差值di
-1.0000
-1.9000
-1.0000
-2.0000
-0.9000
-1.2000
权重wi
1.7036
2.0725
2.0036
1.7594
1.7768
3.0972
12.4131
wi×di
-1.7036
-3.9377
-2.0036
-3.5188
-1.5991
-3.7167
-16.4795
加权平均的均数差
加权平均的均数差的方差
齐性检验:。如果各个研究的两个总体均数的差值(d是相等的,则Q近似服从自由度为5的卡方分布(自由度=研究个数-1,本例df=6-1=5)。设齐性检验的统计检验水平(=0.1。
研究编号i
1
2
3
4
5
6
合计
两个均数差值di
-1.0000
-1.9000
-1.0000
-2.0000
-0.9000
-1.2000
效应差异
0.3276
-0.5724
0.3276
-0.6724
0.4276
0.1276
权重wi
1.7036
2.0725
2.0036
1.7594
1.7768
3.0972
12.4131
wi×()2
0.1828
0.6791
0.2150
0.7955
0.3249
0.0504
2.2477
齐性检验统计量=2.2477<,P值>0.1。因此可以近似认为各个研究的效应是齐性的。
计算的95%可信区间
综合的总体均数差值(d的下限
综合的总体均数差值(d的上限
因此综合的总体均数差值(d的95%可信区间为(-1.8839,-0.7713)
假设检验H0:综合的总体均数差值(d=0 vs H1:综合的总体均数差值(d(0
检验统计量,|Z|>0.96,对应P值<0.05,因此可以认为治疗组BMI低于对照组的BMI,并且差别有统计意义。
并可用STATA软件进行统计分析。资料输入的格式如下:
均数差值
均数差值的标准误
d
se
1
-1
0.766159
第1个研究
2
-1.9
0.694632
第2个研究
3
-1
0.706472
第3个研究
4
-2
0.753902
第4个研究
5
-0.9
0.750208
第5个研究
6
-1.2
0.568214
第6个研究
用STATA命令:
meta d se
其中d为效应指标统计量 se是均数的差值的标准误
得到下列确定性模型的输出部分(Stata软件同时输出随机模型部分,但下面没有给出)
Meta-analysis of 6 studies
----------------------------
Fixed and random effects pooled estimates,
lower and upper 95% confidence limits,and
asymptotic z-test for null hypothesis that true effect=0
Fixed effects estimation(确定性效应估计)
Est Lower Upper z_va~e p_va~e
-1.328 -1.884 -0.771 -4.677 0.000
Test for heterogeneity,Q= 2.248 on 5 degrees of freedom (p= 0.814)
STATA软件Meta分析输出中,
效应齐性检验的卡方值Q=2.248,自由度df=5,P值=0.814>0.1,因此可以认为各个研究之间的效应是齐性的。
均数差的加权平均值Est=-1.328
总体均数差值的95%下限Lower=-1.884,总体均数差值的95%上限Upper=-0.771
检验统计量Z=-4.677,相应P值<0.001
STATA软件输出结果与上述计算一致,结论与上述相同。
General Variance-Based方法进行Meta分析都可以用STATA软件中的Meta命令,但要求效应指标统计量近似服从正态分布,常见的效应指标统计量有:取对数的相对危险度ln(RR),回归系数b,两个率的差值(要求率比较大,接近0.5),对数OR,效应指标及其标准误计算见下表
效应指标D
效应指标的标准误se(d)
有关两个率比较的统计量
,,
d=ln(RR)
d=P1-P2
d=ln(OR)*
回归系数
d=b
se(b)
两个样本均数的差值
*虽然OR可以通过取对数后,再用General Variance-Based方法进行Meta分析,但是有关研究表明:对于OR为效应指标而言(四格表资料),Mantel-Haeszel方法要优于General Variance-Based方法,所以我们还是建议用Mantel-Haeszel方法对OR的四格表资料进行Meta分析。
在STATA软件Meta分析操作命令为
meta 效应指标 效应指标的标准误
随机模型的Meta分析方法为了帮助读者较好地理解Meta分析的随机模型,先举一个比较容易理解的收缩血压观察的随机模型例子(非Meta分析)。例如,任一正常人的收缩血压随着时间变化呈随机性的变化,因此对于任一观察对象的一次收缩压观察值与该对象自身平均收缩压之间存在一个随机变异并称为个体自身内部随机变异(个体内变异)。而任一正常人的平均收缩压与所有正常人平均收缩压的总体均数(正常人群的总体均数)之间也存在随机变异的并称为个体之间的随机变异(简称个体间变异)。所以正常人收缩压的一次观察值与正常人群的收缩压总体均数之间含有两个层次的随机变异:个体内变异和个体间变异。
Meta分析中随机模型把随机变异分为2个层次。在第一个层面上,任一研究的总体均数(简称均数)与该研究的样本均数之间都存在抽样误差,因此这种抽样误差视为个体内变异(该研究内的变异);在第二个层面上,首先假定存在许许多多同一研究问题的的研究,由于研究之间在许多因素上存在微小差异,并且导致各个研究的总体均数之间存在差异并视为随机变异。同一研究问题的所有这些研究的总体均数构成了一个集合可视为一个总体以及这些(研究)总体均数的平均数就是它们的总体均数,为了叙述方便称为群体总体均数。并且认为Meta分析所收集的若干个研究仅是许许多多个研究中的一个随机抽样,这些研究的总体均数与群体总体均数之间的变异为随机变异(个体间变异)。因此任意一个研究中的效应指标的样本估计值与该研究的总体均数之间存在个体内变异,而该研究的总体均数与群体总体均数之间存在个体间变异,所以在Meta分析的随机模型中,任一研究中的样本均数与群体总体均数之间也含有两种随机成分:研究内部的抽样误差(个体内变异)和研究之间的随机变异(个体间变异)。Meta分析中的随机模型的统计分析就是对群体总体均数进行统计推断。
随机模型也要求效应指标近似服从正态分布或变换后的效应指标近似服从正态分布。一般采用Der Simonian and Laird方法对(进行估计和检验。
例3:为了评价A药和B种药治疗骨质疏松症。经检索,共有12个医疗单位做了临床药物疗效观察观察。疗程为12个月,并以骨密度改变比例作为效应指标。但各个研究效果不一致,故需做Meta分析。
研究
均数
标准差
样本量
均数
标准差
样本量
两个均数
均数差值
编号
meana
Sa
na
meanb
Sb
nb
的差值d
标准误se
P值
1
2.6
0.474
26
8.73
1.587
29
-6.13
0.309
<0.05
2
2.41
0.639
27
3.94
1.541
32
-1.53
0.299
<0.05
3
1.4
0.639
28
6.2
1.574
27
-4.80
0.326
<0.05
4
3.58
0.144
21
5.39
1.209
23
-1.81
0.254
<0.05
5
2.22
0.277
26
7.54
1.246
22
-5.32
0.271
<0.05
6
1.99
0.208
25
0.74
0.154
33
1.25
0.049
<0.05
7
1.48
0.671
27
3.98
1.606
31
-2.50
0.316
<0.05
8
1.08
0.869
29
1.23
0.856
23
-0.15
0.241
0.536
9
3.24
0.603
25
4.51
0.416
28
-1.27
0.144
<0.05
10
0.44
0.523
20
3.81
1.787
20
-3.37
0.416
<0.05
11
3.74
0.773
20
10.62
1.233
33
-6.88
0.276
<0.05
12
1.89
0.942
28
6.7
1.132
30
-4.81
0.273
<0.05
两个均数的差值和均数差值的标准误的计算方法与General-Variacne-Based方法中两个均数比较相同,故不再重复。由于Meta分析的随机模型统计方法较为复杂,故现用STATA软件进行Meta分析上述资料。STATA命令与上述相同。
meta d se
得到下列结果
Meta-analysis of 12 studies
----------------------------
Fixed and random effects pooled estimates,
lower and upper 95% confidence limits,and
asymptotic z-test for null hypothesis that true effect=0
Fixed effects estimation确定性模型统计分析
Est Lower Upper z_va~e p_va~e
0.052 -0.029 0.133 1.259 0.208
Test for heterogeneity,Q= 2860.070 on 11 degrees of freedom (p= 0.000)齐性检验
Der Simonian and Laird estimate of between studies variance = 10.137
Random effects estimation随机模型统计分析
Est Lower Upper z_va~e p_va~e
-3.105 -4.914 -1.297 -3.366 0.001
由于齐性检验的卡方值Q=2860.070,自由度df=11,P值<0.001,故认为各个研究之间的效应是不齐的。因此General-Variacne-Based方法不适合用,所以只有用随机模型的meta分析方法。
随机模型统计分析中,各个研究之间的随机效应的方差=10.137,各个研究的(群体)总体均数的平均值=-3.105,95%可信区间为(-4.914,-1.297)
H0:(=0 vs H1:((0,检验统计量Z=-3.366,P值=0.001,因此认为B药使骨密度改善的比例高于A药骨密度改善的比例,并且差别有统计意义。