基本概念复习
Meta分析是以统计量为观察单位进行统计分析,因此需要了解统计量的规律性和一些基本统计概念。
教学目的:复习总体、抽样分布概念、随机现象的规律性――概率分布,特别正态分布,介绍统计量的定义、分布和统计量的总体平均值。效应差异度量(Effect Size)
总体:根据研究目的确定所有同质个体的某指标观察值(或测量值)构成的集合称为总体(population),或更严谨地称为该观察指标(变量)的总体。总体中所有观察值的平均数称为总体均数。例如:研究某地区7岁健康男孩身高,如果该地区共有10000个7岁健康男孩,则这10000个7岁健康男孩的身高测量值构成的集合就是这个研究目的所确定的总体。这10000个7岁男孩的身高平均值就是这个研究问题的总体均数。
个体变异:在同一研究目的下确定的相同特征的研究对象(称为同质个体)中,研究对象之间的观察值相互不同,称为个体变异(严格地说研究对象观察值与总体均数的差值称为个体变异)。个体变异是随机的。
随机现象的规律性:对某一种随机现象进行大量重复观察,可以发现其规律性。同种随机现象的规律性是相同,但是单个随机现象是无法考察其规律性。例如,观察某地区7岁健康男孩身高的分布情况,把身高分为3段:第一段为身高小于125cm;第二段为身高在125cm~135cm;第三段为身高高于135cm。对于在该地区随机抽一个7岁健康男孩并测量他的身高而言,该男孩的身高在这3个身高范围中的任何一个都是可能,所以在抽样前不能断定所抽到的健康男孩身高在哪个范围中。但如果在该地区抽了10000个7岁健康男孩并测量其身高,结果为身高小于125cm共有720人占总数的7.2%;身高在125cm~135cm范围中共有8950人占总数的89.5%;身高大于135cm共有330人占总数的3.3%,因此可以断定大多数男孩的身高在125cm~135cm范围中,这就是大量重复观察时所呈现的规律性。从另一角度上分析,对于随机考察一个7岁健康男孩身高而言,虽因为随机性而不能断定其身高在哪个范围中,但可以肯定身高在125cm~135cm范围中的机会要远高于其它身高两个范围。本例只是一种较简单的概率分布。任何随机现象或随机变异在大量重复观察的意义下都会呈现一定的随机特征的规律性,即这种随机特征的规律性就是指观察值出现在可能的不同范围对应有不同的机会(概率),这就是所谓的“概率分布”。
统计量:样本表达式构成的样本统计指标估计未知总体参数,这种样本统计指标称为统计量(statistic)并且要求统计量的样本表达式中不含有未知参数。例如:样本均数、样本OR、样本RR等。
样本均数的抽样误差:总体均数与样本均数的差称为样本均数的抽样误差。由于通常总体均数是未知的,故用样本均数的标准误大小刻划样本均数的抽样误差的平均度量。由于个体变异是随机的,所以样本均数也是随机的。即:抽样前是无法确切知道样本均数将是多大。由于样本均数的抽样误差=样本均数-总体均数,总体均数是确切的常数,故样本均数的抽样误差是随机的。下面将举例说明:
例如,已知某地高中三年级男生的平均身高为168.15厘米,这里,将该地高中三年级男生的身高视为一个总体,其总体均数,总体标准差。现从该总体中反复抽取5个样本,每个样本中有9个高中三年级男生的身高测量值,每个样本计算样本均数(在每个样本中,对9个身高测量值计算平均数),因此共得到5个样本均数如下:
样本号
样本观测值
(n=9)
样本均数()
抽样误差
1
161.1
173.7
173.7
167.3
162.2
162.2
166.6
166.6
157.4
165.64
-2.51
2
166.8
159.1
159.1
166.1
173.3
173.3
169.1
169.1
165.2
166.79
-1.36
3
157.4
174
172.3
175.8
166.6
182.1
163.1
159.4
159.4
167.79
-0.36
4
174.5
182.1
168.5
171.3
174.1
165.6
173.7
171.9
167.5
172.13
3.98
5
164.1
166.6
169.6
169.6
173.8
173.2
164.3
166.6
182.1
169.99
1.84
由上表可知,由于个体变异的存在,而抽样又是随机进行的,因此,各样本均数与总体均数之间一般说来是有差异的。这种由个体变异和随机抽样所引起的样本均数与总体均数(本例为)之间的差异就是抽样误差,并且是随机的。
由于任何的随机变异都是有其随机特征的规律性,只是单个随机变异往往无法考察其规律性,如果大量重复观察同一种随机变异,就可以发现其随机特征的规律性。下面考察如果资料X服从正态分布N((,(2),它的样本均数的随机特征规律性(概率分布)是什么?
由于在实际研究中,同一特征的研究对象往往只有一个样本,因此只能得到一个样本均数,故往往无法依据样本资料考察样本均数的分布情况。如果我们对同一总体随机抽了许多样本,并且对每个样本计算其样本均数,因此可以得到许多样本均数,然后作这些样本均数(视为新的样本资料)的频数图,就可以得到样本均数的规律性。因此我们以下将借助计算机随机模拟抽样,在同一正态分布的总体中随机抽许多样本,对每一个样本计算样本均数,因此可以得到许多样本均数,这样可以考察样本均数的随机特征的规律性。
正态分布样本的样本均数分布为了给读者关于样本均数分布的直观认识,下面做3个抽样试验,仍以某地高三男生的身高为例。设身高变量为X,假定X服从正态分布,记为X~N(168.15,62)。从总体X中反复随机抽样,样本含量分别为n=4,n=16和n=36,分别随机抽10000个样本并计算样本均数,把同一样本含量的10000个样本均数视为一个新的样本资料作频数图(见图3.1),并且表3.2分别给出同一样本含量的前20个样本均数。读者不难从频数图和表3.2可以发现样本均数的变异有如下特点:
样本含量n=4
样本含量n=16
样本含量n=36



的平均数=168.198
的标准差=2.9995
的平均数=168.185
的标准差=1.4868
的平均数=168.135
的标准差=0.9997
图3.1 从正态分布总体N(168.15,62)中随机抽样的结果曲线是正态总体N(168.15,62)的分布密度曲线×组距直方图为正态分布总体N(168.15,62)的样本均数的频数图(纵坐标为频率)
表3.2 从正态总体N(168.15,62)随机抽样,样本含量分别为4,16和36
分别对应的前20个样本的样本均数
n=4
n=16
n=36
样本号
均数
样本号
均数
样本号
均数
样本号
均数
样本号
均数
样本号
均数
1
169.22
11
166.82
1
167.91
11
168.10
1
168.37
11
166.71
2
169.61
12
162.47
2
170.19
12
166.45
2
167.47
12
167.76
3
165.73
13
170.02
3
168.60
13
168.85
3
170.36
13
169.46
4
166.60
14
171.53
4
165.48
14
169.72
4
167.16
14
168.31
5
169.99
15
168.16
5
168.95
15
168.74
5
168.68
15
167.90
6
166.43
16
164.25
6
168.54
16
172.50
6
168.78
16
168.43
7
171.77
17
164.63
7
167.87
17
168.52
7
169.54
17
167.60
8
166.65
18
164.72
8
168.66
18
167.15
8
168.77
18
167.17
9
170.71
19
165.83
9
170.01
19
166.19
9
167.61
19
168.94
10
170.84
20
169.83
10
167.19
20
166.15
10
168.95
20
169.29
1)大多数的样本均数相互之间存在差异,绝大多数的样本均数不等于X的总体均数,但都离X的总体均数比较近。
2)无论样本含量n多大,在每个抽样试验中,的均数都接近于X的总体均数,即样本均数的集中趋势位置与个体资料X的集中趋势位置较为接近,样本均数的频数图(图3.1)均呈现出中间多、两边少且基本对称的正态分布特征。随着样本含量的增大,样本均数的频数图范围越来越窄。
3) 图3.1所给出的3种样本含量的10000个样本均数的频数图及其统计描述可以发现:每种样本量的10000个样本均数值所计算出的标准差都非常接近((为个体资料X的总体标准差)。
理论上可以证明:从正态分布N((,(2)的总体中随机抽取样本含量为n的一个样本X1,X2,…,Xn,其样本均数有如下性质:
1)样本均数服从正态分布N((,(2/n)。
2)样本均数的总体标准差=。为了区分样本所在总体的标准差,通常称样本均数的标准差为样本均数的标准误(简称均数标准误),记为。故样本均数与个体资料所在的总体变异程度有如下规律:
 (3.1)
由于在实际研究中,我们往往只有一个样本,不能利用样本均数直接估计均数标准误,但可以用样本标准差S估计总体标准差(,利用公式(3.1)得到均数标准误的估计式
 (3.2)
为了叙述方便,常称为标准误,称为理论标准误。
二、非正态总体的样本均数分布在非正态总体中随机抽样,样本均数在抽样前也是不能确定的,任意二次随机抽样的样本均数往往也是不同的,所以无论正态总体抽样还是非正态总体抽样,样本均数都是随机的,同样在概率意义下是有一定规律的。
为了帮助读者比较直观地了解从非正态总体抽样的样本均数分布规律,下面给出总体均数为1的指数分布(密度)曲线图和一个样本含量n=1000的样本资料(个体观察值)频数图(图3.2)。并且做3个抽样试验,在这个总体中大量重复随机抽样,样本量为n=4,n=9和n=100,分别抽10000个样本并作其样本均数的频数图(图3.3)和统计描述。
总体均数(=1(可以证明:总体标准差(=1)
在(=1的指数分布总体随机抽取一个样本


a:指数分布(密度曲线)图
b:个体观察值频数图(样本含量n=1000)。
,S= 0.9672,中位数M=0.7417
图3.2 指数分布的密度曲线和个体观察值频数图
n=4
n=9
n=100



(a)的均数=0.9903
的标准差=0.4891
的中位数=0.9087
(b)的均数=1.0068
的标准差=0.3313
的中位数=0.9696
(c)的均数=0.9995
的标准差=0.1002
的中位数=0.9976
图3.3 从总体均数为1的指数分布总体中随机抽10000个样本的样本均数频数图
从上述抽样结果可以看出:从非正态的指数分布总体X中抽样所得到的样本均数,在样本含量较小时呈偏态分布但也有别于指数分布,而在大样本时的频数分布图接近正态分布。的均数始终在X的总体均数(=1两侧附近,的标准差。
事实上,无论样本来自什么总体,理论上可以证明:
1,样本均数的总体标准差是个体资料X的总体标准差的(,即样本均数的理论标准误),理论标准误的样本估计式为。
2.样本均数与个体资料X的集中趋势位置相同,即样本均数与个体资料X的总体均数相同。
3.若个体资料所属总体X呈正态分布,则由前面所述可知,样本均数的分布规律仍为正态分布;作标准化变换
 (3.3)
则U服从标准正态分布。也就是说,若资料服从正态分布N((,(2),样本含量为n的样本均数出现在的概率为0.95,由此可见样本含量越大,这个范围就越小。
4.若被抽样总体X呈偏态分布且样本量n较大时(如n>40),由上述结果可知样本均数近似地服从正态分布,作标准化变换,则可以证明:U近似服从标准正态分布。
例3.2 已知7岁正常发育男孩的身高服从正态分布,在某地的正常7岁男孩中随机抽一个样本,样本含量为110,得到样本均数为121.92,样本标准差为4.527,则相应的标准误为。
例3.3 已知在某地7岁正常发育男孩的身高服从正态分布N(121,52),则正常发育7岁男孩身高的95%范围为=(111.2,130.8)。若在该地正常7岁男孩中随机抽一个样本,样本含量为100,则样本均数的95%范围为=(120.2,121.98),样本含量为100的样本均数的变异范围要比个体的变异范围小得多。
其他统计量的抽样误差问题:
抽样误差:总体统计指标与其样本统计指标的差值称为抽样误差。例如,总体均数与样本均数的差值称为样本均数的抽样误差。由于个体变异的原因,任何随机抽样的样本所构造的统计量都有抽样误差并且这个抽样误差都呈随机变化的。即:抽样前,抽样误差是不知道的。
标准误:总体参数往往是未知参数,通常用统计量的标准差估计抽样误差,为了区分资料的标准差,故称统计量的标准差为标准误。例如:样本均数的标准差称为样本均数的标准误。
所有的统计量都是有其概率分布的,常用的统计量其概率分布如下:
统计量
取变换
相应的分布
两个样本均数的差值
服从(或近似服从)正态分布
OR
取对数ln(OR)
近似服从正态分布
RR
取对数ln(RR)
近似服从正态分布
相关系数r

近似服从正态分布
线性回归b
服从正态分布
两个率的差值RD=P1-P2
要求P1和P2都较大时
RD近似服从正态分布
模拟两个样本均数的差值设:第一组:样本来自正态总体,样本量n1=25,总体均数为10,总体标准差为2;
设:第二组:样本来自正态总体,样本量n2=25,总体均数为12,总体标准差为2,
两个总体均数的差值=均数1-均数2=-0.2
随机在上述总体中抽10000个样本,每个样本计算两个组的样本均数及其两个样本均数的差值,因此得到10000个两个样本均数的差值RD,视这10000个样本均数的差值为新指标的观察资料,统计描述如下:
平均数为-1.999112,标准差为0.5658609,中位数为 -1.997535
视这10000个样本均数的差值为新指标的观察数据,作频数图:

由于原始资料来自正态总体,故其样本均数的差值也称正态分布,总体均数为-2。
以下通过模拟抽样说明样本OR、样本RR、样本对数OR、样本对数RR和两个样本率的差值的分布情况下列抽了10000个样本,A组的样本量为30,发生率(A=0.4,B组的样本量为40,(B=0.3,每个样本计算一个OR值、RR值以及相应的对数OR和对数RR以及两个率的差值,因此共有10000个样本OR值、10000个样本RR值、10000个对数OR值、10000个样本RR值以及10000个两个率的差值RD。
则总体,总体
总体对数OR=0.44183275 总体对数RR=0.2877
把这些10000个样本统计量视为新的指标资料,统计如下
OR
对数OR
RR
对数RR
两个率的差值
平均值
1.807
0.4485949
1.421049
0.2891504
0.0993442
中位数
1.5555556
0.4418328
1.333333
0.2876821
0.1
几何均数
1.56611
0.4858439
1.335293
0.3141609
0.1075269
从上述估计可见,中位数比较接近总体值,估计的精度相对比较高。
视10000个样本OR作为新指标的数据作频数图

视10000个样本对数OR作为新指标的数据作频数图

视10000个样本RR作为新指标的数据作频数图

视10000个样本对数RR作为新指标的数据作频数图

视10000个样本率的差值作为新指标的数据作频数图

Effect Size(效应差异度量):在Meta分析中,两组总体效应指标的差异。由于在Meta分析中,通常要求Effect Size的对应样本统计量近似服从正态分布,所以常见的Effect Size选择如下:
效应指标为均数,则Effect Size=(2-(1
效应指标为率,则Effect Size可以为对数相对危险度ln(RR)=ln((1/(2)
效应指标为比较大的率,则Effect Size可以为两个率的差值=(1-(2
效应指标为率或Odds,则Effect Size可以为对数Odds Ratio,ln(OR)=
效应指标为回归系数,Effect Size即为回归系数效应指标为相关系数,Effect Size=
Meta分析是把多个研究的统计分析结果进行综合分析,Meta分析分为确定性模型和随机模型,一般而言,确定性模型的检验效能比随机模型中的检验效能要高一些,但确定性模型要求各个研究的Effect Size齐性。
Effect Size齐性是指各个研究的总体Effect Size相同。
对于两个总体均数差值为Effect Size,则有如下性质:
各个研究的每一组总体均数相同,则Effect Size齐性。
各个研究的每一组总体均数可能不同,但各个研究两组总体均数的差值相同,则Effect Size齐性。
例如:
第一种情况的Effect Size齐性
第二种情况的Effect Size齐性
no
A组总体均数
B组总体均数
Effect Size
no
A组总体均数
B组总体均数
Effect Size
1
10
9
1
1
10
9
1
2
10
9
1
2
10.5
9.5
1
3
10
9
1
3
9.5
8.5
1
4
10
9
1
4
12
11
1
在大多数研究中,都是第二种情况(各个研究的A组观察资料不是来自同一总体,B组观察资料也不是来自同一总体,但是它们的Effect Size是相同的。通过Meta分析,得到Effect Size的分析结果。这种情况下的Meta分析在多中心研究中称为校正中心效应。
对于效应指标为相对危险度RR与优势比(OR)都有相同的情况
OR齐性
no
PA
PB
OR
RR
1
0.645656
0.598688
1.221403
1.078453
2
0.668188
0.622459
1.221403
1.073464
3
0.689974
0.645656
1.221403
1.068641
4
0.598688
0.549834
1.221403
1.088852
RR齐性
no
PA
PB
OR
RR
1
0.645656
0.581091
1.313569
1.111111
2
0.668188
0.601369
1.334861
1.111111
3
0.689974
0.620977
1.358393
1.111111
4
0.598688
0.538819
1.276869
1.111111
同一资料,OR齐性不能说明RR齐性
RR齐性不能说明OR齐性,所以Effect Size齐性是针对具体的Effect Size指标而言的,不能仅仅依据某个Effect Size指标不齐性,就称该资料不齐性。
小结样本OR和样本RR的随机性规律(分布)相对比较偏态,而样本对数OR和样本对数RR近似正态分布比较好。
两个样本均数的差值服从正态分布或近似服从正态分布。
如果两个率都比较大时,其差值近似服从正态分布。
对数OR和对数RR的正态近似效果优于OR和RR