第一篇 基本统计方法第二章 计量资料的统计描述第一节 频数分布一、频数分布表频数,计量资料经分组后清点出的各组例数为频数。
频数分布,就是指各组频数的分配情况。
频数分布表,将分组和各组的频数以及频率编制成的表称为频数分布表。
某地 101名正常成年女子血清总胆固醇( mmol/L)结果
2.35 4.21 3.32 5.35 4.17 4.13 2.78 4.26 3.58 4.34 4.84 4.41
4.78 3.95 3.92 3.58 3.66 4.28 3.26 3.50 2.70 4.61 4.75 2.91
3.91 4.59 4.19 3.68 4.52 4.91 3.18 3.68 4.83 3.87 3.95 3.91
4.15 4.55 4.80 3.41 4.12 3.95 5.08 4.53 3.92 3.58 5.35 3.84
3.60 3.51 4.06 3.07 3.55 4.23 3.57 4.83 3.52 3.84 4.50 3.96
4.50 3.27 4.52 3.19 4.59 3.75 3.98 2.13 4.26 3.63 3.87 5.71
3.30 4.73 4.17 5.13 3.78 4.57 3.80 3.93 3.78 3.99 4.48 4.28
4.06 5.26 5.25 3.98 5.03 3.51 3.86 3.02 3.70 4.33 3.92 3.25
4.15 4.36 4.95 3.00 3.26
某地 120例正常人血清铜含量 ( μmol/L)
13.84 12.53 13.70 14.89 17.53 13.19 18.82 10.15 14.56 11.23 12.81 12.89
14.73 17.44 13.90 14.10 12.29 12.61 14.78 14.40 9.93 15.18 16.04 13.41
14.59 14.71 18.62 19.04 10.95 1.081 10.53 18.06 16.18 15.60 12.32 9.29
13.56 11.48 13.07 16.88 17.04 17.98 12.62 10.62 16.43 14.26 14.17 16.43
11.03 9.23 15.04 14.09 15.90 11.48 14.64 17.24 15.43 13.37 15.33 12.09
13.64 14.39 15.74 13.99 11.31 17.61 16.26 11.32 17.88 16.78 14.35 16.19
13.53 11.68 13.25 11.88 14.21 15.21 15.29 16.63 12.87 15.93 13.74 14.94
13.70 14.45 11.23 19.84 13.11 15.15 11.70 15.37 12.35 14.51 15.19 11.92
14.09 18.22 14.34 15.48 11.98 16.54 12.95 12.06 16.67 17.09 15.66 14.50
16.85 13.20 16.84 12.29 15.47 17.28 15.73 14.83 15.57 18.42 17.13 17.34
1,找极值:本例最大值为 5.71,
最小值为 2.35。
2,求极差 ( 全距,R ),R = 最大值 - 最小值本例 R = 5.71 - 2.35 = 3.36
3,定组数 (k):可设 10~15个组,
一般暂设 10组 。
4,求组距 (i),i = R / k
i = 3.36 / 10 = 0.336 ≈0.3。
组距要求取 整齐数,本例定为 0.3。
连续型数值变量资料频数表的编制:
5,列组限:每个组段的起点称下限( L),终点称上限 (U)。
第一组段应包括最小值,最后一组应包括最大值。
第一组段的下限取等于或略小于最小值的 整齐数,
本例取 2.30,其余组段下限依次加 1个组距,直到包括最大值。最后一组可写出上限。
最后分为 12组 。
6,划记归组:用划记的方式将观察值归入各组,
求出各组频数。 L≤X<U
7,列表,并求出频率、累计频数、累计频率。
表 2-1 某单位 101名正常成年女子血清胆固醇( mmol/L)分布组段 频数 频率(%) 累计频数 累计频率(%)
2.30~ 1 0.99 1 0.99
2.60~ 3 2.97 4 3.96
2.92~ 6 5.94 10 9.90
3.20~ 8 7.92 18 17.82
3.50~ 17 16.83 35 34.65
3.80~ 20 19.80 55 54.46
4.10~ 17 16.83 72 71.29
4.40~ 12 11.88 84 83.17
4.70~ 9 8.91 93 92.08
5.00~ 5 4.95 98 97.03
5.30~ 2 1.98 100 99.01
5.60~ 5.90 1 0.99 101 100.00
合 计 101 100.00 —— ——
组段 频数 频率 累积频数 累计频率 ( %)
9.00~ 3 2.5 3 2.5
10.00~ 4 3.3 7 5.8
11.00~ 12 10.0 19 15.8
12.00~ 13 10.8 32 26.6
13.00~ 17 14.2 49 40.8
14.00~ 22 18.3 71 59.1
15.00~ 18 15.0 89 74.1
16.00~ 13 10.8 102 84.9
17.00~ 11 9.2 113 94.1
18.00~ 5 4.2 118 98.3
19.00~ 2 1.7 120 100.0
合计 120 100.0 —— ——
某地 120 例正常成年人血清铜含量频数表
频率=频数/总频数
累计频数为各组频数依次相加
累计频率=累计频数/总频数表 2-2 某医院 1123名产后出血孕妇的人流次数分布人流次数 产后出血人数 累计频数 累计频率(%)
0 402 402 35.80
1 330 732 65.18
2 232 964 85.84
3 118 1082 96.35
4 27 1109 98.75
5 11 1120 99.73
6 3 1123 100.00
合计 1123 —— ——
离散型数值变量频数表频数分布图是以直方的面积大小表示各组频数的多少,观察资料的频数分布比频数表 更直观和形象 。
频数分布图的绘制:
1,纵坐标表示 频数,从 0开始等距离 标明尺度,
最高尺度 取等于或 大于 各组频数的最大值即可。
2,横坐标表示 分组,等距离 标明组段 下限 。
3,各组直条的 高度,根据各组频数,画在纵坐标相应高度。
4,纵坐标与横坐标较合适的 比例 为 5,7左右。
二、频数分布图
0
5
10
15
20
频数
2.3 2.6 2.9 3.2 3.5 3.8 4.1 4.4 4.7 5.0 5.3 5.6 5.9
图 2-1 101名正常成年女子血清总胆固醇频数分布血清总胆固醇( mmol/L)
0
5
10
15
20
25
9  1 0  1 1  1 2  1 3  1 4  1 5  1 6  1 7  1 8  1 9  2 0
血清铜含量 ( μmol/L)
某地 120例正常成年人血清铜含量二、频数分布图频数三、频数分布表(图)的用途:
1,描述频数分布的类型;
对称分布,集中位置居中,两侧频数分布基本对称。
偏态分布,集中位置偏移,两侧频数分布不对称。
(1)正偏态:集中位置偏左,长尾向右延伸,又称右偏态。
(2)负偏态:集中位置偏右,长尾向左延伸,又称左偏态。
展示资料的分布类型,为选择适当的统计方法提供依据
0
5
10
15
20
频数
12 15 18 21 24 27 30 33 36 39 42 45
图 2-2 115名正常成年女子血清转氨酶的频数分布血清转氨酶( mmol/L)
25
0
5
10
15
20
频数
0 5 10 15 20 25 30 35 40 45 50
图 2-3 101名正常人血清肌红蛋白的频数分布血清肌红蛋白( μg/mL)
25
分布曲线示意
2,描述频数分布的特征;
集中趋势,
某些组段的频数较多或某一组段频数最多。
本例居中的 4个组段频数较多( 66例)其中
3.8~
4.1组段最多( 20例),两边组段的频数分布均向该组段靠拢。 (单峰 )
离散趋势,
观察值的大小不等情况(个体差异或变异),
本例变异范围在 2.3~ 5.9mmol/L之间。频数分布的集中趋势和离散趋势均可用统计指标描述
3,便于发现离群值(可疑值、极端值);
4,便于进一步计算分析;
5,当样本含量足够大时,以频率作为概率的估计值。
第二节 集中趋势的描述 —— 平均数平均数( average)的意义,
平均数作为一组观察值的 代表,概括地反映一组观察值的集中位置或平均水平,
便于比较和分析 。
常用的平均数,算术平均数、几何平均数、中位数、众数和调和平均数等。
众数:出现次数最多的观察值。
调和平均数:观察值倒数均数的反倒数。
一、算术平均数 (arithmetic mean):
简称 均数,是一组观察值之和与观察值个数之比,用于 对称分布 或 正态分布 资料。
μ表示总体均数,表示样本均数。
正态性检验见第六节。
x
1,直接计算法 (未分组资料 )
式中 Σ表示求和,x表示观察值,n表示观察值个数。
例 2-2:用直接法计算例 2-1资料的均数:
= 4.03(mmol/L)
/x x n?=
x
例,12名肾虚失钠型病人甲皱微循环的管绊长度 (μ m)分别为,125.0 125.0 125.0
187.5 187.5 187.5 187.5 250.0 250.0
250.0 312.5 312.5,试求其均数 。
答,12名肾虚失钠型病人甲皱微循环的管绊长度的均数为 208.3(μ m)。
3.208
12/)5.3120.1250.125(
x
2,频数表法(加权计算法):(分组资料)
式中 f 为频数(权数),X为 组中值 。
例 2-1资料计算表,公式计算结果:
(mmol/L)
答:某单位 101名正常成年女子血清胆固醇均数为 4.06(mmol/L)
ffX /
06.41 0 1/75.4 0 9
/

ffX
x
x
某单位 101名正常成年女子血清胆固醇均数与标准差计算表组段 频数 f 组中值 X f X
2.30~ 1 2.45 2.45 6.00
2.60~ 3 2.75 8.25 22.69
2.92~ 6 3.05 18.30 55.82
3.20~ 8 3.35 26.80 89.78
3.50~ 17 3.65 62.05 226.48
3.80~ 20 3.95 79.00 312.05
4.10~ 17 4.25 72.25 307.06
4.40~ 12 4.55 54.60 248.43
4.70~ 9 4.85 43.65 211.70
5.00~ 5 5.15 25.75 132.61
5.30~ 2 5.45 10.90 59.41
5.60~ 5.90 1 5.75 5.75 33.06
合 计 101 —— 409.75 1705.09
2fX
组段 组中值 频数
9.00~ 9.5 3 28.5 270.75
10.00~ 10.5 4 42 441
11.00~ 11.5 12 138 1587
12.00~ 12.5 13 162.5 2031.25
13.00~ 13.5 17 229.5 3098.25
14.00~ 14.5 22 319 4625.5
15.00~ 15.5 18 279 4324.5
16.00~ 16.5 13 214.5 3539.25
17.00~ 17.5 11 192.5 3369.75
18.00~ 18.5 5 92.5 1711.25
19.00~ 19.5 2 39 760.5
合计 - 120 1737 25758.5
某地 120例正常人血清铜含量 ( μmol/L) 均数、标准差计算表
2fXfXfX
答:某地 120例正常人血清铜含量的均数为 14.48( μmol/L)。
/
9,5 0 3 1 0,5 0 4 1 9,5 0 2 / 1 2 0
1 7 3 7,0 / 1 2 0 1 4,4 8
x fx f


( + + )
几何均数是 n个观察值乘积的 n次方根,
用于 对数正态分布 资料(观察值呈倍数关系),用 G表示。
1,直接计算法:
或二、几何均数 (geometric mean)
1 l o gl o g ( )xG
n

nn xxxxxxG
n 4321
例 2-4 某地 5例微丝蚴血症患者治疗后,用间接荧光抗体试验测得其抗体滴度分别为 1:10、
1:20,1:40,1:40,1:140,试求几何均数。
答,5例微丝蚴血症患者抗体滴度 几何均数为
1:34.8。
8.34
)
5
1 6 0lg40lg40lg20lg20lg10lg
(lg 1

G
8.34
1604040202010
nG
注意:先用滴度倒数计算,然后再取计算结果的倒数。
例:某医院测得 8名脾虚纳呆患儿的尿液淀粉酶含量( U/10ml)为 4,4,8,8,8,16、
16,32,试求几何均数。
或,
答,8名脾虚纳呆患儿的尿液淀粉酶含量几何均数为 9.5。
5.9321616888448G
1 l og 4l og ( ) 9.5G
n
+l og4 + +lo g32
2,加权计算法:
或例 2-5:见表 2-5
答,69例 RA患者血清 EBV-VCA-lgG抗体滴度几何均数为 1:150.6。
1 l o gl o g ( )fxG
f

f f
n
fff nxxxxG 321
321
6.1 5 0)
69
2 7 7 8.1 5 0
(lg
)
69
1 2 8 0lg240lg1020lg310lg4
(lg
1
1


G
表 2-5 69例 RA患者血清 EBV-VCA-lgG抗体测定结果抗体滴度 人数 f 滴度倒数 X lgX flgX
1:10 4 10 1.0000 4.0000
1:20 3 20 1.3010 3.9030
1:40 10 40 1.6021 16.0210
1:80 10 80 1.9031 19.0310
1:160 11 160 2.2041 24.2451
1:320 15 320 2.5010 37.5765
1:640 14 640 2.8062 39.2868
1:1280 2 1280 3.1072 6.2144
合计 69 —— —— 150.2778
某医院 46例暑温患者的血凝抑制抗体滴度计算表抗体滴度 人数 f 滴度倒数 x log x f log x f (logx) 2
1:20 1 20 1.3010 1.3010 1.6926
1:40 5 40 1.6021 8.0105 12.8336
1:80 10 80 1.9031 19.0310 36.2179
1:160 10 160 2.2041 22.0410 48.5807
1:320 11 320 2.5051 27.5561 69.0308
1:640 6 640 2.8062 16.8372 47.2486
1:1280 1 1280 3.1072 3.1072 9.6547
1:2560 2 2560 3.4082 6.8164 23.2317
合计 46 - - 104.7004 248.4906
答,某地 46例暑温患者的血凝抑制抗体平均滴度为 1:189。
189)46/7004.104(l o g 1G
注意,
采用以上方法计算 G值时,观察值不能有 0,也不能同时有正值和负值出现。如有以上情况,可采用适当的变量变换方法见第六节。
三、中位数( meadian)
将一组观察值从小到大排列,位次居中的数即中位数,用 M表示。用于 偏态分布 资料,
或分布 不规则,分布 不明 及 开口 资料等。
1,直接计算法:
(1)当 n为奇数时,。
例:某医院用大黄粉治疗谓热血淤型血证患者 9人,
其大便阴转天数分别为 1,1,2,2,3,4,5,
7,10,试求其中位数。
本例 n= 9,中位数位于第 5位,即中位数 3天。
2/)1( nXM
(2)当 n为偶数时例:某医院用大黄粉治疗胃热血淤型血证患者 10人,其大便阴转天数分别为 1,1,2,
2,3,4,5,7,10,16,试求其中位数。
本例 n= 10,中位数是第 5位与第 6位观察值的均数,即,
M = ( 3 + 4 ) / 2 = 3.5(天 )
2/)( 1)2/(2/ nn XXM
例 2-6 7名病人患某病的潜伏期分别为 2,3,4,5、
6,9,16天,求其中位数。
例 2-7 8名患者食物中毒的潜伏期分别为 1,2,2、
3,5,8,15,24小时,求其中位数。
2.频数表法
( 1)离散型数值变量频数表资料例 2-8,计算表 2-2资料的中位数。
中位数是第几位? 1123/2=561.5位人流次数的平均值即中位数是 1次。
表 2-2 某医院 1123名产后出血孕妇的人流次数分布人流次数 产后出血人数 累计频数 累计频率(%)
0 402 402 35.80
1 330 732(562 ) 65.18
2 232 964 85.84
3 118 1082 96.35
4 27 1109 98.75
5 11 1120 99.73
6 3 1123 100.00
合计 1123 —— ——
( 2)连续 型数值变量 频数表资料:
式中 L为 M所在组下限,iM为组距,fM为 M所在组频数,Σ fL为 M所在组以前累计频数 。
例,905例男性银屑病患者的发病年龄,见下表,
试求其平均发病年龄。
该资料的频数分布呈偏态,故应选择中位数。
答,905名患者的平均发病年龄为 24.23岁。
)2/( L
M
M fn
f
iLM
23.24)3 0 62/9 0 5(
3 4 6
1020M
905例男性银屑病患者的发病年龄年龄(岁) 频数 f 累计频数 累计频率(%)
<10 54 54 5.97
10~ 252 306 (ΣfL ) 33.81
20~ 346 ( fM) 652 72.04
30~ 128 780 86.19
40 84 864 95.47
50~ 29 893 98.67
60~ 5 898 99.23
≥70 7 905(Σf ) 100.00
例 2-9 118名链球菌咽喉炎患者的潜伏期资料见表
2-6,试求中位数。
答,118名链球菌咽喉炎患者的平均潜伏期中位数为 51天。
51)53
2
118(
24
1248M
)2/( L
M
M fn
f
iLM
48 6051(6,59)
表 2-6 118名链球菌咽喉炎患者的潜伏期天数 人数 累计频数 累计频率(%)
12~ 4 4 3.4
24~ 17 21 17.8
36~ 32 53 44.9
48~ 24 77 (59) 65.3
60~ 18 95 80.5
72~ 12 107 90.7
84~ 5 112 94.5
96~ 4 116 98.3
108~ 2 118 100.0
四、运用平均数的注意事项
1.注意正确选择平均数
2.注意平均数之间的关系:
⑴ 对称分布资料:均数=中位数
⑵ 同一组资料:几何均数 <均数
⑶ 正偏态资料:均数 >中位数
⑷ 负偏态资料:均数 <中位数
3.注意和变异指标结合使用五、百分位数 (percentile):
把一组观察值从小到大排列,分为 100
等份,与 x%位次所对应的数值就是第百分之 x位的百分位数,以 Px表示。
百分位数是所有观察值一百等分的分割值百分位数用于:计算四分位数间距估计医学参考值范围
1.直接计算法当 nX%为带有小数时:
当 nX%为整数时:
truncate:取整百分位数的计算:
)1%)(( nXt r u n cX XP
)(
2
1
1%)(%)( nXnXX XXP
例 2-9 对某医院细菌性痢疾治愈者的住院天数统计,
120名患者的住院天数从小到大的排列如下,试求第 5百分位数和第 99百分位数 。
患 者:
住院天数:
1 2 3 4 5 6 7 8 9 1 1 7 1 1 8 1 1 9 1 2 0
1 2 2 2 3 3 4 4 5 4 0 4 0 4 2 4 5
)(5.3)43(
2
1)(
2
1
765 天 XXP
。6%5120,120n
。8.1 1 8%991 2 0
)(42119)1)8.118((99 天 XXP t r u n c
2.频数表计算法
PX =LX + ( iX / fX )( n X % -ΣfL )
例 2-10:表 2-6资料。
P25 =36+(12 / 32)(118× 25 % - 21 )
=39.2(天)
P75 =60+(12 / 18)(118 × 75 %- 77 )
=67.7(天)
P50=M 表 2-2资料的 P95 = 3
表 2-6 118名链球菌咽喉炎患者的潜伏期天数 人数 累计频数 累计频率(%)
( 1) ( 2) ( 3) ( 4)
12~ 4 4 3.4
24~ 17 21 17.8
36~ 32 53 44.9
48~ 24 77 65.3
60~ 18 95 80.5
72~ 12 107 90.7
84~ 5 112 94.9
96~ 4 116 98.3
108~ 2 118 100.0
表 2-2 某医院 1123名产后出血孕妇的人流次数分布人流次数 产后出血人数 累计频数 累计频率(%)
0 402 402 35.80
1 330 732 65.18
2 232 964 85.84
3 118 1082 96.35
4 27 1109 98.75
5 11 1120 99.73
6 3 1123 100.00
合计 1123 —— ——
离散型数值变量频数表第三节 数值变量的离散趋势描述一、极差 (range):
又称全距,用 R表示,R=最大值-最小值。
极差用于任何分布资料,反映个体变异的范围 。
优点,意义明确,计算简单,
缺点,反映数据离散趋势不全面,稳定性较差,误差较大,受 n影响大。
用极差比较离散趋势大小时要求 n1= n2
例 2-11 试计算下面三组同龄男孩的身高 均数和极差。
甲组:,,;
乙组:,,;
丙组:,,

(cm)
9 0 9 5 1 0 0 1 0 5 1 1 0
1 0 0 c mX?甲
1 1 0 9 0 2 0 c mR甲
9 6 9 8 1 0 0 1 0 2 1 0 4 100cmX?

1 0 4 9 6 8 c mR乙
9 6 9 9 1 0 0 1 0 1 1 0 4 1 0 0 c mX?丙
1 0 4 9 6 8 c mR丙二、四分位数间距 (quartile range),
是上下四分位数之差,用 QR 表示,
QR = QU - QL = P75 - P25
例 2-12,求 118名链球菌咽喉炎患者的潜伏期的四分位数间距。
QR = 67.7- 39.2= 28.5
答,118名链球菌咽喉炎患者的潜伏期的四分位数间距为 28.5天四分位数间距用于配合 M描述偏态分布等资料的离散趋势。
四分位数间距是中间一半观察值的极差。
P25 P75 P50
50%
P100P0
三、方差 (variance)与标准差 (standard deviation):
方差 即离均差平方和的均值,用 σ2 表示总体方差,S2 表示样本方差。
标准差 为方差的算术平方根,用 σ表示总体标准差,S 表示样本标准差。
N
X 22 )(?

N
X 2)(?

总体方差:
总体标准差,
)1/()( 22 nxxs
)1/()( 2 nxxs
)1/(]/)([ 22 nnxxs
)1/(]/)([ 22 fffXfXs
样本标准差:
样本方差:
样本标准差简化公式:
分组资料样本标准差公式:
1.标准差意义,全面衡量观察值以均数为中心的离散程度。
2.计算:
1)直接计算法:
2)加权法:
)1/()( 22 nxx
)1/(/)( 22 fffXfXs
)1/()( 2 nxxs
例 2-12 计算例 2-11资料的标准差为:
(厘米)=甲 91.7S
(厘米)=乙 16.3S
(厘米)=丙 92.2S
标准差与 n大小有无直接关系?
观察值加减或乘除同一个数,均数和标准差会发生怎样的变化?
例,测得 7名外感风寒女性患者的体温分别为 37.8、
38.0,38.1,38.2,38.3,38.5,39.4 摄氏度,试求标准差。
先求得,
代入公式得,
答,7名外感风寒女性患者体温的标准差为 0.52
摄氏度。
3.2 6 8
19.1 0 2 8 52


x
x
52.0)17/()3.268(19.10285 2s
分组资料的标准差:
某地 120例正常人血清铜含量资料:
答:某地 120例正常人血清铜含量标准差为
2.27( μmol/L)。
)1120/(120/)1737(2 5 7 5 8 2s
2,2 7?
组段 组中值x 频数f fx fx2
9.00~ 9.5 3 28.5 270.75
10.00~ 10.5 4 42 441
11.00~ 11.5 12 138 1587
12.00~ 12.5 13 162.5 2031.25
13.00~ 13.5 17 229.5 3098.25
14.00~ 14.5 22 319 4625.5
15.00~ 15.5 18 279 4324.5
16.00~ 16.5 13 214.5 3539.25
17.00~ 17.5 11 192.5 3369.75
18.00~ 18.5 5 92.5 1711.25
19.00~ 19.5 2 39 760.5
合计 - 120 1737 25758.5
某地 120例正常人血清铜含量 ( μ mol/L) 均数、标准差计算表某单位 101名正常成年女子血清胆固醇均数与标准差计算表组段 频数 f 组中值 X f X
2.30~ 1 2.45 2.45 6.00
2.60~ 3 2.75 8.25 22.69
2.92~ 6 3.05 18.30 55.82
3.20~ 8 3.35 26.80 89.78
3.50~ 17 3.65 62.05 226.48
3.80~ 20 3.95 79.00 312.05
4.10~ 17 4.25 72.25 307.06
4.40~ 12 4.55 54.60 248.43
4.70~ 9 4.85 43.65 211.70
5.00~ 5 5.15 25.75 132.61
5.30~ 2 5.45 10.90 59.41
5.60~ 5.90 1 5.75 5.75 33.06
合 计 101 —— 409.75 1705.09
2fX
答,101名正常成年女子血清胆固醇标准差为
0.654( mmol/L)

6 5 4.0
)11 0 1/(1 0 1/)75.4 0 9(09.1 7 0 5 2
s
101名正常成年女子血清胆固醇资料:
补充,对数正态分布资料的标准差:
= 2.99
答,46例暑温患者的血凝抑制抗体滴度标准差为 1∶ 2.99。
)1/(/)l o g(l o gl o g 221 nnxfxfs
)146/(46/)7004.104(4906.248l o g 21
某医院 46例暑温患者的血凝抑制抗体滴度计算表抗体滴度 人数 f 滴度倒数 x log x f log x f (logx) 2
1:20 1 20 1.3010 1.3010 1.6926
1:40 5 40 1.6021 8.0105 12.8336
1:80 10 80 1.9031 19.0310 36.2179
1:160 10 160 2.2041 22.0410 48.5807
1:320 11 320 2.5051 27.5561 69.0308
1:640 6 640 2.8062 16.8372 47.2486
1:1280 1 1280 3.1072 3.1072 9.6547
1:2560 2 2560 3.4082 6.8164 23.2317
合计 46 - - 104.7004 248.4906
3.标准差的应用:
1.和均数(或几何均数)配合描述正态分布(或对数正态分布)观察值的 离散趋势 ;
2.表示均数(或几何均数)的 代表性 ;
3.衡量测定方法的精密度与稳定性;
4,配合均数估计观察值的频数分布范围 ;
5.用于计算标准误和变异系数。
6.标准差比较时的条件,
均数相近,单位相同 。
五、变异系数变异系数指一组观察值的标准差与均数的比值,用 CV表示,是相对离散度指标。
计算公式为:
CV用于比较 度量单位不同,或 均数相差悬殊 时观察值的离散度。
用于评价或比较测量仪器精密度和实验指标的稳定性。
%1 0 0/ xsCV
例:某单位测得 28例成人脾虚病人的红细胞数( RBC)均数为,
,标准差为,
血红蛋白值( Hb)均数为 87.2g/L,标准差为
33.3g/L,试比较两指标的变异程度。
计算如下:
CVRBC =(0.86/3.10)× 100%=27.74%
CVHb =(33.3/87.2)× 100%=38.19%
说明血红蛋白变异程度比红细胞数大。
120,8 6 1 0 / L?
123,1 0 1 0 / L?
教材例子:
%%==身高,83.31 0 0
10.1 2 3
71.4
CV
%%==体重,14.101 0 0
29.22
26.2
CV
图 2-4 频数分布逐渐逼近正态分布示意
(1) (2) (3)
第四节 正态分布正态分布资料,资料的频数分布呈现中间多,
两边逐渐减少而且基本对称。
即频数分布具有集中性、对称性和均匀分布性。
一、正态分布的 定义和特征,
如果随机变量 X的分布服从概率密度函数:
则称随机变量 X服从正态分布,
记作 X~N(μ,σ2 )。
式中 e为自然对数的底,e= 2.71828,
π为圆周率,π = 3.1416
2
2
()
2
1
()
2
X
f X e

定义:
(1)具有 集中性,对称性 和 均匀变动性 。表现为以均数为中心,高峰位于中央,两侧逐渐下降并完全对称,曲线两端永远不与横坐标相交。
(2)正态分布曲线的高峰位于 μ处。
(3)正态分布图形由 2个重要参数 μ和 σ确定。
μ是 位置参数,σ是 形状参数 。
正态分布的特征:
均数相等、方差不等的正态分布图示
- 4 - 3 - 2 - 1 0 1 2 3 4
方差相等、均数不等的正态分布图示
4,正态曲线下的面积分布规律:
μ± 1.65σ区间面积占曲线下总面积的 90%。
μ± 1.96σ区间面积占曲线下总面积的 95%。
μ± 2.33σ区间面积占曲线下总面积的 98%。
μ± 2.58σ区间面积占曲线下总面积的 99%。
μ-1.96 μ+2.58μ
2.5% 0.5%
正态曲线下面积分布示意图
5%
二,标准正态分布,
将一般正态分布资料通过下列公式变换:
u值的 均数为 0,标准差为 1,
u值的称为标准正态分布。
/)( xu
标准正态分布记作 u~N(0,1)
2
2
2
1
)(
u
eu

2
2
()
2
1
()
2
X
f X e

u 值表 见附表一( 803页)
- 2 - 1 0 1 2
u分布示意图标准正态曲线下面积分布则不需要考虑 μ和 σ。
u =- 1.96 u = 1.96
三、正态分布和标准正态分布的应用:
1,正态分布是统计学原理和统计分析方法的基础。
2,估计观察值的 频数分布范围或分布百分
(1)已知百分比求频数分布范围:
如有 90%的观察值分布在 ± 1.65S范围中。
(2)已知频数分布范围求百分比:
先求出 u值然后查 u值表。
x
例 2-15 前例已计算出 101名正常成年女子的血清总胆固醇均数,
标准差 S=0.654 。
试估计该单位:
①正常女子血清总胆固醇在 4.00 以下者占正常女子总人数的百分比;
②在 5.00 以上者各占正常女子总人数的百分比;
③在 4.00~5.00 之间者占正常女子总人数的百分比。
4,0 6X?
m m ol /L
m m ol /L
m m ol /L
m m ol /L
m m ol /L
05.0
6 5 9.0
03.400.4
1
u
47.1
659.0
03.400.5
2?
u
4 8 0 1.0)05.0(值表得查 u
0708.0)47.1(值表得查 u
100%- 48.01%- 7.08%= 44.91%
3,控制检测误差(质量控制):如果 极端值和均数的差值超过 3倍标准差,则可将其舍弃。
4,进行 参数估计,假设检验 及 医学参考值 范围估计。详见后面各章节。
5,有些资料不服从正态分布,但经过 变量变换 后可使其服从正态分布,也可按正态分布规律来处理。
0013.0)00.3(值表得查 u
第五节 医学参考值范围的制定一,基本概念医学参考值是指包括绝大多数正常人的人体形态、功能和代谢产物等各种生理及生化指标值,
也称医学正常值。由于个体差异的存在,正常值并非定值,而是在一定范围内波动,故采用一定的范围作为判定正常和异常的参考标准。
二,医学参考值范围的制定步骤和要求
1.选定正常人样本
①制定标准:相对正常标准,排除具有影响研究指标的疾病和因素的人。
②确定分组:不同特征人群的指标如有本质区别,
则应分开制定。
③确定样本大小,一般每组不低于 100例。
2.测定指标,测定方法统一,测定时要严格控制影响因素,减少测量误差,保证测定结果的正确性和可靠性。
3.决定单、双侧,根据专业知识确定,如过高或过低均异常则为双侧,否则为单侧。
4.确定百分范围,一般为 80%~ 95%为宜。根据专业知识确定,如重点控制假阳性则范围应大些,重点控制假阴性则范围应小些。
5.计算界值,根据资料的分布类型,选择适合的方法计算,常用的有正态分布法 (正态分布资料 )
和百分位数法(偏态分布资料)。
三、参考值范围界值的计算
1.正态分布法 用于正态分布资料。
双侧 1- α参考值范围单侧 1- α参考值范围单侧低限,>
单侧高限,<
Sux 2/
α=1-百分范围
Sux
Sux
表 2-7 正态分布资料的参考值范围计算百分范围 单侧下限 单侧上限 双侧
80%
90%
95%
99%
Sx 28.1?
Sx 64.1?
Sx 33.2?
Sx 64.1?
Sx 28.1?
Sx 58.2?
Sx 96.1?
Sx 64.1?
Sx 33.2?
Sx 84.0? Sx 84.0? Sx 28.1?
例 2-16 由例 2-1资料估计正常成年女子血清总胆固醇的参考值范围。
)(=-下限,Lm m o l/74.2659.096.103.4?
)(=+上限,Lm m o l/32.5659.096.103.4?
该地正常成年女子血清总胆固醇的 双侧参考值范围为( 2.74,5.32) mmol/L。
双侧 1- α参考值范围 例如 95%
~
单侧 1- α参考值范围单侧低限,>
单侧高限,<
2/1 0 01 0 02/1 0 0 ~PP
100P
100100?P
α=1- 百分范围二、百分位数法 用于偏态分布资料。
5.97P5.2P
偏态分布资料计算参考值范围的百分位数百分范围 单侧下限 单侧上限 双侧
80% ~
90% ~
95% ~
99% ~
5P
80P
99P
95P
1P
10P 90
P 95P5P
90P10P20P
5.99P5.0P
5.97P5.2P
例 2-17 测得某年某地 282名正常人的尿汞值如表 2-8,试制定正常人尿汞值的参考值范围。
P95 =LX + ( iX / fX )( n X % -ΣfL )
= 40.0+ ( 8.0 / 11 )( 282× 95% - 263 )
)/(6.43 Lg
答,测得某年某地 282名正常人的尿汞值的参考值范围 单侧高限 为 。)/(6.43 Lg?
表 2-8 某年某地 282名正常人尿汞值( μ g /L)测量结果尿汞值 频数 f 累计频数 Σ f 累计频率(%)
0~ 45 45 16.0
8.0~ 64 109 38.6
16.0~ 96 205 72.7
24.0~ 38 243 86.2
32.0~ 20 263 93.3
40.0~ 11 274 97.2
48.0~ 5 279 98.9
56.0~ 2 281 99.6
65.0~ 1 282 100.0
补充:对数正态分布法:
三种估计方法的应用和计算( 95%)
正态分布法 对数正态分布法 百分位数法资料类型 正态分布 对数正态分布 偏态分布双侧界限单侧下限双侧上限
Sx 96.1?
Sx 65.1?
Sx 65.1?
)65.1(lg lglg1 xx Sx
)65.1(lg lglg1 xx Sx
)96.1(lg lglg1 xx Sx 5.975.2 ~ PP
5P
95P
结束