第二章 统计描述
第四节 正态分布
(Normal distribution)
正态分布( Normal Distribution)
? 概述:
? 正态分布是描述连续型 变量
值 分布的曲线,医学资料许
多服从正态分布。
?
? 直方图的频数分布与正态分布
? (见图 2-4)
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
12.00 14.50 17.00 19.50 22.00 24.50 27.00 29.50 32.00
D? ±? óa ?? ê? íè 2? ?? á| £¨k g £? ·? 2?
0
10
20
30
40
50
14- 16- 18- 20- 22- 24- 26- 28- 30- 32-
?? á| £¨k g £?

êy
£¨f
£?
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
12.0 14.5 17.0 19.5 22.0 24.5 27.0 29.5 32.0
图 2-4 频数分布与正态分布示意图
一、正态分布的概念和特征
? 1.正态分布曲线的数学函数表达式:
2)(
2
1
2
1
)( ?
?
??
?
?
?
X
eXf
X为连续随机变量,μ为 X值的总体均数,
σ2 为总体方差,记为 X~N( μ, σ2)
(-?>X< ?)
( 2-17)
2、正态分布曲线理论上的特征
? ( 1)以 X= μ为中心,μ左右 X值对称性减
少。
? ( 2)在 X= μ处曲线最高,f( X=μ)为最
大值。
? 3,μ, σ决定 正态分布曲线位置和形状
? 固定 σ,随 μ 不同,曲线位置不同,称 μ
为 位置参数,
? 固定 μ, σ越大,曲线形状不同,称 σ为
形状参数,正态分布是一个分布族。
图 2-5 正态分布参数位置变化示意图
图 2-6 正态分布变异度不同变化示意图
? 4.理论上,有中位数 =均数( μ)
? 5.任何正态分布的 X通过 u值 转换后,称为标
准化的正态分布,即 u ~N( μ=0, σ2=1)
2
2
2
1
)(
u
euf
?
?
?
?
??
?
X
u
标准正态分布方程 u为标准化变量值
三、正态曲线下面积(概率)的分
布及估计方法
? 1.曲线下 a?b区间面积的含义
? ( 1)表示 X值在 a?b区间占全部变量值的百
分比或表示 X值在 a?b区间出现的 概率 ( P)。
? ( 2) X在曲线下整个面积分布为 100%
? 或 X值在曲线范围内出现的概率为 1。
2.估计曲线下面积的方法
? 将变量值( X)转换为 u值后,查标准正
态分布表( P520),可估计曲线下 a?b区
间的面积。
dueu
u
u
2
2
2
1
)(
?
???
??
?
?
??
?
X
u
( 2-21)
()u? 表示从- ∞到 u值范
围内 X分布面积
标准正态分布曲线下面积
( ) 1 ( )uu? ? ? ? ?
6 8 2 6.01 5 8 7.0)8 4 1 3.0(
)1()1(
???
??????? uu
例:标准正态变量值 u=( -1,1)和 u=( -1.96
,1.96)区间的面积(概率)各为多少?
同理,u=( -2.58,2.58)区间的面积为 0.99
记为:
)(u?
有,
( 1, 9 6 ) ( 1, 9 6 )
0, 9 7 5 0, 0 2 5 0, 9 5
uu? ? ? ? ? ?
???
变量值分布
的范围表达
X占的百
分比 (%)
)1,1( ???? ??
)96.1,96.1( ???? ??
)58.2,58.2( ???? ??
68.27%
95.00%
99.00%
任意正态分布变量值 (X)理论上分布规律
3.医学常用的三个 X 分布范围及 u界值
( 1) X值分布范围
u0.05/2=1.96 (双侧) u0.01/2=2.58(双侧)
u0.05=1.64 (单侧) u0.01=2.33(单侧)
?
?u
( 2) 统计中常用尾部面积的 u值,记,称为 u
界值。
三、正态分布的应用
1.估计正态分布 X值在特定值范围内的
分布比例。例:
2.制定某临床指标的的参考值范围
3.利用 估计变量值的范围或
对极端值做取舍。
4.许多统计方法的统计推断建立在正
态分布基础上 。
SX 3?
例 2.14 101名正常成年女子的血清总胆
固醇, 。试估计
该总体正常女子血清总胆固醇在 4mmol/l以
下者的百分比。
? 解:假定该资料服从正态分布,将 X1=4
转换为 u值,查正态分布表
09.0
6 54.0
06.44
1 ??
????
?
?xu

??X
??S
0.654S ?lm m o lx /06.4?
查表
? 标准正态变量( u1) =- 0.09
?
4641.0)09.0( 1 ???? u
该地正常女子血清总胆固醇在
4mmol/l以下者的百分比为 46.41%。
145 例正常人体温实际分布和理论分布 (正态)比较
公式 体温值
分布范围
实际分布
频数 比例
( % )
理论分布
( % )
SX
SX
SX
58.2
96.1
1
?
?
? 36,23- 3 6.90
35,92- 3 7.22
35,71- 3 7.43
103
137
144
68.21
94.48
99.31
68.27
95.00
99.00
第五节 医学参考值范围的制定
? 一概念
? 医学参考值是指包括绝大多数, 正常
人, 的各种生理及生化指标常数, 也
称正常值 。
? 由于存在个体差异, 正常值并非为常
数, 而是在一定范围内波动, 医学上
常用 95%或 99%的分布范围作为判定
正常和异常的参考标准 。
? 二、医学参考值制定时注意问题:
? 1.确定诊断指标为“定性”或“定量”
? 2.有无“金标准方法”考核
? 3.计量资料考虑制定单侧诊断界值还
是双侧诊断界值
? 4.有足够的样本例数(一般不低于
100例)
?
三、计量资料参考值的制定
? 1.正态分布法(一般要对资料进
行正态性检验)
? 双侧 参考值范围公式:
? 单侧 参考值范围公式:
/2X u S??
SuX ??? SuX
???
下限值或 上限值
1 ??
1 ??
? 例 2-15 估计例 2-1某单位 101名正常成年
女子血清总胆固醇的参考值范围 。 假设
该资料服从正态分布 。
? 已知:
? 计算 95%的参考范围 ( 双侧 )
? 结论:正常成年女子血清总胆固醇 95%
的参考值范围为 2.78-5.34( mmol/l)
4,0 6 m m o l/LX ? 0,6 5 4 m m o l/ LS ?
)34.5,78.2(
654.096.106.42/05.0
?
???? suX
2.百分位数法
? 偏态分布资料医学参考值范围的制定通
常采用百分位数法,。
? 双侧 参考值范围:
? 单侧 参考值范围:
1 ??
1 ??
10 0 / 2 10 0 10 0 / 2PP?? ??
100P ?? 10 0 10 0P ???

例:讲义
常用 α=0.05
上限值下限值
表 例,102名 3岁以下儿童 LgA含量
? 组段( d) 频数 累计频数 位次范围
? 0- 29 29 1-29
? 15- 32 61 30-61
? 30- 18 79 62-79
? 45- 14 93 80-93
? 60- 4 97 94-97
? 75- 0 97 97
? 90- 0 97 97
? 105- 2 99 98-99
? 120- 1 100 100
? 135- 2 102 101-102
? 合计 102
例,102名 3岁以下儿童 LgA含量
47.8664.22
8369.2796.191176.3196.1
8369.27,91176.31
??
????
??
SX
SX
该地 3岁以下儿童 LgA含量的分布最小、最
大范围为 0-135(单位),由上式可见,该
资料不服从正态分布。
变量值 95%的分布范围
正态分布要求
? 本节要求:
? 1.正态分布理论上的 4点特征
? 2.能正确使用标准正态分布表(利用 u值)
? 3.掌握正态分布的三个常用的分布规律。
? 小结:
? 正态分布法和百分位数法可以对个体做
评价,可以了解一定范围 X值的比例。