第二章 统计描述
第四节 正态分布
(Normal distribution)
正态分布( Normal Distribution)
? 概述:
? 正态分布是描述连续型 变量值
分布的曲线,许多医学资料服
从正态分布。
?
? 直方图的频数分布与正态分布
? (见图 2-4)
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
12.00 14.50 17.00 19.50 22.00 24.50 27.00 29.50 32.00
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
12.0 14.5 17.0 19.5 22.0 24.5 27.0 29.5 32.0
图 2-4 频数分布与正态分布示意图
101 ?? ?y 3£ 3é ?ê ?? ×ó ?a ?? μ¨1ì ′? ·? 2?
0
5
10
15
20
25
2, 3 0 ?? 2, 9 0 ?? 3, 5 0 ?? 4, 1 0 ?? 4, 7 0 ?? 5, 3 0 ??

êy
£¨f£
?
f( X)
一、正态分布的概念和特征
? 1.正态分布曲线的数学函数表达式:
2)(
2
1
2
1
)( ?
?
??
?
?
?
X
eXf
X为连续随机变量,μ为 X值的总体均数,
σ2 为总体方差,记为 X~N( μ, σ2)
(-?>X< ?)
( 2-17)
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
12.00 14.50 17.00 19.50 22.00 24.50 27.00 29.50 32.00
f( X)
2、正态分布曲线理论上的特征
? ( 1)以 X= μ为中心,μ左右 X值对称性减
少,不与横轴相交。
? ( 2)在 X= μ处曲线最高,f( X=μ)为最
大值,x远离 μ,f( X)越小。
? 3,μ, σ决定 正态分布曲线位置和形状
? 随 μ 不同,曲线位置不同,称 μ为 位置参
数,
? σ越大,曲线形状不同,称 σ为 形状参数,
正态分布是一个分布族。
图 2-5 正态分布参数位置变化示意图
实例
? 例 1:中国成年人平均身高( μ)
? 男性 =1.7米,女性 =1.59米
? 例 2:正常人平均舒张压值 μ=80mmhg
? 高血压病平均舒张压值 μ=100mmhg
图 2-6 正态分布变异度不同变化示意图
? 4.曲线下 x值的分布有一定规律,面
积可对公式 2-18式积分实现:
dxeXF
X
X
? ??
?
?
?
2
2)(
2
1
2
1
)( ?
?
??
( 2-18)
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
12.00 14.50 17.00 19.50 22.00 24.50 27.00 29.50 32.00
F( X)
正态分布曲线下面积的含义
? 1.表示变量值( x)在 a-b区间所占全
部(总体)变量值的比例。
? 2.表示变量值( x)在 a-b区间出现的
概率。
? 变量值在整个曲线下的面积为 100%,
出现的概率为 1。
二、标准正态分布及分布估计方法
为应用的方便,任何正态分布的 X通过 u
值 转换后,称为标准化的正态分布,即 u
~N( μ=0, σ2=1),查标准正态分布表
( P520),可估计曲线下 a?b区间的面积

?
??? Xu
u值为标准
化变量 值
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
12.00 14.50 17.00 19.50 22.00 24.50 27.00 29.50 32.00
3,0.23 ?? ??
0
10 2 3-1-2-3
x
?
??? Xu
附表 1:标准正态分布表
? 根据 2-21公式制成附表 1
dueu
u
u
2
2
2
1
)(
?
???
??
? ??? ?? u
( 2-21)
dxeXF
X
x
? ??
?
?
?
2)(
2
1
2
1
)( ?
?
??
2.估计曲线下面积的方法
? 将变量值( X)转换为 u值后,查表
标准正态分布曲线下面积
表示从- ∞到 u值对应曲线范围
内 X值分布比例,记为 )(u?
( ) 1 ( )uu? ? ? ? ?
1587.0)1( ???? u
8 4 1 3.0)1(1)1( ???????? uu
时曲线下的比例查 1??u
6 8 2 6.01 5 8 7.0)8 4 1 3.0(
)1()1(
???
??????? uu
同理,u=( -2.58,2.58)区间的面积为 0.99
( 1, 9 6 ) ( 1, 9 6 )
0, 9 7 5 0, 0 2 5 0, 9 5
uu? ? ? ? ? ?
???
例:标准正态变量值 u=( -1,1)和 u=( -
1.96,1.96)区间内的面积(比例)各为多
少?
标准正态分布 u值有 95%分布在下述范围内
)96.1,96.1( ???????
?
?
?
? xuxu
95.0)96.1,96.1( ??? ????
)96.1,96.1( 21 ???? ???? xx
正态分布的 X值有 95%分布在下述
范围:

? 例:假设已知
? 95%的变量值分布的范围值为多少?
20,100 ?? ??
95.0)96.1,96.1( 21 ????? ???? xx
2.139,8.60
)2096.1100,2096.1100(
21
21
??
??????
xx
xx
95%的变量值分布在 60.8-139.2范围内
变量值分布
的范围表达
X占的百
分比 (%)
)1,1( ???? ??
)96.1,96.1( ???? ??
)58.2,58.2( ???? ??
68.27%
95.00%
99.00%
任意正态分布变量值 (X)理论上分布规律
3.医学常用的三个 X 分布范围及 u界值
( 1) X值分布范围
u0.05/2=1.96 (双侧) u0.01/2=2.58(双侧)
u0.05=1.64 (单侧) u0.01=2.33(单侧)
?
?u
( 2) 统计中常用尾部面积的 u值,记,称为 u
界值。
三、正态分布的应用
1.估计正态分布 X值在特定值范围内的
分布比例。例 2-14:
2.制定某临床指标的的参考值范围
3.利用 估计变量值的范围或
对极端值做取舍。
4.许多统计方法的统计推断建立在正
态分布基础上 。
SX 3?
)(C?
例 2.14 101名正常成年女子的血清总胆
固醇, 。试估计
该总体正常女子血清总胆固醇在 4mmol/l以
下者的百分比。
? 解:假定该资料服从正态分布,将 X1=4
转换为 u值,查正态分布表
09.0
6 54.0
06.44
1 ??
????
?
?xu

??X
??S
0.654S ?lm m o lx /06.4?
查表
? 标准正态变量( u1) =- 0.09
?
4641.0)09.0( 1 ???? u
该地正常女子血清总胆固醇在
4mmol/l以下者的百分比为 46.41%。
? 例:经调查 145例正常人体温,假设
体温分布为正态分布
? 估计总体中 95%和 99%的人体温值在什
么范围?
)(3 3 1 8.0),(57.36 CsCx ?? ??
145 例正常人体温实际分布和理论分布 (正态)比较
公式 体温值
分布范围
实际分布
频数 比例
( % )
理论分布
( % )
SX
SX
SX
58.2
96.1
1
?
?
? 36,23- 3 6.90
35,92- 3 7.22
35,71- 3 7.43
103
137
144
68.21
94.48
99.31
68.27
95.00
99.00
第五节 医学参考值范围的制定
? 一概念
? 医学参考值是指包括绝大多数, 正常
人, 的各种生理及生化指标常数, 也
称正常值 。
? 由于存在个体差异, 正常值并非为常
数, 而是在一定范围内波动的值, 医
学上常用 95%或 99%的分布范围作为
判定正常和异常的参考标准 。
? 二、医学参考值制定时注意问题:
? 1.确定诊断指标为“定性”或“定量”
? 2.计量资料考虑制定单侧诊断界值还
是双侧诊断界值
? 3.有足够的样本例数(一般不低于
100例)
?
三、计量资料参考值的制定
? 1.正态分布法(一般要对资料进行正
态性检验)
? 双侧 参考值范围公式:
? 单侧 参考值范围公式:
/2X u S??
SuX ??? SuX ???
下限值 上限值
1 ??
1 ??
? 例 2-15 估计例 2-1某单位 101名正常成年
女子血清总胆固醇的参考值范围 。 假设
该资料服从正态分布 。
? 已知:
? 计算 95%的参考范围 ( 双侧 )
? 结论:正常成年女子血清总胆固醇 95%
的参考值范围为 2.78-5.34( mmol/l)
4,0 6 m m o l/ LX ? 0,6 5 4 m m o l/ LS ?
)34.5,78.2(
654.096.106.42/05.0
?
???? suX
2.百分位数法
? 偏态分布资料医学参考值范围的制定通
常采用百分位数法,。
? 双侧 参考值范围:
? 单侧 参考值范围:
1 ??
1 ??
10 0 / 2 10 0 10 0 / 2PP?? ??
100P ?? 10 0 10 0P ???

例:讲义
常用 α=0.05
上限值下限值
表 例,102名 3岁以下儿童 LgA含量
? 组段( d) 频数 累计频数 位次范围
? 0- 29 29 1-29
? 15- 32 61 30-61
? 30- 18 79 62-79
? 45- 14 93 80-93
? 60- 4 97 94-97
? 75- 0 97 97
? 90- 0 97 97
? 105- 2 99 98-99
? 120- 1 100 100
? 135- 2 102 101-102
? 合计 102
例,102名 3岁以下儿童 LgA含量
47.8664.22
8369.2796.191176.3196.1
8369.27,91176.31
??
????
??
SX
SX
该地 3岁以下儿童 LgA含量的分布最小、最
大范围为 0-135(单位),由上式可见,该
资料不服从正态分布。
变量值 95%的分布范围
小结
? 1.标准差( S):
? 反映一组数据个体(研究对象)的变量
值之间的差异。
? 2.正态分布的变量值可用下列公式估计个
体的变量值波动(分布)的范围。
/2X u S??
?? ? ?? 2/u
第二章计量资料统计描述的作业
? 21页
? 一、最佳选择题
? 三、计算分析题
? 第 1题
? 第 3题