第三节、离散趋势的描述
?
? 描述计量资料数据间离散(变
异)程度的指标 —变异指标
? 例 2-10 三组同龄男孩的身高值( cm)
? R
? 甲组 90 95 100 105 110 100 20
? 乙组 96 98 100 102 104 100 8
? 丙组 96 99 100 101 104 100 8
x
555N =
组别
3, 0 02, 0 01, 0 0
120
110
100
90
80
三组同龄男孩的身高值( cm)分布
身
高
值
几个常用的变异指标
? 一,极差( Range):用( R)表示,
即一组数据的 R=最大值 –最小值
? 意义,R值越大,表示该组数据的变异
越大。
? 缺点:数据利用不全,部分信息损失,
在例数少时结果不稳定。
二、四分位数间距 (quartile range)
? 四分位数间距:常用 QR表示,
? 计算:用百分位数法计算数据第 75%与第
25%位数之差。 QR=P75%-P25%
? 作为变异指标比极差稳定。 常用于表示偏
态分布资料的变异。
? 例,QR= P75%-P25% =67.7- 39.2=28.5(天)
? 表示方法,Md( QR)
? M=51天,( QR=28.5天)
0
10
20
30
40
12 24 36 48 60 72 84 96 108
频
数
潜伏期
2.3925 ?p
7.6775 ?p
5150 ?p
表 2-5资料 118名链球菌咽喉炎患者潜伏期
三,标准差和方差
( Standard deviation and variance)
公式
2()X
N
?
?
?
? ?
2
2 ()X
N
?
?
?
? ?
总体标准差
2?
?
总体方差
( 2-11)
( 2-12)
为总体均数?
标准差计算公式
2()
1
XX
S
n
?
?
?
?
2()X
N
?
?
?
? ? 总体(理论)
样本标
准差
当用 n代替 N,σ估计偏小,因此用 n-1代替 N 。
标准差的简化计算公式:
1
/)( 22
?
???
?
n
nXX
S
1
/)(
22
??
????
?
f
ffXfX
S
( 2-14)
例数较少
( 2-15)
频数表
资料
例 2-10 甲组 5名同龄男孩的身高值( cm)
? X X2
? 90 8100
? 95 9025
? 100 10000
? 105 11025
? 110 12100
?
500?? X 5 0 2 5 02 ?? X
91.7
15
5/)500(50250 2 ?
?
??S
1
/)( 22
?
????
n
nXXS
表 2-1 101名正常女子血清胆固醇值
组段 ( X) 频数( f) fX fx 2
2.30~ 2.45 1 2.45 6.00
2.60~ 2.75 3 8.25 22.69
2.90~ 3.05 6 18.30 55.82
3.20~ 3.35 8
3.50~ 3.65 17
3.80~ 3.95 20
4.10~ 4.25 17
4.40~ 4.55 12
4.70~ 4.85 9
5.00~ 5.15 5
5.30~ 5.45 2
5.6-5.9 5.75 1
? 统计描述:某地 101名正常女子血清胆固醇值平
均为 4.06( mmol/L),标准差为 0.654 ( mmol/L)
21 0 1,4 0 9, 7 5,1 7 0 5, 0 9f f X f X? ? ? ? ? ?
2( 4 0 9, 7 5 )
1 7 0 5, 0 9
101 0, 6 5 4 ( m m o l /L)
1 0 1 1
S
?
??
?
1
/)(
22
??
????
?
f
ffXfX
S
? 例 2-10 三组同龄男孩的身高值( cm)
? R S
? 甲组 90 95 100 105 110 100 20 7.91
? 乙组 96 98 100 102 104 100 8 3.16
? 丙组 96 99 100 101 104 100 8 2.92
? 标准差的意义:
? 反映一组变量值平均相差的水平,单位相同时,
S越小,表示数据的变异程度越小,同时表示该
组均数的代表性越大。
x
四、变异系数 (CV)
%100??
X
S
CV
应用, 1.单位不同时组间变异程度的比较 。
2.比较组单位相同,但均数相差悬殊
的组 间变异程度,
意义,CV越大,表示数据变异越大。
常用于衡量方法、仪器的精密度 。
公式:
1.单位不同时组间变异程度的比较 。
? 某地 7岁年龄组男童身高与体重
? 指标 S CV(%)
? 身高 (cm)。 123.10 4.71 3.83
? 体重 (kg) 22.29 2.26 10.14
? 结论,7岁年龄组男童身高与体重值指
标比较,体重指标的变异大于身高指标。
x
? 某地不同年龄组男童身高( cm)
? 年龄组 S CV%
? 1-2月 56.3 2.1 3.73
? 5-6月 66.5 2.2 3.31
? 3-3.5岁 96.1 3.1 3.22
? 5-5.5岁 107.8 3.3 3.06
? 结论:随着年龄增加,身高的变异变小。
2.比较组单位相同,但均数相差悬殊的
组间变异程度比较,如表。
X
计量数据的统计描述小结
? 1,在医学杂志中,正态或近似正态资料,
常以 的形式表达,描述和比较 数据
的平均水平和离散程度。
? 例 两组患者年龄(岁)的比较
? 组别 n
? 试验组 12 45.9 ± 3.7
? 对照组 10 50.5 ± 13.0
? 两组患者随机化后基线情况的比较
SX ?
SX ?
? 注意:当计算的标准差接近均数,提示
数据为偏态分布,不适合用
表示。
?,
SX ?
例,102名 3岁以下儿童 LgA含量
)/(8.27),/(9.31 mlugSmlugX ??
中位数( M) =25.3
例,102名 3岁以下儿童 LgA含量
? 组段( d) 频数 累计频数 位次范围
? 0- 29 29 1-29
? 15- 32 61 30-61
? 30- 18 79 62-79
? 45- 14 93 80-93
? 60- 4 97 94-97
? 75- 0 97 97
? 90- 0 97 97
? 105- 2 99 98-99
? 120- 1 100 100
? 135- 2 102 101-102
? 合计 102
? 2.偏态分布或特定资料(生存时间、
病程、潜伏期时间等)用中位数和
四分位间距描述。
? 表达形式,M,( QR)
? 例 2-9, 118名链球菌咽喉炎患者的
中位潜伏期为 51天,QR为 28.5天。
? 3.等比数据和正偏态数据可用几何均
数和几何标准差描述
? 表达形式,G± SG
)
1
/)lg()( l g
(lg
22
1
?
???
? ?
n
nXX
S G
CASIO fx-3600计算器统计功能用法
? 步骤 键盘 说明
? 1,MOOD 3 进入 SD统计功能
? 2,SHIFT AC 清除数据
? 3,5 RUN 输入数据
? 8 RUN
? 10 RUN
? 4,SHIFT 1(数字键) 显示计算的
? 5,SHIFT 3 (数字键) 显示计算的 S
? 6,Kout 3 (数字键) 显示计算的 n
? 7,Kout 1 (数字键) 显示计算的
X
X?
2.频数表资料的输入(例表 2-3)
? 步骤 键盘 说明
? 1,MOOD 3 进入 SD统计功能
? 2,SHIFT AC 清除数据
? 3,3.35?2 RUN 输入数据
? 3.65 ?5 RUN
? 3.95 ?10 RUN
? ….
? 6.05 ?2 RUN
? 4,SHIFT 1(数字键) 显示计算的
? 5,SHIFT 3 (数字键) 显示计算的 S
X
?
? 描述计量资料数据间离散(变
异)程度的指标 —变异指标
? 例 2-10 三组同龄男孩的身高值( cm)
? R
? 甲组 90 95 100 105 110 100 20
? 乙组 96 98 100 102 104 100 8
? 丙组 96 99 100 101 104 100 8
x
555N =
组别
3, 0 02, 0 01, 0 0
120
110
100
90
80
三组同龄男孩的身高值( cm)分布
身
高
值
几个常用的变异指标
? 一,极差( Range):用( R)表示,
即一组数据的 R=最大值 –最小值
? 意义,R值越大,表示该组数据的变异
越大。
? 缺点:数据利用不全,部分信息损失,
在例数少时结果不稳定。
二、四分位数间距 (quartile range)
? 四分位数间距:常用 QR表示,
? 计算:用百分位数法计算数据第 75%与第
25%位数之差。 QR=P75%-P25%
? 作为变异指标比极差稳定。 常用于表示偏
态分布资料的变异。
? 例,QR= P75%-P25% =67.7- 39.2=28.5(天)
? 表示方法,Md( QR)
? M=51天,( QR=28.5天)
0
10
20
30
40
12 24 36 48 60 72 84 96 108
频
数
潜伏期
2.3925 ?p
7.6775 ?p
5150 ?p
表 2-5资料 118名链球菌咽喉炎患者潜伏期
三,标准差和方差
( Standard deviation and variance)
公式
2()X
N
?
?
?
? ?
2
2 ()X
N
?
?
?
? ?
总体标准差
2?
?
总体方差
( 2-11)
( 2-12)
为总体均数?
标准差计算公式
2()
1
XX
S
n
?
?
?
?
2()X
N
?
?
?
? ? 总体(理论)
样本标
准差
当用 n代替 N,σ估计偏小,因此用 n-1代替 N 。
标准差的简化计算公式:
1
/)( 22
?
???
?
n
nXX
S
1
/)(
22
??
????
?
f
ffXfX
S
( 2-14)
例数较少
( 2-15)
频数表
资料
例 2-10 甲组 5名同龄男孩的身高值( cm)
? X X2
? 90 8100
? 95 9025
? 100 10000
? 105 11025
? 110 12100
?
500?? X 5 0 2 5 02 ?? X
91.7
15
5/)500(50250 2 ?
?
??S
1
/)( 22
?
????
n
nXXS
表 2-1 101名正常女子血清胆固醇值
组段 ( X) 频数( f) fX fx 2
2.30~ 2.45 1 2.45 6.00
2.60~ 2.75 3 8.25 22.69
2.90~ 3.05 6 18.30 55.82
3.20~ 3.35 8
3.50~ 3.65 17
3.80~ 3.95 20
4.10~ 4.25 17
4.40~ 4.55 12
4.70~ 4.85 9
5.00~ 5.15 5
5.30~ 5.45 2
5.6-5.9 5.75 1
? 统计描述:某地 101名正常女子血清胆固醇值平
均为 4.06( mmol/L),标准差为 0.654 ( mmol/L)
21 0 1,4 0 9, 7 5,1 7 0 5, 0 9f f X f X? ? ? ? ? ?
2( 4 0 9, 7 5 )
1 7 0 5, 0 9
101 0, 6 5 4 ( m m o l /L)
1 0 1 1
S
?
??
?
1
/)(
22
??
????
?
f
ffXfX
S
? 例 2-10 三组同龄男孩的身高值( cm)
? R S
? 甲组 90 95 100 105 110 100 20 7.91
? 乙组 96 98 100 102 104 100 8 3.16
? 丙组 96 99 100 101 104 100 8 2.92
? 标准差的意义:
? 反映一组变量值平均相差的水平,单位相同时,
S越小,表示数据的变异程度越小,同时表示该
组均数的代表性越大。
x
四、变异系数 (CV)
%100??
X
S
CV
应用, 1.单位不同时组间变异程度的比较 。
2.比较组单位相同,但均数相差悬殊
的组 间变异程度,
意义,CV越大,表示数据变异越大。
常用于衡量方法、仪器的精密度 。
公式:
1.单位不同时组间变异程度的比较 。
? 某地 7岁年龄组男童身高与体重
? 指标 S CV(%)
? 身高 (cm)。 123.10 4.71 3.83
? 体重 (kg) 22.29 2.26 10.14
? 结论,7岁年龄组男童身高与体重值指
标比较,体重指标的变异大于身高指标。
x
? 某地不同年龄组男童身高( cm)
? 年龄组 S CV%
? 1-2月 56.3 2.1 3.73
? 5-6月 66.5 2.2 3.31
? 3-3.5岁 96.1 3.1 3.22
? 5-5.5岁 107.8 3.3 3.06
? 结论:随着年龄增加,身高的变异变小。
2.比较组单位相同,但均数相差悬殊的
组间变异程度比较,如表。
X
计量数据的统计描述小结
? 1,在医学杂志中,正态或近似正态资料,
常以 的形式表达,描述和比较 数据
的平均水平和离散程度。
? 例 两组患者年龄(岁)的比较
? 组别 n
? 试验组 12 45.9 ± 3.7
? 对照组 10 50.5 ± 13.0
? 两组患者随机化后基线情况的比较
SX ?
SX ?
? 注意:当计算的标准差接近均数,提示
数据为偏态分布,不适合用
表示。
?,
SX ?
例,102名 3岁以下儿童 LgA含量
)/(8.27),/(9.31 mlugSmlugX ??
中位数( M) =25.3
例,102名 3岁以下儿童 LgA含量
? 组段( d) 频数 累计频数 位次范围
? 0- 29 29 1-29
? 15- 32 61 30-61
? 30- 18 79 62-79
? 45- 14 93 80-93
? 60- 4 97 94-97
? 75- 0 97 97
? 90- 0 97 97
? 105- 2 99 98-99
? 120- 1 100 100
? 135- 2 102 101-102
? 合计 102
? 2.偏态分布或特定资料(生存时间、
病程、潜伏期时间等)用中位数和
四分位间距描述。
? 表达形式,M,( QR)
? 例 2-9, 118名链球菌咽喉炎患者的
中位潜伏期为 51天,QR为 28.5天。
? 3.等比数据和正偏态数据可用几何均
数和几何标准差描述
? 表达形式,G± SG
)
1
/)lg()( l g
(lg
22
1
?
???
? ?
n
nXX
S G
CASIO fx-3600计算器统计功能用法
? 步骤 键盘 说明
? 1,MOOD 3 进入 SD统计功能
? 2,SHIFT AC 清除数据
? 3,5 RUN 输入数据
? 8 RUN
? 10 RUN
? 4,SHIFT 1(数字键) 显示计算的
? 5,SHIFT 3 (数字键) 显示计算的 S
? 6,Kout 3 (数字键) 显示计算的 n
? 7,Kout 1 (数字键) 显示计算的
X
X?
2.频数表资料的输入(例表 2-3)
? 步骤 键盘 说明
? 1,MOOD 3 进入 SD统计功能
? 2,SHIFT AC 清除数据
? 3,3.35?2 RUN 输入数据
? 3.65 ?5 RUN
? 3.95 ?10 RUN
? ….
? 6.05 ?2 RUN
? 4,SHIFT 1(数字键) 显示计算的
? 5,SHIFT 3 (数字键) 显示计算的 S
X