第十章 统计表与统计图
第一节,统计表
一、统计表的意义与制作原则
? 1,统计表及意义:
? 将资料整理的 数字 或计算的 统计
指标,用表格形式有逻辑性的排列、表
达出来,称为统计表。
? 统计表的意义,
? 数据的表达简明扼要,避免文字
重复陈述,便于阅读和比较。
例,某作者在表达“肝癌手术病人不同
年龄与住院时间、费用的关系”一文
? 作者描述:
?,肝癌手术病人年龄 <30岁 13例,30-40岁的
62例,41-50岁的 104例,51-60岁的 103例,61-
70岁的 47例,>70岁的 5例,
? 平均住院天数为 28,35,32,34,35,33
天
? 平均住院费用为,14169.89,16997.16、
18713.41,29733.98元等”。
肝癌手术病人不同年龄与住院时间、
费用的关系
? 年龄组 例数 平 均 平均住院
? (岁) 住院日 费 (元 )
? <30 13 28 14169.89
? 30- 62 35 16997.16
? 40- 104 32 18713.14
? 50- 103 34 29733.98
? 60- 47 35 21137.59
? 70及以上 5 33 25163.40
用统计表表示
统计表的分类
? 广义统计表,
? 数据收集时用的调查表
? 数据资料计算的统计计算表
? 数据在报告和杂志中陈述的统计结果表
? 狭义统计表,
? 数据在报告和杂志中陈述的统计结果表
2,统计表的制表原则
? 制表原则:
? 一个表最好表达一个中心内容。简
单明了,重点突出。
统计表的基本表式
? 表号 标题 ????
? 横标目 纵标目名称
? 名称 ??? ??? 合计
? ??? 数字 数字 数字
? ??? 数字 数字 数字
? 合计 数字 数字 数字
? 备注,???
主
语
谓语
3.统计表的内容
? ( 1) 标题:简明阐述表中内容
? ( 2) 标目:根据在表中的位置有
? 横标目 (主语),安排比较组的分组标志
? 纵标目(谓语),安排比较的统计指标,
见下,例:
? 计数资料列出:例数、阳性数、阳性率 %
计量资料列出:例数、均数、标准差,p值
? 3.数字:一律用阿拉伯数字表示,小
数位数应一致。无数字用,—,占据。
? 4.线条:一般为 3或 4条横线(有合计
数字为 4线)。
? 5.备注:可有或无,一般放在表下方。
用,*,表示,加以文字说明。
表 1 两种方法对近视眼近期有效率比较
? 矫治 观察 近期有效 近期有效
? 方法 人数 人数 率( %)
? 新医疗法 32 16 50.0*
? 眼保健操 32 9 28.1
? * 与对照组比较,P< 0.05
横标目 纵标目
例;计数资料的表达:
计量资料的表达
? 两组患者 Pco2值的比较
? 组别 n P 值
? 肺心病组 12 65.97 a 20.28
? 慢支肺气肿 10 43.90 a 8.24
SX ?
< 0.05
二、统计表的种类
? 1.简单表,
? 主语为一个分组因素与一组纵标目组成。
? 说明比较组在纵标目指标上的差别。
? 2.组合表,
? 二个分组因素(例如年龄分组和性别分组)
与一组纵标目组成。
? 说明事物在不同因素组合下纵标目指标上的差别 。
? 3.按两个因素分类的列联表;
? 反映两个分类的关联关系。
例,简单表格式
某地 1980年男女 HBsAg阳性率的比较
? 性别 调查例数 阳性数 阳性率 %
? 男 4234 303 7.16
? 女 4530 181 4.00
? 合计 8764 484 5.52
例 组合表的格式
某地不同年龄、性别 HBsAg阳性率( %)的比较
? 年龄 男性 女性
? (岁 ) 调查数 阳性数 阳性率 调查数 阳性数 阳性率
? 0- 2118 146 6.89 2719 74 2.72
? 20- 1287 116 9.01 1168 82 7.02
? 40- 695 37 5.32 571 23 4.03
? ?60 112 4 3.57 72 2 2.78
合计 4234 303 7.16 4530 181 4.00
例:两个指标关系的列联表
? 眼底动脉 冠心病诊断
? 硬化级别 正常 可疑 冠心病 合计
? 0 340 (95.0) 11(3.1) 6(1.7) 357
? Ⅰ 73 (79.3) 13(14.1) 6 (6.5) 92
? Ⅱ -Ⅲ 100(71.9) 17(12.2) 22(15.8) 139
? 合计 513 41 34 588
? 备注,( )括号的数为行的构成比,
3.事物按两个指标分类列联表
三、编制统计表的注意事项
(统计表的审查)
? 审查内容,
? 标题是否简明、清楚
? 纵横标目位置是否颠倒。
? 线条是否不规范、有竖线、斜线。
? 标目缺少单位或含义是否清楚。
? 标目的层次是否太多、排列是否有条理。
? 例:讲义 178页第 2题
讲义表 10-3 不同心理分值的冠心
病危险因素比较
? 慢性 疾病 心理分值
患数构成 % 1 2 3 4 P值
0 81.6 79.3 77.5 73.9 < 0.18
1 15.1 16.2 16.5 15.0 < 0.43
≥ 2 3.3 4.5 6.0 11.1 < 0.05
问题:
横标目含义不清楚;统计方法和 P值的表达
不清楚,
例 1:两法测定健康成人血清补
体含量的比较
? 统计指标 常规法 简易法 t值 P值
? 例数 100 150
? 范围 50-105 46-163 4.2 <0.01
? 72.3 87.4
? S 1.31 2.24
X
例,修改表
两法测定健康成人血清补体含量(单位)
的比较
? 测定方法 例数 范围 CV
? 常规法 100 72.3?1.31 50-105 1.81
? 简易法 150 87.4 ?2.24 46-163 2.56
? * 两组比较 P<0.01
SX ?
例 2:某妇产科比较有蓖麻油加静滴催产
素 (观察组 48例 )与只用静滴催产素 (对照
组 62例 ),对过期孕妊的流产效果比较
? 表 1 引产失败次数与百分率
? 组别 引产失败次数 百分数
? 观察组 7 14.8%
? 对照组 20 32.26%
? P<0.01
? 结论,观察组效果好,
修改表
? 表 2 两种方法对过期引产效果的比较
? 组别 观察例数 引产失败数 失败率 %
? 观察组 48 7 14.58
? 对照组 62 20 32.26
? 合计 110 27 24.54
? 观察组与对照组比较 P<0.01
例, 两组静脉使用次数与静脉损伤的关系研究
? 组别 例数 V使用次数 刺激症次数 静脉炎例数
? 试验 40 -2 0 0
? 组 -4 2 0
? -6 5 1
? -8 10 5
? 对照 40 -2 5 6
? 组 -4 10 7
? -6 26 23
? -8 37 35
作者原表
例,两组静脉使用次数与静脉损伤的关系研究
? V使用 试验组 对照组
? 次数 观察 刺激症 发生 观察 刺激症 发生
? 分组 次数 次数 率 % 次数 次数 率 %
? 2- 50 0 56 5
? 4- 58 2 50 10
? 6- 32 5 40 26
? ≥8次 23 10 45 37
? 合计
前表修改为
第二节、统计图
一、统计图的意义与制作原则
? 1.统计图意义,
? 用图形(如面积大小、线条高低等)的变
化表示比较组指标在 数量的大小 和 相互的
关系
? 作用,
? 图形表达比较直观、能快速获得信息,
是表达数据的重要工具。
? 何时采用
? 在统计表的数字较多,用图表示更直观
2.统计图的种类
? 根据统计分析目的不同,统计图有:
? 1)比较统计结果指标(率、构成比、
平均数)的图形。常用的有:
? 直条图、百分构成图、线图、箱式图 等
? 2)表达一组数据(变量值)特征和分
布的图形:
? 直方图、散点图,残差图、茎叶图等
? (黄色为常用图形)
3、统计图的一般图式和构造
单
位
单位
标题 ????
图 形
图 例 1
图 例 2
纵轴:横轴比
例 5, 7横轴:安排比较的事物(组别)
纵轴:安排比较的统计指标
二、常用统计图的 选择 及绘制,
? (一)直条图( bar chart)
? 作用:
? 用相等宽度的直条高度,表达比较
组某统计指标(率、平均数)的差别。
? 图形选择:
? 比较组( X轴)为相互独立的分类
指标。
直条图分:
? 1.单式直条图:图 10-1,一个分组因素,
一个统计指标(率、或均数),
? 2.复式直条图:二个分组因素,一个统
计指标(率、或均数)。
? 3.误差直条图( error bar):比较几
个组均数 与标准差(或 95%CI)的差
别。例:讲义图 10-2
表 1 1998年不同地区艾滋病流行
情况
? 地区 成人感染率( %)
? 北非及中东 0.13
? 西欧 0.25
? 北美洲 0.56
? 拉丁美洲 0.57
? 南亚及东南亚 0.69
1 9 9 8 áê ?? o? °? ê? 3× ?÷ ?? ?é °? ?÷ í ?é ??
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
aa?? 1??í ′? ?÷? ? aaà? ?T ?- ′? à? ?T áì ??
±?
?è
μí
??
??
£¨%
£?
单式直条图
表 2 某工厂 1994,1998年四项指
标异常检出率情况
? 1994年 1998年
? 指标 受检 异常 检出 受检 异常 检出
? 人数 人数 率 % 人数 人数 率 %
? 血压 519 45 8.89 582 38 6.52
? 心率 519 44 8.48 582 39 6.70
? TTT 519 36 6.94 582 23 3.95
? GPT 519 20 3.85 582 16 2.75
ê1 2-9 á ± ±§???¤199 4á ê ?¢ 199 8á ê èá ì? ?ú ?ì ?μ aê ??
±£ ?? 1? ±? ??
0
2
4
6
8
10
?a ?? íá ?? TTT GPT
1?
±?
??
%
1 9 9 4 áê
1 9 9 8 áê
复式直条图
例 3:两组战士腿部肌力( kg)
? 组别 左腿 肌力 右腿 肌力
? n n
? 科学训练组 172 23.6a 3.73 172 23.87a 3.6
? 常规训练组 83 15.9a 4.0 83 18.6a 4.1
xs? xs?
0
5
10
15
20
25
30
×ó íí íííí
ííí§ííí·×é ííííííí·×é
íí
íí
íK
íí3 - 1 0 íí×é íííííííííííííí
)( sx ?
误差条图( error bar)
ê1 2-10 ? aé? ê1 ?Y ?á ±? ′? ?e 3? a× í? ?a 0
0
2
4
6
8
1? ??
直条图绘制应注意
(二)百分构成比图
? 作用:用面积大小对比和表达某事物各构成比
( %)的大小。
? 图形选择:分组标志为相互独立的分类指标。
? 百分构成图:
? 1.圆图( pie chart),说明一个事物内部百分构成
的对比情况。 图 10-3
? 2.百分条图( percent bar chart)比较两个事物
各部分构成的对比情况。图 10-4
例 4,251例胃癌患者病理组织学类型分布
情况
? 病理 男性 女性
? 类型 例数 构成比 % 例数 构成比 %
? 分化型 101 50.0 16 32.7
? 低分化 54 26.7 9 18.4
? 未分化 47 23.3 24 49.0
? 合计 202 100.0 49 100.0
图 胃癌男性患者病理组织类型构成分布
百分构成圆图
分化型
51%
低分化
26%
未分化
23%
0% 20% 40% 60% 80% 100%
áí
??
?? ?ˉ íê ?? 3ê ?? ?ˉ ì? ?? ?2 ?? ?ˉ ??
50.0%
49.0%32.7% 18.4%
26.7% 23.3%
图 251例男女胃癌患者病理组织类型构成分布比较
百分构成条图
(三)线图( line chart)
? 作用,用线条的升降表达和比较统计指标
(率或平均数)随分组标志(时间) 变化
的趋势和速度 。
? 图形选择,分组标志( X轴)为连续性(如
年代、或不同剂量等)的分类指标。
? 线图种类和表达的作用:
? 1)普通线图:即纵、横坐标为等差距
离的算术尺度单位。 反映事物随时间
变化的趋势,如图 10-5。
? 2)半对数线图:纵坐标为对数尺度单
位,横坐标为等差算术尺度单位。 反
映比较的事物随时间变化的速度,如图
10-6( b)
? 线图:多为比较两个组某指标随时间变
化的情况。
家兔服药前后血清胆固醇变化(均数)
? 例:上表资料为讲义 197页习题 5数据
药前 2周
服
4周
药
6周
后
8周 10周 12周
实验组 53.6 815.8 898.7 1298.9 1232.5 1179.4 1096.8
对照组 50.8 818.1 1081.1 1464.5 1645.5 1620.1 1411
家兔服药前后血清胆固醇变化结果(均数)
0
250
500
750
1000
1250
1500
1750
服药前 2周 4周 6周 8周 10周 12周
时间
胆固醇(单位)
实验组
对照组
普通线图,用折线将各点连接。
表 某市 1949-1957年 15岁以下儿童结
核病与白喉病死亡率( 1/10万)
? 年份 结核病 白喉病
? 死亡率 死亡率
? 1949 150.2 20.1
? 1950 148.0 16.6
? 1951 141.0 14.0
? 1952 130.0 11.8
? 1953 110.4 10.7
? 1954 98.2 6.5
? 1955 72.6 3.9
? 1956 68.0 2.4
? 1957 54.8 1.3
1949-1957á ê ′ù êˉ oá ·è D? ??·ì è? ê? ??
0
20
40
60
80
100
120
140
160
1949 1951 1953 1955 1957
è?
ê?
??
£¨1/1
0ê
í
£?
oá ·è
??·ì
普通线图普通线图
某市 1949-1957年 15岁以下儿童结核
病与白喉病死亡率( 1/10万)
? 年份 结核病 白喉病
? 死亡率 下降 % 死亡率 下降 %
? 1949 150.2 — 20.1 —
? 1950 148.0 1.46 16.6 17.41
? 1951 141.0 4.72 14.0 15.66
? 1952 130.0 7.80 11.8 15.71
? 1953 110.4 15.07 10.7 9.32
? 1954 98.2 11.23 6.5 39.25
? 1955 72.6 26.06 3.9 40.00
? 1956 68.0 6.33 2.4 38.46
? 1957 54.8 19.41 1.3 45.83
0
0.5
1
1.5
2
2.5
1949 1950 1951 1952 1953 1954 1955 1956 1957
年代
死亡率对数值
结核病
白喉病
某市 1949-1957年 15岁以下儿童结核病与
白喉病死亡率( 1/10万)
半对数图
? 比较组 A点 下降 B点 差值 下降比值
? 甲组 1000 100 900 1000/100
? 乙组 100 10 90 100/10
? 丙组 10 1 9 10/1
? Lg A Lg B 差值
? 甲 3 2 1
? 乙 2 1 1
? 丙 1 0 1
0
200
400
600
800
1000
A B
100
纵坐标为等差单位
A B
1
10
100
1000
A B
对
数
单
位
0
2
4
6
8
10
12
0 1 2 3 4 5 6 7 8 9 10 11 12
íí
íí
íK
íê ííí¨íííí
íí 3-12 íííííííííííííí
)( sx ?
误差线图
(四)直方图
? 作用:反映 某计量变量值 数据在取值范
围内的分布和形态(正态或偏态)。
? 图形选择:分组标志为连续性的计量资
料。
? 注意:绘制时应组距相等。
? 例表 10-6资料组距不等,
? 换算每岁例数(每组例数 /该组组距)为
频数,再做图。
101 à? ?ù ±£ ±? áê ?? ?D ?a ?? 3¨?é 21 ?? °1
0
5
10
15
20
25
2, 3 0 ?? 2, 9 0 ?? 3, 5 0 ?? 4, 1 0 ?? 4, 7 0 ?? 5, 3 0 ??
?3
?ù
£¨f£
?
直方图:描述计量数据频数分布
0
2
4
6
8
10
12
14
16
0 1 2 3 4 5 6 7 8 9 10 15 20 25 30 35
表 10-6资料 各组组距不等的直方图
0
2
4
6
8
10
12
14
16
0 2 4 6 8
10 12 14 16 18 20 22 24 26 28 30 32 34 36 38
表 10-6资料 各组组距相等的直方图
(六),箱式图
( 反映 计量数据 的变异和集中趋势 ) )
? 箱式图( box-plot),通过数据的全
距、四分位间距、中位数反映数据
的分布、变异大小、偏度和集中趋
势几个特征。例讲义 图 10-9
? 应用,箱线图常描述几组计量数据
分布特征。
0 10 20 30 40 50 60
元月份
二月份
图 3-9 某年某院某科出院患者住院天数的分布
住 院天数
箱式图
图8.9 某病不同时期血清水平变化情况
晚期中期某病早期正常组
血
清
(u/ml
)
120
100
80
60
40
20*
本节重点
? 1.能正确安排简单表和组合的统计表
? 2.要求掌握统计表的基本表式和内容
? 3.几种统计图形的选择
? 作业,177页
? 一、选择题
? 三、计算分析题的第 1和 2题
?
?
第一节,统计表
一、统计表的意义与制作原则
? 1,统计表及意义:
? 将资料整理的 数字 或计算的 统计
指标,用表格形式有逻辑性的排列、表
达出来,称为统计表。
? 统计表的意义,
? 数据的表达简明扼要,避免文字
重复陈述,便于阅读和比较。
例,某作者在表达“肝癌手术病人不同
年龄与住院时间、费用的关系”一文
? 作者描述:
?,肝癌手术病人年龄 <30岁 13例,30-40岁的
62例,41-50岁的 104例,51-60岁的 103例,61-
70岁的 47例,>70岁的 5例,
? 平均住院天数为 28,35,32,34,35,33
天
? 平均住院费用为,14169.89,16997.16、
18713.41,29733.98元等”。
肝癌手术病人不同年龄与住院时间、
费用的关系
? 年龄组 例数 平 均 平均住院
? (岁) 住院日 费 (元 )
? <30 13 28 14169.89
? 30- 62 35 16997.16
? 40- 104 32 18713.14
? 50- 103 34 29733.98
? 60- 47 35 21137.59
? 70及以上 5 33 25163.40
用统计表表示
统计表的分类
? 广义统计表,
? 数据收集时用的调查表
? 数据资料计算的统计计算表
? 数据在报告和杂志中陈述的统计结果表
? 狭义统计表,
? 数据在报告和杂志中陈述的统计结果表
2,统计表的制表原则
? 制表原则:
? 一个表最好表达一个中心内容。简
单明了,重点突出。
统计表的基本表式
? 表号 标题 ????
? 横标目 纵标目名称
? 名称 ??? ??? 合计
? ??? 数字 数字 数字
? ??? 数字 数字 数字
? 合计 数字 数字 数字
? 备注,???
主
语
谓语
3.统计表的内容
? ( 1) 标题:简明阐述表中内容
? ( 2) 标目:根据在表中的位置有
? 横标目 (主语),安排比较组的分组标志
? 纵标目(谓语),安排比较的统计指标,
见下,例:
? 计数资料列出:例数、阳性数、阳性率 %
计量资料列出:例数、均数、标准差,p值
? 3.数字:一律用阿拉伯数字表示,小
数位数应一致。无数字用,—,占据。
? 4.线条:一般为 3或 4条横线(有合计
数字为 4线)。
? 5.备注:可有或无,一般放在表下方。
用,*,表示,加以文字说明。
表 1 两种方法对近视眼近期有效率比较
? 矫治 观察 近期有效 近期有效
? 方法 人数 人数 率( %)
? 新医疗法 32 16 50.0*
? 眼保健操 32 9 28.1
? * 与对照组比较,P< 0.05
横标目 纵标目
例;计数资料的表达:
计量资料的表达
? 两组患者 Pco2值的比较
? 组别 n P 值
? 肺心病组 12 65.97 a 20.28
? 慢支肺气肿 10 43.90 a 8.24
SX ?
< 0.05
二、统计表的种类
? 1.简单表,
? 主语为一个分组因素与一组纵标目组成。
? 说明比较组在纵标目指标上的差别。
? 2.组合表,
? 二个分组因素(例如年龄分组和性别分组)
与一组纵标目组成。
? 说明事物在不同因素组合下纵标目指标上的差别 。
? 3.按两个因素分类的列联表;
? 反映两个分类的关联关系。
例,简单表格式
某地 1980年男女 HBsAg阳性率的比较
? 性别 调查例数 阳性数 阳性率 %
? 男 4234 303 7.16
? 女 4530 181 4.00
? 合计 8764 484 5.52
例 组合表的格式
某地不同年龄、性别 HBsAg阳性率( %)的比较
? 年龄 男性 女性
? (岁 ) 调查数 阳性数 阳性率 调查数 阳性数 阳性率
? 0- 2118 146 6.89 2719 74 2.72
? 20- 1287 116 9.01 1168 82 7.02
? 40- 695 37 5.32 571 23 4.03
? ?60 112 4 3.57 72 2 2.78
合计 4234 303 7.16 4530 181 4.00
例:两个指标关系的列联表
? 眼底动脉 冠心病诊断
? 硬化级别 正常 可疑 冠心病 合计
? 0 340 (95.0) 11(3.1) 6(1.7) 357
? Ⅰ 73 (79.3) 13(14.1) 6 (6.5) 92
? Ⅱ -Ⅲ 100(71.9) 17(12.2) 22(15.8) 139
? 合计 513 41 34 588
? 备注,( )括号的数为行的构成比,
3.事物按两个指标分类列联表
三、编制统计表的注意事项
(统计表的审查)
? 审查内容,
? 标题是否简明、清楚
? 纵横标目位置是否颠倒。
? 线条是否不规范、有竖线、斜线。
? 标目缺少单位或含义是否清楚。
? 标目的层次是否太多、排列是否有条理。
? 例:讲义 178页第 2题
讲义表 10-3 不同心理分值的冠心
病危险因素比较
? 慢性 疾病 心理分值
患数构成 % 1 2 3 4 P值
0 81.6 79.3 77.5 73.9 < 0.18
1 15.1 16.2 16.5 15.0 < 0.43
≥ 2 3.3 4.5 6.0 11.1 < 0.05
问题:
横标目含义不清楚;统计方法和 P值的表达
不清楚,
例 1:两法测定健康成人血清补
体含量的比较
? 统计指标 常规法 简易法 t值 P值
? 例数 100 150
? 范围 50-105 46-163 4.2 <0.01
? 72.3 87.4
? S 1.31 2.24
X
例,修改表
两法测定健康成人血清补体含量(单位)
的比较
? 测定方法 例数 范围 CV
? 常规法 100 72.3?1.31 50-105 1.81
? 简易法 150 87.4 ?2.24 46-163 2.56
? * 两组比较 P<0.01
SX ?
例 2:某妇产科比较有蓖麻油加静滴催产
素 (观察组 48例 )与只用静滴催产素 (对照
组 62例 ),对过期孕妊的流产效果比较
? 表 1 引产失败次数与百分率
? 组别 引产失败次数 百分数
? 观察组 7 14.8%
? 对照组 20 32.26%
? P<0.01
? 结论,观察组效果好,
修改表
? 表 2 两种方法对过期引产效果的比较
? 组别 观察例数 引产失败数 失败率 %
? 观察组 48 7 14.58
? 对照组 62 20 32.26
? 合计 110 27 24.54
? 观察组与对照组比较 P<0.01
例, 两组静脉使用次数与静脉损伤的关系研究
? 组别 例数 V使用次数 刺激症次数 静脉炎例数
? 试验 40 -2 0 0
? 组 -4 2 0
? -6 5 1
? -8 10 5
? 对照 40 -2 5 6
? 组 -4 10 7
? -6 26 23
? -8 37 35
作者原表
例,两组静脉使用次数与静脉损伤的关系研究
? V使用 试验组 对照组
? 次数 观察 刺激症 发生 观察 刺激症 发生
? 分组 次数 次数 率 % 次数 次数 率 %
? 2- 50 0 56 5
? 4- 58 2 50 10
? 6- 32 5 40 26
? ≥8次 23 10 45 37
? 合计
前表修改为
第二节、统计图
一、统计图的意义与制作原则
? 1.统计图意义,
? 用图形(如面积大小、线条高低等)的变
化表示比较组指标在 数量的大小 和 相互的
关系
? 作用,
? 图形表达比较直观、能快速获得信息,
是表达数据的重要工具。
? 何时采用
? 在统计表的数字较多,用图表示更直观
2.统计图的种类
? 根据统计分析目的不同,统计图有:
? 1)比较统计结果指标(率、构成比、
平均数)的图形。常用的有:
? 直条图、百分构成图、线图、箱式图 等
? 2)表达一组数据(变量值)特征和分
布的图形:
? 直方图、散点图,残差图、茎叶图等
? (黄色为常用图形)
3、统计图的一般图式和构造
单
位
单位
标题 ????
图 形
图 例 1
图 例 2
纵轴:横轴比
例 5, 7横轴:安排比较的事物(组别)
纵轴:安排比较的统计指标
二、常用统计图的 选择 及绘制,
? (一)直条图( bar chart)
? 作用:
? 用相等宽度的直条高度,表达比较
组某统计指标(率、平均数)的差别。
? 图形选择:
? 比较组( X轴)为相互独立的分类
指标。
直条图分:
? 1.单式直条图:图 10-1,一个分组因素,
一个统计指标(率、或均数),
? 2.复式直条图:二个分组因素,一个统
计指标(率、或均数)。
? 3.误差直条图( error bar):比较几
个组均数 与标准差(或 95%CI)的差
别。例:讲义图 10-2
表 1 1998年不同地区艾滋病流行
情况
? 地区 成人感染率( %)
? 北非及中东 0.13
? 西欧 0.25
? 北美洲 0.56
? 拉丁美洲 0.57
? 南亚及东南亚 0.69
1 9 9 8 áê ?? o? °? ê? 3× ?÷ ?? ?é °? ?÷ í ?é ??
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
aa?? 1??í ′? ?÷? ? aaà? ?T ?- ′? à? ?T áì ??
±?
?è
μí
??
??
£¨%
£?
单式直条图
表 2 某工厂 1994,1998年四项指
标异常检出率情况
? 1994年 1998年
? 指标 受检 异常 检出 受检 异常 检出
? 人数 人数 率 % 人数 人数 率 %
? 血压 519 45 8.89 582 38 6.52
? 心率 519 44 8.48 582 39 6.70
? TTT 519 36 6.94 582 23 3.95
? GPT 519 20 3.85 582 16 2.75
ê1 2-9 á ± ±§???¤199 4á ê ?¢ 199 8á ê èá ì? ?ú ?ì ?μ aê ??
±£ ?? 1? ±? ??
0
2
4
6
8
10
?a ?? íá ?? TTT GPT
1?
±?
??
%
1 9 9 4 áê
1 9 9 8 áê
复式直条图
例 3:两组战士腿部肌力( kg)
? 组别 左腿 肌力 右腿 肌力
? n n
? 科学训练组 172 23.6a 3.73 172 23.87a 3.6
? 常规训练组 83 15.9a 4.0 83 18.6a 4.1
xs? xs?
0
5
10
15
20
25
30
×ó íí íííí
ííí§ííí·×é ííííííí·×é
íí
íí
íK
íí3 - 1 0 íí×é íííííííííííííí
)( sx ?
误差条图( error bar)
ê1 2-10 ? aé? ê1 ?Y ?á ±? ′? ?e 3? a× í? ?a 0
0
2
4
6
8
1? ??
直条图绘制应注意
(二)百分构成比图
? 作用:用面积大小对比和表达某事物各构成比
( %)的大小。
? 图形选择:分组标志为相互独立的分类指标。
? 百分构成图:
? 1.圆图( pie chart),说明一个事物内部百分构成
的对比情况。 图 10-3
? 2.百分条图( percent bar chart)比较两个事物
各部分构成的对比情况。图 10-4
例 4,251例胃癌患者病理组织学类型分布
情况
? 病理 男性 女性
? 类型 例数 构成比 % 例数 构成比 %
? 分化型 101 50.0 16 32.7
? 低分化 54 26.7 9 18.4
? 未分化 47 23.3 24 49.0
? 合计 202 100.0 49 100.0
图 胃癌男性患者病理组织类型构成分布
百分构成圆图
分化型
51%
低分化
26%
未分化
23%
0% 20% 40% 60% 80% 100%
áí
??
?? ?ˉ íê ?? 3ê ?? ?ˉ ì? ?? ?2 ?? ?ˉ ??
50.0%
49.0%32.7% 18.4%
26.7% 23.3%
图 251例男女胃癌患者病理组织类型构成分布比较
百分构成条图
(三)线图( line chart)
? 作用,用线条的升降表达和比较统计指标
(率或平均数)随分组标志(时间) 变化
的趋势和速度 。
? 图形选择,分组标志( X轴)为连续性(如
年代、或不同剂量等)的分类指标。
? 线图种类和表达的作用:
? 1)普通线图:即纵、横坐标为等差距
离的算术尺度单位。 反映事物随时间
变化的趋势,如图 10-5。
? 2)半对数线图:纵坐标为对数尺度单
位,横坐标为等差算术尺度单位。 反
映比较的事物随时间变化的速度,如图
10-6( b)
? 线图:多为比较两个组某指标随时间变
化的情况。
家兔服药前后血清胆固醇变化(均数)
? 例:上表资料为讲义 197页习题 5数据
药前 2周
服
4周
药
6周
后
8周 10周 12周
实验组 53.6 815.8 898.7 1298.9 1232.5 1179.4 1096.8
对照组 50.8 818.1 1081.1 1464.5 1645.5 1620.1 1411
家兔服药前后血清胆固醇变化结果(均数)
0
250
500
750
1000
1250
1500
1750
服药前 2周 4周 6周 8周 10周 12周
时间
胆固醇(单位)
实验组
对照组
普通线图,用折线将各点连接。
表 某市 1949-1957年 15岁以下儿童结
核病与白喉病死亡率( 1/10万)
? 年份 结核病 白喉病
? 死亡率 死亡率
? 1949 150.2 20.1
? 1950 148.0 16.6
? 1951 141.0 14.0
? 1952 130.0 11.8
? 1953 110.4 10.7
? 1954 98.2 6.5
? 1955 72.6 3.9
? 1956 68.0 2.4
? 1957 54.8 1.3
1949-1957á ê ′ù êˉ oá ·è D? ??·ì è? ê? ??
0
20
40
60
80
100
120
140
160
1949 1951 1953 1955 1957
è?
ê?
??
£¨1/1
0ê
í
£?
oá ·è
??·ì
普通线图普通线图
某市 1949-1957年 15岁以下儿童结核
病与白喉病死亡率( 1/10万)
? 年份 结核病 白喉病
? 死亡率 下降 % 死亡率 下降 %
? 1949 150.2 — 20.1 —
? 1950 148.0 1.46 16.6 17.41
? 1951 141.0 4.72 14.0 15.66
? 1952 130.0 7.80 11.8 15.71
? 1953 110.4 15.07 10.7 9.32
? 1954 98.2 11.23 6.5 39.25
? 1955 72.6 26.06 3.9 40.00
? 1956 68.0 6.33 2.4 38.46
? 1957 54.8 19.41 1.3 45.83
0
0.5
1
1.5
2
2.5
1949 1950 1951 1952 1953 1954 1955 1956 1957
年代
死亡率对数值
结核病
白喉病
某市 1949-1957年 15岁以下儿童结核病与
白喉病死亡率( 1/10万)
半对数图
? 比较组 A点 下降 B点 差值 下降比值
? 甲组 1000 100 900 1000/100
? 乙组 100 10 90 100/10
? 丙组 10 1 9 10/1
? Lg A Lg B 差值
? 甲 3 2 1
? 乙 2 1 1
? 丙 1 0 1
0
200
400
600
800
1000
A B
100
纵坐标为等差单位
A B
1
10
100
1000
A B
对
数
单
位
0
2
4
6
8
10
12
0 1 2 3 4 5 6 7 8 9 10 11 12
íí
íí
íK
íê ííí¨íííí
íí 3-12 íííííííííííííí
)( sx ?
误差线图
(四)直方图
? 作用:反映 某计量变量值 数据在取值范
围内的分布和形态(正态或偏态)。
? 图形选择:分组标志为连续性的计量资
料。
? 注意:绘制时应组距相等。
? 例表 10-6资料组距不等,
? 换算每岁例数(每组例数 /该组组距)为
频数,再做图。
101 à? ?ù ±£ ±? áê ?? ?D ?a ?? 3¨?é 21 ?? °1
0
5
10
15
20
25
2, 3 0 ?? 2, 9 0 ?? 3, 5 0 ?? 4, 1 0 ?? 4, 7 0 ?? 5, 3 0 ??
?3
?ù
£¨f£
?
直方图:描述计量数据频数分布
0
2
4
6
8
10
12
14
16
0 1 2 3 4 5 6 7 8 9 10 15 20 25 30 35
表 10-6资料 各组组距不等的直方图
0
2
4
6
8
10
12
14
16
0 2 4 6 8
10 12 14 16 18 20 22 24 26 28 30 32 34 36 38
表 10-6资料 各组组距相等的直方图
(六),箱式图
( 反映 计量数据 的变异和集中趋势 ) )
? 箱式图( box-plot),通过数据的全
距、四分位间距、中位数反映数据
的分布、变异大小、偏度和集中趋
势几个特征。例讲义 图 10-9
? 应用,箱线图常描述几组计量数据
分布特征。
0 10 20 30 40 50 60
元月份
二月份
图 3-9 某年某院某科出院患者住院天数的分布
住 院天数
箱式图
图8.9 某病不同时期血清水平变化情况
晚期中期某病早期正常组
血
清
(u/ml
)
120
100
80
60
40
20*
本节重点
? 1.能正确安排简单表和组合的统计表
? 2.要求掌握统计表的基本表式和内容
? 3.几种统计图形的选择
? 作业,177页
? 一、选择题
? 三、计算分析题的第 1和 2题
?
?