,医学统计学,
复 习
第一章 绪论
1,基本概念:
总体与样本
资料类型
计量资料、计数资料、等级资料
误差类型
随机误差、系统误差、过失误差
频率与概率
2,医学统计工作的基本步骤:
设计、搜集资料、整理资料、分析资料
3,实验设计的原则:
随机化、重复、对照
第二章 计量资料的统计描述
1,频数分布表和频数分布图;
2,集中趋势的描述;
3,离散趋势的描述;
4,正态分布:
分布特征、标准正态分布
5,医学参考值范围:
正态分布法、百分位数法
第三章 总体均数的估
计与假设检验
1,均数的抽样误差与标准误
2,t 分布:图形与特征
3,总体均数的估计:可信区间
4,总体均数可信区间与参考值范围的区别
5,t 检验 和 u 检验
6,假设检验的基本步骤及注意事项
第四章 多个样本均数比
较的方差分析
1,方差分析的基本思想、应用条件
2,完全随机设计资料的方差分析
3,随机区组设计资料的方差分析
4,多个样本均数间的多重比较:
SNK-q 检验, Dunnett-t检验
5,多样本方差齐性检验
方差分析与 t检验的关系
在 两组均数比较时, 从同一资料算得之
F 值与 t值有如下关系:
F = t2
可见在两组均数比较时,方差分析
与 t检验的效果是完全一样的。
第五章 计数资料的统计描述
1.常用相对数:
强度相对数、结构相对数、相对比
2.应用相对数的注意事项
3.率的标准化
第六章 几种离散型变量
的分布及其应用
1,二项分布的概念
2,总体率的区间估计
3,样本率与总体率的比较
4,两样本率的比较 — 大样本
2
2 ()
( ) ( ) ( ) ( )
a d b c n
a b c d a c b d
?
?
?
? ? ? ?
1.两个样本率的比较
2× 2表资料专用公式:
2× 2表资料连续性校正公式:
1??
2
2
( | | )
2
( ) ( ) ( ) ( )
c
n
a d b c n
a b c d a c b d
?
??
?
? ? ? ?
1??
第七章 2? 检验
行 × 列表资料 ?2检验专用公式
)1(
2
2 ?? ?
CR nn
A
n?
2.多个样本率的比较
3.两个或多个样本构成比的比较
4.双向无序分类资料的关联性检验
自由度 ν = (行数 -1)(列数 -1)
1,基本概念
2,配对样本比较的 Wilcoxon符号秩检验
3,两个独立样本比较的 Wilcoxon秩和检验
4,完全随机设计多个样本比较的
Kruskal-Wallis H 检验
5,随机区组设计多个样本比较的
Friedman M 检验
第八章 秩转换的非参数检验
1,直线回归
概念, 直线回归方程的计算
直线回归方程的假设检验
2,直线相关
概念, 相关系数的意义与计算
相关系数的假设检验, 决定系数
3,秩相关
Spearman秩相关
4,曲线拟合
第九章 双变量回归与相关
第十章 统计表与统计图
1,统计表
统计表的种类
统计表的编制原则
编制统计表的基本要求
2.统计图
统计图的种类
绘制统计图的原则与要求
第十一章 多因素试验
的方差分析
完全随机分组 2因素 2水平析因设计:
基本概念 处理组间:
A因素主效应
变异分解:总变异 B因素主效应
AB交互作用
方差分析 误差
第十三章 协方差分析
1.基本思想
把与 Y有线性关系的协变量(未加或难以控
制因素) X化为相等后,再进行各组 Y的修
正均数比较。
2,协方差分析应用条件
同方差分析应用条件;各总体存在线性回归
关系且斜率相同。
3,完全随机设计资料的协方差分析
第十五章 多元线性回归分析
1,多元线性回归模型及应用条件
2,多元线性回归方程的假设检验
回归方程, 各自变量
3,标准化回归系数
4,多元线性回归自变量的选择
逐步回归法
5,多元线性回归的应用
1,logistic回归
基本概念、适用范围
与线性回归的区别
2,自变量的类型,应用时如何赋值
3,logistic回归方程的表达
4,logistic回归中回归系数的含义
第十六章 logistic回归分析
1,生存分析基本概念
2,生存分析的单因素分析和多因素分析
3,单因素生存分析常用统计指标、含义
4,Cox比例风险回归模型
5,Cox模型与 logistic回归模型的异同点
第十七章 生存分析
1,判别分析的概念
2,Fisher准则判别
3,最大似然判别法
4,Bayes公式判别法
5,Bayes准则判别
6,逐步判别
第十八章 判别分析
1,聚类分析的概念
意义、类型、聚类统计量
2,聚类方法
系统聚类、动态样品聚类、有序样品聚类
3,聚类分析与判别分析的区别
第十九章 聚类分析
1,主成分分析的基本思想
2,主成分的贡献率和累积贡献率
3,分析结果的解释
4,因子分析
第二十章 主成分分析
与因子分析
2002年级硕士研究生
,医学统计学, 试题
解析
一, 需带计算器, 笔, 尺 。
二, 不要带手机, BP机和其它有文字功能的
工具 。
三, 需带学员证 。
四, 不准拆开试卷 。
五, 中途不得离开考场 。
六, 考试时间一般为 3小时 。
七, 姓名与学号写在密封线外, 不要在试卷
上作记号 。
,医学统计学, 考试有关事宜 ( 开卷 )
一、单项选择题(共 21分)
二、分析思考题(共 14分)
三、计算题(共 65分)
一、单项选择题(共 21分,每小题 1.5分)
1.统计学中所说的样本是指 ____。
A.随意抽取的总体中任意部分
B.有意识的选择总体中的典型部分
C.依照研究者要求选取总体中有意义的一部分
D.依照随机原则抽取总体中有代表性的一部分
2.最小组段无下限或最大组段无上限的频数表资料
,可用 ____描述其集中趋势。
A.均数 B.标准差 C.中位数 D.四分位数间距
3.当样本含量增大时,以下说法正确的是 ____。
A.标准差会变小 B.均数标准误会变小
C.均数标准误会变大 D.标准差会变大
4.关于假设检验,下列哪一项说法是正确的 ____。
A.单侧检验优于双侧检验
B.采用配对 t检验或成组 t检验由实验设计方法决定
C.检验结果若 P> 0.05,则接受 H0犯错误的可能性
很小
D.用 u检验进行两样本总体均数比较时,要求方差
齐性
5.欲比较两地死亡率,计算标准化率可以 ____。
A.消除两地总人口数不同的影响
B.消除两地各年龄组死亡人数不同的影响
C.消除两地各年龄组人口数不同的影响
D.消除两地抽样误差不同的影响
6.多样本资料比较,当分布类型不清楚时选择 ____。
A.t检验 B.秩和检验
C.u检验 D.卡方检验
7.某地人群中高血压的患病率为 ?,由该地区随机抽
查 n个人,则 ____。
A.样本患病率 p=X/n服从 B(n,?)
B.n个人中患高血压的人数 X服从 B(n,?)
C.患病人数与样本患病率均不服从 B(n,?)
D.患病人数与样本患病率均服从 B(n,?)
8.作多元回归分析时,若降低进入的 F界值,则进入
方程的变量一般 ____。
A.增多 B.减少 C.不变 D.可增多也可减少
9.logistic回归分析适用于应变量为 ____。
A.分类值的资料 B.连续型的计量资料
C.正态分布资料 D.一般资料
10.Cox回归风险率 ____。
A.等于一个常数 B.服从某种分布规律
C.等于基准函数乘上一个比例因子
D.适用于任意肿瘤资料
11.生存分析中的生存时间为 ____。
A.出院至失访的时间
B.手术至失访的时间
C.观察开始至终止的时间
D.观察开始至失访的时间
12.5个样本率比较,,则在 ?=0.05检验
水准下。可认为 ____。
A.至少有两个总体率不等 B.各总体率均不等
C.各样本率均不等 D.各样本率不全等
2
4,01.0
2 ???
13.欲比较两地 20年来冠心病与恶性肿瘤死亡率的上
升速度,最好选用 ____。
A.普通线图 B.半对数线图
C.条图 D.直方图
14.成组设计两样本比较的秩和检验,其检验统计量
T是 ____。
A.以秩和较大者为 T B.以秩和较小者为 T
C.以例数较大者秩和为 T D.以例数较小者秩和为 T
二、分析思考题(共 14分)
1.为了明确诊断出小儿肺炎三种类型,测得 52
名结核性,27名化脓性和 15名细菌性肺炎患儿的 7项
生理、生化指标。该资料如何用逐步判别方法进行
分析?( 7分)
答题要点,( 1)变量筛选,采用逐步判别分析方法
进行变量筛选,将 7项生理、生化指标中对分类有
意义的指标选入;( 2)建立判别函数,根据筛选出
的指标建立判别函数;( 3)判别效果验正,考察回
代的正确率,进行一定数量的新例判别。
2.测得某地区 27名 16岁男孩的身高( X1)、体
重( X2)、胸围( X3)、肩宽( X4)的数据,进行主
成分分析,结果如下。本资料选取几个主成分为宜?
为什么?贡献率如何?列出主成分的表达式。( 7分)
相关矩阵的特征值
Ei g env a l ue D i ffer ence P r o po rti o n C um ul a ti v e
Z
1
2,97 0 6 2,36 5 3 0,74 2 6 0,74 2 6
Z
2
0,60 5 3 0,34 0 0 0,15 1 3 0,89 4 0
Z
3
0,26 5 2 0,10 6 3 0,06 6 3 0,96 0 3
Z
4
0,15 8 9 0,03 9 7 1,00 0 0
相关矩阵的特征向量
Z
1
Z
2
Z
3
Z
4
X
1
0.49 17 75 - 0.596 33 3 - 0.149 29 1 0.61 66 49
X
2
0,523684 - 0.197 83 8 0.70 29 12 - 0.438 78 2
X
3
0,451200 0.77 26 18 0.14 50 04 0.42 24 38
X
4
0,529462 0.09 1 15 2 - 0.680 14 8 - 0.498 75 9
简单统计量
X
1
X
2
X
3
X
4
M ean 16 1.56 78 49,264 4 79,953 7 35,622 22
StD 3.30 15 2.65 48 1.57 86 0.70 33
答题要点:
选一个或两个主成分均可。
选一个主成分(简单说明原因),累积贡献率 74.26%

选两个主成分(简单说明原因),累积贡献率 89.40%

列出主成分表达式。
三、计算题(共 65分)
1.某医院有工作人员 900人,其中男性 760人,
女性 140人,在一次率感中发病者 108人,其中男性
患者 79人,女性患者 29人。完成下列问题:
( 1)计算该院总流感发病率,男、女流感发病率。
( 2)计算男、女患者占总发病人数的百分比。
( 3)编制统计表表示上述结果。
( 12分)
答题要点:
( 1)该院总流感发病率为:
( 108/900) × 100%=12.00%
男性流感发病率为:
( 79/760) × 100%=10.39%
女性流感发病率为:
( 29/140) × 100%=20.71%
( 2)男性患者占总发病人数的百分比:
( 79/108) × 100%=73.15%
女性患者占总发病人数的百分比:
( 29/108) × 100%=26.85%
( 3)编制统计表:
某医院流感发病情况
性别 人数 发病人数 百分比( % ) 发病率( % )
男 760 79 73.15 10.39
女 140 29 26.85 20.71
合计 900 108 100.00 12.00
2.下表为 10例垂体催乳素微腺瘤经蝶手术前后
的血催乳素浓度,试分别求术前与术后的均数、标
准差和变异系数。应以何指标比较手术前后数据的
变异情况?为什么?( 10分)
手术前后患者血催乳素浓度( mg/ml )
血催乳素浓度 血催乳素浓度
例号
术前 术后
例号
术前 术后
1 276 41 6 266 43
2 880 110 7 500 25
3 1600 280 8 1700 300
4 324 61 9 500 215
5 398 105 10 220 92
答题要点:
%61.79%100
X
S
CV
)ml/mg(27.101S
)ml/mg(20.127X
%83.82%100
X
S
CV
)ml/mg(99.551S
)ml/mg(40.666X
???
?
?
???
?
?
术后:
术前:
两组资料均数相差
悬殊,应采用变异
系数比较两组的变
异度。虽然术前变
异系数较大,但差
异并不明显,需做
进一步的统计分析
才能知道何者变异
为大。
3.假定正常成年女性红细胞数( × 1012/L)近似
服从正态分布,今检测了 200名正常成年女性红细胞
数,求得均数为 4.18,标准差为 0.29。试计算正常
成年女性红细胞数的 95%参考值范围,正常成年女性
红细胞数总体均数的 95%可信区间,所得参考值范围
与可信区间有何区别?( 8分)
答题要点:
因为正常成年女性红细胞数近似服从正态分布
,直接用正态分布法计算双侧参考值范围如下:
下限,4.18-1.96× 0.29=3.61( × 1012/L)
上限,4.18+1.96× 0.29=4.75( × 1012/L)
成年女性红细胞数的 95%参考值范围是:
3.61~ 4.75 ( × 1012/L)
成年女性红细胞数总体均数的 95%可信区间是:
所得参考值范围与可信区间区别(略)
)( L/../..,1210224144200290961184 ?????
4.有三种抗凝剂( A,B,C)对一标本作红细胞
沉降速度( 1小时值)测定,每种抗凝剂各作 5次,
结果如下,问三种抗凝剂对红细胞沉降速度的测定
有无差别?( 13分)
A,15 11 13 12 14
B,13 16 14 17 15
C,13 15 16 14 12
答题要点:
29 8 0 210 14
990 70 14 12 14 16 15 13 C
11 3 5 75 15 15 17 14 16 13 B
855 65 13 14 12 13 11 15 A
X X X X
2
合计
:
:
:
??
Ho:三种抗凝剂对红细胞沉降速度的测定之间无差别
H1:三种抗凝剂对红细胞沉降速度的测定之间有差别
?=0.05
301040SS
1029405707565SS
4029402980SS
294015210C
222
2
???
?????
???
??
组内
组间

/)(
/)(
方差分析表
变异来源 自由度 SS MS F P
总变异 14 40
组间 2 10 5.0 2 >0.05
组内 12 30 2.5
查 F界值表,F0.05(2,12)=3.89,所以 P>0.05,按 ?=0.05
水准,不拒绝 H0。即尚不能认为 三种抗凝剂对红细
胞沉降速度的测定有差别。
5.对甲、乙两种降压药进行临床疗效评价,将
某时间段内入院的高血压病人随机分为两组,每组
100人。甲药治疗组 80位患者有效,乙药治疗组 50位
患者有效,两种降压药有效率有无差别?( 10分)
有效 无效 合计
甲药 80 20 100
乙药 50 50 100
合计 130 70 200




Ho:?1=?2,两种降压药的总体有效率相等
H1:?1≠ ?2,两种降压药的总体有效率不等
?=0.05
( 1) u检验
p1=80/100=0.8,p2=50/100=0.5,
合并有效率 p=130/200=0.65
444
06750
5080
u
06750
100
1
100
1
6501650S
21 pp
.
.
..
.))(.(.
?
?
?
????
?




因为 u=4.44> 1.96,则 P< 0.05。按 ?=0.05水准
,拒绝 H0,接受 H1,两种降压药有效率差别有
统计学意义,甲药比乙药有效率高。
( 2) 检验
总例数 200>40,最小理论频数 (70× 100)/200
=35>5,无须校正,直接用四格表资料 检验专
用公式。
? ? 7819
10010070130
20050205080 22,?
???
?????
2?
因为 =19.78> 3.84,则 P< 0.05,结论同 u检验

2?
2?
6.为探讨父子身高间的线性相关程度,南方某
地在应届中学毕业生花名册中随机抽取 10名男生,
分别测量他们和他们父亲的身高( cm),得资料如
下,试作回归分析。( 12分)
10名男生身高和他们父亲的身高( cm)
编号 1 2 3 4 5 6 7 8 9 10
父高 164 175 171 170 150 168 172 174 169 177
子高 170 178 170 173 159 169 170 176 170 174




( 1)绘制散点图
1 0 ?? ?D éú éí ?? ?°?? ?? ? ?×μ? éí ?? é¢ μ? í?
Y = 67.1224+0.6141X
155
160
165
170
175
180
145 150 155 160 165 170 175 180
? ?? £¨c m £?
×
ó
??
£¨c
m
£?
( 2)计算回归系数和截距,写出回归方程
( 3)回归系数假设检验
回归系数假设检验方差分析表
变异来源 df SS MS F P
回归 1 198.3441 198.3441 39.1251 <0.05
参差 8 40.5559 5.0695
总计 9 238.9000
( 4)在散点图上绘出回归直线。
X6141.01224.67Y? ??
附界值表
1.F界值表(方差分析,P=0.05)
2.t界值表(双侧)
3.q界值表( P=0.05 )