1
第一章 绪论
基本概念
总体与样本
资料类型:
计量资料、计数资料、等级资料
误差类型:
随机误差、系统误差、非系统误差
频率与概率
2
基本概念
医学统计工作的基本步骤:
设计、搜集资料、整理资料、分析资料
实验设计三原则:
随机化、重复、对照
3
第二章 计量资料的统计描述
1,频数分布表和频数分布图;
2,集中趋势的描述;
3,离散趋势的描述;
4,正态分布:
分布特征、标准正态分布
5,医学参考值范围:
正态分布法、百分位数法
4
第三章 总体均数的估计
与假设检验
1,均数的抽样误差与标准误
2,t 分布:图形与特征
3,总体均数的估计:可信区间
4,总体均数可信区间与参考值范围的区别
5,t 检验和 u 检验
6,假设检验的基本步骤及注意事项
5
第四章 多个样本均数比较
的方差分析
1,方差分析的基本思想、应用条件
2,完全随机设计资料的方差分析
3,随机区组设计资料的方差分析
4,多个样本均数间的多重比较:
SNK-q 检验,Dunnett - t检验
5,多样本方差齐性检验
6
方差分析与 t检验的关系
当比较两个均数时, 从同一资料算得之
F 值与 t值有如下关系:
F = t2
可见在两组均数比较时,方差分析
与 t检验的效果是完全一样的。
7
第五章 计数资料的统计描述
1,常用相对数:
强度相对数、结构相对数、相对比
2,应用相对数的注意事项
3,率的标准化
8
第六章 几种离散型变量的
分布及其应用
1,二项分布的概念
2,总体率的区间估计
3,样本率与总体率的比较
4,两样本率的比较 – 大样本
9
2
2 ()
( ) ( ) ( ) ( )
a d b c n
a b c d a c b d
?
?
?
? ? ? ?
四格表资料专用公式:
四格表资料连续性校正公式:
1??
2
2
( | | )
2
( ) ( ) ( ) ( )
c
n
a d b c n
a b c d a c b d
?
??
?
? ? ? ?
2? 检验
第七章
1??
10
行 × 列表资料的 检验?2
专用公式
)1(
2
2 ?? ?
CR nn
An?
1、多个样本率的比较
2、样本构成比的比较
3、双向无序分类资料的关联性检验
自由度 ν = (行数 -1)(列数 -1)
11
1,基本概念
2,配对样本比较的 Wilcoxon符号秩检验
3,两个独立样本比较的 Wilcoxon秩和检验
4,完全随机设计多个样本比较的
Kruskal-Wallis H 检验
5,随机区组设计多个样本比较的
Friedman M 检验
第八章 秩转换的非参数检验
12
一, 直线回归
概念, 直线回归方程
直线回归中的统计推断
二, 直线相关
概念, 相关系数的意义与计算
相关系数的统计推断, 决定系数
三, 秩相关
Spearman秩相关
四, 曲线拟合
第九章 双变量回归与相关
13
第十章 统计表与统计图
一, 统计表
统计表的编制
不良统计表的修改
二, 统计图
常用统计图, 适用什么资料
简单统计图的绘制
三, 统计表与统计图的联系
14
第十一章 多因素试验
的方差分析
完全随机分组两因素析因设计:
基本概念、变异分解、方差分析
15
第十三章 协方差分析
1,基本思想
2,协方差分析应用条件
3,完全随机设计资料的协方差分析
16
第十五章 多元线性回归分析
1,多元线性回归模型及应用条件
2,多元线性回归方程的假设检验
回归方程, 各自变量
3,标准化回归系数
4,多元线性回归自变量的选择
5,多元线性回归的应用
17
1,logistic回归
基本概念、适用范围
与线性回归的区别
2,自变量的类型,应用时如何赋值
3,logistic回归方程的表达
4,logistic回归中回归系数的含义
第十六章 logistic回归分析
18
1,生存分析基本概念
2,生存分析的单因素分析和多因素分析
3,单因素生存分析常用统计指标、含义
4,Cox比例风险回归模型
5,Cox模型与 logistic回归模型的异同点
第十七章 生存分析
19
1,判别分析的概念
2,Fisher判别
3,Bayes判别
4,逐步判别,分析过程
第十八章 判别分析
20
1,聚类分析的概念
意义、类型、聚类统计量
2,聚类方法:
系统聚类、动态样品聚类
3,聚类分析与判别分析的区别
第十九章 聚类分析
21
1,主成分分析的基本思想
2,主成分的贡献率和累积贡献率
3,分析结果的解释
4,因子分析
第二十章 主成分分析与
因子分析
22
硕士研究生, 医学统计学,
试题解析
23
一,填充题,(共 20分,每空格 1分)
1.实验设计的原则是:,, 。
2.统计资料可分为:,, 。
3.方差分析,t检验等的应用条件是:, 。
4.服从正态分布的资料常用 表示平均水平,
用 表示离散程度;服从对数正态分布的资
料常用 表示平均水平;服从非正态分布的资
料常用 表示平均水平,用 表示离散
程度;
24
5.现况调查的抽样方法主要有:,
,, 。
6.当拒绝了实际上成立的 H0时,犯了 错误
,其概率为 α;当不拒绝实际上不成立的 H0时,犯
了 错误,其概率为 β;要同时降低 α,β
值,唯一的办法是 。
25
二,选择题,(共 15分,每空格 1.5分)
1,⑴ 测得某地 180名正常人血液总胆固醇含量并编
制频数表,该资料可用 表示。
⑵记录某年某省五种恶性肿瘤的死亡人数,该资
料可用 表示。
A,圆图; B,条图; C,线图 ; D,直方图。
26
2,某医院收集 440名正常人与 320名甲亢病人的生
理、生化、体征等 12项指标值。要根据这些指标区
分正常人与甲亢病人,可用 。
A,判别分析 ; B,聚类分析 ;
C,主成份分析 ; D,因子分析。
27
3,测得 18名正常人 (晨尿 )尿氟含量,可用 估计 μ
的 95%可信区间。
A,; B,;
C,; D,。
0,0 5 / 2X t S? 0,0 5 / 2 XX t S?
1,9 6XS? 1,9 6 XXS?
28
4,有直线回归方程,则:
⑴必定有 。 A,lxy > 0,r > 0; B,lxy > 0,r < 0;
C,lxy < 0,r > 0; D,lxy < 0,r < 0。
⑵ 可认为 x,y 。
A,有相关关系; B,无相关关系;
C,ρ = 0; D,ρ 有可能为 0。
⑶ x 每增加 1个单位,y 相应地增加 个单位。
A,2.2; B,3.7; C,5.9; D,不定。
? 2,2 3,7y = + x
29
5.某化工厂工人慢性支气管炎患病情况,由表可
见 。
A,10-年组工人患病最严重; B,15-年组工人患病最严重;
C,5-年组与 15-年组患病情况差不多;
D,以上三种说法都有依据。
工龄 (年 ) 人数 患病数 % %
0- 340 17 11.5 5.0
5- 254 30 20.4 11.8
10- 432 70 49.7 16.9
15- 136 27 18.4 19.9
合计 1162 147 100.0 12.7
30
6.某城市人口普查结果,65岁以上的老人占总
人口的 26.5%。这 26.5%是 。
A,强度相对数; B,结构相对数;
C,相对比; D,百分位数。
7.由病例对照研究的资料可计算 。
A,RR; B,OR; C,发病率; D,生存率。
31
三, 选择填空题 ( 共 15分, 1,2,3小题每题 2分, 4― 9
小题每题 1.5分 )
( 选择合适的方法, 将相应的字母填入空格中 )
A,χ2检验, B,配对设计 t检验, C,u 检验,
D,两组设计 t检验, E,完全随机设计方差分析,
F,随机区组设计方差分析, G,析因方差分析,
H、配对资料秩和检验, I、两组资料秩和检验,
J、多组资料秩和检验,
32
1,记录 10名患者治疗前后的舒张压, 检验某降
压药是否有效, 可用,, 。
2,记录两组用不同降压药患者 ( 各 10名 ) 治疗
前后舒张压的下降值, 比较疗效有无差别可用
、, 。
33
3,记录四组用不同降压药患者 ( 每组 10名 ) 治
疗前后舒张压的下降值, 比较四种降压药的疗效
有无差别, 可用, 。
4,调查三个不同民族各 2000人, 得到 A,B,O
,AB四种血型的人数, 问血型构成与民族有无关
系, 可用 。
5,有 8个不同产地, 每个产地测得黄瓜, 萝卜
,白菜中某种农药的含量各一份, 比较三种蔬菜
该农药污染情况, 可用 。
34
6,某药治疗老年慢性支气管炎, 近期疗效如下,
比较两种不同类型病人的疗效可用 。
类型 治愈 显效 好转 无效
单纯型 60 98 51 12
喘息型 23 83 65 11
某药治疗老年慢性支气管炎近期疗效
35
7,治疗缺铁性贫血患者 40名, 随机分成四组, 分
别采用常规治疗, 常规加甲药, 常规加乙药, 常规
加甲药和乙药治疗 。 记录治疗 1个月后血红蛋白增
加量, 可用 作统计分析 。
8,甲, 乙两省各测量 300名成年男性身高, 比较
两省成年男性身高有无差别, 可 用 。
36
9,某矿石粉厂工人穿着四种不同防护服后, 皮炎
患病率如下, 比较四种防护服的效果可用 。
A B C D
例数 28 30 25 24
患病人数 10 8 9 5
四种防护服的效果比较
37
四, 分析题 ( 共 15分 )
1,为探讨影响差等生学习成绩的因素, 某儿科医
生调查某小学六年级各班倒数五名以内学生共 34名
的平均成绩 (y),并测定了智商 (x1),血清铁 (x2),血
清铜 (x3),日均热卡 (x4),日均食入蛋白量 (x5),头
围 (x6)和家庭月人均收入 (x7),进行了逐步回归分
析 。 分析结果如下 。
38
Parameter Estimates
Variable DF Parameter Standard T for H0,Prob>|T| Standardized
Estimate Error Parameter=0 Estimate
Cons 1 161.7777 26.6200 6.077 0.0001 0.0000
X1 1 0.2207 0.08476 2.605 0.0144 0.3283
X2 1 0.0072 0.00234 3.092 0.0044 0.3897
X4 1 -0.0098 0.00232 -4.233 0.0002 -0.5413
X6 1 -1.8016 0.54828 -3.286 0.0027 -0.4204
Analysis of Variance
Source DF Sum of Squares Mean Square F Value Prob>F
Model 4 2037.09340 509.27335 10.20 0.0001
Error 29 1447.51226 49.91422
Total 33 3484.60566
39
试回答下列问题:
⑴ 给出选入变量的检验水准, 列出多重回归方程;
⑵ 列出方差分析表和标准化回归方程;
⑶ 给出复相关系数和标准估计误差;
⑷ 列出每步入选或剔除变量和相应的 P值;
⑸ 给出方程中各偏回归系数检验的 t 值和 P值;
⑹ 将方程内变量按其对 y 的作用大小排序 。
40
2,完全随机分组的 3× 2× 2析因试验, 每个处理
组观察 5例, 试用方差分析表形式说明总离均差平
方和分成哪几个部分, 每种来源的自由度 。 (5分 )
41
五, 计算题 ( 共 35分 )
1,三地湖水中氯化物的含量 ( mg/L) 如下, 试比较三地
湖水中氯化物含量有无差别 。 并写出该资料的 SAS数据集格
式, 假设该数据集名为 work.a,请写出运用, 分析员应用
” 的方法进行检验的过程 。 ( 13分 )
∑ x ∑ x2 S2
甲地 19 23 14 18 15 89 1635 12.7
乙地 18 20 21 14 24 97 1937 13.8
丙地 17 15 22 25 16 95 1879 18.5
42
2,某市调查市区在校小学生 1800人, 龋患率为
41%,农村在校小学生 1650人, 龋患率为 46%,试
问该市区与农村在校小学生龋患率有无差别? 并写
出该资料的 SAS数据集格式, 假设该数据集名为
work.b,请写出运用编程的方法进行检验的程序代
码 。 ( 10分 )
43
3,测得 8名 20岁男青年身高 ( cm,x) 与前臂长
( cm,y) 如下, 请作直线相关与回归分析 。 并写
出该资料的 SAS数据集格式, 假设该数据集名为
work.c,请写出运用, 交互数据分析, 的方法进行
分析的过程 。 ( 12分 )
例号 1 2 3 4 5 6 7 8
身高 (x) 170 173 160 155 173 188 178 183
前臂长 (y) 45 45 44 40 47 50 47 49
44
硕士研究生, 医学统计学, 试题
(答案一律做在试卷上)
45
1,方差齐性 2,直线化 3,主成分分析
4,随机化分组 5,相对数 6,抽样误差
7,参数估计 8,整群抽样 9,随访资料
10,总体和样本
一, 名词解释 ( 每小题 3分, 共 30分 )
46
1,2?3?2的析因试验, 每个处理组观察 5例, 试
述总离均差平方和可分解成哪几个部分? 每种来
源的自由度是多少? ( 列方差分析表说明 )
2,什么情况下应选用非参数检验? 非参数检验
的优缺点?
二, 简答题 ( 每题 5分, 共 30分 )
47
3,简述聚类分析的意义, 类型, 方法和聚类
统计量 。
4,调查设计的主要内容 。
5,评价诊断试验的基本指标有哪些?
6,在多重回归分析中为何要用逐步回归的方法?
二, 简答题 ( 每题 5分, 共 30分 )
48
编号 体重 (kg) 心脏横径 (cm)
1 25.5 9.2
2 20.0 8.2
3 24.0 9.4
4 20.5 8.6
5 25.0 9.0
6 22.0 8.8
7 21.5 9.0
8 23.5 9.4
9 26.5 9.7
10 23.5 8.8
三, 计算分析题 ( 共 40分 )
10名正常男童体重与心脏横径
1.测得 10名正常男
童体重 (X)与心脏横
径 (Y)如表 。 (14分 )
①, 试作回归, 相
关分析 。
②, 直线回归, 相关
分析应注意哪些问题

49
2,某医院对献血员与性乱者分别检测抗 -
HCV,在 107例献血员中阳性的 2例,在 208例
性乱者中阳性的 18例 。 试比较两组抗 -HCV
检测阳性率 是否有差别?
( 用两种方法比较 ) ( 12分 )
50
3,9名志愿受试者服用某种减肥药前后的体重列
于下表,( 14分 )
编号 服药前 服药后
1 101 100
2 131 136
3 131 126
4 143 150
5 124 127
6 137 126
7 126 116
8 95 105
9 90 87
服用某种减肥药前后的体重
①,用方差分析方法检
验此药是否有效?
②,除方差分析外, 还
可以用哪些方法分析
( 不必计算 )?
③,作假设检验应注意
哪些问题?
51
一, 需带计算器, 笔, 尺 。
二, 不要带手机, BP机和其它有文字功能的工具

三, 不要带任何书籍, 纸张 (试卷附有草稿纸 )。
四, 试卷不准拆开 。
五, 中途不得离开考场 。
六, 考试时间三个小时 。
,医学统计学, 考试有关事宜