绪 论
Introduction
DEPARTMENT OF HEALTH STATISTICS
2002.10.17
st
ati
sti
cs
1.班次、教材、时间、课代表
2.教员,张罗漫、孟虹、贺佳、熊林平
3.学科性质,工具学科、边缘学科
4.学习目的,科学研究中的设计与数据处理、
阅读文献、撰写论文等。
5.学习方法,理解基本概念、对实际资料能用
正确方法描述与分析、准确计算、对计算结果
能够正确理解;不要死记公式与追求公式推导。
6.学习要求,注重统计思想、抽象思维与严谨
作风的培养。
教学安排与要求
st
ati
sti
cs
运用概率论、数理统计等原理与方法,
研究数据的搜集、整理、分析的科学。
医学统计学 (statistics of medicine)
运用统计学的原理和方法,研究医学科
研中有关数据的搜集、整理、分析的科
学。
统计学 (statistics)
st
ati
sti
cs
医学统计学 (statistics of medicine)
卫生统计学 (health statistics)
应用于整个生物学范畴,范围比医学统
计学广,侧重于人的生物方面。
用于医学和卫生学领域,侧重于人的社会
方面,如健康状况统计和卫生服务统计。
生物统计学 (biostatistics)
st
ati
sti
cs
1,以正确的方式搜集数据。
2,描述数据的统计特征。
3,统计分析以得出正确的结论。
医学统计方法
在医学研究中的运用
st
ati
sti
cs
第一节 统计学的几个基本概念
二,总体与样本
三,变量与资料
四, 误 差
五,频率与概率
一,随机试验与随机事件
st
ati
sti
cs
一,随机试验与随机事件
1,随机试验:
( 1)可以在相同的条件下重复进行;
( 2)每次试验的可能结果不止一个,并
且能事先明确试验的所有可能结果;
( 3)进行一次试验之前不能确定那一个
结果会出现。
st
ati
sti
cs
1,随机试验:
如:对某人的某项生理生化指标的检测
某种疾病的治疗结果
抽烟与肺癌的关系
18岁正常中国男子的身高测量
?
st
ati
sti
cs
2,随机事件:
在一次随机试验中,它的每一次可能
出现的结果都是一个随机事件。
随机事件的发生在大量重复试验中具
有某种统计规律性,揭示和研究这种
统计规律性是概率论所要研究的问题。
st
ati
sti
cs
二,总体与样本
1,总体,population
根据研究目的确定的同质观察单位的全体;
是同质的所有观察单位某种观察值的集合。
如某地 2002年 18岁正常男子的身高。
观测单位, observed unit
观测值,observed value
st
ati
sti
cs
了解某地 2002年全体正
常 18岁男子身高情况
研究
目的
总体 该地 2002年全体正常 18岁男子身高值
观测单位 每个正常 18岁男子
观测值 正常 18岁男子身高值
st
ati
sti
cs
(1) 有限总体,finite population
规定了时间、空间、人群范围内有限个观
察单位的总体。
(2) 无限总体,infinite population
总体的概念是设想的或抽象的,没有时间
和空间范围的限制。
如用某种药物治疗患某种疾病患者的总体。
st
ati
sti
cs
抽样研究,sampling research
从总体中抽取样本,根据样本信息推断总
体特征。
抽样,sampling
从总体中随机抽取部分观察单位的过程。
应遵循随机化 (randomization)的原则。
2,样本,sample
从总体中随机抽取部分观察单位的实测值
集合。该样本包含的观察单位数称该样本
含量 (sample size)。
st
ati
sti
cs
三,变量与资料
1,变量,variable
总体确定后,对每个观察单位的某项
特征进行测量和观察,这种特性能表
现观察单位的变异性,称为变量。
随机变量,random variable
取值不能事先确定的观察结果。
离散型变量,discrete variable
连续型变量,continuous variable
st
ati
sti
cs
2.资料,data
对变量的测得值称为变量值 (value of
variable),或观测值 (observed value),
由变量值构成资料 。
资料的分类:
(1)计量资料,measurement data
定量资料,quantitative data,变量值是定
量的,表现为数值的大小,有度量衡单位。
有效正常11.5816.80B组女55108
……………………
无效异常15.6622.56对照男554
有效异常10.9317.33B组女433
好转正常12.5720.00对照女452
治愈正常11.4718.67A组男371
疗效
评价心电图
舒张压
(kPa)
收缩压
(kPa)
治疗
分组性别
年龄
(岁 )
患者
编号
108例高血压患者治疗后的临床记录
st
ati
sti
cs
(2)计数资料,count data
无序分类变量资料,
unordered categorical variable data,
观察单位按某种属性或类别进行分组,分
组汇总各组观察单位数,变量值是定性的,
表现为互不相容的属性或类别。
二分类
多分类
st
ati
sti
cs
(3)等级资料,ordinal data
有序分类变量资料,
ordinal categorical variable data;
半定量资料,semi-quantitative data。
将观察单位按某种属性的不同程度分
成等级后分组计数,分类汇总各组观
察单位数,其变量值具有半定量性质,
表现为等级大小或属性程度。
st
ati
sti
cs
不同资料转化举例(每分钟脉搏次数)
计量资料 计数资料 等级资料
75 缓 脉( <60 )
82 正常( 60 ~ 1 0 0 )
125 正常脉( 60 ~ 100 )
96 异常( <60 或 >100 )
56 速 脉( >100 )
?
st
ati
sti
cs
四, 误 差
实际测量值与真值之差,即样本指标与
总体指标之差。
1,随机误差,random error
一类不恒定的、随机变化的误差,由多种
尚无法控制的因素引起。随机误差呈正态
分布。
st
ati
sti
cs
随机测量误差:
如测量一个人身高,178.12 178.09
178.15cm
抽样误差:
从一个总体中进行抽样,各样本统计量
与总体参数之差。
st
ati
sti
cs
其值恒定不变或遵循一定变化规律,产
生原因往往是已知或可能掌握的。
原因:抽样不均匀,分配不随机,实
验者感觉或操作上的差异,仪器不准
确等,可以通过周密的研究设计和严
格的技术措施消除。
2,系统误差,systematic error
st
ati
sti
cs
在实验过程中,由研究者偶然失误
而造成的误差。
3,过失误差,gross error
仪器失灵,抄错数字,点错小数点,写
错单位等,可以通过认真的检查核对予
以清除。
90mmHg
。。 。 。 。 。
85mmHg
真值 血压计测定值
系统误差
。 。 。
。 。 。
随机误差和系统误差
随机 误差
st
ati
sti
cs
五,频率与概率
实 验 者
Buffon(法)
k.pearson(英)
k.pearson(英)
投掷次数
4040
12000
24000
“正面, 次数
2048
6019
12012
频 率
0.5069
0.5016
0.5005
1,频率,frequency
在相同条件下,独立地重复 n次试验,随
机事件 A出现 f次,则称 f/n为随机事件 A出
现的频率。
st
ati
sti
cs
英文字母被使用频率
字母 空格 E T O A N I R S
频率 0.2 0.10 5 0.07 2 0.06 5 0.06 3 0.05 9 0.05 5 0.05 4 0.05 2
字母 H D L C F U M P Y
频率 0.04 7 0.03 5 0.02 9 0.02 3 0.02 3 0.02 3 0.02 1 0.01 8 0.01 2
字母 W G B V K X J Q Z
频率 0.01 2 0.01 1 0.01 1 0.00 8 0.00 3 0.00 2 0.00 1 0.00 1 0.00 1
引自 L,B r ill pu in,Sc ie nc e a nd Inf or m a tio n T he or y,N e w Y or k,195 6,
st
ati
sti
cs
2,概率,probability
描述随机事件发生可能性大小的度量。
当 n逐渐增大时,频率 f/n始终在一个常
数左右作微小摆动,称该常数为随机事
件 A的概率,记为,P(A)
?
只要观察单位数足够多,可将频率作为概
率的估计值。
它揭示了隐藏在随机现象中的统计规律性。
st
ati
sti
cs
0 ? P ? 1
P=1 必然事件,P=0 不可能事件。
P? 0.05称为小概率事件,表示在一次实验
或观察中该事件发生的可能性很小。
在只有一个样本情况下,P(A)估计要借助概
率分布,概率分布是, 在同一总体中抽样,
假设下,A在 (- ∞,+ ∞)任一区间分布的概
率,如果一次抽样试验 P (A) ? 0.05,就有
理由怀疑 A不是抽样误差所致,或, 在同一
总体中抽样, 的假设不正确。
st
ati
sti
cs
第二节 统计工作的基本步骤
1.设计,design
2.资料搜集,collection of data
3.资料整理,sorting data
4.分析资料,analysis of data
st
ati
sti
cs
一,设计
统计设计是影响研究能否成功的最关
键环节,是提高观察或实验质量的重
要保证。
1.调查设计,survey design
客观描述研究总体,不对研究总体
施加任何干预,目的在于摸清某一
事物的水平和分布状态。
st
ati
sti
cs
(1)实验研究设计:以动物或生物材
料为研究对象,在研究过程中对研
究对象施加干预。
(2)临床试验设计:以人为研究对象,
在研究过程中施加干预。
2.实验设计,experiment design
st
ati
sti
cs
统计设计的内容:
1.研究目的和假说。
2.研究总体、研究对象、观察单位。
3.是否施加干预,如何施加干预?
4.需搜集那些资料,如何搜集?
5.设置观察指标。
6.资料的整理和汇总,计算有关统计量。
7.控制误差。
8.预期结果。
9.时间和经费的安排等。
st
ati
sti
cs
研究设计的几个关键问题:
1.如何进行抽样?如何安排干预措施?
随机化原则:随机抽样和随机分配。
2.要达到研究目的应抽取多少观察单位?
重复原则:确定样本含量。
st
ati
sti
cs
3.如何在诸多影响因素中,分离出研
究因素对实验结果的效应?
对照原则:在对比组中,除研究因素
外,其它影响实验结果的非研究因素
都尽可能相同。
医学统
计 学
研究
设计
数据
处理
观察性研究
实验性研究
统计描述
统计推论
动物实验
临床试验
假设检验
参数估计
(调查)
实验设计
实验分类
动物实验
临床试验
社区干预试验
基本要素
处理因素
受试对象
实验效应
实验设计
基本原则
对 照
随机化
重 复
(样本含量 )
设置
原则,均衡可比
类型,配对、组间
?
1-?
?,?,?
?
空白
实验
标准
潜在
安慰剂
调查设计
调查方法
调查对象
调查指标
研究目的 按范围
按时间
抽样
普查
横向(现况调查)
非概率
概 率
简单随机
系统
分层随机
整群
纵向
病例对照研究
队列研究
调查工具
调查员
st
ati
sti
cs
二,搜集资料
指采取措施使能取得准确可靠的原始数据。
医疗卫生工作中的统计资料主要来自:
1.统计报表。
2.经常性的工作记录。
3.专题调查或实验研究。
4.统计年鉴和统计数据专辑。
st
ati
sti
cs
三,整理资料
将原始数据净化、系统化和条理化,为
下一步的计算和分析打好基础的过程。
1,净化:对原始数据的清理、检查、
核对和纠正错误等。
2,系统化和条理化:根据研究目的
将原始数据合理分组并归纳汇总等。
st
ati
sti
cs
四,分析资料
统计分析,statistical analysis
统计指标的选择与计算;
统计图、表的绘制;
统计方法的选择及统计软件的应用。
目的是在描述数据特征的基础上,阐
明事物的内在联系和规律性。
st
ati
sti
cs
1.统计描述,statistical description
选用恰当的统计指标,合适的统计表
和统计图,对资料的数量特征及其分
布规律进行测定和描述。
st
ati
sti
cs
(1)参数估计,estimation of parameters
如何由样本统计量推断总体参数。
(2) 假设检验,test of hypothesis
如何由样本差异来推断总体之间是
否存在差异。
2,统计推断,statistical inference
如何在一定的可信程度下由样本信息
推断总体特征 。
st
ati
sti
cs
THE END
st
ati
sti
cs