[AM]
[LM][AM]
〖KH+50mm〗〖HT0XBS〗〖JZ〗
第二篇
〖JZ〗 医学统计学方法在[JZ]护理科研中的应用
〖LM〗[AM][LM]
〖HT〗
〖HS7〗〖HT2XBS〗〖JZ〗 第五章〓医学统计学概述
〖HT5SS〗〓〓
医学统计学是结合医学实际工作,应用概率论和数理统计的方法及原理来研究医
学数据
资料的搜集、整理、分析与推断的一门学科。在医学和护理科研领域中,有许多“群
体”现象,必须用“群体研究的方法学”进行研究,才能获得对这类事物规律性的认识。
同样,
在护理工作中也积累了大量的数据结果,其中蕴藏着丰富的护理和疾病治疗的特点及
规律,只有通过用统计学方法进行分析,才能透过偶然现象,找出事物的本质及其规律
性,更好地为医学和护理工作服务。医学统计学方法是进行科学研究和工作总结必不可少的
工具。
具体地说,统计学在护理科研中主要有三方面的作用,即帮助和指导科研人员有
计划、
有目的地收集资料(科研设计);合理地分析科研资料;正确地解释研究结果,从而
科学地反映护理科研所揭示的特征和规律。因此,护理科研工作者必须具备一定的医学统计
学知识,并将医学统计学基本原理和方法正确地应用于科研过程的各个环节。
〖HS4〗〖HT3H〗〖JZ〗 第一节〓医学统计学的研究对象、任务和研究内
容
〖HT〗〖HT4”K〗〓〓一、 研究对象和任务〖HT〗〖HJ1〗〖HJ〗〖HT5SS〗
自然界一切事物的发生和发展都有它内在的必然规律,但其必然性往往受到许多
偶然因素的影响,
以致在相同的条件下(统计学上称为同质),同一事物的表现结果会存在着不同。例
如,同为某病的患者,他们病情的表现可以不同;同样病情的患者经相同的治疗和护理,表
现的疗效也不同;同地区、同性别、同年龄健康人的身高、体重、血压、脉搏等指标都会
不同。
这些疗效和指标的不同,统计学上称为变异。 同质的个体间存在变异,是生物的重
要特征。
医学统计学所研究的对象是医学中具有同质性和变异性的事件,统计学中称为随
机事件。
随机事件是一种带有偶然性的现象,其事物的结果具有不确定状态,它受众多的因素
所左右,使事物的必然规律被掩盖。医学上许多事件为随机事件。例如,用某药治疗某病
患者,治疗结果可能为治愈、显效、好转、无效等等。医学统计学的任务就是在同质的基础
上
,通过对一定数量个体特征的研究,透过偶然现象,反映和总结出事物的本质特征
和规律,
从而认识和改造事物。〖HS2〗〖HT4”K〗
〓〓二、主要研究内容〖HT5H〗
(一)科研中的统计设计
〖HT5SS〗即从统计学的角度,在科研设计中考虑一些与统计方法、误差控制等有关的问题
。如在调查或实验中应怎样获得有代表性的数据资料(样本)、应观察
多少研究对象、怎样设置对照和处理组、受试对象应怎样安排进行试验和随机化分组等。
统计设计的目的就是以最少的受试对象去获得科学、可靠的结果。〖HTH
〗
(二)参数的估计
〖HTSS〗在对数据进行较深入分析前, 一般要描述与说明研究事物的基本特征和规律(
如平均水平、分布、发生率的高低等)。在医学研究中,常观察的是样本
资料,用统计学的方法可对总体参数(平均数、率)进行估计。〖HTH〗
(三)假设检验〖HTSS〗在医学和护理科研的比较性研究中,常常要对
研究对象采用不同的护理方法或药物进行疗效比较,由于研究对象的个体差异和观察的
数据是样本
资料,
不能直接对结果作出评价。采用统计学中的假设检验方法,排除抽样误差的影响后,
就可对比较的结果作出科学的推断,从而得到有关方法或药物疗效优劣的结论。〖HTH〗
(四)事物间关系的测定〖HTSS〗事物的发生、发展是与许多因素的影响有关
的, 疾病的存在、
治疗及恢复也不例外。医学和护理科研中常常需了解疾病与生理、心理、环境、社会
等因素间的关系,以便达到治疗、预防及控制疾病的目的。采用统计学中相关和回归分析,
可测定事物间的关系程度和定量描述事物间变化的关系。
〖HS4〗〖HT3H〗〖JZ〗 第二节〓统计学中的一些基本概念
〖HT〗〖HT4”K〗〓〓一、 几个常用的名词解释〖HT〗〖HJ1〗〖HJ〗〖HT5H〗
(一)变量(Variable)及分类〖HT5SS〗
统计研究中把所观察的指标称为随机变量或变量,变量值的来源通称为观察单位
或研究
对象。观察单位可以是“患者、健康人、动物、检测中的检样”等,而不仅仅局限于
人的范围。 例如观察某人群血压的舒张压变化情况,观察单位是该研究人群的每个个体,
测得血压
的舒张压指标为变量值。统计中按观察结果的变量值是定量或定性的,可将变量分为以下类
型:〖HTK〗
1.数值变量(Numerical variable)〓〖HTSS〗每个观察对
象的某项指标是用定量方法测定的数据,即每个观察的指标有一个度量衡单位。例如测得观
察对象的身
高值(
cm)、体重值(kg)、血压值(kPa)、脉搏(次/min)等均属数值变量,又称为计
量资料。〖HTK〗
2.分类变量(Categorical variable)〓〖HTSS〗观察对象的观察结果按某个类别
(属性)来划分后得到的定性的资料。又可分为以下两类。
(1)无序分类〓包括:1)两项分类,例如观察某病护理后的疗效,观察结果分为治
愈、未治愈;
某病检查结果分为正常、异常等两项类别的变量。2)多项分类,即各类间无程度的差
别;如观察某人群的血型,观察结果分为A型、B型、AB型和O型。清点各类的人数后整理的
资料又称计数
资料。
(2)有序分类〓观察结果按多个有程度变化的分类划分后得到的资
料。 例如护理科研中疗效的结果可分为治愈、显效、好转、无效4个有序的等级;对病区管
理的结果可分优、良、中、差;对术后患者疼痛指标结果可分Ⅰ级、Ⅱ级、Ⅲ级、Ⅳ级。
将研究指标的结果按不同类别清点个数后整理的资料又称为等级资料。 这类
资料与无序分类资料不同的是结果有程度上的差别,结果应以等级的大小顺序来排列;与计
量资
料
不同的是结果无确切的量,因此又称为半计量资料或等级资料。护理科研中按此类型
划分的资料很常见。
根据需要,各类变量也可以转换。例如血压值(kPa)指标,属于定量资料, 若
按正常、
异常划分两组,计数各组人数,便成为计数资料;若按正常、可疑、轻度、中度、重
度划分为5组,计数各组人数,便成为等级资料。在医院管理中结果评价常用优、
良、中、
差几个等级来评价,若将结果数量化,分别用1,2,3…10分表示,这时就转成计量
资料。
数据的分类不同,提供的信息不同,统计处理的方法也不同。〖HTH〗
(二)总体与样本(Population and Sample)〖HTSS〗
总体是根据研究的目的,确定同质的观察单位中某个观察指标(变量)值的全体
。根据总体内所包含的观察单位数的多少可分为有限总体和无限(抽象或设想)总体。
临床和护理科研中的总体常为设想的无限总体。如在护理科研中了解“某种心理护理对腹
部手术患者术后血压的影响”,研究对象为某一条件(同质)下做腹部手术的患者,观察的
指标是实施了心理放松训练的患者术后的血压值,因此,此次科研中用该法观察到腹部手术
患
者术后的血压值和包括设想用该法护理的患者术后的血压值,构成该研究的总体。显然这
个总体中的研究对象是不确定的,称为无限总体。如了解某医院护理人员的年龄和文化程
度,该院全体从事护理工作的人员的年龄和文化程度值就构成了该研究的总体,这个总体
中的研究对象是确定的,称为有限总体。
样本是从总体中随机抽取的有代表性的一部分。在实际工作中常常不可能对总体
中的全部观察对象进行研究,而只能观察部分对象,
所观察到的部分研究对象的指标值构成了样本。如上例在临床
上观察到符合一定条件的腹部手术患者接受心理护理术后的血压值,构成该总体的样本。但
科研的目的不仅仅是为了了解样本的情况,而期望样本结论能推论一定条件的某个人群——
即研究的总体,从而得出具有普遍意义的结论。因此,为使样本能真实地反映总体的情况,
统计学上要求样本对总体要有代表性,即是要有一定的观察例数和遵循随机化原则抽样的样
本。〖HTH〗
(三)概率(Probability)〖HTSS〗
概率指某事件(指随机事件)在一定条件下发生的可能性,其可能性的大小通常
用[WTBX]P表
示,P〖WTBZ〗值波动在0~1范围。随机事件某结果发
生的概率常波动
在0~1之间。概率越接近0,表示发生的可能性越小,越接近1则发生的可能性越大。
概率在医学统计学中的应用主要为:
〖HTK〗 1.估计某事件发生的可能性〓〖HTSS〗医学研究中许多随机事件的发生
概率是未知的,常用样本研
究结果的频率作为概率的估计。例如通过用某药或用某种疗法治疗某病的治愈率为80
%,这
个数字说明了某药治愈某病的强度或频率,在治疗的例数较多时,80%也为用某药治
愈某病概率的估计值。〖HTK〗
2.对随机事件的结论作出概率的推论〓〖HTSS〗概率论是统计学原理的基础,
统计分析的许多结论都是建立在概率大小的基础上的。通过统计学方法得到的结论(如检验
假设),
无论是肯定或否定假设,结论都不是百分之百可靠的;但重要的是这种统计结论可以估计
出某事件结论成立的概率有多大,帮助研究者作出决策。医学文献中常见的〖WTBX〗P〖WTB
Z〗≤0.05, 表示某结论成立的可能性等于或小于0.05,被作为事物间差别有统计学意义的
界限(详见第六章
)。〖HTH〗
(四)参数和统计量(Parameter and Statistic)〖HTSS〗
参数指总体中变量值的表现特征(如总体均数、总体率)。通过样本的
观察值计算的指标值(如样本均数、〖WTBX〗t〖WTBZ〗值等)称为统计量。
〖HS2〗〖HT4”K〗〓〓二、数据资料的误差〖HT5SS〗
误差(Error)是指数据的真值与测得值之差,大体可分为4类。
〖HTK〗 1.过失误差〓〖HTSS〗指在收集(调查、登记)和整理(汇总、计算)
资料的过程中, 由于粗心或人为因素造成的误差。必须严格防止,并应在工作中有意地查
找和核对。〖HTK
〗
2.系统误差〓〖HTSS〗指由于某种原因(仪器未校正或某操作人员掌握标准不
统一),使得测定的数据倾向性地偏高或偏低而造成的误差。它将影响统计指标的准确性,
应尽量避免
。〖HTK〗
3.随机误差〓〖HTSS〗随机误差是指排除上述误差后,由众多未知的偶然因素引
起的不易控制的误差,数据的大小及方向是随机变化的。例如,由同一名护士同时多次测量
同一名患者血压值所产生的误差。随机误差的分布有一定规律性,可用统计方法描述和处理
。〖HTK〗
4.抽样误差〓〖HTSS〗
在总体中作随机抽样,由于受个体存在变异及样本只是总体中的一部分的影响,
使得样本观察的结果,即样本指标在一定程度上偏离总体的指标,这种由于抽样而引起的样
本与总体指标的差异,统计学上称为抽样误差。抽样误差是一种不可避免的随机误差,其大
小可用标准误来度量(计算见第六章)。
〖HS4〗〖HT3H〗〖JZ〗 第三节〓统计工作的步骤〖HT〗
〖HT4”K〗〓〓一、统计资料的收集〖HT〗〖HJ1〗〖HJ〗〖HT5H〗
(一)日常医疗卫生工作记录〖HT5SS〗
医疗卫生工作记录有门诊病历、住院病历、医学检查记录和临床护理观察记录等。这些
是诊治疾病的工作记录,是实践经验的积累,也是研究疾病规律和总结诊断、治疗水平的基
本资料。由于受
医院服务对象、患者病情和医院的条件、时期不同等多种因素影响,这种病历总结性质的
资料
在分析时要注意以下问题。〖HTK〗
1.患者病情具有挑选性〓〖HTSS〗一般来说,在大医院就诊的患者往往病情较重, 医
院病历资
料代表某疾病的病情或护理疗效一般是不全面的,它只能代表同样病情的总体。不同医院的
病历资料作对比时应注意这个问题。〖HTK〗
2.不同时期医院病历资料不同〓〖HTSS〗由于医院工作人员的业务水平、 护理质量的
提高
和医疗设备的改善,对疾病的治愈都有影响,因此不同时期的病历资料的对比有一定的局限
性。〖HTH〗
(二)专题调查和实验研究的资料〖HTSS〗
即资料不能从日常的工作记录得来,需采用专门的调查设计和实验设计方法方能获取的
资料。调查资料,
如现况调查、回顾性调查、前瞻性调查等得到的资料;实验研究,如某病用常规
护理与新法护理后疗效
的比较为实验性质的研究(具体设计的方法见有关章节)。〖HS2〗〖HT4”K〗〓〓
二、统计资料(数据)的整理〖HT5H〗
(一)检查资料〖HT5SS〗
在资料整理前,首先应对所收集的资料进行详细的检查,避免和减少过失误差。注意从
下面两方面检查。〖HT5K〗
1.资料的完整性〓〖HT5SS〗检查原始记录各项目是否均填齐或有无重复、遗漏。如有
遗漏, 应
尽量补齐。尤其是临床病史总结资料,由于事前无周密的设计,一些项目可能有遗漏,若舍
弃的例数太多,将影响统计指标的可靠性。〖HTK〗
2.资料的正确性〓〖HT5SS〗检查所有的项目填写是否正确,各项目间有无矛盾, 数
字大小有无
不合理处。〖HTH〗
(二)分组和拟定整理表〖HTSS〗
分组方法:根据研究的目的和各观察指标数据的类型,
将原始的结果按对比的因素(如不同方法或疾病)
分组后,再将数据划分成若干性质相同的组进行归类,使资料系统化,以反映出事物不同组
别各分类的分布和规律。
〖HTK〗 1.计数和等级资料的分组比较及整理表式〓〖HTSS〗
数据按属性分类(如正常或异常)表示各组的差别。例如,将含有原始数据的表51中
的疗效评定指
标按治疗分组,可整理为表52格式,即计数资料的频数表; 或是在某因素(如
不同年龄)下再按某属性
分类(如表53),即比较不同年龄组段差别的频数表;如数据按等级分类的资料可整理成
如表54的频数表。〖HT5”H〗〖JZ〗〖STHZ〗
表51〓100例高血压患者治疗后的临床记录〖HT5”SS〗〖STBZ〗〖BG(!
〗〖BHDFG4,WK6。7W〗
患者编号 〖〗年龄(岁)〖〗 性别 〖〗 治疗分组 〖〗 舒张压(kPa)〖〗
体温 (℃)〖〗 疗效评定
〖BHDG1*2〗
1 〖〗 37 〖〗 男 〖〗 药物A〖〗 11.27 〖〗 37
.5 〖〗 显效
〖BHDW〗 2 〖〗 45 〖〗 女 〖〗 药物B〖〗 12.53 〖〗
37.0 〖〗 有效
〖BH〗3 〖〗 43 〖〗 男 〖〗 药物A 〖〗 10.93 〖〗
36.5 〖〗 有效
〖BH〗4 〖〗 59 〖〗 女 〖〗 药物B〖〗 14.67 〖〗
37.8 〖〗 无效
〖BH〗〖GP〗…
〖BH〗100 〖〗 54 〖〗 男〖〗 药物B〖〗 16.80 〖〗
37.6 〖〗无效〖BG)F〗
〖HT5”H〗〖JZ〗 〖STHZ〗 表52〓两种药物治疗高血压患者后疗效的比较
〖HT5”SS〗〖STBZ〗〖BG(!〗〖BHDFG3,WK11。4W〗
分组 〖〗 有效例数 〖〗 无效例数 〖〗 合计
〖BHDG2,WK11,WK11,WK11,WK11DWW〗
药物A〖〗 30 〖〗 20 〖〗〖JZ〗 50
〖BHDW〗 药物B 〖〗 20 〖〗 30 〖〗 50
〖BHDG2〗 合计〖〗 50 〖〗 50 〖〗 100〖BG
)F〗
〓〓 注:有效例数=显效例数+有效例数
〖HT5”H〗〖STHZ〗〖JZ〗 表53〓两种药物对不同年龄高血压患者疗效的比较
〖HT5”SS〗〖STBZ〗〖BG(!〗〖BHDFG4,WK7,WK14,WK2,WK14,WK7W〗
分组〖〗〖ZB(〗〖BHDG2,WK14W〗年龄<40岁〖BHDG2,WK7,WK7W〗有效例数〖〗无效例数
〖ZB)〗〖〗〖〗〖ZB(〗〖BHDG2,WK14W〗年龄≥40岁〖BHDG2,WK7,WK7W〗有效例数〖〗
无效例数〖ZB)〗〖〗合计
〖BHDG1*2,WK7,WK7,WK7,WK2,WK7,WK7,WK7DWW〗
药物A〖〗 15 〖〗 10〖〗〖〗 12 〖〗 13 〖〗
〖JZ〗 50
〖BHDW〗药物B〖〗 10 〖〗 20 〖〗〖〗 8 〖〗
12 〖〗 50
〖BHDG1*2〗 合计 〖〗 25〖〗 30〖〗〖〗 20 〖〗
25 〖〗 100〖BG)F〗
〖HT5”H〗〖STHZ〗〖JZ〗 表54〓两种心理护理方法对术后患者疼痛程度(级
别)的影响
〖HT5”SS〗〖STBZ〗〖BG(!〗〖BHDFG4,WK9,WK28,WK7W〗
分组〖〗〖ZB(〗〖BHDG2,WK28W〗疼痛程度分级例数〖BHDG2,WK7。4W〗
Ⅰ级 〖〗 Ⅱ级 〖〗 Ⅲ级 〖〗 Ⅳ级 〖ZB)〗〖〗 合计
〖BHDG1*2,WK9,WK7,WK7DW,WK7DW,WK7DW,WK7W〗
试验组 〖〗 5 〖〗〖JZ〗 8 〖〗 〖JZ〗 10 〖〗〖JZ〗
8 〖〗 31
〖BHDW〗 对照组 〖〗 4 〖〗 6 〖〗 8 〖〗 2 〖〗
20
〖BHDG1*2〗 合〓计 〖〗 9 〖〗 14 〖〗 18 〖〗 10〖
〗 51〖BG)F〗
〖HT5K〗 2.计量资料的分组和整理表式〓〖HT5SS〗
计量(数值)资料的整理,常表示在不同组段中某指标数量或分布上的差别。常用频数表
(表55,该资料原始数据省略)表示。以表55为例,介绍编制频数表的步骤。
〖HT5SS〗(1)找出全距(Range)〓全距即资料的变量值中最大值和最小值之差,用
符号〖WTBX〗R表示。
本例最大值为37.6℃,最小值为35.6℃,全距(R)=37.6-35.6=2.0℃〖WTBZ〗。
(2)定组数和组距(Class interval)〓频数分布表的组数一般不宜过多和过少,
一般取8~15组为宜。相邻两个组段间的距离
称为组距,用符号〖WTBX〗i表示。各组组距相等。组距的计算为:组距(i)=全距/组数。
组距常取整数和便于划记的数值, 本例i〖WTBZ〗=2.0/10=0.2。
(3)写出组段值〓第1组段值应小于或等于样本观察值中的最小值,起点值常用2,4,
6,8,或0,5。本例第1组的组段值为35.6,组距为0.2,依次往下写,最末组段应
包括最大
值。各组段值置于表55中第(1)栏。
(4)划记并计数〓将原始数据划入表55的第(2)栏,体温≥35.6℃,但<35.8℃的数据
归入35.6-组段,余仿此。并计出各组段的例数(频数),其
和应等于总数。表55中的第(1)和(3)栏即为各组段腋温分布的频数分布表。
〖HT5”H〗〖STHZ〗〖JZ〗表55〓正常人腋下温度值的分布〖HT5”SS〗
〖STBZ〗
〖BG(!〗〖BHDFG3,WK15。3W〗
腋温(℃)(1)〖〗划记(2)〖〗频数(〖WTBX〗f〖WTBZ〗)(3)
〖BHDG1*2,WK15,WK15ZQ3,WK15DWW〗
35.6~〖〗 - 〖〗〖JZ〗 1
〖BHDW〗 35.8~〖〗 正 〖〗 4
〖BH〗36.0~ 〖〗 正正正 〖〗 13
〖BH〗 36.2~〖〗 正正正正正 〖〗 24
〖BH〗36.4~〖〗 正正正正正正正正正 〖〗 42
〖BH〗 36.6~〖〗 正正正正正正 〖〗 30
〖BH〗 36.8~〖〗 正正正 〖〗 15
〖BH〗 37.0~〖〗 正正 〖〗 10
〖BH〗 37.2~〖〗 正 〖〗 5
〖BH〗〓〓37.4~37.6〖〗- 〖〗 1
〖BHDG1*2〗 合计 〖〗〖〗 145 〖BG)
F〗〖HT5H〗
(三) 统计归纳〖HT5SS〗
资料的统计归纳可用计算机和手工的方式。如果资料的数据不多,可用手工分组的方式
归纳在已设计好的分组整理表中,如表52~55。若资料数据很多,准备用计算机整理归
纳和
统计分析资料时,应事先将要分析的资料的结果变成数字代码。若资料结果本身为数值数据
,如血
压(kPa)、心率(次/min)、年龄(岁)等,可直接输入计算机。如资料结果为分类或等级
资
料,例如疗效结果为有效、无效,可用1和0数值作代码;如结果为优、良、
中、差,可按等级顺序记为1,2,3,4等代码输入计算机。
〖HS2〗〖HT4”K〗〓〓三、统计资料的分析〖HT5SS〗
资料的分析是把已整理好的结果(如频数表的数据),用统计学的方法进一步计算相
应的
统计指标和作统计分析,作出合乎客观事实的统计描述和推断,为研究的事物提出科学的理
论依据。
〖JY〗〖HT5K〗(孟〓虹)〓〓
〖LM〗
〖HS7〗〖HT2XBS〗〖JZ〗
第六章〓计量资料的统计方法
〖HT5SS〗〓〓
数据资料经整理后,可计算一系列统计指标,对资料做概括性的描述和分析。
本章介绍常用描述计量资料的平均指标和变异指标,以及进行参数估计和假设检验的统计方
法。
〖HS4〗〖HT3H〗〖JZ〗第一节〓平均指标和变异指标
〖HT〗〖HT4”K〗〓〓一、平均指标〖HT〗〖HJ1〗〖HJ〗
〖HT5SS〗
平均指标(平均数)描述了一组同质观察值(或称变量值,统计学中用〖WTBX〗X
〖WTBZ〗表示)的平均水平或集中趋势,
常作为一组观察值的代表值,同时也便于不同组间的比较。它是度量计量资料最基本
的指标。
医学中常用的平均数有算术均数、中位数、几何均数。不同的平均数适用的条件
不同,
使用时应注意区别。〖HTH〗
(一)算术均数(Arithmetic mean)〖HTSS〗
简称均数(Mean),统计学中用〖WTBX〗〖AKX-〗表示样本均数,用μ表示总体均
数。 均数适用于观察值间相差不大或频数分布呈对称或正态及近似正态分布的资料。均数
计算方法如下:
〖HTK〗 1.不分组资料的计算方法(直接法)〓〖HTSS〗
当观察值例数不多时,将各观察值(X)相加后除以观察值的个数即得均数。 用
公式表示如下:
〖JZ〗[AKX-]=[SX(]X1+X2+X3+…+Xn[]n[SX)]=[SX(] 〖WTBZ〗Σ
〖WTBX〗Xi[]n[SX)]
〖KH-1*2〗[JY](6.1)〓〓〖HJ1*2〗〖HJ〗
式(6.1)中X为各观察值,〖AKX-〗为算术均数,〖WTBZ〗Σ〖WTBX〗为求和符号
,n为样本的例数。
例6.1〓某病区10名护士的年龄分别为18,19,19,21,23,24,26,30,31,3
5 岁,
该病区护士平均年龄为:
〖AKX-〗=[SX(] ΣX[]n[SX)]=[SX(]18+19+20+…+35[]10[SX)]
=[SX(]246[]10[SX)]=24.6(岁)
〖HTK〗
2.加权法(频数表资料的计算均数的方法)〓〖HTSS〗
当观察值例数较多时,用公式(6.1)计算较麻烦, 常将观察值分组编制成频数分
布表(如表61)。计算公式为:
〖JZ〗〖AKX-〗=[SX(]fx1+fx2+fx3+…+fxn[]f1+f2+f3+…+fn
[SX)]=[SX(]Σfx[]Σf[SX)]
〖KH-1*2〗[JY](6.2)〓〓〖HJ1*2〗〖HJ〗
式中x1,x2,x3,…,xn分别为各组段的组中值,某组段组中值=(该组
段的下限值+该组段的近似上限值)/2,如表61中35.6-组段的组中值x=(35.6+35.8)
/2=35.
7, 余类推。 f分别为各组段的频数(例数),各组的 f起了“权重”的作用,频数 f越多
的组段,对计算均数的作用越大,均数趋向频数多的变量值,故本法称为加权法。
例6.2〓对表61资料按公式(6.2)计算均数。
〖HT5”H〗[STHZ]〖JZ〗 表61〓某地正常成人腋下温度(℃)均数的计算
(加权法)
〖HT5”SS〗[STBZ]〖BG(!〗〖BHDFG4,WK11。4W〗
腋温组段(1)〖〗组中值(x)(2)〖〗频数(f)(3)〖〗fx(4)=(3)×(2)
〖BHDG2,WK11DW,WK11DW,WK11DW,WK11DWW〗
〖JZ〗35.6~ 〖〗〖JZ〗35.7 〖〗〖JZ〗1 〖〗〖JZ〗 35.7
〖BHDW〗 35.8~ 〖〗 35.9 〖〗 4 〖〗 143
.6
〖BH〗 36.0~ 〖〗 36.1 〖〗 13 〖〗 469.3
〖BH〗 36.2~ 〖〗 36.3 〖〗 24 〖〗 871.2
〖BH〗 36.4~ 〖〗 36.5 〖〗 42 〖〗 1533.0
〖BH〗 36.6~ 〖〗 36.7 〖〗 30 〖〗 1101.0
〖BH〗 36.8~ 〖〗 36.9 〖〗 15 〖〗 553.5
〖BH〗 37.0~ 〖〗 37.1 〖〗 10 〖〗 371.0
〖BH〗 37.2~ 〖〗 37.3 〖〗 5 〖〗186.5
〖BH〗 37.4~37.6〖〗 37.5 〖〗 1 〖〗 37.5
〖BHDG2〗〖JZ〗合计 〖〗〖JZ〗-〖〗145(Σf) 〖〗5302.3(Σfx)
〖BG)F〗〖WTBZ〗
〖HT5SS〗〖WTBX〗〖AKX-〗〖WTBZ〗=[SX(]1×35.7+4×35.9+…+1×47.5[]1+4+13+…+1[S
X)]=[SX(]5302.3[]145[SX)]=36.57(℃)
结论:本组正常成人腋下体温的平均水平为36.57℃。〖HTH〗
(二)几何均数(Geometric mean)〖HT5SS〗
几何均数适用于观察值呈倍数关系或部分观察值偏离过大的偏态分布的计量资料
。医学
中如传染病的潜伏期天数和某种抗体滴度资料常用几何均数表示平均水平。计算公
式有直接法和加权法。〖HTK〗
1.直接法〖HTSS〗[WTBX]〖JZ〗
G=[WTBX]n〖KG-*3〗[KF(][WTBX]X1·
X2·X3…X[WTBZ]n[KF)]
〖KH-1〗[JY](6.3)〓〓
在实际计算中用公式(6.3)较不方便,常采用对数形式计算,如式(6.4):
[JZ][WTBX]G[WTBZ]=lg-1([SX(]lg[WTBX]X1[WTBZ]+lg[WTBX]X2+…+[WTBZ]lg[
WTBX]X[WTBZ]n[][WTBX]n[WTBZ][SX)])=lg-1([SX(][WTBZ]Σlg[WTBX]Xi[]
[WTBX]n[WTBZ][SX)])
〖KH-1*2〗[JY](6.4)〓〓〖HJ1*2〗〖HJ〗
式中[WTBX]G[WTBZ]为几何均数,lg-1为求对数均数的反对数。
例6.3〓某病6位出院患者的住院天数为5,5,5,6,7,20,求平均住院天数。 用
几何均数计算如下:
lg[WTBX]G[WTBZ]=([SX(]lg5+lg5+lg5+lg6+lg7+lg20[]6[SX)])=0.8369
[WTBX]G[WTBZ]=lg-10.8369=6.8 (d)
得某病出院患者住院时间平均为6.8 d。〖HTK〗
2.加权法(频数表资料)〖HTSS〗〓
当资料中相同观察值个数较多时,或频数分布为正偏态时的频数表资料可用下式
计算:〖JZ〗
〖WTBX〗G〖WTBZ〗=lg-1([SX(] Σ〖WTBX〗f〖WTB
Z〗lg〖WTBX〗X〖WTBZ〗[] Σ〖WTBX〗f〖WTBZ〗[SX)]
)
〖KH-1*2〗[JY](6.5)〓〓〖HJ1*2〗〖HJ〗
例6.4〓表62资料,用几何均数方法计算慢性胃炎患者平均住院天数。
〖HT5”H〗〖STHZ〗〖JZ〗 表62〓慢性胃炎患者住院时间几何均数计算
表
〖HT5”SS〗〖STBZ〗〖BG(!〗〖BHDFG4,WK9。5W〗
住院天数(〖WTBX〗X)〖〗组中值(x)〖WTBZ〗〖〗lg〖WTBX〗x〖WTBZ〗[]频数(〖WT
BX〗f)[]f〖WTBZ〗lg〖WTBX〗x〖WTBZ〗
[BHDG2,WK9DW,WK9DW,WK9DW,WK9DW,WK9DWW]
〖JZ〗0~ []〖JZ〗 7.5 []〖JZ〗0.8751 []〖JZ〗 70 []〖JZ〗
61.2570
[BHDW] 15~ [] 22.5 [] 1.3522 [] 54[] 73.0188
[BH] 30~ [] 37.5 [] 1.5740 [] 16 [] 25.1840
[BH] 45~ [] 52.5 [] 1.7202 [] 5 [] 8.6010
[BH] 60~ [] 67.5 [] 1.8293 [] 4 [] 7.3172
[BH] 75~ [] 82.5 [] 1.9164 [] 1 [] 1.9164
[BH] 90~ [] 97.5 [] 1.9890 [] 0 [] 0.0000
[BH] 105~115[] 112.5 [] 2.0512 [] 1 [] 2.0512
[BHDG2] 〖JZ〗 合计 []〖JZ〗-[]〖JZ〗-[] 151
[] 179.3456[BG)F]〖HT5SS〗
〖WTBX〗G〖WTBZ〗=lg-1([SX(]179.3456[]151[SX)])=lg-11.1877=15.4(d)
结论:慢性胃炎患者平均住院时间的几何均数为15.4 d。〖HTH〗
(三)中位数(Median)和百分位数(Percentile)〖HTSS〗
中位数(简记为〖WTBX〗M)〓是将一组观察值由小到大依次排列,居以中间位
置的观察值即中位
数。因此,大于和小于中位数的观察值个数相等。
百分位数是描述分布特征的位置指标,以Px表示,指将n个观察值从小到大依
次排列,
[WTBZ] 并将它分为100等份或100%,对应的x%位的观察值即为第[WTBX]x[WTBZ]
百分位数,理论上有
[WTBX]x[WTBZ]%的观察值比它小,有(100-[WTBX]x)[WTBZ]%的观察值比它大。中位数实际
上是第50%位数。〖HTK〗
1.中位数和百分位数的计算方法〖HTSS〗[WTBX]
(1) 不分组资料〓将观察值按大小顺序排列,再按式(6.6)或(6.7)计算:
〖JZ〗
M=X[SX(]n+1[]2[SX)]〓(n为奇数时)〖KH-1〗[JY](6.6)〓〓
〖JZ〗
M=[X[SX(]n[]2[SX)]+X([SX(]n[]2[SX)]+1)]/2〓(n为偶数时)
〖KH-1〗[JY](6.7)〓〓
例如,某病5位出院患者的住院天数为5,5,6,7,20,例数n=5,用(6.6)式计
算中位数。
M=X[SX(]5+1[]2[SX)]=X3=6[WTBZ](d)
即某病5位出院患者平均住院时间为6 d。
再如,6位出院患者住院天数为5,5,5,6,7,20,例数〖WTBX〗n=6,用(6.7
)式计算中位数。
M=[X[SX(]6[]2[SX)]+X([SX(]6[]2[SX)]+1)]/2=
(5+6)/2=5.5[WTBZ](d)
即某病6位出院患者平均住院时间为5.5 d。
(2)分组资料〓即用频数表资料计算中位数和百分位数。分组资料百分位数法
的计算公式为:〖JZ〗
〖WTBX〗 Px[WTBZ]%[WTBX]=L+〖SX(〗i[]f[SX)](n·x[WTBZ]%
-Σ[WTBX]fL)
〖KH-1*2〗[JY](6.8)〓〓〖HJ1*2〗 〖HJ〗
式中P为第x百分位数,L为第x[WTBZ]%[WTBX]位数所在组的下限,i为第x[WTBZ]
%位数所在组的组距
,[WTBX]f为第x[WTBZ]%位数所在组的频数,Σ[WTBX]fL为第x[WTBZ]%位数所在组前一组[
WTBZ]段的累计频数,n为样本例数。〖WTBZ〗
例6.5〓某院1991年消化科慢性胃炎出院患者住院天数如表63,分别计
算第25,
75,95百分位数和中位数。
〖HT5”H〗〖STHZ〗〖JZ〗表63〓慢性胃炎患者住院时间中位数和百分位
数计算表
〖HT5”SS〗〖STBZ〗〖BG(!〗〖BHDFG4,WK11。4W〗 住院时间(d)〖〗频数
[WTBX](f)〖〗累计频数([WTBZ]Σ[WTBX]fL)[WTBZ]〖〗累计频率 (%)
〖BHDG2,WK11DW,WK11DW,WK11DW,WK11DWW〗
〖JZ〗0~ []〖JZ〗 70 []〖JZ〗 70 []〖JZ〗
46.36
[BHDW] 15~ [] 54 [] 124 [] 82.12
[BH] 30~ [] 16 [] 140 [] 92.72
[BH] 45~ [] 5 [] 145 [] 96.03
[BH] 60~ [] 4 [] 149 [] 98.68
[BH] 75~ [] 1 [] 150 [] 99.34
[BH] 90~ [] 0 [] 150 [] 99.34
[BH] 105~115[] 1 [] 151 [] 100.00
[BHDG2] 〖JZ〗合计 [] 151[]〖JZ〗-[]〖JZ〗-[BG)F]
〖HT5SS〗 具体计算步骤如下:
① 在频数表上计算累计频数,见表63。
② 确定各百分位数所在组段和公式中的值。
〖BG(〗〖BHDWG2,WK4,WK10,WK4,WK6,WK10W〗
[WTBX] Px% 〖〗 位置秩号 〖〗 该组段 〖〗 该组
段频数〖〗 上一组段的累计频数
〖BHDW〗
〖3〗 [WTBX] (L) 〖〗 (f) 〖〗
([WTBZ]Σ[WTBX]fL)
[BH] P[WTBZ]25% [] 151×25%=37.75 [] 0 [] 70 []
0
[BH] [WTBX] P[WTBZ]50% []151×50%=75.50 [] 15 [] 54
[] 70
[BH] [WTBX]P[WTBZ]75% [] 151×75%=113.25 [] 15 [] 54
[] 70
[BH] [WTBX]P[WTBZ]95% []151×95%=143.45 [] 45 [] 5
[] 140[BG)W]
〓〓③ 代入公式(6.8)计算:
[WTBX] P[WTBZ]25%〖WTBZ〗=0+〖SX(〗15〖〗70〖SX)〗(151×
25%-0)=8.09(d)
〖WTBX〗 P[WTBZ]50%〖WTBZ〗=15+〖SX(〗15〖〗54〖SX)〗(〖SX(
〗151〖〗2〖SX)〗 - 70)=16.53(d)
〖WTBX〗P[WTBZ]75%〖WTBZ〗=15+〖SX(〗15[]54[SX)](151×75%
-70)=27.01(d)
〖WTBX〗P95%〖WTBZ〗=45+〖SX(〗15〖〗5〖SX)〗(151×95
%-140)=55.35(d)
结论:1991年该院消化科慢性胃炎患者平均住院时间的中位数为16.53 d,有5
0%的慢
性胃炎患者住院时间在8.09~27.01 d,95%的患者住院时间在55.35 d内。〖HTK〗
2.中位数和百分位数的应用〖HTSS〗
(1)中位数常用于描述偏态分布资料的平均水平或集中趋势。由于中位数不是综
合全部观
察值计算的,所以不受两端特小或特大极端值的影响。在正态分布和对称分布资料中
,中位数和均数在理论上相等。
(2)百分位数是用于描述观察值分布序列在某百分位置的水平。通常用多个百分
位数结合使用,可全面描述总体或样本分布的特征,如例6.3。
(3)百分位数法常用于确定医学正常值(参考值)范围。它是指特定的健康
人群(排除了有关疾病和影响因素对所研究指标的影响)的生理、生化等各种数据的波动范
围
。习惯上正常值范围只包括95%(可用80%,90%,99%等)的人的数据波动范围。
[WTBZ] 可计算双侧正常值范围或单侧范围。例如白细胞数过高或过低均为异常,
如制定95%正
常值范围,应计算〖WTBX〗P[WTBZ]2.5%[WTBX]及P[WTBZ]97.5%两个
百分位数值(即双侧范围),其两值范围内为95%
的正常值范围。再如确定肺活量的95%的正常值范围,因肺活量只以低为不正常,应
计算[WTBX]P[WTBZ]5%百分位数值(即单侧范围),[WTBX]其大于P[WTBZ]5%
百分位数值为正常值范围。[WTBX]
〖AKX-〗和G是利用了一组数据全部信息计算得到的,资料信息利用度较高,在
满足公式条件的前提下,结果较可靠。M是由数据排队的位置决定的,在数据较
少时
, 结果不稳定,数据信息的利用度较低。在资料的分布为正态或对称时,资料的〖AKX-〗
与
M相等。〖WTBZ〗
〖HS2〗〖HT4”K〗〓〓二、变异指标
〖HT5SS〗
平均数只表达了计量资料的变量值平均水平或集中趋势这一特征,但变量值间的相差程度
,即数据间离散大小的特征不能表达。只有把二者结合起来才能
全面地说明一组计量数据的特征。例如,某院3个科室护士的年龄(岁):
甲科室为20, 21, 22, 23, 24;
乙科室为18, 20, 22, 24, 26;
丙科室为16, 19, 22, 25, 28。
用均数来描述上述数据的平均水平时,3组均值(〖WTBX〗〖AKX-〗)都为22岁,
但3组数据的分散程度不尽相同,即数据间参差不齐的程度(离散趋势)是不一样的,在分
析资料时应描述出数据
的离散趋势的大小。统计学中用变异指标来描述一组数据间的离散程度。〖WTBZ〗〖HTH
〗
(一)常用变异指标的定义和计算〖HTK〗
1.极差〓〖HTSS〗亦称全距(Range),用〖WTBX〗R表示。即一组观察值中最大
值与最小值之差, 反映了个体值变异的范围。R愈大,说明数据的离散程度愈大,反之愈小
。如上例资料中
:
甲科室R=24-20=4(岁);
乙科室R=26-18=8(岁);
丙科室R=28-16=12(岁)。〖WTBZ〗
甲科室的全距最小,丙科室最大,说明甲科室护士年龄最集中,丙科室护士年龄
相差较分散,即变异程度最大。
用极差说明变异程度的大小,优点是简单明了。但缺点是:1)计算时只考虑了最大和最小值
,不能全面反映组内其他数据的变异程度;2)易受样本例数的影响,使结果不够稳定。[H
TK]
2.四分位数间距(Quartile)〓[HTSS]简记为〖WTBX〗Q,是资料中用百分位数
法计算的第75
〖WTBZ〗%位的观察值(〖WTBX〗P〖WTBZ〗75%)与资料中第25%位的观察值(〖WT
BX〗P〖WTBZ〗25%)的差值,差值区间包含中间50%的观察值。是常用于表示一组
偏态分布资料的离散程度大小的指标。差值越大,表示变量值变异越大。比如例6.5中
求得〖WTBX〗P〖WTBZ〗75%〖WTBZ〗=27.01 d,〖WTBX〗P〖WTBZ〗25%[WT
BZ]=8.09 d,故四分位数间距为:
[WTBX] Q=P〖WTBZ〗75%-〖WTBX〗P〖WTBZ〗25%=27.01-8.09=
18.92〖WTBZ〗(d)
这个数据可与同级医院的慢性胃炎患者住院天数的四分位数间距对比,如此值较大
,说明该院慢性胃炎患者住院天数波动较大。
用四分位数间距说明个体变异的大小,优点是不受极端值的影响,比极差稳定。
但是未用全部数据的信息,例数较少时应慎用。〖HTK〗
3.标准差(Standard deviation)〓〖HTSS〗标准差是描述一组观察值离散程
度大小最常用的指标。由于一般难以得到研究事物的总体,常用样本标准差来估计总体标准
差(〖WTBX〗σ),样本标准差常用符号S或〖WTBZ〗SD表示,公式为: 〖WTBX〗
〖JZ〗S=[KF(][SX(]〖WTBZ〗Σ〖WTBX〗(X-〖AKX-〗)2[]n-1[SX)][KF)]
〖KH-1*2〗[JY](6.9)〓〓〖HJ1*2〗〖HJ〗
式中[AKX-]为样本均数,X为各观察值,n为样本例数。
(1)不分组资料标准差的计算〓
当观察值个数较少时,用公式(6.10)计算标准差,公式(6.10)是将公式(6.9)经
代数运算演变而来,
计算则更简便。
〖JZ〗S=[KF(] [SX(]〖WTBZ〗Σ〖WTBX〗X2- [SX(](〖WTB
Z〗Σ〖WTBX〗X)2[]n[SX)][]n-1[SX)][KF)]〖KH-1*2〗[JY](6.10)〓〓〖HJ1*2〗〖
HJ〗
〖WTBZ〗
例6.6〓以上例中甲科室5名护士年龄资料为例,计算标准差:
〖HT5”H〗〖JZ〗 〖STHZ〗 表64〓某科室5名护士的年龄(岁)
〖HT5”SS〗〖STBZ〗〖BG(!〗〖BHDFG3,WK22,WK22W〗
〖WTBX〗 年龄(X)〖〗X2
[BHDG1*3/4,WK22DW,WK22DWW〗
〖JZ〗 20 [] 〖JZ〗 400
[BHDW]21 [] 441
[BH]22[] 484
[BH]23 [] 529
[BH]24[] 576
[BHDG2] 110(〖WTBZ〗Σ〖WTBX〗X) [] 2430(〖WTBZ〗Σ〖W
TBX〗X2)〖BG)F〗
〖HT5SS〗 代入公式(6.10)即得:
S=[KF(][SX(]2430-[SX(](110)2[]5[SX)][]5-1[SX)][KF)]=1.58(岁)
结论:甲科室5名护士年龄的标准差为1.58岁,即平均相差1.58岁。
(2)分组资料(频数表资料)标准差的计算〓公式为:
〓〓〓〓〓〓〓〓〓〓〓〓〓〖WTBX〗S=[KF(][SX(]〖WTBZ〗Σ〖WTBX
〗fx2-[SX(](〖WTBZ〗Σ〖WTBX〗fx)2
[]〖WTBZ〗Σ〖WTBX〗f[SX)][]〖WTBZ〗Σ〖WTBX〗f-1[SX)][KF)][JY]
(6.11)〓〓〖WTBZ〗
例6.7〓计算表61频数表资料中145名正常人体温的标准差。计算方法见表6
5。
〖HT5”H〗〖ST5”HZ〗〖WT5”HZ〗〖JZ〗 表65〓某地正常成人腋
下温度(℃)的标准差计算表
〖HT5”SS〗〖ST5”BZ〗〖WT5”BZ〗〖BG(!〗〖BHDFG4,WK9。5W〗
腋温组段(1)〖〗组中值[WTBX]x(2)〖〗频数f(3)[]fx(4)=(3)×(2)[]fx2(5)=
(2)×(4)[WTBZ]
〖BHDG1*2,WK9DW,WK9DW,WK9DW,WK9DW,WK9DWW〗
〖JZ〗35.6~ []〖JZ〗 35.7 []〖JZ〗 1 []〖JZ〗 35.7
[]〖JZ〗 1274.49
[BHDW] 35.8~[] 35.9 [] 4 [] 143.6 [] 515
5.24
[BH] 36.0~ [] 36.1[] 13 [] 469.3 [] 16941.
73
[BH] 36.2~[] 36.3 [] 24 [] 871.2 [] 31624.
56
[BH] 36.4~ [] 36.5 [] 42 [] 1533.0 [] 55954.
50
[BH] 36.6~ [] 36.7 [] 30 [] 1101.0 [] 40406.
70
[BH] 36.8~ [] 36.9 [] 15[] 553.5 [] 20424.
15
[BH] 37.0~ [] 37.1[] 10 [] 371.0[] 13764.
10
[BH] 37.2~ [] 37.3 [] 5 [] 186.5 [] 6956.
45
[BH] 37.4~37.6[] 37.5 [] 1 [] 37.5 [] 1406.
25
[BHDG2] 〖JZ〗 合计 [][] 145 [] 5302.3 []
193908.17 [BG)F]
〖HT5SS〗
由表65,已知〖WTBZ〗Σ〖WTBX〗fx=5302.3,〖WTBZ〗Σ〖WTBX〗f=145, 再
用第(3)栏与第(4)栏相乘后再相加,得〖WTBZ〗Σ〖WTBX〗fx2=
193908.17, 代入式(6.11),得:
S=[KF(][SX(]193908.17-[SX(](5302.3)2[]145[SX)][]145-1[SX)][KF)]=0.3318(℃)
结论:某地正常成人腋下体温的标准差为0.3318〖WTBZ〗℃。〖HTK〗
4.变异系数(Coefficient of variation,CV)〓〖HTSS〗
即同一资料的标准差与均数之比,用百分数来表示。公式为:
〖JZ〗CV=〖WTBX〗〖SX(〗S〖〗[AKX-]〖SX)〗×100%〖KH-1*2〗[JY]
(6.12)〓〓〖HJ1*2〗〖HJ〗〖WTBZ〗
变异系数的意义和标准差一样,其值越大,表示一组变量值间的离散程度越大。CV值也是表
示变量值离散程度的相对变异指标,因它消除了单位的影响,可用于不同指标间的比较。
变异系数的应用:
(1)比较单位不同的组间的变异程度。
例6.8〓某人在冠心病的研究中,测定了一部分人的体脂(%)、血清胆固醇(m
mol/L)的均数和标准差,结果如下,问二者中何者变异更大?
〖HT5”H〗〖JZ〗〖STHZ〗 表66〓体脂与血清胆固醇的变异系数
〖HT5”SS〗〖STBZ〗〖BG(!〗〖BHDFG3,WK11。4W〗
观察指标 〖〗 〖WTBX〗 S 〖〗 [AKX-]〖WTBZ〗 〖〗
CV(%)
〖BHDG1*2,WK11ZQ1,WK11DW,WK11DW,WK11DWW〗
体脂(%) 〖〗〖JZ〗 5.80 〖〗〖JZ〗 18.90 〖〗〖JZ〗
30.69
〖BHDW〗 胆固醇(mmol/L)[] 1.04[] 4.84[] 21.40[BG)F]〖
HT5SS〗
由于体脂和胆固醇两指标的单位不同,其标准差不能直接比较,所以用变异系数
比较变异程度的大小,表中变异系数的计算结果表明,体脂的变异大于胆固醇,说明胆固醇
指标较体脂更稳定。
(2)比较单位相同、但均数相差悬殊的组间变异程度。 如表67中变
异系数结果表明,不同年龄的男童在1~2月时变异最大,随着年龄的增加, 变异逐渐缩小
。
〖HT5”H〗〖STHZ〗〖WTHZ〗〖JZ〗 表67〓某地不同年龄组男童身高(cm)
资料
〖HT5”SS〗〖STBZ〗〖WTBZ〗〖BG(!〗〖BHDFG3,WK11。4W〗
年龄组 〖〗 〖WTBX〗〖AKX-〗〖〗 S〖〗〖WTBZ〗 CV
(%)
〖BHDG1*2,WK11,WK11DW,WK11DW,WK11DWW〗
1~2月 〖〗 〖JZ〗 56.3〖〗〖JZ〗 2.1〖〗〖JZ〗
3.73
〖BHDW〗 5~6月 〖〗 66.5 〖〗 2.2 〖〗 3.31
〖BH〗 3~3.5岁〖〗 96.1 〖〗 3.1 〖〗 3.22
〖BH〗 5~5.5岁 〖〗 107.8 〖〗 3.3 〖〗 3.06〖BG)F
〗〖HT〗〖HT5SS〗
〖HT4”K〗〓〓三、平均指标和变异指标的应用〖HT〗〖HJ1〗〖HJ〗
〖HT5SS〗 (一)根据标准差的大小,可了解某指标(一组同质观察值)的离散程
度, 即观察值围绕均数的分布情况。单位相同的资料,标准差越小,表示观察值分布较集
中、整齐;反
之较分散,参差不齐。
(二)在医学杂志的论文中,往往将均数和标准差同时列出, 用于描述一组资料
的平均水平和离散程度两个特征。在正态分布的大样本资料中,常用〖WTBX〗〖AKX-〗±S
〖WTBZ〗形式,
将算术均数和标准差结合起来,概括地估计资料中变量值频数分布的取值范围。
理论上正态分布变量值的分布曲线如图61,图中〖WTBX〗μ为变量值的总体均
数,σ〖WTBZ〗为变量值的总体标准差。正态分布的变量值在理论上有其分布规律,见表
68。
〖KH+40mm〗
〖HT5”H〗[STHZ]〖JZ〗图61〓正态分布曲线下面积分布图
〖HT5”H〗〖STHZ〗〖JZ〗表68〓正态分布的变量值理论上的分布规律
〖HT5”SS〗〖STBZ〗〖BG(!〗〖BHDFG4,WK15。3W〗
变量值〖WTBX〗(X)分布的范围〖〗简记μ±uσ[]变量值(X)占全部变量值的百分比(
%)
〖BHDG1*2〗
(μ-1σ,μ+1σ)[] μ±σ [] X占了68.27[WTBZ]%[WTBX]
[BHDW] (μ-1.96σ,μ+1.96σ)[]μ±1.96σ[] X占了95.00[WTBZ]%[W
TBX]
[BH] (μ-2.58σ, μ+2.58σ)[]μ±2.58σ [] X占了99.00[WTBZ]% [BG
)F]〖HT〗〖ST〗〖WT〗〓〓
在正态或近似正态分布的大样本中,利用正态分布变量值的分布规律,用样本均数和样
本标准差作为总体均数([WTBX]μ)和总体标准差(σ)的估计值,可概括地估计样本中
变量值的分布情况。例如表61资料的变量值分布如下:
〖HT5”H〗〖STHZ〗〖JZ〗表69〓145例正常人体温值实际分布和理论分
布的比较
〖HT5”SS〗〖STBZ〗〖BG(!〗〖BHDFG4,WK9,WK9,WK18,WK9W〗
估计公式〖〗〖WTBX〗X〖WTBZ〗值的分布范围(℃)〖〗〖ZB(〗〖BHDG2,WK18W〗实际
分布〖BHDG2,WK9,WK9W〗频数〖〗比例(%)〖ZB)〗〖〗理论分布(%)
〖BHDG2,WK9。5W〗〖WTBX〗
[AKX-]±1S 〖〗 36.23~36.90 〖〗 103 〖〗 68.21〖〗
68.27
〖BHDW〗 [AKX-]±1.96S 〖〗 35.92~37.22 〖〗 137〖〗 94.48
〖〗 95.00
〖BH〗 [AKX-]±2.58S〖〗 35.71~37.43 〖〗 144 〖〗 99.31 〖
〗 99.00〖BG)F〗
〖HT5SS〗
(三)根据正态分布变量值的分布规律原理, 对正态或能转换成正态分布的大样
本资料,
确定医学上某指标的正常值范围(又称参考值范围,常用95[WTBZ]%和99%的正常值范
围),用于临床的诊断。估计医学正常值范围的统计方法为:
[HTK]1. 双侧正常值范围公式[HTSS]〖JZ〗
95%的正常值范围: [WTBX]
[AKX-]±1.96S 或([AKX-]-1.96S~ 〖AKX-〗+1.96S)
〖KH-1〗〖JY〗(6.13)〓〓〖JZ〗
[WTBZ]99%的正常值范围: [WTBX]
[AKX-]±2.58S 或([AKX-]-2.58S~ 〖AKX-〗+2.58S)〖KH-1〗〖JY〗(6.14)〓〓
双侧范围是指某测定指标过高或过低于某规定的界值都为不正常时,应确定的双
侧正常值范围。如制定的是95[WTBZ]%(或99%)正常值范围(双侧),即某指标观察值低
于下限和
高于上限值的假阳性比例各占2.5%(或0.5%)。[WTBX]
例6.9〓用表61中的正常人体温资料,计算出[AKX-]=36.57℃,S=0.3318℃
,资料分布为
正态。按[AKX-]±1.96S=36.57±0.3318=35.92~37.22℃,该地正常人体温值的参
考值范围,
即95[WTBZ]%的正常人体温波动范围为35.92~37.22℃。
[HTK]2.单侧正常值范围公式〖HTSS〗
〖JZ〗95%正常值下限: [WTBX]
〖AKX-〗-1.64S〖KH-1〗 〖JY〗(6.15)〓〓〖JZ〗
[WTBZ]95%正常值上限:
〖WTBX〗 〖AKX-〗+1.64S 〖KH-1〗〖JY〗(6.16)〓〓 〖WTBZ〗
单侧范围是指某指标的上限值高于某规定界值时为不正常,下限值为0。 若指标
的下限
值低于某规定的界值时为不正常,无上限值。[WTBZ]
〖HS4〗〖HT3H〗〖JZ〗 第二节〓总体均数的估计
〖HT〗〖HT4”K〗〓〓一、均数的抽样误差和标准误〖HT〗〖HJ1〗〖HJ〗〖HT5H〗
(一)抽样与抽样误差〖HT5SS〗
科学研究中常用抽样研究的方法。抽样研究的目的是用样本的信息推断总体的特
征,称
为统计推断。一般情况,在一个已知的总体内进行多次抽样,样本的均数与总体均数
、样本均数与样本均数常不相同,这种由于抽样产生的样本均数与总体均
数(总体均数是假设由全部对象所得出的结果)的差异称为抽样误差。抽样误差是因为总体
中的
观察对象存在变异和抽样时只观察了总体中部分研究对象而产生的。因此,抽样误差是不可
避免的。
但如果按随机的原则抽样,抽样误差是有一定规律的,其大小可以控制,并可用
统计方法估计。抽样误差的大小,是表示样本均数估计总体均数的可靠性或抽样的有效性
指标。〖HTH〗
(二)均数的抽样误差与标准误〖HTSS〗
在同一总体中随机抽取例数相等的样本,由于存在抽样误差,则各样本均数不尽
相等。
如果抽样的总体为正态分布,则抽样的样本均数的分布(如将许多样本均数列成频数
分布表)
将呈现以总体均数为中心的正态分布。描述样本均数与总体均数的变异的指标,称为
均数的标准差,又称标准误〖WTBX〗(σ[AKX-])。
〖JZ〗σ[AKX-]=[KF(][SX(]〖WTBZ〗Σ〖WTB
X〗(〖AKX-〗-μ)2[]〖WTBZ〗Σ〖WTBX〗f[SX)][KF)]〖KH-1*2〗[JY](6.17)〓〓〖HJ
1*2〗〖HJ〗
从上式不难看出,标准误是描述样本均数与总体均数间离散程度或抽样误差
大小的指标。据数理统计研究证明,标准误与总体标准差σ(即总体内的变异程度)的大小
及样本例数n的
多少有关,其关系如下:
〖JZ〗σ[AKX-]=[SX(]σ[][KF(]n[KF)][SX)]〖KH-1〗[JY](6.18)〓〓〖HJ1*2〗
〖HJ〗
但在实际工作中研究者一般未知总体标准差,只掌握一个样本的标准差,常常只
能计算
标准误的估计值S[AKX-],其计算公式如下:
〖JZ〗S[AKX-]=[SX(]S[][KF(]n[KF)][SX)]〖KH-1〗[JY](6.19)〓〓〖HJ1*2〗
〖HJ〗
例6.10〓表61正常人体温的抽样资料中,n=145,〖AKX-〗=36.57℃,S=0.3
318℃, 计算其标准误。
S[AKX-]=[SX(]0.3318[][KF(]145[KF)][SX)]=0.0276(℃)
标准误越小,说明均数的抽样误差较小,表示在此例数下,该资料的样本均数估
计或代表总体均数的可靠性越大。反之,标准误越大,样本的抽样误差较大,样本均数估计
总体均数的可靠性就低。标准误作为说明样本均数的可靠性指标,在医学论文中常用[AKX-]
±S[AKX-]形式, 用以表示样本均数的可靠程度。另外,标准误常用于估计总体均数
的可信区间和作样本均数间的显著性检验。
〖HS2〗〖HT4”K〗〓〓二、 〖WTBX〗t〖WTBZ〗分布与总体均数可信区间的估
计 〖HT5H〗
(一)〖WTHX〗t分布 〖HT5SS
〗 〖WTBX〗
样本均数与总体均数间的差值除以标准误的估计值,此倍数为t值。
〓〓〓〓〓〓〓〓t=[SX(]〖AKX-〗-μ[]S[AKX-][SX)][JY](6.20)〓〓
如在某个总体中抽若干个例数相等的样本,可以计算出这些样本的均数及样本均数的
标准误,按公式(6.20)计算,
即可得到许多大小不等的 t 值, 并可作类似直方图; 由这些t值组成的分布为 t
分布,如图62。t分布是在总体中随机抽样,抽样例数为n时, 各样本均
数转换成t值的标准化分布,反映了样本均数的抽样误差的波动范围和样本均数的取
值在一定范围内出现的概率。t分布是医学研究中最常用的分布。t分布曲线有以下特点:
1. 以t=0为中心,两侧的t值(样本均数)呈对称性减少。t 的绝对值越大,t
值外侧对应曲线下的面积(即概率)越小。t分布曲线下与横轴间的全部面积(概率)为1或
100〖WTBZ〗%。〖WTBX〗
〖KH+55mm〗
〖HT5”H〗〖STHZ〗〖WTHZ〗〖JZ〗图62〓自由度分别为1,5,和∞的t分布图
〖HT5SS〗〖STBZ〗〖WTBX〗〓〓
2. t分布曲线是一簇与抽样例数大小有关的曲线簇。当抽样例数(n)越小时,
抽
样误差越大,曲线的峰越低平,两侧尾部的面积越大。当抽样例数n→∞时,t分布曲线形状
趋向正态分布,当n=∞时,t分布就为标准正态分布。
3. t值与曲线下面积(即t值出现的概率 P)的关系,可在附表2的t界值表中查
到, 记为tα,ν,其中α表示在t分布曲线横轴上某一t界值对应曲线外侧的概率,ν
为自由
度,ν=n-1。
由于t值以0为中心对称分布,故表中只列出正的t值。
如:由附表2中查出单侧t0.05,20=1.725,表示在正态总体中做n=21的许
多个随机抽样,其样本均数转换的t值服从ν=21-1=20的t分布。理论上,t0.05,20
=1.725的界值
含义为:在t分布中,抽到t≥1.725的t值的概率(P)=0.05,或抽到t≤-1.725的t值的概
率(P)
=0.05。
表示为: P(t≤-1.725)=0.05, 或P(t≥1.725)=0.05。
一般表示方法为:
单侧概率: P(t≤-tα,ν)=α,或P(t≥tα,ν)=α
双侧概率: P(t≤-tα,ν)+P(t≥tα,ν)=α
〖HTH〗
(二)总体均数的可信区间估计〖HTSS〗
用样本指标估计总体的参数是抽样研究的主要目的之一,统计中对总体均数估计
方法常
用可信区间方法来估计。总体均数的可信区间是指按一定的概率估计总体均数所在范
围。〖HTK〗
1.可信区间估计的方法〓〖HTSS〗
根据t分布的原理(均数的抽样误差波动范围),用式(6.5)和(6.6) 对总体均数
作区间估计。从t分布的讨论中可知,同正态分布一样,在t分布中理论上有95〖WTBZ〗%〖
WTBX〗的t值分布在
下式中,
其可信的概率(P)为95〖WTBZ〗%,即:〖WTBX〗
P(-t0.05,ν< t <t0.05,ν)=1-0.05=0.95,该式也可写成:
P(-t0.05,ν<[SX(]〖AKX-〗-μ[]S[AKX-][SX)]<t0.0
5,ν)=0.95,
将该式移项后为:
P(〖AKX-〗-t0.05,ν·S[AKX-]<μ<〖AKX-〗+t0.05,ν
·S[AKX-])=0.95
总体均数落在上述范围的概率为95〖WTBZ〗%。习惯上用95%或99%的
可信区间估计总体均数,
即:〖JZ〗
95%〖WTBX〗的可信区间缩写为 〖AKX-〗±t0.05,ν·S[AKX-
]〖KH-1〗[JY](6.21)〓〓〖JZ〗
99〖WTBZ〗%的可信区间缩写为〖WTBX〗 [AKX-]±t0.01,ν·S
[AKX-]〖KH-1〗[JY](6.22)〓〓
例6.11〓某地抽样调查100例健康女性的血红蛋白量,得[AKX-]=117.6 [WTBZ]g/L
,[WTBX]S[WTBZ]=10.2 g/L,
根据本资料对该地健康女性的血红蛋白的平均水平作出估计。
本例[WTBX]n=100,ν=100-1=99,α=0.05(双侧),查附表2,t0.05
,99=1.984, [WTBZ]
按式(6.21):
(117.6-1.984×[SX(]10.2[][KF(]100[KF)][SX)],117.6+1.984×[SX(]10.2[][KF(]100[KF)
][SX)])=(115.5,119.6)
该地女性健康人群的血红蛋白总体均数95%的可信区间为115.5~119.6 g/L
。
〖HTK〗2. 可信区间(Confidence interval, CI)的含义〓〖HTSS〗从总体中作随机
抽样,每个样本均数都可以计算可信区间。如95%的可信区间,意味着作100次抽样,平均
有95 次的可信区间包括了总体均数(估计正确),5个可信区间不包括总体均数(估计不正
确), 即
估计正确的可能性为95%,这种估计犯错误的风险为5%。〖HTK〗
3. 可信区间的两个要素〓〖HTSS〗一是区间的精确度,即区间范围越窄越好
;二是区间的可信
度,概率越大越准确,但二者是矛盾的。不能认为99%的可信区间就比95%可信区间
好,要在兼顾精度和准确度的前提下,适当增加例数,缩小标准误,故实际工作中常用95
%的可信区间。
〖HS4〗〖HT3H〗〖JZ〗 第三节〓计量资料的显著性检验
〖HT〗〖HT4”K〗〓〓一、〖WTBX〗t检验和u检验〖HJ1〗〖HJ〗
〖HT5H〗
(一)假设检验的概念及一般步骤〖HT5SS〗
假设检验〖WTBZ〗(Hypothesis test)亦称显著性检验(Significance test)
。在科学
研究中,研究者常常面临着要对某种不肯定事物作出决策,例如研究某种新药是否比常规药
的疗效高,
如何作出决策呢?统计中采用假设检验的方法。假设检验的基本思路是:对有关的研
究建立某种假设,通过实际观察或实验得到一批数据,即收集验证假设的事实材料,然后用
统计方法检验假设,最后根据检验统计量的概率〖WTBX〗(P )值大小选择拒绝或不拒绝假
设而作出
某种决策。以上的整个过程叫假设检验。故假设检验的基本模式是:假设—检验—选择。假
设检验的思想是以“小概率事件不可能发生”理论为依据的。
下面通过例子说明假设检验的步骤。〖WTBZ〗
例6.12〓经大量调查,已知健康成年男子脉搏的均数为72次/min,某医生在一山区
随机调查了
25名健康成年男性,得平均脉搏数为74次/min,标准差为6.0次/min, 能否据此认为
山区成年男性的脉搏数高于一般成年男子的脉搏数?
由上节内容可知,这里的两个均数不等有两种可能:1)由于抽样误差所致;2)
由于环境的影响,山区的健康男性的脉搏数确实高于一般地区。如何判断是哪种可能性较大
呢?用假设检验的方法来判别。下面是假设检验的一般步骤。〖HTK〗
1.建立检验假设〓〖HTSS〗〖WTBZ〗
建立检验的假设,又叫无效假设,用符号H0表示,即H0:〖WTBX〗μ1=μ
0=72次/〖WTBZ〗min, 假设两总体(〖WTBX〗μ1为山区健康男性的平均脉搏数,μ
0为一般地区健康男子的脉搏数)的总体均数相等,〖AKX-〗≠μ是抽样误差造成的
。再
建立备择假设,用符号〖WTBZ〗H1表示,即H1:〖WTBX〗μ1≠μ0(双侧检验),
其含义为两总体均数不等,即山区健康男性脉搏数与一般地区健康男性脉搏数不同;或〖WT
BZ〗H1:〖WTBX〗μ1>μ0,或μ1<μ0
(单侧检验),即山区健康男性的脉搏数大于或小于一般地区健康男性的脉搏数作为
〖WTBZ〗H0不成立时的备择选择。选用单侧检验或双侧检验一般根据专业知识和检验要求
而定,一般情况下常用双侧检验。〖HTK〗〖WTBX〗
2.确定检验的水准亦称显著性水准〖WTBX〗(α)〓〖HTSS〗常用α=0.05或α=
0.01 。〖HTK〗
3.确定并计算检验的统计量〓〖HTSS〗即根据资料性质、设计及例数的多少, 选
用适当的检验统
计量。〖HTK〗
4.确定统计量的概率(P)〓〖HTSS〗用计算的统计量(例如t值)与确定的显著水准
临界值(tα,ν)作比较, 根
据P值的大小作出统计结论。
〖HT5”H〗〖STHZ〗〖WTHX〗〖JZ〗表610〓t值、P值与差别意义及结论的
关系〖HT5”SS〗〖STBZ〗〖WTBX〗〖BG(!〗〖BHDFG3,WK11。4W〗
t值与t界值 〖〗 P值 〖〗 差别的意义 〖〗
〖WTBZ〗H0〖BHDG1*2〗〖WTBX〗
t<t0.05,ν[] P>0.05 [] 差别无显著性 [] 不拒
绝
〖BHDW〗 t≥t0.05,ν[] P≤0.05[] 差别有显著性〖
〗 拒绝
〖BH〗 t≥t0.01,ν[] P≤0.01[] 差别有显著性〖
〗 拒绝〖BG)F〗〖HT5K〗
5.作出结论〓〖HT5SS〗
按检验水准α=0.05的规定,如P>0.05,〖WTBZ〗认为H0假设成立的可能性较
大,概率大于5%,
不拒绝H0,因此,认为差别是抽样误差所造成的可能性较大。反之,如〖WTBX〗P
≤0.05,〖WTBZ〗
认为H0假设成立的可能性不大(概率等于或小于5%),因此拒绝H0,接受H1, 认为差
别不
仅是用抽样误差来解释,还可能是来自不同的总体或是某因素的作用。作出这样结论的理由
是:认
为在H0
假设成立的条件下,出现了〖WTBX〗P<α的小概率事件,这在一次抽样中是不大可能
发生
的,现竟然发生了,因此拒绝〖WTBZ〗H0,接受H1,此时认为两总体均数不等的可能性
较大。〖WTBX〗
上面所述的基本步骤,不仅在t检验中适用,在其他统计检验中也适用。〖HTH
〗
(二)〖WTHX〗t检验〖HT5SS〗〖WTBX〗
t检验是利用t分布的原理,检验两个样本的均数的差别有无显著性的检验方法。
根据收
集的资料和设计的不同,t检验有以下几种情况。〖HTK〗
1.样本均数与总体均数比较的t检验〓〖HTSS〗
样本均数与已知的总体均数(可为标准值或经大量观察后所得的稳定值)比较,
其目的是通过比较,推断样本所代表的总体均数μ与已知的总体均数μ0是否有差别。
检验的统计量t值按式(6.20)计算。
例6.12的资料,进行t检验的步骤如下:
(1)建立检验假设〖WTBZ〗
H0:〖WTBX〗μ=μ0=〖WTBZ〗72次/min,即〖AKX-〗≠μ是抽样误
差所造成〖WTBZ〗
H1:〖WTBX〗μ>72次/〖WTBZ〗min(μ0) 〖WTBX〗
(2)确定检验水准 α=0.05(单侧检验)
(3)计算检验的统计量〓
已知n=25,〖AKX-〗=74.2次〖WTBZ〗/min,〖WTBX〗S〖WTBZ〗=6次/min,〖
WTBX〗μ0=72次〖WTBZ〗/min,代入下式:〖WTBX〗
t=[SX(][AKX-]-μ0[]S/[KF(]n[KF)][SX)]=[SX(]74.2-72[]6/[KF(]25[KF)][SX)
]=1.833
〖WTBX〗 (4)确定统计量t值的概率〓
本例ν=n-1=25-1=24,计算的统计量t=1.833,查t界值表(附表2)得
t0
.05,24=1.711(单侧界值),本例t=1.833>t0.05,24, 故P<0.05
。
(5)结论〓按α=0.05水准,P<0.05,拒绝〖WTBZ〗H0,接受H1,差别有显
著性(即有统计学的意义),认为山区健康成年男性脉搏数高于一般地区健康成年男性的脉
搏数。〖HTK〗
2. 成对数据(配对设计)比较的〖WTBX〗t检验〓〖HTSS〗
成对数据是指比较的两个样本中的每一对观察值间存在某种关系而成为对子。在
护理科研中常见的有以下两种情况:
(1)同体比较(自身对照比较)〓
在护理研究中,常常比较某种处理(方法)对同一批患者治疗前后的某些生理、
生化指标(如血压、心率等)的测量值,或比较同一患者的两个部位的观察结果、同一标本
分成两份(一个用某种处理,另一个为对照)后测量值的差别,以观察疗效等。
(2)配对实验的比较〓
用相同条件(对象为患者时,为相同年龄、性别、病情等;对象为动物时,为相
同体重、
窝别、性别等)的对象配成若干对子,随机将每对实验对象分到实验组和对照组,对
比各实验结果。
对上述两种设计的数据的比较,都称为成对数据(或称配对设计的资料
)的比较,均用每对
观察值的差值(d)作t检验,公式如下:
〖JZ〗t=[SX(][AKd-]-μd[]S[AKd-][SX)]
〖KH-1*2〗[JY](6.23)〓〓〖HJ1*2〗〖HJ〗
式中〖AKd-〗为差值的均数,S[AKd-]为差值均数的标准误,自由度
ν=对子数-1。
例6.13〓应用放松训练法对10名腹部手术患者给予术前指导和训练, 观察手术前
后收缩压的血压值如表611,问放松训练对术后收缩压值有无影响?
〖HT5”H〗〖STHZ〗〖JZ〗表611〓经术前放松训练患者腹部手术前后的收缩压值〖WTBZ
〗(kPa)
〖HT5”SS〗〖STBZ〗〖BG(!〗〖BHDFG2,WK11。4W〗
〖WTBX〗 患者号 〖〗 术前 〖〗 术后 〖〗 差值(d)
〖BHDG1*3,WK11DW,WK11,WK11,WK11DWW〗
〖JZ〗1 〖〗 17.2 〖〗 16.8 〖〗 〖JZ〗 0.4
〖BHDW〗 2 〖〗 16.5〖〗 15.5 〖〗 1.0
〖BH〗 3 〖〗 16.8 〖〗 16.5 〖〗 0.3
〖BH〗 4 〖〗 17.2 〖〗 16.5 〖〗 0.7
〖BH〗 5 〖〗 14.5 〖〗 14.0 〖〗 0.5
〖BH〗 6 〖〗 13.8 〖〗 14.6 〖〗 -0.8
〖BH〗 7 〖〗 18.1 〖〗 16.7 〖〗 1.4
〖BH〗 8 〖〗 15.5 〖〗 15.9 〖〗 -0.4
〖BH〗 9 〖〗 18.5 〖〗 17.5 〖〗 1.0
〖BH〗 10 〖〗 14.8 〖〗 14.0 〖〗 0.8
〖BHDG2〗 〖JZ〗 合计 〖〗〖〗〖〗 4.9 〖
BG)F〗
〖HT5SS〗〖WTBX〗此例为成对数据(配对设计)的比较,先计算出每对观察值的差值(d)
。t 检验步骤如下:
(1)建立假设〖WTBZ〗
H0:〖WTBX〗μd=0,即某处理对血压变化无作用,差值的差别是抽样误
差所造成的〖WTBZ〗
H1:〖WTBX〗μd≠0 ,即某种处理有作用,差值的均数不为零
(2)α=0.05(双侧检验)
(3)按公式(6.23)计算检验的统计量〖HT5SS〗
〖WTBX〗
〓〓样本差值的均数:〖AKd-〗=〖SX(〗〖WTBZ〗Σ〖WTBX〗d[]n[SX)]=[SX(]4.9
[]10[SX)]=0.49
差值的标准差:Sd=[KF(][SX(]〖WTBZ〗Σ〖WTBX〗d2-(〖WTBZ〗Σ〖WTBX〗d)2/n[]
n-1[SX)][KF)]=[KF(][SX(]6.39-(4.9)2/10[]10-1[SX)][KF)]=0.6657
差值的标准误:S[AKd-]=[SX(]Sd[][KF(]n[KF)][SX)]=[SX(]0.6657[][K
F(]10[KF)][SX)]=0.2105
t=[SX(][AKd-]-0[]S[AKd-][SX)]=[SX(]0.49[]0.2105[SX)]=2.327
(4)确定统计量t值的概率
本例自由度(ν)=对子数-1=10-1=9,
查附表2,t0.05,9=2.262,本例|t|=2.327>2.262,P<0.05。
(5)结论〓在α=0.05的水准上,P<0.05,拒绝〖WTBZ〗H0,〖WTBX〗差别有显
著性,认为放松训练法对降低腹部手术患者术后的血压值有作用。
〖HTK〗
3. 两样本均数比较的t检验〓〖HTSS〗
在护理科研中,常常比较资料是成组(不配对)的资料, 即比较不同年龄段的
某个指标如血压、体温是否不同; 比较不同方法对同一种疾病患者的治疗和护理的效果有无
不同等。
有时很难找到多个病情、年龄、性别等条件相同的人配成对子,只能用成组设计的比
较。如是成组设计比较的资料,先计算出各组的均数和标准差,然后再进行两样本均数的t
检验,其公式为:
〖JZ〗t=[SX(][AKX-]1-[AKX-]2[]S[AKX-]1-[AKX-]2[SX)]
〖KH-1*2〗[JY](6.24)〓〓〖HJ1*2〗〖HJ〗
例6.14〓某医院根据康复医学训练的原理,对12 名先天性心脏病患儿进行术前
1周的康复训练,另10名未训练的先天性心脏病患儿作对照,观察两组术后撤呼吸机的时间[
WTBZ](h)
如下表,问康复训练对先心病患儿的术后恢复有无作用?
〖HT5”H〗〖STHZ〗〖JZ〗表612〓两组患儿术后撤呼吸机的时间(h)
〖HT5”SS〗〖STBZ〗〖BG(!〗〖BHDFG4,WK22,WK1,WK22W〗
[ZB(]〖BHDG2,WK22W〗康复训练组〖BHDG2,WK11,WK11W〗[WTBX]X1[]X12[ZB)]
[][][ZB(][BHDG2,WK22W]对照组〖BHDG2,WK11,WK11W〗X2[]X22[ZB)]
[BHDG1*3,WK11DW,WK11DW,WK1,WK11DW,WK11DWW]
〖JZ〗 8.1 [] 〖JZ〗 65.61 [][] 〖JZ〗 10.5 []
〖JZ〗110.25
[BHDW] 6.6 [] 43.56 [][] 12.6 [] 158.76
[BH] 5.5 [] 30.25 [][] 14.2 [] 201.64
[BH] 7.6 [] 57.76[][] 15.0 [] 225.00
[BH] 9.2 [] 84.64[][] 17.4 [] 302.76
[BH] 10.3[] 106.09[][] 19.0 [] 361.00
[BH] 8.8 [] 77.44 [][] 10.2 [] 104.04
[BH] 7.5 [] 56.25 [][] 9.8 [] 96.04
[BH] 11.2[] 125.44 [][] 14.8 [] 219.04
[BH] 9.5[] 90.25[][] 13.7 [] 187.69
[BH] 9.0 [] 81.00
[BH] 7.9 [] 62.41
[BHDG2] 102.12 [] 880.7[][] 137.2[] 1966.2[BG)F]
〖HT5SS〗 检验步骤如下:〖WTBZ〗
(1)建立检验假设
H0:〖WTBX〗μ1=μ2 ,即康复训练对术后恢复无作用,两组的总体均
数相同
〖WTBZ〗 H1:〖WTBX〗μ1≠μ2 ,即两总体均数不等
(2)α=0.05
(3)计算检验统计量〓本例: [AKX-]1=8.43 [WTBZ]h, [WTBX] [AKX-]
2=13.72 [WTBZ]h。
先按公式(6.25)计算合并方差([WTBX]S[WTBZ]c2):
〓〓〓〓〓〓〓[WTBX]S[WTBZ]2c=[SX(][WTBZ]Σ[WTBX][WTBX]X12-([WTBZ]Σ[WTB
X]X1)2/n
1+[WTBZ]Σ[WTBX]X22-([WTBZ]Σ[WTBX]X2)2/n2[]n1+n2-2[SX)][JY](6.25)
〓〓
S2c=[SX(]880.7-[SX(](102.1)2[]12[SX)]+1966.2-[SX(](137.2)2
[]10[SX)][]12+10-2[SX)]=4.79
再按下式求出两均数相差的标准误(S[AKX-]1-[AKX-]2):
〖JZ〗S[AKX-]1-[AKX-]2=[KF(]S〖WTBZ〗c2〖WTBX〗([SX(]1[]
n1[SX)]+[SX(]1[]n2[SX)])[KF)]
〖KH-1*2〗[JY](6.26)〓〓〖HJ1*2〗〖HJ〗
S[AKX-]1-[AKX-]2=[KF(]4.79×([SX(]1[]12[SX)]+[SX(]1[]10[SX)])[KF)]=2.0
5
t=[SX(][AKX-]1-[AKX-]2[]S[AKX-]1-[AKX-]2[SX)]=[SX(]8.43-13.72[]2.0
5[SX)]=2.58
(4)确定统计量t的概率〓
自由度ν=n1+n2-2, 本例ν=12+10-2=20。
查附表2,得t0.05,20=2.086,本例|t|=2.58>2.086, P<0.05,拒绝[
WTBZ]H0。
[WTBX] (5)结论〓在α=0.05水准,P<0.05,拒绝[WTBZ]H0,差别有显著性,可
认为术前的康复训练对术后的恢复时间有作用。
〖HTH〗
(三)两大样本均数比较的〖WTHX〗u检验〖HTSS〗〖WTBX〗
当抽样例数较大时(n1+n2≥100),t分布接近正态分布,两组(成组设计)大样
本均数的比较可用u检验,u 值服从标准正态分布。
u检验的公式:〖JZ〗
u=[SX(][AKX-]1-[AKX-]2[][KF(][SX(]S21[]n1[SX)]+[SX(]S22[]n2[SX)]
[KF)][SX)]
〖KH-2〗〖HS2〗〖JY〗(6.27)〓〓
例6.15〓有人研究出生后新生儿体温与婴儿的体温是否不同,观察了88例正常
新生儿和100例1月至不满周岁的婴儿体温,其中新生儿组体温的[AKX-]=37.17℃,S=0.39
℃;婴儿组体温的[AKX-]=36.80℃,S=0.56℃,问两组的体温值是否有统计学差别?[WTB
Z]
(1)建立检验假设
H0:[WTBX]μ1=μ2, 即两组的总体平均体温相同,差别是抽样误差造成[WTBZ]
H1:[WTBX]μ1≠μ2,即两组总体平均体温不同
(2)α=0.05
(3)计算检验的u值
u=[SX(]37.17-36.80[][KF(][SX(]0.392[]88[SX)]+[SX(]0.562[]100[SX)][KF)][SX)]=
[SX(]0.37[]0.069[SX)]=5.36
(4)确定统计量u值的概率〓u0.05=1.96和u0.01=2.58是标准正态分布α=0.
05和α=0.01的界值,当计算的|u|≥1.96或2.58时,P≤0.05或0.01,拒绝H0。本例u
=5.36>u0.05,并且u=5.36>2.58, P<0.01。
(5)结论〓在α〖WTBZ〗=0.05水准上,〖WTBX〗P〖WTBZ〗<0.01,拒绝H0,〖WTBZ〗差
别有显著性,认为新生儿体温要高于婴儿体温。〖HTH〗
(四)〖WTHX〗t检验和u检验应用时的注意事项〖HTK〗
〖WTBX〗1.选用t检验和u检验的公式时应符合其应用的条件〓〖HTSS〗设计不同,
样本例数大小不同,选用的检验公式也不同。如为配对设计的资料,选用了成组比较的t检
验, 不但会使配
对的信息浪费,而且还可能得出错误的结论。在例数少(两组例数小于100)时,不能用u检
验的
公式代替小样本的t检验。〖HTK〗
2.正确理解统计结论中的“差别有显著性或不显著”的含义〓〖HTSS〗显著或不显
著是统计学上的术
语,并不表示两均数的差别在专业上的相差程度的大小。所以,不能以概率P<0.01或
P<0.001,就认为比较组的均数在专业上的差别很显著。〖HTK〗
3.结论不能绝对化〓〖HTSS〗检验中是否拒绝〖WTBZ〗H0[WTBX]假设, 与抽样
误差的大小(涉及个体的变异和抽样例数的多少)及检验水准(α)的大小有关。如比较组
的例数太少时,统计检
验可能会得到P>0.05的结论,此时下结论要慎重。如设检验水准α=0.05时和设检验水准α
=0.01时,同一资料的结论可能就会不同,因此结论中比较组有无差别的结论不能绝对化。
检验水准的大小是根据分析的要求而定的,统计结论中一定要报告显著的水准和确切的P值
(例如P
=0.001,或P<0.05),使读者有清楚的认识。〖HTK〗
4.资料应符合进行t检验和u检验的条件〓〖HTSS〗要求假定比较资料的总体是来
自正态或近似正态的分布,而且成组比较
的t检验要求比较组数据的总体方差相等,即σ21=σ22,如不满足此条件
,t检验可能得出错误的结论。因此,在进行t检验,特别是在做成组比较的小样本的t检验
时,应先做
组间的方差齐性检验,
如组间方差是齐性的,可用t检验,否则应采用秩和检验,或对变量值做变量转换
, 达到方差齐性后再用t检验处理。
〖HTH〗(五)方差齐性检验的方法和步骤〖HTK〗1.建立假设和确定检验水准〖HTSS〗〖
WTBZ〗H0:〖WTBX〗σ21=σ22,即两组对应的总体方差相等〖WTBZ〗
H1:〖WTBX〗σ21≠σ22,即两组对应的总体方差不等
α=0.05
〖HTK〗2.计算F统计量〖HTSS〗 〖JZ〗
F=[SX(]S21[]S22[SX)]〓(ν1=n1-1,ν2=n2-1)
〖KH-1*2〗〖JY〗(6.28)〓〓[HJ1*2][HJ]
S21为比较组中较大的方差,S22为较小方差,如F<F0.05,(ν1
,ν2),则P>0.05, 认为两组的总体方差相等;反之两组总体方差不等,不能用t检验
。
例6.16〓有人用大鼠比较两组饲料对坏死性心肌炎的损害, 测定了两组大
鼠心肌坏死〖WTBX〗
的小格数。甲组例数为29,得〖AKX-〗1=3.61格,S1=7.26格;乙组例数为
28,得[AKX-]2=1.06格
,S2=2.56格。观察到两组样本的标准差相差较大, 问两组心肌坏死小格数
的总体方差是否相等?
检验步骤如下:[WTBZ]
H0:〖WTBX〗σ21=σ22, 即两组指标对应的总体方差相等〖WTB
Z〗
H1:〖WTBX〗σ21≠σ22, 即两组指标对应的总体方差不等
α=0.05
F=[SX(]7.262[]2.562[SX)]=[SX(]52.71[]6.55[SX)]=8.04
ν1=n1-1=29-1=28, ν2=n2-1=28-1=27
查附表3的F界值表(方差齐性检验用表),F0.05,(28,27)=2.25,本例计算F
=8.04>2.25。
P<0.05,按α=0.05水准,拒绝〖WTBZ〗H0,接受H1,〖WTBX〗故认为两总体
的方差不齐。本例不满足t检验的条件,可改用秩和检验方法。
〖HS2〗〖HT4”K〗〓〓二、方差分析
〖HT5H〗(一)方差分析的用途和基本思想
〖HT5SS〗上节中讨论了两个样本均数间有无差别的比较用t检验和u检验,对多个样本均〖W
TBZ〗数间有无差别比较的假设检验方法用方差分析(Analysis of variance,简写为ANOV)。
方差分析的基本思想是将全部观察值的变异——总变异分解为组间变异和组内变异,通过比
较组间变异和组内变异的比值来决定处理因素是否有作用的统计方法。
可用表613的例子说明。从表613某药在不同注射部位的吸收率结
果可见到数据的差别有3种不同的变异:
〖HTK〗1.组内变异〓〖HTSS〗3个组每组内部的数据〖WTBX〗Xij(即第i组的
第j个观察值)不
同,这种变异称为组内变异。它反映了各组观察对象(Xij)在相同处理下,
同一部位
吸收率的随机误差(其原因是个体差异和随机因素所造成)。其变异的大小可用各组内每个观
察值(Xij)与该组均数〖AKX-〗i[WTBZ]的离均差平方和来表示,即SS组内
。
SS组内=[WTBZ]Σ[DD(]〓〖WTBX〗〖〗i[DD)]〖WTBZ〗Σ〖WTBX〗[DD(]〓[]j[DD)](
Xij-〖AKX-〗i)2[WTBZ]
SS组内的大小与各组例数([WTBX]n)多少有关,故用[WTBZ]SS组内[WTBX]/(N
-k)
,称为组内方差,[WTBZ]记为MS组内。[WTBX]N-k为组内自由度,即ν组内
=N-k,N=[WTBZ]Σ[WTBX]n,k为比较的组数。
〖HTK〗2.组间变异〓〖HTSS〗3个部位组的各样本均数〖AKX-〗i(i=1,2,3,…,k=组数)
大
小也不相等,这种差别称为组间变异,它反映了不同的注射部位对吸收率的影响作用(如果
确实有差别)和随机误差。其大小可用各组均数〖AKX-〗i与全部数据的总平均数〖AKX-〗
[WTBZ]的离均差平方和来表示,即SS组间。
SS组间[WTBX]=[WTBZ]Σ〖DD(〗〓〖〗i〖DD)〗[WTBX]([AKX-]i-[AKX-])2
显然, [WTBZ]SS组间[WTBX]的大小与组数(k)的多少有关, 故用[WTBZ]SS组间
[WTBX]/(k-1), 称为组间方差, 可记为[WTBZ]MS组间, [WTBX]k-1为组间自由度
, 即ν组间=k-1。
〖HTK〗3.总变异〓〖HT5SS〗全部数据的不同,这种变异称为总变异。其大小可用每个观察
值Xij与全部数据的总平均〖AKX-〗的离均差平方和来表示,即[WTBZ]SS总。
SS总=Σ[WTBX][DD(]〓[]i[DD)][WTBZ]Σ[WTBX][DD(]〓[]j[DD)](Xij-[AKX-])2
总变异的大小与总例数(N)有关,故用[WTBZ]SS总/[WTBX](N-1),称为总方差。N-1为总自
由度,记为ν总=N-1。
3种变异的关系为:[WTBZ]SS总=SS组间+SS组内
3种变异的自由度为:[WTBX]ν总=ν组间+ν组内
假设不同的部位对该药的吸收率相同(即无作用),则理论上组间变异应等于组内变异,计算
两者的比值(F)应为1。
F[WTBZ]=[SX(]MS组间〖〗MS组内〖SX)〗[WTBX]
但由于抽样误差的关系,F值一般不为1,接近于1。反之,如果不同的处理因素有作用,则
组间变异就会变大,F值也增大。当F值超过规定的检验水准(Fα,ν),P<α,此时,
认为比较的几组均数间差别有显著性,即不同的处理是有作用的。
此处介绍成组设计和配伍设计的方差分析,其条件是:各样本来自正态总体和各比较组的总
体方差相同,即各样本的变异大致相同。
〖HTH〗(二)成组设计的多样本均数比较
〖HT5SS〗成组设计的多个样本比较又称单因素方差分析。该分析比较的是一个研究因素的
不同水平的均数有无显著性。如实验研究的完全随机分组设计(例6.17为一个研究因素——
注射部位的3个水平)和观察性研究中观察某因素的不同组均数的比较(如不同年龄段人群的
舒张压均数的比较)。
〖HTK〗1.成组设计方差分析的变异分解及计算
〖HTSS〗例6.17〓某药物常在3种部位注射,有人将15个研究对象随机分为3组,在不同部位
注射该药后,其吸收率记录如下表,问不同部位对药物的吸收率是否相同?
〖HT5”H〗〖JZ〗〖WTHZ〗〖STHZ〗表613〓某药在不同部位注射后吸收率(%)的比较
〖HT5”SS〗〖STBZ〗〖WTBZ〗〖BG(!〗〖BHDFG4,WK9,WK27,WK9W〗
〖〗〖ZB(〗〖BHDG2,WK27W〗不同注射部位〖BHDG2,WK9。3W〗部位甲〖〗部位乙〖〗部
位丙〖ZB)〗〖〗
〖BHDG1*2,WK9,WK9DW,WK9DW,WK9DW,WK9DWW〗
〖〗[JZ]88.1[][JZ]70.1[][JZ]83.4
[BHDW][]92.5[]50.2[]77.6
[BH]Xij[]79.3[]78.1[]80.5
[BH][]95.4[]65.3[]90.3
[BH][]83.4[]59.6[]85.2〖WTBX〗
[BHD][AKX-]i[]87.74[]64.66[]83.40[]〖JZ〗78.60([AKX-])
[BHDW]ni[]5[]5[]5[]15(N)
[BHDWG2*2][WTBZ]Σ[WTBX][DD(]〓[]j[DD)]Xij[]438.7[]323.3[]417.0[]1179([WTB
Z]Σ[WTBX]X)
〖BHDWG2*2〗[WTBZ]Σ[WTBX]〖DD(〗〓〖〗j[DD)]Xij2[]38663.07[]21349.91[]
34870.70[]94883.68([WTBZ]Σ[WTBX]X2)〖BG)F〗
〖HT5SS〗例6.17是单因素的完全随机分组设计,其总变异可分解为组间变异和组内变异。
〖HTK〗2.计算公式及步骤〖HT5SS〗
(1)建立假设和检验水准[WTBZ]
〖HTSS〗H0:[WTBX]μ1=μ2=μ3,不同部位吸收率的总体均数相等,即各处理水平
无作用
〖WTBZ〗H1:不同部位吸收率的总体均数不等或不全等,处理有作用〖WTBX〗
α=0.05
(2)计算各方差统计量和F值〓先计算出表613中的下半部分,再用表614中公式计算
则更为简便。
本例〖WTBZ〗C=(Σ〖WTBX〗X)2/N=11702/15=92669.4[WTBZ]
SS总=[WTBZ]Σ〖WTBX〗X2-〖WTBZ〗C=94883.68-92669.4=2214.28[WTBZ]
SS组间=[WTBZ]Σ[SX(](Σ〖WTBX〗X)2[]n[SX)]-〖WTBZ〗C=[SX(](438.7)2[]5[
SX)]+[SX(](323.3)2[]5[SX)]+[SX(](417.0)2[]5[SX)]-92669.4=1504.52〖WTBX〗
ν组间=k-1=3-1=2[WTBZ]
SS组内=SS总-SS组间=2214.28-1504.52=709.76
[WTBX]ν组内=N-k=15-3=12[WTBZ]
MS组间=SS组间/ν组间=1504.52/2=752.26
MS组内=SS组内/ν组内=709.76/12=59.15
〖HT5”H〗[STHZ]〖JZ〗表614〓成组设计的方差分析计算公式
〖HT5”SS〗[STBZ]〖BG(!〗〖BHDFG3,WK9。5W〗
变异来源〖〗离均差平方和(SS)〖〗自由度(ν)〖〗均方(MS)〖〗[WTBX]F值
〖BHDG2〗
总〖〗〖WTBZ〗Σ〖WTBX〗X2-〖WTBZ〗C〖WTBX〗[]N-1[][]
[BHDW]组间〖〗〖WTBZ〗Σ[DD(]〓〖〗i[DD)]〖SX(〗(〖WTBZ〗Σ〖WTBX〗〖WTBX〗X
)2[]ni[SX)]-〖WTBZ〗C〖WTBX〗[]k-
1[][WTBZ]SS组间/ν组间〖〗[WTBZ]〖SX(〗MS组间〖〗MS组内
〖SX)〗
〖BH〗组内〖〗SS总-SS组间〖〗[WTBX]N-k[][WTBZ]SS组内/ν组
内〖BG)F〗
〓〓注:C=[WTBX][SX(](〖WTBZ〗Σ〖WTBX〗[DD(]〓[]i[DD)]〖WTBZ〗Σ〖WTBX〗[DD(]〓
[]j[DD)]Xij)2[]N[SX)],N=各组例数之和
〖HT5SS〗〓〓(3)列方差分析表(表615)并计算F统计量
〖HT5”H〗〖STHZ〗〖JZ〗表615〓例6.17的方差分析表
〖HT5”SS〗〖STBZ〗〖BG(!〗〖BHDFG3,WK7。6W〗
〖WTBZ〗
变异来源〖〗SS〖〗ν〖〗MS〖〗〖WTBX〗F〖〗P
〖BHDG1*2,WK7,WK7。5DWW〗
总〖〗〖JZ〗2214.28[]〖JZ〗14
[BHDW]组间〖〗1504.52[]2[]〖JZ〗752.26[]〖JZ〗12.7184[]〖JZ〗<0.01
[BH]组内(误差)〖〗709.76[]12[]59.15〖BG)F〗
〖HT5SS〗(4)确定F统计量的P值,作出结论〓查方差分析界值表(附表4),检验水准界值记
为F
α,(ν1,ν2),本例ν组间=ν1=2,ν组内=ν2=12,查F0.
05,(
2,12)=3.88,F0.01,(2,12)=6.93,本例F=12.7184>6.93,P<0.01,拒绝〖WTBZ〗
H0,接受H1,故3个注射部位对药物的吸收率是不同的。
以上结论表明,3个部位吸收率是有差别的,但并不等于表明任何两组间均有差别
。要了解哪两组之间有差别,需进一步作两两比较(详见本节“多个样本均数的两两比较”)
。
〖HTH〗(三)配伍组设计的多组样本均数比较
〖HT5SS〗配伍组设计(随机单位组设计)是配对设计的扩展。将某些影响因素(年龄、病情等
)一致的试验对象组成一个单位组或区组,如表616中资料是自身的配伍设计,在医学研
究中较常见。配伍设计的目的是通过组成单位组,控制组间的个体变异,减少实验误差,提
高实验效率。
〖HTK〗1.配伍设计方差分析的变异分解及计算
〖HTSS〗例6.18〓某脑电图室观察家兔注〖WTBZ〗AT3前后脑电图(EEG)波形的变化,结果
如下表,问不同时间的脑电图波有无不同?
〖HT5”H〗〖STHZ〗〖WTHZ〗〖JZ〗表616〓家兔注射AT3不同时间EEG波的变化
〖HT5”SS〗〖WTBZ〗〖STBZ〗〖BG(!〗〖BHDFG4,WK7。6W〗
家兔号〖〗注射前〖〗〖ZB(〗〖BHDG2,WK21W〗注射后〖BHDG2,WK7。3W〗1 h[]24 h[]48
h[ZB)][]〖〗〖〗〖WTBZ〗Σ〖WTBX〗〖DD(〗〓[]i[DD)]Xij
〖BHDG1*2/3,WK7,WK7DW,WK7DW,WK7DW,WK7DW,WK7DWW〗
1〖〗[JZ]29[][JZ]37[][JZ]27[][JZ]38[]〖JZ〗131
[BHDW]2[]28[]44[]31[]33[]136
[BH]3[]38[]52[]38[]39[]167
[BH]4[]29[]35[]36[]34[]134
[BH]5[]34[]41[]31[]30[]136
[BH]6[]41[]43[]42[]29[]155
[BHDG2]〖WTBZ〗Σ〖DD(〗〓〖〗j[DD)]〖WTBX〗Xij[]199[]252[]205[]203[]8
59(〖WTBZ〗Σ〖WTBX〗X)
[BHDW]〖WTBZ〗Σ[DD(]〓〖〗j[DD)]〖WTBX〗Xij2[]6747[]10746[]7155[]69
51[]31599(〖WTBZ〗Σ〖WTBX〗X2)
[BH][AKX-]i[]33.17[]42.00[]34.17[]33.83[]35.79([AKX-])
[BH]bi[]6[]6[]6[]6[]24(N)〖BG)F〗
〖HT5SS〗表616中数据的变异除了总变异、组间变异(不同时间的变异)和组内变异(
随机误差)外,还存在着不同家兔间的变异,即配伍组间的变异,用〖WTBZ〗SS
配伍表示。〖WTBZ〗SS配伍〖WTBZ〗=Σ[DD(]〓〖〗j[DD)]〖WTBX〗bj
([AKX-]j-[AKX-])2,ν配伍=b-1,〖WTBZ〗MS配伍=SS配伍/〖W
TBX〗(b-1)。
在配伍设计的方差分析中,总变异可分为3部分:〖WTBZ〗
SS总=SS组间+SS配伍+SS误差,且ν总=ν组间+ν配伍
+ν误差
由于该设计将个体变异(配伍变异)中从组内变异分离出来,使组内变异(误差)更能反映随
机误差的大小,因此提高了研究的效率。
〖HTK〗2.分析计算步骤
〖HTSS〗(1)建立假设和确定检验水准
H0:注射前后不同时间的EEG波形相同,〖WTBX〗即μ1=μ2=μ3=μ4〖WTBZ〗
H1:注射前后不同时间的EEG波形不同或不全相同〖WTBX〗
α=0.05
(2)计算F值〓本例〖WTBZ〗C=〖WTBZ〗(Σ〖WTBX〗X)2/N=(859)2/24=30745.04
,〖WTBZ〗按表617中公式计算:
SS总=〖WTBZ〗Σ〖WTBX〗X2-〖WTBZ〗C〖WTBX〗=31599-30745.04=853.96
ν总=N-1=24-1=23〖WTBZ〗
SS组间=〖WTBZ〗Σ〖WTBX〗[SX(](〖WTBZ〗Σ〖WTBX〗[DD(]〓[]j[DD)]Xij)
2[]b[SX)]〖WTBZ〗-〖WTBZ〗C〖WTBX〗=[SX(](199)2[]6[S
X)]+[SX(](252)2[]6[SX)]+[SX(](205)2[]6[SX)]+[SX(](203)2[]6[SX)]-30745.04=3
11.46〖WTBX〗
ν组间=k-1=4-1=3〖WTBZ〗
SS配伍=Σ[DD(]〓[]〖WTBX〗j[DD)][SX(](〖WTBZ〗Σ[DD(]〖WTBX〗〓[]i[DD)]X
ij)2[]k[SX)]-〖WTBZ〗C〖WTBX〗=[SX
(](131)2+(136)2+(167)2+(134)2+(136)2+(155)2[]4[SX)]-30745.04=260.7
1
ν配伍=b-1=6-1=5
SS误差=SS总-SS组间-SS配伍=853.96-311.46-260.71=299.79
ν误差=ν总-ν组间-ν配伍=23-3-5=15
MS组间=SS组间/ν组间=311.46/3=103.82
MS配伍=SS配伍/ν配伍=260.71/5=52.14
MS误差=SS误差/ν误差=299.79/15=19.986
〖WTBX〗F组间〖WTBZ〗=[SX(]MS组间〖〗MS误差〖SX)〗=[SX(]103.82
[]19.986[SX)]=5.19,〖WTBX〗F配伍〖WTBZ〗=[SX(]MS配伍〖〗MS误差
[SX)]=[SX(]52.14[
]19.986[SX)]=2.61
〖HT5”H〗〖JZ〗〖STHZ〗表617〓配伍设计的方差分析计算公式
〖HT5”SS〗〖STBZ〗〖BG(!〗〖BHDFG2,WK9。5W〗
变异来源〖〗SS〖〗ν〖〗MS〖〗〖WTBX〗F
〖BHDG3〗
总〖〗[WTBZ]Σ[WTBX]X2-[WTBZ]C[WTBX][]N-1
[BHDW]组间〖〗[WTBZ]Σ[WTBX]〖DD(〗〓〖〗i[DD)][SX(]([WTBZ]Σ[WTBX][DD(]〓[]j[DD
)]Xij)2[]b[SX)]-
[WTBZ]C[WTBX][]k-1[]SS组间/ν组间〖〗〖WTBZ〗〖SX(〗MS组间〖〗
MS误差[SX)]
〖BH〗配伍〖〗〖WTBZ〗Σ[WTBX][DD(]〓[]j[DD)][SX(]([WTBZ]Σ[WTBX][DD(]〓[]i[DD)]
Xij)2[]k[SX
)]-[WTBZ]C[WTBX][]b-1[]〖WTBZ〗SS配伍/ν配伍〖〗〖SX(〗MS配伍
〖〗MS误差[SX)]
〖BH〗误差〖〗SS总-SS组间-SS配伍〖WTBX〗〖〗ν总-ν组间-ν
配伍[]〖WTBZ〗SS误差/ν误差〖BG)F〗
〖HT5SS〗(3)将上述结果列方差分析表(如表618)
〖HT5”H〗〖JZ〗〖STHZ〗表618〓例6.18的方差分析表
〖HT5”SS〗〖STBZ〗〖BG(!〗〖BHDFG2,WK7。6W〗
变异来源〖〗SS〖〗ν〖〗MS〖〗〖WTBX〗F〖〗P
〖BHDG1*2,WK7,WK7。5DWW〗
总〖〗〖JZ〗853.96[]〖JZ〗23
[BHDW]组间〖〗311.46[]3[]〖JZ〗103.82[]〖JZ〗5.19[]〖JZ〗<0.01
[BH]配伍〖〗260.71[]5[]52.14[]2.61[]>0.05
〖BH〗误差〖〗299.79[]15[]19.986〖BG)F〗
〖HT5SS〗(4)确定F统计量的P值,作出结论〓查Fα,(ν1,ν2)界值,本
例ν组间
=3,ν误差=15,查附表4,F0.05,(3,15)=3.29,F0.01,(3,15)=5.42,
本例组间的F=5.19>3.29,P〖WTBZ〗<0.05,拒绝H0,接受H1,故不同时间的脑电图波形
是不同的。〖WTBX〗F0.05,(5,15)=2.90,本例配伍组F=2.61<2.90,P>0.05,〖WTBZ
〗不拒绝H0,故不同的家兔间的脑电图波形差别无显著性。
〖HTH〗(四)多个样本均数的两两比较
〖HT5SS〗多个样本均数的两两比较的目的是了解比较组间何组之间有差别,由于涉及到对
比组数大于2组,不能用前面所介绍的〖WTBX〗t检验,常用本节介绍的多个均数的两两比
较方法。
1.多个均数间的相互比较〖WTBZ〗(NewmanKeulse法),又称〖WTBX〗q检验,公式为:
〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓
q=[SX(][AKX-]A-[AKX-]B[]S[AKX-]A-[AKX-]
B[SX)][JY](6.30)〓〓
〖JZ〗
S[AKX-]A-[AKX-]B=[KF(][SX(]〖WTBZ〗MS〖WTBX〗
误差〖〗2〖SX)〗(〖SX(〗1〖〗nA[SX)]+[SX(]1[]nB[SX)])[KF)]
〖KH-1*2〗[JY](6.31)〓〓〖HJ1*2〗〖HJ〗
如果q>qα,ν误差,a,则P<α,拒绝[WTBZ]H0假设。
例6.19〓对例6.17资料(表613)作两两比较。
(1)建立假设
H0:任意两个对比组的总体均数相等,即[WTBX]μA=μB[WTBZ]
H1:[WTBX]μA≠μB
α=0.05
将比较均数按大小排列:
组次〓〓1〓 〓〓〓2〓〓〓〓 3
均数〓 87.74〓〓 83.4〓〓 〖KG*3〗64.66
组别〓部位甲〓〓部位丙〓〓部位乙
(2)列两两均数比较表(表619)
〖HT5”H〗〖STHZ〗[WTHX]〖JZ〗表619〓3个样本均数两两比较的q检验
〖HT5”SS〗〖STBZ〗〖BG(!〗〖BHDFG6,WK6。7W〗[WTBZ]
对比组A与B(1)〖〗两均数之差〖WTBX〗〖AKX-〗A-〖WTBX〗[AKX-]
〖WTBZ〗B(2)〖〗组数〖WTBX〗a〖WTBZ〗(3)〖〗[WTBX]
q值(4)=〖SX(〗〖WTBX〗[AKX-]〖WTBZ〗A-〖WTBX〗[AKX-]〖WTBX〗B[]S
〖WTBX〗[AKX-]〖WTBZ〗A-〖WTBX〗[AKX-]〖WTBZ〗B[SX)][][ZB(][BHDG2,WK14W]
〖WTBX〗q界值〖BHDG4,WK7,WK7W〗α=0.05(5)[]α=0.01(6
)[ZB)][]〖〗P
〖BHDG1*2,WK6,WK6。6DWW〗
1与2〖〗〖JZ〗4.34[]〖JZ〗2[]〖JZ〗1.26[]〖JZ〗3.08[]〖JZ〗4.32[]〖JZ〗>0.05
[BHDW]1与3[]23.08[]3[]6.71[]3.77[]5.05[]<0.01
[BH]2与3〖〗18.74[]2[]5.45[]3.08[]4.32[]<0.01〖BG)F〗
〖HT5SS〗第(3)栏内的a值为〖WTBZ〗A、B两对比组范围内所包含的组数,如1组与3组比较
,在均数按大小排列范围内包含了1,2,3组,故〖WTBX〗a值为3。余类推。
第(4)栏q值按公式(6.30)计算,本例中的〖WTBZ〗MS误差=59.15,各组例数均为5,故
各组值的标准误均相等。
〖WTBX〗S[AKX-]〖WTBZ〗A-〖WTBX〗[AKX-]〖WTBZ〗B=[KF(][SX(]59.15[]2[S
X)]([SX(]1[]5[SX)]+[SX(]1[]5[SX)])[KF)]=3.44
(3)查〖WTBX〗q界值表(附表5)〓确定q值的概率,列入表内。
本例a=2,ν误差=12,q0.05,12,2=308,q0.01,12,2=4.32,余类推
。
(4)作结论〓按α=0.05水准,1与3组和2与3组差别有显著性,1与2组无显著性。该药物注射
在部位甲与部位丙、部位乙与部位丙之间吸收率不同,但部位甲和部位乙间的吸收率看不出
差别。
2.如各对比组仅需与对照组比较,用新复极差法比较。方法请参考《卫生统计学》或《医学
统计学》专著。
〖JY〗〖HT5K〗(孟〓虹)〓〓
〖LM〗
〖HS7〗〖HT2XBS〗〖JZ〗 第七章〓分类数据资料的统计方法
〖HT5SS〗
分类资料是按观察对象所观察指标的某种分类(如阳性、阴性,治愈、显效、有
效、无效)
,清点阳性或阴性个数的合计数所得到的资料。阳性或阴性合计数称为某分类的总量
指标或绝对数指标。绝对数指标表示在一定的条件下某事物发生的具体规模和绝对数量的多
少,它是制定和检查计划不可缺少的指标。但绝对数指标不便于事物之间的比较,需用分类
数据的统计指标和推断方法加以处理和分析。
〖HS4〗〖HT3H〗〖JZ〗第一节〓分类数据资料的统计描述——相对数
〖HT〗〖HT4”K〗〓〓一、相对数的意义〖HT〗〖HJ1〗〖HJ〗
〖HT5SS〗
分类数据资料经整理后常用频数表和率、构成比、相对比指标来描述和比较。
这些指标都是由两个有关的绝对数(总量数据)之比所构成,统称相对数。相对
数指标的意义是:
1)可描述事物发生的频率程度和相对大小关系;
2)消除事物发生数由于基数(各组例数)不同的影响,化为相同基数中某事件的
发生数,便于事物之间的合理比较;
3)为医疗工作的计划和决策提供依据。〖HS2〗〖HT4”K〗〓〓二、常用的相
对数指标〖HT5H〗〖WTBZ〗
(一)率(Rate)〖HT5SS〗又称频率指标,说明了在一定的时期内,某现象(
事物)在单位基数中发生的频率或强度。可用百分率(%)、千分率(‰)、十万分率(1
/10 万)来表示。率的一般计算通式为:
〖JZ〗率=[SX(]某现象实际发生的例数〖〗可能发生某现象的观察例数〖SX)〗×100%
〖KH-1*2〗〖JY〗(7.1)〓〓〖HJ1*2〗〖HJ〗
例如表71中,内1科室的差错次数为35次,同年护理人数为500人,则内1 科室
在该年的护理差错率=35÷500×100%=7.0%,同理依次可计算其他两科室的差错率分别
为9.8%和10.0
%。由此可知,内1科室的差错率最低,平均每百人为7次,内2和内3科室平均每百人
为10次。
〖HT5SS〗 计算率指标时应注意下列两点:
1.率的分母是由性质不同的几部分观察单位组成,如表71中差错率的分母是
由“
有差错人数和无差错人数”组成的护理人员总数构成的。分子和分母的单位可以相同或不同
,如感染率中,分子可以为感染人次数,分母为观察人数。
2.率的分子和分母的确定与该率的定义有关。例如表71中内1科室护理差错率的计算为:
分子是内1科室的差错次数,分母应是内1科室的护理人数,而不能用合计护理人数
。〖HT5”H〗〖STHZ〗〖JZ〗表71〓某院某年3个内科科室护理差错情况的比较
〖HT5”SS〗〖STBZ〗〖BG(!〗〖BHDFG3,WK11。4W〗
科室 〖〗 护理人数〖〗 差错次数 〖〗 差错率(%)
〖BHDG1*3/4,WK11,WK11。3DWW〗
内1 〖〗 〖JZ〗 500 〖〗 〖JZ〗 35 〖〗 〖JZ〗7
.0
〖BHDW〗 内2 〖〗 650 〖〗 64 〖〗 9.8
〖BH〗 内3 〖〗 600 〖〗 60 〖〗 10.0
〖BHDG2〗 合计 〖〗 1750 〖〗 159 〖〗 9.1〖BG)
F〗
〖HT5SS〗
〖HTH〗
(二)构成比(Proportion)
〖HTSS〗 又称构成比指标, 说明某一事物内部各组成部分在总和中所占的比重大小或分
布,常用百分比表示。构成比的一般计算公式为:〖JZ〗
某组成部分的构成比=[SX(]某一组成部分的例数〖〗同一事物各个组成部分的总例数〖SX)
〗×100%
〖KH-1*2〗〖JY〗(7.2)〓〓〖HJ1*2〗〖HJ〗
计算构成比时应注意的是:1)构成比中分子是分母中的一部分,但分母是性质相同、
类别不同的观察例数总数,构成比不能反映各类的频率或严重程度;2) 同一事物各构成比
之和一定为100%。
例如表72中的新生儿黄疸疾病的构成比为60÷138×100%=43.5%, 同理依
次可计算出其他疾病的构成比重。由表72构成比一栏可知,该地新生儿患病中,黄疸、窒
息、肺炎为主要疾病,共占80%左右。
〖HT5”H〗〖STHZ〗〖JZ〗
表72〓某地社区家庭护理新生儿患病情况(某院)
〖HT5”SS〗〖STBZ〗〖BG(!〗〖BHDFG3,WK15。3W〗
疾病种类 〖〗 患病例数 〖〗 构成比(%)
〖BHDG1*3/4,WK15,WK15DW,WK15DWW〗
黄疸〖〗[JZ] 60 〖〗 [JZ] 43.5
〖BHDW〗 窒息 〖〗 31 〖〗 22.5
〖BH〗 肺炎 〖〗 20 〖〗 14.5
〖BH〗 发热 〖〗 10 〖〗 7.2
〖BH〗 腹泄 〖〗 8 〖〗 5.8
〖BH〗 ABO溶血 〖〗 9 〖〗 6.5
〖BHDG2〗 合计 〖〗 138 〖〗 100.0〖BG)F〗
〖HT5H〗 (三)比值(Ratio)
〖HT5SS〗又称相对比指标,即A与B两个有关的指标之比。说明A指标为B指标的倍数或百分
之几的关系。一般计算公式为:〖JZ〗
相对比=[SX(]A指标〖〗B指标〖SX)〗(×100%)〖KH-1*2〗〖JY〗(7.3)〓〓〖HJ1*2〗
〖HJ〗
护理工作中常用的相对比,如:
性别比=〖SX(〗男性人数〖〗女性人数〖SX)〗, 医护比=〖SX(〗护士人数〖〗医生人数〖
SX)〗, 护士数与床位数比=[SX(]护士人数〖〗护理床位数〖SX)〗〖HTH〗
(四)动态相对比指标〖HT5SS〗
对一些按时间顺序排列的指标(可以为绝对数或相对数),计算它们的定基
比和环比两个动态相对比指标,可用于说明事物在时间上的变化和发展或增长速度。〖HT
K〗
1.定基比〓〖HTSS〗统一用某一个时间的指标作为基数,以后各时间点的指标都
与该基数相比。
〖JZ〗定基比=〖SX(〗各时间点的指标〖〗某时间点指标(基数)〖SX)〗×100%
〖KH-1*2〗〖JY〗(7.4)〓〓〖HJ1*2〗〖HJ〗〖HTK〗
2.环比〓〖HTSS〗各时间点的指标均与前一个时间点的指标相比。〖JZ〗
某环比=[SX(]前一时间点指标〖〗后一时间点指标〖SX)〗×100%〖KH-1*2〗〖JY〗(7.5)
〓〓〖HJ1*2〗〖HJ〗
〖HT5”H〗〖STHZ〗〖JZ〗 表73〓 某院在1990~1992年的床位数和
护士人数
〖HT5”SS〗〖STBZ〗〖BG(!〗〖BHDFG2,WK5,WK5,WK5,WK5,WK5,WK5,WK5,WK8W〗
年份 〖〗 床位数 〖〗 定基比 〖〗 环比 〖〗 护士数 〖〗 定基比 〖〗
环比 〖〗 床位数与
〖BHDWG2〗(年) 〖〗 (张) 〖〗 (%)〖〗 (%)〖〗 (人) 〖〗 (
%)〖〗 (%)〖〗 护士数之比
〖BHDG2〗
1990 〖〗 400 〖〗 100.0 〖〗 100.0 〖〗 150 〖〗 100.0〖〗
100.0 〖〗 1∶0.38
〖BHDW〗1991 〖〗 450 〖〗 112.5 〖〗 112.5〖〗 180 〖〗 120.
0 〖〗 120.0 〖〗 1∶0.40
〖BH〗1992 〖〗 480 〖〗 120.0 〖〗 106.6 〖〗 200 〖〗 133.3
〖〗 111.1 〖〗 1∶0.42〖BG)F〗
〖HT5SS〗在表73中,1990~1992年中床位数和护士人数每年均有不同程度增加,从
环比指标上看:床位数1991年增加了12.5%,1992年增加了6.6%,护士人数1991年增加了20.
0%,1992年增加了11.1%,其增加速度快于床位数的增长。但从床位数和护士数比值指标上
分析,3年变动不大,一张床位有0.38~0.42个护士。
〖HTH〗
(五)护理和临床上常用的几个反映疗效的率指标〖HT5SS〗
某病治愈率=〖SX(〗某病治愈人数〖〗某病治疗的总人数〖SX)〗×100%
某病治疗有效率=[SX(]某病治疗有效人数〖〗某病治疗的总人数〖SX)〗×100%
某事物的阳性率=〖SX(〗某事物中出现的阳性数〖〗某事物中观察的总数〖SX)〗×100%
某病的病死率=[SX(]某病的死亡人数〖〗某病观察(治疗)的总人数〖SX)〗×100%
〖HTH〗
(六)反映人群中发病和患病的频率指标
〖HT5SS〗
某病发病率=〖SX(〗在一定时期内新发生某病的人数(或例数)〖〗在一定时期内观察人群的
总人数或平均人口数〖SX)〗×100%
某病患病率=[SX(]在一定时期内某病患病人数(包括新、旧患者)〖〗一定时期内调查或观
察人群的总数〖SX)〗×100%或1000‰
〖HS2〗〖HT4”K〗〓〓三、应用相对数指标时应注意的问题〖HT5H〗
(一)计算相对数的分母数不宜过少
〖HT5SS〗一般说来观察例数足够多时, 计算的相对数指标较稳定(特别是频率指标),这
样才能正确反映事物实际发生的频率。〖HTH〗
(二)率和构成比的含义不同
〖HT5SS〗做结论和应用时不能以比代率。 率表
示事物发生的频率或强度。在例数较多时,频率可作为事件发生概率的估计值,对工作和决
策有指导意
义。例如表74中50~岁组高血压的患病率为15%~16%, 说明该企业在该年龄段人群中患
高血压的严重程度,应引起重视。而构成比的大小,并不表示事物的严重程度,只表示某事
物内
部各部分所占的比重,例如表74中女性40~岁组段病例构成比为55.10%, 并不表示该年
龄段患病最严重,只表示该企业女性高血压患者中,40~岁组段的患者最多。
〖HT5”H〗〖STHZ〗〖JZ〗 表74〓某企业不同年龄高血压病
例调查情况
〖HT5”SS〗〖STBZ〗〖BG(!〗〖BHDFG6,WK4,WK20,WK1,WK20W〗
年龄(岁)〖〗〖ZB(〗〖BHDG2,WK20W〗男〖BHDG4,WK5。4W〗检查人数〖〗病例数〖
〗病例构成比(%)〖〗患病率(%)〖ZB)〗〖〗〖〗〖ZB(〗〖BHDG2,WK20W〗女〖BHD
G4,WK5。4W〗检查人数〖〗病例数〖〗病例构成比(%)〖〗患病率(%)〖ZB)〗
〖BHDG2,WK4,WK5DW,WK5DW,WK5DW,WK5DW,WK1,WK5DW,WK5DW,WK5DW,WK5DWW〗
20~ [][JZ] 333 [][JZ] 5 [] [JZ]2.84 [] [JZ]1.5[][][JZ] 7
12 [][JZ] 4 [][JZ] 8.16[][JZ] 0.6
[BHDW] 30~ [] 301 [] 4 [] 2.27 [] 1.3 [][] 142 [] 9 []
18.37 [] 6.3
[BH] 40~[] 517 [] 64 [] 36.36 [] 12.4 [][] 185 [] 27[]
55.10 [] 14.6
[BH] 50~ [] 576 [] 93 [] 52.84[] 16.2[][] 61 [] 9[]
18.37 [] 14.8
[BH] 60以上 [] 12 []10 [] 5.68 [] 83.3 [][] [JZ] -[][JZ] -[
] [JZ] -[][JZ]-
[BHDG2] 合计 [] 1739 [] 176 [] 100.00[] 10.12 [][] 1100 [] 49 [
] 100.00 [] 4.45〖BG)F〗〖HT5H〗
(三)其他〖HT5SS〗
1.对观察例数不等的几个率,不能直接相加求平均。〖HT5SS〗例如表74中的
男性合计率的计算为:
男性高血压平均患病率=176÷1739×100%=10.12%。
2.表达率或构成比指标时,〖HTSS〗应写明“有效率(%)”或“疗效构成
比(%)”, 避免仅写“%”或“百分率”等不清楚的表达。
3.如率和构成比是据抽样资料计算的,这样得到的率和构成比同样存在抽样误
差, 应作显著性检验后,再作出比较高低的结论。
4.医院内患者数计算的率不能反映当地人群中的发病或患病频率。 因某医院的
患者数并不能代表当地的患者情况。
〖HS4〗〖HT3H〗〖JZ〗 第二节〓计数资料的假设检验——〖WTHX
〗χ2检验
〖HT5SS〗〓〓
〖WTBX〗χ2检验〖WTBZ〗(Chisquare test)是一种用途较广的假设检
验方
法,本节只介绍它在分类资料中的应用。〖WTBX〗χ2检验可用于检验两组或两个以上组
的样本率(或构成比)的差别有无显
著性,两个不同程度分类指标间有无相关关系。
〖HS2〗〖HT4”K〗〓〓一、两个样本率比较的χ2检验〖HT5H〗
(一)χ2检验的基本公式和基本思想〖HT5SS〗
例7.1〓新生儿窒息常由于分娩时产程过长而产生。某人用心理护理(激励式心
理护理)
对产妇分娩的新生儿窒息率进行研究。结果如下表,试分析心理护理能否降低新生儿
窒息率?
〖HT5”H〗〖STHZ〗〖JZ〗表75〓经两种方式护理的产妇分娩时新生儿窒息状
况的比较
〖HT5”SS〗〖STBZ〗〖BG(!〗〖BHDFG3,WK9。5W〗
组别 〖〗 窒息例数 〖〗 未窒息例数 〖〗 合计 〖〗 窒息率〖W
TBZ〗(%)
〖BHDG1*2,WK9,WK9。4DWW〗
心理护理组 〖〗 〖JZ〗2 〖〗 〖JZ〗 174 〖〗 〖JZ〗 176
〖〗 〖JZ〗 1.14
〖BHDW〗 一般护理组 〖〗 13 〖〗 189 〖〗 202 〖〗
6.07
〖BHDG1*2〗 合计〖〗 15 〖〗 363 〖〗 378 〖〗
3.97〖BG)F〗〖HT5SS〗
由表75可见, 两组新生儿窒息率不同可能有两种原因造成:一种可能是由
于比较的是样本,两率的差是抽样误差所致,两组的总体率相同,即心理护理对分娩的产
程
无影响。另一种可能是两个总体率确实不同,即心理护理法对缩短产程有作用。为
推断两总体的率是否有差异,须对分类数据进行假设检验。常用的方法是〖WTBX〗χ2检
验。
〖FL(25mm,118mm〗
〖BG((2)〗〖BHDG2,K2,K2〗
2〖〗174
〖BH〗13〖〗189〖BG)〗〖LL〗
〓〓左表中4个格子的数据是两组中两种分类的基本数据,其余的
数据是由这4个数据推算来的,这种数据资料称四格表资料,又称2
×2表。[FL)]〖HTK〗
1.〖WTBX〗χ2检验的基本公式 〖HTSS〗
〖JZ〗
χ2=〖WTBZ〗Σ〖WTBX〗〖SX(〗(A-T)2[]T[
SX)]〖KH-1*2〗[JY](7.6)〓〓〖HJ1*2〗〖HJ〗
式中 A 为各格子的实际频数,如表中的4个基本数据;T为各格子的理论频数,
它是根据某个假设计算确定的。 〖HTK〗
2.χ2检验的基本思想〓〖HTSS〗从公式(7.6)可见,χ2值是反映了实际发生频数和理
论
(假设)频数一致程度的指标。如果检验假设成立,则实际得到的频数和理论频数的差别相差
不大,即得到不大的χ2值;若得到较大的χ2值,则实际频数与理论频数的差值较大,
若χ2≥χ2α,ν,P≤α,则怀疑〖WTBZ〗H0假设,因此,拒绝H0,接受H
1,认为两组的总体率不同。〖HTH〗
(二)χ2检验的步骤与计算
〖HTSS〗先将资料写成四格表形式,如表76。
〖HT5”H〗〖STHZ〗〖JZ〗表76〓两组产妇分娩新生儿窒息率的比较
〖HT5”SS〗〖STBZ〗〖BG(!〗〖BHDFG3,WK11。4W〗
组别 〖〗 窒息数 〖〗 未窒息数 〖〗 合计数
〖BHDG1*2,WK11,WK11。3DWW〗
心理护理组 〖〗〖JZ〗2(6.98)〖〗 〖JZ〗174(169.01) 〖〗 〖JZ〗176
〖BHDW〗 一般护理组 〖〗13(8.02)〖〗 189(193.98)〖〗 202
〖BHDG1*2〗 合计 〖〗 15 〖〗 363 〖〗 378〖BG)F
〗
〓〓 注:括号内为理论频数(〖WTBX〗T)
〖HT5K〗〓〓
1.建立假设〖HT5SS〗〖WTBZ〗H0:两组护理的新生儿窒息率相等,即 〖WT
BX〗π1=π2〖WTBZ〗
H1:两组护理的新生儿窒息率不等,即 〖WTBX〗π1≠π2
〖WTBZ〗
〖HTK〗 2.确定显著性水准〓〖HTSS〗〖WTBX〗α=0.05〖HTK〗
3.计算各组的理论频数(T)〓〖HTSS〗T〖WTBZ〗是根据检验的假设H0,按式(7
.7)计算得到的,称为理论上发生的频数。
〖JZ〗[WTBX]T[WTBZ]RC=[SX(][WTBX]n[WTBZ]R·[WTBX]n[WTBZ]C[][
WTBX]N[WTBZ][SX)]〖KH-1*2〗[JY](7.7)〓〓〖HJ1*2〗〖HJ〗
式中:[WTBX]T[WTBZ]RC表示第R行与第C列格子的理论频数,[WTBX]n[WTB
Z]R为相应行的合计数,[WTBX]n[WTBZ]C为相应列的合计数,
[WTBX]N[WTBZ]为总的合计数。如表中第1行和第1列的理论频数T11的计算为:
〖WTBX〗
T11=[SX(]15×176〖〗378〖SX)〗=6.98
同理,T12=169.01,T21=8.02,T22=193.98。
[HTK] 4.计算χ2 值[HTSS]
χ2= [SX(](2-6.98)2[]6.98[SX)]+[SX(] (174-169.01
)2[]169.01[SX)]+[SX(] (13-8.02)2[]8.02[SX)]+[SX(] (189-193.98)2[]193.
98[SX)]
=3.5531+0.1473+3.0923+0.1279=6.9206
[HTK] 5.确定四格表的自由度[HTSS]〓
ν=(行数-1)(列数-1)=(2-1)(2-1)=1
〖HTK〗 6.确定计算的χ2统计量的概率〓〖HTSS〗
根据自由度查χ2分布的界值表(附表6),得α=0.05的χ20.05
,ν界值,如计算
的χ2≥χ20.05,ν,P≤0.05,认为两个率的差异有显著性,拒绝〖WTBZ
〗H0。〖WTBX〗
如计算的χ2<χ20,05,ν, P>0.05,认为两个率的差异无显著性,
差别是由抽样误差造成,不拒绝〖WTBZ〗H0。〖WTBX〗
本例计算的χ2=6.92>χ20,05,1=3.84,P<0.05;且χ2=6.92>
χ20,01,1=6.63,P
<0.01。〖WTBZ〗〖HTK〗
7.结论〓〖HTSS〗本例在α=0.05水准,〖WTBX〗P〖WTBZ〗<0.01,拒绝H0,
认为两组率差异有显著性, 心理护理方法对产妇的分娩有一定的作用。〖HTH〗
(三)四格表的专用公式
〖HTSS〗对于四格表资料,还可用四格表专用公式(7.8)计算χ2
值,该公式省去计算理论频数的过程,简化了运算。〖JZ〗
〖WTBX〗 χ2= [SX(] (ad-bc)2N〖〗
(a+b)(c+d)(a+c)(b+d) 〖SX)〗〖KH-1*2〗〖JY〗(7.8)〓〓〖HJ1*2
〗〖HJ〗
以表75资料为例,介绍四格表专用公式中的符号,见表77。
〖HT5”H〗〖STHZ〗〖JZ〗表77〓 四格表一般形式
〖HT5”SS〗〖STBZ〗〖BG(!〗〖BHDFG3,WK11。4W〗
组别 〖〗 窒息数 〖〗 未窒息数 〖〗 合计
〖BHDG2,WK11,WK11。3DWW〗
心理护理组 〖〗 〖JZ〗2(a) 〖〗 〖JZ〗 174(b) 〖〗 〖JZ〗176
(a+b)
〖BHDW〗 一般护理组 〖〗 13(c) 〖〗 189(d) 〖〗 202(c+d)
〖BHDG2〗 合计 〖〗 15(a+c) 〖〗 363(b+d) 〖〗 378(N)〖BG)F
〗〖HT5SS〗
χ2=[SX(] (2×189-174×13)2×378[]
176 ×202 × 15 × 363[SX)]=6.92
计算结果与前相同。〖HTH〗
(四)四格表χ2值的校正 〖HTSS〗 在自由度为1的四格表中,在下列情况
下,计算的χ2值的概率偏低,应对其进行校正。
1. 1<T<5,且n>40时,需计算校正χ2值,见公式(7.9)和(7.10),两式等
价。〖WTBX〗〖JZ〗
χ2=〖WTBZ〗Σ〖WTBX〗[SX(] (|A-T
|-0.5)2[]T[SX)]〖KH-1*2〗[JY](7.9)〓〓〖HJ1*2〗〖HJ〗〖JZ〗
χ2=[SX(] (|ad-bc|-N/2)2N[]
(a+b)(c+d)(a+c)(b+d)[SX)]〖KH-1*2〗[JY](7.10)〓〓〖HJ1*2〗
〖HJ〗
〖WTBX〗
2. T<1,或n<40时,χ2值的计算改用确切概率计算法(参考杨树勤主编的《卫生统计学》
)。
例7.2〓重症胰腺炎的坏死组织不及时清除和引流,继发并发症,死亡率为〖WTBZ〗100%。
有人对重症胰腺炎患者用两种引流方法做腹腔的引流,引流液的细菌培养结果如下,问两法
细菌阳性检出率有无差别?
〖HT5”H〗〖STHZ〗〖JZ〗表78〓 两种腹腔引流方法的引流
液细菌培养结果
〖HT5”SS〗〖STBZ〗〖BG(!〗〖BHDFG3,WK9。5W〗
组别 〖〗 阳性数 〖〗 阴性数 〖〗 合计数 〖〗 阳性率(
%)〖BHDG2,WK9,WK9。4DWW〗
常规法 〖〗 〖JZ〗7(4.5) 〖〗 〖JZ〗 8(10.5) 〖〗 〖JZ〗15
〖〗 〖JZ〗46.67
〖BHDW〗 改进法 〖〗 5(7.5) 〖〗 20(12.5) 〖〗 25 〖〗
20.00
〖BHDG2〗 合计 〖〗 12 〖〗 28 〖〗 40〖〗
30.00 〖BG)F〗〖HT5SS〗〖WTBZ〗
(1)建立假设 H0:两法的阳性率相等,即 〖WTBX〗π1=π2〖
WTBZ〗
H1:两法的阳性率不等,即 〖WTBX〗π1≠π2
(2)确定显著性水准〓α=0.05
(3) 按式(7.7)计算〓T11=[SX(]12×15〖〗40〖SX)〗=4.5,因有1<T<5
,且n=40,故对χ2值进行校正,按式
(7.10)计算。
(4)计算χ2值
χ2=〖SX(〗 (|7×20-8×5|-40/2)2×40[
]
15×25×12×28〖SX)〗=2.03
(5)确定四格表的自由度〓
ν=(行数-1)(列数-1)=(2-1)(2-1)=1
(6)确定χ2出现的概率P〓
本例χ2=2.03<3.84,P>0.05,认为两个率的差异无显著性,不拒绝〖WTBZ
〗H0。〖WTBX〗
(7)结论〓本例在α=0.05水准上,P>0.05,不拒绝〖WTBZ〗H0,认为两组率
差异无显著性, 即本例两法细菌阳性检出率无差别。 〖WTBX〗
〖HS2〗〖HT4”K〗〓〓二、多个样本率比较的χ2检验〖HT5H〗
(一)多个样本率(或构成比)的比较〖HT5SS〗〖WTBZ〗
基本数据为2行2列的资料称为四格表资料,如果是多个率的比较,即基本数据有R行和2列(
如表79)或2行和C列,均称为行×列表(或R×C表)。行×列表的χ2的基本思想和四
格表的一样,检验公式既可用χ2的基本公式,也可用公式(7.11),但用公式(7.6)计算
则更为方便。〖JZ〗
〖WTBX〗 χ2=N(〖WTBZ〗Σ〖WTBX〗[SX(]A2[]nRnC[SX)]
-1)〖KH-1*2〗[JY](7.11)〓〓[HJ1*2] [HJ]
式中A为各格子的实际频数,nR和nC为A的行和列的合
计数。
例7.3〓留置导尿是手术后护理常见的技术,临床上发现拔出尿管后, 常出现排
尿困难等异常情况,为此某人用两种方法对传统的导尿方法进行改进,结果如下。问3种
方法排尿顺利率有无差别?
〖HT5”H〗〖STHZ〗〖JZ〗表79〓3组不同放尿方法第1次排尿的比较〖WT
BZ〗
〖HT5”SS〗〖STBZ〗〖BG(!〗〖BHDFG3,WK9。5W〗
比较组 〖〗 排尿顺利数 〖〗 不顺利数 〖〗 合计 〖〗 顺利率
(%)
〖BHDG2,WK9,WK9。4DWW〗 个体化放尿组 〖〗 〖JZ〗 38 〖〗 〖JZ〗
2 〖〗〖JZ〗 40 〖〗 〖JZ〗 95.0
〖BHDW〗 定时放尿组 〖〗 33 〖〗 7 〖〗 40 〖〗
82.5
〖BH〗 传统方法组 〖〗 19 〖〗 21 〖〗 40 〖〗
47.5
〖BHDG2〗 合计 〖〗 90 〖〗 30 〖〗 120〖〗
75.0 〖BG)F〗
〓〓注:个体化放尿指根据膀胱充盈度或尿意放尿〖HT5K〗〓〓
1.建立假设[HT5SS][WTBZ]
H0:3组放尿方法的排尿顺利率相等,即[WTBX]π1=π2=π3[WTB
Z]
H1:3组放尿方法的排尿顺利率不等或不全相等〖WTBX〗
α=0.05〖HTK〗
2.计算χ2统计量〓〖HTSS〗按式(7.11)计算。
χ2=120([SX(]382[]90×40[SX)]+[SX(]22[]30×40[SX)]+[SX(]33
2[]90×40[SX)]+[SX(]72[]30×40[SX)]+[SX(]192[]90×40[SX)]+[SX(]212[]30×
40[SX)]-1)=25.87〖HTK〗
3.确定统计量的P值〓[HTSS]
自由度(ν)=(行数-1)(列数-1)=(3-1)(2-1)=2, 查χ
2界值表,
本例χ2=25.87>χ20.05,2=5.99 , P<0.05,且χ2=2587>χ2
0.01,2=9.21,P<0.01。[HTK]
4.结论〓[HTSS]按α=0.05水准,本例P<0.01,拒绝〖WTBZ〗H0,接受H1,
3组率差别有显著性, 故不能认为3种方法排尿的顺利率相等。〖HTH〗
〖WTBX〗
(二)多个样本率的两两比较〖HTSS〗
当多个率比较的χ2检验结论为有显著性时,只能认为各总体率之间总的有
差别, 但不等于彼此之间两两均有差别,若要了解彼此的差别,需作χ2检验的两两比较
。
例7.4〓对表79资料3种放尿方法顺利率结果作进一步的两两比较。
首先列表710,本例个体化组和定时组的率差异最小,先作这2组的χ2检验
,χ2=2.00,ν=1,P>0.05,因此将两组合并,再将它与传统组比较,得χ2=2
4.2,P<0.001,说明传统方法与个体化组和定时组的率间差异有显著性,传统方法放尿顺利
率最低,定时组和个体化组两法无差别。应注意的是,表710的两个分割表的自由度之和
应等于例7.3的自由度,两个χ2值之和也应与例7.3资料的χ2值接近,否则说明有
误。
〖HT5”H〗〖STHZ〗〖JZ〗 表710〓 χ2分割两两比较计算
表
〖HT5”SS〗〖STBZ〗〖BG(!〗〖BHDFG3,WK6。7W〗
比较组 〖〗 顺利 〖〗 不顺利 〖〗 合计 〖〗 顺利率〖WTBZ〗(
%)〖〗〖WTBX〗 χ2值[] P值
[BHDG2,WK6,WK6。6DWW]
个体化组 []〖JZ〗 38 []〖JZ〗 2 [] 〖JZ〗 40 [] 〖JZ〗
95.0 [] 〖JZ〗 2.00 [] 〖JZ〗 >0.05
[BHDW] 定时组 [] 33 [] 7 [] 40 [] 82.5[]
[BHDG2] 个+定组 [] 71 [] 9 [] 80 [] 88.75 [] 24.2[
] <0.001
[BHDW] 传统组[] 19 [] 21 [] 40 [] 47.5[BG)F]
〓〓〓 注:个体化组与定时组比较因有理论数小于5,故采用校正的χ2 检验
计算
〖HT5SS〗
〖HT4”K〗〓〓三、两个分类指标关系的χ2检验〖HT〗〖HJ1〗〖HJ〗
〖HT5SS〗对一组观察对象观察两个分类的指标,整理为双向交叉排列的表,如
表711格式称为列联表。列联表资料主要用于推断两个分类或按等级分类的指标间是否存
在着相关关系。检验的公式仍为〖WTBZ〗R×C表的〖WTBX〗χ2检验公式。〖HTH〗〖WT
BZ〗
(一)R×C表的列联表资料〖HTSS〗
例7.5〓某人了解不同工作年限的护士与护理工作资料记录质量的关系,收集资
料整理如下表,问工作年限的长短与护理工作资料记录质量间有无关系?
〖HT5”H〗〖STHZ〗〖JZ〗
表711〓不同工作年限与护理记录质量的关系
〖HT5”SS〗〖STBZ〗〖BG(!〗〖BHDFG4,WK7,WK28,WK9W〗
工作年限(年)〖〗〖ZB(〗〖BHDG2,WK28W〗记录质量分类〖BHDG2,WK7。4W〗差〖〗中
〖〗良〖〗优〖ZB)〗〖〗合计
〖BHDG2,WK7ZQ,WK7DW,WK7DW,WK7DW,WK7DW,WK9DWW〗
<5[] 〖JZ〗 11(7.33) [] 〖JZ〗25(16.67) [] 〖JZ〗61(40.6
6)[] 〖JZ〗 53(35.33) [] 〖JZ〗 150
[BHDW] 5~10 [] 6(3.48) [] 22(12.79)[] 69(40.11)[] 75(43.05)
[] 172
[BH] >10 [] 4(2.74) [] 9( 6.16) [] 60(41.10)[] 73(50.00) []
146
[BHDG2] 合计 [] 21 [] 49 [] 190 [] 208 []
468〖BG)F〗
〓〓 注:表中括号内为各行的百分比数
〖HT5SS〗〓〓
本资料是由468名护士组成的一个样本,每个护士按工作年限和护理记录两个指
标分类,
清点分类的个数构成表711列联表,目的是了解工作年限与记录质量两个指标间是
否有关系。
检验步骤:〖HTK〗
1.建立假设[HTSS]
H0:护理工作时间与护理记录质量间无关系, 即各工作年限护理记录质
量的百分比相同
H1:护理工作时间与护理记录质量间有关系,即各工作年限护理记录质量
的百分比不同[HTK]〖WTBX〗
2.确定检验水准〓〖HTSS〗α=0.05〖HTK〗
3.计算χ2值〓〖HTSS〗按公式(7.11)计算。
χ2=468([SX(]112[]150×21[SX)]+[SX(]252[]150×49[SX)]+[SX(
]612[]150×190[SX)]+[SX(]562[]150×208[SX)]+[SX(]62[]172×21[SX)]+[SX(]22
2[]172×49[SX)]+[SX(]692[]172×190[SX)]+[SX(]792[]172×208[SX)]+[SX(]42[
]146×21[SX)]+[SX(]92[]146×49[SX)]+[SX(]602[]146×190[SX)]+[SX(]732[]146
×208[SX)]-1)=29.88〖HTK〗
4.确定P值〓[HTSS]
本例自由度(ν)=(3-1)(4-1)=6,查χ2界值表,χ20.05,6=
12.59,χ2=29.88>χ20.05,6
,P<0.05;并且29.88>χ20.01,6=16.81,P<0.01。〖HTK〗
5.结论〓[HTSS]在α=0.05水准上,P<0.01,拒绝〖WTBZ〗H0,认为护理工作
时间与护理记录质量间有关,工作时间越长,护理记录质量越好。〖HTH〗
〖WTBX〗
(二)行×列表计算χ2检验时的注意事项〖HTSS〗
1. χ2检验要求理论频数不宜太小,否则结论有误。一般要求行×列表不宜
有1/5 以上的格子数的理论频数小于5,或有一个理论频数小于1。如不满足此要求的资料
最好
的方法是增加例数或合并相应的组,满足以上条件。
2. 如比较组的效应是按强弱(或优劣)等单向分组的等级资料,如表7
12资料,
比较两组疗效的差别,最好用第八章的秩和检验方法。χ2检验只能说明各处理组
疗效的构成比之间有无差别。
〖HT5”H〗〖STHZ〗〖JZ〗表712〓 某病两组疗效的比较
〖HT5”SS〗〖STBZ〗〖BG(!〗〖BHDFG3,WK7。6W〗
组别 〖〗 显效 〖〗 有效 〖〗 好转 〖〗 无效 〖〗 合
计
〖BHDG2,WK7,WK7。5DWW〗 甲组 〖〗 〖JZ〗5 〖〗 〖JZ〗7
〖〗 〖JZ〗 12 〖〗 〖JZ〗 4 〖〗 〖JZ〗 28
〖BHDW〗 乙组 〖〗 12 〖〗 10 〖〗 7 〖〗 1 〖〗
30〖BG)F〗
〖JY〗〖HT5K〗(孟〓虹)〓〓
〖LM〗
〖HS7〗〖HT2XBS〗〖JZ〗 第八章〓非参数统计方法
〖HT5SS〗〓〓〖WTBX〗
前面所述的t检验、u检验及方差分析几种计量资料的检验方法,均假定比较的样
本来自
已知为正态或近似正态分布的总体,在这个假设的前提下计算某分布的统计量(
如t值、
u值、F值),比较样本均数有无差别,从而推断总体均数(参数)是否不同,此种方
法称
为参数检验或参数统计方法。实际工作中常常有未知比较资料的总体分布或资料不满足参
数检验的条件,此时可用非参数检验。非参数统计方法很多,本章仅介绍较常用的秩和检验
方法。它是将比较组的数据(变量值)从小至大排列,并统一由小到大分别给予每个变量值
一个顺序号,称为秩次,即用秩次的大小代替原始数据,再计算各组秩次之和,用秩和进
行假设检验,故称为秩和检验(Rank sum test)。由于它在进行比较时不计算参数的
估计值(即均数),而是通过比较组间的分布是否一致来判断组间差别,故又称非参数检验
。
秩和检验的适用范围很广,可用于比较计量资料、等级资料组间的差别有无显著
性,应用时不要求了解被比较资料的总体分布类型。它主要用于以下几种情况:
1)偏态分布或分布不明的计量资料组间的比较;
2)比较组间的方差相差悬殊(即方差不齐)的资料;
3)按等级分类的资料组间的比较;
4)计量资料的某些数据一端无界(如某变量值为<0.01〖WTBZ〗 μg),这种类
型的不同组间的比较。
秩和检验的方法视比较组间的设计类型而有所不同。下面介绍几种常用秩和检验方法。
〖HS4〗〖HT3H〗〖JZ〗第一节〓成对设计资料差值的秩和检验
〖HT〗〖HT4”K〗〓〓一、差值符号的秩和检验〖HT〗〖HJ1〗〖HJ〗
〖HT5SS〗符号的秩和检验(Signed rank test)是由Wilcoxon首次提出,又称Wilcoxon法。
主要用于两组的配对设计数据的检验。方法和步骤见例8.1。
例8.1〓在眼科患者护理中为眼科患者滴眼药时,要求护士每滴一位患者后洗手消
毒,费时费力。为了解用酒精消毒手指是否达到操作的合格标准,由一名护士对10名患者在
滴药前后应用酒精消毒手指,并均作细菌培养,结果见表81。问该法是否有效?
(1)检验假设〓H0:差值的总体中位数〖WTBX〗M〖WTBZ〗d=0(即消毒前后的
细菌数相等)
H1:〖WTBX〗 M〖WTBZ〗d≠0 即消毒前后的细菌数不等
(2)检验水准〓 α=0.05
(3) 求差值〓 见表81第(4)栏。
(4) 编秩并求正、负秩和〓按差值的绝对值由小到大编秩次, 再根据差值的正负号
给秩次加上正负号后求出各正、负秩次的和,〖WTBX〗记为T+和T-。
〖HT5”H〗〖STHZ〗〖JZ〗表81〓消毒前后手指细菌数的比较
〖HT5”SS〗〖STBZ〗〖BG(!〗〖BHDFG4,WK9。5W〗患者号(1)〖〗消毒前(2)〖〗消毒
后(3)
〖〗差值(4)=(2)-(3)[]〖ZB(〗〖BHDG2,WK9W〗秩次(5)〖BHDG2,WK4*2。2W〗负〖〗正
〖ZB)〗
〖BHDG1*3/4,WK9。4DW,WK4*2DW,WK4*2DWW〗
[JZ] 1 〖〗 [JZ] 10 〖〗 [JZ] 5[] [JZ] 5 []
〖〗[JZ] 5
[BHDW] 2 [] 7 [] 7 [] 0 [] - 0.5 [] 0.
5
[BH] 3 [] 12 [] 8 [] 4 []〖〗 3
[BH] 4 [] 9 [] 10 [] -1 [] - 2
[BH] 5 [] 14 [] 6 [] 8 [] 〖〗 10
[BH] 6 [] 12 [] 5 [] 7 [] 〖〗 9
[BH] 7 [] 10 [] 6 [] 4 [] 〖〗4
[BH] 8 [] 10 [] 4 [] 6 [] 〖〗6
[BH] 9 [] 12 [] 6 [] 6 [] 〖〗7
[BH] 10 [] 13 [] 7 [] 6 [] 〖〗8
[BHD][5]〖WTBX〗 T-=2.5 []
T+=52.5〖BG)F〗〖HT5SS〗〖WTBX〗
(5) 确定秩和的概率值〓 当n≤25时,可用T+或T-的秩和查T界值表(附表7)。
本例n=10,双侧界值T0.05,10=8,T0.01,10=3,本例T-=2.
5<T0.01,10,
P<0.01。如用T+=52.5查表,T+=52.5>T0.01,10=52,P<0.01,
结论相同。
(6)结论〓在α=0.05水准上,P<0.01,拒绝〖WTBZ〗H0,〖WTBX〗差值的差异有
显著性,认为用酒精消毒后能减少细菌数。
〖HS2〗〖HT4”K〗〓〓二、正态近似法
〖HT5SS〗当n(对子数)>25时,超出附表7范围时,按式(8.1)计算u值判断。
〖JZ〗u=[SX(] |T-n(n+1)/4|-0.5[][KF(]n(n+1)(2n+1
)/24[KF)][SX)]〖KH-1*2〗[JY](8.1)〓〓〖HJ1*2〗〖HJ〗
如u≥1.96或u≥2.58,P≤0.05或P≤0.01,均表示差异有显著性,拒绝H0
。
本法的基本思想:假设两法结果相同,理论上各差值应为0或相差不大,则正、负
秩次的秩和应相等或正、负秩和与n(n+1)/4相差不大,当正秩和即T+>T0.05界值
或负秩和即T-<T0.05界值时,P均<0.05,认为差值是抽样误差造成的可能性较小
,拒绝〖WTBZ〗H0,〖WTBX〗认为两法不同。
〖HS4〗〖HT3H〗〖JZ〗第二节〓成组设计资料比较的秩和检验〖HT〗
〖HT〗〖HT4”K〗〓〓一、原始数据的两组比较〖HT〗〖HJ1〗〖HJ〗
〖HT5SS〗
例8.2〓有人研究患肺心病与慢支合并肺气肿患者的PCO2是否不同,
测得结果如下表。〖LM〗
〖HT5”H〗〖WT5”HZ〗〖ST5”HZ〗〖JZ〗 表82〓两组患者PCO2
测得结果值
〖HT5”SS〗〖WTBZ〗〖STBZ〗〖BG(!〗〖BHDFG4,WK22,WK1,WK22W〗
〖ZB(〗〖BHDG2,WK22W〗肺心病组〖BHDG2,WK11,WK11W〗PCO2〖〗秩号〖ZB)〗
〖〗〖
〗〖ZB(〗〖BHDG2,WK22W〗慢支并肺气肿组〖BHDG2,WK11,WK11W〗PCO2〖〗秩
号〖ZB)〗
〖BHDG1*3/4,WK11,WK11DW,WK1,WK11,WK11DWW〗
29.5 []〖JZ〗 1 [][] 31.0[] 〖JZ〗 2
[BHDW] 38.5 [] 4 [][] 36.5 [] 3
[BH] 48.0 [] 10 [][] 40.0 [] 5
[BH] 57.0 [] 13[][] 41.0 [] 6
[BH] 60.0 [] 14.5[][] 42.0 [] 7
[BH] 66.6 [] 16 [][] 42.5 [] 8
[BH] 69.0 [] 17 [][] 44.0 [] 9
[BH] 74.0 [] 18 [][] 50.0 [] 11
[BH] 80.0 [] 19 [][] 52.0[] 12
[BH] 86.0 [] 20[][] 60.0 [] 14.5
[BH] 88.0 [] 21
[BH] 95.0 [] 22
[BHDG2]〖WTBX〗 n2=12 [] T2=175.5 [][] n1=10 [] T
1=77.5
[BG)F]〖HT5SS〗 〖WTBZ〗
已知两组方差不齐,故用秩和检验加以比较。方法及计算步骤:
(1)建立假设
H0:两组患者的PCO2值总体分布位置相同
H1:两组患者的PCO2值总体分布位置不同
α=0.05
(2)编秩〓将两组数据各自从小到大排队,再将两组数据由小到大统一编秩次。
若两组中有相同大小的数据,如上表各组中都有一个PCO2为60的值,应编秩次14和
15号,均取平均秩次,为(14+15)/2=14.5,若相同大小的值在同一组内,可不必取平均
。
〖WTBX〗(3) 求秩和T1或T2〓当两组例数不等时,以例数较小者为n1,
并用其秩和为检验的统计量T
值,查表(附表8)作检验。当两组例数相等,可任用一组的T值查表。本例的n1=10,检验
的统计量T1=
77.5。
(4) 确定统计量T的P值〓查两组比较秩和检验的T界值表(附表8)。
用表中n1与n2-n1的交叉处的4行范围值与计算的T值相比较,若计算
的秩和T值是落在大的范围值侧,判断方法是:T越大,P值越小。若计算的秩和T是落在小的
范围侧
, 判断的方法是:T越小,P值越小。本例n1=10,n2-n1=2,计算的T值为77.5,落
在左侧79和76范围中,故0.01<P<0.02。
(5)结论〓按双侧α=0.05水准,P<0.02,〖WTBZ〗拒绝H0,两组的PCO
2值
差别有显著性。 肺心病组的平均秩次=175/12=14.58,慢支合并肺气肿组的平均秩次=77.
5/10=7.75,
故认为肺心病组患者的PCO2要高于慢支合并肺气肿患者。〖HS2〗〖HT4”K〗〓
〓二、频数表资料或等级资料的两组比较〖HT5SS〗
〖WTBX〗 当n1或n2-n1的数值超出附表8范围,用公式(8.2)计算u值
作检验。
〖JZ〗u=[SX(] |T1-n1(N+1)/2|-0.5[][KF(]n1n2(N+1)/12[KF
)][SX)]〖KH-1*2〗[JY](8.2)〓〓〖HJ1*2〗〖HJ〗
如u≥1.96或u≥2.58,P≤0.05或P≤0.01,均表示两组差异有显著性。但在相同
秩次出现较多的情况下,如等级资料或频数表资料的比较,由于相同秩次的影响,使u值计
算偏
小, 应按公式(8.3)校正,u〖WTBZ〗C〖WTBX〗增大,P值相应减小。
〖JZ〗uC=[SX(]u[][KF(]〖WTBZ〗C〖WTBX〗[KF)][SX)]〖KH-1*2〗[JY](8.3)〓〓〖HJ
1*2〗〖HJ〗
式中〖WTBZ〗C=1-Σ〖WTBX〗(tj3-tj)/(N3-N), tj为第j个相同
秩次的个数,N=n1+n2。
例8.3〓有人调查了不同学历护士对护理资料记录的质量,结果如下表中(1)
~(3)栏,问学历的高低反映在护理资料记录的质量上有无不同?
〖HT5H〗〖ST5”HZ〗〖JZ〗 表83〓不同学历的护士护理资料记录的比较
〖HT5”SS〗〖ST5”BZ〗〖BG(!〗〖BHDFG6,WK6,WK12,WK3,WK5,WK5,WK14W〗
资料记录结果(1)〖〗〖ZB(〗〖BHDG2,WK12W〗比较组〖BHDG4,WK6,WK6W〗中专(2
)〖〗大专及以上(3)〖ZB)〗〖〗〖HS2〗[JZ]合计〖JZ〗(4)〖〗秩次范围(5)〖〗
平均秩次(6)〖
〗〖ZB(〗〖BHDG2,WK14W〗秩和〖BHDG4,WK7,WK7W〗中专组(7)=(2)×(6)[]大专组(
8)=(3)×(6)〖ZB)〗
〖BHDG2,WK6,WK6DW,WK6DW,WK3DW,WK5,WK5,WK7DW,WK7DWW〗
优 〖〗 〖JZ〗 134 〖〗 〖JZ〗 74 〖〗 〖JZ〗 208 〖〗 〓1
~208 〖〗 104.5〖〗〖JZ〗 14003 〖〗 〖JZ〗 7733
〖BHDW〗良 〖〗 139 〖〗 51 〖〗 190 〖〗 209~398 〖〗
303.5 〖〗 42186.5 〖〗 15478.5
〖BH〗中 〖〗 39 〖〗 20 〖〗 59 〖〗 399~457 〖〗
428.0 〖〗 16692 〖〗 8560
〖BH〗差 〖〗 20 〖〗 1 〖〗 21 〖〗 458~478 〖〗
468.0 〖〗 9360 〖〗 468
〖BHDG2,WK6,WK6DW,WK6DW,WK3DW,WK5,WK5,WK7,WK7W〗
合计 〖〗 〖JZ〗 332 〖〗〖JZ〗 146 〖〗 〖JZ〗 478 〖〗〖〗
〖〗
[JZ]T2=82241.5 [][JZ]T1=32239.5[BG)F]〖HT5SS〗〖WTBZ〗
(1)建立检验假设
H0:两组资料记录的结果分布位置相同
H1:两组资料记录的结果分布位置不同〖WTBX〗
α=0.05
(2)编秩次范围〓先计算出两组各等级的合计见第(4)栏。 再对各等级合计数编制
秩次范
围,结果为“优”等级的例数共208例,其秩次(序号)的范围为1~208,则该等级
的平均秩次为
(1+208)/2=104.5。其他等级计算类推,得表83的第(5)、(6)栏。
(3)计算各比较组的等级秩和〓例如中专组“优”等级的秩和为134×104.5=14003
, 其他
类推及各自的总秩和T1和T2,见第(7)和第(8)栏及合计栏。
(4)计算检验的统计量u值〓用正态近似法的u检验,本例的n1=146,T1=32239.
5,代入公式
(8.2)计算u值。 由于本例每个等级都有相同秩次,故用公式(8.3)加以校正。
按式(8.2)〓 u= 〖SX(〗 |32239.5-146
(478+1)/2|-0.5〖〗〖KF(〗146×332(478+1)/12[KF)][SX)]=1.96
按式(8.3)〓 〖WTBZ〗C〖WTBX〗=1-[SX(] (2083-208)+(1903-19
0)+(593-59)+(213-21)[]4783-478〖SX)〗=0.8528
u[WTBZ]C=1.96/[KF(]0.8528[KF)]=2.12
(5)确定〖WTBX〗P值和作出结论〓本例 〖WTBX〗u〖WTBZ〗C=2.12>1.96,
〖WTBX〗P<0.05,差别有显著性。按α=0.05 ,〖WTBZ〗
拒绝H0,可认为两组资料记录资料的分布不同,大专学历护士资料记录的优良比例
高于中专
学历。〖WTBX〗
本法的基本思想: 假定n1和n2两个样本数据来自同一总体(或分布相同的
两个总体),
则n1组的秩次(或变量值)和n2组的秩次排列应是随机的,即n1组或n2组的
秩和T应与各组的理论秩和,即n1(N+1)或n2(N+1)相差不大,若相差悬殊,超过所规
定的检验
水准的界值,
表示抽到现有统计量T的概率很小,〖WTBZ〗H0成立的可能性不大。反之,则不拒
绝无效假设。
〖HS4〗〖HT3H〗〖JZ〗 第三节〓多组资料比较的秩和检验
〖HT〗〖WTBX〗〖HT4”K〗〓〓一、多组资料比较的H检验〖HT〗〖HJ1〗[HJ]
〖HT5SS〗〖WTBZ〗多组资料进行比较,按其设计的不同,秩和检验的方法不同,本节仅介
绍完全随
机分组设计的检验方法——KruskaiWallis法,又称〖WTBX〗H检验,以及相应的各组间相
互比较的检验方法。
〖HTH〗(一)方法与步骤〖HTSS〗
例8.4〓某人在研究睡眠对人心情的影响时,用18例研究对象随机分为3组,比
较了不同的睡眠效果对心情的得分,第1组为无干扰组,第2组睡熟后人为打断两次,第3组
睡熟后
人为打断4次,结果如下表。问不同的睡眠效果对心情有无影响?
〖HT5”H〗〖STHZ〗〖JZ〗表84〓不同睡眠效果的心情得分
〖HT5”SS〗〖STBZ〗〖BG(!〗〖BHDFG4,WK2,WK14,WK1,WK14,WK1,WK14W〗
[]〖ZB(〗〖BHDG2,WK14W〗第1组〖BHDG2,WK7,WK7W〗得分〖〗秩次〖ZB)〗〖〗〖〗〖Z
B(
〗〖BHDG2,WK14W〗第2组〖BHDG2,WK7,WK7W〗得分〖〗秩次〖ZB)〗〖〗〖〗〖ZB(〗〖B
HDG2,WK14W〗第3组〖BHDG2,WK7,WK7W〗得分〖〗秩次〖ZB)〗
〖BHDG1*3/4,WK2,WK7,WK7DW,WK1,WK7DW,WK7DW,WK1,WK7DW,WK7DWW〗
[] 3 〖〗 〖JZ〗 1 〖〗〖〗〖JZ〗 6 〖〗〖JZ〗 3.5
〖〗〖〗 〖JZ〗 9 〖〗〖JZ〗 10
〖BHDW〗 [] 5 [] 2 [][] 7 [] 5.5 [][] 10[]
13
[BH][] 6 [] 3.5 [][] 8 [] 7.5 [][] 11[]
15.5
[BH][] 7 [] 5.5 [][] 9 [] 10 [][] 12 []
17
[BH][] 8 [] 7.5[][] 10 [] 13 [][] 15 []
18
[BH][] 9 [] 10 [][] 10 [] 13
[BH][5] 11 [] 15.5
[BHDG2] Ri [][] 29.5 [][][] 68.0[][][]
73.5
[BHDW] ni〖〗 6 〖〗〖〗〖〗 7 〖〗〖〗〖〗
5〖BG)F〗〖HT5SS〗〖WTBZ〗
(1)建立检验假设
H0 : 3组睡眠后心情得分的总体分布相同
H1 : 3组睡眠后心情得分的总体分布不同或不全相同〖WTBX〗
α=0.05
(2)编秩〓将各组得分由小到大排列,再将3组数据统一由小到大编秩, 如有
数据相同
时,将位置顺序号相加后求平均秩次。如本例得分为9的数据有3个, 分别在不同的
3个组
内,其平均秩次为(9+10+11)/3=10。
(3)求各组秩和〓将上表各组秩次相加为各组秩和〖WTBX〗Ri,下标i表示组号
(i=1,2,3,…,k)。
(4)计算检验统计量H值〓按公式(8.4)计算。
〖JZ〗H=〖SX(〗12〖〗N(N+1)[SX)]Σ[SX(]Ri2[]ni[SX)]-
3(N+1)〖KH-1*2〗 [JY](8.4)〓〓〖HJ1*2〗〖HJ〗
式中ni为各组的例数,N为各组例数之和。本例:
H=[SX(]12[]18(18+1)[SX)]([SX(]29.52[]6[SX)]+[SX(]68.02[]7[SX)]+[SX(]73.52[
]5[SX)])-3(18+1)=9.17
(5)确定P值并作出推断〓若组数k=3,N>15,最小组例数不小于5,此时H值近似地
服从ν=
k-1的χ2分布。 本例ν=3-1=2,查χ2界值表(附表6),得χ20.05,2
=5.99, 本例χ2=9.17>χ20.05,2,
P<0.05。按α=0.05水准,〖WTBZ〗拒绝H0,接受H1,3组人不同睡眠后心情的
得分是不同的。〖HTH〗〖WTHX〗
(二)H值的校正 〖HTSS〗〖WTBX〗在各等级相同秩次较多时,由式(8.4)计算
的H值偏低,应对其进行校正,校正公式为:
〖JZ〗H〖WTBZ〗C〖WTBX〗=H/〖WTBZ〗C, C=1-Σ〖WTBX〗(tj3-
tj)〖KH-1〗〖JY〗 (8.5)〓〓
例8.5〓据报道吹氧疗法可加速口腔溃疡的愈合,干扰素又有提高免疫力作用,
有人选择了123例因肿瘤放疗和化疗产生的口腔溃疡患者,随机分成3组,比较了传统的锡类
散、 吹氧法、干扰素3种疗法对口腔溃疡的疗效,结果见表85, 问吹氧法和干扰素能否
提高口腔溃疡的治愈率?
〖HT5”H〗〖STHZ〗〖JZ〗表85〓3组口腔溃疡患者疗效的比较
〖HT5”SS〗〖STBZ〗〖BG(!〗〖BHDFG2,WK6。7W〗
疗效 〖〗 锡类散组 〖〗 干扰素组〖〗 吹+干组 〖〗 合计 〖〗 秩次范
围 〖〗 平均秩次
〖BHDW〗 (1) 〖〗 (2) 〖〗 (3) 〖〗 (4) 〖〗 (5) 〖〗
(6) 〖〗 (7)
〖BHDG2,WK6,WK6。6DWW〗
无效 〖〗 〖JZ〗19 〖〗 〖JZ〗 8 〖〗 〖JZ〗 2 〖〗
〖JZ〗 29 〖〗 〖JZ〗 1~29〖〗 〖JZ〗 15
〖BHDW〗 好转 〖〗 19 〖〗 23 〖〗 15 〖〗 57 〖〗
30~86 〖〗 58
〖BH〗 显效 〖〗 2 〖〗 10 〖〗 25 〖〗 37 〖〗
87~123 〖〗 105
〖BHDG2〗 ni 〖〗 40 〖〗 41 〖〗 42 〖〗 123
〖BHDW〗 Ri 〖〗 1597 〖〗 2504 〖〗 3525
〖BH〗 〖AKR-〗i 〖〗 39.93 〖〗 61.07 〖〗 83.93〖BG)F〗
〖HT5SS〗
(1)建立假设〖WTBZ〗
H0:3组方法疗效分布位置相同,即不同的处理无作用
H1:3组方法疗效分布位置不同或不全相同,即不同的处理有作用
〖WTBX〗
α=0.05
(2)编秩次〓先计算各等级的合计数和确定各等级秩次的序号范围,然后计算平均秩
次, 见表85的第(5)~(7)栏。方法与两组等级资料编秩次方法相同。
(3)求各组秩和(Ri)〓如锡类散组秩和为R1=19×15+19×58+2×105=15
97,该组的平均秩次〖AKR-〗1=1597/40=39.93,其他组类推并记录在表85下半部
。
〖HT5SS〗
(4)计算检验的统计量H值
H=[SX(]12[]123(123+1)[SX)]([SX(]15972[]40[SX)]+[SX(]25042[]41[SX)]+[SX(]3525
2[]42[SX)])-3(123+1)=31.25
本例由于各组有相同的秩次,按式(8.5)计算校正值H〖WTBZ〗c。
C〖WTBX〗=1-[(293-29)+(573-57)+(373-37)]/(1233-123)=0.8602
H=31.25/0.8602=36.33
(5)确定P值〓查χ2界值表(附表6)得出计算统计量H的P值。此时自由度ν=组数
-1, 本例ν=3-1=2,查χ2界值表,χ20.05,2=5.99,χ20.01,2=9.2
1,H=36.33>9.21,P<0.01。
(6)结论〓在α=0.05水准上,P<0.01,拒绝H0,3组疗效差别有显著性。3组方法
疗法的效果是不同或不全相同的。
〖HS2〗〖HT4”K〗〓〓二、多组资料间的两两比较〖HT5SS〗
当秩和检验计算的H值拒绝〖WTBZ〗H0,认为各总体的分布不同或不全同时,
需要进一步作样本之间两两比较秩和检验,以推断比较的总体何者之间不同。检验的步骤与
方差分析的〖WTBX〗q 检验类似,检验统计量t值的计算见公式(8.6)。
〖JZ〗
t=[SX(]|[AKR-]A-[AKR-]B|[][KF(][SX(]N(N+1)(N-1-H)[]12(N-k)[SX)]([S
X(]1[]nA[SX)]+[SX(]1[]nB[SX)])[KF)][SX)]
〖KH-2〗[JY](8.6)〓〓
式中[AKR-]A和[AKR-]B为任何两比较组的平均秩次,例如[AKR-]
A=R
A/nA。nA和nB为任何两比较组的例数,N为各组例数之和,k为比较
的组数,H为多组资料比较中计算的H值。
例8.6〓对例8.5资料(表85)作3个样本组间的两两比较,以确定不同组间的差别
。计算和步骤见表86。
〖HT5”H〗〖STHZ〗〖JZ〗 表86〓 3组口腔溃疡疗效的两两比较
〖HT5”SS〗〖STBZ〗〖BG(!〗〖BHDFG4,WK7,WK7,WK14,WK7,WK7W〗
对比组A与B〖〗 |[AKR-]A-[AKR-]B |〖〗[ZB(]〖BH
DG
2,WK14W〗样本例数 〖BHDG2,WK7,WK7W〗nA[]nB[ZB)][] t []
P
[BHDG2,WK7。6W]
1与2 [] 21.14 [] 40 [] 41 [] 3.07 [] <0.005
[BHDW] 1与3 [] 44.00 [] 40 [] 42 [] 6.42 [] <0
.001
[BH] 2与3 [] 22.86 [] 41[] 42 [] 3.36 [] <0.0
05[BG)F]〖HT5SS〗
疗效组〓〓 锡类散组〓 干扰素组 〓 吹+干组
编号〓〓〓〓 1 〓〓〓〓〓 2 〓〓〓〓〓 3
平均秩次 〓 39.93 〓〓〓61.07 〓〓〓 83.93
〖HT5SS〗检验步骤:[WTBZ]
(1)建立假设H0:任意比较的两组口腔溃疡疗效的总体分布相同
H1:任意比较的两组口腔溃疡疗效的总体分布不同〖WTBX〗
α=0.05
(2)列出两两比较的计算表〓如表86,按公式(8.6)计算各比较组的t值。例如第1组
与第 2组比较的t
值计算如下,余类推。
t=[SX(]39.93-61.07[][KF(][SX(]123(123+1)(123-1-31.25)[]12(123-3)[SX)]([SX(]1[]40
[SX)]+[SX(]1[]41[SX)])[KF)][SX)]=3.068
(3)确定统计量t的P值〓自由度ν=N-K。本例ν=123-3=120,查t界值
表(附表2),ν近似为
100,t0.05,100=1.98,t0.01,100=2.58,与本例的t=3.07,6.42
,3.36作比较,得出P
值写在表中。
(4)结论〓按α=0.05水准,各组的比较均拒绝〖WTBZ〗H0,两两组间差别均有显
著性。 因疗效秩次是由差到好排序,故各组的平均秩次〖AKR-〗越高,即疗效越好。
本例由各组的平均秩次可
见, 单纯用干扰素的疗效优于传统的方法,但干扰素+吹氧法合用的疗效又好于单纯用干
扰素和传统方法。
秩和检验的主要优点是:
1)应用范围较广泛,无论样本资料所来自的总体分布形式如何,均能使用;
2)方法简便,易于掌握。
其缺点是对于适用参数检验方法的计量资料,若用非参数检验处理,常会损失部分
信息,非参数检验只考虑数据的大小,而数据大小的程度信息被丢失,降低了检验效率。
〖JY〗〖HT5K〗(孟〓虹)〓〓
〖LM〗
〖HS7〗〖HT2XBS〗〖JZ〗
第九章〓直线相关与回归分析〖HT5SS〗〓〓
前面各章讨论的是一个变量的统计处理方法,即同一指标(变量)在两组或多组
中的比较。
但各种事物或疾病的存在和发展都是相互关联的,例如医学中的体温与脉搏、年龄与
血压的高低、病情与疗效的好坏之间常有一定关系。在医学和护理工作及科研
中,常常要了解某个研究的变量(指标)与另一个或多个变量(指标)间的关系及关系的程
度,
以达到对事物的变化有科学的解释或控制影响变量、预测研究变量的目的。相关和回归分析
就
是研究这种关系的统计方法。
〖HS4〗〖HT3H〗〖JZ〗 第一节〓直线相关分析
〖HT〗〖HT4”K〗〓〓一、相关系数的意义〖HT〗〖HJ1〗〖HJ〗〖HT5SS〗
〖WTBX〗 当一个变量值(X)在数量上增加,另一个变量值(Y)随之也增加或减少
(见图91), 称两个变量之间有相关关系(或称协同变化关系)。直线关系是变量间关系中
最简单的一种关系。
统计中用相关系数(r)定量地描述两个变量间直线关系的方向以及关系的密切程度。
两个变量间(X和Y)关系的密切程度和方向可由图91散点图直观地说明。
〖KH+60mm〗
〖HT5”H〗〖JZ〗 〖STHZ〗 图91〓相关系数示意图
〖HT5SS〗〖ST5BZ〗〓〓
由图91可见,相关系数r有以下性质和特征:
1.相关系数r的值是波动在-1~1范围,r为正数时, 两变量间为
正相关关系,即随着X变量值的增加,Y变量值也增加。r为负数时,两变量间为负相
关关系,
即随着X变量值的增加,Y变量值随之减少。
2.相关系数r的绝对值越大,两变量的关系越密切,|r|=1时,两个变量间
关系为
一一对应的函数关系,称为完全相关;|r|在0~1范围内, 两个变量间呈并非是一
一
对应的不确定关系,称为不完全相关;r=0,即随着X变量的增加,另一个变量不变, 称两
个变量间无关系或无线性相关关系。
3.相关分析中两个变量有相关关系,并不表明二者是因果关系,即Y 变量的变化
并不一定
是由于X变量的变化而造成,两者可能是一种伴随关系。因此,相关分析中X变量和Y
变量可以任意指定。
〖HT〗〖HS2〗〖HT4”K〗〓〓二、相关系数的计算方法〖HT5SS〗[WTBZ]
相关系数(Correlation coefficient)又称为积差相关系数,用符号[WTBX]r表
示,它是说明具有直线关系的两个变量间的相关关系的密切程度和方向的指标,又称简单相
关系数
。它没有单位,不同资料的r可以做比较。计算的公式为式(9.1):
〖JZ〗r=〖SX(〗 [WTBZ]Σ[WTBX](X-[A
KX-])(Y-[AKY-])〖〗〖KF(〗
Σ(X-〖AKX-〗)2Σ(Y-[AKY-])2〖KF)〗〖SX)〗=[SX(]l
XY〖〗〖KF(〗lXXlYY〖KF)〗〖SX)〗〖KH-1*2〗〖JY〗(9.1)〓〓〖
HJ1*2〗〖HJ〗
式中[AKX-]和[AKY-]分别为X变量和Y变量的均数,分母中的[WTBZ]Σ[WTBX](X-
[AKX-])
2和[WTBZ]Σ[WTBX](Y-[AKY-])2为X和Y变量的离均差平方和,分子中的[WTBZ]Σ[WTBX]
(X-[AKX-])(Y-[AKY-])为X和Y变量的离均差积和,为计算上的方
便,可将分子、分母分别按下式计算。
〖JZ〗lxy=[WTBZ]Σ[WTBX](X-[AKX-])(Y-[AKY-])=[WTBZ]Σ[WTB
X]XY-〖SX(〗
([WTBZ]Σ[WTBX]X)([WTBZ]Σ[WTBX]Y)〖〗n
〖SX)〗〖KH-1*2〗〖JY〗(9.2)〓〓〖HJ1*2〗〖HJ〗
〖JZ〗
lxx=[WTBZ]Σ[WTBX](X-[AKX-])2=[WTBZ]Σ[WTBX]X2-
([WTBZ]Σ[WTBZ]X)2/n〖KH-1〗〖JY〗(9.3)〓〓
〖JZ〗
lyy=[WTBZ]Σ[WTBX](Y-[AKY-])2=[WTBZ]Σ[WTBX]Y2-
([WTBZ]Σ[WTBX]Y)2/n〖KH-1〗〖JY〗(9.4)〓〓
例9.1〓某人研究血清胆固醇与低密度脂蛋白含量之间的关系,得数据如下表,
问两指标间是否有相关关系?
〖HT5”H〗〖STHZ〗〖JZ〗表91〓8名健康成人血清胆固醇与低密度脂蛋白含
量
〖HT5”SS〗〖STBZ〗〖BG(!〗〖BHDFG4,WK7。6W〗受试者编号〖〗血清胆固醇〖WTBX
〗(X)〖〗脂蛋白(Y)〖〗X2[]Y2[]XY
〖BHDG1*2,WK7,WK7。5DWW〗
1[] 〖JZ〗 4.27 [] 〖JZ〗 0.80 []〖JZ〗 18.2329[] 〖JZ
〗 0.6400 [] 〖JZ〗3.416
[BHDW] 2 [] 5.17 [] 1.23 [] 26.7289 [] 1.5129 [] 6.359
1
[BH] 3 [] 5.69 [] 1.31 [] 32.7289 [] 1.7161 [] 7.4539
[BH] 4 [] 5.17 [] 1.33 [] 26.7289 [] 1.7689[] 6.8761
[BH] 5 [] 3.77 [] 0.68 [] 14.2129 [] 0.4624 [] 2.5639
[BH] 6 [] 5.17 [] 1.12 [] 26.7289 [] 1.2544 [] 5.7904
[BH] 7 [] 5.66 [] 1.29 [] 32.0356 [] 1.6641 [] 7.3014
[BH] 8 [] 3.31 [] 0.46 [] 10.9561 [] 0.2116 [] 1.5226
[BHDG2] 合计 [] 38.21 [] 8.22 [] 188.0003 [] 9.2304[] 41.28
31[BG)F]〖HT5SS〗
按式(9.2)、(9.3)、(9.4)计算得:
lXY=[WTBZ]Σ[WTBX]XY-[SX(] ([WTBZ]Σ[WT
BX]X[WTBZ])(Σ[WTBX]Y) []n[SX)]
= 41.2831-[SX(]38.21×8.22[]8[SX)]
=2.0223
lXX=[WTBZ]Σ[WTBX]X2-〖SX(〗 [WTBZ] (
Σ[WTBX]X)2[]n[SX)]=188.003 -[SX(]38.212〖〗8〖SX)〗 =5.4998
lYY= [WTBZ] Σ[WTBX]Y2-[SX(] [WTBZ
] (Σ[WTBX]Y)2[]n[SX)]
=9.2304 - [SX(]8.222[]8[SX)]=0.78435
按式(9.1)得:
r=[SX(]2.0223[][KF(]5.4998×0.7844〖KF)〗〖SX)〗=0.9737
r为正值,表示血清胆固醇和脂蛋白含量之间为正相关关系, 即血清胆固醇含量
高的,低密度脂蛋白含量也高,r=0.9737,两变量的关系较密切。〖HS2〗〖HT4”K〗〓
〓三、相关系数的假设检验〖HT5SS〗
例9.1是用8例观察对象的指标值所计算的样本相关系数,与前面所计算的
样本均数一样,
r的大小同样存在抽样误差的影响,即从两个无关的数据(即总体相关系数ρ=0)
中抽样,
计算的r值也不会等于零。因此,为了判断两个变量间是否真正存在相关关系, 要对
样本相关系数r作假设检验,常用的检验方法有以下两种。〖HTH〗
(一)相关系数r的tr检验〖HTSS〗
〖JZ〗tr= 〖SX(〗 r-ρ 〖〗Sr[SX)]=[SX(]
r-ρ[][KF(](1-r2)/(n-2)[KF)][SX)]〓(ν=n-2)
〖KH-1*2〗[JY](9.5)〓〓〖HJ1*2〗〖HJ〗
式中Sr为r的标准误,计算出tr值后,查t界值表得出P值。〖HTH〗
(二)查相关系数r界值表〖HTSS〗
可查r界值表(附表9),得出P值。可按ν=n-2,查出r0.05,ν的界值, 与
计算的r作比较。 如|r|≥r0.05,ν,P≤0.05 ,拒绝〖WTBZ〗H0。
例9.2〓对例9.1资料的相关系数[WTBX]r做假设检验。
检验步骤:
(1)建立假设[WTBZ]
H0:ρ=0,两变量间无相关关系
H1:ρ≠0 〖WTBX〗
α=0.05
(2)计算统计量tr
tr=〖SX(〗0.9737-0[][KF(](1-0.97372)/(8-2)[KF)][SX)]=10.4684
(3)查t界值表,确定P值〓
本例ν=8-2=6, t0.001,6=5.959,tr=10.4684>t0.001,6
,故P<0.001。
如直接查r界值表(附表9),得r0.001,6=0.925,r=0.9737>0.92
5,P<0.001,结果与tr法相同。
(4) 结论〓在α=0.05水准,P<0.001,[WTBZ]拒绝H0,认为胆固醇与脂蛋白含
量间存在着相关关系。即随着体内胆固醇含量的增高,低密度脂蛋白含量随之增加。
〖HS4〗〖HT3H〗〖JZ〗 第二节〓直线回归分析
〖HT〗〖HT4”K〗〓〓一、直线回归的概念〖HJ1〗〖HJ〗〖HT5SS〗
从实际得到的两组观察现象中,若某一变量[WTBX](Y)的变化是依赖于另一变
量(X)
的变化而变动的,例如身高与年龄、血压与年龄、某指标的反应值的大小和浓度等等,称两
变量间的变化有某种因果关系或依赖关系,但这种关系又不是一种确定性关系,医学中这种
现象是常见的。回归分析的任务是用回归方程定量地描述出Y变量依赖X变量变化的数量关系
。
直线回归方程[WTBZ](Linear regression equation)[WTBX]是描述两个变量间变化关系
中最简单的一种形式。
直线回归方程:〖AKY^〗=a+bX,式中〖AKY^〗为研究变量(Y)的平均估计值,
Y称为应变量 [WTBZ](Dependent
variable)[WTBX]或研究变量,X为自变量[WTBZ](Independent variable),[WTBX]a
为截距,b为斜率,
统计中又称b值为回归系数[WTBZ](Regression coefficient),[WTBX]其统计含义为:当X变
量增加一个单位值时,
Y变量值平均增加(或减少)b个单位。〖HS2〗〖HT4”K〗〓〓二、回归方程的计
算方法〖HT5SS〗
〖JZ〗〖AKY^〗=a+bX〖KH-1〗〖JY〗(9.6)〓〓
〖JZ〗b=[SX(] Σ(X-[AKX-])(Y-[AKY-])[]Σ(X-[AKX-])2[SX)]= [SX(]l
XY[]lXX[SX)]〖KH-1*2〗[JY](9.7)〓〓〖HJ1*2〗〖HJ〗
〖JZ〗a=[AKY-]-b[AKX-]〖KH-1〗〖JY〗(9.8)〓〓
例9.3〓某人测得某地10名3岁儿童体重与体表面积值如下,计算两者的回归方程。
〖HT5”H〗[WTHZ][STHZ]〖JZ〗 表92〓某地3岁儿童体重(kg)与体表面积(cm2)
〖HT5”SS〗[STBZ][WTBX]〖BG(!〗〖BHDFG3,WK7。6W〗
儿童编号 〖〗 体重(X)〖〗 体表面积(Y)〖〗 X2[] Y2[]
XY
[BHDG2,WK7DW,WK7。5DWW]
〖JZ〗1 [] 〖JZ〗 11.0[] 〖JZ〗 5283 [] 〖JZ〗 121 []
〖JZ〗 27910089[] 〖JZ〗 58113
[BHDW] 2 [] 11.8 [] 5299 [] 139.24 [] 28079401 [] 62
528.2
[BH] 3 [] 12.0 [] 5358 [] 144 [] 28708164 [] 6429
6
[BH] 4 [] 12.3 [] 5292 [] 151.29 [] 28005264 [] 6509
1.6
[BH] 5 [] 13.1 [] 5602 [] 171.6 [] 31382404 [] 7338
6.2
[BH] 6 [] 13.7 [] 6014 [] 187.69 [] 36168196 [] 8239
1.8
[BH] 7 [] 14.4 [] 5830 [] 207.36[] 33988900 [] 8395
2
[BH] 8 [] 14.9 [] 6102 [] 222 [] 37234404 [] 9091
9.8
[BH] 9 [] 15.2 [] 6075 [] 231.04 [] 36905625 [] 9234
0
[BH] 10 [] 16.0 [] 6411 [] 256 [] 41100921[] 10257
6
[BHDG2] 〓〓〓合计 [] 134.4 [] 57266 [] 1831.24 []329483368
[] 775594.6[BG)F]〖HT5SS〗
计算方法和步骤:
(1)列表计算〓算出[WTBZ]Σ[WTBX]X、[WTBZ]Σ[WTBX]Y、[WTBZ]Σ[WTBX]X2、
[WTBZ]Σ[WTBX]Y2、[WTBZ]Σ[WTBX]XY,见表92。
(2)计算离均差平方和lXX、lYY及离均差积和lXY
lXX=ΣX2-[SX(] (ΣX)2[]n[SX)]
=1831.24-[SX(](134.4)2[]10[SX)]=24.9
lYY=ΣY2-[SX(] (ΣY)2[]n[SX)]
=329483368-[SX(](57266)2[]10[SX)]=1543892.4
lXY=ΣXY2-[SX(] (ΣX)(ΣY) []n[
SX)] =775594.6- [SX(](134.4)(57266)[]10[SX)]=5939.56
(3)计算回归系数b和截距a〓按式(9.7)、(9.8)计算。
b=〖SX(〗5939.56[]24.904[SX)]=238.498, a=57266/10-238.498(134.4/10
)=2521.18
本例b的含义为:3岁儿童体重每增加1 kg,体表面积平均增加238.5 cm
2。
(4)列出回归方程〓
〖AKY^〗=2521.18+238.498X
(5)绘制直线回归方程图示〓为直观分析实测值和方程的拟合效果,可按求出的方
程在坐标纸上作图。在自变量X实测范围内任取相距较远的两个X值,代入所求的回归方程中
,如本例X1=11,估计值[AKY^]1=5144.66,X2=16,估计值[AKY^]2=6337.16,
在图上确定(11,5144.66)和(16,6337.16)两点,用直线连接两点为回归直线(如图92)
,即表示体重(X)与体表面积(Y)间数量变化的依存关系。
〖KH+85mm〗
〖HT5”H〗〖STHZ〗〖JZ〗 图92〓某地3岁儿童的体重与体表面积的散
点图与回归直线〖HT〗〖HT4”K〗〓〓三、回归系数的假设检验〖HJ1〗〖HJ〗〖HT5
SS〗〖STBZ〗〖WTBX〗
由样本计算的回归系数(b)是总体回归系数(β)的估计值,同样存在抽样误差,
从β=0
的总体(两变量无相关关系)中得到的样本回归系数不一定为0。因此, 必须对样本
的回归系数作假设检验。即假设样本回归系数b是从总体回归系数β=0 的总体中随机抽样
得到的
(X与Y间无关系存在)。回归系数的检验目的是要说明X与Y间是否存在着回归关系。
检验方法可用tb检验和查r界值表法。〖HTH〗
(一)tb检验法〖HTSS〗
tb=[SX(] b-β []Sb[SX)]=〖SX(〗b
-0[]SY.X/[KF(]lXX[KF)][SX)]
[JY](9.9)〓〓
SY.X=[KF(] [SX(][WTBZ] Σ[WTBX](Y-[AKY^])2[]n-2
[SX)][KF)][JY](9.10)〓〓
[WTBZ] Σ[WTBX](Y-〖AKY^〗)2=[SX(][WTBZ]Σ[WTBX](Y-[AKY-]
)2-
[[WTBZ]Σ[WTBX](X-[AKX-])(Y-[AKY-])]2[]
[WTBZ] Σ[WTBX](X-[AKX-])2[SX)]=lY
Y-blXY[JY](9.11)〓〓
〓〓式Σ(Y-[AKY^])2称为剩余平方和,其含义为在回归方程中,X对Y的直线作
用被
扣除后,其他随机因素对Y造成的变异。SY.X称为剩余标准差;Sb称为回归系数b的
标准误。
例9.4〓对例9.3资料的样本回归系数作检验。
(1)建立假设
〖WTBZ〗H0:β=0,体重与体表面积无直线回归关系
H1:β≠0,体重与体表面积有直线回归关系
〖WTBX〗 α=0.05
(2)计算t值〓
本例b=238.498 , lXX=24.904, lYY=1543892.4, lXY
=5939.56,分别代入式(9.11)、(9.10)和(9.9)。
Σ(Y-[AKY^])2=1543892.4-238.498×5939.56=127319.22
SY.X=[KF(][SX(]127319.22[]10-2[SX)][KF)]=126.15〓〓Sb=[SX(]126.15[][KF(]
24.904[KF)][SX)]=25.29
tb=[SX(]238.498[]25.29[SX)]=9.43
(3)确定概率值〓 查t界值表(附表2),ν=n-2=10-2=8, t0.05,8=2.306, t0.
01,8=5.041, 本例t=9.43>5.041, P<0.01。
(4)结论〓按α=0.05水准,P<0.01,拒绝〖WTBZ〗H0,认为体重与体表面积之间存在回归
关系。〖HTH〗〖WTBX〗
(二)查r界值表法〖HTSS〗
同一资料计算的样本回归系数b的假设检验结果与样本相关系数r的检验结果是等价的,即t
r=〖WTBX〗tb。〖WTBX〗由于r的检验可用查表法,故b的假设检验可计算出相关系数r
,用r查表代替计算较繁琐的tb〖WTBZ〗检验。查表的方法和步骤同前。
〖WTBX〗如表92资料中的体重与体表面积的r=0.9580,n=10,ν=10-2=8,查r界
值表,得r0.05,8=0.632,r0.01,8=0.765,
本例r=0.9580>0.632,且r=0.9580>0.765,P<0.01。结论与tb计算法相同。〖H
S2〗〖HT4”K〗〓〓四、直线回归分析的应用〖HT5H〗
(一)描述两变量间数量变化的依存关系〓
〖HT5SS〗经回归系数的假设检验, 若两变量间存在着回归关系,则可用直线回归方程表示
它们之间的数量关系。如例9.3中计算的回
归方程,
是体表面积依赖于体重的增加而增加的定量表达。〖HTH〗
(二)如两变量值间有相关关系〓〖HTSS〗可根据一个较容易测得的变量值,
推算另一个不容易测
得的变量值。如例9.3中体表面积在实际工作中较难测定,可根据观测的数据, 建立
体重与体表面积的回归方程,实际工作中就可用体重推算出体表面积的估计值。例如当地某
3岁男〖WTBZ〗
孩体重为15 kg,问其体表面积约为多少?
〖WTBX〗已知方程为:[AKY^]=2521.18+238.5X, X=15 [WTBZ]kg时代入方程,可估
计他的体表面积约为[WTBX][AKY^]=[WTBZ]2521.18+238.5×15=6098.68 cm2。〖HS2〗
〖HT4”K〗〓〓五、直线相关与回归在应用上的区别与联系〖HT5H〗
(一)区别〖HTK〗
〖WTBX〗 1.在意义上〓〖HT5SS〗相关分析是用r来度量两个变量间有无关系及关
系的强弱程度, 这种关系不一定是因果关系。因此分析时何者为X,何者为Y,对计算r无
影响。 回归分
析是Y变量(研究变量)如何依赖X变量变化的数量关系,意味两个变量间有某种因果关系,因
此分析时,应事先选定Y和X变量。〖HTK〗
2.在应用上〓〖HTSS〗要说明两个变量间依存的数量关系用回归分析,说明变量
间的相关关系用相关分析。〖HTH〗
(二)联系 〖HT5SS〗
1.对于同组数据计算的r和b,符号应为一致。
2.r和b的假设检验是等价的。因此,实际工作中可用r的检验代替b的检验, 较
方便。
〖HS4〗〖HT3H〗〖JZ〗
第三节〓等级相关分析
〖HT〗〖HT4”K〗〓〓一、概念和意义〖HT〗〖HJ1〗〖HJ〗〖HT5SS〗〖WTBZ〗
前面所述的相关分析要求两个变量为正态分布的资料,在实际工作中未知总体分
布和数
据为等级资料时,不适合用前面所述的方法计算相关系数,常用本节的等级相关。
等级相关(Spearman's rank correlation )法只适用于分析两个变量间是否存
在相关关系。等级相关系数记为〖WTBX〗r〖WTBZ〗s,计算公式如下:
〖JZ〗〖WTBX〗 r〖WTBZ〗s=1- [SX(]
6〖WTBZ〗Σ〖WTBX〗d2[]n(n2-1)[SX)]〖KH-1*2〗[JY](9.12)〓〓〖HJ1*2〗〖H
J〗
式中d为每对观察值的秩次差值,n为观察值的对子数。等级相关系数r〖WTBZ〗
s的值界于-1~1〖WTBX〗
之间,r〖WTBZ〗s值为正值时为正相关,负值时为负相关。检验〖WTBX〗r〖WTBZ
〗s值是否由于抽样误差所造成,可查
〖WTBX〗r〖WTBZ〗s〖WTBX〗界值表(附表10)。〖HS2〗〖HT4”K〗〓〓二、方法
与分析步骤
〖HT5SS〗
例9.5〓某人观察急性白血病患者的血小板计数和临床观察的出血状况,记录如下表
, 问血小板计数与出血严重程度之间有无相关关系?
〖HT5”H〗〖JZ〗
〖STHZ〗 表93〓急性白血病患者血小板计数与出血状况
〖HT5”SS〗〖STBZ〗〖WTBX〗〖BG(!〗〖BHDFG4,WK6,WK12,WK1,WK12,WK1,WK12W〗
编号〖〗〖ZB(〗〖BHDG2,WK12W〗血小板计数〖BHDG2,WK6,WK6W〗X〖〗秩次〖ZB)〗〖
〗〖〗〖ZB(〗〖BHDG2,WK12W〗出血状况〖BHDG2,WK6,WK6W〗Y〖〗秩次〖ZB)〗〖〗〖
〗[ZB(][BHDG2,WK12W]秩次之差〖BHDG2,WK6,WK6W〗d[]d2[ZB)]
〖BHDG2,WK6DW,WK6DW,WK6DW,WK1,WK6,WK6DW,WK1,WK6DW,WK6DWW〗
〖JZ〗1[] 〖JZ〗12.16 [] 〖JZ〗 1 [][] 明显 [] 〖JZ〗 5.5[][]
〖JZ〗 -4.5 [] 〖JZ〗 20.25
[BHDW] 2 [] 13.79 [] 2 [][] 非常明显 [] 8.5[][] -6
.5[] 42.25
[BH] 3 [] 16.50 [] 3 [][] 个别点 [] 4 [][] -1[]
1
[BH] 4 [] 31.05 [] 4 [][] 无 [] 2 [][] 2 [
] 4
[BH] 5[] 42.60 [] 5 [][] 非常明显 [] 8.5 [][] -3.5
[] 12.25
[BH] 6 [] 54.27 [] 6 [][] 非常明显 [] 8.5[][] -2.5
[] 6.25
[BH] 7 [] 74.24 [] 7 [][] 无 [] 2 [][] 5
[]25
[BH] 8 [] 106.43 [] 8 [][] 无 [] 2 [][] 6 [
] 36
[BH] 9 [] 126.17[] 9 [][] 非常明显 [] 8.5 [][] 0.5
[] 0.25
[BH] 10 [] 143.80 [] 10 [][] 明显 [] 5.5[][] 4.5
[] 20.25〖BHD〗〖8〗167.5(Σd2)[BG)F]〖HT5SS〗〖WTBZ〗
(1)建立假设
H0:两变量间无相关关系,即〖WTBX〗ρr=0〖WTBZ〗
H1:两变量间有相关关系,〖WTBX〗ρr≠0〖WTBX〗
α=0.05
(2)编秩〓一个变量由小到大排列,另一个变量与成对的数据对应列出。两变
量各自由小到大各自编秩次,若有相同等级,秩次求平均秩次。例如出血状况中有3个相同
的
“无出血 ”,各自的秩次为(1+2+3)/3=2。
(3)计算r〖WTBZ〗s〖WTBX〗〓先求出两变量秩次之差d、d2及〖WTBZ〗Σ〖
WTBX〗d2。本例〖WTBZ〗Σ〖WTBX〗d2=167.5,n=10,代入公式(9.12)计算:
r[WTBZ]s[WTBX]=1-[SX(]6×167.5[]10(102-1)[SX)]=-0.015
2
(4)确定P值和作出推断〓
本例n=10,查r〖WTBZ〗s〖WTBX〗界值表(附表10),得界值r0.05,10=0.648,
本例|r〖WTBZ〗s〖WTBX〗|=0.0152<0.648,P>0.05,不拒绝〖WTBZ〗H0, 故
认为出血状况与血小板数的多少之间无相关关系存在。
〖JY〗〖HT5K〗 (孟
〓虹)
〖LM〗
〖HS7〗〖HT2XBS〗〖JZ〗 第十章〓统计表与统计图
〖HT5SS〗〓〓
护理工作或科研资料经整理和计算各种统计指标后,所得结果除了用适当的文字
说明外,
常用统计表和统计图来陈述和分析。统计表和统计图是表达统计资料结果的重要
工具。
统计表不仅便于阅读,而且便于分析比较。统计图是把数字资料形象化,使人获得清
晰和直观的印象。因此,统计图表制作的合理与否,对统计结果的表达、分析、理解有着重
要的影响。
〖HS4〗〖HT3H〗〖JZ〗 第一节〓统计表
〖HT5SS〗
广义的统计表包括收集资料时用的调查表,整理资料时的汇总表,资料统计处理
时的计算表和在文献上陈述结果的统计分析表;狭义的统计表指陈述结果的统计分析表。由
于用途和要求不同,本节只介绍陈述资料用的统计分析表的规则和要求。
〖HS2〗〖HT4”K〗〓〓
一、统计表的基本结构和表式 〖HT5SS〗
从外形上看,统计表是由一些线条、文字、数字所组成的。可这些线条、文字安
排的好坏,直接影响统计表的质量。从内容说,统计表由主语和谓语所构成,主语是表中主
要分析的对象,谓语是说明主语的指标名称。一般说来,主语放在横标目的位置上,谓语放
在纵标目位置上。制表前,应先找出主谓语,安排在适当的位置。统计表的基本表式示意如
下:
〖HT5”SS〗〖ST5”BZ〗〖WT5”BZ〗
〖SX(〗表×(表号)〓〓〓〓标题〓×××〓〓〓〓〓〓〓〓〖HJ1〗〖〗横标
目〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〖SX)〗〓顶线〖HJ*7〗〖HJ〗
〖SX(〗的总名称〓〓〓〓〓纵标目〓〓〓纵标目〓〓〓纵标目〖〗〖HJ1〗横标目〓〓
〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〖SX)〗〓隔线〖HJ〗
(主要比较的组别)〓〓〓数字区域
〓〓〓〓〓〓〓〓〖ZZ(Z〗〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〖ZZ)〗〓隔线
合计
〖ZZ(Z〗〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〖ZZ)〗〓底线
〓〓*备注〖HT〗〖ST〗〖WT〗
〖HTH〗
(一)标题〖HTSS〗置于表上端中央,应简明、扼要地说明表中主要内容,必要时可注明资
料的时间和地点。〖HTH〗
(二)标目〖HTSS〗标目是表中主要说明的内容,文字应简明。标目有横标目和
纵标目。横标目列在表的左侧,一般用来表示被研究事物的主要标志(如比较的组别)。纵
标目列在表的
右上端,
一般用来表示说明横标目的各统计指标的内容,如计数资料纵标目常列出:总例数,
阳性例数,阳性率(〖WTBZ〗%〖WTBX〗);计量资料的纵标目常列出:n、〖AKX-〗±S等
。标目中有单位的须注明。〖HTH〗
(三)线条〖HTSS〗线条不宜过多,一般的统计表有4条横线,如无合计数仅为3
条横线,将标题、纵标目和数字分开,其余的线条一般均省去。表的左上角不宜有斜线。
〖HTH〗
(四)数字〖HTSS〗表内的数字一律用阿拉伯数字表示,同一指标的小数位数应
一致。表内不宜留空格,表内数字为零时用“0”表示,暂缺或未记录可用“…”或“-”
填入。〖H
TH〗
(五)备注〖HTSS〗一般不列入表内,必要时可用“*”标出,写在表的下面。
一个表最好说明一个主要的中心内容,表格的形式要简单,使人一目了然。
〖HS2〗〖HT4”K〗〓〓二、统计表的种类〖HT5H〗
(一)简单表〖HT5SS〗由一组横标目(比较的主要标志,如组别)和一组纵标
目所组成。如表101。
〖HT5”H〗〖STHZ〗〖WTHZ〗〖JZ〗表101〓某院护理不同病种Nor
ton评分的比较
〖HT5”SS〗〖STBZ〗〖WTBZ〗〖BG(!〗〖BHDFG3,WK11。4W〗
病 种 〖〗 例数 〖〗 高危患者数〖〗 高危率(%)
〖BHDG1*2,WK11,WK11DW,WK11DW,WK11W〗
脑血管疾病 〖〗〖JZ〗 39 〖〗〖JZ〗 23 〖〗 5
8.97
〖BHDW〗 脊柱骨折并截瘫 〖〗 26 〖〗 21 〖〗 80.
77
〖BH〗 癌症 〖〗 11 〖〗 5 〖〗 54.5
5
〖BH〗 颅脑外伤 〖〗 82 〖〗 39 〖〗 47.5
6
〖BH〗 其他〖〗 57 〖〗 11 〖〗 19.3
0
〖BHDG2〗 合计 〖〗 215 〖〗 99 〖〗 46
.05〖BG)F〗
〓〓 注:Norton评分<12分以下者为褥疮的高危患者〖HT5H〗
(二)组合表〖HT5SS〗由两个比较的主要标志及纵标目结合起来所组成的,主
语
按两个比较标志交叉分组而构成的表,如表102。
〖HT5”H〗〖STHZ〗〖JZ〗表102〓不同工作年限、学历的护士护理资料记
录质量的比较
〖HT5”SS〗〖STBZ〗〖BG(!〗〖BHDFG4,WK6,WK18,WK2,WK18W〗
工作年限(年)〖〗〖ZB(〗〖BHDG2,WK18W〗中专学历〖BHDG2,WK6。3W〗总份数〖〗优
良份数〖〗优良率(%)〖ZB)〗〖〗〖〗〖ZB(〗〖BHDG2,WK18W〗大专学历〖BHDG2,WK6。3
W〗总份数〖〗优良份数〖〗优良率(%)〖ZB)〗
〖BHDG1*2,WK6ZQ1,WK6。3DW,WK2,WK6。3DWW〗
<5 〖〗 〖JZ〗 50 〖〗 〖JZ〗 30〖〗 〖JZ〗 60.0〖〗
〖〗 〖JZ〗 55 〖〗〖JZ〗 40 〖〗 〖JZ〗 80.0
〖BHDW〗 5~10 〖〗 70 〖〗 50 〖〗 71.4〖〗〖〗
85 〖〗 75 〖〗 88.2
〖BH〗≥10 〖〗 80 〖〗 70 〖〗 87.5〖〗〖〗 8
0 〖〗 75 〖〗 93.7
〖BHDG2〗 合计 〖〗 200 〖〗 150〖〗 75.0 〖〗〖〗
220 〖〗 190〖〗 86.4〖BG)F〗
〖HT〗〖ST〗〖WT〗
〖HS2〗〖HT4”K〗〓〓
三、统计表的审查和修改〖HT5SS〗
统计表制作的是否良好,应从标题是否简明、清楚;纵横标目的位置是否颠倒;
标目的层次是否太多;表线是否有竖线、斜线,标目的含义是否明确;从左至右,主谓语相
连是否可以读成一句完整、通顺的话等方面来检查。
〖HT5SS〗〓〓例10.1〓某医院用麦芽根糖浆治疗161例急慢性肝炎的疗效如下表
:
〖HT5”H〗〖STHZ〗〖JZ〗表103〓治疗急慢性肝炎疗效观察
〖HT5”SS〗〖STBZ〗〖BG(!〗〖BHDFG2,WK5,K30,K10W〗
效果〖〗有效〖〗无效
〖BHDWG2,WK35,K10W〗
〖ZB(〗〖BHDG2,WK5,K10,K10,K10〗总例数〖〗小计〖〗近期痊愈〖〗好转〖ZB)W〗
〖BHDWG2,WK5,WK40W〗
〖〗〖ZB(〗〖BHDG2,K10,K10,K10,K10W〗例〓
〓〓%〖〗例〓〓〓%〖〗例〓〓〓%〖〗例〓〓〓%〖ZB)〗
〖BHDG2,WK5,K10,K10,K10,K10W〗
161〖〗108〓 〓671〖〗70〓 〓435〖〗38〓 〓236〖〗53〓 〓329
〖BG)F〗〖HT5SS〗〓〓
此表的缺点是:主要比较的标志(疗效)安排的位置不当, 线条和纵标目的
层次太多,使比较的内容不能一目了然,表中的标题不明确及“%”含义不清。现修改如下
表:
〖HT5”H〗〖STHZ〗〖JZ〗 表104〓 某院用麦芽根糖浆治疗急慢性肝炎的
疗效观察(修改表)
〖HT5”SS〗〖STBZ〗〖BG(!〗〖BHDFG3,WK11。4W〗
疗 效 〖〗 观察例数〖〗 疗效构成比(%) 〖〗 有效率(%
)
〖BHDG2,WK11,WK11。2DW,WK11W〗
近期痊愈 〖〗 〖JZ〗70 〖〗 〖JZ〗43.5 〖〗
〖BHDWG2〗 好转 〖〗 38 〖〗 23.6 〖〗
67.1
〖BH〗 无效 〖〗 53 〖〗 32.9 〖〗
〖BHDG2〗 合计 〖〗 161 〖〗 100.0 〖〗
〖BG)F〗
〓〓 注:有效例数为近期痊愈数+好转数〖HT5SS〗
〓〓例10.2〓某医院3年中不同出生体重婴儿死亡情况如下表:
〖HT5”H〗〖STHZ〗〖JZ〗
表105〓某医院1980~1983年出生婴儿的死亡率
〖HT5”SS〗〖STBZ〗〖BG(!〗〖BHDFG2,WK9,WK9。4DWW〗
总活产数〖〗〖〗 〖JZ〗5647
〖BHDW〗 体重 〖〗 〖JZ〗 <1500 g[] ~2000 g [] 〖JZ〗~2500
g [] 〖JZ〗≥2500 g
[BH] 新生儿数 [] 14 [] 61 [] 280 [] 5292
[BH] 百分比(%) [] 0.25 [] 1.08 [] 4.96 [] 93.71
[BH] 死亡数 [] 11 [] 10 [] 12 [] 24
[BH] 死亡率(‰) [] 785.7[] 163.9[] 42.9 [] 4.5 〖BG)F〗
〖HT5SS〗
此表的主要缺点是纵横标目位置颠倒, 使人难以很快找出表中所要比较主语的对比关系;
主要比较标目——体重的分组组段与统计学习惯分法不一致;合计项不清楚。修改如下:
〖LM〗
〖HT5”H〗〖STHZ〗〖JZ〗 表106〓某医院1980~1983年不同出生体重婴儿
的死亡率(修改表)
〖HT5”SS〗〖STBZ〗〖BG(!〗〖BHDFG4,WK8,WK18,WK1,WK18W〗
出年体重(g)〖〗〖ZB(〗〖BHDG2,WK18W〗活产〖BHDG2,WK9,WK9W〗新生儿数〖〗百分
比(%)〖ZB)〗〖〗〖〗〖ZB(〗〖BHDG2,WK18W〗死亡〖BHDG2,WK9,WK9W〗死亡数〖〗死
亡率(‰)〖ZB)〗
〖BHDG2,WK8,WK9DW,WK9DW,WK1,WK9DW,WK9DWW〗
<1500 [] 〖JZ〗14 [] 〖JZ〗 0.25[][] 〖JZ〗 11 [] 〖
JZ〗785.7
[BHDW] 1500~ [] 61 [] 1.08[][] 10[] 163.9
[BH] 2000~ [] 280 [] 4.96 [][] 12 [] 42.9
[BH] ≥2500 [] 5292[] 93.71 [][] 24 [] 4.5
[BHDG2] 合计 [] 5467 [] 100.00 [][] 57 []
10.4[BG)F]
〖HS4〗〖HT3H〗〖JZ〗 第二节〓统计图
〖HT5SS〗
统计图是用线条的升降变化、面积的大小、直条的长短等表示数据的数量大小和
关系,
形象直观、通俗易懂。但从统计图上不能得到确切的数字,所以它不能代替统计表,
必要时可将统计表一起列出。医学上常用的统计图有直条图、圆图、线图、直方图。
〖HS2〗〖HT4”K〗〓〓一、统计图的一般模式和要求〖HT5SS〗
一般的统计图由标题、图形、纵横坐标所组成。图的标题要求与表相同, 但位
置在图下。图的横坐标安排统计表中横标目(主要比较的标志)的内容,纵坐标安排说明横
坐标的数量(如率、人数),纵横坐标的刻度要等距,长宽之比为7∶5较美观。应根据资
料的性质选用不同的图形表示其数量关系,必要时附上图例说明。
〖HS2〗〖HT4”K〗〓〓〖WTBX〗二、常用统计图的绘制方法〖HT5SS〗
图形的选择按主要比较标志的性质,即X轴的放置内容来决定。主要比较的标志
按类别
(属性)分类,如疾病的分类、不同的方法、性别等,可用条图或百分构成图表示
。主要比较的标志按数量分组,如年代、年龄、血压等,可用线图、直方图、散点图表示。
〖HT5H〗
(一)条图〖HT5SS〗
以相等宽度的直条长短代表指标数量的大小,表示比较事物间指标的对比关系。
适用于
比较标志按类别分组的资料。条图有单式和复式两种(图101和图102)。绘制方
法如下:〖HTSS〗
1.横轴表示各类别,纵轴表示说明横轴各类别的某指标值(主要为频率)。
2.各组的直条宽度应相等,各直条间隙为直条宽度的一半,并也应相等;但复式
图形中,
各组有对比的两个直条,中间不能有空隙。为了图形的美观和便于对比,可按数值的
高低排列,也可按事物的逻辑顺序排列。
3.纵轴尺度必须从0开始,否则各直条的高低不能正确反映组间的比例关系。
例10.3〓甲、乙、丙3所同类型医院的护士长管理知识考核情况:参加考核人数分别为18,2
0,20;达标人数分别为10,16,18;达标率分别为556%,668%,889%
。绘制条图如下:
〖LM〗
〖KH+75mm〗
〖HT5”H〗〖STHZ〗〖JZ〗图101〓3所医院护士长管理知识考核情况
〖HT5”H〗〖STHZ〗〖JZ〗 表107〓某医院对护士长管理知识考核的情况
〖HT5”SS〗〖STBZ〗〖BG(!〗〖BHDFG4,WK7,WK7,WK14,WK2,WK7,WK7W〗
年份〖〗考评人数〖〗〖ZB(〗〖BHDG2,WK14W〗第1次〖BHDG2,WK7,WK7W〗达标人数〖〗
达标率(%)〖ZB)〗〖〗〖〗〖ZB(〗〖BHDG2,WK14W〗第2次〖BHDG2,WK7,WK7W〗达标
人数〖〗达标率(%)〖ZB)〗
〖BHDG2,WK7,WK7,WK7,WK7,WK2,WK7,WK7DWW〗
1994 〖〗 18 〖〗 10 〖〗 55.6〖〗〖〗 14 〖〗
〖JZ〗77.8
〖BHDW〗1995 〖〗 20 〖〗 16 〖〗 80.0 〖〗〖〗 1
7 〖〗 85.0
〖BH〗 1996 〖〗 20 〖〗 18 〖〗 90.0 〖〗〖〗 20
〖〗 100.0〖BG)F〗
〖KH+75mm〗
〖HT5”H〗〖STHZ〗〖JZ〗 图102〓某医院1994~1996年护士长管理知识考核
情况〖HT5H〗〖ST〗〖WT〗
(二)百分构成图〖HT5SS〗适用于百分构成的资料。以圆形的总面积代表100%, 以角度
的大小表示各部分所占的比重,常用于事物宣传。
以表108为例, 绘制方法如下:
〖HTSS〗
1.先绘制一圆形,将各类的构成比分别乘以3.6°,得各类的圆心角度, 再用
量角器绘制在圆中,各构成按大小或顺序以12点位置为起点,顺时针排列。
2.圆中各构成部分注明简要文字及百分比,或用不同图例表示。
将表109资料的百分构成比换算成角度。
8.333×3.6=30.00°,
23.214×3.6=83.57°,
46.429×3.6=167.14°,
22.024×3.6=79.29°
绘制成百分构成圆图,见图103。
〖HT5”H〗〖STHZ〗〖JZ〗 表108〓某院调查80份护理病历中的主要缺陷
问题
〖HT5”SS〗〖STBZ〗〖BG(!〗〖BHDFG3,WK15。3W〗
主要缺陷 〖〗 缺陷次数 〖〗 百分比(〖WTBZ〗%)
〖BHDG2,WK15,WK15。2DWW〗
护理诊断 〖〗 〖JZ〗14 〖〗 〖JZ〗 8.333
〖BHDW〗术语不准确 〖〗 39 〖〗 23.214
〖BH〗 病情记录 〖〗 78 〖〗 46.429
〖BH〗 出院指导 〖〗 37〖〗 22.024
〖BHDG2〗 合计 〖〗 168〖〗 100.00〖BG)F〗
[KH+70mm]
〖HT5”H〗〖STHZ〗〖JZ〗 图103〓某院护
理病历主要缺陷问题
〖HT5H〗〖STBZ〗〓〓
(三)普通线图和误差线图〖HTSS〗
用线条的高低表示某事物(指标)随另一事物(时间)而变动的情况,有普通线
图和误差线图两种,适用于比较主要标志按数量分组的资料。
表109的资料可绘制误差线图(
图104),表1010资料可绘制普通线图(图105)。绘制方法如下。〖HTSS〗
1.横轴表示按数量分组的组段,纵轴表示说明横轴事物的指标(如率,或平均数
指标或加减标准差的范围)。纵横轴尺度必须等距。
2.当表示两个或多个事物随某一事物变动时,图内可用不同的图线(实线、虚
线)表示,并用图例说明。
〖WTBX〗
3.纵横轴的宽与长之比以5∶7为宜,否则线图会带来错误的印象。
〖HT5”H〗〖STHZ〗〖JZ〗 表109〓两种方法控制骨折患者感染后白
细胞指标的比较〖JY〗〖STBZ〗〖WTBZ〗(×109/L,〖WTBX〗〖AKx-〗±s)〓〓
〖HT5”SS〗〖STBZ〗〖WTBZ〗〖BG(!〗〖BHDFG3,WK9。5W〗
方法 〖〗 处理前 〖〗 处理后3 d〖〗 处理后7 d〖〗
处理后 14 d
〖BHDG2,WK9,WK9。4DWW〗
旧法 〖〗 〖JZ〗16.70±1.2〖〗 〖JZ〗13.80±1.4〖〗 〖JZ〗11.
40±1.2〖〗 〖JZ〗9.10±1.0
〖BHDW〗 新法 〖〗16.00±1.1 〖〗 10.00±1.2 〖〗 7.10±0.8〖
〗 6.66±0.8〖BG)F〗
〖KH+70mm〗
〖HT5”H〗〖STHZ〗〖JZ〗图104〓两种方法控制骨折患者感染后白细胞指标的比较
〖HT5”H〗〖STHZ〗〖WTHZ〗〖JZ〗表1010〓放松训练对腹部手术患者
心率均数(次/min)的影响
〖HT5”SS〗〖STBZ〗〖WTBZ〗〖BG(!〗〖BHDFG3,WK9。5W〗
组别 〖〗 术前1 d 〖〗 术日 〖〗 术后1 d 〖〗 术后2 d
[BHDG2]
实验组 [] 70 [] 73 [] 82 [] 80
[BHDW] 对照组 [] 68 [] 75 [] 88 [] 85[BG)
F]〖LM〗
〖HT5”H〗〖STHZ〗〖WTHZ〗〖JZ〗图105〓放松训练对腹部手术
患者心率的影响
〖HT5H〗〓〓
(四)直方图〖HT5SS〗〖STBZ〗〖WTBZ〗
以各矩形的面积的高低表示各组段值的人数(频数),用以表示连续性数量
分组变量值(如身高、体重、年龄等)的频数分布及变量值的集中趋势。例如将第5章中的
表55的数据绘制成直方图(如图106),绘制方法如下:〖HTSS〗〖WTBX〗
1.纵轴表示各组段的频数(f),尺度应从零开始。横轴为各组的组段值, 通
常标出各组段的下限及最大组段的上限。纵、横轴的分组均为等距。
2.直方图的各直条宽度为各组段的组距,直条间不留空隙。
〖KH+70mm〗
〖HT5”H〗〖STHZ〗〖JZ〗 图106〓正常人腋下体温分布的直方图
〖HT5K〗〖JY〗(孟〓虹)〓〓
〖LM〗
〖HT3H〗〖JZ〗附:统计习题
〖HT4”K〗〓〓一、计量资料的统计方法(第五、六章)〖HT〗〖HJ1〗〖HJ〗
〖HT5H〗〓〓(一)计算分析题
〖HT5SS〗〖ST5BZ〗〖WTBZ〗1.某地101例30~40岁健康男女血清总胆固醇值(mmol/L)测定
结果如下:〖HT5”SS〗
4.77〓3.37〓6.14〓3.95〓3.56〓4.23〓4.31〓4.71〓5.69〓4.12
4.56〓4.37〓5.39〓6.30〓5.21〓7.22〓5.54〓3.93〓5.21〓6.51
5.18〓5.77〓4.79〓5.12〓5.20〓5.10〓4.70〓4.74〓3.50〓4.69
4.38〓4.89〓6.25〓5.32〓4.50〓4.63〓3.61〓4.44〓4.43〓4.25
4.03〓5.85〓4.09〓3.35〓4.08〓4.79〓5.30〓4.97〓3.18〓3.97
5.16〓5.10〓5.86〓4.79〓5.34〓4.24〓4.32〓4.77〓6.36〓6.38
4.86〓5.55〓3.04〓4.55〓3.35〓4.87〓4.17〓5.85〓5.16〓5.09
4.52〓4.38〓4.31〓4.58〓5.72〓6.55〓4.76〓4.61〓4.17〓4.03
4.47〓3.40〓3.91〓2.70〓4.60〓4.09〓5.96〓5.48〓4.40〓4.55
5.38〓3.89〓4.60〓4.47〓3.64〓4.34〓5.18〓6.14〓3.24〓4.90
3.05〖HT5SS〗
(1)编制频数分布表,简述其分布特征。
(2)计算平均数与变异指标和〖WTBX〗〖AKX-〗±1.96S范围。〖WTBZ〗
(3)现测得一40岁男子血清总胆固醇值为6.99 mmol/L,如按95%正常值范围估计,此人胆固
醇值是否正常?
2.某中心医院消化内科1月份出院患者的住院天数如下:
〖HT5”SS〗〖BG(!〗〖BHDFG2,WK5,WK2*2。14W〗
住院天数〖〗0~[]5~[]10~[]15~[]20~[]25~[]30~[]35~[]40~[]45~[]50~[]55~
[]60~[]合计
〖BHDW〗各组人数〖〗6[]21[]14[]13[]6[]2[]3[]1[]1[]5[]1[]3[]3[]79〖BG)F〗
〖HT5SS〗〓〓(1)用均数、中位数、几何均数计算患者的平均住院天数,本例应选何种平均
数指标对该资料的代表性较大?为什么?〖WTBX〗
(2)用百分位数法(〖WTBX〗Px%)计算〖WTBZ〗80%的患者住院时间低于多少天?计
算中间90%的患者住院时间的范围。
3.用上面题1中的健康男子血清胆固醇值资料
(1)计算血清胆固醇值的标准误,并说明标准误和本例计算的标准差在概念上的区别。
(2)估计该地30~40岁健康男子血清胆固醇值总体均数的可信区间。
4.已知正常人乙酰胆碱酶活力的平均水平为1.44 U,现测得13例气管炎患者的乙酰胆碱酶活
力为:1.50,2.19,2.23,2.41,2.11,2.54,2.20,2.36,1.42,2.17,1.84,1.96,2.39 U。问慢性
气管炎患者的乙酰胆碱酶活力与正常人间差别有无显著性?
5.测得12名正常人和15名病毒性肝炎患者的血清转铁蛋白含量(g/L)结果如下,问患者和正
常人该指标差别有无显著性?〖HT5”SS〗
正常人〓〓2.65〓2.72〓2.85〓2.91〓2.55〓2.76〓2.82〓2.69〓2.64〓2.73〓2.71〓2.61
肝炎患者〓2.36〓2.15〓2.52〓2.25〓2.28〓2.31〓2.53〓2.19〓2.34〓2.31〓2.41〓2.22
2.57〓2.61〓2.24〖HT5SS〗
6.用甲乙两药治疗高血脂病症,两组样本例数分别为8和10例,各组治疗前后的血清胆
固醇值变化结果如下,问两药疗效间差别有无显著性?
〖HT5”SS〗〖BG(!〗〖BHDWG2,WK4,WK4,WK3。10W〗
〖〗编号〖〗1〖〗2〖〗3〖〗4〖〗5〖〗6〖〗7〖〗8〖〗9〖〗10
〖BHDW〗甲药〖〗治疗前〖〗6.78[]7.38[]6.62[]6.15[]6.00[]7.10[]6.45[]6.15
[BH][]治疗后〖〗6.27[]6.48[]5.77[]5.55[]5.30[]7.01[]5.80[]6.07
[BH]乙药〖〗治疗前〖〗6.80[]6.50[]7.34[]7.15[]6.10[]6.35[]7.15[]6.15[]6.45[]6.70
[BH][]治疗后〖〗5.44[]5.40[]5.03[]5.04[]5.97[]4.68[]6.08[]5.71[]5.01[]6.10〖BG)W
〗
〓〓〖HT5SS〗7.某医院妇产科测事实上几种卵巢功能异常患者血清促黄体素含量(IU/L)结
果如下,问:不同组患者血清促黄体素含量是否不同?
〖HT5”SS〗〖BG(!〗〖BHDWG2,WK7,WK3。11W〗
卵巢发育不良〖〗42.50[]38.31[]35.76[]33.60[]31.38
〖BHDW〗丘脑性闭经〓〖〗6.71[]3.32[]4.59[]1.67[]10.51[]2.96[]11.82[]3.86[]8.26[]
2.63[]2.20
〖BH〗垂体性闭经〓〖〗4.50[]2.75[]11.45[]5.98[]1.90[]5.43[]11.05[]22.03〖BG)W〗
〓〓〖HT5SS〗8.某人测定6名健康初生婴儿在不同时间的血浆中胆红素值,问不同时间
胆红素值的差别是否有显著性?
〖HT5”SS〗〖BG(!〗〖BHDFG4,WK9,WK36W〗
婴儿编号〖〗〖ZB(〗〖BHDG2,WK36W〗出生天数〖BHDG2,WK9。4W〗4 d[]6 d[]8 d[]10
d〖ZB)〗
〖BHDG2,WK9。5DWW〗
〖JZ〗1[]〖JZ〗10.8[]〖JZ〗4.1[]〖JZ〗5.0[]〖JZ〗2.6
[BHDW]2[]11.5[]4.0[]2.6[]1.6
[BH]3[]14.9[]9.9[]10.0[]7.6
[BH]4[]10.8[]6.8[]4.2[]3.5
[BH]5[]16.2[]15.4[]8.3[]7.4
[BH]6[]12.5[]11.8[]8.2[]60〖BG)F〗
〖HT5H〗(二)思考题
〖HT5SS〗1.一组计量资料,应如何整理,并从哪几个方面反映资料的基本特征?
2.常用的平均数有哪些?各自的适用条件是什么?
3.常用的变异指标有哪些?其大小说明了什么?
4.在文献中常用〖WTBX〗[AKX-]±S和[AKX-]±1.96S两种方式,各表示的含义是什么?
5.S与S[AKX-]在概念和应用上有何不同?
6.何时考虑用t检验,何时用方差分析?应用时应注意什么问题?
〖HT4”K〗〖HS2〗〓〓二、分类资料的统计方法(第七章)
〖HT5H〗〓〓(一)计算题
[HT5SS]1.某人调查(普查)某企业不同年龄高血压病情况如下表:
〖HT5”H〗〖JZ〗某企业不同年龄组高血压病的比较
〖HT5”SS〗〖BG(!〗〖BHDFG4,WK8,WK18,WK1,WK18W〗
年龄(岁)〖〗〖ZB(〗〖BHDG2,WK18W〗男〖BHDG2,WK9,WK9W〗检查人数〖〗病例数〖Z
B)〗〖〗〖〗〖ZB(〗〖BHDG2,WK18W〗女〖BHDG2,WK9,WK9W〗检查人数〖〗病例数〖ZB)
〗
〖BHDG1*2,WK8DW,WK9DW,WK9DW,WK1,WK9DW,WK9DWW〗
〖JZ〗20~[]〖JZ〗333[]〖JZ〗5[][]〖JZ〗712[]〖JZ〗4
[BHDW]30~[]301[]4[][]142[]9
[BH]40~[]517[]64[][]185[]27
[BH]50~[]576[]93[][]61[]9
[BH]60以上[]12[]10
[BHDG2]〖JZ〗合计〖〗1739[]176[][]1100[]49〖BG)F〗
〖HT5SS〗〓〓(1)该资料可计算什么相对数指标?
(2)该企业总的高血压患病情况为多少?高血压病与年龄、性别有无关系?该企业高血压患者
主要分布在哪些年龄段?
(3)本例在作结论前是否要作假设检验?为什么?
2.某院消化科1991年出院患者情况
〖HT5”SS〗〖BG(!〗〖BHDFG2,WK15。3W〗
病名〖〗治疗例数〖〗治愈数
〖BHDG1*2,WK15,WK15。2DWW〗胃、肠溃疡〖〗〖JZ〗26〖〗〖JZ〗20
〖BHDW〗急性胃炎〖〗40〖〗37
〖BH〗慢性胃炎〖〗151〖〗126
〖BH〗急慢性肠炎〖〗60〖〗50
〖BH〗肝硬变〖〗17〖〗7
〖BH〗胆囊疾病〖〗9〖〗8
〖BH〗消化道出血〖〗24〖〗21
〖BH〗其他〖〗18〖〗7
〖BHDG1*2〗合计〖〗345〖〗276〖BG)F〗
〖HT5SS〗对上表计算相对数指标并作分析。
3.某医院为探索导致手术切口感染原因,收集409例手术情况,手术时间≤5 h有242例
,其中感染13例,手术时间>5 h有63例,问不同的手术时间患者的感染率是否有差别?
4.某人对某地40岁人群作抽样调查,血压正常者485人,其中有冠心病者20人。血压不正
常者有80人,其中有冠心病人数19人,问血压与患者冠心病间有无关系?
5.不同组别心音图检查结果
〖HT5”SS〗〖BG(!〗〖BHDFG4,WK11,WK33W〗
组别〖〗〖ZB(〗〖BHDG2,WK33W〗心音图〖BHDG2,WK11。3W〗正常〖〗异常〖〗合计〖ZB
)〗
〖BHDG1*2,WK11,WK11。3DWW〗
正常组〖〗〖JZ〗95〖〗〖JZ〗5〖〗〖JZ〗100
〖BHDW〗冠心病组〖〗20〖〗30〖〗50
〖BHDW〗心肌梗死组〖〗9〖〗30〖〗39
〖BHDG1*2〗合计〖〗124〖〗65〖〗189〖BG)F〗
〖HT5SS〗(1)计算出各组心音图异常率(〖WTBZ〗%)。
(2)不同组别的心音图异常率间有无显著性差别?
〖HTH〗(二)思考题
〖HTSS〗1.常用的相对数指标有哪些?在意义和计算上有何不同?为什么不能以比代率?
2.什么性质的资料比较用〖WTBX〗χ2〖WTBZ〗检验?该检验可用于解决什么问题?
〖HT4”K〗〖HS2〗〓〓三、非参数统计方法、相关与回归、统计图表(第八、九、十章)
〖HT5H〗〓〓(一)计算题
〖HT5SS〗1.某医院对9例慢性苯中毒患者用中草药抗苯一号治疗得白细胞总数(×109/L)
如下,问该药是否对治疗有作用?
〖HT5”SS〗〖BG(!〗〖BHDWG2,WK4。10W〗
患者号〖〗1〖〗2〖〗3〖〗4〖〗5〖〗6〖〗7〖〗8〖〗9
〖BHDW〗治疗前〖〗6.0[]4.8[]5.0[]3.4[]7.0[]3.8[]6.0[]3.5[]4.3
[BH]治疗后〖〗4.2[]5.4[]6.3[]3.8[]4.4[]4.0[]5.9[]8.0[]5.0〖BG)W〗
〖HT5SS〗〓〓2.在对白血病研究中测得两组大鼠脾中DNA含量如下,问两组间的DNA含量间
差别有无显著性?〖HT5”SS〗
正常组〓12.3〓13.2〓13.7〓15.2〓15.4〓15.8〓16.9〓17.3
自发性白血病组〓10.8〓11.6〓12.3〓12.7〓13.5〓14.8〖HT5SS〗
3.某医院测定了220例梗阻性黄疸患者的血清胆红素,各组频数结果如下:
〖HT5”SS〗〖BG(!〗〖BHDWG2,WK7,WK5。7W〗
胆红素水平〖〗<1〖〗1.0~[]3.0~[]6.0~[]15.0~[]≥20[]合计
〖BHDW〗(g/L)
〖BH〗壶腹癌组〓〖〗5[]10[]20[]30[]40[]11[]116
〖BH〗胆管结石组〖〗25〖〗45〖〗20〖〗10〖〗3〖〗1〖〗104〖BG)W〗
〖HT5SS〗〓〓问两组黄胆患者的胆红素值差别有无显著性?
4.某医院用3种治疗方案治疗急性无黄疸型病毒性肝炎254例,结果如下表,问3组间的疗效
差别有无显著性?
〖HT5”SS〗〖BG(!〗〖BHDFG4,WK7,WK28,WK7W〗
组别〖〗〖ZB(〗〖BHDG2,WK28W〗治疗结果(例数)〖BHDG2,WK7。4W〗无效〖〗好转〖〗
显效〖〗痊愈〖ZB)〗〖〗合计
〖BHDG2,WK7,WK7。5DWW〗
西药组〖〗〖JZ〗49〖〗〖JZ〗31〖〗〖JZ〗5〖〗〖JZ〗15〖〗〖JZ〗100
〖BHDW〗中药组〖〗45〖〗9〖〗22〖〗4〖〗80
〖BH〗中西药结合〖〗15〖〗28〖〗11〖〗20〖〗74〖BG)F〗
〓〓〖HT5SS〗5.孕妇孕周与血浆中游离E3值的测定结果如下,问二者是否存在直线关系?
〖HT5”SS〗〖BG(!〗〖BHDWG2,WK5,WK3。13W〗
孕妇编号〖〗1〖〗2〖〗3〖〗4〖〗5〖〗6〖〗7〖〗8〖〗9〖〗10〖〗11〖〗12〖〗13
〖BHDW〗孕周〖〗13〖〗13〖〗15〖〗16〖〗16〖〗17〖〗18〖〗18〖〗20〖〗20〖〗21〖
〗24〖〗26
〖BH〗E3值〖〗0.44[]0.88[]1.10[]1.18[]2.50[]1.25[]1.88[]2.19[]1.75[]2.31[]2.18
[]2.88[]5.00〖BG)W〗
〓〓〖HT5SS〗6.10名糖尿病患者的血糖(mmol/L)和胰岛素(IU/L)的测定值如下,试做二者
的回归分析。
〖HT5”SS〗〖BG(!〗〖BHDWG2,WK5,WK4。10W〗
病例号〖〗1〖〗2〖〗3〖〗4〖〗5〖〗6〖〗7〖〗8〖〗9〖〗10
〖BHDW〗血〓糖〖〗12.21[]14.54[]12.27[]12.04[]7.88[]11.10[]10.43[]13.32[]19.59[]
9.05
[BH]胰岛素〖〗152[]167[]119[]140[]198[]162[]170[]103[]59[]187〖BG)W〗
〓〓〖HT5SS〗7.根据1974年应征青年的体检结果,按18,19,20和21周岁分组,北京各年
龄
组合格人数分别为1376,1055,751和427,身高的均数与标准差分别为170.27±5.96,169.
87±6.
12,168.97±5.64,168.90±5.70。天津各年龄组合格人数分别为305,414,220,109,身
高均数和标
准差为170.78±5.22,170.41±5.27,170.25±5.45,169.61±5.12。上海各年龄合格
人数分别
为514,268,163,91,身高均数与标准差为168.33±5.67,166.88±5.56,169.25±5.29
,166.16±5.12。将以上结果列为统计分析表,并对三地合格人数和身高均数及标准差结果
用统计图表示。
8.某医生在“某药的收敛与驱虫作用”一文中,列表如下:
〖HT5”H〗〖JZ〗大便秘结与驱虫
〖HT5”SS〗〖BG(!〗〖BHDFG10,K4,K10,K4,K10,K4,WK10〗
服药例数560〖〗〖ZB(〗〖BHDG2,K10〗第一疗程〖BHDG8,K4,K3,K3〗便秘
驱虫〖〗例数325〖〗%5.710.89[ZB)]〖〗
服药例数416〖〗〖ZB(〗〖BHDG2,K10〗第二疗程〖BHDG8,K4,K3,K3〗便秘
驱虫〖〗例数262〖〗%5.250.39[ZB)]
服服药例数540〖〗〖ZB(〗〖BHDG2,K10〗第三疗程〖BHDG8,K4,K3,K3〗便秘
驱虫〖〗例数41〖KG*2〗1〖〗%7.590.19[ZB)]〖BG)F〗
〖KH-3*2〗
〓〓〓〓〓[KG*4]〓〓〓〖CD6〗〓〓〓〓〓〓〓〓〖CD6〗〓〓〓〓〓〓〓〓〖CD
6〗
〓 〓〓〓〓〓〖CD10〗〓〓〓〓〖CD10〗〓〓〓〓〖CD10〗
〖HT5SS〗〓〓(1)指出上表存在的问题。
(2)按制统计分析表的原则加以修改。
〖HTH〗(二)思考题
〖HT5SS〗1.什么性质的资料用秩和检验?秩和检验对资料的设计类型和应用条件有何要求?
3.何时考虑用相关和回归分析?相关和回归分析各自说明什么问题?
4.统计表的基本格式是什么?常用的统计图有哪几种,适用条件是什么?
〖JY〗〖HT5K〗(孟〓虹)〓〓