第十四章 生存分析 第一节 Life Tables过程 14.1.1 主要功能 14.1.2 实例操作 第二节 Kaplan-Meier过程 14.2.1 主要功能 14.2.2 实例操作 第三节 Cox Regression过程 14.3.1 主要功能 14.3.2 实例操作 ? 在临床诊疗工作的评价中,慢性疾病的预后一般不适合用治愈率、病死率等指标来考核,因为其无法在短时间内明确判断预后情况,为此,只能对患者进行长期随访,统计一定时期后的生存或死亡情况以判断诊疗效果。这就是生存分析。 ? 第一节 Life Tables过程 ? 14.1.1 主要功能 调用此过程时,系统将采用即寿命表分析法,完成对病例随访资料在任意指定时点的生存状况评价。 ?  ? 14.1.2 实例操作 [例14-1] 用中药+化疗(中药组,16例)和单纯化疗(对照组,10例)两种疗法治疗白血病患者后,随访记录存活情况如下所示,试比较两组的生存率。 ? 中药组 对照组  随访月数 是否死亡 随访月数 是否死亡  10 2 12 13 18 6 19 26 9 8 6 43 9 4 31 24 否 是 是 否 否 是 是 否 是 是 是 是 否 否 否 否 2 13 7 11 6 1 11 3 17 7 是 否 是 是 否 否 否 否 否 否  ? 14.1.2.1 数据准备 激活数据管理窗口,定义变量名:随访月数的变量名为TIME,是否死亡的变量名为DEATH,分组(即中药组与对照组)的变量名为GROUP。输入原始数据:随访月数按原数值;是否死亡的,是为1,否为0;分组的,中药组为1,对照组为2。 ? 14.1.2.2 统计分析 激活Statistics菜单选Survival中的Life Tables...项,弹出Life Tables对话框(图14.1)。从对话框左侧的变量列表中选time,点击(钮使之进入time框;在Display Time Intervals栏中定义需要显示生存率的时点,本例要求从0个月显示至48个月,间隔为2个月,故在0 through框中输入48,在by框中输入2。选death,点击(钮使之进入Status框,点击Define Event...钮弹出Life Tables:Define Event for Status Variable对话框,在Single value栏中输入1,表明death = 1为发生死亡事件者;点击Continue钮返回Life Tables对话框。选group,点击(钮使之进入Factor框,点击Define Range...钮,弹出Life Tables:Define Range for Factor Variable对话框,定义分组的范围,在Mininum框中输入1,在Maxinum框中输入2,点击Continue钮返回Life Tables对话框。 ? ?  图14.1 生存资料的寿命表分析对话框  ? 点击Options...钮弹出Life Tables: Options对话框,在Plot栏中选Survival项,要求绘制生存率曲线图;在Compare Levels of First Factor栏中选Overall项,要求作组间生存状况的比较。之后点击Continue钮返回Life Tables对话框,再点击OK钮即完成分析。 ? 14.1.2.3 结果解释 在结果输出窗口中将看到如下统计数据: 共有26个观察对象进入分析。系统先显示中药组(group = 1)的生存状况寿命表,按用户指定,从0月起,隔2个月直至42个月(原指定从0—48个月,但因42个月后,生存概率已为0,故42个月后至48个月的生存状况不再显示),分别显示进入该时点例数(Number Entrng this Intrvl)、从该时点失去的例数(Number Wdrawn Durong Intrvl)、该时点暴露于死亡危险的例数(Number Exposd to Risk)、该时点死亡的例数(Number of Termnl Events)、该时点死亡概率(Propn Terminating)、该时点生存概率(Propn Surviving)、该时点末生存率(Propn Surv at End)、单位时点的累积概率(Cumul Probability Densty)、该时点风险比例(Hazard Rate)、生存率的标准误(SE of Cumul Surviving)、单位时点累积概率的标准误(SE of Probability Densty)、风险比例的标准误(SE of Hazard Rate)。如本例,用中药+化疗的方式治疗白血病患者,至8个月时,死亡率为17.39%,生存概率为82.61%,生存率为66.38%,风险比例为9.52%。至42个月时,生存概率和生存率均为0,此时风险比例为100%。中药组的50%生存率在19.44个月。 对照组同类结果的显示,因在16个月时生存概率已为0,故仅从0月起,隔2个月至16个月止。分析显示,单纯用化疗,白血病患者的半数生存率约在16个月多一点,比中药组少三个月。 ? This subfile contains: 26 observations ? Life Table Survival Variable TIME for GROUP = 1 Number Number Number Number Cumul SE of SE of Intrvl Entrng Wdrawn Exposd of Propn Propn Propn Proba- Cumul Proba- SE of Start this During to Termnl Termi- Sur- Surv bility Hazard Sur- bility Hazard Time Intrvl Intrvl Risk Events nating viving at End Densty Rate viving Densty Rate ------ ------ ------ ------ ------ ------ ------ ------ ------ ------ ------ ------ ------ .0 16.0 .0 16.0 .0 .0000 1.0000 1.0000 .0000 .0000 .0000 .0000 .0000 2.0 16.0 .0 16.0 1.0 .0625 .9375 .9375 .0313 .0323 .0605 .0303 .0322 4.0 15.0 1.0 14.5 .0 .0000 1.0000 .9375 .0000 .0000 .0605 .0000 .0000 6.0 14.0 .0 14.0 2.0 .1429 .8571 .8036 .0670 .0769 .1019 .0441 .0542 8.0 12.0 1.0 11.5 2.0 .1739 .8261 .6638 .0699 .0952 .1231 .0458 .0670 10.0 9.0 1.0 8.5 .0 .0000 1.0000 .6638 .0000 .0000 .1231 .0000 .0000 12.0 8.0 1.0 7.5 1.0 .1333 .8667 .5753 .0443 .0714 .1348 .0420 .0712 14.0 6.0 .0 6.0 .0 .0000 1.0000 .5753 .0000 .0000 .1348 .0000 .0000 16.0 6.0 .0 6.0 .0 .0000 1.0000 .5753 .0000 .0000 .1348 .0000 .0000 18.0 6.0 1.0 5.5 1.0 .1818 .8182 .4707 .0523 .1000 .1453 .0489 .0995 20.0 4.0 .0 4.0 .0 .0000 1.0000 .4707 .0000 .0000 .1453 .0000 .0000 22.0 4.0 .0 4.0 .0 .0000 1.0000 .4707 .0000 .0000 .1453 .0000 .0000 24.0 4.0 1.0 3.5 .0 .0000 1.0000 .4707 .0000 .0000 .1453 .0000 .0000 26.0 3.0 1.0 2.5 .0 .0000 1.0000 .4707 .0000 .0000 .1453 .0000 .0000 28.0 2.0 .0 2.0 .0 .0000 1.0000 .4707 .0000 .0000 .1453 .0000 .0000 30.0 2.0 1.0 1.5 .0 .0000 1.0000 .4707 .0000 .0000 .1453 .0000 .0000 32.0 1.0 .0 1.0 .0 .0000 1.0000 .4707 .0000 .0000 .1453 .0000 .0000 34.0 1.0 .0 1.0 .0 .0000 1.0000 .4707 .0000 .0000 .1453 .0000 .0000 36.0 1.0 .0 1.0 .0 .0000 1.0000 .4707 .0000 .0000 .1453 .0000 .0000 38.0 1.0 .0 1.0 .0 .0000 1.0000 .4707 .0000 .0000 .1453 .0000 .0000 40.0 1.0 .0 1.0 .0 .0000 1.0000 .4707 .0000 .0000 .1453 .0000 .0000 42.0 1.0 .0 1.0 1.0 1.0000 .0000 .0000 .2354 1.0000 .0000 .0727 .0000 ? The median survival time for these data is 19.44 ? Life Table Survival Variable TIME for GROUP = 2 Number Number Number Number Cumul SE of SE of Intrvl Entrng Wdrawn Exposd of Propn Propn Propn Proba- Cumul Proba- SE of Start this During to Termnl Termi- Sur- Surv bility Hazard Sur- bility Hazard Time Intrvl Intrvl Risk Events nating viving at End Densty Rate viving Densty Rate ------ ------ ------ ------ ------ ------ ------ ------ ------ ------ ------ ------ ------ .0 10.0 1.0 9.5 .0 .0000 1.0000 1.0000 .0000 .0000 .0000 .0000 .0000 2.0 9.0 1.0 8.5 1.0 .1176 .8824 .8824 .0588 .0625 .1105 .0553 .0624 4.0 7.0 .0 7.0 .0 .0000 1.0000 .8824 .0000 .0000 .1105 .0000 .0000 6.0 7.0 2.0 6.0 1.0 .1667 .8333 .7353 .0735 .0909 .1628 .0678 .0905 8.0 4.0 .0 4.0 .0 .0000 1.0000 .7353 .0000 .0000 .1628 .0000 .0000 10.0 4.0 1.0 3.5 1.0 .2857 .7143 .5252 .1050 .1667 .2122 .0918 .1643 12.0 2.0 1.0 1.5 .0 .0000 1.0000 .5252 .0000 .0000 .2122 .0000 .0000 14.0 1.0 .0 1.0 .0 .0000 1.0000 .5252 .0000 .0000 .2122 .0000 .0000 16.0 1.0 1.0 .5 .0 .0000 1.0000 .5252 .0000 .0000 .2122 .0000 .0000 ? The median survival time for these data is 16.00+ ?  ? 接着显示两组比较的结果。系统采用Gehan比分检验法,得u = 0.012,P = 0.9113,即中药组与对照组的生存率无差别。 ? Comparison of survival experience using the Wilcoxon (Gehan) statistic Survival Variable TIME grouped by GROUP Overall comparison statistic .012 D.F. 1 Prob. .9113 Group label Total N Uncen Cen Pct Cen Mean Score 1 16 8 8 50.00 .1875 2 10 3 7 70.00 -.3000 ?  ? 最后,系统输出生存率曲线图(图14.2)。从图中可见,对照组(group = 2)在8个月前一段时点的生存率均较中药组(group = 1)略低,而8-12个月这一段其生存率又较中药组略高,12个月后再又下降。但在治疗中加用中药,对个别患者而言,20个月后依然有一定的生存率。 ? ?  图14.2 中药组与对照组生存率曲线的比较  ?  ? 第二节 Kaplan-Meier过程 ? 14.2.1 主要功能 调用此过程,系统将采用Kaplan-Meier方法,对病例随访资料进行生存分析,在对应于每一实际观察事件时点上,作生存率的评价。 ?  ? 14.2.2 实例操作 [例14-2]25例某癌症病人在不同时期经随机化分配到A、B治疗组进行治疗,同时随访观察至1974年5月31日结束,资料整理后如下表,试对其结果进行生存率分析。 ? 病人号 随访天数 是否死亡 治疗方式  1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 8 180 632 852 52 2240 220 63 195 76 70 8 13 1990 1976 18 700 1296 1460 210 63 1328 1296 365 23 是 是 是 否 是 是 是 是 是 是 是 是 是 否 否 是 是 否 否 是 是 否 是 否 是 A B B A A B A A B B B A B B A B B A A B A A B A B  ? 14.2.2.1 数据准备 激活数据管理窗口,定义变量名:随访天数为TIME,是否死亡为DEATH,治疗方式为TREAT。变量TIME按原数值输入,DEATH为是的输入1、否的输入0,TREAT为A的输入1、为B的输入2。 ? 14.2.2.2 统计分析 激活Statistics菜单选Survival中的Kaplan-Meier...项,弹出Kaplan-Meier对话框(图14.3)。从对话框左侧的变量列表中选time,点击(钮使之进入time框;选death,点击(钮使之进入Status框,点击Define Event...钮弹出Kaplan-Meier:Define Event for Status Variable对话框,在Single value栏中输入1,表明death = 1为发生死亡事件者;点击Continue钮返回Kaplan-Meier对话框。选treat,点击(钮使之进入Factor框。 ? ?  图14.3 Kaplan-Meier法生存率分析对话框  ? 点击Save... 钮弹出Kaplan-Meier:Save New Variables对话框,选Survival项,要求将各观察样例的生存率存入原始数据库中。点击Continue钮返回Kaplan-Meier对话框。 点击Options...钮弹出Kaplan-Meier: Options对话框,在Plot栏中选Survival项,要求绘制生存率曲线图。之后点击Continue钮返回Life Tables对话框,再点击OK钮即完成分析。 ? 14.2.2.3 结果解释 在结果输出窗口中将看到如下统计数据: 先对A治疗组资料进行分析。将原资料按生存天数的大小顺次排列,再逐例显示生存状态(Status,即死亡为1、生存为2)、生存率(Cumulative Survival)、生存率标准误(Standard Error)、累积死亡例数(Cumulative Event)和尚存活人数(Number Remaining)。如本例,A组共12人,死亡6人,生存6人,存活率为50.00%;平均生存时间为1023天,标准误为276,95%可信区间为482—1563天。B组共13人,死亡12人,生存1人,存活率为7.69%;平均生存时间为607天,标准误为226,95%可信区间为163—1051天。 ? Factor TREAT = A ? Time Status Cumulative Standard Cumulative Number Survival Error Events Remaining 8 1 1 11 8 1 .8333 .1076 2 10 52 1 .7500 .1250 3 9 63 1 4 8 63 1 .5833 .1423 5 7 220 1 .5000 .1443 6 6 365 0 6 5 852 0 6 4 1296 0 6 3 1328 0 6 2 1460 0 6 1 1976 0 6 0 ? Number of Cases: 12 Censored: 6 ( 50.00%) Events: 6 ? Survival Time Standard Error 95% Confidence Interval Mean: 1023 276 (482, 1563 ) (Limited to 1976 ) Median: 220 . ( ., . ) ? ? Factor TREAT = B ? Time Status Cumulative Standard Cumulative Number Survival Error Events Remaining 13 1 .9231 .0739 1 12 18 1 .8462 .1001 2 11 23 1 .7692 .1169 3 10 70 1 .6923 .1280 4 9 76 1 .6154 .1349 5 8 180 1 .5385 .1383 6 7 195 1 .4615 .1383 7 6 210 1 .3846 .1349 8 5 &nb166af pan>632 1 .3077 .1280 9 4 700 1 .2308 .1169 10 3 1296 1 .1538 .1001 11 2 1990 0 11 1 2240 1 .0000 .0000 12 0 ? Number of Cases: 13 Censored: 1 ( 7.69%) Events: 12 ? Survival Time Standard Error 95% Confidence Interval Mean: 607 226 ( 163, 1051 ) Median: 195 80 ( 38, 352 ) ? Total Number Number Percent Events Censored Censored TREAT A 12 6 6 50.00 TREAT B 13 12 1 7.69 Overall 25 18 7 28.00 ?  ? 系统按用户的请求输出生存率曲线图(图14.4)。从图中可见,生存天数为200左右之前,A、B两组的生存率相近,而后,A组维持约50%的生存率,B组则不断下降。 最后系统将各观察对象的生存率计算结果,逐一送入原始数据库保存(图14.5),变量名为sur_1。用户从中可见,如A组治疗8天死亡者,其8天的生存率为83.333%;又如B组治疗180天死亡者,其180天的生存率为53.846%。 ? ?  图14.4 两种治疗方式生存率曲线比较  ? ?  图14.5 生存率分析结果的保存  ?  第三节 Cox Regression过程 ? 14.3.1 主要功能 调用此过程可完成对病例随访资料中事件发生时点与一系列相关独立变量之间关系的评价,即建立Cox回归模型(亦称比例风险模型)。 第一、二节介绍的方法,仅仅是对生存资料作较简单的统计,即描述和分析一个因素(如治疗方式)对生存时间的影响。而在Cox回归模型中,某一时点t,除了有一个本底风险量h0(t)外,第i个影响因素可使该本底风险量h0(t)增至eβixi倍而成为h0(t)·eβixi 。因此如果有k个因素同时影响生存过程,那么时点t的风险量(常称之为风险函数)表达为: h(t) = h0(t) ·e(β1x1+β2x2+...+βkxk) ?  14.3.2 实例操作 [例14-3]某医师在研究急性白血病患者的生存率时,收集了33名患者的资料,按Ag阳、阴性分组(Ag阳性组17例,Ag阴性组16例),同时考察白细胞数的影响作用。试据下表资料作Cox回归模型的分析。 ? Ag阳性组 Ag阴性组  生存月数 是否死亡 白细胞数(×109 /L) 生存月数 是否死亡 白细胞数(×109 /L)  1 1 4 5 16 22 26 39 56 65 65 100 108 121 134 143 156 是 是 是 是 是 是 否 是 是 否 是 是 是 是 否 是 是 100.0 100.0 17.0 52.0 6.0 35.0 32.0 5.4 9.4 2.3 100.0 4.3 10.5 10.0 2.6 7.0 0.8 2 3 3 3 4 4 4 7 8 16 17 22 30 43 56 65 是 是 是 是 否 是 是 是 是 是 是 是 是 是 是 是 27.0 10.0 28.0 21.0 19.0 26.0 100.0 1.5 31.0 9.0 4.0 5.3 79.0 100.0 4.4 3.0  ? 14.3.2.1 数据准备 激活数据管理窗口,定义变量名:生存月数为TIME,是否死亡为DEATH,白细胞数为WBC,Ag阳性与否为AG。TIME按原数据输入,DEATH是的输入1、否的输入0,WBC亦按原数据输入,AG阳性的输入1、阴性的输入2。 ? 14.3.2.2 统计分析 激活Statistics菜单选Survival中的Cox Regression...项,弹出Cox Regression对话框(图14.6)。从对话框左侧的变量列表中选time,点击(钮使之进入time框;选death,点击(钮使之进入Status框,点击Define Event...钮弹出Cox Regression:Define Event for Status Variable对话框,在Single value栏中输入1,表明death = 1为发生死亡事件者;点击Continue钮返回Cox Regression对话框。选wbc和ag,点击(钮使之进入Covariates框。 ? ?  图14.6 Cox回归模型分析对话框  ? 在Method处有一下拉菜单,系统提供7种回归运算方法让用户选择: 1、Enter:所有自变量强制进入回归方程; 2、Forward: Conditional:以假定参数为基础作似然比概率检验,向前逐步选择自变量; 3、Forward: LR:以最大局部似然为基础作似然比概率检验,向前逐步选择自变量; 4、Forward: Wald:作Wald概率统计法,向前逐步选择自变量; 5、Backward: Conditional:以假定参数为基础作似然比概率检验,向后逐步选择自变量; 6、Backward: LR:以最大局部似然为基础作似然比概率检验,向后逐步选择自变量; 7、Backward: Wald:作Wald概率统计法,向后逐步选择自变量。 本例因自变量较少,故选用Enter法。 点击Plots...钮弹出Cox Regression:Plots对话框,在Polts Type栏中选Survival项,要求绘制生存率曲线图,同时选Hazard项,要求绘制风险量变化图。然后点击Continue钮返回Cox Regression对话框。 点击Save... 钮弹出Cox Regression:Save New Variables对话框,在Survival栏中选Function项,要求将生存率计算结果存入原数据库;在Diagnostics处选Hazard function项,要求将风险函数计算结果存入原数据库;再选X*Beta项,要求计算各自变量与其系数的乘积并存盘。完成选择后点击Continue钮返回Cox Regression对话框。 点击Options...钮弹出Cox Regression:Options对话框,在Model Statistics栏中选At last step项,要求只显示回归方程拟合过程的最终结果;同时选Display baseline function项,要求显示各样本的本底风险量。之后点击Continue钮返回Cox Regression对话框,再点击OK钮即完成分析。 ? 14.3.2.3 结果解释 在结果输出窗口中将看到如下统计数据: 系统显示共有33例样本进入分析,其中29例在观察期内死亡,4例仍存活,存活率为12.1%。Cox回归方程拟合结果的χ2检验,χ2值为11.773,P = 0.0028,表明AG与WBC两自变量对生存状态均有作用。得到风险量增加倍数为e(0.0089×WBC - 1.1219×AG),其中白细胞数的变量系数为正值,意味着白细胞数愈高,死亡风险愈大;Ag的变量系数为负,意味着Ag阳性者,死亡风险小。 ? 33 Total cases read 0 Cases with missing values 0 Valid cases with non-positive times 0 Censored cases before the earliest event in a stratum 0 Total cases dropped 33 Cases available for the analysis ? Dependent Variable: TIME ? Events Censored 29 4 (12.1%) ? Beginning Block Number 0. Initial Log Likelihood Function ? -2 Log Likelihood 153.394 ? Beginning Block Number 1. Method: Enter ? Variable(s) Entered at Step Number 1.. AG WBC ? -2 Log Likelihood 142.761 ? Chi-Square df Sig Overall (score) 11.773 2 .0028 Change (-2LL) from Previous Block 10.633 2 .0049 Previous Step 10.633 2 .0049 ? -------------------- Variables in the Equation --------------------- Variable B S.E. Wald df Sig R Exp(B) AG -1.1219 .4505 6.2025 1 .0128 -.1655 .3256 WBC .0089 .0052 2.9703 1 .0848 .0795 1.0089 ?  ? 接着,系统显示各生存时点(亦即各样本)的本底风险量(Cum Hazard)、生存率(Survival)、生存率的标准误(SE)和本底风险量的标准误(SE of Cum hazard)。并提示将在原数据库中产生三个新的变量,即生存率、风险比例和风险量倍数。 ? Baseline ---- At mean of covariates --- Time Cum Hazard Survival SE SE of Cum Hazard 1 .0701 .9503 .0338 .0510 2 .1069 .9252 .0415 .0778 3 .2286 .8468 .0574 .1663 4 .3730 .7623 .0691 .2714 5 .4305 .7311 .0738 .3132 7 .4907 .6998 .0776 .3570 8 .5555 .6676 .0809 .4041 16 .6977 .6020 .0858 .5075 17 .7755 .5688 .0877 .5642 22 .9484 .5016 .0895 .6899 30 1.0552 .4641 .0901 .7677 39 1.1770 .4248 .0910 .8562 43 1.3251 .3814 .0894 .9640 56 1.7359 .2829 .0829 1.2628 65 2.3579 .1799 .0679 1.7153 100 2.8882 .1223 .0635 2.1011 108 3.5394 .0762 .0521 2.5748 121 4.3891 .0411 .0369 3.1929 143 6.4697 .0090 .0133 4.7066 156 . .0000 . . ? Covariate Means Variable Mean AG .5152 WBC 29.1667 ? 3 New variables have been added: Name Label SUR_1 Survival Function HAZ_1 Cumulative Hazard Function XBE_1 X'Beta ?  ? 从输出的Cox模型生存率曲线图(图14.7)中可见,随时间的延长,患者生存率逐渐下降,接近160个月时,生存率几乎为0。 ? ?  图14.7 Cox模型的生存率曲线  ? 下图为Cox模型的风险量曲线图,其趋势也十分明显,即随时间的延长,患者在生存上所经历的死亡风险愈来愈大,到140个月时,大约是起初(0个月)的5倍。 ? ?  图14.8 Cox模型的风险量曲线  ? 系统在原始数据库中将生存率以变量sur_1、风险比例以变量haz_1和风险量倍数以变量xbe_1存盘(图14.9)。用户从中可见,如经治疗后1月内死亡、其白细胞数为100.0×109 /L、Ag阳性者,生存率为94.592%、风险比例为5.560%、风险量倍数为0.08695;又如经治疗后26月内尚存活、其白细胞数为32.0×109 /L、Ag阳性者,生存率为66.318%、风险比例为41.070%、风险量倍数为-0.51874。 ? ?  图14.9 Cox回归模型分析结果的保存