上一主题:Spss电脑实验-第八节(1)统计指标影响因素的分析
下一主题:Spss电脑实验-第七节(2)动态数列及其外延预测法
返回列表 发帖

Spss电脑实验-第八节(4)对照调查比较 — 配对调查资料的条件 Logistic 回归分析

Ⅳ.对照调查比较 — 配对调查资料的条件 Logistic 回归分析
1. 1:1 病例对照研究的基本概念
在管理工作中,我们也经常要开展对照调查。例如为什么有的人患了胃癌,有的人却不会患胃癌?如果在同一居住地选取同性别、年龄相差仅 ±2 岁的健康人作对照调查,调查他们与患胃癌有关的各种影响因素,这就是医学上很常用的所谓“1:1 病例对照研究”。
病例对照研究资料常用条件Logistic 回归分析。条件Logistic 回归模型(conditional logistic regression model,CLRM),下称CLRM 模型。
2. 条件Logistic 回归模型的一个实例
某地在肿瘤防治健康教育、社区干预工作中做了一项调查,内容是三种生活因素与胃癌发病的关系。调查的三种生活因素取值见表 11-6。
请拟合条件Logistic 回归模型,说明胃癌发病的主要危险因素。
表 11-6 三种生活因素与胃癌发病关系的取值
------------------------------------------------------------------------------------------
变 量 名 取 值 范 围
------------------------------------------------------------------------------------------
X1 (不良生活习惯) 0,1,2,3,4 表示程度(0 表示无,4 表示很多)
X2 (喜吃卤食和盐腌食物) 0,1,2,3,4 表示程度(0 表示不吃,4 表示喜欢吃、吃很多)
X3 (精神状况) 0 表示差,1 表示好
------------------------------------------------------------------------------------------

表 11-7 50 对胃癌病例(S=1)与对照(S=0)三种生活习惯调查结果
------------------------------------------------------------------------------------------
病例 对照 病例 对照
-----------------------------------------------------------------------------
No S X1 X2 X3 No S X1 X2 X3 No S X1 X2 X3 No S X1 X2 X3
------------------------------------------------------------------------------------------
1 1 2 4 0 1 0 3 1 0 26 1 2 2 0 26 0 1 1 0
2 1 3 2 1 2 0 0 1 0 27 1 2 0 1 27 0 0 2 1
3 1 3 0 0 3 0 2 0 1 28 1 1 1 1 28 0 3 0 1
4 1 3 0 0 4 0 2 0 1 29 1 2 0 1 29 0 4 0 0
5 1 3 0 1 5 0 0 0 0 30 1 3 1 0 30 0 0 2 1
6 1 2 2 0 6 0 0 1 0 31 1 1 0 1 31 0 0 0 0
7 1 3 1 0 7 0 2 1 0 32 1 4 2 1 32 0 1 0 1
8 1 3 0 0 8 0 2 0 0 33 1 4 0 1 33 0 2 0 1
9 1 2 2 0 9 0 1 0 1 34 1 2 0 1 34 0 0 0 1
10 1 1 0 0 10 0 2 0 0 35 1 1 2 0 35 0 2 0 1
11 1 3 0 0 11 0 0 1 1 36 1 2 0 0 36 0 2 0 1
12 1 3 4 0 12 0 3 2 0 37 1 0 1 1 37 0 1 1 0
13 1 1 1 1 13 0 2 0 0 38 1 0 0 1 38 0 4 0 0
14 1 2 2 1 14 0 0 2 1 39 1 3 0 1 39 0 0 1 0
15 1 2 3 0 15 0 2 0 0 40 1 2 0 1 40 0 3 0 1
16 1 2 4 1 16 0 0 0 1 41 1 2 0 0 41 0 1 0 1
17 1 1 1 0 17 0 0 1 1 42 1 3 0 1 42 0 0 0 1
18 1 1 3 1 18 0 0 0 1 43 1 2 1 1 43 0 0 0 0
19 1 3 4 1 19 0 2 0 0 44 1 2 0 1 44 0 1 0 0
20 1 0 2 0 20 0 0 0 0 45 1 1 1 1 45 0 0 0 1
21 1 3 2 1 21 0 3 1 0 46 1 0 1 1 46 0 0 0 0
22 1 1 0 0 22 0 2 0 1 47 1 2 1 0 47 0 0 0 0
23 1 3 0 0 23 0 2 2 0 48 1 2 0 1 48 0 1 1 0
24 1 1 1 1 24 0 0 1 1 49 1 1 2 1 49 0 0 0 1
25 1 1 2 0 25 0 2 0 0 50 1 2 0 1 50 0 0 3 1
-------------------------------------------------------------------------------------------
3. 条件Logistic 回归模型的拟合原理与方法
本例以 SPSS 软件包来拟合 CLRM 模型。SPSS 虽有一个 LOGISTIC REGRESSION 命令,却无法拟合条件 Logistic 模型(CLRM),但有拟合 Cox 回归模型的固有命令(COXREG)。 回顾一下Cox 回归模型的公式:
h (t,X) = h0(t) exp (X1 β1 + X2 β2 + ...+ Xp βp)
将两侧同时取对数可得:
LN(h(t,X)) = LN (h0(t)) + (X1 β1 + X2 β2 + ...+ Xp βp)
如果是含有分层变量的Cox 回归模型, 则公式变为:
LN(h(t,X)) = LN (h0i(t)) + (X1 β1 + X2 β2 + ...+ Xp βp)
各层的基线风险函数h0i(t) 可以完全无关,而协变量的系数则在所有层中保持不变。作
为半参数的方法,Cox 模型在拟合时并不估计基线风险函数h0i(t),只估计各协变量的系数值β。这则与条件 Logistic 回归模型不关心αi 的大小,只解出系数值β的思路一致。而且两者都以最大似然法(LR)来拟合。把配对因素作为分层因素,即可消除配对因素的作用,因此可用分层变量控制法的原理,来拟合条件 Logistic 回归模型。
在使用SPSS的COXREG 命令拟合条件 Logistic 模型时(Analyze → Survival → Cox Regression),要回答下列5个对话框:
① Time: 给每行记录一个虚拟的生存时间(Time),一般默认“病例” 生存时间短(例如为“1”),“对照” 生存时间长(例如为“2”)。只要“对照” 的生存时间(例如“2”~“100”)长于“病例”即可。因为SPSS 会把在最短的完全数据的生存时间之前的截尾数据(Censored)全部去掉而不参加分析。输出分层状态时,Event=“1”;Censored= “2”。
② Status 与 Define Event: 选入虚拟生存状态变量。定义事件时“病例”全为“1”(Single value),为完全数据;“对照” 全“0”,为截尾数据。此值“1”表示事件已发生,本例即“病例”。
③ Covariates: 选入要进行分析的协变量(即自变量 X1,X2,X3)。
④ Method: 用 FSTEP(LR),即似然比法。
⑤ Strata: 录入配对的对子号,“1”指第1 个对子(含“病例”为“1”一行与“对照” 者为“0”一行);“2”指第2 个对子。本例指变量“No”。
4. 拟合条件Logistic 回归模型所用程序文件
所用程序文件名为 CondLogiRegre.sps。
*Conditional Logistic Regression; filename: CondLogiRegre.sps.
*---------------------------------------------------------------.
*Fang Ji-Qian: Med. Stat. and Computer Experiment, P.492:.
* Using COX-Regression to fit Conditional Logistic Regression:.
DATA LIST FREE /No Status Time x1 x2 x3.
BEGIN DATA.
1 1 1 2 4 0 1 0 2 3 1 0 2 1 1 3 2 1 2 0 2 0 1 0
3 1 1 3 0 0 3 0 2 2 0 1 4 1 1 3 0 0 4 0 2 2 0 1
5 1 1 3 0 1 5 0 2 0 0 0 6 1 1 2 2 0 6 0 2 0 1 0
7 1 1 3 1 0 7 0 2 2 1 0 8 1 1 3 0 0 8 0 2 2 0 0
9 1 1 2 2 0 9 0 2 1 0 1 10 1 1 1 0 0 10 0 2 2 0 0
11 1 1 3 0 0 11 0 2 0 1 1 12 1 1 3 4 0 12 0 2 3 2 0
13 1 1 1 1 1 13 0 2 2 0 0 14 1 1 2 2 1 14 0 2 0 2 1
15 1 1 2 3 0 15 0 2 2 0 0 16 1 1 2 4 1 16 0 2 0 0 1
17 1 1 1 1 0 17 0 2 0 1 1 18 1 1 1 3 1 18 0 2 0 0 1
19 1 1 3 4 1 19 0 2 2 0 0 20 1 1 0 2 0 20 0 2 0 0 0
21 1 1 3 2 1 21 0 2 3 1 0 22 1 1 1 0 0 22 0 2 2 0 1
23 1 1 3 0 0 23 0 2 2 2 0 24 1 1 1 1 1 24 0 2 0 1 1
25 1 1 1 2 0 25 0 2 2 0 0 26 1 1 2 2 0 26 0 2 1 1 0
27 1 1 2 0 1 27 0 2 0 2 1 28 1 1 1 1 1 28 0 2 3 0 1
29 1 1 2 0 1 29 0 2 4 0 0 30 1 1 3 1 0 30 0 2 0 2 1
31 1 1 1 0 1 31 0 2 0 0 0 32 1 1 4 2 1 32 0 2 1 0 1
33 1 1 4 0 1 33 0 2 2 0 1 34 1 1 2 0 1 34 0 2 0 0 1
35 1 1 1 2 0 35 0 2 2 0 1 36 1 1 2 0 0 36 0 2 2 0 1
37 1 1 0 1 1 37 0 2 1 1 0 38 1 1 0 0 1 38 0 2 4 0 0
39 1 1 3 0 1 39 0 2 0 1 0 40 1 1 2 0 1 40 0 2 3 0 1
41 1 1 2 0 0 41 0 2 1 0 1 42 1 1 3 0 1 42 0 2 0 0 1
43 1 1 2 1 1 43 0 2 0 0 0 44 1 1 2 0 1 44 0 2 1 0 0
45 1 1 1 1 1 45 0 2 0 0 1 46 1 1 0 1 1 46 0 2 0 0 0
47 1 1 2 1 0 47 0 2 0 0 0 48 1 1 2 0 1 48 0 2 1 1 0
49 1 1 1 2 1 49 0 2 0 0 1 50 1 1 2 0 1 50 0 2 0 3 1
END DATA.
LIST VARIABLES=ALL /FORMAT=NUMBERED /CASES=FROM 1 TO 50.
* When programing:.
* "Status": "Case"=1; "Control"=0.
* "Time": "Case"=1; "Control"=2, that is,
the survival time of "Control" should longer than "Case".
* "Define Event": Single value: "1" means "Case".
* "Covariate": Inpute the independence variables.
* "Method": ENTER, FSTEP, BSTEP, etc.
* "Strata": The No. of per pairs, that is,No.
COXREG Time /STATUS=Status(1)
/STRATA=No
/METHOD=FSTEP(LR) X1 X2 X3
/PRINT=DEFAULT CI(95)
/CRITERIA=PIN(0.05) POUT(0.1) ITERATE(20).
*--------------------------------------------------------------------------.
5. 拟合条件Logistic 回归模型的主要运算结果
运行程序文件 CondLogiRegre.sps 可得到下列主要结果:
Variables in the Equation
B SE Wald df Sig. Exp(B) 95.0% CI for Exp(B)
Lower Upper
Step 1 X1 0.659 0.220 8.973 1 0.003 1.932 1.256 2.973
Step 2 X1 0.785 0.257 9.351 1 0.002 2.193 1.326 3.629
X2 0.814 0.307 7.042 1 0.008 2.257 1.237 4.118

回归系数 B 表示病例与对照变量值之差与患病优势的关系,即 Exp(B) 表示病例与对照暴露水平相差 1 个单位时患病的比数比(Odd Ratio, OR)。从表中可见,X3(精神状况)未被引入回归模型,只引入影响因素 X1 与 X2,说明精神状况的好坏与胃癌发病无显著相关,而 X1 (不良生活习惯) 和X2 (喜吃卤食和盐腌食物)与患胃癌有较密切的关系。
注意:X1 与 X2 的回归系数 B 都是正值(前者为0.785,后者为0.814),OR 值都大于 1(前者 Exp(B) = OR = 2.193,后者 Exp(B) = OR = 2.257),而且都有统计学显著性(前者 Sig.= P = 0.002,后者 P = 0.008)。说明不良生活习惯、喜吃卤食和盐腌食物会增加胃癌发病机会;而且不良生活习惯越多、卤食和盐腌食物吃得越多,胃癌发病的机会就越大。

返回列表
上一主题:Spss电脑实验-第八节(1)统计指标影响因素的分析
下一主题:Spss电脑实验-第七节(2)动态数列及其外延预测法