方差分析是R.A.Fister发明的,用于两个及两个以上样本均数差别的显著性检验。由于各种因素的影响,研究所得的数据呈现波动状,造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。方差分析的基本思想是:通过分析研究中不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。
方差分析主要用于:1、均数差别的显著性检验,2、分离各有关因素并估计其对总变异的作用,3、分析因素间的交互作用,4、方差齐性检验。
第一节 Simple Factorial过程
6.1.1 主要功能
调用此过程可对资料进行方差分析或协方差分析。在方差分析中可按用户需要作单因素方差分析(其结果将与第五章第四节相同)或多因素方差分析(包括医学中常用的配伍组方差分析);当观察因素中存在有很难或无法人为控制的因素时,则可对之加以指定以便进行协方差分析。
6.1.2 实例操作
[例6-1]下表为运动员与大学生的身高(cm)与肺活量(cm3)的数据,考虑到身高与肺活量有关,而一般运动员的身高高于大学生,为进一步分析肺活量的差异是否由于体育锻炼所致,试作控制身高变量的协方差分析。
运 动 员 |
大 学 生 | ||
身高 |
肺活量 |
身高 |
肺活量 |
184.9 167.9 171.0 171.0 188.0 179.0 177.0 179.5 187.0 187.0 169.0 188.0 176.7 179.0 183.0 180.5 179.0 178.0 164.0 174.0 |
4300 3850 4100 4300 4800 4000 5400 4000 4800 4800 4500 4780 3700 5250 4250 4800 5000 3700 3600 4050 |
168.7 170.8 165.0 169.7 171.5 166.5 165.0 165.0 173.0 169.0 173.8 174.0 170.5 176.0 169.5 176.3 163.0 172.5 177.0 173.0 |
3450 4100 3800 3300 3450 3250 3600 3200 3950 4000 4150 3450 3250 4100 3650 3950 3500 3900 3450 3850 |
6.1.2.1 数据准备
激活数据管理窗口,定义变量名:组变量为group(运动员=1,大学生=2),身高为x,肺活量为y,按顺序输入相应数值,建立数据库,结果见图6.1。
6.1.2.2 统计分析
激活 Statistics 菜单选ANOVA Models中的Simple Factorial...项,弹出Simple Factorial ANOVA对话框(图6.2)。在变量列表中选变量y,点击Ø钮使之进入Dependent框;选分组变量group,点击Ø钮使之进入Factor(s)框中, 并点击Define Range...钮在弹出的Simple Factorial ANOVAefine Range框中确定分组变量group的起止值(1,2);选协变量x,点击Ø钮使之进入Covariate(s)框中。
点击Options...框,弹出Simple Factorial ANOVA:Options对话框。系统在协方差分析的方法(Method)上有三种选项:
1、Unique:同时评价所有的效应;
2、Hierarchical:除主效应外,逐一评价各因素的效应;
3、Experimental:评价因素干预之前的主效应。
本例选Unique方法,之后点击Continue钮返回Simple Factorial ANOVA对话框,再点击OK钮即可。
6.1.2.3 结果解释
在结果输出窗口中可见如下统计数据:
先输出肺活量总均数和两组的肺活量均数,总均数为4033.25,运用员组均数为4399.00,大学生组为3667.50。
接着协方差分析表明,混杂因素X(身高)两组间是有差异的(F=10.679,P=0.002),控制其影响后,两组间肺活量的差别依然存在(F=9.220,P=0.004),故可以认为两组间肺活量的均数在消除了身高因素的影响之后仍有差别,运动员的肺活量大于大学生,即体育锻炼会提高肺活量。
最后系统输出公共回归系数,
本例为
Y by GROUP Total Population 4033.25 ( 40)
GROUP 1 2 4399.00 3667.50 ( 20) ( 20) Y by GROUP with X UNIQUE sums of squares All effects entered simultaneously Sum of Mean Sig Source of Variation Squares DF Square F of F Covariates 1630763 1 1630762.635 10.679 .002 X 1630763 1 1630762.635 10.679 .002 Main Effects 1407847 1 1407847.095 9.220 .004 GROUP 1407847 1 1407847.095 9.220 .004 Explained 6981685 2 3490842.568 22.860 .000 Residual 5649992 37 152702.496
Total 12631678 39 323889.167
40 cases were processed. 0 cases (.0 pct) were missing. Covariate Raw Regression Coefficient X 36.002
|
6.1.2.3 结果解释
在结果输出窗口中可见如下统计数据:
先输出肺活量总均数和两组的肺活量均数,总均数为4033.25,运用员组均数为4399.00,大学生组为3667.50。
接着协方差分析表明,混杂因素X(身高)两组间是有差异的(F=10.679,P=0.002),控制其影响后,两组间肺活量的差别依然存在(F=9.220,P=0.004),故可以认为两组间肺活量的均数在消除了身高因素的影响之后仍有差别,运动员的肺活量大于大学生,即体育锻炼会提高肺活量。
最后系统输出公共回归系数,
本例为
Y by GROUP Total Population 4033.25 ( 40)
GROUP 1 2 4399.00 3667.50 ( 20) ( 20) Y by GROUP with X UNIQUE sums of squares All effects entered simultaneously Sum of Mean Sig Source of Variation Squares DF Square F of F Covariates 1630763 1 1630762.635 10.679 .002 X 1630763 1 1630762.635 10.679 .002 Main Effects 1407847 1 1407847.095 9.220 .004 GROUP 1407847 1 1407847.095 9.220 .004 Explained 6981685 2 3490842.568 22.860 .000 Residual 5649992 37 152702.496
Total 12631678 39 323889.167
40 cases were processed. 0 cases (.0 pct) were missing. Covariate Raw Regression Coefficient X 36.002
|
6.2.2.2 统计分析
激活Statistics菜单选ANOVA Models中的General Factorial...项,弹出General Factorial ANOVA对话框(图6.3)。在对话框左侧的变量列表中选变量x,点击Ø钮使之进入Dependent Variable框;选要控制的分组变量base、sero和pct,点Ø钮使之进入Factor(s)框中,并分别点击Define Range钮,在弹出的General Factorial ANOVAefine Range对话框中确定各变量的起止值,本例变量base的起止值为1、3,变量sero的起止值为1、2,变量pct的起止值为1、2。之后点击OK钮即可。
6.2.2.3 结果解释
在结果输出窗口中,系统显示48个观察值进入统计,三个因素按其各自水平共产生12种组合。
分析表明,模型总效应的F值为10.55,P值 < 0.001,说明三因素间存在有交互作用。单因素效应和交互效应导致的组间差别比较结果是:
单因素组间比较:
A:基础液(BASE)
F = 4.98,P = 0.012,说明三种培养基培养钩体的计数有差别;
B:血清种类(SERO)
F = 61.265,P < 0.001,说明两种血清培养钩体的计数有差别;
C:血清浓度(PCT)
F = 3.49,P = 0.070,说明两种血清浓度培养钩体的计数无差别。
两因素构成的一级交互作用:
A×B:基础液(BASE)×血清种类(SERO)
F = 5.16,P = 0.011,交互作用明显;
B×C:血清种类(SERO)×血清浓度(PCT)
F = 15.96,P < 0.001,交互作用明显;
A×C:基础液(BASE)×血清浓度(PCT)
F = 0.78,P = 0.465,交互作用不明显。
三因素构成的二级交互作用:
A×B×C:基础液(BASE)×血清种类(SERO)×血清浓度(PCT)
F = 6.75,P = 0.003,交互作用明显。
48 cases accepted. 0 cases rejected because of out-of-range factor values. 0 cases rejected because of missing data. 12 non-empty cells. 1 design will be processed. - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Univariate Homogeneity of Variance Tests Variable .. X Cochrans C(3,12) = .34004, P = .036 (approx.) Bartlett-Box F(11,897) = 1.69822, P = .069 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - * * * * * * A n a l y s i s o f V a r i a n c e -- design 1 * * * * * * Tests of Significance for X using UNIQUE sums of squares Source of Variation SS DF MS F Sig of F WITHIN+RESIDUAL 2459233.75 36 68312.05 BASE 679967.38 2 339983.69 4.98 .012 PCT 238713.02 1 238713.02 3.49 .070 SERO 4184873.52 1 4184873.5 61.26 .000 BASE BY PCT 107005.54 2 53502.77 .78 .465 BASE BY SERO 705473.04 2 352736.52 5.16 .011 PCT BY SERO 1089922.69 1 1089922.7 15.96 .000 BASE BY PCT BY SERO 922307.37 2 461153.69 6.75 .003 (Model) 7928262.56 11 720751.14 10.55 .000 (Total) 10387496.31 47 221010.56
R-Squared = .763 Adjusted R-Squared = .691
|
第三节 Multivarite过程
6.3.1 主要功能
调用此过程可进行多元方差分析。此外,对于一元设计,如涉及混合模型的设计、分割设计(又称列区设计)、重复测量设计、嵌套设计、因子与协变量交互效应设计等,此过程均能适用。
6.3.2 实例操作
[例6-3]甲地区为大城市,乙地区为县城,丙地区为农村。某地分别调查了上述三类地区8岁男生三项身体生长发育指标:身高、体重和胸围,数据见下表,问:三类地区之间男生三项身体生长发育指标的差异有无显著性?
学生编号 |
甲地区 |
乙地区 |
丙地区 | ||||||
身高 |
体重 |
胸围 |
身高 |
体重 |
胸围 |
身高 |
体重 |
胸围 | |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 |
119.80 121.70 121.40 124.40 120.00 117.00 118.10 118.80 124.20 124.90 124.70 123.00 125.30 124.20 127.40 128.20 126.10 128.70 129.50 126.90 126.50 128.20 131.40 130.80 133.90 130.40 131.30 130.20 136.00 141.00 |
22.60 21.50 19.10 21.80 21.40 20.10 18.80 22.00 21.30 24.00 23.30 22.50 22.90 19.50 22.90 22.30 22.70 23.50 24.50 25.50 25.00 26.10 27.90 26.80 27.20 24.40 24.40 23.00 26.30 31.90 |
60.50 55.50 56.50 60.50 57.70 57.00 57.10 61.70 58.40 60.80 60.00 60.00 65.20 53.80 59.50 60.00 57.40 60.40 51.00 61.50 63.90 63.00 63.10 61.50 65.80 62.60 59.50 62.60 60.00 63.70 |
125.10 127.00 125.70 114.90 124.90 117.60 124.20 117.90 120.40 115.00 126.20 125.10 114.90 121.50 114.00 118.70 120.60 122.90 119.60 112.30 121.30 121.20 120.20 120.30 120.00 123.30 122.10 123.30 109.90 125.60 |
23.00 21.50 23.40 17.50 23.50 18.90 20.80 20.30 20.00 19.70 21.20 22.10 19.70 22.00 19.00 19.10 20.00 18.50 19.50 20.00 20.00 21.20 23.10 21.00 22.20 20.10 21.00 21.50 17.80 23.30 |
62.00 59.00 61.50 52.50 58.50 57.00 58.50 61.00 56.00 56.50 56.50 58.50 56.00 57.00 54.50 54.50 55.50 56.00 59.50 58.00 58.00 59.00 59.50 59.50 59.50 56.50 57.50 61.00 56.50 60.50 |
118.30 121.30 121.80 124.20 123.50 123.00 134.90 123.70 105.20 112.20 118.60 112.00 121.50 124.50 119.50 122.50 115.50 122.50 124.50 125.00 117.50 127.30 122.30 121.30 120.50 116.00 120.50 114.50 131.00 122.50 |
20.40 20.00 26.60 22.10 23.20 22.90 32.30 22.70 20.20 20.80 21.00 23.20 24.00 21.50 20.50 23.00 19.00 22.50 25.00 25.50 23.00 22.50 22.00 21.00 22.00 19.00 20.00 19.00 25.50 24.50 |
54.40 54.30 61.10 |
欢迎光临 CFA论坛 (http://forum.theanalystspace.com/) | Powered by Discuz! 7.2 |