SPSS教程第六课：平均数的比较

Rank: 1

UID: 323356
帖子: 66
主题: 0
注册时间: 2006-7-5
最后登录: 2008-9-2

10^#

发表于 2006-7-5 21:59 | 只看该作者

hao

Rank: 1

UID: 304992
帖子: 145
主题: 69
注册时间: 2005-11-1
最后登录: 2006-7-5

9^#

发表于 2006-7-4 18:38 | 只看该作者

第四节 One-Way ANOVA过程

5.4.1 主要功能

在实际研究中，经常需要比较两组以上样本均数的差别，这时不能使用t检验方法作两两间的比较（如有人对四组均数的比较，作6次两两间的t检验），这势必增加两类错误的可能性（如原先a定为0.05，这样作多次的t检验将使最终推断时的a>0.05）。故对于两组以上的均数比较，必须使用方差分析的方法，当然方差分析方法亦适用于两组均数的比较。方差分析可调用此过程可完成。

本过程只能进行单因素方差分析，即完全随机设计资料的方差分析。对于随机区组设计资料方差分析的方法，将在第五章介绍。

5.4.2 实例操作

［例５.4］某单位研究两种不同制剂治疗钩虫的效果，用大白鼠作试验。11只大白鼠随机分配于3组：一组为对照组、另外二组分别为使用甲、乙制剂的实验组。试验方法是：用药前每鼠人工感染500条钩蚴，感染后第8天实验组分别给予甲、乙制剂，对照组不给药，第10天全部解剖检查鼠体内活虫数，结果如下，问两制剂是否有效？

对照组

甲制剂组

乙制剂组

279

334

303

338

298

129

174

110

210

285

117

5.4.2.1 数据准备

激活数据管理窗口，定义变量名：实际观察值定义为x，组别用变量range表示：其中对照组的值为、甲制剂实验组的值为、乙制剂实验组的值为，输入后的结果如图5.7所示。

5.4.2.2 统计分析

激活Statistics菜单选Compare Means中的One-Way ANOVA...项，弹出One-Way ANOVA 对话框（如图5.8示）。从对话框左侧的变量列表中选x，点击Ø钮使之进入Dependent List框，选range 点击Ø钮使之进入Factor框，点击Define Range钮打开One-Way ANOVA: Define Range 对话框，因本例为3组比较，故在Minimum处输入1，在Maximum处输入3，点击Continue钮返回One-Way ANOVA 对话框。如果欲作多个样本均数间两两比较，可点击该点击对话框的Post Hoc...钮打开One-Way ANOVA: Post Hoc Multiple Comparisons对话框（如图5.9所示），这时可见在Tests框中有7种比较方法供选择：

Least-significant difference：最小显著差法。a可指定0~1之间任何显著性水平，默认值为0.05；

Bonferroni：Bonferroni修正差别检验法。a可指定0~1之间任何显著性水平，默认值为0.05；

Duncan’s multiple range test：Duncan多范围检验。只能指定a为0.05或0.01或0.1，默认值为0.05；

Student-Newman-Keuls：Student-Newman-Keuls检验，简称N-K检验,亦即q检验。a只能为0.05；

Tukey’s honestly significant difference：Tukey显著性检验。a只能为0.05；

Tukey’s b：Tukey另一种显著性检验。a只能为0.05；

Scheffe：Scheffe差别检验法。a可指定0~1之间任何显著性水平，默认值为0.05。

本例选用Student-Newman-Keuls显著性检验法。在Sample Size Estimate框中有Harmonic average of pairs和Harmonic average of all groups两选项，前者表示仅采用相互比较两组的调和均数，后者表示采用所有组（含比较的两组和尚未比较的其他组）的调和均数，本例选用前者，点击Continue钮返回One-Way ANOVA 对话框后，再点击OK钮即完成分析。

Rank: 1

UID: 304992
帖子: 145
主题: 69
注册时间: 2005-11-1
最后登录: 2006-7-5

8^#

发表于 2006-7-4 18:38 | 只看该作者

5.4.2.3 结果解释

在结果输出窗口中将看到如下统计数据：

- - - - - O N E W A Y - - - - -

Variable X

By Variable RANGE

Analysis of Variance

Sum of Mean F F

Source D.F. Squares Squares Ratio Prob.

Between Groups 2 59724.3152 29862.1576 12.6804 .0033

Within Groups 8 18839.8667 2354.9833

Total 10 78564.1818

上述结果显示组间、组内（实际上本例应称之为“剩余”）和合计的自由度（D.F.）、离均差平方和（Sum of Squares,即SS）、均方（Means Squares,即SS）、F值（F Ratio）和P值（F Prob.），本例F=12.6804，P=0.0033，表明甲、乙两种制剂中必有一种制剂治疗钩虫是有效的。

为了解哪一种制剂是有效的，本例采用SNK两两比较法，结果如下：

- - - - - O N E W A Y - - - - -

Variable X

By Variable RANGE

Multiple Range Tests: Student-Newman-Keuls test with significance level .050

The difference between two means is significant if

MEAN(J)-MEAN(I) >= 34.3146 * RANGE * SQRT(1/N(I) + 1/N(J))

with the following value(s) for RANGE:

Step 2 3

RANGE 3.27 4.04

(*) Indicates significant differences which are shown in the lower triangle

G G G

r r r

p p p

2 3 1

Mean RANGE

137.6667 Grp 2

204.0000 Grp 3

310.4000 Grp 1 * *

上述结果显示：如果两均数的差值 34.3146×RANGE×，则差别有显著性意义。上面已用“*”标出2、3两组与1组比较均有显著性差异。具体作法是：以甲制剂与对照组的比较为例，均数差值 = 310.4000 - 137.6667 = 172.7333，已知RANGE为4.04，n1=5，n2=3，按上式求得101.2418，因172.7333 > 101.2418，故甲制剂有效；余同。即甲、乙制剂治疗钩虫均有效。因甲制剂与乙制剂比较，均数差值为66.3333，按上式求得界值为91.6180，故尚无证据表明甲、乙制剂间效果有差别。

Rank: 1

UID: 304992
帖子: 145
主题: 69
注册时间: 2005-11-1
最后登录: 2006-7-5

7^#

发表于 2006-7-4 18:37 | 只看该作者

第三节 Paired-Samples T Test过程

5.3.1 主要功能

调用此过程可完成配对资料的显著性检验，即配对t检验。在医学领域中，主要的配对资料包括：同对（年龄、性别、体重、病况等非处理因素相同或相似者）或同一研究对象分别给予两种不同处理的效果比较，以及同一研究对象处理前后的效果比较。前者推断两种效果有无差别，后者推断某种处理是否有效。

5.3.2 实例操作

［例５.2］某单位研究饲料中缺乏维生素E与肝中维生素A含量的关系，将大白鼠按性别、体重等配为8对，每对中两只大白鼠分别喂给正常饲料和维生素E缺乏饲料，一段时期后将之宰杀，测定其肝中维生素A含量（mmol/L）如下，问饲料中缺乏维生素E对鼠肝中维生素A含量有无影响？

大白鼠对别

肝中维生素A含量（mmol/L）

正常饲料组

维生素E缺乏饲料组

37.2

20.9

31.4

41.4

39.8

39.3

36.1

31.9

25.7

25.1

18.8

33.5

34.0

28.3

26.2

18.3

5.3.2.1 数据准备

激活数据管理窗口，定义变量名：正常饲料组测定值为x1，维生素E缺乏饲料组测定值为x2，数据输入后结果如图5.5所示。

Rank: 1

UID: 304992
帖子: 145
主题: 69
注册时间: 2005-11-1
最后登录: 2006-7-5

6^#

发表于 2006-7-4 18:37 | 只看该作者

5.3.2.2 统计分析

激活Statistics菜单选Compare Means中的Paired-samples T Test...项，弹出Paried-samples T Test对话框（如图5.6示）。从对话框左侧的变量列表中点击x1，这时在左下方的Current Selections框中Variable 1处出现x1，再从变量列表中点击x2，左下方的Current Selections框中Variable 2处出现x2。点击Ø钮使x1、x2进入Variables框，点击OK钮即完成分析。

5.3.2.3 结果解释

在结果输出窗口中将看到如下统计数据：

- - - t-tests for paired samples - - -

Number of 2-tail

Variable pairs Corr Sig Mean SD SE of Mean

--------------------------------------------------------------------------------------------------------------

X1 34.7500 6.649 2.351

8 .586 .127

X2 26.2375 5.821 2.058

-------------------------------------------------------------------------------

这段结果显示本例共有8对观察值，相关系数（C）为0.586，相关系数的显著性检验表明P=0.127；变量x1的均数（Mean）、标准差（SD）、标准误（SE of Mean）分别为34.7500、6.649、2.351，变量x2的均数、标准差、标准误分别为26.2375、5.821、2.058。

Paired Differences |

Mean SD SE of Mean | t-value df 2-tail Sig

----------------------------------------------------|--------------------------------------------------

8.5125 5.719 2.022 | 4.21 7 .004

95% CI (3.730, 13.295) |

这段结果显示变量x1、x2两两相减的差值均数、标准差、标准误95%可信区间（95% Cl）分别为8.5125、5.719、2.022，95%可信区间（95% Cl）为3.730，13.295。配对检验结果为：t=4.21, P=0.004, 差别具高度显著性意义，即饲料中缺乏维生素E对鼠肝中维生素A含量确有影响。

Rank: 1

UID: 304992
帖子: 145
主题: 69
注册时间: 2005-11-1
最后登录: 2006-7-5

5^#

发表于 2006-7-4 18:36 | 只看该作者

第二节 Independent-Samples T Test过程

5.2.1 主要功能

调用此过程可完成两样本均数差别的显著性检验，即通常所说的两组资料的t检验。

5.2.2 实例操作

［例５.2］分别测得14例老年性慢性支气管炎病人及11例健康人的尿中17酮类固醇排出量（mg/dl）如下，试比较两组均数有无差别。

病人	2.90 5.41 5.48 4.60 4.03 5.10 4.97 4.24 4.36 2.72 2.37 2.09 7.10 5.92
健康人	5.18 8.79 3.14 6.46 3.72 6.64 5.60 4.57 7.71 4.99 4.01

5.2.2.1 数据准备

激活数据管理窗口，定义变量名：把实际观察值定义为x，再定义一个变量group来区分病人与健康人。输入原始数据，在变量group中，病人输入1，健康人输入2。结果如图5.3所示。

5.2.2.2 统计分析

激活Statistics菜单选Compare Means中的Independent-samples T Test...项，弹出Independent- samples T Test对话框（如图5.4示）。从对话框左侧的变量列表中选x，点击Ø钮使之进入Test Variable(s)框，选group 点击Ø钮使之进入Grouping Variable框，点击Define Groups...钮弹出Define Groups定义框，在Group 1中输入1，在Group 2中输入2，点击Continue钮，返回Independent-samples T Test对话框，点击OK钮即完成分析。

Rank: 1

UID: 304992
帖子: 145
主题: 69
注册时间: 2005-11-1
最后登录: 2006-7-5

4^#

发表于 2006-7-4 18:36 | 只看该作者

5.2.2.3 结果解释

在结果输出窗口中将看到如下统计数据：

t-tests for independent samples of GROUP

Number

Variable of Cases Mean SD SE of Mean

---------------------------------------------------------------

GROUP 1 14 4.3779 1.450 .387

GROUP 2 11 5.5282 1.735 .523

---------------------------------------------------------------

Mean Difference = -1.1503

Levene's Test for Equality of Variances: F= .440 P= .514

这一部分显示两组资料的例数（Numbers of cases）、均数（Mean）、标准差（SD）和标准误（SE of Mean），显示两均数差值为1.1503，经方差齐性检验： F= .440 P= .514，即两方差齐。

t-test for Equality of Means 95%

Variances t-value df 2-Tail Sig SE of Diff CI for Diff

-----------------------------------------------------------------------

Equal -1.81 23 .084 .637 (-2.468, .167)

Unequal -1.77 19.47 .093 .651 (-2.513, .213)

-----------------------------------------------------------------------

这一部分显示t检验的结果，第一行表示方差齐情况下的t检验的结果，第二行表示方差不齐情况下的t检验的结果。依次显示值（t-value）、自由度（df）、双侧检验概率（2-Tail Sig）、差值的标准误（SE of Diff）及其95%可信区间（Cl for Diff）。因本例属方差齐性，故采用第一行（即Equal）结果：t=1.81,P=0.084,差别有显著性意义，即老年性慢性支气管炎病人的尿中17酮类固醇排出量低于健康人

Rank: 1

UID: 304992
帖子: 145
主题: 69
注册时间: 2005-11-1
最后登录: 2006-7-5

3^#

发表于 2006-7-4 18:35 | 只看该作者

5.1.2.1 数据准备

激活数据管理窗口，定义变量名：性别为sex，年龄为age，血红蛋白值为hb。按顺序输入数据(sex变量中，男为1，女为2)，结果见图5.1。

5.1.2.2 统计分析

激活Statistics菜单选Compare Means中的Means...项，弹出Means对话框（如图5.2示）。今欲分性别同时分年龄求血红蛋白值的均数和标准差，故在对话框左侧的变量列表中选hb，点击Ø钮使之进入Dependent List框，选sex 点击Ø钮使之进入Independent List框，点击Next，可选定分组的第二层次（Layer 2 of 2)，选age 点击Ø钮亦使之进入Independent List框。点击Options...可选统计项目：在Cell Displays项中，Mean为均数、Standard deviation为标准差、Variance为方差、Count为观察单位数、Sum为观察值总和，在Statistics for First Layer项中，将为第一层次的分组计算方差分析（ANOVA table and eta）和线性检验（Test of linearity）。选好后点击Continue钮返回Means对话框，点击OK钮即可。

5.1.2.3 结果解释

在结果输出窗口中将看到如下统计数据：

- - Description of Subpopulations - -

Summaries of HB

By levels of SEX

AGE

Variable Value Label Sum Mean Std Dev Variance Cases

For Entire Population 457.79 11.4448 2.2690 5.1484 40

SEX 1 265.71 12.6529 2.0531 4.2154 21

AGE 16 111.67 12.4078 2.2455 5.0423 9

AGE 17 37.21 12.4033 1.8993 3.6074 3

AGE 18 116.83 12.9811 2.0933 4.3821 9

SEX 2 192.08 10.1095 1.6989 2.8863 19

AGE 16 46.42 9.2840 1.3494 1.8209 5

AGE 17 68.17 9.7386 1.4036 1.9700 7

AGE 18 77.49 11.0700 1.9158 3.6703 7

Total Cases = 40

For Entire Population一行表示40个观察值合计为457.79，均数为11.4448，标准差为2.2690，方差为5.1484，例数为40；接下去各行分别表示先按性别分组（分男性与女性），再按年龄分组（16，17，18岁三组）的观察值合计、均数、标准差、方差和例数。

若在Independent List中未分层次，即sex和age一起放在Layer 1 of 1中，则结果是分别计算男性与女性（不作年龄分组）、16，17，18岁三组（不作性别分组）的观察值合计、均数、标准差、方差和例数（如下所示）。

- - Description of Subpopulations - -

Summaries of HB

By levels of SEX

Variable Value Label Sum Mean Std Dev Variance Cases

For Entire Population 457.79 11.4447 2.2690 5.1484 40

SEX 1 265.71 12.6529 2.0531 4.2154 21

SEX 2 192.08 10.1095 1.6989 2.8863 19

Total Cases = 40

Summaries of HB

By levels of AGE

Variable Value Label Sum Mean Std Dev Variance Cases

For Entire Population 457.79 11.4448 2.2690 5.1484 40

AGE 16 158.09 11.2921 2.4649 6.0759 14

AGE 17 105.38 10.5380 1.9421 3.7719 10

AGE 18 194.32 12.1450 2.1827 4.7640 16

Total Cases = 40

Rank: 1

UID: 304992
帖子: 145
主题: 69
注册时间: 2005-11-1
最后登录: 2006-7-5

2^#

发表于 2006-7-4 18:34 | 只看该作者

第一节 Means过程

5.1.1 主要功能

与第四章中Descriptives过程相比，若仅仅计算单一组别的均数和标准差，Means过程并无特别之处；但若用户要求按指定条件分组计算均数和标准差，如分性别同时分年龄计算各组的均数和标准差，则用Means过程更显简单快捷。

5.1.2 实例操作

［例５.1］某医师测得如下血红蛋白值（g%），试作基本的描述性统计分析：

对象编号

性别

年龄

血红蛋白值

对象编号

性别

年龄

血红蛋白值

女

男

女

男

女

男

女

男

女

男

女

男

12.83

15.50

12.25

10.06

10.88

9.65

8.36

11.66

8.54

7.78

13.66

10.57

12.56

9.87

8.99

11.35

14.56

12.40

8.05

14.03

女

男

女

男

女

男

女

男

11.36

12.78

15.09

8.67

8.56

12.56

11.56

14.67

7.88

12.35

13.65

9.87

10.09

12.55

16.04

13.78

11.67

10.98

8.78

11.35