Ⅴ.距离相关系数的计算(相似性与差异性)
1. 距离相关的概念
距离相关分析是计算各变量间距离大小 / 远近的分析方法。这里所说的“距离”,一般以 “欧基里德距离”(Euclidean distance)来衡量。距离小/ 近,就表明相似性大(similarities, 相关性大);距离大 / 远,就表明差异性大(dissimilarities,相关性小)。
例如:美、法、韩、中、俄、罗、意等国和体育爱好者,在比赛裁判中的评分数据库文件名为 Judges.sav。请据评分高低来判断哪些国家的裁判较类似? 哪些国家的裁判评分差异较大? (引自张文彤主编. 2002,P.277)
所用数据库文件为 judges.sav; 程序文件名为 CorreRegre2.sps 中的例 *3。
2. 相似性与差异性矩阵计算的所用命令
*--------------------------------------------------------------------------.
*3. Prof. Zhang Weng-Tong: SPSS 11, P.277:.
GET FILE='c:spsssavjudges.sav'.
PROXIMITIES judge1 judge2 judge3 judge4 judge5 judge6 judge7 judge8
/VIEW=VARIABLE
/MEASURE= EUCLID
/STANDARDIZE= NONE.
PROXIMITIES judge1 judge2 judge3 judge4 judge5 judge6 judge7 judge8
/VIEW=VARIABLE
/MEASURE= CORRELATION
/STANDARDIZE= NONE.
*--------------------------------------------------------------------------.
相似性与差异性计算命令(PROXIMITIES)的产生方法与步骤是:
SPSS 程序编辑窗主菜单 Analyze → 选 Correlation(相关) → 选 Diatances(距离相关)→ 出现“Distances”对话框 →,将左边小窗中中的 8 个裁判员变量,全部选入到右边的“Variables” 窗中,这时默认的计算距离Compute Distancse是“案例间”(Between cases,即运动员的得分间),据本题的题意,要改为“变量间”即“裁判员间”(Between variables),默认测量距离的方法(Measures)是欧基里德距离”(Euclidean distance),先默认计算“差异性”(Dissimilarities)→ Paste,即出现程序中的第一句“PROXIMITIES”命令(含 /MEASURE= EUCLID 子命令,计算欧基里德距离,即计算“差异性”)。
按上述方法,如果将默认计算“差异性”(Dissimilarities),改为计算“相似性” (Similarities)→ Paste,即出现程序中的第二句“PROXIMITIES”命令(含 /MEASURE = CORRELATION 子命令,计算相关系数,即计算“相似性”)。
2. 相似性与差异性矩阵的计算结果
运行程序中的第一句“PROXIMITIES”命令后,输出 8 国裁判员间评分差异性的矩阵。
Proximity Matrix
Euclidean Distance
Italy South Korea Romania France China United States Russia Armchair Enthusiast
Italy 9.622 9.556 10.367 10.403 9.682 8.920 13.709
South Korea 9.622 16.027 5.344 16.637 6.674 14.997 15.377
Romania 9.556 16.027 16.799 5.706 15.925 6.665 15.287
France 10.367 5.344 16.799 17.125 7.829 16.232 16.024
China 10.403 16.637 5.706 17.125 16.739 7.952 15.338
United States 9.682 6.674 15.925 7.829 16.739 14.472 15.831
Russia 8.920 14.997 6.665 16.232 7.952 14.472 15.243
Armchair Enthusiast 13.709 15.377 15.287 16.024 15.338 15.831 15.243
This is a dissimilarity matrix
从上述8 国裁判员评分差异矩阵中可见:
① 距离小、相似性大的国家裁判员是:法、韩间仅 5.344, 美韩间仅 6.674。
② 距离较小、相似性较大的国家裁判员是: 中、俄间仅 7.952,中、罗间仅 5.706。
③ 体育爱好者Armchair Enthusiast的评分,和其它 7 国裁判员间的差距较大:欧基里德距离达 13.709 以上。
Proximity Matrix
Correlation between Vectors Values
Italy South Korea Romania France China United States Russia Armchair Enthusiast
Italy .910 .906 .917 .903 .904 .909 .667
South Korea .910 .878 .935 .885 .919 .887 .682
Romania .906 .878 .875 .922 .872 .929 .655
France .917 .935 .875 .881 .910 .875 .660
China .903 .885 .922 .881 .884 .926 .666
United States .904 .919 .872 .910 .884 .885 .665
Russia .909 .887 .929 .875 .926 .885 .660
Armchair Enthusiast .667 .682 .655 .660 .666 .665 .660
This is a similarity matrix
从上述8 国裁判员评分相关系数矩阵中可见:
① 相关系数大、评分相似的国家裁判员是:法、韩间达 0.935, 美韩间达 0.919。
② 相关系数较大、评分较相似的国家裁判员是: 中、俄间达 0.926,中、罗间达 0.922。
③ 体育爱好者Armchair Enthusiast的评分,和其它 7 国裁判员间的相关系数都最小:相关系数都小于 0.682。
可见:前面“差异(欧基里德距离)矩阵”和“相关系数矩阵”所表达的结果是等价的:差异(欧基里德距离)小者,相关系数就大;差异(欧基里德距离)大者,相关系数就小。
欢迎光临 CFA论坛 (http://forum.theanalystspace.com/) | Powered by Discuz! 7.2 |