Board logo

标题: Spss电脑实验-第七节(4)时间序列数据的相关系数计算与一元线性回归预测法 [打印本页]

作者: spss_SAS    时间: 2006-1-21 10:50     标题: Spss电脑实验-第七节(4)时间序列数据的相关系数计算与一元线性回归预测法

Ⅳ.时间序列数据的相关系数计算与一元线性回归预测法
1. 时间序列数据相关系数的计算方法
例如:某公司为了研究广告费支出(ad)对销售额(sale)的影响,统计了过去 10 个月的数据,请计算两者的相关系数。
问当投入广告费 1 万元时,估计的销售额会有多少?
表 7-3 某公司的广告费支出与销售额的关系(万元)
----------------------------------------------------------
月份 广告费(ad) 销售额(sale)
-------------------------------------------------------------------
1 0.1 10.0
2 0.1 20.0
3 0.2 20.0
4 0.2 30.0
5 0.3 30.0
6 0.4 40.0
7 0.5 50.0
8 0.6 50.0
9 0.7 70.0
10 0.9 80.0
-------------------------------------------------------------------
11 1.0
-------------------------------------------------------------------
在程序文件(CorreRegre.sps,例 *1)的“BEGIN DATA”与“END DATA”之间,即录入表中第 (2) 列ad 与第 (3) 列 sale的数据。
计算相关系数的命令是“CORRELATION”,产生的过程是:Analyze → Correlate → Bivariate → 将 ad 与 sale 选入右侧的“Variables”窗中 → Paste。
2. 时间序列数据一元线性回归方程拟合与预测方法
要知道投入广告费(ad) 1 万元时,预测销售额(Esale)是多少,则为双变量的直线回归分析(引自王宪玉主编. 1999 年,P.166。数据有改动),即要计算一元线性回归方程:
Y = b0 + b1×x1
本例为:Esale = b0 + b1 × ad
SPSS 中的 REGRESSION 命令即可算得此回归方程。REGRESSION 命令产生的过程是:Analyze → Regression → Linear → 将 sale 选入 “Dependent” (因变量)窗中 → 将 ad 选入“Independent(s)” 窗中 → Paste。
用前述曲线拟合法同样可得此回归方程。曲线拟合的命令是“CURVEFIT”(直线是特殊形式的一种曲线!),此命令产生的过程是:Analyze → Regression → Curve Estimation → 将 sale 选入右侧的“Dependent(s)”窗中 →将 ad 选入右侧的“Independent”窗中(这时默认的拟合模型为直线回归方程 Linear)→ 击右下方的“Save”钮 → 将新出现的小窗中Save Variables中的“Predicted Values”、“Residuals”与“Prediction Intervals” 全勾选 → Continue → Paste → 出现 “CURVEFIT”命令。
上述 REGRESSION 与 CURVEFIT 两个命令的拟合结果是相同的;REGRESSION 命令也可得到相关系数的结果。
* Correlation and regression; Filename: CorreRegre.sps.
*-----------------------------------------------------------------------.
*1. From Wang Xian-Yu: Market Survey and the Prediction, P.166:.
DATA LIST FREE /ad sale.
BEGIN DATA.
0.1 10 0.1 20 0.2 20 0.2 30 0.3 30 0.4 40 0.5 50
0.6 50 0.7 70 0.9 80
END DATA.
CORRELATIONS /VARIABLES=ad sale /PRINT=TWOTAIL NOSIG /MISSING=PAIRWISE .
REGRESSION /STATISTICS COEFF OUTS R ANOVA
/CRITERIA=PIN(.05) POUT(.10) CIN(95)
/NOORIGIN
/DEPENDENT=sale
/METHOD=ENTER ad
/CASEWISE=ALL
/SAVE=PRED.
GRAPH /LINE(MULTIPLE)=VALUE(sale, pre_1) BY ad.
* Curve Estimation.
CURVEFIT /VARIABLES=sale WITH ad
/CONSTANT
/MODEL=LINEAR
/PLOT FIT
/CIN=95
/SAVE=PRED RESID CIN.
*-------------------------------------------------------------------------------.
用CORRELATIONS命令:相关系数计算结果,r = 0.980, P = 0.000。
Correlations
AD SALE
AD Pearson Correlation 1.000 .980
Sig. (2-tailed) . .000
N 10 10
SALE Pearson Correlation .980 1.000
Sig. (2-tailed) .000 .
N 10 10
** Correlation is significant at the 0.01 level (2-tailed).
用REGRESSION命令:相关系数计算结果相同,r = 0.980 (即 R = 0.980; R Square = R2 = 0.960), P = 0.000。
Model Summary
Model R R Square Adjusted R Square Std. Error of the Estimate
1 0.980 0.960 0.956 4.7673
a Predictors: (Constant), AD

Coefficients
Unstandardized Coefficients Standardized Coefficients t Sig.
Model B Std. Error Beta
1 (Constant) 7.273 2.790 2.607 .031
AD 81.818 5.868 .980 13.943 .000
a Dependent Variable: SALE

Casewise Diagnostics(a)
Case Number Std. Residual SALE Predicted Value Residual
1 -1.144 10.00 15.4545 -5.4545
2 .953 20.00 15.4545 4.5455
3 -.763 20.00 23.6364 -3.6364
4 1.335 30.00 23.6364 6.3636
5 -.381 30.00 31.8182 -1.8182
6 .000 40.00 40.0000 .0000
7 .381 50.00 48.1818 1.8182
8 -1.335 50.00 56.3636 -6.3636
9 1.144 70.00 64.5455 5.4545
10 -.191 80.00 80.9091 -.9091
a Dependent Variable: SALE

输出的预测值(Esale)即“Predicted Value”,见“Casewise”表第4 列。
在 REGRESSION 命令的子命令“/SAVE=PRED”中,可自行存储下预测值(Esale)的变量名“pre_1”,它可用于其下一句的绘图:“GRAPH /LINE(MULTIPLE)=VALUE(sale, pre_1) BY ad.”,并绘出如下拟合图:

回归方程Esale = b0 + b1×ad 的计算结果:b0 = Constant = 7.273,b1 = 81.818。可得: Esale = 7.273 + 81.818×ad。
当投入广告费(ad)1 万元时,估计的销售额为:
Esale = 7.273 + 81.818×1 = 89.55 万元。
用CURVEFIT命令拟合直线回归方程的结果: 即Rsq = R Square = R2 = 0.960;即r = R = 0.980。可见 b0 = 7.2727 = 7.273, b1 = 81.8282 = 81.818, 结果同上。
Independent: AD
----------------------------------------------------------------------------
Dependent Mth Rsq d.f. F Sigf b0 b1
----------------------------------------------------------------------------
SALE LIN 0.960 8 194.40 .000 7.2727 81.8182
----------------------------------------------------------------------------

The following new variables are being created:
----------------------------------------------------------------------------
Name Label
----------------------------------------------------------------------------
FIT_1 Fit for SALE with AD from CURVEFIT, MOD_3 LINEAR
ERR_1 Error for SALE with AD from CURVEFIT, MOD_3 LINEAR
LCL_1 95% LCL for SALE with AD from CURVEFIT, MOD_3 LINEAR
UCL_1 95% UCL for SALE with AD from CURVEFIT, MOD_3 LINEAR
----------------------------------------------------------------------------
拟合图形详下。






欢迎光临 CFA论坛 (http://forum.theanalystspace.com/) Powered by Discuz! 7.2