唐人电视台是谁主办的:Spss电脑实验-第七节(1)时间序列数据11 种曲线的拟合与外延预测法--CFA spa...
来源:百度文库 编辑:中财网 时间:2024/05/12 15:59:35
www.CFAspace.com 更新时间: 2006-1-19 20:50:25 关注指数: 3320
Ⅰ. 时间序列数据11 种曲线的拟合与外延预测法
1. 11 种常用曲线方程
时间序列数据常常要研究某变量随时间变化的趋势。曲线拟合就是根据实际数据所呈现的趋势,拟合出误差最小的曲线方程。SPSS的 Trends 过程,其中的 CURVEFIT 命令可一次性拟合出11 种常用的曲线方程。本节介绍其拟合方法。这11 种常用的曲线方程是:
下述方程以“*”表示“乘”,“**”表示“乘方”。
(1) 直线回归方程(LINEAR,LIN): Y=b0+(b1*t)。
式中 b0 为截距,b1 为直线的斜率,t 为自变量,Y 为因变量的估计值。
(2) 对数曲线方程(LOGARITHMIC,LOG): Y=b0+(b1*ln(t))。
令 ln(t)=t',可得直线方程形式:Y=b0+(b1*t')。
(3) 反函数曲线方程(INVERSE,INV):Y=b0+(b1/t)。
令1/t=t', 可得直线方程形式:Y=b0+(b1*t')。
(4) 二次曲线(抛物线)方程(QUADRATIC,QUA): Y=b0+(b1*t)+(b2*t**2)。
(5) 三次曲线(三次抛物线)方程(CUBIC,CUB): Y=b0+(b1*t)+(b2*t**2)+(b3*t**3)。
(6) 复合曲线方程(COMPOUND,COM):Y=b0*(b1**t)
或 ln(Y)=ln(b0)+(ln(b1)*t)。
令 ln(Y)=Y',ln(b0)=b0',ln(b1)=b1', 可得直线方程形式:Y'=b0'+(b1*t)。
(7) 幂函数曲线方程(POWER,POW):Y=b0*(t**b1)
或 ln(Y)=ln(b0)+(b1*ln(t))。
令 ln(Y)=Y',ln(b0)=b0',ln(t)=t', 可得直线方程形式:Y'=b0'+(b1*t')。
(8) S 形曲线方程(S):Y=e**(b0+(b1/t))
或 ln(Y)=b0+(b1/t)。
令 ln(Y)=Y',1/t=t', 可得直线方程形式:Y'=b0+(b1*t')。
(9) 生长曲线方程(GROWTH,GRO):Y=e**(b0+(b1*t))
或 ln(Y)=b0+(b1*t)。
令 ln(Y)=Y', 可得直线方程形式:Y'=b0+(b1*t)。
(10) 指数曲线方程(EXPONENTIAL,EXP):Y=b0*(e**(b1*t))
或 ln(Y)=ln(b0)+(b1*t)。
令 ln(Y)=Y',ln(b0)=b0', 可得直线方程形式:Y'=b0'+(b1*t)。
(11) logistic 曲线方程(LGSTIC,LGS):Y=1/(1/u+(b0*(b1**t)))
或 ln(1/Y-1/u)=ln(b0)+(ln(b1)*t)。
此处 u 为上渐近线的数值。
2. 拟合11 种常用曲线方程的第一种方法(默认,用时点自变量)
这种方法拟合时,时间序列默认从“1”开始。
例如:某数值(P)从 1980 年至 1993 年的数据见程序文件 11CurvesFit.sps的例 *1。
程序中“BEGIN DATA”与“END DATA”之间是“年份”(year)与“数值P”的数据。
2.1 录入数据的注意事项:
① 录入年份 year 时,例如“1980”年,可省略地录入“80”,计算结果相同;但如有世纪交替的年份时,例如 1999 年的下一年 2000,这时要完整地录入“1999”、“2000”等;
② 当年份很多、绘图时横座标不易表达时,要改变输出窗(Ouput-Viewer Editor)的设置,使图形比例加宽。步骤是:主菜单中的 Edit → Option → Charts → 把“Chart Aspect Ratio”的数值,从 1:1.25,改为 1:1.5等以加宽图形,横座标就易表达出有关年份数值。
③ 自变量是“Time”不是具体的“年份”。“Time”时间序列默认从“1”开始。
TITLE '11 kinds of curves fitting; Filename: 11CurvesFit.sps'.
*--------------------------------------------------------------------------------.
*1. This is for increasing tendency:.
DATA LIST FREE /year P.
BEGIN DATA.
80 18.18 81 25.10 82 20.68 83 26.57 84 16.64 85 10.38
86 28.87 87 27.89 88 37.51 89 69.53 90 81.96 91 98.76
92 79.55 93 142.83
END DATA.
FORMATS year(F2.0).
GRAPH /LINE(SIMPLE)=VALUE(P) BY year.
*CURVEFIT /VARIABLES=P /MODEL=ALL.
* Curve Estimation.
PREDICT THRU END.
CURVEFIT /VARIABLES=p
/CONSTANT
/MODEL=LINEAR LOGARITHMIC INVERSE QUADRATIC CUBIC COMPOUND
POWER S GROWTH EXPONENTIAL LGSTIC
/SAVE=PRED.
FORMATS FIT_1 TO FIT_11(F7.2).
LIST VARIABLES=year P FIT_1 FIT_2 FIT_3 FIT_4 FIT_5 FIT_6 /CASES=FROM 1 TO 14.
LIST VARIABLES=year P FIT_7 FIT_8 FIT_9 FIT_10 FIT_11 /CASES=FROM 1 TO 14.
GRAPH /LINE(MULTIPLE)=VALUE(P, FIT_1) BY year.
GRAPH /LINE(MULTIPLE)=VALUE(P, FIT_2) BY year.
GRAPH /LINE(MULTIPLE)=VALUE(P, FIT_3) BY year.
GRAPH /LINE(MULTIPLE)=VALUE(P, FIT_4) BY year.
GRAPH /LINE(MULTIPLE)=VALUE(P, FIT_5) BY year.
GRAPH /LINE(MULTIPLE)=VALUE(P, FIT_6) BY year.
GRAPH /LINE(MULTIPLE)=VALUE(P, FIT_7) BY year.
GRAPH /LINE(MULTIPLE)=VALUE(P, FIT_8) BY year.
GRAPH /LINE(MULTIPLE)=VALUE(P, FIT_9) BY year.
GRAPH /LINE(MULTIPLE)=VALUE(P, FIT_10) BY year.
GRAPH /LINE(MULTIPLE)=VALUE(P, FIT_11) BY year.
*-----------------------------------------------------------------------------------.
2.2 “CURVEFIT”命令的产生方法:程序文件 NormalTest.sps 中的例 *1,有“CURVEFIT”命令用于拟合出11 种常用曲线方程。其步骤是:
运行“DATA LIST”至“END DATA”之间的命令读入数据 →主菜单中的 Analyzet → Regression → Curve Estimation → 将“P”选入“Dependent[s]”框(因为“P”是因变量) →“Independent”框中,从默认的“variable”改选为“Time”,即按时间(年份)的顺序(这时默认时间序列从“1”开始)来拟合曲线方程 → 把“Models”框中的 11 种曲线模型全勾选 → 点击“Save” → 将需要的预测值“Predicted Values”勾选 → Paste → 即可产生程序中的 “PREDICT”和“CURVEFIT”两句命令。
其下的 11 句“GRAPH”命令可分别绘出 11 种图形。
2.3 11 种曲线模型拟合结果:
运算“CURVEFIT”一句即可输出下列结果:
---------------------------------------------------------------------------------------------
Independent: Time
Upper
Dependent Mth Rsq d.f. F Sigf bound b0 b1 b2 b3
---------------------------------------------------------------------------------------------
P LIN .731 12 32.67 .000 -11.353 8.0323
P LOG .468 12 10.54 .007 -13.559 34.7056
P INV .211 12 3.20 .099 65.5582 -71.7700
P QUA .913 11 57.46 .000 33.3540 -8.7328 1.1177
P CUB .913 10 35.06 .000 29.7747 -6.2818 .7229 .0175
P COM .729 12 32.29 .000 11.1560 1.1725
P POW .490 12 11.51 .005 10.3542 .7048
P S .234 12 3.67 .080 3.9543 -1.5014
P GRO .729 12 32.29 .000 2.4120 .1591
P EXP .729 12 32.29 .000 11.1560 .1591
P LGS .729 12 32.29 .000 . .0896 .8529
---------------------------------------------------------------------------------------------
判断哪种曲线拟合较优的方法是:“Rsq”值大或“F”值大、“Sigf”即 P 值小者,拟合优度高。本例二次曲线(抛物线)方程(QUADRATIC,QUA)拟合得最好,因为其“Rsq”值最大(0.913)、“F”值最大(57.46)、“Sigf”即 P 值最小(0.000)。
根据输出的方程系数值,即可写出这 11 种曲线。例如二次曲线方程是:
FIT_4 = 33.3540 - 8.7328 * Time + 1.1177 * (Time)**2
例如 1993 年(Time = 14)的预测值是:
FIT_4 = 33.3540 - 8.7328 * 14 + 1.1177 * 14**2 = 130.16,等等。
拟合11 种曲线模型的理论值见下表 FIT_1 至 FIT_11:
--------------------------------------------------------------------------
YEAR P FIT_1 FIT_2 FIT_3 FIT_4 FIT_5 FIT_6
--------------------------------------------------------------------------
80 18.18 -3.32 -13.56 -6.21 25.74 24.23 13.08
81 25.10 4.71 10.50 29.67 20.36 20.24 15.34
82 20.68 12.74 24.57 41.63 17.21 17.91 17.98
83 26.57 20.78 34.55 47.62 16.31 17.34 21.09
84 16.64 28.81 42.30 51.20 17.63 18.63 24.72
85 10.38 36.84 48.63 53.60 21.19 21.90 28.99
86 28.87 44.87 53.97 55.31 26.99 27.24 33.99
87 27.89 52.91 58.61 56.59 35.02 34.77 39.85
88 37.51 60.94 62.70 57.58 45.29 44.58 46.73
89 69.53 68.97 66.35 58.38 57.79 56.79 54.79
90 81.96 77.00 69.66 59.03 72.53 71.50 64.24
91 98.76 85.03 72.68 59.58 89.51 88.81 75.32
92 79.55 93.07 75.46 60.04 108.71 108.83 88.31
93 142.83 101.10 78.03 60.43 130.16 131.66 103.55
--------------------------------------------------------------------------
-------------------------------------------------------------------------
YEAR P FIT_7 FIT_8 FIT_9 FIT_10 FIT_11
-------------------------------------------------------------------------
80 18.18 10.35 11.62 13.08 13.08 13.08
81 25.10 16.88 24.62 15.34 15.34 15.34
82 20.68 22.46 31.62 17.98 17.98 17.98
83 26.57 27.51 35.84 21.09 21.09 21.09
84 16.64 32.19 38.63 24.72 24.72 24.72
85 10.38 36.61 40.61 28.99 28.99 28.99
86 28.87 40.81 42.09 33.99 33.99 33.99
87 27.89 44.83 43.23 39.85 39.85 39.85
88 37.51 48.72 44.14 46.73 46.73 46.73
89 69.53 52.47 44.89 54.79 54.79 54.79
90 81.96 56.12 45.50 64.24 64.24 64.24
91 98.76 59.67 46.02 75.32 75.32 75.32
92 79.55 63.13 46.47 88.31 88.31 88.31
93 142.83 66.51 46.85 103.55 103.55 103.55
-------------------------------------------------------------------------
运行其下的 11 个“GRAPH”语句,即可绘出这 11 种曲线的图形:
直线回归方程(LINEAR,LIN) 对数曲线方程(LOGARITHMIC,LOG)
反函数曲线方程(INVERSE,INV) 二次曲线方程(QUADRATIC,QUA)
三次曲线方程(CUBIC,CUB) 复合曲线方程(COMPOUND,COM)
幂函数曲线方程(POWER,POW) S 形曲线方程(S)
生长曲线方程(GROWTH,GRO) 指数曲线方程(EXPONENTIAL,EXP)
logistic 曲线方程(LGSTIC,LGS)
3. 拟合11 种常用曲线方程的第二种方法(用实际自变量)
见程序文件 11CurvesFit.sps 的例 *2。
本法拟合时与第一种方法有所不同。产生“CURVEFIT”命令的步骤是:
运行“DATA LIST”至“END DATA”之间的命令读入数据 →主菜单中的 Analyzet → Regression → Curve Estimation → 将“P”选入“Dependent[s]” 框(因为“P”是因变量) →“Independent”框中,用默认的“variable”,即按时间(年份 year)的顺序来拟合曲线方程 → 把“Models”框中的 11 种曲线模型全勾选 →点击“Save” → 将需要的预测值“Predicted Values”勾选 → Paste → 即可产生程序中的“CURVEFIT”命令。
*---------------------------------------------------------------------------------.
*2. This is another command for fitting:.
DATA LIST FREE /year P.
BEGIN DATA.
80 18.18 81 25.10 82 20.68 83 26.57 84 16.64 85 10.38
86 28.87 87 27.89 88 37.51 89 69.53 90 81.96 91 98.76
92 79.55 93 142.83
END DATA.
FORMATS year(F2.0).
GRAPH /LINE(SIMPLE)=VALUE(P) BY year.
* Curve Estimation.
CURVEFIT /VARIABLES=p WITH year
/CONSTANT
/MODEL=LINEAR LOGARITHMIC INVERSE QUADRATIC CUBIC COMPOUND
POWER S GROWTH EXPONENTIAL LGSTIC
/SAVE=PRED.
FORMATS FIT_1 TO FIT_11(F7.2).
LIST VARIABLES=year P FIT_1 FIT_2 FIT_3 FIT_4 FIT_5 FIT_6 /CASES=FROM 1 TO 14.
LIST VARIABLES=year P FIT_7 FIT_8 FIT_9 FIT_10 FIT_11 /CASES=FROM 1 TO 14.
GRAPH /LINE(MULTIPLE)=VALUE(P, FIT_1) BY year.
GRAPH /LINE(MULTIPLE)=VALUE(P, FIT_2) BY year.
GRAPH /LINE(MULTIPLE)=VALUE(P, FIT_3) BY year.
GRAPH /LINE(MULTIPLE)=VALUE(P, FIT_4) BY year.
GRAPH /LINE(MULTIPLE)=VALUE(P, FIT_5) BY year.
GRAPH /LINE(MULTIPLE)=VALUE(P, FIT_6) BY year.
GRAPH /LINE(MULTIPLE)=VALUE(P, FIT_7) BY year.
GRAPH /LINE(MULTIPLE)=VALUE(P, FIT_8) BY year.
GRAPH /LINE(MULTIPLE)=VALUE(P, FIT_9) BY year.
GRAPH /LINE(MULTIPLE)=VALUE(P, FIT_10) BY year.
GRAPH /LINE(MULTIPLE)=VALUE(P, FIT_11) BY year.
*------------------------------------------------------------------------.
11 种曲线模型拟合:运算“CURVEFIT”一句即可输出下列结果:
--------------------------------------------------------------------------------------------
Independent: YEAR
Upper
Dependent Mth Rsq d.f. F Sigf bound b0 b1 b2 b3
--------------------------------------------------------------------------------------------
P LIN .731 12 32.67 .000 -645.91 8.0323
P LOG .716 12 30.27 .000 -3012.1 686.458
P INV .700 12 28.05 .000 727.059 -58534
P QUA .913 11 57.46 .000 7698.68 -185.33 1.1177
P CUB .913 11 57.74 .000 2371.11 -1.0285 .0083
P COM .729 12 32.29 .000 3.9E-05 1.1725
P POW .717 12 30.42 .000 1.5E-25 13.6327
P S .705 12 28.62 .000 17.1040 -1165.1
P GRO .729 12 32.29 .000 -10.161 .1591
P EXP .729 12 32.29 .000 3.9E-05 .1591
P LGS .729 12 32.29 .000 . 25866.5 .8529
-------------------------------------------------------------------------------------------
注意:自变量是具体的“年份”(不是“Time”)。时间序列从具体年份 year 开始。
本例基本上二次曲线(抛物线)方程(QUA 与CUB)拟合得最好,因为其“Rsq”值最大(0.913)、“F”值为 57.46、“Sigf”即 P 值最小(0.000)。
根据输出的方程系数值,即可写出这 11 种曲线方便。例如二次曲线方程是:
FIT_4 = 7698.68 - 185.33 * Year + 1.1177 * (Year)**2
例如 1991 年(录入为“91”)的预测值是:
FIT_4 = 7698.68 - 185.33 * 91 + 1.1177 * (91)**2 = 89.32,等等(有点计算误差)。
拟合11 种曲线模型的理论值见下表 FIT_1 至 FIT_11。理论值拟合结果与上法类似。
---------------------------------------------------------------------------------------------
YEAR P FIT_1 FIT_2 FIT_3 FIT_4 FIT_5 FIT_6
---------------------------------------------------------------------------------------------
80 18.18 -3.32 -3.99 -4.62 25.74 25.05 13.08
81 25.10 4.71 4.54 4.42 20.36 20.32 15.34
82 20.68 12.74 12.96 13.23 17.21 17.55 17.98
83 26.57 20.78 21.28 21.83 16.31 16.79 21.09
84 16.64 28.81 29.50 30.22 17.63 18.09 24.72
85 10.38 36.84 37.63 38.42 21.19 21.51 28.99
86 28.87 44.87 45.66 46.43 26.99 27.10 33.99
87 27.89 52.91 53.59 54.25 35.02 34.89 39.85
88 37.51 60.94 61.44 61.90 45.29 44.95 46.73
89 69.53 68.97 69.19 69.37 57.79 57.31 54.79
90 81.96 77.00 76.86 76.68 72.53 72.04 64.24
91 98.76 85.03 84.45 83.83 89.51 89.18 75.32
92 79.55 93.07 91.95 90.82 108.71 108.78 88.31
93 142.83 101.10 99.37 97.66 130.16 130.89 103.55
---------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------
YEAR P FIT_7 FIT_8 FIT_9 FIT_10 FIT_11
---------------------------------------------------------------------------------------------
80 18.18 12.88 12.69 13.08 13.08 13.08
81 25.10 15.25 15.19 15.34 15.34 15.34
82 20.68 18.03 18.10 17.98 17.98 17.98
83 26.57 21.27 21.48 21.09 21.09 21.09
84 16.64 25.04 25.38 24.72 24.72 24.72
85 10.38 29.43 29.88 28.99 28.99 28.99
86 28.87 34.51 35.05 33.99 33.99 33.99
87 27.89 40.41 40.95 39.85 39.85 39.85
88 37.51 47.22 47.68 46.73 46.73 46.73
89 69.53 55.08 55.33 54.79 54.79 54.79
90 81.96 64.15 63.99 64.24 64.24 64.24
91 98.76 74.57 73.77 75.32 75.32 75.32
92 79.55 86.56 84.79 88.31 88.31 88.31
93 142.83 100.30 97.16 103.55 103.55 103.55
---------------------------------------------------------------------------------------------
直线回归方程(LINEAR,LIN) 对数曲线方程(LOGARITHMIC,LOG)
反函数曲线方程(INVERSE,INV) 二次曲线方程(QUADRATIC,QUA)
三次曲线方程(CUBIC,CUB) 复合曲线方程(COMPOUND,COM)
幂函数曲线方程(POWER,POW) S 形曲线方程(S)
生长曲线方程(GROWTH,GRO) 指数曲线方程(EXPONENTIAL,EXP)
logistic 曲线方程(LGSTIC,LGS)