唐人电视台是谁主办的:Spss电脑实验-第七节(1)时间序列数据11 种曲线的拟合与外延预测法--CFA spa...

来源:百度文库 编辑:中财网 时间:2024/05/12 15:59:35
Spss电脑实验-第七节(1)时间序列数据11 种曲线的拟合与外延预测法
www.CFAspace.com 更新时间: 2006-1-19 20:50:25 关注指数: 3320

Ⅰ. 时间序列数据11 种曲线的拟合与外延预测法
1. 11 种常用曲线方程
   时间序列数据常常要研究某变量随时间变化的趋势。曲线拟合就是根据实际数据所呈现的趋势,拟合出误差最小的曲线方程。SPSS的 Trends 过程,其中的 CURVEFIT 命令可一次性拟合出11 种常用的曲线方程。本节介绍其拟合方法。这11 种常用的曲线方程是:
下述方程以“*”表示“乘”,“**”表示“乘方”。
(1) 直线回归方程(LINEAR,LIN): Y=b0+(b1*t)。
    式中 b0 为截距,b1 为直线的斜率,t 为自变量,Y 为因变量的估计值。
(2) 对数曲线方程(LOGARITHMIC,LOG): Y=b0+(b1*ln(t))。
       令 ln(t)=t',可得直线方程形式:Y=b0+(b1*t')。
(3) 反函数曲线方程(INVERSE,INV):Y=b0+(b1/t)。
       令1/t=t', 可得直线方程形式:Y=b0+(b1*t')。
(4) 二次曲线(抛物线)方程(QUADRATIC,QUA): Y=b0+(b1*t)+(b2*t**2)。
(5) 三次曲线(三次抛物线)方程(CUBIC,CUB): Y=b0+(b1*t)+(b2*t**2)+(b3*t**3)。
(6) 复合曲线方程(COMPOUND,COM):Y=b0*(b1**t)
或 ln(Y)=ln(b0)+(ln(b1)*t)。
        令 ln(Y)=Y',ln(b0)=b0',ln(b1)=b1', 可得直线方程形式:Y'=b0'+(b1*t)。
(7) 幂函数曲线方程(POWER,POW):Y=b0*(t**b1) 
或 ln(Y)=ln(b0)+(b1*ln(t))。
    令 ln(Y)=Y',ln(b0)=b0',ln(t)=t', 可得直线方程形式:Y'=b0'+(b1*t')。
(8) S 形曲线方程(S):Y=e**(b0+(b1/t)) 
或 ln(Y)=b0+(b1/t)。
        令 ln(Y)=Y',1/t=t', 可得直线方程形式:Y'=b0+(b1*t')。
(9) 生长曲线方程(GROWTH,GRO):Y=e**(b0+(b1*t)) 
或 ln(Y)=b0+(b1*t)。
       令 ln(Y)=Y', 可得直线方程形式:Y'=b0+(b1*t)。
(10) 指数曲线方程(EXPONENTIAL,EXP):Y=b0*(e**(b1*t)) 
或 ln(Y)=ln(b0)+(b1*t)。
        令 ln(Y)=Y',ln(b0)=b0', 可得直线方程形式:Y'=b0'+(b1*t)。
(11) logistic 曲线方程(LGSTIC,LGS):Y=1/(1/u+(b0*(b1**t)))
或 ln(1/Y-1/u)=ln(b0)+(ln(b1)*t)。
        此处 u 为上渐近线的数值。
2. 拟合11 种常用曲线方程的第一种方法(默认,用时点自变量)
    这种方法拟合时,时间序列默认从“1”开始。
   例如:某数值(P)从 1980 年至 1993 年的数据见程序文件 11CurvesFit.sps的例 *1。
程序中“BEGIN DATA”与“END DATA”之间是“年份”(year)与“数值P”的数据。
2.1 录入数据的注意事项:
① 录入年份 year 时,例如“1980”年,可省略地录入“80”,计算结果相同;但如有世纪交替的年份时,例如 1999 年的下一年 2000,这时要完整地录入“1999”、“2000”等;
② 当年份很多、绘图时横座标不易表达时,要改变输出窗(Ouput-Viewer Editor)的设置,使图形比例加宽。步骤是:主菜单中的 Edit → Option → Charts → 把“Chart Aspect Ratio”的数值,从 1:1.25,改为 1:1.5等以加宽图形,横座标就易表达出有关年份数值。
     ③ 自变量是“Time”不是具体的“年份”。“Time”时间序列默认从“1”开始。
TITLE '11 kinds of curves fitting; Filename: 11CurvesFit.sps'.
*--------------------------------------------------------------------------------.
*1. This is for increasing tendency:.
DATA LIST FREE /year P.
BEGIN DATA.
80  18.18    81  25.10    82  20.68    83  26.57    84  16.64    85  10.38
86  28.87    87  27.89    88  37.51    89  69.53    90  81.96    91  98.76
92  79.55    93 142.83
END DATA.
FORMATS year(F2.0).
GRAPH /LINE(SIMPLE)=VALUE(P) BY year.
*CURVEFIT /VARIABLES=P /MODEL=ALL.

* Curve Estimation.
PREDICT THRU END.
CURVEFIT /VARIABLES=p
         /CONSTANT
         /MODEL=LINEAR LOGARITHMIC INVERSE QUADRATIC CUBIC COMPOUND
                POWER S GROWTH EXPONENTIAL LGSTIC
         /SAVE=PRED.
FORMATS FIT_1 TO FIT_11(F7.2).
LIST VARIABLES=year P FIT_1 FIT_2 FIT_3 FIT_4 FIT_5 FIT_6 /CASES=FROM 1 TO 14.
LIST VARIABLES=year P FIT_7 FIT_8 FIT_9 FIT_10 FIT_11 /CASES=FROM 1 TO 14.

GRAPH /LINE(MULTIPLE)=VALUE(P, FIT_1) BY year.
GRAPH /LINE(MULTIPLE)=VALUE(P, FIT_2) BY year.
GRAPH /LINE(MULTIPLE)=VALUE(P, FIT_3) BY year.
GRAPH /LINE(MULTIPLE)=VALUE(P, FIT_4) BY year.
GRAPH /LINE(MULTIPLE)=VALUE(P, FIT_5) BY year.
GRAPH /LINE(MULTIPLE)=VALUE(P, FIT_6) BY year.
GRAPH /LINE(MULTIPLE)=VALUE(P, FIT_7) BY year.
GRAPH /LINE(MULTIPLE)=VALUE(P, FIT_8) BY year.
GRAPH /LINE(MULTIPLE)=VALUE(P, FIT_9) BY year.
GRAPH /LINE(MULTIPLE)=VALUE(P, FIT_10) BY year.
GRAPH /LINE(MULTIPLE)=VALUE(P, FIT_11) BY year.
*-----------------------------------------------------------------------------------.
2.2 “CURVEFIT”命令的产生方法:程序文件 NormalTest.sps 中的例 *1,有“CURVEFIT”命令用于拟合出11 种常用曲线方程。其步骤是:
    运行“DATA LIST”至“END DATA”之间的命令读入数据 →主菜单中的 Analyzet → Regression → Curve Estimation → 将“P”选入“Dependent[s]”框(因为“P”是因变量)  →“Independent”框中,从默认的“variable”改选为“Time”,即按时间(年份)的顺序(这时默认时间序列从“1”开始)来拟合曲线方程 → 把“Models”框中的 11 种曲线模型全勾选 → 点击“Save” → 将需要的预测值“Predicted Values”勾选 → Paste  → 即可产生程序中的 “PREDICT”和“CURVEFIT”两句命令。
    其下的 11 句“GRAPH”命令可分别绘出 11 种图形。
2.3  11 种曲线模型拟合结果:
       运算“CURVEFIT”一句即可输出下列结果:
---------------------------------------------------------------------------------------------
Independent:  Time
                                           Upper
  Dependent Mth   Rsq  d.f.       F  Sigf  bound      b0        b1       b2       b3
---------------------------------------------------------------------------------------------
   P        LIN  .731    12   32.67  .000        -11.353    8.0323
   P        LOG  .468    12   10.54  .007        -13.559   34.7056
   P        INV  .211    12    3.20  .099        65.5582  -71.7700
   P        QUA  .913    11   57.46  .000        33.3540   -8.7328    1.1177
   P        CUB  .913    10   35.06  .000        29.7747   -6.2818     .7229     .0175
   P        COM  .729    12   32.29  .000        11.1560    1.1725
   P        POW  .490    12   11.51  .005        10.3542     .7048
   P        S    .234    12    3.67  .080         3.9543   -1.5014
   P        GRO  .729    12   32.29  .000         2.4120     .1591
   P        EXP  .729    12   32.29  .000        11.1560     .1591
   P        LGS  .729    12   32.29  .000   .      .0896     .8529
---------------------------------------------------------------------------------------------
     判断哪种曲线拟合较优的方法是:“Rsq”值大或“F”值大、“Sigf”即 P 值小者,拟合优度高。本例二次曲线(抛物线)方程(QUADRATIC,QUA)拟合得最好,因为其“Rsq”值最大(0.913)、“F”值最大(57.46)、“Sigf”即 P 值最小(0.000)。
    根据输出的方程系数值,即可写出这 11 种曲线。例如二次曲线方程是:
    FIT_4 = 33.3540 - 8.7328 * Time + 1.1177 * (Time)**2
     例如 1993 年(Time = 14)的预测值是:
    FIT_4 = 33.3540 - 8.7328 * 14 + 1.1177 * 14**2 = 130.16,等等。
    拟合11 种曲线模型的理论值见下表 FIT_1 至 FIT_11:
--------------------------------------------------------------------------
YEAR        P   FIT_1   FIT_2   FIT_3   FIT_4   FIT_5   FIT_6
--------------------------------------------------------------------------
 80     18.18   -3.32  -13.56   -6.21   25.74   24.23   13.08
 81     25.10    4.71   10.50   29.67   20.36   20.24   15.34
 82     20.68   12.74   24.57   41.63   17.21   17.91   17.98
 83     26.57   20.78   34.55   47.62   16.31   17.34   21.09
 84     16.64   28.81   42.30   51.20   17.63   18.63   24.72
 85     10.38   36.84   48.63   53.60   21.19   21.90   28.99
 86     28.87   44.87   53.97   55.31   26.99   27.24   33.99
 87     27.89   52.91   58.61   56.59   35.02   34.77   39.85
 88     37.51   60.94   62.70   57.58   45.29   44.58   46.73
 89     69.53   68.97   66.35   58.38   57.79   56.79   54.79
 90     81.96   77.00   69.66   59.03   72.53   71.50   64.24
 91     98.76   85.03   72.68   59.58   89.51   88.81   75.32
 92     79.55   93.07   75.46   60.04  108.71  108.83   88.31
 93    142.83  101.10   78.03   60.43  130.16  131.66  103.55
--------------------------------------------------------------------------

-------------------------------------------------------------------------
YEAR        P     FIT_7    FIT_8    FIT_9   FIT_10   FIT_11
-------------------------------------------------------------------------
 80     18.18    10.35    11.62    13.08    13.08    13.08
 81     25.10    16.88    24.62    15.34    15.34    15.34
 82     20.68    22.46    31.62    17.98    17.98    17.98
 83     26.57    27.51    35.84    21.09    21.09    21.09
 84     16.64    32.19    38.63    24.72    24.72    24.72
 85     10.38    36.61    40.61    28.99    28.99    28.99
 86     28.87    40.81    42.09    33.99    33.99    33.99
 87     27.89    44.83    43.23    39.85    39.85    39.85
 88     37.51    48.72    44.14    46.73    46.73    46.73
 89     69.53    52.47    44.89    54.79    54.79    54.79
 90     81.96    56.12    45.50    64.24    64.24    64.24
 91     98.76    59.67    46.02    75.32    75.32    75.32
 92     79.55    63.13    46.47    88.31    88.31    88.31
 93    142.83    66.51    46.85   103.55   103.55   103.55
-------------------------------------------------------------------------
     运行其下的 11 个“GRAPH”语句,即可绘出这 11 种曲线的图形:
  
 直线回归方程(LINEAR,LIN)           对数曲线方程(LOGARITHMIC,LOG)


反函数曲线方程(INVERSE,INV)         二次曲线方程(QUADRATIC,QUA)


三次曲线方程(CUBIC,CUB)               复合曲线方程(COMPOUND,COM)
  
幂函数曲线方程(POWER,POW)             S 形曲线方程(S)

    
生长曲线方程(GROWTH,GRO)         指数曲线方程(EXPONENTIAL,EXP)


logistic 曲线方程(LGSTIC,LGS)

3. 拟合11 种常用曲线方程的第二种方法(用实际自变量)
     见程序文件 11CurvesFit.sps 的例 *2。
    本法拟合时与第一种方法有所不同。产生“CURVEFIT”命令的步骤是:
运行“DATA LIST”至“END DATA”之间的命令读入数据 →主菜单中的 Analyzet → Regression → Curve  Estimation → 将“P”选入“Dependent[s]” 框(因为“P”是因变量) →“Independent”框中,用默认的“variable”,即按时间(年份 year)的顺序来拟合曲线方程 → 把“Models”框中的 11 种曲线模型全勾选 →点击“Save” → 将需要的预测值“Predicted Values”勾选 → Paste  → 即可产生程序中的“CURVEFIT”命令。
*---------------------------------------------------------------------------------.
*2. This is another command for fitting:.
DATA LIST FREE /year P.
BEGIN DATA.
80  18.18    81  25.10    82  20.68    83  26.57    84  16.64    85  10.38
86  28.87    87  27.89    88  37.51    89  69.53    90  81.96    91  98.76
92  79.55    93 142.83
END DATA.
FORMATS year(F2.0).
GRAPH /LINE(SIMPLE)=VALUE(P) BY year.
* Curve Estimation.
CURVEFIT /VARIABLES=p WITH year
         /CONSTANT
         /MODEL=LINEAR LOGARITHMIC INVERSE QUADRATIC CUBIC COMPOUND
                POWER S GROWTH EXPONENTIAL LGSTIC
         /SAVE=PRED.
FORMATS FIT_1 TO FIT_11(F7.2).
LIST VARIABLES=year P FIT_1 FIT_2 FIT_3 FIT_4 FIT_5 FIT_6 /CASES=FROM 1 TO 14.
LIST VARIABLES=year P FIT_7 FIT_8 FIT_9 FIT_10 FIT_11 /CASES=FROM 1 TO 14.

GRAPH /LINE(MULTIPLE)=VALUE(P, FIT_1) BY year.
GRAPH /LINE(MULTIPLE)=VALUE(P, FIT_2) BY year.
GRAPH /LINE(MULTIPLE)=VALUE(P, FIT_3) BY year.
GRAPH /LINE(MULTIPLE)=VALUE(P, FIT_4) BY year.
GRAPH /LINE(MULTIPLE)=VALUE(P, FIT_5) BY year.
GRAPH /LINE(MULTIPLE)=VALUE(P, FIT_6) BY year.
GRAPH /LINE(MULTIPLE)=VALUE(P, FIT_7) BY year.
GRAPH /LINE(MULTIPLE)=VALUE(P, FIT_8) BY year.
GRAPH /LINE(MULTIPLE)=VALUE(P, FIT_9) BY year.
GRAPH /LINE(MULTIPLE)=VALUE(P, FIT_10) BY year.
GRAPH /LINE(MULTIPLE)=VALUE(P, FIT_11) BY year.
*------------------------------------------------------------------------.
    11 种曲线模型拟合:运算“CURVEFIT”一句即可输出下列结果:
--------------------------------------------------------------------------------------------
Independent:  YEAR
                                              Upper
Dependent Mth   Rsq  d.f.       F  Sigf  bound      b0        b1        b2         b3
--------------------------------------------------------------------------------------------
   P        LIN  .731    12   32.67  .000        -645.91    8.0323
   P        LOG  .716    12   30.27  .000        -3012.1   686.458
   P        INV  .700    12   28.05  .000        727.059    -58534
   P        QUA  .913    11   57.46  .000        7698.68   -185.33    1.1177
   P        CUB  .913    11   57.74  .000        2371.11              -1.0285    .0083
   P        COM  .729    12   32.29  .000        3.9E-05    1.1725
   P        POW  .717    12   30.42  .000        1.5E-25   13.6327
   P        S    .705    12   28.62  .000        17.1040   -1165.1
   P        GRO  .729    12   32.29  .000        -10.161     .1591
   P        EXP  .729    12   32.29  .000        3.9E-05     .1591
   P        LGS  .729    12   32.29  .000   .    25866.5     .8529
-------------------------------------------------------------------------------------------
     注意:自变量是具体的“年份”(不是“Time”)。时间序列从具体年份 year 开始。
本例基本上二次曲线(抛物线)方程(QUA 与CUB)拟合得最好,因为其“Rsq”值最大(0.913)、“F”值为 57.46、“Sigf”即 P 值最小(0.000)。
    根据输出的方程系数值,即可写出这 11 种曲线方便。例如二次曲线方程是:
    FIT_4 = 7698.68 - 185.33 * Year + 1.1177 * (Year)**2
     例如 1991 年(录入为“91”)的预测值是:
    FIT_4 = 7698.68 - 185.33 * 91 + 1.1177 * (91)**2 = 89.32,等等(有点计算误差)。
    拟合11 种曲线模型的理论值见下表 FIT_1 至 FIT_11。理论值拟合结果与上法类似。
---------------------------------------------------------------------------------------------
YEAR        P   FIT_1   FIT_2   FIT_3   FIT_4   FIT_5   FIT_6
---------------------------------------------------------------------------------------------
 80     18.18   -3.32   -3.99   -4.62   25.74   25.05   13.08
 81     25.10    4.71    4.54    4.42   20.36   20.32   15.34
 82     20.68   12.74   12.96   13.23   17.21   17.55   17.98
 83     26.57   20.78   21.28   21.83   16.31   16.79   21.09
 84     16.64   28.81   29.50   30.22   17.63   18.09   24.72
 85     10.38   36.84   37.63   38.42   21.19   21.51   28.99
 86     28.87   44.87   45.66   46.43   26.99   27.10   33.99
 87     27.89   52.91   53.59   54.25   35.02   34.89   39.85
 88     37.51   60.94   61.44   61.90   45.29   44.95   46.73
 89     69.53   68.97   69.19   69.37   57.79   57.31   54.79
 90     81.96   77.00   76.86   76.68   72.53   72.04   64.24
 91     98.76   85.03   84.45   83.83   89.51   89.18   75.32
 92     79.55   93.07   91.95   90.82  108.71  108.78   88.31
 93    142.83  101.10   99.37   97.66  130.16  130.89  103.55
---------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------
YEAR        P   FIT_7   FIT_8   FIT_9  FIT_10  FIT_11
---------------------------------------------------------------------------------------------
 80     18.18   12.88   12.69   13.08   13.08   13.08
 81     25.10   15.25   15.19   15.34   15.34   15.34
 82     20.68   18.03   18.10   17.98   17.98   17.98
 83     26.57   21.27   21.48   21.09   21.09   21.09
 84     16.64   25.04   25.38   24.72   24.72   24.72
 85     10.38   29.43   29.88   28.99   28.99   28.99
 86     28.87   34.51   35.05   33.99   33.99   33.99
 87     27.89   40.41   40.95   39.85   39.85   39.85
 88     37.51   47.22   47.68   46.73   46.73   46.73
 89     69.53   55.08   55.33   54.79   54.79   54.79
 90     81.96   64.15   63.99   64.24   64.24   64.24
 91     98.76   74.57   73.77   75.32   75.32   75.32
 92     79.55   86.56   84.79   88.31   88.31   88.31
 93    142.83  100.30   97.16  103.55  103.55  103.55
---------------------------------------------------------------------------------------------
 
直线回归方程(LINEAR,LIN)           对数曲线方程(LOGARITHMIC,LOG)
  
反函数曲线方程(INVERSE,INV)         二次曲线方程(QUADRATIC,QUA)
  
三次曲线方程(CUBIC,CUB)               复合曲线方程(COMPOUND,COM)
  
幂函数曲线方程(POWER,POW)                   S 形曲线方程(S)

  
生长曲线方程(GROWTH,GRO)         指数曲线方程(EXPONENTIAL,EXP)
 
 logistic 曲线方程(LGSTIC,LGS)