论文导读::时间序列预测方法的基本思想是:预测一个现象的未来变化时。在我国GDP预测中的应用。
论文关键词:ARMA模型GDP,时间序列
一、前言
经济运行过程从较长时间序列看,由于市场机制的作用,呈现一定的规律,这对预测提供了依据。目前,预测经济运行时间序列的理论与方法较多,而AR-MA模型在经济预测过程中既考虑了经济现象在时间序列上的依存性,又考虑了随机波动的干扰性,对经济运行短期趋势的预测准确率较高,是近年应用比较广泛的方法之一。由于国内生产总值(GDP)不仅能够在总体上度量国民产出和收入规模,也能够在整体上度量经济波动和经济周期状态,因此,对GDP进行精确的拟合和分析对分析一国的宏观经济发展趋势具有重要意义。在本文中研究中,根据ARMA模型的应用条件,选取1978年我国实行市场经济体制后的GDP序列数据进行建模分析。
二、ARMA模型简介
ARMA模型是由美国统计学家GE.P.Box和英国统计学家G.M.Jenkin在二十世纪七十年代提出的时序分析模型,即自回归移动平均模型。若时间序列 为它的当前与前期的误差和随机项,以及它的前期值得线性函数,可以表示为:
(1.1)
则称该时间序列 为(p,q)阶自回归移动平均模型,记为ARMA(p,q)论文开题报告范例。参数为自回归参数, , , 为移动平均参数,是模型的待估参数。引入滞后算子B,(1)式可以表示为: 
若 =0,则称该平稳随机序列{ }为p阶自回归模型,记为AR(p)模型;若 =0,则称平稳随机序列{ }为q阶移动平均模型,记为MA(q)模型。
三、GDP时间序列模型的建立
1.数据初步处理
首先对我国1978年到2007年GDP年度数据作图观察,发现GDP随时间的增长呈指数趋势,因此对原始序列作对数处理。通过观察时间序列图,发现经对数处理所得序列具有线性趋势。
2.建模过程
由于GDP带有很强的趋势成分,而我们的目的主要是利用ARMA模型对其周期成分进行分析,因此需要对此类的数据先进行消除趋势性的处理,然后建立ARMA模型。
2.ARIMA模型的建模思想
2.1模型的识别
模型的识别主要依赖于对相关图与偏相关图的分析。第一步,判断时间序列数据是否平稳时间序列,一般采用ADF检验(augmentedDickey一Fuller lest)方法来判断该序列的平稳性。如果该序列为非平稳序列,这时,应对该时间序列进行差分,同时分析差分序列的相关图以判断差分序列的平稳性,直至得到一个平稳序列。在实际中应该防止过度差分,过度差分不但会使序列样本容量减少还会使序列的方差变大。第二步,在平稳时间序列基础上识别ARMA模型阶数p和q,在建立ARMA模型时,时间序列的相关图和偏相关图为识别模型参数p和q提供了信息,选择模型原则如表1。
估计的模型形式并不是唯一的时间序列,在建立模型阶段应多选择几种模型形式,再根据从Akaike提出的AIC准则和Schwatz提出的SC准则评判拟合模型的优劣,选取AIC和SC值达最小的模型。
表1:ARMA(P,q)模型选择原则
ACF
|
PACF
|
选择模型
|
拖尾
|
P阶截尾
|
ARMA(p,0)
|
q阶截尾
|
拖尾
|
ARMA(0,q)
|
拖尾
|
拖尾
|
ARMA(p,q)
|
2.2模型参数的估计和检验
本文利用Eviews5.0对ARMA(p,d,q)模型的未知参数进行估计,选择最小二乘法。完成模型的识别和参数的估计后,从三个方面检验该模型是否成立:(1)模型参数估计量必须通过t检验(2)全部的特征根倒数必须小于1(3)模型的残差序列必须通过Q检验,即是一个白噪音序列论文开题报告范例。
2.3模型预测
根据最后所选方程模型对将来数据进行预测,由于手工计算步骤繁多且容易出错,故本文利用Eviews5.0的预测功能对将来数据进行预测,得出将来数据的趋势。
3.ARIMA模型对我国GDP的实证分析及预测
以我国1978年到2007年的国民生产总值数据为例时间序列,分析ARIMA的建模过程,并通过所选模型对将来三年我国的GDP进行预测淇中2008年的GDP留作对照值。
3.1数据的平稳性处理及检验
根据表2中的GDP时间序列数据利用Evlews5.0作序列的折线图
表1:1978-2007的我国GDP数据
年份
|
GDP
|
年份
|
GDP
|
年份
|
GDP
|
1978
|
3645.2
|
1988
|
15042.8
|
1998
|
84402.3
|
1979
|
4062.6
|
1989
|
16992.3
|
1999
|
89677.1
|
1980
|
4545.6
|
1990
|
18667.8
|
2000
|
99214.6
|
1981
|
4891.6
|
1991
|
21781.5
|
2001
|
109655.2
|
1982
|
5323.4
|
1992
|
26923.5
|
2002
|
120332.7
|
1983
|
5962.7
|
1993
|
35333.9
|
2003
|
135822.8
|
1984
|
7208.1
|
1994
|
48197.9
|
2004
|
159878.3
|
1985
|
9016.0
|
1995
|
60793.7
|
2005
|
183217.4
|
1986
|
10275.2
|
1996
|
71176.6
|
2006
|
211923.5
|
1987
|
12058.6
|
1997
|
78973.0
|
2007
|
257305.6
|
图1:1978-2007年的我国GDP折线图
对我国1978-2007三十年的GDP数据进行单位跟检验,结果如表3所示,ADF检验表明GDP时间序列存在单位跟,是非平稳时间序列。
表2: GDP的单位根检验
|
|
|
|
|
|
|
|
|
|
|
|
|
t-Statistic
|
Prob.*
|
|
|
|
|
|
|
|
|
|
|
Augmented Dickey-Fuller test statistic
|
2.800051
|
1.0000
|
Test critical values:
|
1% level
|
|
-3.769597
|
|
|
5% level
|
|
-3.004861
|
|
|
10% level
|
|
-2.642242
|
|
|
|
|
|
|
|
|
|
|
|
由于GDP序列存在单位根是非平稳时间序列,利用EViews5.0对GDP序列作一阶差分,并作单位跟检验,检验结果认为GDP的一阶差分序列仍是非平稳的。
对GDP序列进行二阶差分,并作单位跟检验,检验结果认为GDP的二阶差分序列仍是非平稳的。
经二阶差分后的GDP序列仍存在单位根。在建模过程中要防止差分过度时间序列,当差分次数过多时存在三个缺点:序列的样本容易减小;序列的方差变大;移动平均分量中存在单位根。因此,我们对GDP数据取对数后的序列lny进行单位根检验。经单位根检验,得到lny的二阶差分折线图和自相关与偏相关图分别如图2,3所示:图2 :lny序列的二阶差分折线图

图3 :序列lny的自相关(左)和偏相关(右)图

为了检验lny序列的二阶差分是否平稳,再对GDP的二阶差分序列进行单位根检验,结果如表3所示:
表3:lny序列的二阶差分单位根检验
|
|
|
|
|
|
|
|
|
|
|
|
|
t-Statistic
|
Prob.*
|
|
|
|
|
|
|
|
|
|
|
Augmented Dickey-Fuller test statistic
|
-3.460563
|
0.0186
|
Test critical values:
|
1% level
|
|
-3.737853
|
|
|
5% level
|
|
-2.991878
|
|
|
10% level
|
|
-2.635542
|
|
|
|
|
|
|
|
|
|
|
|
结果表明lny序列经过二阶差分后是平稳的。
3.2 模型的识别与选择
通过对二阶差分后序列lny的ACF和PACF图(图3)分析可知,由偏相关图知P可以选择2或者4,由自相关图知Q可以选择2,由于是二次差分d=2,所以得到两组模型ARMIA(2,2,2)和ARMIA(4,2,2)时间序列,下面对比两组模型:
表4:ARMIA(2,2,2)模型参数估计与检验结果
|
|
|
|
|
|
|
|
|
|
Variable
|
Coefficient
|
Std. Error
|
t-Statistic
|
Prob.
|
|
|
|
|
|
|
|
|
|
|
AR(1)
|
-0.869654
|
0.158911
|
-5.472583
|
0.0000
|
AR(2)
|
-0.599632
|
0.154323
|
-3.885562
|
0.0008
|
MA(1)
|
1.658813
|
0.042582
|
38.95615
|
0.0000
|
MA(2)
|
0.994965
|
0.048695
|
20.43260
|
0.0000
|
|
|
|
|
|
|
|
|
|
|
R-squared
|
0.526926
|
Mean dependent var
|
0.004642
|
Adjusted R-squared
|
0.462416
|
S.D. dependent var
|
0.051650
|
S.E. of regression
|
0.037870
|
Akaike info criterion
|
-3.568692
|
Sum squared resid
|
0.031551
|
Schwarz criterion
|
-3.375139
|
Log likelihood
|
50.39300
|
Durbin-Watson stat
|
1.751855
|
|
|
|
|
|
|
|
|
|
|
表5:ARMIA(4,2,2)模型参数估计与检验结果
|
|
|
|
|
|
|
|
|
|
Variable
|
Coefficient
|
Std. Error
|
t-Statistic
|
Prob.
|
|
|
|
|
|
|
|
|
|
|
AR(1)
|
0.703356
|
0.340955
|
2.062898
|
0.0539
|
AR(2)
|
-0.484346
|
0.375483
|
-1.289927
|
0.2134
|
AR(3)
|
0.429596
|
0.324563
|
1.323612
|
0.2022
|
AR(4)
|
-0.438427
|
0.217346
|
-2.017184
|
0.0588
|
MA(1)
|
-0.507702
|
0.364768
|
-1.391849
|
0.1809
|
MA(2)
|
-0.488453
|
0.338207
|
-1.444243
|
0.1659
|
|
|
|
|
|
|
|
|
|
|
R-squared
|
0.524713
|
Mean dependent var
|
0.003359
|
Adjusted R-squared
|
0.392689
|
S.D. dependent var
|
0.053579
|
S.E. of regression
|
0.041754
|
Akaike info criterion
|
-3.301734
|
Sum squared resid
|
0.031381
|
Schwarz criterion
|
-3.007221
|
Log likelihood
|
45.62081
|
Durbin-Watson stat
|
1.831896
|
|
|
|
|
|
|
|
|
|
|
由表4可知其调整后的R2为0.462416大于表5中的ARMIA(4,2,2)模型的0.392689,而AIC和SC值分别为-3.568692和-3.375139,分别小于表5中的-3.301734和-3.007221,可以认为ARMIA(4,2,2)更为合适。
3. 3模型的建立
根据上面模型的识别与选择,我们选用ARMIA(4,2,2)作为我们的最佳预测模型时间序列,估计该模型的参数及模型的相关检验结果如上图(表6)。结果表明,模型ARMIA(4,2,2)的参数估计值具有统计意义。其展开式为:
3. 3模型的诊断检验
通过对二阶差分ddlny序列的自相关和偏自相关图表的分析可以看出,其相关系数都落入随机区间,并且自相关和偏自相关函数幅度呈逐步递减趋势论文开题报告范例。因此我们可以认为残差序列是纯随即序列,模型满足检验要求,模型方程可以预测。由公式

再由ddlny=dlny-dlny(-1)及dlny=lny-lny(-1)逆推可求得lny的预测值。
经预测得到2008年的GDP值为320246.5与统计资料上的真实值300670.0之间的误差为6.5%较为准确,利用此模型预测2009,2010年的GDP分别为
年份
|
2009
|
2010
|
预测值
|
370021.2
|
438227.9
|
四、结论
时间序列分析的ARMA模型预测问题,实质上是通过对社会经济发展变化过程的分析研究,找出其发展变化的量变规律性,用以预测经济现象的未来。预测时不必考虑其它因素的影响,仅从序列自身出发,建立相应的模型进行预测,这就从根本上避免了寻找主要因素及识别主要因素和次要因素的困难;和回归分析相比,可以避免了寻找因果模型中对随机扰动项的限定条件在经济实践中难以满足的矛盾。实际上这也是ARMA模型预测与其它预测方法相比的优越性所在。
本文将时间序列分析方法应用到我国国内生产总值短期预测中。首先对样本序列进行平稳性判别,若非平稳则对该序列进行平稳化处理;其次,对已识别模型进行估计,这里包括模型系数的估计和阶数的判别;然后白噪声检验显示得到的模型是合理的;最后,通过参数的估计值建立相应的模型并计算出序列短期的点预测
与区间预测。在整个建模的过程中, ,通过Eviews5.0软件可以很方便地得出序列的模型并且有较高的拟合精度。
[参考文献]
[1]王振龙.时间序列分析.中国统计出版社,2003.
[2]徐国祥.统计预测和决策.上海财经大学出版社,1998.
[3]易丹辉.数据分析与Eviews应用[M].北京:中国统计出版社,2002年.
[4]李子奈,叶阿忠.高级计量经济学[M].北京:清华大学出版社,2000年.
[5]何书元应用时间序列分析[M]北京:北京大学出版社,2004
|