数据分享|Eviews用ARIMA、指数曲线趋势模型对中国进出口总额时间序列预测分析

发布时间 2023-11-25 23:51:02作者: 拓端tecdat

全文链接:https://tecdat.cn/?p=34361

原文出处:拓端数据部落公众号

研究的背景及意义

众自20世纪80年代至今,随着改革开放的深入以及中国最终加入WTO,我国的对外贸易实现了跨越式的发展,中国已经成为世界第一大出口国和第二大进口国,中国经济对世界经济做出了重大贡献。与此同时,中国经济自身的外贸依存度也已经达到了很高的水平,因此正确分析预测我国的进出口贸易额将对我国对外贸易的发展起着举足轻重的作用。 

本文帮助客户在分析了我国出口总额的基础上,根据其数据特征建立ARIMA模型和指数曲线趋势外推模型,主要利用Eviews对模型进行检验分析,从而预测了中国出口贸易总额。

数据的选取与描述性统计

本文选取了1978-2012进出口总额数据(X),(见图1)通过对数据的初步观察可得出:中国进出口总额带有明显的趋势性,这个社会经济现象可以看成是随机过程在现实中的一次样本实现。

image.png

图中显示,中国进出口总额保持指数增长趋势,特别是1978年改革开放以后,呈现出较强劲的增长趋势。从中国进出口总额的变化特征来看,这是一个非平稳序列,明显呈现上升趋势。

image.png

以下为利用软件相关过程:

第一步:读取中国 1978-2012 进出口总额数据建模及预测

在workfile中新建序列im_ex,并录入数据(点击File/Import/Read Text-Lotus-Excel…,

找到相应的Excel数据集,打开数据集,出现如下图的窗口,在“Data order”选项中选择“By observation-series in columns”即按照观察值顺序录入 ,本例只有一列数据,在“Names for series or number if named in file”中输入序列的名字im_ex,点击ok,则录入了数据):

第二步:时序图判断平稳性

    双击序列im_ex,点击view/Graph/line,得到下列对话框:

得到如下该序列的时序图,由图形可以看出该序列呈指数上升趋势,直观来看,显著非平稳。

得到图1所示,中国进出口总额变化趋势图(2006.01—2014.09)

中国进出口总额的趋势模型应用

y序列显著非平稳,现对其一阶差分序列进行ADF检验。在对y的一阶差分序列进行ADF单位根检验之前,需要明确y的一阶差分序列的趋势特征。在Eviews命令框中输入相应的命令“series dy1=D(y)”就得到对数序列的一阶差分序列dy1,其时序图见下图

image.png

检验结果见下图,可以看出在显著性水平0.05下,拒绝存在单位根的原假设,说明序列y的一阶差分序列是平稳序列,因此d=1

image.png

变量 检验类型 Adf统计量 5%临界值 Prob 结论
Ex-im C(0,0) 2.3275 -2.91  0.99 非平稳
D(ex-im) C(0,0) -4.839 -2.91 0.0002 平稳

在Eviews对话框中输入“series x=y-y(-1)”或“series x=y-y(-1)”,并点击“回车”,便得到了经过一阶差分处理后的新序列x,其时序图见下图,从直观上来看,序列x也是平稳的,这就可以对x序列进行ARMA模型分析了。

image.png

结果如下:

image.png

PACF为拖尾的,ACF二阶截尾,故模型为MA(2)。

接下来估计模型参数:

得到了以下结果:

image.png

对模型参数进行显著性检验,计算其T统计量,显然参数在5%的显著水平下拒绝零假设。

模型的适应性检验与预测

参数估计后,应对拟合模型的适应性进行检验,实质是对模型残差序列进行白噪声检验。若残差序列不是白噪声,说明还有一些重要信息没被提取,应重新设定模型。可以对残差进行纯随机性检验,也可用针对残差的检验。

残差序列从1978至2012年采用拟合的ARMA(1,6)模型生成

将该方程的残差序列定义为a_eq01_06_1即可,可以得到从1978至2012年采用拟合的ARMA(1,6)模型生成的残差序列。

 
 
a_eq01_06_1 (2)=x(2)-0.151676-0.785440*0+0.463391*0+0.428391*0-0.454978*0

这样得到的序列a_eq01_06_1即为ARMA(1,6)模型的残差序列,a_eq01_06_1序列的自相关偏自相关图如下:

image.png

(偏)相关函数值、以及Q-Stat及其p值显示,残差序列不存在自相关,为白噪声,因此模型是适合的模型。模型拟合图如下

image.png

检验结果表明

     LB统计量的P值均大于0.05(或其ACF均落在区间内),说明残差序列无自相关,模型为适应的。

接下来做模型预测:

首先需要扩展样本期,在命令栏输入expand 1952 2015,回车则样本序列长度就变成64了,且最后面4个变量值为空。在方程估计窗口点击Forecast,出现下图对话框,

在预测时,样本内(1978-2012)预测选用静态预测或模型的拟合值(估计值),样本外(2012-2015)预测选用动态预测。

(1)进行样本内(1978-2012)静态预测,在方程估计窗口点击Forecast,出现下图对话框,预测序列记为xf_static_eq01_06_1,预测方法选择“Static forecast”,预测样本区间为“1952-2015”,点击OK,得到下列预测图

image.png

(2)将序列的估计值x_fit_eq01_06_1和这里的静态预测序列xf_static_eq01_06_1以组的形式打开,并将组命名为x_fit_xf_static,组序列图形如下

image.png

可见,样本内的静态预测序列值严格落在拟合值序列x_fit的曲线上,说明在样本期内(1978-2012)静态预测值与模型的拟合值(估计值)是相等的。

(3)进行样本外(2012-2015)动态预测,在方程估计窗口点击Forecast

预测序列记为xf_dynamic_eq01_06_1,预测方法选择“Dynamic forecast”,预测样本区间为样本外区间“2012-2015”,点击OK,得到下列预测图

image.png

(4)建立新的序列x_fit_f存放序列的静态和动态预测值,在样本内(1978-2012)采用静态预测值或序列的拟合值(估计值),在样本外(2012-2015)采用动态预测值。所以,将序列xf_static_eq01_06_1(或序列x_fit_eq01_06_1)中第1978-2012年的数值复制到序列x_fit_f的对应位置,然后将序列xf_dynamic_eq01_06_1中第2012-2015年的数值复制到序列x_fit_f的对应位置,这样得到的序列x_fit_f就是序列x的预测值。

(5)将序列的实际值x和这里的预测序列x_fit_f以组的形式打开,并将组命名为x_x_fit_f,组序列图形,即x的实际值与预测值图形如下

QQ截图20231123142318.png

image.png

指数平滑模型

除了趋势拟合外,平滑法也是消除短期随机波动反应长期趋势的方法,而其平滑法可以追踪数据的新变化。平滑法主要有移动平均方法和指数平滑法两种,这里主要使用指数平滑方法。

对已经平稳了的时间序列,通过Eviews进行指数平滑。

步骤如下:

image.png

给定方法为选择使残差平方和最小的平滑系数,该例中平滑系数0.88,超过0.5用一次平滑效果不太好

image.png

image.png

可以看出,平滑系数为0.1 ,修匀或者趋势预测效果不错。

image.png

结论

2005 年进口总额预测值6438.752 亿美元, 根据 《 海关统计》 数据, 2005年两项指标实际值分别为63169.8亿元、6601亿美元, 误差分别为1.66% , 2.45% 0误差非常之小, 因此预测模型有相当的可信度。 时间序列预测法是一种重要的预测方法, 其模型比较简单 , 对资料的要求比较单一, 只需变量本身的历史数据, 在实际中有着广泛的适用性。


economic-conditions-outlook-march 2023-1421622970-thumb-1536x1536.webp

最受欢迎的见解

1.在python中使用lstm和pytorch进行时间序列预测

2.python中利用长短期记忆模型lstm进行时间序列预测分析

3.Python用RNN循环神经网络:LSTM长期记忆、GRU门循环单元、回归和ARIMA对COVID-19新冠疫情新增人数时间序列

4.Python TensorFlow循环神经网络RNN-LSTM神经网络预测股票市场价格时间序列和MSE评估准确性

5.r语言copulas和金融时间序列案例

6.R 语言用RNN循环神经网络 、LSTM长短期记忆网络实现时间序列长期利率预测

7.Matlab创建向量自回归(VAR)模型分析消费者价格指数 (CPI) 和失业率时间序列

8.r语言k-shape时间序列聚类方法对股票价格时间序列聚类

9.R语言结合新冠疫情COVID-19股票价格预测:ARIMA,KNN和神经网络时间序列分析