陈彦斌,刘玲君,陈小亮 | 基于深度学习 LSTM 模型的通货膨胀率预测研究
通货膨胀率预测研究
2.中国社会科学院经济研究所,北京 100836)
陈彦斌(1976-),男,湖南益阳人,教授,博士生导师,博士,教育部长江学者特聘教授,主要从事宏观经济学研究。
E-mail:cyb@ruc.edu.cn
刘玲君(1997-),女,山东烟台人,博士研究生,主要使用机器学习方法研究宏观经济重大问题。
E-mail:liulingjun@ruc.edu.cn
陈小亮(1987-),男,山东潍坊人,副编审,博士,主要从事经济增长和宏观政策方面的研究。
E-mail:chenxiaoliang2200@126.com
关键词:
通货膨胀率;CPI;PPI;LSTM模型;BVAR模型
国家自然科学基金应急管理项目“国内经济政策环境与金融风险防范”(71850003);
国家自然科学基金面上项目“人口老龄化对中国宏观政策有效性的影响:实证研究与模型仿真”(72073141)
一、引 言
BP等传统神经网络模型虽然能够识别变量之间的非线性关系,但无法反映变量之间的时序关系。在经济领域,变量之间的时序关系及其背后的逻辑关系是很重要的。深度学习模型中的长短期记忆神经网络模型(Long Short Term Memory,LSTM)具有出色的时序数据处理能力,在经济与金融预测领域取得了良好的成效,得到了较为广泛的应用,国内相关研究也逐渐增加。例如,唐晓彬等[29]基于LSTM模型,结合大数据技术挖掘消费者信心指数相关网络搜索数据(User Search,US),进而构建了LSTM & US预测模型,并将其应用于对中国消费者信心指数的预测研究,结果发现,LSTM & US模型具有较好的泛化能力和较高的预测精度。杨青和王晨蔚[30]使用LSTM模型对全球30种重要股票指数进行了预测研究,结果发现,LSTM模型具有很强的泛化能力,预测结果较为稳健,而且预测精度优于SVR、MLP和ARIMA三种模型。肖争艳等[28]同时使用LSTM模型和BVAR模型对中国GDP进行了预测研究,结果发现,LSTM模型能够更好地挖掘相关指标对GDP的非线性影响,从而提升模型的预测性能。
与已有研究相比,本文主要有两点边际贡献:其一,本文将LSTM模型应用于中国通胀率预测。已有文献主要使用AR和VAR系列模型等线性模型对通胀率进行预测,忽视了货币政策等因素对通胀率的非线性影响。本文使用的LSTM模型能够较好地将非线性影响考虑在内,而且与BP等传统神经网络模型相比,LSTM模型的门控结构使其能够识别出各序列更长时期的非线性关系,从而更充分地利用历史数据所包含的信息进行预测。本文研究结果表明,LSTM模型的预测性能的确优于BVAR等传统线性模型,更适用于对通胀率的预测研究。其二,本文同时将CPI和PPI作为通胀率的测度指标,分别进行了预测研究。已有文献通常仅将CPI作为通胀率的测度指标加以研究,但是新常态以来中国的CPI和PPI走势多次背离,只考虑CPI很难对整体物价走势进行准确把握。有鉴于此,本文同时将CPI和PPI作为通胀率的测度指标,从消费与生产两个领域更加全面地把握物价走势,从而更好地为货币政策提供决策参考。
二、LSTM 模型的设定与求解
(一)LSTM模型概述
LSTM模型是对循环神经网络(Recurrent Neural Network,RNN)模型的改进,也是深度学习方法的卓越代表之一[28]。(深度学习方法是一类模型结构的统称,主要包括有循环神经网络、深度神经网络、深度卷积神经网络等。其中,LSTM模型是循环神经网络模型的一种,已经得到了较为广泛的应用。)RNN模型在普通多层BP神经网络基础上,增加了隐藏层各单元间的横向联系,通过一个权重矩阵,可以将上一个时间序列神经元的值传递至当前神经元,从而使神经网络具备了记忆功能。LSTM模型在RNN模型隐藏层各神经元中增加记忆单元,从而使时间序列上的记忆信息可控,每次在隐藏层各单元间传递时通过几个可控门,可以控制之前信息和当前信息的记忆和遗忘程度,从而使RNN模型具备了长期记忆功能。与传统的机器学习方法相比,深度学习方法能够更好地从既有数据中提取出各类指标之间的复杂关系,对各种形式的信息和数据都具有较好的适用性。不仅如此,深度学习方法能够提取并充分利用更抽象、更复杂的数据特征,从而使得预测结果更加准确可靠[31]。作为新一代的深度学习方法,LSTM模型与ANN(Artificial Neural Network)、RNN等神经网络模型相比具有明显优势:一方面,经济金融领域的数据普遍存在时序结构,因而时序关系及其背后的逻辑关系对于预测分析是不可或缺的,但是ANN模型无法识别样本之间的时序关系,与之不同,LSTM模型则可以充分挖掘变量之间的长期依赖关系,从而将其背后的时序关系尽可能地应用到预测过程中。另一方面,LSTM模型还解决了RNN模型的梯度消失、梯度爆炸等问题,从而做出更精准的预测[29]。正因如此,LSTM模型的应用日益广泛,不仅被应用到语音识别、情感分析、机器翻译和文本分析相关的学术研究之中[29-32],而且已经在谷歌和百度等公司得到了越来越多的应用。(例如,谷歌的神经网络机器翻译系统就应用了LSTM模型和相关算法,百度的汉语语音识别产品同样应用了LSTM模型和相关算法。)
LSTM模型的预测过程通过神经元的连接实现,具体而言,基本单元模型接收来自其他神经元传递过来的输入信号,输入信号通过带权重的连接进行传递。因此,可以将LSTM模型视为若干线性和非线性函数相互嵌套的模型。对于本文重点研究的通胀率预测分析而言,由于不同时期的历史数据都会对通胀率产生影响,但近期历史数据对通胀预测的影响更大,故而本文选择设有三个门控(Gates)的LSTM模型来控制信息传递过程,从而筛选出对预测有用的信息。每个神经元结构,如图1所示。其中,xt表示t时期的输入向量,包含通胀率、M2、投资、消费、股价指数、汇率、国际大宗商品等变量的历史数据。ht-1表示上一时期的输出结果,ct-1表示上一时期的旧记忆。遗忘门(Forget Gate)决定了上一时期的单元状态有多少记忆需要遗忘,更新门(UpdateGate)则决定了需要更新多少新记忆,并由新记忆和旧记忆相加形成最终记忆,由输出门(OutputGate)从最终记忆中筛选出对预测有用的部分。
图1 LSTM神经元示意图
上述神经元结构使得LSTM模型比BVAR模型具有显著的预测优势:其一,BVAR模型是线性模型的经典代表,只能挖掘变量之间的线性关系,而LSTM模型具有非线性激活函数,因而可以充分挖掘不同变量之间的非线性关系,以及同一变量的历史数据与新数据之间的非线性关系。其二,BVAR模型所能利用的历史数据及相关信息取决于滞后阶数的设置,为了保证模型的可求解性和结果的稳定性,滞后阶数通常是较为有限的,而LSTM模型则可以借助遗忘门和更新门,处理较为复杂的长期时序信息,从而更充分地利用历史数据所包含的信息进行预测,由此得到的预测结果也将更加贴近现实。
(二)训练方法及优化器选择
在训练模型的过程中,选择合适的训练方法和优化器能够提升模型的训练效率,反之则会导致模型的训练效率偏低、学习效果偏差,进而影响最终的预测准确度。本文主要参照杨青和王晨蔚[30]的做法选择训练方法和优化器。就训练方法而言,本文选择小批量(Mini-Batch)方法。具体而言,本文采用深度学习神经网络的常用做法,随机抽取30个样本点进行模型训练,避免了训练的样本点过多导致训练过程慢以及过拟合问题。就优化器而言,为了使LSTM模型能够快速地实现收敛,本文采用适应性矩估计(Adaptive Moment Estimation,Adam)优化器进行优化训练。Adam优化器由Kingma和Ba[33]首次提出,是目前最常用的优化算法之一。传统的优化算法通常将学习率设为常数,与之不同,Adam优化算法在优化过程中会更新学习率,因而学习效果更为有效、收敛速度也更快。
(三)超参数的设定和网络结构的选择
由于训练LSTM模型需要将数据划分为训练集和验证集,本文参照已有研究的常用划分方式,在初始训练中将2004年5月至2014年5月共121个月度数据作为模型的训练集,2014年6月至2015年6月共13个月度数据作为模型的验证集。训练集数据用来帮助模型更新权重、确定模型结构,而验证集的数据则主要用来评估模型效果。且由于本文采用了动态滚动预测方法,在后续预测过程中,训练集会随着样本量增加而不断扩充。模型需要调试的目标包括LSTM层的神经元个数、训练周期的期数等。训练时,采用Mini-Batch Adam算法进行更新,再根据模型在验证集上对所有变量拟合后的均方误差(MSE)来衡量模型的精度,选择精度最高的模型结果。本文预测CPI和PPI所使用的网络结构,如图2和图3所示。(本文将分别使用基准指标体系和扩展指标体系对CPI和PPI进行预测,为了节省篇幅,图2和图3只列示了扩展指标体系下所使用的网络结构。基准指标体系下所使用的网络结构与之类似,只是神经元个数有所差别,不再赘述。)
图2 预测CPI所使用的网络结构
(扩展指标体系)
图3 预测PPI所使用的网络结构
(扩展指标体系)
(四)动态预测过程
(五)预测误差指标
在评判不同模型预测性能的优劣时,本文将开展两方面工作:一方面,分别计算基准指标体系和扩展指标体系下各个模型的预测性能,从而判断纳入扩展指标是否有助于改善模型的预测性能,此时并不对LSTM模型和BVAR模型进行对比分析。另一方面,给定相同的指标体系,就LSTM模型和BVAR模型的预测性能进行对比分析,从而判断在预测通胀率时这两个模型的表现究竟孰优孰劣。
为了实现上述目标,本文参照肖争艳等[28]、唐晓彬等[29]以及杨青和王晨蔚[30]等已有文献的常用做法,使用均方误差(MeanSquared Error,MSE)、平均绝对百分比误差(MeanAbsolute Percent Error,MAPE)、对称平均绝对百分比误差(Symmetric Mean Absolute Percentage Error,SMAPE)作为LSTM模型和BVAR模型样本外预测性能优劣的评判标准。以上三个误差指标的具体计算公式如下:
为了准确评判LSTM模型和BVAR模型预测效果的优劣,本文除了直接比较MSE、MAPE和SMAPE三个误差指标的大小,还将结合D-M检验进行更加严谨的判断。这是因为,虽然借助于MSE等指标值的大小能够从绝对值上评判不同模型的预测性能的优劣,但是并不能验证相关结果在统计分布上是否存在显著差异。要想检验LSTM模型和BVAR模型是否存在统计上显著的差异,可以借助于D-M检验[34]。D-M检验的统计量服从标准正态分布,具体表达式如下:
三、指标选择与数据说明
如上文所述,考虑到CPI和PPI能够分别从消费领域和生产领域反映通胀率的走势,因而本文分别对CPI和PPI进行预测分析。本文基于经济学理论和相关文献,分别构建了预测CPI和PPI的指标体系。
(一)预测CPI的指标体系与数据说明
通过从理论层面分析通胀率的决定因素,并且借鉴龚玉婷等[35]以及封思贤等[36]等相关文献的做法,本文在预测CPI时构建了包括11个变量的基准指标体系:CPI同比增速(CPI),衡量通胀率,是本文要预测的关键指标之一;(由于CPI与PPI多次出现背离走势,因此在预测CPI时暂时没有将PPI纳入指标体系。)狭义货币供应量的同比增长率(M1)、广义货币供应量的同比增速(M2)以及银行间7天同业拆借利率(RATEST),分别反映数量型货币政策和价格型货币政策对通胀率的影响;工业增加值同比增速(IVA),用以反映生产活动的活跃程度对通胀率的影响;社会消费品零售总额同比增速(C),用以反映居民消费需求对通胀率的影响;国房景气指数(HINDEX)、房地产开发投资累计同比增速(HINVEST)以及商品房本年新开工面积同比增速(HSTARTS),用以全面反映房地产市场的运行状况对通胀率的影响;沪深300指数(STOCK),用以体现股市对通胀率的影响;人民币对美元汇率中间价(EXC),用以反映汇率市场变动对通胀率的影响。
除了上述11个基准指标,本文还结合中国的实际情况额外考虑了两类拓展指标,从而更加全面地涵盖通胀率的影响因素,进而对通胀率的走势进行准确预测。一方面,中国的通胀率很容易受到食品价格的影响[16],在不少时期猪肉和蔬菜价格可以很大程度上影响CPI走势,有鉴于此本文专门纳入了食品价格相关的变量,具体包括:食品价格消费指数(FOOD),用以反映肉类、蔬菜、水果等食品价格对通胀率的影响;粮食价格消费指数(GRAIN),用以反映粮食价格对通胀率的影响;CBOT小麦期货收盘价指数(CBOT),用以反映大宗期货食品对通胀率的影响。另一方面,理论和国际经验表明,输入性通胀因素尤其是国际能源价格也是通胀率的重要影响因素[37],因而还需要将国际能源价格相关指标考虑在内。结合已有研究和数据可得性,本文主要考虑如下三个能源价格指标:美国亨利港天然气现货价格指数(GAS)、澳大利亚动力煤炭价格指数(COAL)以及英国布伦特原油现货价格指数(OIL)。
综上所述,本文预测CPI走势时,使用的基准指标体系包括11个变量,在此基础上还分别纳入了3个食品价格指标和3个能源价格指标,从而得到了包含17个指标的扩展指标体系。预测CPI所使用的指标的含义及其统计性描述,如表1所示。为了方便同时使用LSTM和BVAR两种模型进行对比研究,本文所有指标统一使用月度数据,相关数据均来自中经网和Wind数据库。其中,沪深300指数(STOCK)、银行间7天同业拆借利率(RATEST)、人民币对美元汇率中间价(EXC)、小麦期货收盘价指数(CBOT)可以直接查询到的是日度数据,我们将这几个指标每一个月份当中所包含的每一天数据取平均值,从而得到月度数据。其余指标则可以直接获得月度数据。基于数据可得性,在预测CPI时,本文所选择样本的起止时间为2004年5月至2020年6月,一共包含194个样本观测值。
表1 预测CPI所使用的指标含义及统计性描述
注:没有标注单位的指标,均为指数值,无需标注单位。下同。
(二)预测PPI的指标体系与数据说明
借鉴方昕[38]和莫万贵等[39]的做法并结合中国实际情况,本文在预测PPI时构建了包含13个指标的基准指标体系:工业品出厂价格指数(PPI),是本文预测的关键指标之一;CPI同比增速(CPI),用来反映消费领域价格走势对生产领域价格走势的影响;狭义货币供应量的同比增速(M1)、广义货币供应量的同比增速(M2)以及银行间7天同业拆借利率(RATEST),分别体现数量型和价格型货币政策操作对通胀率的影响;工业增加值同比增速(IVA),用以反映工业领域生产活动的活跃程度对通胀率的影响;社会消费品零售总额同比增速(C),用以反映居民消费需求对通胀率的影响;国房景气指数(HINDEX)、房地产开发投资累计同比增速(HINVEST)以及商品房本年新开工面积同比增速(HSTARTS),用以从多个维度全面反映房地产市场对通胀率的影响,从而尽可能地将房地产对通胀率的影响考虑在内;沪深300指数(STOCK),用以反映股市对通胀率的影响;人民币对美元汇率中间价(EXC),用以反映汇率市场变动对通胀率的影响;PMI购进价格指数(PMI_P),用以反映原材料价格对通胀率的影响。
与对CPI的预测类似,在预测PPI时,本文除了构建基准指标体系,同样还考虑了两类拓展指标,从而更加准确地对PPI的走势进行预测。具体而言,PPI主要从生产端反映通胀率走势,因而生产端影响价格的因素需要着重考虑,其中化工类产品的价格和能源价格是重中之重。有鉴于此,本文纳入了3个化工指标作为拓展指标:化工原料类购进价格指数(CHE_B)、石油工业工业品出厂价格指数(OIL_P)、化学工业工业品出厂价格指数(CHE_P)。此外,考虑到国际大宗商品尤其是国际能源价格会对国内PPI产生深远影响[39-41],本文进一步纳入了美国亨利港天然气现货价格指数(GAS)、澳大利亚动力煤炭价格指数(COAL)、英国布伦特原油现货价格指数(OIL),从而将煤、石油、天然气的价格因素考虑在内。
综上所述,本文预测PPI走势时,使用的基准指标体系包括13个变量,在此基础上还分别纳入了3个化工指标和3个能源指标,从而得到了包含19个指标的扩展指标体系。所有指标统一使用月度数据。基于数据可得性,在预测PPI时,所选择样本的起止时间同样确定为2004年5月至2020年6月,一共包含194个样本观测值。相关指标均来自中经网数据库,预测PPI所使用的指标的含义及其统计性描述,如表2所示。
表2 预测PPI所使用的指标含义及
描述性统计
四、预测结果分析
本部分主要回答两个问题:其一,在设置指标体系时,本文不仅选择了基准指标,还基于中国实际情况选择了多个拓展指标,那么加入拓展指标是否有助于改善模型的预测效果?其二,LSTM模型将非线性影响以及更多的历史数据信息纳入预测过程,因而理论上LSTM的预测能力要优于BVAR模型,那么在预测中国通胀率时LSTM模型是否真的优于BVAR模型?
(一)基准指标体系和扩展指标体系的预测性能对比分析
首先回答本文的第一个主要问题,即加入拓展指标是否有助于改善模型对通胀率的预测效果。为了提高模型的预测性能,本文在表1和表2中分别构建了用于预测CPI和PPI的基准指标体系和扩展指标体系。就CPI而言,本文不仅引入了货币政策、汇率、股价、消费、投资等方面的11个基准指标,还专门引入了3个食品指标和3个国际能源指标,从而将食品和能源对CPI的影响考虑在内,得到了包含17个变量的扩展指标体系。表3的预测结果证实,不管是对BVAR模型而言,还是LSTM模型而言,扩展指标体系下的MSE、MAPE和SMAPE三个误差指标的数值均小于基准指标体系下的相应数值,可见使用扩展指标体系对CPI的预测结果的确优于基准指标体系下的预测结果。
表3 使用基准指标体系和扩展指标体系
预测CPI和PPI的效果
预测 指标 | 评价 指标 | BVAR模型 | LSTM模型 | ||
基准指标体系 | 扩展指标体系 | 基准指标体系 | 扩展指标体系 | ||
CPI 预测 | MSE | 0.537 | 0.476 | 0.538 | 0.359 |
MAPE | 0.536% | 0.501% | 0.533% | 0.460% | |
SMAPE | 0.536% | 0.499% | 0.535% | 0.460% | |
PPI 预测 | MSE | 1.609 | 1.470 | 1.964 | 1.404 |
MAPE | 0.974% | 0.126% | 1.122% | 0.932% | |
SMAPE | 0.975% | 0.996% | 1.120% | 0.930% |
注:预测CPI时,基准指标体系只包括11个基准指标,扩展指标体系则包含11个基准指标和6个扩展指标,一共17个指标。预测PPI时,基准指标体系只包括13个基准指标,扩展指标体系则包含13个基准指标和6个扩展指标,一共19个指标。
与之类似,在预测PPI时,纳入扩展指标也显著提升了模型的预测性能。本文设置的预测PPI的完整指标体系中,不仅包含货币政策、投资、消费等方面的13个基准指标,还包含3个化工类价格指标和3个国际能源价格指标,从而得到了包含19个指标的扩展指标体系。从表3的预测结果来看,对于LSTM模型而言,扩展指标体系下的MSE、MAPE和SMAPE三个评价指标的值均小于基准指标体系下的相应值;对于BVAR模型而言,虽然扩展指标体系下的SMAPE略高于基准指标体系的响应值,但是MSE和MAPE的值在扩展指标体系中都有所下降,其中MAPE更是从0.974%下降到0.126%。总体而言,在预测PPI时,纳入扩展指标同样有助于提升模型的预测性能。
不仅如此,从表3还可以发现,在采用扩展指标体系之后,LSTM模型预测性能的改进幅度比BVAR模型的改进幅度更大。就CPI而言,使用扩展指标体系之后,BVAR模型的MSE指标值从0.537下降到0.476,降幅为11.359%,(两种指标体系下MSE的变化幅度的计算公式为:(0.537-0.476)/0.537=11.359%。下文同。)而LSTM模型的MSE指标值则从0.538降到了0.359,降幅达33.271%;MAPE和SMAPE也呈现出类似变化。就PPI而言,在使用扩展指标体系之后,BVAR模型的MAPE指标值降幅更大,但是LSTM模型的MSE和SMAPE指标值降幅更大。由此可以推知,对于相同的指标体系,LSTM模型的确能够挖掘和处理更多的信息:一方面,得益于LSTM模型所具有的非线性激活函数,使其可以充分挖掘变量之间的非线性关系。另一方面,得益于LSTM模型独特的遗忘门和更新门结构,使其可以更充分地利用历史数据所包含的信息进行预测。
需要补充说明的是,使用基准指标体系和扩展指标体系预测CPI所得结果的显著差异意味着,食品价格和能源价格对CPI走势的确起到了深远影响,使得CPI波动性明显偏大。如果忽视食品价格和能源价格,自然难以准确把握CPI水平高低和未来走势。以刚刚过去的2020年为例,国家统计局数据显示,全年CPI上涨2.5%,其中食品价格上涨10.6%,猪肉价格涨幅更是达到了49.7%,影响CPI上涨约1.6个百分点,占CPI总涨幅的六成多。但是,食品和能源价格的大幅波动主要是因为受到了季节性和随机性因素的干扰,并不能准确地反映全社会一般物价水平的走势。仍然以2020年为例,猪肉价格上涨主要是受非洲猪瘟的影响,新冠肺炎疫情冲击之下中国经济整体面临下行压力,经济基本面不仅不能支撑物价上升态势,反而呈现出一定的通缩压力。如图4所示,剔除了食品和能源价格的核心CPI在2020年不仅没有上升反而持续下行,这才是与经济基本面相符的一般物价水平走势。也正因如此,包含食品和能源价格的整体CPI并不适合作为货币政策的锚定目标,相对更加平稳、更能反映一般物价水平走势的核心CPI更适合作为货币政策的锚定目标。不过目前社会各界对于核心CPI的关注仍然有待提高,对于核心CPI的预测研究也有待强化。
图4 CPI同比增速与核心CPI同比增速走势对比
(二)LSTM模型和BVAR模型预测性能的对比分析
如上所述,不管是对于LSTM模型还是对于BVAR模型而言,使用扩展指标体系对CPI和PPI的预测效果比基准指标体系更好,因而本文将在扩展指标体系的基础上回答第二个主要问题,即LSTM模型在预测通胀率时的效果是否真的优于BVAR模型。
基于MSE、MAPE、SMAPE三个预测误差指标以及D-M检验,可以较为全面而准确地判断LSTM模型和BVAR模型的预测效果究竟孰优孰劣。从表4可以看出,其一,对于CPI的预测而言,使用LSTM模型预测得到的MSE、MAPE、SMAPE指标值全部小于BVAR模型得到的相应指标值,可见在预测CPI时,LSTM模型更加适用。其二,对于PPI的预测而言,虽然使用LSTM模型预测得到的MAPE指标值大于BVAR模型相应的指标值,但是使用LSTM模型预测得到的MSE、SMAPE指标值却都小于BVAR模型相应的指标值,相对而言在预测PPI时LSTM模型同样比BVAR模型更加适用。其三,D-M检验结果显示,不管是对于CPI预测还是对于PPI预测而言,D-M检验的p值均小于10%,从而拒绝了原假设,也就意味着LSTM模型和BVAR模型预测结果的差异在统计上是显著的,由此再度证实,在预测通胀率时LSTM模型的表现优于BVAR模型。
表4 LSTM和BVAR两种模型的预测效果对比
CPI | PPI | |||
BVAR模型 | LSTM模型 | BVAR模型 | LSTM模型 | |
MSE | 0.476 | 0.359 | 1.470 | 1.404 |
MAPE | 0.501% | 0.460% | 0.126% | 0.932% |
SMAPE | 0.499% | 0.460% | 0.996% | 0.930% |
D-M检验(p值) | 3.893(0.0001) | 1.744(0.0811) |
基于图5的样本外预测结果可以更加直观地发现,LSTM模型对CPI同比增速和PPI同比增速的预测值的确比BVAR模型的预测值更贴近实际值。一方面,无论是对CPI同比增速的预测还是对PPI同比增速的预测,BVAR模型的预测值与真实值相比存在着较为明显的滞后性,预测值与实际值相比大约滞后1—2个月,而LSTM模型的预测值与实际值则更加同步,与实际情况更一致。以CPI为例,2016年间CPI的峰值出现在4月份,LSTM模型预测的峰值也出现在4月份,但是BVAR模型预测的峰值却出现在5月份;2020年CPI的峰值出现在1月份,LSTM模型预测的峰值也出现在1月份,但是BVAR模型预测的峰值却出现在3月份。另一方面,LSTM模型对通胀率波动性的预测更加贴近现实,在CPI预测上体现得尤为明显。通过计算可以发现,2015年7月至2020年6月期间,CPI实际值的标准差为0.00947,LSTM模型预测值的标准差是0.00940,而BVAR模型预测值的标准差则是0.00925,可见LSTM模型的预测值与实际值更为接近。综上,本文认为LSTM模型对通胀率的预测能力相比BVAR模型更强。
(a)CPI同比增速实际值和预测值
(b)PPI同比增速实际值和预测值
图5 LSTM模型和BVAR模型对通胀率的
样本外预测效果对比
五、结 语
本文同时采用LSTM模型和BVAR模型对中国通胀率的走势进行了预测分析。考虑到CPI和PPI能够分别从消费领域和生产领域反映物价走势,而且近年来在中国的CPI同比增速和PPI同比增速多次出现明显背离,本文同时使用这两个指标反映通胀率的走势。在预测CPI同比增速时,本文不仅基于理论和国际经验,引入了货币政策、汇率、股价、消费、投资等方面的11个基准指标,而且基于中国实际情况引入了3个食品指标和3个国际能源指标,从而得到了包含17个指标的扩展指标体系。类似地,在预测PPI同比增速时,本文不仅引入了货币政策、投资、消费等方面的13个基准指标,还引入了3个化工类价格指标和3个国际能源价格指标,从而得到了包含19个指标的扩展指标体系。
本文的主要结论包括两点:其一,不管是对于LSTM模型还是对于BVAR模型而言,使用扩展指标体系对CPI同比增速和PPI同比增速的预测效果均比基准指标体系更好,可见在预测中国的通胀率时,需要将食品价格和能源价格等重要因素考虑在内,否则会对CPI和PPI的走势产生误判。同时,在采用扩展指标体系之后,LSTM模型的预测性能改进幅度比BVAR模型的改进幅度更大,这是因为LSTM模型能够较好地将非线性影响考虑在内,而且LSTM模型的独特门控结构使其能够识别出各指标序列更长时期的非线性关系,从而更充分地利用历史数据所包含的信息进行预测。其二,基于MSE、MAPE、SMAPE三个误差指标以及D-M检验的结果可以发现,LSTM模型比BVAR模型更加适用于预测中国的通胀率。鉴于LSTM模型对复杂数据的强大处理能力和出色的泛化能力,未来应该大大强化LSTM模型在通胀率预测领域的推广和使用。
需要补充说明的是,未来除了加强LSTM模型对CPI和PPI的预测研究,还应该加强LSTM模型对核心CPI的预测研究。这是因为,CPI包含了食品与能源价格等容易受到季节性与随机性因素干扰的组成部分,从而具有较强的波动性,这容易扰乱公众的通胀预期,甚至可能会误导宏观经济政策的制定[42-43]。剔除食品和能源价格的核心CPI则能够更好地反映一般物价水平的走势,因此货币政策应该重点关注的是核心CPI而非整体CPI,从国际经验来看,核心CPI的确是各国央行更加关注的物价指标。下一步,应该进一步加强LSTM模型在核心CPI预测方面的应用,从而为货币政策的制定提供更有价值的决策参考。
参考文献
(责任编辑:徐雅雯)
公众号责任编辑:李明齐
封面图片@百度
电话:0411-84710267
投稿网站:http://zzs.dufe.edu.cn/
中国道路专题
(点击图片链接进入专题)
数字经济专题