作者:Koffi Dumor and Li Yao
本文第一作者Koffi Dumor现为电子科技大学西非研究中心助理研究员
本文发表于SSCI Q2期刊
摘要:由中国发起的“一带一路”倡议(BRI)是中国与其贸易伙伴之间的一种区域一体化发展模式。本文使用1990年至2017年的详细双边贸易出口数据,通过比较传统引力模型与神经网络分析的相对估计能力,来研究如何估计这一贸易倡议。结果表明,神经网络在学习和澄清国际贸易估计方面优于引力模型方法。与具有国家-年份固定效应的基线模型相比,具有固定国家效应的神经网络估计更精确,如OLS估计量和泊松伪极大似然法。另一方面,分析表明,在参与“一带一路”建设的6个东非国家中,超过50%的国家能够实现其预期目标。肯尼亚实现了80%(5个中的4个)的目标。借鉴“一带一路”倡议的经验教训和运用神经网络模型,将成为衡量和比较其他国际贸易干预措施的重要参考点。
关键词:“一带一路”倡议;双边贸易;引力模型;神经网络分析
1. 引言
众所周知,国际贸易是促进增长和减少贫困的关键因素。因此,评估一个国家的贸易表现,并估计其增长潜力是非常重要的。各国政府可以利用这种估计,根据国际经济需求采取和制定政策。与贸易伙伴合作并扩大贸易边界以刺激其经济的需要促使中国提出了“一带一路”倡议,Huang,Liu and Dunford 的研究强调,这一战略的重点是刺激中国的社会经济发展,并超越国界与该倡议的合作国互惠互利,改善人民生活,创造就业和改善环境。Swaine指出,我们将“一带一路”倡议追溯到2013年9月和10月,当时中国国家主席提出了“丝绸之路经济带”模式,旨在成为区域合作发展的典范,并进一步纳入了“海上丝绸之路”。 Huang, Johnston 指出“一带一路”倡议聚焦政策协调、设施联通、贸易便利、资金融通、民心相通五大重点领域。2017年年中,习主席将“一带一路”倡议称为“世纪工程”。关于“一带一路”倡议的收益评估研究一直在稳步增长,但鲜少有研究使用神经网络方法对这一领域进行分析。
在本研究中,我们并非一定要设计一个新的神经网络或引力模型数据集,我们的目标是通过神经网络的应用将这一概念扩展到“一带一路”。这使得能够使用数据集进行准确预测,同时确保产生更多预测性信息的可持续性,从而提高股东决策的质量,并促进这一新的“一带一路”概念的发展。在本研究中,可持续性被定义为持续使用数据集,从而始终如一地实现一套政策目标,这与布伦特兰委员会将可持续性定义为复合的确定的政策目标相一致。我们运用引力模型进一步解释这种国际贸易协定对参与国的益处。引力模型常用于估算国际贸易,各种双边贸易的实证研究往往依赖于传统的引力模型,该模型国家间的贸易量与国家的经济规模和国家间的距离联系起来。预测或估计国际贸易的第二种可行方法是神经网络分析。人工神经网络描述了一类非线性模型,这些模型已成功地应用于各种问题,如模式识别、自然语言处理、医学诊断、功能合成、预测(如计量经济学)以及汇率预测。神经网络尤其适用于学习模式和记忆大型数据集中的复杂关系。Wohl和Kennedy在他们的研究中进行了一个极为新颖的尝试,即用神经网络和传统的引力模型方法来研究国际贸易。研究结果表明,与引力模型相比,神经网络在预测均方根误差(RMSE)方面具有更高的准确性。他们的研究将神经网络预测与美国及其主要贸易伙伴之间的实际贸易进行了比较。
因此,问题在于,“一带一路”作为一项国际贸易协定,对参与国的影响或益处有多大?我们将使用神经网络引力模型,并对数据进行分析,以尝试解释或评估“一带一路”对伙伴国的影响。因此,本研究的目的是以中国与其“一带一路”倡议中的贸易伙伴,尤其是非洲国家之间的贸易为例,检验和比较神经网络分析与引力模型的预测能力。事实上,就非洲而言,“一带一路”倡议主要位于东非。本研究利用引力模型和神经网络对中国与非洲伙伴的双边贸易进行估算,并将估算结果与实际贸易数据进行比较,以了解哪种估算方法更接近实际数据。最后,本文将通过所分析的数据来解释“一带一路”倡议对中国及其合作伙伴是否确实是一个有价值的模式。这对政策至关重要,并可能影响其在参与者中的可持续性。
本文的其余部分结构如下:第二节简要回顾了神经网络分析和引力模型在国际贸易估算中的应用的相关文献;第三节讨论了“一带一路”倡议的概念;第四节对引力模型和神经网络模型进行了更详细的概述;第五节讨论了数据、数据清洗技术,并对其特征进行详细说明。第六节给出了模型的评估结果和分析,并将神经网络和引力模型的预测与中国及其“一带一路”倡议成员国之间的实际贸易数据进行了比较。最后,第七部分对全文进行了总结,并提出了未来的研究方向。
2. 文献综述
虽然已有大量关于引力模型的文献,但应用机器学习方法预测贸易流仍然是另一个研究主题。Nummelin等人使用支持向量机来分解和推测软锯木的相互交换流。Elif通过使用15个欧盟国家的数据,证明了神经网络比面板数据模型具有更低的均方根误差。Tkacz等人也表明,金融和货币变量可以使用神经网络技术进行改进。Gradojevic和Yang结合神经网络和市场微观结构方法研究汇率波动,发现宏观经济和微观经济变量对预测高频汇率变化有重要价值。同样,Varian、Sonia Circlaeys和Kumazawa概述了机器学习工具和技术,包括其对计量经济学的影响。此外,Bajari等人概述了兴趣估计问题,并将统计学和计算机科学中的一些方法应用于兴趣估计问题。研究结果表明,机器学习与计量经济学相结合,可以比面板数据模型更准确地预测标准测量中测试的要求。
引力模型因其在基础设施、移民、制度和双边贸易等流动领域的一贯成就而得到许多研究的认可。例如,Beverelli等在引力贸易框架内研究了制度对贸易和发展的影响,发现制度促进了贸易。Lu等人也通过引入交通基础设施对安德森模型进行了扩充,并使用引力模型估算了其对“一带一路”下贸易和增长的影响。研究结果表明,交通基础设施建设加快了“一带一路”贸易伙伴之间的贸易和经济增长。同样,根据贝尔模型,Herrero和Xu的研究表明,基础设施加速了“一带一路”成员国之间的贸易。Fiorentini等人也以意大利威尼托地区为研究对象,对移民与贸易之间的关系进行了实证评估。利用引力模型得到的结果表明,移民促进了输出国和东道国之间的贸易。
最近,Wohl和Kennedy在他们的研究中用神经网络和传统的贸易引力模型方法来研究国际贸易。研究结果表明,与引力模型相比,神经网络在预测均方根误差方面具有很高的准确性。Wohl和Kennedy指出,在大多数数据集中,神经网络具有抵御混沌和噪声的非线性泛函能力,并且由于其处理单元内部存在大量的互联性,因此相对而言更加稳健,具有很强的适应性。此外,Athey在他的研究论文中对机器学习对经济学的早期贡献进行了评估,并对其未来的贡献进行了同样的预期。他们还研究了发展中的计量经济学整合机器学习和因果推理的一些特征,包括它对研究工具和研究问题的协调努力的影响。
Tillema等人、Pourebrahim等人在他们对行程分布中的神经网络和引力模型进行比较的研究中得出结论,当数据稀缺时,神经网络优于引力模型,在大型数据集中,证据表明引力模型优于神经网络,但后者的确定性较低。此外,Elif将神经网络与面板引力模型方法进行了比较,并指出两种模型都给出了令人满意的结果,即所分析的修正的双边贸易引力模型解释了欧洲国家之间双边出口的差异。面板引力模型具有解释自变量对双边贸易的个体效应的优势,也显示了自变量对双边贸易的显著性。具有相似自变量的另一个维度的神经网络相应地给出了97%的变异,显示了传统面板引力模型数据分析的优势。神经网络在“一带一路”中的应用是合理的,因为神经网络具有综合预测二分类结果的好处,这一点在医学领域已得到证明。而且它还具有处理因变量和自变量之间复杂的非线性关系的能力。因此,这符合具有类似二分特征的双边关系,即东道国、中国及其已同意参与这一贸易安排的伙伴。
在影响国际贸易的因素方面,Celine和Christopher利用167个国家的面板引力模型,考察了基础设施对中亚贸易的影响。他们的研究表明,基础设施将使贸易流量增加2.4%。同样,Limao和Venables也研究了交通基础设施对双边贸易的影响。他们发现,基础设施质量差使双边贸易减少了28%。由于预计“一带一路”将与基础设施一起出现,文献假设“一带一路”对双边贸易流量的增加(或减少)有影响。本研究旨在估计“一带一路”对其沿线非洲国家双边贸易增长(或其他)的贡献程度。除此之外,本研究还利用联合国商品贸易署(UN-Comtrade)中163个国家的大型数据集,对中国与“一带一路”倡议成员国的出口情况进行了估算和预测。
3. 一带一路倡议
“一带一路”倡议始于2013年,2017年5月在北京举行的首届“一带一路”论坛(BRF)促成与包括肯尼亚和埃塞俄比亚在内的30个国家签署经贸协议。目前,中国与其他65个国家在贸易、投资和基础设施方面合作,通过港口和基础设施项目实现区域连通性。丝绸之路经济带和海上丝绸之路,将中国与中亚,东南亚,欧洲,非洲和海湾国家联系起来。“一带一路”倡议的发展可以改变其运营地区的经济环境,降低贸易成本,增加投资,促进增长,改善连通性,最终建立持久的区域内贸易关系。
然而,基础设施、经济限制等问题可能会阻碍贸易流动;另一方面,一带一路沿线基础设施本身对贸易有促进作用。为保障一带一路倡议发展,助力各国实现高质量合作,须分析来源找出其弱点。基于上述考虑,本文利用神经网络分析和引力模型估计,将一系列经济、地理和区域贸易协定,如GDP、基础设施、进口商和出口商之间的距离等作为模型输入,研究“一带一路”倡议(BRI)对双边贸易的影响。
4. 模型构建与分析
4.1引力模型
引力模型最早由Leibenstein,Pöyhönen 提出,该模型将两国之间的贸易量与它们的经济规模和它们之间的距离联系起来表示如下:
该模型直观,适应性强,可以对国际贸易做出合理准确的预测。引力模型通常包含虚拟变量,这些因素代表贸易双方是否共享边界、语言、殖民关系或区域贸易协定。Anderson and vanWincoop指出,相对贸易成本不仅仅是直接成本,引力模型还应该考虑多边阻力。同时指出可以通过使用国家固定效应(单个国家出口商和其虚拟因素)来确定多边阻力。一些引力模型使用国家-时间固定效应、国家-国家固定效应或两者兼而有之。引力模型可以用普通最小二乘估计量(OLS):
其中,Distij和虚拟变量,代表共同边界(Contigij),共同语言(Comlangij),共同殖民地(Colij),伙伴国家的基础设施指数(ln frai和ln fraj)和区域贸易协定(Oborij、Aseanij、Eacij、Sadcij)。
考虑国家固定效应:
式(3)扩展了式(2),其中分别表示出口商和进口商固定效应。
考虑国家-年份固定效应:
式(4)引入分别表示出口商和进口商对应年份固定效应。
将贸易流量置于对数框架中,为了避免贸易流量为零的观察被排出,本文做了的处理,避免了观测值的丢失,但难以解释系数。此外,本研究还使用Silva and Tenreyro提出的泊松伪最大似然法(PPML),保证无偏性和一致性。由于缺乏充分的假设支持,引力模型估计使用的是时间序列计量经济学方法论,对双边出口流动的基本机制方面缺乏解释力,但能为政策制定者提供更准确的贸易量预测模型,助力各国贸易决策。
4.2神经网络模型
人工神经网络(ANN)是一种非线性计算模型,其灵感来自于人脑中生物神经网络处理信息的方式。神经网络中的基本计算单元是神经元,从其他节点接收输入并计算输出,每个输入具有相关联的权重(w),该权重基于其重要性来分配。节点定义为其输入的加权和的函数f,如下所示:
图 1 具有两个输入特征X1、X2和一个非线性输出特征Y的单个神经元表示
本文使用的不同类型的激活函数(sigmoid,tanh,ReLu),定义如下:
图 2 激活函数示意图
神经网络具有从复杂关系的数据中预测未知数据的强大能力,因此,它们可以用作预测中国与一带一路沿线合作伙伴之间贸易流量的预测工具。本文遵循Wohl and Kennedy的思路,使用ReLU作为激活函数,并将隐藏的全连接层修改为20×15×10×5,如图3所示。本文搭建的前馈网络模型由一个输入层,四个隐藏层和一个输出层组成。
输入层:从数据集中接收信息,称为输入特征。输入层中节点的数量反映了数据集中自变量的数量。网络的输入特征来源于标准引力模型变量,如GDP,距离,边界,殖民关系,贸易协定等。
隐藏层:隐藏层中的每个节点从输入层中的每个节点接收,执行加权计算并输出,与数据集特征没有直接联系。
输出层:给出神经网络的计算结果——中国与一带一路沿线合作伙伴之间的双边贸易额预测。
为了减少输出层的误差,本文使用梯度下降的优化方法来调整神经网络模型中的所有权重。共训练了100个epoch,批量大小为16,学习率为0.001。
图 3 全连接神经网络模型
5. 数据集
5.1 数据来源
本研究数据涵盖了1990年至2017年163个国家的面板数据集。包括4536个双边出口流量观测值(162 × 161个国家对)。使用了联合国贸易统计数据库、国际前景研究和信息中心、CEPII距离数据库、WDI (WB,2018)等多种数据库分别作为双边贸易(出口)数据、国内生产总值(进口商、出口商)、邻近(共同边界)、共同语言(官方语言)、殖民地(殖民地关系)、交通基础设施变量等数据来源。
5.2数据清洗
首先,研究移除所有没有贸易流量价值的数据。其次,使用反向和正向线性插值来推断缺失的数据。此外,研究获取每日数据,以实现更平滑的数据分布,如图4所示。经过这个过程,得到3936个观测值。对于神经网络,我们对持久变量(出口商的GDP,进口商的GDP)进行标准化,使用公式(6)对它们进行缩放,使它们的均值等于零,标准差等于1。
公式(6)中,m为分布均值,s为标准差,定义为:
表2说明了聚合区域中每个变量的描述性统计信息。在附录A所列163个样本汇总地区(亚洲、欧洲、非洲和世界其他地区),中国双边出口的平均值为4.73%,标准差为2.19%,说明中国与“一带一路”伙伴的贸易往来日益活跃。合计地区进口和出口GDP均值分别为10.14%和12.34%,标准差分别为1.82%和0.49%,这证明了中国经济的快速增长。中国与“一带一路”沿线贸易伙伴地理距离均值为3.914411公里,标准差为0.2320467公里。交通基础设施指数的最大值是指中国在“一带一路”成员国中为6.228716吨公里,这是因为中国正根据“一带一路”倡议大力推进基础设施建设。“一带一路”沿线国家相邻度虚拟值均值较高,标准差为0.068%,标准差为0.25%。这说明了一个事实,即“一带一路”沿线国家比非沿线国家拥有更多的共同边境贸易。文化变量中,通用官方语言dummy的均值为0.025%,标准差为0.15%。这表明,共同语言对“一带一路”贸易伙伴至关重要。文化与贸易流动的扩张之间可能存在决定性的关联。区域贸易协定虚拟体(一带一路、东盟、东共体和南共体)在“一带一路”贸易伙伴国的平均绩效分别为0.46%、0.94%、0.97%和0.97%,标准差分别为0.50%、0.24%、0.17%和0.27%。区域贸易协定指标绩效在“一带一路”合作伙伴中最高,为0.50%,而东非共同体最低,为0.17%。“一带一路”旨在通过改善基础设施和加强贸易来促进区域一体化。这与“一带一路”倡议通过促进贸易伙伴之间的经济增长来促进区域一体化的期望是一致的。
6. 分析结果及分析
6.1. 分析指标
为了比较我们的神经网络模型和重力模型的预测性能,常用的指标是均方误差。本章使用r2,即决定系数和均方误差(MSE)作为衡量。
6.1.1. 决定系数
决定系数R2说明了因变量贸易出口流量的变化程度,该变量可以从空间变量中预测。即
其中,SSres为残差平方和,SStot为数据的总平方和或与方差的比例,yi为与预测值相关的输入向量,y´i为观测数据的平均值。为避免被零除,我们将式(8)修改为:
其中ϵ为经验参数,设为1ϵ−8。r2的取值范围为0 ~ 1,当r2 = 0时,模型总是无法预测目标变量,当r2 = 1时,模型完美预测目标变量。如果r2 < 0,则表明该模型并不优于不断预测目标变量均值的模型。
6.1.2均方误差(MSE)
损失函数(MSE)用于表示我们的预测与目标的偏离程度。MSE定义为:
其中yi为实际观测值,yi为预测观测值,N为观测值个数。
均方根误差RMSE,主要表征为预测值与观测值之差的平方根,即均方根RMSE = p MSE,用于测量由估计器或模型预测的值与实际观测值之间的差异。
6.2. 分析与预测
表3显示了评估的结果。
为了说明模型的预测应用,我们在1990年至2012年的完整数据集上训练了神经网络,并使用它来预测中国与其丝绸之路倡议中的主要贸易伙伴之间的双边贸易出口。表4显示了预测的结果。神经网络的估计值与实际贸易值非常接近,即使是在训练期之后的5年。此外,我们观察到神经网络模型仍然对2017年做出了很好的预测,预测结果如图6所示。
表4:神经网络预测与以百万美元计的实际贸易额对比
7. 结论
本文研究了神经网络分析和重力模型的相对预测能力。基于分析和比较的结果表明,神经网络能够在使用其他经济变量的情况下更有效地预测双边贸易流量。神经网络还能够提高重力模型性能的预测。这将对从事国际贸易业务的政策制定者、分析者和从事国际贸易业务的企业提供有用的帮助,并为行业内的所有参与者衡量这种贸易合作的影响提供动力。利用神经网络模型对这些贸易进行估算,是合作国家衡量这种伙伴关系的影响和可持续性的众多方法之一。