当前位置: 中心动态/ 正文
【科研动态】电子科技大学西非研究中心团队成员在《Applied Sciences》发表论文
发表时间:2026-02-09 点击:

 



标题:基于注意力机制的深度学习混合模型在经济作物价格预测中的应用 —— 来自全球期货市场的实证分析及对西非的启示


一、摘要

精准预测农产品价格对于管控市场波动、优化供应链协同、支撑粮食安全相关决策制定具有至关重要的意义。深度学习技术的最新发展,在捕捉大宗商品价格动态中的非线性和时间依赖关系方面展现出强劲的潜力。本研究基于全球期货市场数据,提出一种融合长短期记忆网络与多头注意力机制的混合模型(LSTM-MHA),并将其应用于农产品价格预测研究。

本研究以全球多元大宗商品期货价格为数据集开展模型的训练与验证,相关数据均来自国际交易基准市场,而非特定区域的国内市场价格。尽管本研究的实证分析基于全球数据,但研究的出发点是国际价格波动对粮食进口依赖型地区的重要影响,西非地区尤为典型 —— 全球价格传导在该地区的国内市场动态中发挥着核心作用。实验结果表明,本研究提出的混合模型能够有效捕捉价格的短期时间依赖关系,并通过注意力机制,为分析价格滞后项的相关性提供可解释的研究结论。消融实验进一步揭示了在不同模型架构下,预测精度与结果可解释性之间的权衡关系。该混合模型架构结合了多头注意力机制的时间模式识别、权重分配能力,以及长短期记忆网络的序列学习能力。研究采用平均绝对误差(MAE)、均方根误差(RMSE)和均方误差(MSE)作为模型性能的评价指标。实验结果显示,该模型的均方误差为 0.0124、均方根误差为 0.1114、平均绝对误差为 0.1097,相较于自回归积分滑动平均模型(ARIMA)、纯长短期记忆网络等传统模型,误差降低幅度达到 3 4 倍。研究结论表明,融合注意力机制的深度学习模型可作为解析全球农产品价格动态的重要分析工具,为西非农产品市场的政策分析与风险管理提供科学的参考依据。

关键词:经济作物;大宗商品期货;价格预测;长短期记忆网络模型;多头注意力机制;深度学习

二、引言

农产品价格波动对全球粮食安全、贸易稳定及供应链韧性构成显著挑战,尤其对西非等高度依赖经济作物出口的地区而言,价格预测偏差可能直接影响农户收入、企业运营及政策有效性。传统统计模型难以捕捉价格动态中的非线性关系,现有深度学习模型多聚焦单一商品或缺乏可解释性。为此,本研究提出融合长短期记忆网络(LSTM)与多头注意力机制(MHA)的混合预测模型,基于 2000-2023 年全球六种大宗商品期货数据开展实证分析,旨在为西非地区提供精准、可解释的价格预测工具,支撑相关决策制定。

三、文献综述

1. 农产品价格预测研究现状:

农产品价格预测方法已从传统统计模型向先进机器学习技术演进。传统方法中,ARIMAGARCH 等模型广泛应用于时间序列预测,但难以捕捉价格动态的非线性与长期依赖特征;机器学习领域,支持向量机(SVM)、随机森林等通过识别非线性关联提升预测精度;深度学习方面,LSTM 网络因解决梯度消失问题成为序列预测主流,注意力机制则通过聚焦关键时序信息增强模型可解释性,近年来混合模型(如 LSTM CNN、遗传算法结合)逐步成为研究热点,但其性能仍有提升空间。

2. 现有研究缺口:

当前研究存在三大局限:一是预测范围多聚焦单一农产品,缺乏对多种大宗商品的综合适配性研究;二是模型多采用单变量输入结构,未充分整合多元市场信息,且多数未引入注意力机制,可解释性不足;三是评估体系不完善,部分研究省略验证集或未采用多维度误差指标,难以全面反映模型性能,尤其缺乏针对西非等进口依赖型地区的针对性研究。

3. 研究方法优势:

LSTM 网络擅长捕捉时序数据的长期依赖关系,多头注意力机制能够动态识别不同时间尺度的关键模式并分配权重,二者融合构建的 LSTM-MHA 模型,既保留了序列学习能力,又通过注意力机制提升模型可解释性。同时,模型采用多元输入结构,覆盖六种大宗商品,结合 MSERMSEMAE 多指标评估,有效弥补现有研究不足。

四、研究方法

本研究遵循 “数据采集 - 预处理 - 模型构建 - 训练验证 - 性能评估” 的研究路径。数据方面,选取 2000-2023 年可可、咖啡、棉花等六种全球交易大宗商品期货数据,包含开盘价、最高价、成交量等指标,通过前向填充处理缺失值,经最小 - 最大归一化后按 7:2:1 比例拆分为训练集、验证集与测试集。模型架构采用 “双 LSTM + 多头注意力层 + 全连接层” 设计,第一层 LSTM64 单元)提取时序特征,多头注意力层(8 头)动态加权关键信息,第二层 LSTM32 单元)优化特征,最后通过全连接层输出预测结果。训练过程采用 Adam 优化器与 MSE 损失函数,经超参数调优确定 100 轮迭代、128 批次大小的最优配置,确保模型稳定性与泛化能力。

五、研究结果

(1) 模型核心性能指标优异:MSE 0.0124RMSE 0.1114MAE 0.1097,训练集与验证集损失接近(均约 0.0347),无过拟合现象,展现出强泛化能力;

(2) 相较于传统模型优势显著: ARIMA、纯 LSTM 等基线模型相比,误差降低幅度达 3-4 倍,且能有效捕捉价格长期趋势,对短期波动的平滑处理提升了预测稳定性;

(3) 消融实验揭示架构价值: LSTM 与纯注意力模型的 MSE 均为 0.0046,混合模型虽 MSE 略高(0.0054),但通过牺牲少量数值精度获得了更强的结构灵活性与可解释性,符合政策分析与中长期规划需求;

(4) 滞后项重要性特征明确:注意力权重分析显示,模型优先关注近 3-5 天的时序数据,7-10 天后数据贡献度显著下降,符合农产品市场短期动态主导价格形成的规律。

六、研究结论

本研究构建的 LSTM-MHA 混合模型,有效整合了 LSTM 的序列学习能力与多头注意力机制的关键模式识别优势,实现了多种农产品价格的精准预测。模型在多元大宗商品数据集中表现出优异的泛化能力,误差指标显著优于传统模型,且通过注意力权重分析提供了清晰的时序关联解释,为理解全球农产品价格动态提供了有效工具。研究虽以全球期货数据为基础,但聚焦西非地区的应用场景,其预测结果可为该地区农产品市场的政策制定、风险管理与供应链优化提供科学参考,丰富了跨境农产品价格预测的方法论体系。

七、研究局限与未来方向

(1) 模型未纳入气候、地缘政治、宏观经济等外部变量,难以完全捕捉极端价格波动的驱动因素;

(2) 样本未覆盖更多西非本土市场数据,对区域特定市场特征的适配性有待验证;

(3) 未来可拓展方向包括:整合外部影响因素完善输入特征、探索波动率敏感型损失函数平衡稳定性与极端值预测能力、构建动态评估体系适配实时市场变化。

八、研究启示

(1) 对政府:应基于模型预测结果优化农产品贸易政策与储备调控,加强区域间政策协调,建立价格波动预警机制,保障粮食安全与市场稳定;

(2) 对企业:可利用模型预测优化生产调度、库存管理与出口策略,结合注意力分析的关键时序信息,制定针对性风险管理方案,降低市场波动冲击;

(3) 对市场参与者:模型提供的趋势预测与可解释性分析,可辅助贸易决策、投资规划与合约设计,尤其为西非地区相关主体应对全球价格传导提供实用工具。

本论文由Mohammed Gadafi Tamimu在赵蜀蓉教授的指导下完成,已收录于期刊《Applied Sciences》(ISSN2076-3417

文字: Mohammed Gadafi Tamimu 许倩文

图片:Mohammed Gadafi Tamimu

责编:许倩文

审稿:西非研究中心负责人



版权©2016, 西部非洲研究中心