Momentum-integrated Multi-task Stock Recommendation with Converge-based Optimization
创建于 更新于
摘要
本文提出了一种结合动量指标的多任务学习框架MiM-StocR,设计了基于动量线指标的分类任务和自适应k近似NDCG排序损失,显著提升了股票推荐的排名能力和盈利性能。同时,引入CQB优化方法,有效缓解了训练中的过拟合问题。实证结果表明,该方法在SEE50、CSI100和CSI300三个基准上均优于现有多任务学习基线,具备较强泛化能力和投资适用性 [page::0][page::1][page::4][page::5]。
速读内容
MiM-StocR框架设计与核心创新 [page::2][page::3]

- 采用多任务学习结构,联合进行回归(预测收益率)和分类(动量线指标五分类)任务。
- 动量线指标替代传统的涨跌标签,更好反映股票短期趋势,定义五类:Bounce、Positive、Volatile、Negative、Sink。
- 自适应k参数的ApproxNDCG列表式排序损失,专注于提升头部股票的排名准确性,避免固定k导致的截断效应。
- 引入Converge-based Quad-Balancing(CQB)多目标优化方法,通过动态调整梯度遗忘率和L2正则化强度缓解多任务训练中的过拟合和梯度尺度不平衡。
实验与性能表现 [page::5]
| Backbone | Dataset | Method | IC ↑ | RankIC ↑ |
|---------|---------|--------|-------|---------|
| LSTM | SEE50 | MiM-StocR (ours) | 0.0362 | 0.0358 |
| LSTM | CSI100 | MiM-StocR (ours) | 0.0522 | 0.0467 |
| LSTM | CSI300 | MiM-StocR (ours) | 0.0632 | 0.0604 |
| GATs | SEE50 | MiM-StocR (ours) | 0.0278 | 0.0266 |
| GATs | CSI100 | MiM-StocR (ours) | 0.0472 | 0.0443 |
| GATs | CSI300 | MiM-StocR (ours) | 0.0622 | 0.0590 |
| HIST | SEE50 | MiM-StocR (ours) | 0.0393 | 0.0387 |
| HIST | CSI100 | MiM-StocR (ours) | 0.0605 | 0.0544 |
| HIST | CSI300 | MiM-StocR (ours) | 0.0667 | 0.0633 |
- 在不同主干网络和不同规模的股票池中均优于STL、均权、多目标优化的SOTA方法。
- 回测显示,结合LSTM的MiM-StocR策略收益超过CSI300指数11.6%,表现稳健。

动量线指标优于传统涨跌标签 [page::4]
| Backbone | Task Type | IC ↑ | RankIC ↑ |
|----------|-------------|------------|------------|
| LSTM | Rise-or-Fall| 0.0457 | 0.0436 |
| LSTM | Momentum | 0.0632 | 0.0604 |
| GATs | Rise-or-Fall| 0.0501 | 0.0484 |
| GATs | Momentum | 0.0622 | 0.0590 |
| HIST | Rise-or-Fall| 0.0519 | 0.0507 |
| HIST | Momentum | 0.0667 | 0.0633 |
- 传统涨跌二分类任务带来噪声,难以提升模型对价格变动方向的感知,动量线任务表现更优。
Adaptive-k ApproxNDCG损失效果及排名提升 [page::6]
| Objective Function | IC ↑ | RankIC ↑ |
|--------------------|--------|---------|
| Cross-entropy | 0.0640 | 0.0612 |
| Pair-wise | 0.0657 | 0.0625 |
| w/o adaptive-k | 0.0649 | 0.0618 |
| MiM-StocR (ours) | 0.0667 | 0.0633 |
- Precision@N指标显示,采用Adaptive-k策略的ApproxNDCG提升了对涨幅股票的筛选准确率。
- Adaptive-k避免固定k值导致的截断,动态适配每天顶级股票数量,增强排名优化。
| Precision@N | @10 | @20 | @30 | @50 |
|---------------------|---------|--------|--------|--------|
| Cross-entropy | 53.58% | 53.98% | 53.99% | 53.67% |
| Pair-wise | 54.07% | 54.15% | 54.15% | 53.82% |
| w/o adaptive-k | 54.04% | 54.01% | 53.93% | 53.64% |
| MiM-StocR (ours) | 54.42% | 54.33% | 54.15% | 53.84% |
CQB多目标优化显著缓解过拟合 [page::6]

- CQB通过梯度归一化、动态调整遗忘率β及L2正则化衰减,有效缓解了验证集和测试集损失反弹的过拟合问题。
- 消融实验验证β平衡和L2正则两部分均贡献于性能提升。
- 长周期训练过程中,CQB维持了稳定低损失,优于传统多任务训练方法。
其他补充说明与未来方向 [page::6]
- 采用LSTM、GATs和HIST三种主流网络架构验证,保证方法普适性。
- 定义清晰的股票推荐指标(IC和RankIC)及基于Qlib的真实行情回测验证收益。
- 未来研究建议关注多任务融合、动态关系建模及领域知识运用以进一步提升收益和降低风险。
深度阅读
详尽分析报告:《Momentum-integrated Multi-task Stock Recommendation with Converge-based Optimization》
---
1. 元数据与概览
- 报告标题:《Momentum-integrated Multi-task Stock Recommendation with Converge-based Optimization》
- 作者及机构:
- Hao Wang等,分别来自香港科技大学(广州)、香港科技大学和上海交通大学
- 主题:
- 股票推荐系统的深度学习优化,结合多任务学习(Multi-Task Learning, MTL)和收敛性优化技术
- 核心论点:
- 传统的价格预测模型未能同时捕获股票趋势和排名信息,这两点对投资者尤为重要。
- 提出了MiM-StocR框架,以多任务学习为基础,利用动量指标作为辅助任务,并融入了Adaptive-k ApproxNDCG排名损失和一种名为Converge-based Quad-Balancing(CQB)的多目标优化方法来缓解过拟合。
- 主要贡献及结果:
- 通过SEE50、CSI100、CSI300三个真实股票数据集实证,MiM-StocR在排名和盈利能力两个方向显著优于最先进的MTL基线方法。
总结而言,作者旨在通过结合更具解释性和有效性的动量指标、多任务学习和针对过拟合的自适应优化,提升股票推荐模型的实用价值和投资收益表现。[page::0,1]
---
2. 逐节深度解读
2.1 引言与问题定义
- 关键论点:
- 传统深度学习模型多将股票推荐视为独立的分类(涨跌预测)或回归(价格预测)任务,但这些任务忽略了相对排名这一投资决策关键因素。
- 由于金融市场的高度波动与噪声,模型准确率通常约50%,涨跌预测乃至精确的价格回归预测均较难实现高精度。
- 另外,投资者关注的是有限资金下的优质股票筛选,相较于所有股票的整体分类或回归,顶层股票的准确排序才更有效。
- 现有的排序方法多为pair-wise比较,容易稀释投资者关注的头部股票信息,效果有限。
- 股票市场高度不稳定,训练数据与未来数据分布存在显著漂移,导致模型易过拟合。
- 问题陈述:
- 股票推荐任务定义为基于当日股票特征,预测其次日收益率,并基于预测值完成股票排名,以尽可能贴近真实排名并获得更高收益。
2.2 设计与方法论
2.2.1 多任务学习框架(MiM-StocR)
- 任务准备:
- 回归任务:预测下一交易日的收益率。
- 分类任务:设计了“动量线指标”作为分类标签,力求更好地捕捉价格趋势信息,替代传统的涨跌分类标签。
- 动量线指标:
- 以价格差计算价格动量$mT = priceT - price{T-l}$,其中$l$为时间间隔长度。
- 动量线由过去$s$天动量序列组成,基于其形态划分为五类:“Bounce”(负转正)、“Positive”(持续正向)、“Volatile”(围绕0波动)、“Negative”(持续负向)、“Sink”(正转负)。
- 该设计的目标是缓解涨跌预测的噪声性,提高模型对价格趋势的辨识能力。
- 排名损失函数:Adaptive-k ApproxNDCG:
- 利用NDCG(Normalized Discounted Cumulative Gain)评价排名,传统NDCG因不可微而难直接用作训练目标。
- 引入ApproxNDCG算法,将不可微指示函数替换成光滑的sigmoid函数,从而实现端到端梯度优化。
- 为避免静态$k$值导致“截断效应”,即固定考察排名长度$k$可能排除某些同等级股票,设计了自适应$k$机制,根据当日各动量类股票数量动态确定$k$,确保不会将同类别股票人为切割。
- 分类损失由交叉熵和Adaptive-k ApproxNDCG加权组成,两个任务比例各50%。
- 多目标优化方法:Converge-based Quad-Balancing (CQB):
- 针对多任务中不同损失与梯度规模差异显著及过拟合问题,提出CQB,包含以下核心模块:
1. 损失与梯度规模平衡:利用梯度的指数滑动平均(EMA)与对数变换,计算两任务梯度并归一化,统一$l2$范数后组合梯度。
2. 遗忘率自适应调整:动态调整EMA的遗忘率$\beta$,基于训练与验证损失变化比值$Vn$监测模型是否过拟合,当检测到过拟合迹象时减弱梯度权重。
3. L2正则强度调节:结合训练状态自动调整权重衰减率,以增强正则化抑制过拟合。
- 整体流程如图1所示,包含任务准备(输入原始数据,生成标签)、多任务训练(共享参数的回归与分类模块)、多目标优化(三重平衡策略)。[page::1,2,3]
---
3. 图表深度解读
图1: MiM-StocR框架示意图(第2页)
- 描述:
- 图示了三个并列模块:任务准备(绿色背景)、多任务训练(橙色背景)和多目标优化(蓝色背景)。
- 任务准备中,原始股价数据输入动量线生成模块,构建分类标签。
- 多任务训练包含回归层(MSE损失)和分类层(结合交叉熵及Adaptive-k ApproxNDCG损失)。
- 多目标优化模块显示四个调节步骤:损失尺度平衡、梯度幅度平衡、遗忘率调节、L2正则调节。
- 解读:
- 直观展示作者如何融合时序信息与趋势、多任务训练目标、多维度动态梯度优化,体现了模型设计全面考虑股票任务的多面挑战。
- 动量指标五种形态曲线示意,突出动量分类的多样性及其对价格变动趋势的刻画。
图2: 训练损失曲线(第3页)
- 描述:
- 子图A:回归任务的训练、验证、测试损失随训练轮次(epoch)变化。
- 子图B:分类任务的训练、验证、测试损失随训练轮次变化。
- 解读:
- 回归任务损失(子图A)训练集持续下降而验证和测试集损失趋势趋平且持平甚至上升,显示典型过拟合现象。
- 分类任务损失(子图B)相比回归任务,验证和测试损失较为稳定,但也呈现过拟合趋势。
- 图示佐证文中对股票数据训练因波动大、数据分布漂移引起的严重过拟合问题的陈述。
图3: CSI300上的账户收益变化(第5页)
- 描述:
- 三个子图分别对应三种骨干网络(LSTM、GATs、HIST),横轴为2020年全年时间,纵轴为账户余额。
- 不同颜色线表示不同方法,包括单任务(STL)、等权梯度(EW)、DB-MTL、CAGrad与MiM-StocR。
- 解读:
- MiM-StocR曲线(粗紫线)在所有骨干网下均表现出明显的优势,尤其在年中之后的收益增长上领先其他方法,最终累计收益远超基准CSI300指数(未标出具体曲线但文中说明超出11.6%)。
- 该图形象体现了模型在实盘交易模拟中的优秀盈利能力及策略稳定性。
图4: CQB与其它多任务优化基线的损失曲线对比(第6页)
- 描述:
- 子图A与B分别展示DB-MTL与CAGrad在回归与分类损失上的训练、验证、测试集表现。
- 子图C展示CQB对应任务的损失曲线。
- 解读:
- DB-MTL和CAGrad在验证及测试损失上出现明显“反弹”现象,训练损失持续下降,反映过拟合。
- CQB的验证及测试损失较为平稳且无明显过拟合迹象,说明该优化算法有效缓解了模型过拟合问题。
- 结合训练方法论,图示验证了CQB设计中遗忘率动态调整和L2正则调节的作用。
图5: Adaptive-k变量$k$在训练过程中的取值分布(第9页)
- 描述:
- 柱状图显示训练期间每日动态确定的$k$值出现频率,横轴为$k$值,纵轴为出现次数。
- 主要集中在60~70区间,同时具有50~300较宽分布。
- 解读:
- 反映在实际股票样本中,动量类的股数波动大,Adaptive-k机制根据每日样本自适应选择$k$以覆盖全部高动量股票,避免截断效应。
- 表明自适应策略既保证了排名损失聚焦于潜在优质股票,也避免了不合理固定长度的缺陷,提高模型对市场动态的适应能力。
---
4. 估值分析
报告性质为模型算法研究,非企业财务估值,未包含DCF或传统PE等估值方法,但模型性能的“估值”体现在几个指标和实验中:
- 核心性能指标:
- 信息系数(IC)和排名信息系数(RankIC),均为衡量模型预测收益率及其排序准确性的统计指标,范围为[-1,1],越高表示预测与真实表现越相关。
- 盈利性评价:
- 实盘交易模拟中累计收益率体现模型实际投资优势,超过基准指数11.6%。
- 关键模型优化与评估:
- Multi-task learning通过结合回归、动量分类任务及Adaptive-k ApproxNDCG排名损失提升了预测精度和排序质量。
- CQB优化策略提升泛化能力,避免过拟合提升实盘收益稳健性。
---
5. 风险因素评估
- 过拟合风险:
- 股票数据时序高波动性和分布漂移特性导致过拟合风险高,影响模型泛化。
- CQB尝试以动态遗忘率和平衡正则权重缓解该风险,该风险被视为当前及未来研究重点。
- 动量指标分类风险:
- 动量指标有助于刻画趋势,但若市场结构发生变化或出现极端行情,动量信号可能失效,影响模型表现。
- 截断效应风险:
- 如果使用静态$k$值,排名损失忽略部分关键股票,影响排名优化效果。Adaptive-k机制降低了此风险,但其效果依赖于阈值选择合理性。
- 模型复杂度与解释性:
- 多任务模型若参数调节不当可能陷入局部最优,导致预测波动;此外,复杂模型可能难以向投资决策者充分解释,限制实时应用。
---
6. 批判性视角与细微差别
- 潜在偏见和假设挑战:
- 报告中将动量指标作为分类任务标签,假设这一指标相较于传统涨跌标签更准确且噪声更小,但未充分讨论在不同市场环境或极端风险事件中动量失效的可能性。
- CQB方法依赖于验证集损失变化率$Vn$来动态调整遗忘率和衰减,这一调节策略假设损失趋势能准确反映过拟合表现,但在非平稳市场中,验证集的代表性和损失走势可能并非稳健指标。
- Adaptive-k的阈值选择和分组顺序对结果有一定影响,虽然通过经验和网格搜索确定,但该方法可能对异常数据敏感。
- 报告内部一致性与论证:
- 整体结构清晰,模型设计思路与实验验证相辅相成,描述一致。
- 但由于实验以公开数据和回测模拟为主,实际市场微观结构和交易成本未充分考虑,外推到实盘环境应谨慎。
---
7. 结论性综合
本报告提出了以多任务学习为核心,融合动量线指标和排名优化损失的股票推荐新框架MiM-StocR,并创新性地提出CQB多目标优化算法,有效解决传统模型在金融时序数据过拟合与排名信息缺失的问题。具体洞见:
- 动量线指标设计:
- 通过将价格动量演化序列归为五类,替代涨跌二元分类,缓解了噪声任务对模型的影响,提高了训练信号有效性。
- 这一设计从金融学经典动量策略中汲取灵感,兼具理论基础与实践意义。
- Adaptive-k ApproxNDCG排名损失:
- 将排名指标以近似微分形式加入损失,实现端到端优化。
- 采用动态调整$k$值,敏感捕获每日市场中的前沿优质股票,减少了截断效应的弊端,增强模型对顶级股票识别的能力。
- 实验结果显示该机制相较传统pair-wise或纯交叉熵损失,有显著排名和盈利能力提升。
- CQB多目标优化策略:
- 引入梯度规模归一、遗忘率动态调整和L2权重衰减自适应调节机制,针对股票数据特有的过拟合与训练不平衡难题进行创新缓解。
- 实证图表清晰显示CQB在控制验证和测试损失上优于现有多任务优化方法。
- 实证效果:
- 在SEE50、CSI100及CSI300三个真实数据集上,MiM-StocR均显著提升IC和RankIC指标。
- 模拟交易收益率超过基准指数11.6%,展现良好盈利潜力和稳健性。
- 通过消融实验验证了每个核心模块的独立贡献。
- 报告价值:
- 提供了结合金融知识与深度学习技术解决复杂投资问题的范式。
- 对未来多任务金融时间序列预测和投资策略设计提供了宝贵参考和模型基础。
综上,MiM-StocR通过多层面创新,实现了从股价走势、股票相对排名到模型训练的整体优化,有效提升了模型预测质量和经济效益,具有较强的研究和应用价值。[page::0,1,2,3,4,5,6,9]
---
小结
本报告结合动量投资经验、深度学习多任务训练结构及多目标动态优化策略,构建起了一个设计合理、实验扎实且适应股票市场波动性的股票推荐系统。其设计思想和实验体现出工业与学术的深度融合,为金融领域基于机器学习的投资策略开发树立了新的技术路线标杆。