`

Decision by Supervised Learning with Deep Ensembles: A Practical Framework for Robust Portfolio Optimization

创建于 更新于

摘要

本文提出了一种基于监督学习的投资组合优化框架DSL,结合深度集成(Deep Ensemble)方法,通过交叉熵损失函数训练模型直接预测最优投资组合权重。DSL显著降低模型预测方差、提升组合稳定性和收益表现。详尽回测验证了DSL在多市场、多模型及多目标条件下均优于传统方法和现有机器学习基线。集成规模越大,收益的中位数和风险调整后表现越稳定,展示了DSL在实际资产管理中的强大潜力与实用性 [page::0][page::1][page::2][page::4][page::5][page::6]

速读内容


DSL框架创新及方法论核心 [page::0][page::1][page::2]

  • 提出基于监督学习的投资组合优化框架Decision by Supervised Learning(DSL)。

- 结合深度集成方法,利用多个独立初始化模型的平均预测降低方差提高稳定性。
  • 以交叉熵作为损失函数,训练模型直接预测最优投资组合权重,区别于传统的预测-优化两阶段或端到端学习。

- 理论上支持凸替代目标(如Sharpe比率和Sortino比率),避免非凸优化带来的训练不稳定。[page::0][page::1][page::2]

实验设计及多维比较 [page::2][page::3]

  • 对比基准:Prediction-Focused Learning (PFL), End-to-End Learning (E2E), 以及经典均权、价值权和mSSRM方法。

- 采用Mamba、LSTM、Transformer三种模型结构结合最大Sharpe比率和最大Sortino比率两种目标。
  • 在多个静态与滚动股票标的池(大盘股、纳斯达克30等)上回测2019-2025年间股票数据。

- 输入为21交易日的OHLCV序列预处理数据,训练采用Sophia优化器,滚动训练并选取最低验证误差模型。[page::2][page::3]

关键回测结果总结 [page::4][page::5]


| 方法 | 大盘股(回报率/Sharpe/Sortino) | 纳斯达克滚动(回报率/Sharpe/Sortino) | S&P滚动(回报率/Sharpe/Sortino) |
|-|-|-|-|
| DSL (最佳模型组合) | 最高累计回报、Sharpe和Sortino指标领先多数基线方法 | 在动态调整成分股情况下仍维持良好优势 | 多数配置下表现优于PFL和E2E,显示稳定强劲性能 |
  • 在大多数市场环境和目标设定下,DSL超越PFL、E2E和传统策略,表现最优。

- 最大Sortino比率目标下普遍效果优于最大Sharpe,比率选择对结果影响大。
  • 静态和滚动投资组合均体现良好的风险调整收益能力。[page::4][page::5]


深度集成作用分析 [page::6]


  • 以NASDAQ 100和S&P 500滚动池为例,随着深度集成规模从1扩展至64甚至128,累计回报、Sharpe和Sortino比率均显著提升。

- 集成提高了模型预测的稳定性,降低了组合表现的方差,增强收益的鲁棒性。
  • 该实证证明了Deep Ensemble在提升组合优化性能和风险管理中的重要价值。[page::6]


研究局限与未来方向 [page::6][page::7]

  • 当前DSL限于多头(long-only)投资组合,尚不适用多空策略。

- 深度集成带来较高计算成本,需权衡资源与收益。
  • 在特定市场环境(如区间震荡或下跌趋势)表现减弱,可能呈现高风险暴露。

- 未来可探索长短仓混合、多样化损失函数、结合强化学习及不确定性估计的策略扩展。[page::6][page::7]

深度阅读

深度解析报告:《Decision by Supervised Learning with Deep Ensembles: A Practical Framework for Robust Portfolio Optimization》



---

1. 元数据与概览



报告标题: Decision by Supervised Learning with Deep Ensembles: A Practical Framework for Robust Portfolio Optimization
作者及机构: Juhyeong Kim, Sungyoon Choi, Youngbin Lee, Yejin Kim, Yongmin Choi, Yongjae Lee,来自韩国Mirae Asset Global Investments、Elice以及Ulsan National Institute of Science and Technology等机构。
发布日期与会议: 2025年,发表于第6届ACM国际人工智能金融会议(ICAIF’25)。
主题: 本报告聚焦于资产组合优化(Portfolio Optimization),提出基于监督学习和深度集成(Deep Ensembles)方法的稳健投资组合构建框架。
核心论点与创新点:
  • 传统基于预测的投资组合优化方法面临模型预测和实际决策之间的不匹配难题。

- 报告提出了“Decision by Supervised Learning”(DSL)框架,直接以监督学习形式预测最优组合权重,训练目标使用交叉熵损失函数,简化且稳定优化流程。
  • 通过引入深度集成,DSL显著降低模型输出的方差,提升组合权重的稳定性和鲁棒性。

- 大规模实证回测验证DSL在多样市场环境和不同模型架构上优于传统方法(包括经典的均值-方差优化、多种基于深度学习的方法)、Prediction-Focused Learning(PFL)及End-to-End Learning(E2E)。
  • 作者给出DSL代码公开地址,强调实用性和可验证性。


整体上,报告试图通过结合机器学习前沿技术与金融组合管理实践,桥接学术研究与投资实务的差距。[page::0,1]

---

2. 逐节深度解读



2.1 引言与背景(Introduction)


  • 描述机器学习,尤其深度学习近年在资产组合优化领域的广泛应用。

- 介绍现有的三大范式:
- Prediction-Focused Learning(PFL,先预测资产收益等参数,再做组合优化)
- Decision-Focused Learning(DFL,集成决策目标到模型训练中)
- End-to-End Learning(E2E,模型输出直接为投资组合权重,自动优化投资表现指标)
  • 引出问题:传统的端到端方法在优化非凸目标(如Sharpe比率)时训练过程不稳定,易陷入局部极值,同时受模型初始化等超参数影响波动大。

- 呼吁提出兼顾鲁棒性和可扩展性的实用方法。
  • 提出使用深度集成以缓解模型方差,提高稳定性和可靠性。

- 最终提出DSL框架,利用交叉熵等凸损失“监督”学习最优投资组合权重,再用深度集成集成多模型结果,兼顾稳定与性能。
  • 本节奠定了研究的现实背景和技术路线的合理性。[page::0,1]


2.2 相关工作(Related Works)


  • 综述经典均值-方差模型的敏感性及改进尝试,以及近年来机器学习对组合优化的推动

- 介绍强化学习方法的应用和局限
  • 强调决策聚焦学习(DFL)和端到端学习的兴起,特别其在金融管理中的应用和理论分析

- 涉及最新的深度序列模型架构(如LSTM,Transformer,Mamba)及其在时间序列建模中的优势
  • 讨论集成方法(Ensemble methods)在提升模型准确率和不确定性估计中的理论基础及其对金融领域的价值

- 最后指出现有方法多受到理论与实操差距,难以兼顾稳定性与性能目标,提出DSL的创新价值定位。[page::1]

2.3 方法论(Methodology)



2.3.1 三种学习范式预备知识


  • Prediction-Focused Learning (PFL): 两阶段方法,先训练模型预测未来收益或相关参数 $\hat{y}=f\theta(x)$ 最小化预测误差,再用预测参数进行组合优化(如最大化Sharpe比率)。表达式如下:

- 模型训练目标:$\hat{\theta} = \arg\min
\theta \mathcal{L}(\hat{y}, y)$
- 组合优化目标:$\hat{w} = \arg\maxw \mathcal{P}(w, \hat{y})$
  • Decision-Focused Learning (DFL): 统一两个阶段,通过优化模型参数直接最大化组合表现指标 $\mathcal{P}$,用可微优化层输出最优权重 $\boldsymbol{w}^(\hat{y})$,直接进行决策导向训练。目标:$\hat{\theta} = \arg\max\theta \mathcal{P}(\boldsymbol{w}^(\hat{y}), y)$

- End-to-End Learning (E2E): 更简单的单阶段方法,模型直接输出组合权重 $\hat{w}$,并用表现指标作为训练目标:$\hat{\theta} = \arg\max\theta \mathcal{P}(\hat{w}, y)$。此法跳过了显性优化层,适合结构简单任务,但对复杂决策可能表现不佳。

这些范式阐明了模型训练和决策优化之间的关系与差异,为DSL设计提供理论基础。[page::2]

2.3.2 深度集成(Deep Ensemble)简介


  • 深度集成是集成学习的一种,通过训练多个随机初始化的独立神经网络模型,平均输出以减少预测方差,从而提升准确率和不确定性估计的校准。

- 数学公式展示了集成预测值的方差为单模型方差经过调整的分数,只要集成模型之间不存在100%正相关,集成可显著减小方差。
  • 这种方差减少的特性是金融领域尤其重要,因为组合权重的波动会带来投资风险。

- 深度集成等效于有偏方差权衡的装袋(bagging)方法,避免模型过拟合与对噪声的敏感。
  • 这是DSL利用深度集成提升稳健性的理论支撑。[page::2]


2.3.3 决策监督学习与深度集成(DSL)


  • DSL框架将投资组合构建视为监督学习任务,训练模型直接预测最优组合权重,目标为通过交叉熵损失($\mathcal{L}(\hat{w}, w^)$)拟合预先计算的最优组合 $w^$(基于最大Sharpe或Sortino比率)。

- 相比传统端到端优化非凸目标,交叉熵损失提供更稳定、凸优化路径,降低训练难度。
  • 训练完成后,多模型集成输出:

$$\hat{w} = \frac{1}{m} \sum
{i=1}^m f{\thetai}(x)$$
  • 其中每个模型独立初始化训练,集成权重降低了单模型偶然性和波动,带来更稳健的投资决策。

- DSL兼具决策导向学习的优点与集成方法的稳定性创新。
  • 该方法直接面向投资组合权重,简化了传统的两阶段架构,提高了运算稳定性和实际表现。[page::2,3]


2.4 实验设计(Experiment)


  • 研究问题(RQ1-RQ3):

- RQ1: DSL是否优于传统及现有深度学习基线?
- RQ2: DSL在不同市场、模型、投资目标上的表现如何?
- RQ3: 集成规模对表现稳定度的影响?
  • 基线和模型:

- PFL:深度序列模型预测未来月收益再组合优化;
- E2E:直接优化Sharpe/Sortino比率的端到端模型;
- 经典权重策略:等权(EW),市值加权(VW),以及文献[19]中优化方法(mSSRM)。
  • 模型架构: Mamba(新近高效序列模型),LSTM,Transformer(TRF)。

- 投资组合目标: 最大Sharpe比率(MSH)、最大Sortino比率(MSO)两种经典绩效指标。
  • 输入数据和预处理: 财务OHLCV时间序列,采用对数收益率及其他归一化处理,21个交易日的历史序列作为模型输入。训练2010年起,回测从2019年11月起覆盖疫情及波动周期。

- 标签生成: 目标组合权重以凸优化方法近似最大Sharpe或Sortino比率组合,基于21日回顾期计算。
  • 训练细节: 使用高效Sophia优化器,按月滚动训练,选择验证集最优模型。DSL通过100次独立模型训练集成权重,PFL与E2E结果则为独立训练均值表现。

- 实验数据范围广,注重真实世界回测稳定性并控制交易成本、卖空限制、数据偏差等问题。[page::3]

2.5 实验结果与分析(Backtesting Results)



2.5.1 静态资产池回测(Table 2)


  • DSL在大盘股、股息高股池等稳定资产池中,针对不同目标(Sharpe/Sortino),均取得高于PFL、E2E以及传统策略的累计收益和风险调整指标(Sharpe、Sortino比率)。

- 部分复杂或压力测试序列(区间受限、效用板块)中,DSL略显逊色,尤其在长期下跌阶段可能表现为高β策略,风险敞口较大。
  • 在纳斯达克和标准普尔30只股票中,DSL总体优于对比组,展现出稳定的投资组合构建能力。


2.5.2 滚动资产池回测(Table 3)


  • 面对动态调整的股票池(NASDAQ 100 Rolling、S&P 500 Rolling),DSL依然表现稳健,特别是S&P 500滚动资产池中,DSL以多个指标领先于其他机器学习方法。

- 这体现了DSL在适应复杂股票池变动和市场状态转换中的鲁棒性。
  • E2E在部分环境中表现有波动,表明端到端非凸优化的实操稳定性不足。


整体数据表明,DSL框架结合深度集成的策略相比其他方法更能兼顾收益和风险调整效率,尤其在市场状态多变的背景中优势明显。[page::4]

2.6 图表深度解读



2.6.1 图1:机器学习投资组合优化方法示意图


  • 图示分别展示了Prediction-Focused Learning两阶段流程、单阶段Decision-Focused Learning、End-to-End Learning及本文提出的DSL四种不同学习范式的结构流程。

- DSL结合监督学习和深度集成的单阶段结构,强调以假设最优组合权重作为监督目标,用交叉熵损失训练模型,最后通过集成减少方差。
  • 图中“Gradient”箭头反馈清晰展示DSL优化路劲,有效将实际投资决策纳入训练目标。此图用于加强读者对不同学习框架诉求及成本的理解。[page::0]


2.6.2 图2:DSL与传统策略累计收益曲线对比


  • 针对不同资产池绘制累计收益曲线(时间跨度2020~2025年),主要观察DSL不同目标(Max Sharpe/Sortino)及不同模型(Mamba/LSTM/Transformer)与传统策略(等权、加权、mSSRM)表现。

- 整体趋势显示,最大Sortino比率目标下的DSL模型(尤其Mamba)在大部分资产池累计收益领先,且表现更稳健。
  • 相反,最大Sharpe目标策略相对更保守,部分资产池不及基准表现,强调目标函数的选择对性能影响显著。

- 例如S&P 500 Top 30池中,DSL最高累计回报超过11倍,而传统等权和市值权重组合增幅明显较低。
  • 这一图形强化了DSL框架灵活选目标的优点和实际应用中的重要性。[page::5,6]


2.6.3 图3:集成规模对表现的影响(NASDAQ 100和S&P 500 Rolling)


  • 图为箱线图+趋势曲线,横轴为集成规模(模型数量,1至128),纵轴分别为累计收益、Sharpe和Sortino比率。

- 结果显示,随着集成模型数量的增加,三项绩效指标的中位数值明显上升,整体表现趋于稳定,波动范围显著收窄。
  • 最大提升发生在集成数小到中等阶段(1-32个模型),超过后边际收益递减。

- 这清楚证明集成策略有助于降低组合权重估计方差,提升策略稳定性和风险调整收益。
  • 该图同时定量反映深度集成在金融决策系统中的实用作用。

- 此处实验选用低成本的Mamba模型与Sortino目标,既兼顾计算效率,又关注波动调整下的投资回报,契合实际投资者关切。[page::6]

---

3. 估值分析



本报告并未涉及传统意义上的财务估值(如DCF、市盈率)分析,而是专注于金融机器学习框架下的资产组合优化方法学和实证表现。报告重点在于探索算法和模型设计对投资组合表现的提升,估值范畴更多以复合表现指标(如累计收益、Sharpe和Sortino比率)体现其成果。因此,不适用估值方法论解读。

---

4. 风险因素评估



报告明确指出DSL方法在实际应用中的一些限制和风险点:
  • 模型与损失函数局限:

- 当前DSL设计基于交叉熵损失,且仅适用于多资产的长期持有组合(long-only)。
- 对于需要卖空或复杂组合约束的场景,模型需扩展损失函数或设计自定义约束,增加实现复杂度和验证难度。
  • 计算开销大:

- 深度集成方法本质上需要训练多达100个独立模型,计算和存储资源消耗显著。
- 在高频或实时交易场景需权衡资源分配与收益提升的成本效益。
  • 市场状态敏感性:

- DSL优势在多数情况下明显,但面对特定市场,如价格区间限制明显的震荡市或持续下跌行情时,表现可能不佳。
- 该策略可能表现为高风险偏好(高β)暴露,增加下行风险。
- 需要结合动态风险管理措施,或设计自适应目标函数以缓解此类负面影响。

这些风险因素体现了DSL目前的实际限制,提示未来研发应注重模型灵活性和风险控制整合。[page::6]

---

5. 审慎视角与细节


  • 潜在偏见:

- 报告由机构内部团队撰写,并附带免责声明,内容主要为介绍新技术,未公开论及利益冲突,但创新性声明较强。
- 文章对DSL优越性的描述基于多个实验和指标,较为全面,但对失败场景的论述有限,需关注可能的选样偏差。
  • 内部一致性与细节注意点:

- 各部分架构和实验设计保持逻辑连贯,稳步推导DSL的优势。
- 表格与图形对照清晰,指标选取合理。
- 但实验涵盖的高频交易环境、交易成本敏感性等场景未详细展开。
- 目标函数选择被证明对结果影响较大,后续研究中应考虑多目标权衡和非凸优化效果。
  • 未来扩展点识别:

- 长短仓支持、复杂约束、替代损失函数和自适应方案是关键扩展空间。
- 与强化学习等其他机器学习范式结合亦为前景。

综上,报告学术严谨且实操导向明显,虽仍有发展空间,但提出了可迅速推动实际应用的有益框架。[page::6,7]

---

6. 结论性综合



本报告通过提出“Decision by Supervised Learning with Deep Ensembles”(DSL)架构,成功将传统的资产组合优化问题转化为可利用深度监督学习解决的稳定任务,显著提升了投资组合预测的稳健性和性能表现。
  • 理论突破: 利用交叉熵等凸损失避免直接优化非凸投资绩效指标带来的训练不稳定,批判性地整合监督学习和端到端学习优势。

- 技术创新: 深度集成多模型以减少预测方差、提升风险调整收益的理论与实证结合。
  • 实验验证: 多样化资产池和市场环境回测结果表明,DSL在累计收益、Sharpe和Sortino比率表现上,均系统性优于基线PFL、E2E及传统组合策略,尤其在动态调整的滚动股票池中依旧保持强劲表现。

- 目标函数影响显著: 以最大Sortino比率为目标的DSL表现最佳,揭示实际应用中明确风险调整目标的重要性。
  • 深度集成影响显著: 实验显示集成规模增长带来组合表现和稳定性双重提升,有助于降低模型输出的不确定性风险。

- 局限性和未来方向: 当前DSL配置限制于长仓凸组合结构,计算资源较高,且部分市场环境中表现可能受限。未来可探索长短仓、复杂约束、动态目标及其它机器学习范型结合。

通过实验表明DSL既具备学术创新性,也兼顾实用性,为机器学习驱动的金融资产配置提供了切实可行的强健优化框架。期待未来研究继续完善该方法,推动量化投资自主决策技术的发展。

---

图表索引



-


---

以上分析基于报告全文细致解读,严格引用页面标记,力求为金融分析师提供详实、权威且透彻的研究评析。

报告