`

Finance-Grounded Optimization For Algorithmic Trading

创建于 更新于

摘要

本文提出了基于金融指标(如夏普比率、盈亏和最大回撤)的定制损失函数和周转率正则化方法,提升深度学习模型在算法交易中的预测表现。回测结果显示,ModSharpeLoss结合周转率约束显著优于传统MSE损失函数,推动交易策略的盈利能力和风险控制 [page::0][page::1][page::4][page::5][page::6][page::7][page::8].

速读内容


研究背景与目标 [page::0][page::1]

  • 传统深度学习损失函数(如MSE)不适应金融时间序列预测的评价指标。

- 提出基于金融指标(夏普比率、最大回撤、PnL)的损失函数,用于训练算法交易策略。
  • 引入周转率正则化,限制交易策略周转率,避免过度交易。


数据集与实验设置 [page::2][page::3]

  • 使用Binance的加密货币交易数据,覆盖2022年1月至2025年7月,选择61个长期上市币种。

- 数据频率包含日、小时及15分钟级别,回归目标是每日收益率。
  • 构造滑动窗口特征,融合多频数据,归一化处理后输入模型。

- 实验基线包括传统启发式策略(动量、反转)与线性回归模型。
  • 深度学习模型包括多层感知机(MLP)和长短期记忆网络(LSTM)。


设计的定制损失函数和正则化 [page::4][page::5]

  • SharpeLoss、PnLLoss、MDDLoss损失函数,从财务指标直接派生。

- ModSharpeLoss为改进后的夏普损失,结合均方差惩罚,更适于训练。
  • 周转率正则化实现对策略变化程度的约束,防止“懒惰”持仓。

- 损失函数与转动率正则化组合使用,控制策略稳定性与盈利性。



量化实验结果分析 [page::5][page::6][page::7]

  • LSTM模型结合LogMDDLoss及ModSharpeLoss TvrReg在测试期表现最佳。

- ModSharpeLoss+TvrReg模型年化收益高达126%+,夏普比率维持约2.9以上。
  • 周转率正则化有效减少过度交易,提高策略稳定性。

- 传统动量、线性回归及买入持有策略表现显著落后。



投资组合优化与多Alpha组合表现 [page::7][page::8][page::9][page::10]

  • 构建20个低相关性Alpha信号,融合多模态数据指标,显著提升组合收益分散。

- 采用点权重和单权重两种LSTM组合路径,实现动态组合权重分配。
  • ModSharpeLoss训练的组合以高达7.4的夏普比率领先,其次为LogMaxDrawDown和PnLLoss。

- 组合策略优于等权重组合和传统启发式组合。



结论与未来方向 [page::8]

  • 财务指标派生的损失函数有助于提升深度模型算法交易策略的表现。

- 周转率正则化能够有效限制交易频率,实现模型预测的交易活跃度控制。
  • 未来工作包括探索更先进DL模型(如transformers)、LOB数据融合与强化学习奖励函数设计。

深度阅读

金融优化驱动的算法交易深层解析报告



---

1. 元数据与概览


  • 报告标题:Finance-Grounded Optimization For Algorithmic Trading

- 作者:Kasymkhan Khubiyev, Mikhail Semenov, Irina Vyacheslavovna Podlipnova
  • 所属机构:Sirius University of Science and Technology(俄罗斯Sirius)、Moscow Institute of Physics and Technology(莫斯科物理技术学院)

- 发布时间:2025年9月8日
  • 研究主题:基于金融理论的深度学习算法交易优化,通过财务指标驱动的损失函数和正则化,提升算法交易策略及投资组合管理的表现。


核心论点与目标



本报告提出了基于金融指标(Sharpe比率、收益与最大回撤)的专用深度学习损失函数,并结合了换手率正则化,以便更好地反映金融领域的评价标准,替代传统的均方误差(MSE)损失。实验证明,这些金融驱动的损失函数大幅提升了回报预测的有效性,同时控制了策略的换手率,增强了算法交易系统的稳健性和经济解释力。作者目标是推动算法交易及投资组合管理领域采用更符合金融实务的机器学习优化目标,促进可信的金融AI发展。

---

2. 逐节深度解读



Abstract(摘要)


  • 提出将财务指标直接作为损失函数——包括Sharpe比率、盈亏(PnL)、最大回撤(MDD)。

- 介绍了换手率正则化以限制策略仓位的变化幅度,防止过度交易。
  • 结果显示:基于金融指标的损失与换手率正则化相结合,显著优于传统MSE,提升了预测质量和策略表现。


1 Introduction (引言)


  • 点明深度学习快速发展,但金融领域特别是算法交易场景具有特殊挑战。

- 指出当前主流深度学习的方法多采用传统回归损失(如MSE),但金融领域重视的指标截然不同。
  • 综述了大语言模型(LLMs)在金融价格预测上的探索,说明纯自然语言处理方法的局限,提出了强化学习以财务指标为奖励函数的必要性。

- 阐述本文贡献:
1. 引入基于金融度量的定制损失;
2. 提出换手率正则化以控制策略交易频率;
3. 这些损失适配于投资组合优化任务。

2 Data(数据)


  • 数据来自币安(Binance)集中交易所的高频市场数据,涵盖2022年1月1日至2025年7月1日。

- 选取了2021年底前上市且未退市的61种数字货币。故意排除2021年以降低极端波动的影响(2021-2022年中位涨幅为432.42%,2022-2023年幅度下降,但仍较高)。
  • 使用三类时间频率数据(日、小时、15分钟),包含价格(开、收、高、低)、成交量、买卖双方成交量及交易次数。

- 表1显示了币种历年波动幅度,强调市场的非平稳性,反映了数据特征的多样性和挑战性。

3 Methodology(方法论)



3.1 Evaluation Metrics(评价指标)


  • 说明实际算法交易中,策略通常以日频率再平衡,即每日调整仓位以降低交易成本和滑点风险。

- 基线策略包括经典启发式策略如:反转(Reversion)、动量(Momentum)、均值回复(Mean Reversion)及Buy&Hold。
  • 定义日收益率计算公式:


\[
r(d) = \frac{p(d)}{p(d-1)} - 1
\]
  • 介绍深度学习模型(MLP、LSTM)及线性回归作为机器学习基线,分别以单模型预测与集成模型预测两种方式进行。

- 使用的核心指标为:
- Sharpe比率,体现收益的风险调整后表现;
- Profit-and-Loss (PnL),累计收益;
- Maximum Drawdown (最大回撤),最大亏损幅度;
- Turnover (换手率),仓位变动的累计绝对值,反映交易频率和执行成本。

这些指标均是实务中风险与收益评估的核心标准。

3.2 Custom Loss Functions(定制损失函数)


  • 强调传统标准损失函数(如MSE)与金融目标间的错配。

- 定义金融相关损失函数:

- SharpeLoss:基于收益与标准差比值(Sharpe比率)设计损失,但去除波动因子$\sqrt{N}$以适应批量训练。
- PnLLoss:负的累计收益(目标最大化收益,故负号)。
- MDDLoss:最大回撤最小化损失,鼓励策略限制风险。
- RiskAdjLoss:综合利润、最大回撤和预测误差的加权损失,权重为超参数$\lambda,\ \gamma$。
- ModSharpeLoss(改良版SharpeLoss):解决SharpeLoss对预测值绝对量不敏感问题,新增基于预测与真实回报误差的惩罚项,使损失函数对错误的趋势和仓位规模更为敏感,避免产生“无意义”的高仓位预测。其核心表现为:

\[
ModSharpeLoss = -\ln((\alpha - r)^2) \frac{\mathbb{E}(pnl)}{\sigma(pnl) + \epsilon}
\]
  • 换手率正则化(TvrReg)通过限制换手率在上下界内,防止模型生成“懒惰型”(低频变动)的买入持有策略,保持策略灵活性和执行效率。

- 换手率正则化添加至损失函数作为惩罚项以优化训练。

4 Experiment(实验)


  • 数据集基于币安市场,选出61币种构建时间序列。

- 生成三类启发式基线策略:反转、动量、均值回复。
  • 机器学习方法包括线性回归。

- 深度学习基线:MLP与LSTM。
  • 比较基于MSE和定制损失(SharpeLoss,PnLLoss,MDDLoss,Logarithmic MDDLoss,RiskAdjLoss,ModSharpeLoss)以及换手率正则项的表现。

- 创造20个基于多模态金融数据(K线、订单统计、盘口数据等)设计的低相关性alphas,进一步用于投资组合优化问题。
  • 验证两套权重生成方案(单一权重,对应alphas整体;点权重,对应每个标的),均使用基础LSTM网络结构。


5 Results and Discussion(结果与讨论)



5.1 Loss Functions(损失函数)


  • LSTM与自定义损失结合策略整体超越基线启发式和经典ML方法,均大幅领先Buy&Hold。

- Logarithmic MDDLoss表现最优,测试集拥有最低最大回撤,较高盈利和Sharpe比率,表现最稳健。
  • 换手率正则化明显提升了模型表现,有效控制交易频率且提升收益及风险调整表现。

- 图2与图3为全量与测试区间累计PnL曲线,展示各策略收益变化走势。
图2-Alphas performance
图中红色虚线代表测试集开始节点,深度学习策略普遍展现主导性优势。
  • 表2与表3详细对比了所有策略指标,LSTM模型配合ModSharpeLoss与TvrReg在收益和风险控制方面取得最佳平衡:


| 策略名称 | 换手率 | 最大回撤 | 利润(%) | Sharpe比率 |
|-----------------------|---------|------------|---------|------------|
| LSTM LogMDDLoss | 0.65 | -0.055888 | 67.26 | 1.919644 |
| LSTM ModSharpeLoss | 0.20 | -0.057322 | 22.29 | 1.985342 |
| LSTM ModSharpeLoss TvrReg | 0.59 | -0.108168 | 21.68 | 1.666563 |
| LSTM SharpeLoss | 0.24 | -0.101082 | 94.86 | 2.975480 |

等。这些指标强调了降风险与稳定盈利的权衡。[page::6,7]

5.2 Portfolio Optimization(投资组合优化)


  • 利用20个低相关alphas构建Portfolio策略,结合深度学习权重预测。

- 相关性热图(图4和图6)证明了alphas间低相关性特征,有利于分散风险,提高组合效率。
图4 Correlation Heatmap
  • 每个alpha具体表现见图5与表4,最大的alpha性能出众,尤其是基于订单簿不平衡(volume imbalance)的alpha表现最佳,Sharpe指标高达8.89。

- 组合策略表现见图7及表5,基于ModSharpeLoss优化的组合表现最优,换手率较为适中,最大回撤和收益均优越,Sharpe比率超过7,稳定且盈利能力强。
图7 Portfolio Performance
| 组合策略 | 换手率 | 最大回撤 | 利润(%) | Sharpe比率 |
|----------------|---------|-----------|----------|------------|
| ModSharpe | 0.638 | -0.020634 | 13.05 | 7.40 |
| LogMaxDrawDown | 0.664 | -0.028539 | 10.97 | 5.59 |

展示了金融指标定制损失结合的深度学习组合策略优越表现。[page::8,9,10]

---

3. 图表深度解读



图1(第5页)


  • 描述:图1展现了原始SharpeLoss与改良ModSharpeLoss的损失值对产出仓位数值(对数尺度)的依赖关系。

- 解读:标准SharpeLoss损失对仓位大小不敏感,曲线接近水平,无法有效区分预测仓位的大小;而ModSharpeLoss随仓位数值呈指数线性增长,意味着更能鼓励适当大小的仓位预测,避免极端猜测。
  • 联系文本:支持作者关于标准SharpeLoss缺乏顺序感知的批评,验证了改进版本的合理性和必要性。


图2(第6页)与图3(第7页)


  • 描述:分别为全历史时间和测试时间区间内各算法策略的累计PnL曲线。

- 数据和趋势:
- 多数DL策略(如ModSharpeLoss、LogMDDLoss)曲线整体向上,表现优于传统启发式和线性回归策略。
- Buy&Hold及部分传统策略在测试区间表现出现较大波动和回撤。
  • 联系文本:视觉呈现了金融驱动损失函数结合LSTM的优势,提升长期稳健收益能力。

- 附表2与3中细节数据印证曲线所示趋势。

图4与图6(第8页、第9页)


  • 描述:20个alpha策略间的相关性热图,全历史与测试时间区间。

- 数据解读:
- 差异化明显,存在大量低甚至负相关性,有利于组合多样化与风险分散。
  • 联系文本:为组合优化提供了坚实基础,避免单一策略风险,捕捉风格多元化。


图5与图7(第8页、第9页)


  • 描述:单个alpha和投资组合策略的累计收益表现。

- 解读:个别alpha策略如volume imbalance表现极为突出,组合中的ModSharpeLoss权重模型表现为最优,既控制了风险也实现较高收益。
  • 联系文本:支撑了基于定制损失函数的深度投资组合优化策略的有效性。


---

4. 估值分析



本报告并未聚焦传统意义上的标的资产估值分析,而是围绕算法交易预测模型的训练损失和策略表现评估进行讨论,核心是将传统金融绩效指标(如Sharpe比率、最大回撤)融入到机器学习损失函数中,用于指导模型训练和组合权重生成。

损失函数设计和正则化构成报告的“估值分析”核心,即通过构造与投资者关注风险-收益特征相契合的优化目标,提升最终交易策略的真实表现。一些具体输入与假设示例:
  • 损失函数必须适应批量大小,为此去除年化因子$\sqrt{N}$,使训练兼顾数值稳定性。

- 损失中加入梯度友好的项(如对数误差惩罚减少极端值影响)。
  • 损失与换手率边界($tb$, $bb$)等超参数由实验验证确定。


整体看,报告属于深度学习优化目标函数设计与实验结果验证,非传统资产估值部分。

---

5. 风险因素评估



报告内部并无传统意义的风险章节明确列举,但隐含的风险和挑战可归纳如下:
  • 市场极端波动风险:报告数据剔除了2021年波动剧烈的时间段用于训练,说明市场高波动可能会干扰模型拟合和表现稳定。

- 损失函数收敛问题:作者在结论部分坦言,定制损失函数的训练收敛性及数值稳定性尚未充分确认,属于开放研究课题。
  • 模型过拟合与泛化风险:尽管模型在测试集表现令人满意,未来市场情况演变不可预知,模型鲁棒性仍需进一步验证。

- 换手率限制与交易成本风险:换手率正则化旨在控制策略交易频次,避免滑点和过高成本,但参数选择不当或市场动态变动时可能导致收益与风险权衡失衡。
  • 数据质量与代表性风险:依赖币安数据,存在来源依赖与极端事件不充分覆盖风险,特别是多频率数据整合的稳定性和延迟问题。


报告并未对以上风险量化概率或提供缓解方案,提示读者关注未来研究方向。

---

6. 批判性视角与细微差别


  • 适用范围和假设限制

- 报告基于加密货币市场数据及高频订单簿,结论对传统股市或不同金融产品的适用性未明示。
- 损失函数基于静态历史数据,没有结合市场行为动态变化(如突发信息、主题事件等)。
  • 模型复杂度与可解释性

- 采用了LSTM、MLP等相对经典模型,未探讨更先进的模型结构(如Transformer、xLSTM)在此框架下的表现,作者也承认为未来工作。
  • 算法交易真实落地难度

- 纯超参数选择的换手率边界和正则化强度可能对不同市场环境敏感,具体值选择需大量调优,报告中设置明显为经验值。
  • 结果稳定性与重复性

- 虽然多个评价指标显示了优势,但 Sharpe ratio 极端值差异较大,一些基线方法Sharpe甚至为负,可能受数据分布、样本划分影响。
  • 损失函数梯度和优化难度

- 用非传统金融指标作为损失,理论上带来非凸优化问题,训练过程难度和稳定性或与标准MSE相比大幅提升,详细训练曲线未展示。
  • 图中某些数值小错误

- 比如表6中“maximum draw down”列,出现“−0.0.108168”的笔误,虽不影响整体趋势判断,但需注意。

这些细微之处和潜在限制为研究者提供了反思和后续改进方向。

---

7. 结论性综合



本报告提出了针对算法交易任务的金融定制性损失函数体系,核心包括利用Sharpe比率、最大回撤与盈亏数据设计的SharpeLoss、MDDLoss、PnLLoss等,以及创新的换手率正则化项以控制交易动态。

经过详实的实证研究,报告发现:
  • 以金融指标为导向的损失函数全面优于传统MSE,不仅提升回报预测精度,也显著改善了策略的风险调整表现。

- 换手率正则化有效防止过度交易和“懒惰”持仓,提升策略的稳健性和执行合理性。
  • 复杂多模态数据融合、多模型集成大大推进了算法的性能边界,特别是在投资组合管理中,基于ModSharpeLoss的策略在收益与风险方面达到了最佳平衡。

- 投资组合表现中,相关性低的20个alphas构建的组合策略体现了分散风险收益的优势,盈利与Sharpe比率双双领先。
  • 报告明确表述了训练收敛、安全性、模型结构优化等未来研究方向,指出将现有损失与高频订单簿数据深度结合,甚至扩展至强化学习领域构建金融智能体的潜力。


整体来看,报告在算法交易领域提出以金融评价为优化核心理念的深度学习方法论,展示了显著的实证效果,代表了面向金融实务的机器学习优化的重要前沿。报告通过详尽的数学推导、严密的实验设计和丰富的图表辅助,有力支撑了基于金融指标优化算法交易的必要性和可行性。

---

参考溯源


  • 见报告[page::0~11]全篇内容及图表。


---

附录:重要图表



图1 SharpeLoss与ModSharpeLoss对比
(描述了经典SharpLoss对仓位幅度不敏感,而ModSharpeLoss则体现了明显的权重变化)

图2 各策略累计收益全区间

图3 各策略累计收益测试区间

图4 alpha相关性热图

图5 Alpha表现

图7 组合策略表现

图6 20 alpha相关性热图

---

(全文完)

报告