`

Forecasting Probability Distributions of Financial Returns with Deep Neural Networks

创建于 更新于

摘要

本研究提出并系统评估了基于深度神经网络(1D CNN和LSTM)直接预测金融收益率概率分布参数的模型,包括正态分布、学生t分布和偏态学生t分布。利用自定义负对数似然损失函数优化分布参数,模型在六大股指上表现优异,其中LSTM结合偏态学生t分布实现了最优的概率预测准确性和风险度量(VaR)表现,且在校准性与传统GARCH模型竞争中表现突出,体现了深度学习在金融风险管理中的应用潜力 [page::0][page::5][page::6][page::9][page::10]。

速读内容


深度神经网络在分布式金融收益预测上的框架设计 [page::0][page::3]

  • 使用1D CNN与LSTM结构分别建模,输入包含收益序列及其条件波动性估计;

- 预测三种分布参数:正态(Normal)、学生t(Student’s t)及偏态学生t(skewed Student’s t);
  • 自定义负对数似然损失函数实现参数直接优化,提高了分布预测的准确性。


模型超参数及数据训练设置 [page::4][page::5]


| 超参数 | 取值范围 | 最优设定 | 优化工具 |
|--------------|-------------|-----------------|----------|
| 隐藏层数 | 1-5 | 3 | 手动 |
| 每层神经元数 | 8-700 | 128/64/32 | KerasTuner |
| Dropout | 0-0.5 | 0.02 | KerasTuner |
| 学习率 | 0.0001-0.5 | 0.002 | KerasTuner |
| 序列长度 | 1-200 | 10 | 手动 |
| 批处理大小 | 1-动态扩展 | 128 | 手动 |
| Epochs | 10-1000 | 300(早停) | 手动 |
| 卷积核大小(CNN) | 1-5 | 2 | 手动 |
| 过滤器数量(CNN) | 10-512 | 256 | KerasTuner |

量化分布预测表现比较 [page::5][page::6][page::9]


| 指数/模型 | LSTM-SSTD LPS | CNN-SSTD LPS | LSTM-SSTD CRPS | CNN-SSTD CRPS | PIT p-value (LSTM-SSTD) |
|----------|--------------|-------------|----------------|---------------|-------------------------|
| S&P 500 | 1.1933 | 1.2220 | 0.5094 | 0.5197 | 0.0309 |
| Nikkei225| 1.5854 | 1.5865 | 0.6874 | 0.6963 | 2.41e-07 |
| KOSPI | 1.2847 | 1.3172 | 0.5165 | 0.5302 | 5.08e-06 |
  • LSTM结合偏态学生t分布模型在多数市场指标中均达最佳评分,且PIT检验显示其校准效果最好。

- 模型对厚尾和分布偏斜特征均有良好拟合能力。



风险管理VaR与ES性能及统计测试 [page::6][page::7][page::8][page::9]


| 指数/模型 | $5\%$ VaR超出率(%) | $1\%$ VaR超出率(%) | Kupiec 5% 检验 | Christoffersen 5% 检验 |
|----------|------------------|-------------------|--------------|-------------------|
| S&P (LSTM-STD) | 5.34 | 1.01 | 0.4311 | 0.0161 (拒绝) |
| Nikkei (LSTM-STD) | 4.58 | 1.01 | 0.4311 | 0.0161 (拒绝) |
| DAX (CNN-STD) | 5.42 | 1.12 | 未列明 | 未列明 |
  • VaR估计与实际超出频率基本匹配,统计测试多数通过,证明模型在风险估计上的有效性。

- 模型成功捕捉多个市场压力事件(2008金融危机、欧洲债务危机、COVID-19疫情)的波动聚集。

神经网络模型与传统GARCH模型对比分析 [page::9][page::10]


| 指数 | 最佳神经网络模型 | 神经网超出率(%) | 最佳GARCH模型 | GARCH超出率(%) |
|----------|------------------|-----------------|-----------------|---------------|
| S&P 5% | LSTM-N | 4.86 | G(STD) | 5.11 |
| Nikkei 5%| LSTM-STD | 4.58 | AP(SSTD) | 4.91 |
| DAX 5% | CNN-STD | 5.42 | E(SSTD) | 6.03 |
  • 神经网络模型与多种GARCH变体竞争,其中LSTM及CNN模型在预测精度和风险覆盖方面表现不逊色于最优GARCH模型。


结论与未来方向 [page::10]

  • LSTM结合偏态学生t分布框架为金融收益率分布预测提供精确且校准良好的工具,优于传统统计模型;

- CNN模型在计算效率上具有优势,适合高频场景;
  • 未来关注Transformer架构、量化交易策略开发、多资产类别扩展和敏感性分析。


深度阅读

金融回报概率分布预测深度神经网络研究报告详尽解析



---

1. 元数据与概览



报告标题: Forecasting Probability Distributions of Financial Returns with Deep Neural Networks
作者: Jakub Michan´ków
发布机构: TripleSun(波兰克拉科夫)
日期: 未标明具体发布日期,但包含2025年文献引用,推断为2024年前后
主题: 金融市场中股票收益率的概率分布预测,深度学习方法应用于风险管理和投资组合管理,比较深度神经网络和传统计量经济模型的预测能力。

核心论点:
本报告通过构建基于深度神经网络的概率分布预测模型(包含1D卷积神经网络CNN和长短期记忆网络LSTM架构),预测金融市场的收益率分布参数(包括正态分布、学生t分布、偏态学生t分布三种分布),并将模型性能与传统的GARCH家族模型进行多指标比较,尤其关注风险计量(VaR)效果。研究发现,LSTM配合偏态学生t分布在多个评价指标上表现最佳,成功捕捉收益序列的重尾与分布偏斜特征,表现出深度神经网络在金融回报分布预测及风险评估上的竞争力与实用性。[page::0,1]

---

2. 逐节深度解读



2.1 摘要与引言


  • 摘要指出,研究利用1D CNN和LSTM分别拟合正态、学生t及带偏态学生t分布,通过自定义负对数似然函数(Negative Log-Likelihood,NLL)直接优化分布参数,针对六大主要股票指数进行检验,结果显示神经网络表现优异并且在VaR估计中优于传统GARCH方法,特别是LSTM搭配偏态学生t分布能够较好反映收益的非对称和重尾特性。[page::0]
  • 引言中强调金融回报预测应超越点预测,转向完整分布建模以精准捕捉不确定性结构。传统计量经济学模型对复杂非线性关系和时间变化的波动率建模往往显得有限,而深度学习具备模式识别与序列处理优势,可直接对条件分布参数进行估计,满足风险管理尤其是VaR和ES等需求。[page::0]
  • 研究问题聚焦于深度神经网络能否准确预测股票收益分布、这些预测能否用于风险评估、以及是否优于经典GARCH模型。研究贡献在于首创结合负对数似然自定义损失函数,针对不同分布结构,使用CNN和LSTM实现端到端分布参数预测。[page::0]


2.2 文献综述


  • 本节详述概率深度学习理论基础(Murphy等),能源市场中分布式神经网络已有成功案例(Nowotarski & Weron等),以及金融市场中的动态模型、密度组合与分位回归方法。评估手段采用严格的概率预报评分规则(Gneiting & Raftery,Jordan等),并结合卷积及样条函数方法拓展评估工具箱。此背景支持本文方法论的理论牢固性与应用合理性。[page::1]


2.3 方法论



2.3.1 概率预测框架


  • 通过条件均值$\mu(xt)$和条件波动率$\sigma(xt)$构造时间依赖的金融回报模型:

$$rt = \mu(xt) + \varepsilont, \quad \varepsilont = \sigma(xt) zt, \quad zt | xt \sim D(\eta(xt))$$
其中$D$为所假设的分布类型,参数为时间依赖的$\eta(x
t)$。采用三种分布族:标准正态(N)、学生t(St)、与偏态学生t(sSt),后者允许随时间变化的自由度$\nu$和偏度$\xi$。这种结构体现出模型可以灵活捕捉波动率聚集和非对称分布特性。[page::1,2]

2.3.2 分布参数化


  • 正态分布基础概率密度函数形式给出,参数为均值$\mu$和方差$\sigma^2$。

- 学生t分布引入自由度$\nu$适应金融数据重尾特征,概率密度含Gamma函数,适配收益的厚尾性质。
  • 偏态学生t分布通过额外的偏度参数$\xi>0$($\xi=1$为对称)捕捉金融收益的偏斜,使用Heaviside函数实现分段概率加权,进而调整期望和方差表达式,体现均值偏离模式、方差调整机制。[page::1,2]


2.3.3 损失函数设计


  • 针对三种分布分别设计对应的负对数似然损失函数,直接对分布参数进行端到端优化:

- 正态分布NLL含常数项、方差惩罚及平方误差项,典型的最大似然估计形式。
- 学生t分布NLL调整了Gamma函数项,并对自由度$\nu$参数进行估计,捕捉厚尾特性。
- 偏态学生t分布NLL则包含偏度变量,并通过Heaviside函数区分正负尾部概率,为复杂非对称分布建模提供依据。[page::2,3]

2.3.4 神经网络结构


  • 1D CNN架构为:单卷积层(256过滤器,核大小2),后接池化层(池大小2)和展平层,注重捕捉局部模式,计算效率高。

图1展示该结构,输入为序列收益及GARCH估计波动率,输出为偏态学生t分布参数$\mu,\sigma^2,\nu,\xi$。
  • LSTM架构包含三层LSTM单元(128、64、32神经元)递减排列,擅长长序列依赖建模,捕捉时间序列的长期动态。

- 输出层均为全连接层,对应目标分布参数数量。
此设计兼顾了模型表达能力和计算效率,适用于不同预测任务需求。[page::3]

2.3.5 评估指标


  • 对数预测分数(LPS)定义为负对数似然,用以衡量预测分布对观测值的拟合程度。

- 连续排列概率分数(CRPS)衡量预测CDF与实际观察值间距离(积分平方误差),是评分规则中公认严谨的概率预报指标。
  • 概率积分变换(PIT)是模型校准的关键指标,理想情况下PIT值为均匀分布,偏离代表预测分布与真实分布不符。

- VaR与ES定义及检验遵循金融风险管理标准,并采用Kupiec和Christoffersen统计测试对预测准确度进行验证,涵盖5%与1%置信区间的风险估计,用于准确性和独立性检验。[page::3,4]

2.4 数据与实验设计


  • 数据覆盖6个全球主要股票指数,时间跨度2000至2021年,共2487个预测点,数据预处理为对数收益。

- 使用滑动步长扩展窗口,初始训练窗口约4年(1008交易日),验证集占训练集33%,测试集长度504日。
  • 预测基于最近10个回报序列(序列长度10),训练每轮300个epochs,以早停策略保留最佳模型权重。模型参数调优结合手工设定与自动KerasTuner,实现网络层数、神经元数、正则化、优化器及学习率等多项超参数的最优配置。[page::4,5]


2.5 结果分析



2.5.1 概率分布预测性能


  • 表2多指数结果显示,LSTM配合偏态学生t分布(LSTM-SSTD)在Log Predictive Score(LPS)和CRPS均获得最低值,即最佳准确性能。例如,S&P 500的LPS从CNN-N的1.282降至LSTM-SSTD的1.193,CRPS也相应下降,表明对分布尾部和非对称性的建模更有效。

- PIT校准检验中,LSTM-SSTD模型多项指标P值高于显著性阈值,显示出良好的概率分布一致性;相较之下,正态分布模型校准较差,无法满足风险预警需求。
  • 图2展示DAX指数的PIT值直方图,LSTM-SSTD呈近似均匀分布,进一步验证校准优良。[page::5,6]


2.5.2 Value-at-Risk(VaR)表现


  • 表3中,5%和1%置信水平的VaR超额频率均接近理论值,许多配置满足Kupiec和Christoffersen测试,体现模型在风险极端事件预测中的可靠性。

- LSTM-STD和CNN-STD模型在多个指数表现优异,特别是5%VaR的超额率维持在理论附近,显示出风险水平的准确把控。
  • 图3、4分别展示六大指数VaR趋势及超额事件,模型能在重大市场危机(2008金融危机、欧洲债务危机、COVID-19疫情)期间准确捕获风险峰值,体现出风险管理的有效性与稳定性。[page::6,7,8]


2.5.3 详细指标举例(S&P500 LSTM模型)


  • 表4综合评估LSTM在三种分布上的表现,LSTM-SSTD获得最低LPS(1.193)和CRPS(0.509),PIT的p值提升至0.031,显示出最优校准与拟合能力。

- VaR超额次数和比例均贴近理论5%和1%,多数统计检验未被拒绝,且偏态学生t分布在期望短缺(ES)检验中展现更好适应性。
  • 普通正态分布在部分检验中被拒绝,强调分布假设对模型性能的显著影响。[page::9]


2.5.4 与传统GARCH模型比较


  • 表5比较神经网络最佳配置与经典GARCH及其变体(如AP-GARCH、EGARCH、GJR-GARCH)在不同指数上5%、1% VaR超额率。

- 深度模型超额率与GARCH模型相近甚至略优,反映出深度神经网络具备捕捉非线性和复杂波动结构的能力,并在风险估计上不逊色传统模型。
  • LSTM-STD与CNN-STD在大多数指数与置信水平下表现尤为出色。说明现代机器学习模型为金融时序风险管理提供了强有力补充或替代方案。[page::9,10]


---

3. 图表与表格深度解读



3.1 图1(第3页):1D CNN模型架构示意图


  • 展示从输入的收益序列$(r{1:t})$和外生波动率序列$(\sigma^{GKYZ}{1:t})$进入256个卷积核卷积、池化到展平的流程,最终输出偏态学生t分布参数$(\mu{t+1}, \sigma^2{t+1}, \nu{t+1}, \xi{t+1})$。

- 该图清晰传达CNN特征提取的层级结构和参数预测的目标输出,有助理解模型如何结合输入序列局部信息预测未来分布参数。
  • 该架构强调对短序列内收益模式的挖掘,适合挖掘局部非线性依赖。[page::3]


---

3.2 表2(第5页):分布预测评估结果表


  • 对比不同模型(CNN和LSTM)及分布假设(Normal, Student’s t, skewed Student’s t)在六大指数上的LPS、CRPS和PIT p值。

- 关键趋势是LSTM-SSTD在多数指标及指数中均为最优,尤其S&P500:LPS从1.282(CNN-N)降至1.193(LSTM-SSTD),CRPS相似下降趋势,PIT p值从几乎零升至0.1144,体现模型校准与预测精准度均显著提升。
  • LSTM模型整体优于CNN,偏态学生t分布优于其他分布,强调模型架构和分布设定两者对预测性能的关键影响。

- PIT p值高表明预测分布与真分布接近,提升风险估计的信赖度。[page::5]

---

3.3 图2(第6页):DAX指数PIT值分布直方图


  • 三个子图分别展示LSTM-SSTD、LSTM-N和CNN-N下PIT分布。

- 理想情况下PIT应接近均匀分布,LSTM-SSTD图形近似平坦,多数区间频率均匀;LSTM-N呈峰态,CNN-N则在尾部有明显不均,表明偏态学生t和LSTM模型更具良好预测校准。
  • PIT直观体现预测分布的置信可靠性,是深度模型优势的直观证明。[page::6]


---

3.4 表3(第6页):VaR超额率统计表


  • 统计神经网络方法在5%和1%VaR置信水平下在多个指数的超额频次及其符合Kupiec、Christoffersen测试的情况(以*符号标注)。

- 超额率多接近理论5%和1%水平,且普遍通过统计检测,反映模型在实际风险计量中准确抓住极端事件概率。
  • 比如S&P 500在CNN-SSTD中5%超额5.30%、1%超额0.88%,符合统计假设,说明模型风险控制稳定。[page::6]


---

3.5 图3与图4(第7至8页):VaR预测时序图


  • 展示6个指数(S&P 500、Nikkei 225、DAX、WIG、KOSPI、BOVESPA)在测试期内的实际收益与5%、1% VaR预测,绿色和红色线代表对应VaR界限,颜色点代表超额点。

- 视觉上反映模型对于重大风险事件(例如2020年疫情引起的市场剧烈波动)具有敏感捕捉能力,超额点多聚集在风险剧增阶段,验证模型的风险预警功能。
  • 同时,超额点数量分布合理,符合统计意义的预期,增强采用深度学习模型进行风险监控的信心。[page::7,8]


---

3.6 表4(第9页):S&P 500上LSTM模型三种分布详细指标


  • 显示LPS、CRPS、PIT p值、VaR超额次数及比例、Kupiec检验、Christoffersen检验和ES检验等多指标,呈现不同分布对模型预测效果的细分影响。

- LSTM-SSTD在各项分类指标中表现最优,PIT p值由近乎零升至0.031,VaR超额比例更贴近理论值,ES检验亦显著改善。
  • 结构化整合多项性能指标,可全方位验证模型的分布拟合及风险预测能力。

- 普通正态分布虽便捷,但难以覆盖复杂金融时序的尾部与偏斜属性,制约其风险管理实用性。[page::9]

---

3.7 表5(第9页):深度学习与不同GARCH模型VaR表现比较


  • 列出5%和1%VaR水平下,最佳神经网络模型与对应最佳GARCH家族模型(普通GARCH、AP-GARCH、EGARCH、GJR-GARCH,不同分布设定)超额率对比。

- 大多数情况下,神经网络的超额率与最优GARCH模型差距极小,甚至有所优越,表明神经网络能有效捕捉波动异质性与非对称分布特征。
  • 体现深度学习方法是可行且强有力的替代方案,特别是在处理高频或非线性复杂金融数据时具有优势。[page::9,10]


---

4. 估值分析



本报告专题为风险预测工具方法学评估,无传统意义上的公司估值部分,不涉及市盈率、DCF等估值模型。报告核心为概率分布预测准确率和风险管理指标(VaR、ES)的统计检验,采用自定义负对数似然等概率评分函数衡量模型优劣。

---

5. 风险因素评估


  • 报告中虽未专门独立列明风险因素,但隐含讨论的风险点包括:

- 深度学习模型计算复杂度远高于传统模型,潜在的计算资源和训练时间成本。
- 在市场大幅波动或极端事件频发时,深度模型存在过拟合风险,可能影响泛化能力。
- 数据特征变化(非平稳)及模型超参数选择对预测结果均有显著影响,配置失误或不完整训练使模型表现下滑。
  • 报告建议通过严格的交叉验证、早停机制、超参数调优等方式缓解上述风险。[page::4,10]


---

6. 审慎视角与细微差别


  • 偏见风险:作者对深度学习模型持积极态度,着重强调其优点,可能忽视部分市场条件下模型表现不稳定的风险。

- 假设局限:研究采用单变量收益序列模型,未考虑多资产间相关性与高维特征,限制模型适用范围。
  • 模型解释性:相比GARCH等经济计量模型,深度神经网络的“黑箱”性质可能降低政策制定与监管过程中的可解释性。

- 实验局限:主要数据集中于股票指数,对其他资产类别(如债券、外汇、大宗商品)适用性尚待验证。
  • 综上,尽管结果鼓舞人心,未来需关注模型稳健性、多元资产扩展及解释性增强。[page::10]


---

7. 结论性综合



本研究成功构建并验证了结合深度神经网络(CNN及LSTM)与概率分布预测(正态、学生t及偏态学生t)的金融收益率分布预测框架。经六大全球股票指数实证检验,LSTM与偏态学生t分布的结合不仅在对数预测分数、连续排列概率分数等指标上实现最佳表现,也在概率积分变换校准及VaR风险预测中展现出优异稳定性。

关键发现包括:
  • 分布假设重要性:引入偏态学生t分布提升了模型对重尾及分布偏斜特征的适应能力,显著改善风险计量准确性。

- 模型架构优势:LSTM因具备长期记忆机制表现优于CNN,突出序列依赖性在金融时间序列建模中的重要性。
  • 风险管理适用性:VaR超额与统计检验表明模型可用于实际风险控制,且结果与传统GARCH模型不分伯仲甚至更优,显示深度神经网络技术是未来金融风险评估的重要工具。

- 计算与泛化:尽管深度模型计算成本较高,适当正则化和参数调优可辅助避免过拟合。未来可拓展至Transformer等高级架构,进一步提升性能。

从图表中深入洞察:
  • PIT直方图确认了不同模型的概率预测校准水平,偏态学生t与LSTM表现出更为均匀分布,贴近理论假设,体现模型的风险识别与调整能力。

- VaR时序图直观展现模型在市场危机期间对极端风险事件的有效捕捉与风险动态调节,保证风险管理的时效性与准确性。

总体,本文立场明确推荐基于LSTM与偏态学生t分布的深度学习模型作为金融收益率分布预测和风险管理的先进方法,具备广泛的应用前景和未来研究潜力。[page::0-10]

---

总结性提示: 本分析基于报告原文内容,客观呈现各部分逻辑和数据信息,重点披露模型架构、概率分布假设、损失函数设计、评价指标与实证结果,确保系统的风险建模性能评价。对复杂概率模型和深度神经网络方法进行了通俗且严谨的剖析,支持金融领域专业用户深入理解该研究贡献及应用价值。

报告