`

TIME DEEP GRADIENT FLOW METHOD FOR PRICING AMERICAN OPTIONS

创建于 更新于

摘要

本研究基于神经网络技术,提出并扩展了Time Deep Gradient Flow (TDGF) 方法以高效求解多维美式期权定价问题,涵盖Black–Scholes与Heston模型,最高支持五维资产标的。通过构建自由边界偏微分方程的能量最小化问题,设计专门采样策略和网络架构,实验证明TDGF相较于Deep Galerkin Method (DGM)在训练速度上更优,且均显著优于传统蒙特卡洛方法,精度与计算效率兼顾 [page::0][page::4][page::6][page::7][page::8]。

速读内容


研究背景与方法概述 [page::0][page::1]

  • 美式期权的早期行权特性引入自由边界偏微分方程(PDE)问题,传统数值方法难以高效处理高维定价。

- 本文提出基于神经网络的Time Deep Gradient Flow (TDGF)方法,扩展至五维资产的Black–Scholes和Heston模型。
  • 将PDE转化为分时刻能量最小化问题,通过深度神经网络拟合期权价格函数,限制训练样本至期权价值高于内在值的区域。


美式期权相关数学模型与PDE系统 [page::1][page::2][page::3][page::4]

  • 详细定义了美式期权价格满足的变分不等式及自由边界PDE形式。

- 给出多维Black–Scholes模型下资产价格的几何布朗运动及其生成算子形式。
  • 介绍多维Heston模型及其波动率随机演变过程,及对应生成算子表达形式。


TDGF方法扩展与训练流程 [page::4][page::5]

  • 时间离散化后,将PDE转为能量泛函最小化,采用蒙特卡洛积分近似并利用深度神经网络参数化近似解。

- 设计了含跳跃连接和门控结构的神经网络架构,采用双激活函数保证价格在内在值下界之上。
  • 训练时只在满足条件区域进行蒙特卡洛采样和梯度下降,使用Adam优化算法,样本生成考虑多维结构。


采样策略优化 [page::6]

  • 针对多维资产,提出基于“盒子划分”的分区采样方法,有效解决均匀采样导致样本在边界稀疏的问题。

- 实验中分别针对Black–Scholes和Heston模型,采用不同的采样区间和采样密度调整,以提升训练效果。
  • 图示采样的moneyness分布直方图和盒子划分示意,验证采样设计的合理性。





数值结果与性能比较 [page::7][page::8]


| 模型 | Black-Scholes d=2 | Black-Scholes d=5 | Heston d=2 | Heston d=5 |
|--------------------|-------------------|-------------------|------------|------------|
| DGM训练时间(秒) | 8293 | 16174 | 17997 | 41718 |
| TDGF训练时间(秒) | 4543 | 6583 | 7138 | 12881 |
| MC计算耗时(秒) | 4.6 ~ 6.6 | 4.5 ~ 6.6 | 6.0 ~ 6.6 | 6.6 |
| DGM计算时间(秒) | 0.0015 ~ 0.0024 | 0.0015 ~ 0.0016 | 0.0015 ~ 0.0016 | 0.0017 |
| TDGF计算时间(秒) | 0.0017 ~ 0.0018 | 0.0016 ~ 0.0017 | 0.0016 ~ 0.0017 | 0.0017 |
  • TDGF训练相比DGM更快,且两者均远优于蒙特卡洛方法。

- 两种神经网络方法均在不同维度和模型下取得准确结果,价格-行权价差与Longstaff–Schwartz蒙特卡洛方法高度一致。

定价精度对比图示 [page::8][page::9][page::10][page::11]

  • 各模型二维及五维设置下,TDGF与DGM相较蒙特卡洛的价格差分布趋势高度重合,验证了方法有效性。

- 时间维度上选择多时点观察,均显示方法稳定准确。





深度阅读

金融研究报告详尽分析报告



---

一、元数据与概览



报告标题: Time Deep Gradient Flow Method for Pricing American Options
作者: Jasper Rou
发布机构: Delft Institute of Applied Mathematics, EEMCS, TU Delft
发布日期: 至少2024年,具体时间未知(引用文献到2024年)
研究主题: 采用基于神经网络的高维方法(TDGF和DGM)定价多维美式期权,聚焦于Black-Scholes模型和Heston模型,维度最高可达5。

核心论点: 作者扩展了Time Deep Gradient Flow (TDGF)方法以适用于带自由边界的偏微分方程(PDE),这是美式期权定价中的核心问题。通过精心设计采样策略,TDGF和Deep Galerkin Method (DGM)在准确性和计算速度上均优于传统蒙特卡洛方法。特别地,TDGF训练期间的速度明显优于DGM。

目标与贡献:
  • 拓展TDGF方法至美式期权的自由边界PDE问题

- 与DGM进行对比,验证两者对美式看跌期权定价问题的准确性和效率
  • 在多资产情形(最多5维)下进行实证研究

- 设计有效的训练采样方法,提升模型表现

[page::0]

---

二、逐节深度解读



2.1 摘要与引言


  • 摘要明确阐述研究内容:利用神经网络方法解决多维美式看跌期权定价问题,涉及Black-Scholes及Heston模型。

- 引言介绍了美式期权定价的难点:早期行权权利使问题复杂化,需要解决自由边界PDE特性。
  • 传统方法介绍了包括Cox-Ross-Rubinstein二叉树模型、数值PDE方法、多网格迭代方法和蒙特卡洛路径回归方法。

- 深度学习最新发展也予以总结,引用若干经典文献,突出深度方法在高维定价问题中的潜力。
  • 本文贡献聚焦于扩展和性能评估TDGF方法与DGM在美式期权及多维问题上的表现。


[page::0]

---

2.2 问题公式化(第2节)


  • 2.1 美式期权及系统不等式:

- 定义$d$维资产价格向量$\mathbf{S}$,及其美式期权的价值函数$u(t, \mathbf{x})$。
- $u$ 必须满足一套变分不等式:
\[
\frac{\partial u}{\partial t} + \mathcal{A}u + ru \geq 0,\quad u(t,\mathbf{x}) \geq \Psi(\mathbf{x}), \quad \text{互补条件:}\left(\frac{\partial u}{\partial t} + \mathcal{A}u + ru\right)(u-\Psi)=0
\]
- $\mathcal{A}$为二阶偏微分算子,表达为$\mathcal{A}u = -\sum a^{ij}\partial{xi xj}u + \sum \beta^{i}\partial{xi}u$,具体系数由基础资产动态决定。
  • 2.2 Black-Scholes多维模型

- 资产价格服从相关的几何布朗运动。
- Brownian运动之间存在相关系数矩阵。
- 算子具体表达式包含漂移项和扩散项,包括交叉二阶导数,表示资产间相关性的影响。
  • 2.3 Heston多维模型

- 引入随机波动率过程$V
i(t)$,波动率本身服从均值回复扩散过程。
- 模型更加复杂,涉及两个维度的随机过程($S$, $V$)。
- 引入更多相关系数,用于刻画多资产间及资产-波动率间相关。
- 相应PDE算子变得更为复杂,但仍可写成上述形式。

此节为后续TDGF方法的数学模型基础。明确了要定价的问题属于带自由边界的二维(或更多维)变分不等式问题形式,且具体对应的生成算子$\mathcal{A}$根据不同模型给出。

[page::1,2,4]

---

2.3 TDGF方法扩展及架构设计(第3节)


  • 3.1 TDGF方法说明

- 时间区间$[0,T]$划分为$K$小段,离散时间步长为$h$.
- PDE转化为能量极小化问题,每个时间步通过极小化能量泛函$I^k(u)$获得下一时间步解。
- 该能量泛函包含前后时间步的$L^2$距离项和下一步PDE弱形式相关项。
- 通过神经网络$f^k(\mathbf{x}; \theta)$参数化函数空间,用随机点蒙特卡洛估计积分,并用随机梯度下降优化$L^k(\theta)$。
- 训练时,只在$u > \Psi$(即继续持有区域)部分采样和训练,避免不必要计算。
  • 算法要点简述:

- 初始化参数,
- 针对每个时间步,进行多轮采样和梯度更新,
- 训练中特别筛选满足$u > \Psi$的样本点对损失函数贡献,确保网络满足自由边界限制。
  • 3.2 神经网络结构

- 受DGM启发的循环门控网络结构,层数为3,神经元数为50,使用$tanh$激活函数和softplus激活(保证输出大于零)。
- 网络学习的是“续持价值”(Continuation Value)而非期权价格$u$本身,以自然确保$u \geq \Psi$。
  • 3.3 采样策略

- 统一采样会导致训练样本集中在中间区域,边界区域采样匮乏,影响模型性能。
- 采取分箱蒙特卡洛采样方法,将状态空间划分成多个子区间,各区间均匀采样,确保边界区域充足采样(如19个箱,30个采样点/维度/箱)。
- 对不同模型调整采样区间以适应续持价值不同分布特征(Black-Scholes moneyness区间为$[0.01, 3.0]$,Heston为$[0.01,2.0]$, 波动率$V\in[0.001,0.1]$)。

[page::4,5,6]

---

2.4 数值结果分析(第4节)


  • 4.1 准确性比较

- 使用Longstaff-Schwartz蒙特卡洛方法作为基准比较。
- 图3&4(二维和五维Black-Scholes)以及图5&6(二维和五维Heston)均显示TDGF和DGM结果与蒙特卡洛极为接近,均能准确捕捉续持价值与执行边界。
- 两深度学习方法在不同剩余期限和不同moneyness水平均保持良好拟合。
  • 4.2 计算性能比较

- 表1显示训练时间,TDGF比DGM快,尤其在高维(5维)和Heston复杂模型中表现更优。
- 表2显示每次计算预测时的运行时间,深度学习均远快于传统蒙特卡洛(速度提升数千倍),在实时定价环境合理性强。

[page::7,8,9,10,11]

---

三、图表深度解读



图1 & 图2:采样分布及分箱示意


  • 图1(子图A和B)比较了采样的moneyness直方图。

- 子图A采用统一采样,样本多数集中于moneyness中间,边界采样严重不足。
- 子图B箱划分采样后,样本更均匀覆盖整个区间,尤其增强边界区域训练重要性。
  • 图2展示分箱方式的示意,划分为连续重叠的多个区间,覆盖整个资产价格区间。

- 意义
- 通过更加合理的训练样本分布,网络能够学得更准确的自由边界和续持价值函数,有效防止模型对极端状态估计失真。




---

表1-2:训练时间和计算时间对比



| 方法/模型 | Black-Scholes 2维 | Black-Scholes 5维 | Heston 2维 | Heston 5维 |
|-----------------|-------------------|-------------------|------------|------------|
| 训练时间 (秒) | | | | |
| DGM | 8293 | 16174 | 17997 | 41718 |
| TDGF | 4543 | 6583 | 7138 | 12881 |
| 计算时间 (秒) | | | | |
| MC | 4.6 | 4.5 | 6.0 | 6.6 |
| DGM | 0.0015 | 0.0024 | 0.0015 | 0.0016 |
| TDGF | 0.0018 | 0.0017 | 0.0016 | 0.0017 |
  • 解读

- 训练阶段耗时差异明显,TDGF在所有设置下均显著优于DGM(约提升一倍+),反映了计算复杂度降低。
- 预测阶段(计算时间)两方法相近,都比蒙特卡洛快数千倍,为高频环境的实用提供可能。

---

图3-6:不同模型与维度的价格差异曲线


  • 图3(二维Black-Scholes)和图4(五维Black-Scholes),以及图5(二维Heston)和图6(五维Heston)均分别在四个时间点($t=0.01, 0.34, 0.67, 1.0$)展示了续持价值(期权价格-行权价)的moneyness函数曲线。

- 三种方法MC(蓝线)、DGM(绿线)、TDGF(红线虚线)几乎完全重合,表明深度学习方法的高度准确性。
  • 五维Black-Scholes中的少数时刻红线与蓝线轻微偏离,可能与训练复杂度相关,但整体趋势吻合。

- Heston模型下,TDGF与DGM更接近于MC,验证了方法对复杂随机波动率模型的适用性。






---

四、估值方法解析



本报告的核心估值问题为解决美式期权的自由边界PDE,数学上属于变分不等式问题。传统估值难点包括高维度和自由边界处理。
  • 采用的TDGF方法依赖将PDE时域离散化,基于能量泛函最小化,在每个时间步通过深度神经网络参数化函数空间以拟合续持价值。

- TDGF方法避开了直接求解二阶导数的高成本计算,通过时间递推方式分步逼近,兼顾高维问题的数值稳定性和效率。
  • 估值目标即为求得每个状态及时间的期权价值函数$u$,其满足上述变分不等式。

- 网络设计中利用续持价值分解思想(续持价值 = 期权价值 - 内在价值),为网络提供结构化先验,确保估值合理。
  • 注意到计算过程中网络训练和采样设计恰当处理了自由边界条件($u \geq \Psi$),保证估计的准确性与稳定性。


[page::2,4,5]

---

五、风险因素评估



报告中并未直接设立独立的风险因素评估章节,但从方法和实验设置可推断潜在风险及限制:
  • 高维度采样与训练复杂性

- 复杂的多维状态空间导致采样难题,通过多箱采样缓解,但采样策略设计敏感,可能受限于预设的采样箱和点数。
  • 模型假设和参数选择

- Black-Scholes和Heston模型本身存在假设局限,如市场无摩擦、资产价格服从指定随机过程,实际偏离可能导致定价误差。
  • 神经网络训练随机性

- 训练过程涉及随机初始化和随机梯度下降,结果可能存在方差和不稳定性。
  • 计算资源依赖

- 报告中提到训练使用单GPU高性能计算资源,实际应用需考虑硬件限制。

报告未详细说明如何缓解这些风险,侧重强调方法设计合理且实际运行有效。

[page::4,5,6,7]

---

六、批判性视角与细微差别


  • 报告基于深度学习方法解决高维高复杂度美式期权定价问题,提供了创新思路和实证支持,符合当前金融数学前沿趋势。

- 然而,训练参数选择(如时间步数100、采样数目、网络层数等)较为经验性,缺乏严谨泛化误差分析或收敛证明。
  • 实验中蒙特卡洛作为基准虽然合理,但其自身存在采样误差,未提供精确误差定量分析,难以完全证明深度方法优劣。

- 对Heston模型的PDE算子给出部分公式时存在明显排版错误和断句不清(第3页),该处公式完整性受限,影响理解。
  • 自由边界处理策略尽管有效,但未给出更详细理论支撑或对比,存在方法推广限制。

- 深度方法对超参数敏感,训练时间较长,在实际金融应用场景尤其多资产高频环境下的适用性与稳定性尚需进一步验证。

总体而言,报告在方法创新和实验展示方面表现卓越,但理论统一性和实用细节仍有提升空间。

---

七、结论性综合



本报告系统地研究了基于神经网络的Time Deep Gradient Flow (TDGF)方法,用于解决多维美式看跌期权统一建模下的定价问题。通过数学建模,将美式期权价值问题等价为带自由边界的偏微分变分不等式,并进一步表达为时间递推的能量最小化问题,实现了深度学习框架内的数值求解。

关键成果和洞察包括:
  • 方法创新与扩展:首次成功将TDGF方法扩展到自由边界PDE问题,解决了美式期权定价的核心难题。

- 采样策略优化:引入基于多箱均匀采样,极大提升了训练样本在边界和低概率区域的覆盖,确保神经网络在PDE自由边界区域获得充分训练,提升定价稳定性。
  • 模型性能与准确性:在2维和5维Black-Scholes与Heston模型中均表现出高精度,结果与蒙特卡洛长期受认可的Longstaff-Schwartz方法吻合,验证了神经网络方法的实用性。

- 计算效率显著提升:TDGF训练时间显著低于DGM,且两者推断阶段速度均大幅快于传统蒙特卡洛,彰显深度学习在高维金融定价问题中的潜力。
  • 架构设计合理:采用续持价值和内在价值分解策略,结合特定激活函数,保证估值逻辑和经济学合理性,兼顾数学性质和金融实践需求。


综上,作者立场鲜明,推介TDGF方法特别适合高维、复杂模型下的美式期权定价,并且在保证高精度的同时提升了计算效率。这对资产组合风险管理以及衍生品定价实践具有重要实际价值。

---

参考出处标注



本分析中所有结论均来源于报告相应页码,详见钮句末对应标注:
  • 研究背景与模型定义[page::0,1,2]

- 方法框架及算法细节[page::3,4,5,6]
  • 数值结果及图表[page::6,7,8,9,10,11]

- 批判和总结[page::3,4,5,7]

---

备注



本文结合数学推导、计算方法和金融工程实际案例,对该研究的每个关键组成部分做了详尽分析,特别关注图表和公式的具体含义及其对文本论证的支撑作用,保证专业性和系统性,符合资深金融分析师与报告解构专家标准。

报告