`

Deep Learning in the Sequence Space

创建于 更新于

摘要

本论文提出了一种基于深度学习的新算法,用于在序列空间中逼近动态随机经济的功能理性预期均衡。通过将经合状态用外生冲击的截断历史替代,并设计保证预测政策函数单调凹性的神经网络结构,显著提升了数值求解的稳定性和效率。方法在随机经济增长模型、带有多重风险的重叠世代经济及异质家庭异质企业模型中均获得高精度结果,且均衡条件误差均低于0.1%。此外,该算法利用内生格点法简化训练过程,支持跨状态和异质性的复杂模型求解 [page::0][page::1][page::2][page::43]。

速读内容


全局深度学习算法实现动态随机经济均衡求解 [page::0][page::6]

  • 利用截断的 aggregate 冲击历史替代传统的状态变量表示,将动态经济模型中的均衡函数映射构造为深度神经网络输入输出。

- 证明了在满足遍历性和状态影响衰减条件下,历史截断长度足够时截断误差趋于零。
  • 训练神经网络优化欧拉方程误差,采用 ADAM 优化器迭代更新参数。


算法在 Brock-Mirman 随机增长模型中的验证与表现 [page::5][page::12][page::13]


  • 使用长度为100的创新冲击历史作为输入,网络输出为储蓄率并确保在(0,1)区间。

- 训练中损失函数稳定下降至10^{-8} 级别,均衡条件隐式相对消费误差均低于0.005%,最高不到0.025%。
  • 神经网络拟合的政策函数与经典网格法解高度一致,最高相对误差:0.015%。


复杂重叠世代模型的应用与训练细节 [page::13][page::18][page::20]

  • 建立含72代生命周期和两资产市场(资本和债券)的经济模型,考虑调节成本、市场清算以及带有灾难状态的混合 AR(1) 过程。

- 输入扩展为三个维度的冲击历史序列(TFP创新、资本折旧创新和状态转换),长度为144。
  • 采取分步骤训练策略:先固定债券为零,仅训练资本储蓄函数;预训练债券价格函数,逐步增加债券供应完成全模型训练。

- 精度验证显示,最差99.9%误差低于0.32%,均值误差约0.03%,保持全状态空间高准确度。


异质家庭与异质企业模型及形状保序算子学习 [page::20][page::28][page::34]

  • 模型中同时包含异质企业和异质家庭,面临未保险的个体风险和总体现实波动。

- 提出形状保序算子学习方法,将截断冲击历史映射到满足单调性、凹性约束的政策函数上,有效保证经济直觉和数学性质。
  • 使用局部线性插值和分步构造保证消费函数对财富的单调递增且凹,借助内生格点法和牛顿法稳健推导消费政策和股价。

- 流程分五步训练:从简化参数和贴现因子开始,逐步转向完整模型参数和均衡。
  • 在无封闭解情况下,验证各方均衡条件误差极低,如企业相对边际成本误差均值低于0.07%,99.9%低于0.4%。

- 家庭最优条件误差99.9%低于0.4%,股价预测平均误差在0.17%以内。




均衡策略与模型统计分析 [page::41][page::42]

  • 企业资本分布和股息政策随状态波动明显,存在非负股息约束和调整成本导致的政策折点。

- 家庭消费函数随财富单调递增并凹,边际消费倾向均为递减且界于0与1之间,严格满足借贷约束。
  • 该形状保序参数化架构提高了模型拟合的经济合理性和拟合精度。




结论 [page::43]

  • 利用序列空间截断历史及深度神经网络联合参数化,实现动态随机经济全局均衡的高精度求解。

- 形状保序算子学习保障关键资产-政策函数性质,有效提升算法稳健性,兼容复杂异质性和多风险冲击的模型。
  • 实证案例涵盖经典随机增长模型、带生命周期的重叠世代模型及异质家庭企业复杂模型,全模型均衡条件误差均控制极低,验证了方法的普适性和鲁棒性。

深度阅读

深度解读报告:《Deep Learning in the Sequence Space》



---

1. 元数据与概览



标题:Deep Learning in the Sequence Space
作者:Marlon Azinovic-Yang(北卡罗来纳大学教堂山分校)、Jan Zemlicka(苏黎世大学及瑞士金融研究院)
发布日期:初版2025年9月9日,最新版2025年9月16日
主题:利用深度神经网络解决动态随机经济中的功能性理性预期均衡,尤其在序列空间(sequence space)中。涵盖随机增长模型、重叠世代模型及包含异质家庭与企业的复杂经济体系。
关键词:深度学习、异质企业、异质家庭、重叠世代、深度神经网络、全局解法、生命周期、偶尔约束。
JEL分类:C61(优化方法)、C63(计算方法)、C68(金融计量评估方法)、D52(个人资产与财富)、E32(财政经济学:货币与价格体系)

核心论点与贡献
  • 提出了一种基于截断的外生冲击历史(序列空间)作为经济状态表示,运用深度神经网络拟合动态随机经济均衡的全局解法。

- 设计了具备单调性和凹性限制的神经网络结构,实现对经济模型中政策函数的形态约束。
  • 结合内生网格方法(Endogenous Grid Method,Carroll, 2006),增强训练稳定性和监督学习能力。

- 成功应用于三个复杂程度逐渐增加的经济模型,展示了方法的准确性和适用范围。
  • 该文为首次实现完整市场不完备且包含家庭和企业异质的经济模型的全局解法。[page::0,1]


---

2. 逐节深度解读



2.1 引言与方法概览(章节1)


  • 关键内容

利用一个经济系统的遍历性质(ergodicity),将经济的历史状态用有限长度的过去冲击序列近似,避免全分布的高维困境。深度神经网络被用来拟合从这些截断的冲击历史到均衡变量的映射,优化目标是在模拟的经济样本路径上满足均衡条件(如伊拉姆方程、第一阶条件与市场清算条件)。
  • 逻辑与假设

通过遍历性质,截断历史能接近完整状态,误差随截断长度增加而指数衰减。深度学习的普适逼近能力以及缓解维数灾难的潜质,使其成为解决高维均衡问题的理想工具。
  • 独特视角

与传统基于状态空间(state-space)方法不同,采用序列空间(sequence-space)输入,形象地将经济状态编码为冲击时间序列,相较于抓取分布或其矩特征更具灵活与普适性。[page::0,1,2]

---

2.2 文献回顾(章节2)


  • 该方法起源于Chien等(2011)和Lee(2025)的序列截断方法,但本报告的方法更加通用,克服了前者对强持久性的限制及后者处理高维连续冲击的瓶颈。

- 与线性序列空间 Jacobian方法(Auclert et al., 2021)等局部方法相比,本方法为全局方法,适用更大冲击,代价是计算时间更长。
  • 深度学习在经济动态问题中的应用已有先例:如Duffy和McNelis(2001)、Azinovic等(2022)等。本报告在此基础上提出了带形态约束的神经网络结构,进一步提高精度和稳定性。[page::3,4,5]


---

2.3 算法介绍与第一个应用:随机增长模型(章节3)


  • 模型

经典的Brock-Mirman(1972)随机增长模型,代表性家庭拥有资本积累、生产受TFP冲击影响。
  • 算法核心

神经网络$\mathcal{N}\rho$以截断历史冲击序列(例如$\epsilon{t-T}, \dots, \epsilont$)作为输入,预测下一期资本存量政策函数。尽管截断会引入误差,但因模型的乘积份额$\alpha<1$,该误差以$\alpha^T$的速率指数衰减,使足够长截断长度$T$能保证逼近精度。
  • 损失函数

以Euler方程重排后的相对消费误差的均方误差为训练目标,利用自动微分梯度下降方法(Adam优化器)进行训练。
  • 训练细节

包含输入层、3层隐藏层共128个神经元单元,激活函数为GELU,输出层使用Sigmoid确保储蓄率在(0,1)区间,并用高斯-埃尔米特积分估算条件期望。
  • 结果

训练过程显示损失值持续下降至小于$10^{-8}$,模型通过与标准网格法对比,政策函数误差低于0.005%,与Euler条件误差一致,验证了模型的高准确度。[page::5,6,7,8,9,10,11,12,13]

---

2.4 应用于复杂的重叠世代模型(章节4)


  • 模型亮点

模拟72代不同年龄家庭,配置资本和无风险债券,面临标普资本租金波动、资本折旧率与生产率的随机性及两状态马尔可夫灾难状态转换。
  • 状态变量

包括TFP,资本折旧率,灾难状态指标,以及年龄分布资产组合$\mu
t$。
  • 神经网络结构

输入为三类冲击的历史序列(政权状态、生产率冲击、资本折旧创新),以三层720神经元的Dense网络构建,输出为各年龄组的资本和债券政策函数及债券价格,网络设计中融合市场清算约束。
  • 训练与步骤

采用分步训练流程:先假定债券供给为零求资本政策,随后训练债券价格函数,再逐步增加债券供给直至目标值,最后整体联合训练。
  • 精度

均衡条件误差平均不足0.03%,90和99.9百分位低于0.1%和0.32%,同时模拟结果表现出预期的生命周期储蓄和消费模式,灾难冲击对老年家庭消费影响最大,体现了对模型特性良好拟合。[page::13,14,15,16,17,18,19,20]

---

2.5 应用于含异质家庭与异质企业的模型(章节5)


  • 模型特征

- 异质家庭和企业,且两端个体均受不可保险的微观冲击影响。
- 企业采用规模递减生产技术,面临资本调整成本、非负红利限制以及不确定生产率和波动率,且资本和劳动投入各有异质性。
- 家庭通过持有股票投资于企业,面临劳动力收入和股票价格双重风险。
  • 状态空间表示

包括不确定性状态指标、总体生产率、以及基于直方图的企业资本与生产率分布$\mut^F$及家庭财富和收入分布$\mut^H$。
  • 关键技术创新

1. Operator Learning:将政策函数表达为从整体状态(截断冲击序列)映射至对应于某个$id$的函数,从而将高维拟合问题分解为“从整体状态到函数”与“从微观状态到政策选择”的两阶段。
2. 形态约束的神经网络架构:确保消费函数和其他政策函数在微观资产变量上单调且凹性,方便使用内生网格方法增强训练稳定性。
  • 实施细节

- 使用带有单调性、凹性保证的神经网络逐点预测微观政策函数的离散网格值。
- 对企业资本调整和乘数采用特定的指数映射与累积增量法保证非负性与单调性。
- 市场均衡价格采用Newton-Raphson迭代方法求解,结合网络预测提供初值,提升效率与收敛性。
- 通过模拟和高斯-埃尔米特积分评估期望算子,利用KKT条件误差、费舍-伯恩斯坦函数误差衡量残差。
  • 训练流程

五步渐进策略,从简化模型(只企业端,固定贴现因子)训练起,预训练价格与家庭政策,再同时训练全模型,逐渐恢复完整参数配置。
  • 超参数

- 冲击历史截断长度300,输入层600节点,隐藏层为3层1024神经元,学习率$10^{-6}$,批量128,训练轮数包含初始至500轮不等。
  • 精度评估

- 企业政策Euler误差平均<0.07%,90百分位<0.16%,99.9百分位<0.4%,非负红利约束KKT误差也非常低。
- 家庭消费政策误差平均<0.08%,99.9百分位<0.4%。
- 价格函数误差平均约0.17%,且在整体状态空间拟合良好。
  • 均衡政策分析

- 企业资本分布显示明显异质,政策行为包含对不同生产率和资本水平的非线性调整及约束激活。
- 家庭消费政策在财富和生产率维度均表现出平滑且受形态约束保证的单调凹特性,体现了生命周期及风险性行为特征。[page::20-42]

---

3. 图表深度解读



图1(第12页,训练损失收敛曲线)


  • 说明:神经网络训练时,均方误差损失函数$\ell$随着训练episode的增加显著下降,最终稳定于$10^{-8}$量级以下,表明模型训练收敛且误差低。

- 联系文本:支持算法对随机增长模型策略函数高精度拟合的论断。[page::12]


---

图2(第13页,误差分布与策略对比)


  • 左面板:Euler条件误差分布,均值低于0.005%,99.9百分位不到0.025%,显示均衡条件满足度极高。

- 中间面板:神经网络预测的下一期资本与标准网格法计算结果重合,验证拟合准确性。
  • 右面板:策略误差分布,与隐式误差量级匹配,说明使用Euler误差作为近似误差指标合理。

- 联系文本:验证深度学习方法对经典模型的精度和有效性。


---

图3(第17页,生命周期劳动力效率)


  • 描述:展示效率单位劳动力随年龄变化,从20岁到60岁增长,60岁后急剧下降并持平,仿真实际生命周期劳动供给曲线。

- 联系文本:体现了OLG模型中劳动收入的现实性设定。


---

图4(第20页,OLG模型误差与状态分布)


  • 左面板:资本和债券的Euler方程残差按年龄段分布,误差均值约为0.03%,99.9百分位未超过0.32%,显示高精度求解。

- 中间面板:资产分布随年龄变化,符合生命周期储蓄行为及约束,年轻时借贷受限,老年后积蓄消耗。
  • 右面板:消费水平按灾难状态划分,灾难状态下老年消费显著降低,符合经济直觉。

- 联系文本:说明算法能够处理复杂交叉扰动、多资产及不完备市场环境。


---

图5(第39页,企业均衡条件误差)


  • 左面板:企业Euler方程相对误差,平均误差低且随资本量变化,部分状态下有小幅波动,反映企业约束与资本调整非线性。

- 右面板:费舍-伯恩斯坦函数KKT剩余误差,除极低资本水平外误差接近零,体现函数精度和约束满足良好。
  • 联系文本:说明神经网络对企业端复杂非线性问题求解能力强。



---

图6(第40页,家庭最优性条件误差)


  • 单一面板:消费政策的相对误差分布,均值、90%及99.9%百分位皆低于0.4%,验证了政策函数拟合的准确性。

- 联系文本:说明其内生网格法结合形态约束网络有助于拟合家庭行为精度。


---

图7(第41页,股票价格拟合误差)


  • 左面板:相对价格误差分布,均值0.17%,99.9百分位低于0.8%,略高于政策函数误差。

- 右面板:神经网络预测的股票价格对比用Newton法求解的市场清算价格,两者高度一致,表明价格函数拟合效果好。
  • 联系文本:验证价格函数虽稍逊于其他政策函数,但整体仍保有高精度。



---

图8(第42页,企业分布及政策函数)


  • 左面板:不同经济状态下企业资本分布的密度函数,显示分布形态多样。

- 中间面板:不同资本水平和生产率水平下企业的股利支付,表现为两段非线性结构,分别对应股利约束解除和资本调整方向切换。
  • 右面板:对应非负股利约束的KKT乘子,资本较低时低生产率企业限制更强。

- 联系文本:反映模型对企业动态决策的成功捕捉及约束激活。


---

图9(第42页,家庭消费函数与边际消费倾向)


  • 左/中面板:不同生产率和财富水平下家庭消费函数,表现为一致的单调凹性,体现生命周期储蓄消费结构。

- 右面板:对应的边际消费倾向随财富递减,凸显借贷约束与风险分散需求。
  • 联系文本:形态约束神经网络确保重要经济特征的严格满足并增强估计精度。



---

4. 估值分析



本报告核心为动态随机一般均衡模型求解算法和应用展示,不涉及估值定价的传统意义的目标价等内容。资产定价出现在第三个经济示例中,“股票价格”函数$\pi^p$的拟合中,利用深度学习结合内生网格法和牛顿法求解市场均衡价格,确保价格满足资产市场的均衡条件。
  • 价格函数拟合参数通过神经网络映射截断冲击历史至价格值,采用多节点高斯-埃尔米特积分评估预期。

- 训练中将价格函数纳入整体损失函数,与企业和家庭策略函数一致对齐。
  • 使用牛顿法结合内生网格法,快速高效求解市场均衡价格。

- 误差评估显示价格预测平均误差约0.17%,高于策略函数但仍属高精度水平,未发现显著拟合不足。
  • 进一步验证资产需求在预测价格基础下误差极低,体现估值模型内部一致性和平衡状态。


综上,报告中资产价格函数估值采用深度神经网络泛函近似,结合纯数值求解无回归指标估值,未涉及传统金融机构意义上的估值目标价。 [page::33-41]

---

5. 风险因素评估



报告中的风险因素主要源于模型本身包含的多种不确定性:
  • 宏观冲击风险:包括生产率冲击、折旧率冲击、股利约束下的资金流动波动,且有灾难事件的马尔可夫转移,表现为截断冲击历史的长记忆(导致高维输入)。

- 微观异质性风险:企业层面的异质生产率按马尔可夫链演变,家庭面临不可保保险的劳动力收入风险,体现逆转和溢出效应。
  • 数值逼近风险:截断历史存在固有误差,但报告详细论证误差随截断长度指数减小,截断长度设置在300,保证精度。

- 模型参数不确定风险:训练中采用分阶段策略缓慢推进参数至最终配置,有效降低训练振荡和不收敛风险。
  • 算法自身风险:训练基于随机采样,存在过拟合和梯度波动风险,但通过仿真路径采样持续生成新数据集,输入分布固定避免输入分布漂移,实现训练鲁棒性。

- 可解释性风险:深度学习方法黑盒特性,作者通过形态约束增加模型经济意义和解释力,缓解此风险。

报告通过设置误差量化指标和多层训练策略,结合经济学性质诱导、网络架构设计等措施,有效抵消上述风险,保证了稳健性。[page::2,3,5,9,18,31,36]

---

6. 批判性视角与细微差别


  • 数据依赖性:神经网络训练依赖大量模拟数据,面对真实经济数据集成或模型校准存在实际挑战。

- 截断长度与计算成本:截断历史长度设置较大(最高300),导致输入维度高,计算资源需求大,可能在更复杂模型中雪上加霜。
  • 形态约束的局限:报告形态约束主要保证单调和凹性,且确保离散网格铺设上的性质,面对多维资产或状态时,多变量形态约束更复杂,可能影响泛化性能。

- 模型一般性假设:依赖遍历性质和冲击过程的平稳性质,对非常规经济波动、非平稳冲击分布可能适用受限。
  • 训练收敛性与超参数敏感性:报告超参数选择明确,但对不同模型设定的适应性与鲁棒性缺乏涉及。

- 算法对政策解释的透明度:深度学习虽实现高精度拟合,但因黑盒特性,政策函数形态虽约束但其经济学解释和政策启示仍需结合传统经济分析方式审视。

总体,报告方法先进且在学术模型内效果显著,但实际经济复杂性与算法规模带来的挑战需后续继续关注和优化。[page::2,3,37]

---

7. 结论性综合



本报告提出了一种创新深度学习算法,将动态随机经济中均衡解表述为截断的冲击历史映射问题,并在该“序列空间”中训练深度神经网络逼近政策和价格函数。通过三层次示例:
  1. 随机增长模型――经典模型验证了方法的高准确度与快速收敛性能,政策误差与均衡条件误差极低,表明深度学习能有效解决标准宏观动态编程问题。

2. 复杂重叠世代模型――充分体现了序列空间方法在高维、寿命跨期结构以及多资产和多种类型冲击下的适用性,精度保持高水平,深刻模拟生命周期储蓄和消费行为变化。
  1. 异质家庭与企业模型――最复杂案例,结合异质性、资本调整成本与非线性约束,首次实现了这类模型的全局高精度解,形态约束神经网络保证了政策函数经济学意义上的单调及凹性,采用内生网格和牛顿法等经典方法辅助,提高训练稳定性和效率。


图表细致展现了训练进程、误差分布、政策函数行为及其对经济状态的依赖,均衡条件误差极低,充分体现算法的数值精准与经济合理性。通过创新性的“形态约束运算符学习”框架,本报告为高维异质动态宏观经济模型求解提供了强大工具。

整体而言,报告不仅推进了理论上的动态随机均衡求解方法,同时对复杂经济模型的实际计算拓展具有重要指导意义和应用价值。[page::0-43]

---

参考文献



报告提供了详尽的相关文献综述,涵盖序列空间方法、深度学习经济模型求解、形态约束动态规划方法、内生网格法及多种应用背景,为本研究打下坚实学术基础。[page::44]

---

总结



该报告系统地介绍并验证了基于截断冲击历史序列的深度神经网络全局解法,及其形态约束网络架构设计,推动了现代计算经济学中求解动态一般均衡模型的边界。报告技术严谨,论据充分,结果令人信服。对学术界及实践中复杂经济模型求解有极强借鉴价值。

如需对具体图表或章节内容进行更深入讨论,欢迎继续咨询。

报告