Multivariate Quadratic Hawkes Processes – Part II: Non-Parametric Empirical Calibration
创建于 更新于
摘要
本报告提出了一种基于矩方法的非参数校准方法,针对多变量二次Hawkes(MQHawkes)过程的粗粒度MQGARCH近似模型,实现了对市场自反馈及交叉反馈机制的分步估计。实证研究覆盖多对期货合约及S&P500单只股票,发现了自反馈主导的波动内生性、多种交叉趋势反馈及协方差反馈效应,同时验证了指数因子对个股残差波动的重要影响。校准结果揭示市场行为的复杂动态结构和长期记忆特性,为高频数据的多资产波动建模提供了全新视角和方法论支撑 [page::0][page::1][page::4][page::5][page::6][page::7][page::8][page::9][page::10][page::12][page::14]。
速读内容
研究背景与目标 [page::0][page::1]
- MQHawkes是多变量二次Hawkes过程,建模资产价格跳变活动强度,具备捕获反馈回路能力。
- 由于标的市场的复杂性和数据特性,提出了基于矩方法的非参数分步校准方案,先估计自反馈,再逐步引入交叉效应。
- 减少数据噪声与维度,通过对一对资产(如e-mini与tbond)的双变量模型示范校准,为多资产建模提供基础。
数据与预处理 [page::2][page::3][page::4]
- 样本包含6个期货合约(如e-mini、nasdaq、crude oil等)与317只S&P500股票,区间2013–2023年。
- 预处理步骤包括波动归一化和“martingalisation”,消除波动日内季节性与回报线性自相关。
- 1分钟频率日志收益率和波动率用于模型校准。
MQARCH模型及非参数矩方法校准原理 [page::2][page::4][page::5]
- MQARCH作为MQHawkes的离散时间粗粒度近似,波动率视为强度的代理,适应1分钟分桶数据。
- 校准过程基于时序协方差统计量(包括二阶和三阶),构建包含线性、二次与跨资产反馈内核的线性方程组。
- 协方差结构包含:
- $\mathcal{C}{ij}(\tau)$:波动率与滞后平方收益协方差
- $\mathcal{D}{ij}(\tau1,\tau2)$及跨项$\mathcal{D}{\times j}(\tau1,\tau2)$:三阶相关,捕捉趋势性反馈
- $\mathcal{V}{ij}(\tau)$:波动率与滞后收益协方差,用于识别杠杆效应
校准方法及策略设计 [page::5][page::7][page::8][page::9]
- 四步校准流程:
1. 估计每个资产单变量自反馈核(线性与二次)。
2. 估计交叉反馈的线性与二次核。
3. 基于前两步调整后估计跨协方差反馈核。
4. 利用含杠杆效应的原始数据估计杠杆内核。
- 采用矩方法非参数估计内核形态,并辅以最大似然验证。
关键实证发现——期货对校准 [page::6][page::8][page::9][page::10][page::40][page::41][page::42]
- 多数期货显示自反馈强且接近系统临界,表明高波动性内生成分显著。
- 发现显著的自Zumbach趋势反馈,及值得关注的交叉Zumbach效应,E-mini指数对其他资产趋势反馈尤为突出。
- 识别了跨资产协方差反馈影响,如e-mini与tbond之间的复杂反馈关系。
- 明确了杠杆效应,尤以e-mini负回报提升自身及其他期货波动为特征。

多期货对个股残差的1因子大规模校准 [page::12][page::13][page::14][page::43]
- 构建1因子MQARCH模型,分离市场因子(e-mini)与个股残差,分析各自及相互的波动反馈机制。
- 结果显示股票残差波动自反馈机制强且近临界,呈长记忆幂律衰减。
- 市场因子波动和负向回报显著影响个股残差波动,杠杆负反馈尤其稳定。
- 各产业板块反馈内核存在差异,房地产与公用事业行业反馈最显著。
模型验证与方法论贡献 [page::17][page::18][page::20][page::21][page::22][page::23]
- 合成数据上验证了MQGARCH矩方法估计的有效性及稳定性,优于采样率受限时的QHawkes直接估计。
- 提供详细高维Yule-Walker方程矩阵构造,确保估计的数值稳定与解释清晰。
- 构建了参数最大似然方法作为矩方法结果的补充,提升估计精度。
总结与展望 [page::14][page::15]
- 本文成功将多变量二次Hawkes复杂反馈机制通过非参数方法分步校准,揭示了金融市场高频波动多层次反馈特征。
- 未来工作可望进一步扩展多因子框架,探索行业间相互作用和更丰富的多资产动态建模。
- 同时,使用同步tick数据的直接MQHawkes校准及日频率数据分析也具潜力深化理解市场内生机制。
深度阅读
多变量二次Hawkes过程——第二部分:非参数经验校准(详尽分析)
本文是关于多变量二次Hawkes(MQHawkes)过程的第二部分研究,重点在于模型的非参数经验校准。作者提出了一种基于矩方法的非参数校准方法,旨在克服逐笔数据的固有难题,逐步校准“自反馈”和“交叉反馈”内核,并将模型简化为双变量校准以确保数值稳定。本文以E-mini期货和T-bond国债期货的对比作为案例研究,拓展到股票和其他期货合约,提出了若干新的市场反馈效应,最终构建并校准了适用于大规模股票市场的因子模型。
---
1. 元数据与报告概览
- 标题:Multivariate Quadratic Hawkes Processes – Part II: Non-Parametric Empirical Calibration
- 作者:Cecilia Aubrun,Michael Benzaquen,Jean-Philippe Bouchaud
- 发布机构:巴黎理工大学经济物理与复杂系统主席、Capital Fund Management等
- 日期:2025年9月26日
- 主题:多变量二次Hawkes过程(MQHawkes)的非参数校准方法及其在金融市场,特别是期货和单只股票波动率动态中的应用。
核心论点与目标信息:
作者主要阐述了如何利用矩方法对MQHawkes模型进行非参数校准,克服金融市场高频数据数量庞大以及噪声多的困难,稳定获取反馈内核。该方法设计成分步进行,优先校准自反馈,再逐步纳入交叉影响,保障数值稳定。研究首次明确识别出跨资产的Zumbach效应和基于联动实现协方差的反馈机制,还发现资产间的交叉杠杆效应。最终,结合单因子模型,对大规模股票市场也能实现有效校准。
---
2. 逐节深度解读
I. 引言与研究动机
- Hawkes过程源于地震研究,因其解释事件自激和互激的通用性被引入金融市场高频数据分析。[1,2]
- 之前研究定义了多变量二次Hawkes模型(MQHawkes),但其复杂性使得实证校准十分困难。
- 校准方法可分参数化(如极大似然,EM算法)和非参数化(矩方法,Wiener-Hopf方法等)两类,后者更灵活但计算复杂。
- 本文采用非参数矩方法,基于对值的“粗粒化”,绕过高频tick-by-tick数据的挑战,先核心校准自反馈,再纳入交叉作用。
- 关键创新点还包括区分了线性反馈(带符号的影响)和二次反馈(无符号)。
II. MQHawkes与MQARCH模型框架
A. MQHawkes模型定义
- Hawkes过程定点强度公式:
\[
\lambdat = \lambda\infty + \int{-\infty}^t \phi(t-u) dNu
\]
其中,必须满足内生率 \(n = \int \phi < 1\) 保证稳态。
- 在QHawkes中,事件不仅依赖于历史事件,更涉及价格涨跌符号的矩阵反馈:
\[
\lambdat = \lambda\infty + \int{-\infty}^t L(t-s) dPs + \iint{-\infty}^t K(t-s, t-u) dPs dPu,
\]
\(L(\cdot)\)捕捉杠杆效应,二次核K体现路径依赖,含时间对角和非对角部分。
- 多资产扩展:
\[
\lambda{i,t} = \lambda{i,\infty} + \sum{j=1}^N \int{-\infty}^t Lj^i(t-s) dPs^j + \sum{j \leq k} \iint{-\infty}^t K{jk}^i(t-s, t-u) dPs^j dPu^k,
\]
分别描述自反馈和交叉反馈。
- 强调忽略三资产不同(i,j,k均异),简化为两个资产间的校准组合。
B. MQARCH模型(粗粒化版本)
- 将连续点过程的强度 \(\lambdat\) 近似为周期内(如1分钟)波动率平方除以时间长度:
\[
\frac{\sigmat^{(\Delta t)^2}}{\Delta t} \to \lambdat \quad (\Delta t \to 0).
\]
- MQARCH 以离散时间模型形式描述两个资产时间序列的波动率动态:
\[
\sigma{i,t}^2 = \sigma{i,\infty}^2 + \sumj \sum\tau Lj^i(\tau) r{j,t-\tau} + \sumj \sum\tau \phij^i(\tau) r{j,t-\tau}^2 + \text{二次(非对角)} + \text{协方差反馈项} + \ldots,
\]
其中\(r{i,t} = \sigma{i,t} \xi{i,t}\), \(\xi{i,t}\)为独立噪声。
- 该粗粒化模型适配1分钟的离散观测数据,有利于实际金融数据的校准。
III. 数据介绍与预处理
- 数据集包括2013-2023年6个期货合约(E-mini、E-mini-3、纳斯达克、道琼斯、原油、国债期货TBond)和317只标普500成分股。
- 预处理分两步:
1. 归一化:去除波动率的日内季节性,标准化波动率时序,确保平稳。本质是用过去100交易日的波动率均值对每分钟波动率和收益率加以调整。
2. “马丁格尔化”:由于1分钟收益率中存在弱自相关,进行条件期望移除,确保收益率无马丁格尔偏置,即无条件可预测性,以满足模型基础假设。
- 图1展示未处理前后对E-mini和TBond期货的日内波动率轮廓调整,去除了开盘和收盘时的高波动影响。
IV. 校准方法
- 采用非参数矩方法,利用不同的协方差结构和三阶及更高阶矩的协方差函数构建线性方程系统,用于反演内核函数。
- 由于不同反馈内核及协方差结构数量庞大且尺度相差悬殊,设计了分阶段校准策略以保障数值稳定:
1. 先估计自反馈(单资产、一元核)
2. 再纳入交叉反馈(跨资产)
3. 最后估计交叉协方差反馈及交叉杠杆效应
4. 利用完整数据集恢复杠杆核
- 关键协方差结构包括:
- \(\mathcal{C}{ij}(\tau) = E[\sigmai^2 r{j,t-\tau}^2] - E[\sigmai^2]E[rj^2]\),对应波动率与滞后平方收益的协方差。
- \(\mathcal{D}{ij}(\tau1, \tau2) = E[(\sigmai^2 - \langle \sigmai^2 \rangle) r{j,t-\tau1} r{j,t-\tau2}]\),三阶关联。
- \(\mathcal{D}{\times j}(\tau1, \tau2)\),涉及跨资产协方差反馈。
- \(\mathcal{V}{ij}(\tau) = E[\sigmai^2 r{j,t-\tau}]\),捕捉杠杆效应。
- 通过对以上协方差结构利用幂律指数等函数平滑减少噪声,提高估计精度。
---
3. 图表深度解读
图1(第4页)
- 内容:展示E-mini和TBond期货的内日1分钟波动率平方均值,横轴为交易时间(10:00-15:00),明显展示了开盘与收盘时段的波动峰值。
- 趋势分析:原波动率存在典型的日内U形或J形模式,明确说明为何需归一化以去除季节性。
- 支持文本:图形证明了归一化步骤的必要性,提升了模型稳定性和校准质量。[page::4]
图2(第6页)
- 内容:E-mini与T-bond的两点相关函数\(\mathcal{C}
- 趋势分析:平稳存在长程相关性,拟合函数为幂律乘以指数衰减,说明波动率集群效应持续时间较长。
- 支持文本:验证了模型假定的内核函数存在长尾形态,为Zumbach效应提供实证基础。[page::6]
图3(第6页)
- 内容:三点相关函数 \(\mathcal{D}{\times j}\) 时间对角(\(\tau1 = \tau2\))展示,反映资产间协方差与未来波动率的关系。
- 趋势分析:负值且缓慢衰减,表示当历史协方差偏离均值(如更负相关)时,未来波动率有明显反应,说明飞向质量期的风险溢价动态。
- 支持文本:支持新发现的基于实现协方差的反馈类型,区别于传统自激效应。[page::6]
图4(第6页)
- 内容:三点相关矩阵 \(\mathcal{D}{ij}\) 最大特征向量及其指数拟合,解释二次内核的主导方向。
- 趋势分析:特征向量指数衰减表明趋势反馈(Zumbach效应)具有明确的时序结构。
- 关联文本:“马丁格尔化”使得这些特征更为明显,免除噪音影响,确保稳健估计。[page::6]
图5(第7页)
- 内容:二点相关函数 \(\mathcal{V}_{ij}(\tau)\),捕捉波动率与过去收益间的相关,体现杠杆效应。
- 趋势分析:E-mini负收益对自波动率有强烈负反馈,且该效应传递至T-bond,反映风险溢出。
- 关联文本:确认了跨资产杠杆反馈的实证存在,并说明其异方差性质及跨资产影响方向。[page::7]
图6(第8页)
- 内容:对E-mini与TBond对的线性核、二次核及协方差核的估计结果,分四部分展示:线性内核(对数-对数刻度)、二次内核的秩一近似(对数刻度)、杠杆内核、以及相关协方差反馈核。
- 分析:
- 线性内核显示自反馈核幅度大于交叉反馈,衰减平滑,符合长期依赖。
- 二次Zumbach内核显示趋势反馈,且交叉影响不容忽视,表明资产间趋势传染。
- 杠杆内核负值对应价格下跌导致波动率上升,但TBond对E-mini杠杆表现为弱正,可能是负相关导致的溢出效应。
- 实现协方差反馈核揭示了新的反馈路径,当过去协方差异常扩大时,会分别影响两个资产的未来波动率,体现复杂的交互反馈。[page::8-9]
图7(第10-11页)
- 内容:期货对全体系二维内核的范数热图,涵盖线性核、Zumbach核、杠杆核及交叉协方差核,用颜色编码反馈强度和方向。
- 分析:
- 对角元素显著,说明自反馈主导系统内生性,且系统接近临界状态。
- E-mini作为主要引发者,对其他期货有强烈影响,尤其Zumbach趋势反馈突出,佐证市场指数驱动其他资产波动的结论。
- 协方差反馈对E-mini和E-mini-3尤其显著,说明期限结构未来波动性高度耦合。
- 股票指数与商品、债券间显示负相关反馈,且多数为降低对方波动率的趋势,符合市场避险假设。[page::10-11]
图8(第14页)
- 内容:股票残差动态内核平均曲线及跨股票的横截面波动,展示残差波动自反馈和市场波动影响。
- 分析:
- 残差波动自反馈核总体接近1(强内生性),呈现幂律衰减,说明残差波动记忆长且跨股票表现均匀,有普适性。
- 市场因子(E-mini)对残差波动的影响显著,部分行业如金融、房地产等表现更强。
- 交叉趋势反馈较弱但存在,表现为指数趋势自因子传递给个股残差。
- 杠杆反馈有所分歧,但市场因子负收益对残差波动的负反馈稳定,暗示市场整体风险溢价影响广泛。[page::14]
图9(第14页)
- 内容:市场因子(E-mini)至个股残差的杠杆效应核,表现负指数衰减。
- 意义:清晰体现了市场回撤对个股残差波动的放大作用,补充先前关于杠杆效应的理论实证。[page::14]
---
4. 估值分析
本研究未涉及直接的估值分析,主要围绕过程参数的估计及内核形态刻画开展。通过非参数矩方法构建线性方程组反求内核函数,结合最大似然估计进行校准优化,实证应用更侧重模型特性和反馈效应识别,而非资产定价估值。
---
5. 风险因素评估
- 校准过程中面临的风险主要源于:
- 高频数据的庞大规模和噪声干扰(如买卖价差跳动引发的回归效应)。
- 参数估计中估计协方差矩阵可能受尾厚分布影响导致不稳定。
- 由于现实市场活动高频率与时间分辨率的矛盾,单笔事件建模(Hawkes)在1分钟数据上存在偏差,需用MQARCH模型粗粒化近似。
- 交叉反馈较弱且误差大,可能带来模型误差和解释局限。
- 缓解措施:
- 采用“马丁格尔化”消除小范围自相关和噪声。
- 利用平滑函数拟合协方差矩阵,有效抑制波动。
- 采取分步校准策略,降低交叉影响估计误差。
- 在最大似然估计时使用矩方法估计结果作为初值,加速收敛与稳定性。
---
6. 批判性视角与细微差别
- 内核估计偏差:正如附录A所示,Hawkes模型在高频且事件密集的情况下,基于聚合数据的协方差矩估计存在系统性偏差,导致参数偏误。采用MQARCH模型虽能缓解,但仍需谨慎解读估计结果。
- 参数识别挑战:多变量高维度参数众多,尤其交叉核函数数量大且幅度小,分辨信噪比极低,可能导致过拟合或误报,需要在实际应用中评估稳健性。
- 模型简化限制:为稳定起见,忽略三资产以上交叉影响假设较强,未来多资产高维内核估计仍需扩展。
- 时间尺度适用性:模型侧重于1分钟数据,与杠杆效应等可能更显著于日尺度有一定偏差,提示未来可探索多时间尺度模型。
- 残差模型假设:单因子分解残差假设零相关也简化了实际行业及风格因子对冲影响,未来多因子拓展是必要方向。
- 内核平滑拟合形式:虽然采用指数与幂律函数平滑,可能未覆盖全部复杂动态模式,需考虑更灵活的非参数形态。
---
7. 结论性综合
本文成功提出并验证了一种多步骤非参数矩方法,用以在高频聚合数据上校准多变量二次Hawkes过程的离散近似模型MQARCH。研究具体贡献包括:
- 方法创新:
- 利用矩方法对粗粒化的QGARCH模型进行稳定校准,有效避免传统Hawkes模型数据密集和噪声导致的偏误。
- 设计四步递进式校准策略,先重点识别自反馈,随后纳入交叉反馈与杠杆效应,确保模型识别的可行性和稳健性。
- 引入“马丁格尔化”方法,剔除收益率可预测成分,符合模型涨跌符号假设。
- 实证发现:
- 自反馈效应为期货及股票市场波动率最显著驱动,内生性接近临界状态。
- 实证首次明确识别出交叉Zumbach效应及不同资产间基于实现协方差的二次反馈效应。
- 股票市场残差波动率内生性强烈,且市场因子的波动和下跌对其有明显负向影响,支持因子与残差耦合的实证结论。
- 跨资产的杠杆效应亦被确认,且展现出显著的方向性和时序特征。
- 图表数据洞察:
- 图2和图3展现了长程的幂律衰减与协方差反馈,反映波动率记忆机制。
- 图6和图7揭示了期货之间自反馈与交叉反馈的层次和幅值差异,确认E-mini的市场中心地位。
- 图8-9和图18-21呈现了股票残差波动率内核和市场因子对其的重要调节作用。
- 未来展望:
- 拓展多因子模型,纳入行业及风格因子,提升拟合与解释能力。
- 探索更高维度及多时间尺度下的MQHawkes直接校准方法。
- 结合最大似然方法,提升参数估计精细度。
整体而言,本文既提供了MQHawkes和MQARCH模型实证校准的创新方法论,也为理解金融市场波动率的多变量动态反馈机制造就了实证基础,对金融市场微结构与风险管理研究具有重要推动意义。[page::0,1,2,3,4,5,6,7,8,9,10,11,12,13,14]
---
补充说明:方法论与附录理解
- 矩方法与Yule-Walker方程:文章通过构造包括自回归协方差和三阶协方差的矩阵方程,反演未知冲击反馈函数(核函数),并利用矩估计的优点实现非参数化估计。
- 分步校准程序细节:
1. 利用对称数据(收益反号数据与其映射)消除杠杆效应,仅估计线性及二次核。
2. 先估计单资产自反馈内核,确保数值稳定。
3. 加入交叉反馈内核。
4. 回归原始数据,引入杠杆效应核估计。
- 附录A所示仿真实验:对比矩方法在Hawkes和GARCH两类模型的校准稳定性,指出GARCH模型在高频且事件密集时更为鲁棒,支持本文对MQARCH采用的合理性。
- 附录C至F详尽描述了内核与观测矩之间的计算关系与矩阵系统搭建,确保多资产多内核复杂模型的算法落地。
- 最大似然优化:矩方法结果作为初值,可进一步用MLE细化,兼顾非参数与参数估计优势。
---
本报告综合了全文各章节观点、数据与图表,详细解读了模型定义、协方差结构设计、非参数矩方法校准程序,及实证应用发现,既揭示了多变量金融市场波动率反馈的微观机制,也提供了可操作的校准框架。