`

高频因子 (九):高频波动中的时间序列信息

创建于 更新于

摘要

本报告围绕高频波动类因子的构建与验证,基于1分钟高频成交量数据,提出差分与波峰计数两种提取时间序列信息的新方法,改进传统波动因子。差分绝对值均值因子与成交量波峰计数因子在全市场表现稳健,后者更能有效捕捉趋势交易者行为,收益和稳定性均优,缩短调仓频率进一步提升表现。因子风格中性后仍保留一定选股能力,适用于多数据频率和品种,揭示局部峰值在高频数据中的重要信息 [page::1][page::4][page::8][page::14][page::20]

速读内容


高频波动因子高频拓展与回测表现 [page::4][page::5]



  • 高频成交量波动因子根据日内分钟K线成交量计算,采用先日内标准差再日间标准差除均值去量纲;

- 全市场年化多空收益20.84%,超额收益6.27%,夏普比2.87,表现优于中证800区间表现;
  • 高频因子捕获了传统日度波动因子未包含的量价波动信息,近两年波动回撤小。


差分提取时间序列信息与差分标准差因子构建 [page::8][page::9]


  • 通过对每笔成交量做差分,提取时间序列的局部峰值信息,弥补标准差仅刻画截面波动的不足;

- 差分标准差因子全市场年化收益24.22%,超额收益3.00%,夏普比1.76,信息比0.51;
  • 近两年回撤明显,尤其在中证800表现波动较大且回撤更震荡。


差分绝对值均值因子的改进及表现提升 [page::11][page::12]


  • 将日内标准差改为差分绝对值均值,避免负向收益波动抵消正向信息;

- 因子年化多空收益34.13%,超额收益7.95%,夏普比2.12,信息比1.10,明显优于差分标准差因子;
  • 对数据频率敏感,15分钟频率表现显著下降。


成交量波峰计数因子及局部峰值识别过程 [page::14][page::15]


  • 局部峰值以“均值+1倍标准差”筛选,再通过时间间隔筛除连续峰值,计数峰值数构造因子;

- 波峰计数因子年化多空收益39.08%,超额收益7.10%,多空夏普比3.41,信息比1.61,稳定性显著优于差分因子;
  • 提示波峰计数识别局部峰值更有效,捕捉趋势或知情交易信息。


关键参数影响及调仓频率优化 [page::16][page::17]

  • 阈值参数(标准差倍数)和最小时间间隔对结果影响有限,参数在1倍标准差、1分钟时间间隔下效果较优;

- 调仓频率缩短至5日使波峰计数因子多空收益率提升至56.65%,夏普比4.33,交易成本可控且提升明显;
  • 差分绝对值均值因子对调仓频率缩短响应较弱。


因子风格暴露及风格中性后表现 [page::17][page::18][page::19]


  • 高频波动因子主要暴露于波动、反转和流动性风格,无明显基本面暴露;

- 风格中性化后超额收益下降明显,但成交量波峰计数因子仍保留正向多空收益能力,表明因子捕获的alpha因子独立于传统风格;
  • 波峰计数因子风格中性后全市场年化多空收益18.45%,超额收益1.62%,夏普比2.04。


深度阅读

高频因子(九):高频波动中的时间序列信息—详尽分析报告



---

1. 元数据与概览



标题: 高频因子(九):高频波动中的时间序列信息
分析师及联系人: 覃川桃、郑起
机构: 长江证券研究所
发布日期: 2020年10月12日
研究主题: 高频波动因子的创新构建、时间序列信息的提取及其在股票市场中的应用,属于金融工程专题报告。

核心论点与目标



本报告重点探讨传统波动因子的高频化以及如何利用时间序列中的信息提升波动因子的选股能力。报告展示了三类高频波动因子:1分钟频率的高频成交量波动因子、差分提取时间序列信息的因子以及基于波峰计数的因子。其中,波峰计数因子在多空收益率、超额收益、夏普比率和信息比等指标上表现最优,并且缩短调仓频率能够进一步提升因子表现。本文旨在表明高频数据中的时间序列信息对因子的预测能力产生积极影响,同时探讨因子构建方法、数据频率、参数选择和风格中性处理对因子效果的影响。

---

2. 逐节深度解读



2.1 报告要点(Page 1)


  • 传统波动因子基于日度收益率数据,本文扩展到高频数据(1分钟),尤其对成交量波动的构造。

- 1分钟频率的高频成交量波动因子在全市场实现年化20.84%多空收益,超额收益6.27%,夏普比2.87,信息比1.62,且近两年无明显回撤。
  • 利用差分处理提取时间序列信息,构建的因子表现出正向收益,区别于传统仅利用截面波动的思路。

- 将差分因子中的标准差改为均值显著提升因子表现,但差分因子对数据频率较敏感,15分钟频率会丧失收益能力。
  • 波峰计数因子简化了局部峰值的识别,表现最佳,缩短调仓周期(5日)带来超额收益的显著提升。

- 风险提示包括模型存在失效风险、历史回测非未来收益保证。[page::1]

2.2 报告目录与图表目录分析(Page 2)



报告结构包括:
  • 波动因子的高频拓展

- 波动因子构建方法比较(日内、日间标准差/均值)
  • 差分提取时间序列信息(差分标准差、差分绝对值均值因子)

- 数据频率影响分析
  • 波峰计数的定义、构建及参数敏感性

- 调仓频率影响
  • 风格中性后的表现分析

- 总结

图表丰富,覆盖回测净值曲线、风险指标和参数敏感性分析,保证论点的实证基础。

2.3 高频成交量波动因子及高频拓展 (Page 4-5)


  • 传统波动因子口径是日度收益率波动,忽略了日内和其他指标的波动特性。本文利用1分钟频率的成交量数据构建高频因子。其计算步骤包括先计算个股每天1分钟成交量的标准差(表示日内波动),用20日标准差衡量日间波动,再除以均值去除量纲。

- 回测中,全市场此因子年化多空收益20.84%,夏普2.87,表现稳健。中证800板块略逊但依然有效。
  • 从分组角度,因子多头和空头强度均衡,区别于传统波动因子中空头较强的特点。

- 年度表现稳定,2014年例外,且在传统波动因子表现不佳的2019和2020年依然有效。
  • 表格1详细说明年度超额收益、信息比、夏普比的变化,进一步佐证表现稳定[page::4][page::5]。


2.4 高频波动因子构建方式解析(Page 6-7)


  • 探讨4种构建方式:(1)直接计算所有分钟数据的标准差/均值;(2)计算日内标准差求均值忽视日间波动;(3)先日内标准差再日间标准差;(4)日内标准差和日间标准差均计算后去量纲(采用的是方式(4))。

- 方式(4)表现最佳,说明同时刻画日内和日间波动是提升因子有效性的关键。
  • 方式(3)和(1)表现接近,去量纲的时点对稳定性影响明显。

- 高频成交量及成交笔数因子随数据频率提高表现优化,1分钟频率最佳,5分钟次之,15分钟表现下滑。振幅因子表现频率曲线为先升后降,噪声影响更大。
  • 表格3、4涵盖了不同因子、不同构建方式及不同数据频率下的收益风险指标,充分体现了高频因子构建的细节重要性。[page::6][page::7]


2.5 差分提取时间序列信息(Page 8-10)


  • 传统标准差因子忽略时间序列顺序信息,图3、4直观体现重新排序后波动不变但信息不同。

- 差分方法:计算每笔成交量之间的差分,再对差分序列计算标准差去量纲,提取时间序列的峰值信息。
  • 回测显示差分标准差因子全市场年化多空收益24.22%,超额收益3%,夏普1.76,信息比0.51,近两年表现回撤明显。

- 组内分组线性较好,全市场空头稍强于多头,近两年回撤主要源于中证800板块,需要注意因子稳定性问题。
  • 差分标准差因子表现为因子值越大未来股票收益越高,与传统低波动效应认知相反,可能刻画趋势交易者或知情交易者的活动。

- 因子构建采用20日均值而非标准差,避免日间波动负收益抵消了因子的正收益能力。[page::8][page::9][page::10]

2.6 差分绝对值均值因子(Page 11-12)


  • 优化差分标准差因子,先对差分序列取绝对值,随后计算均值而非标准差,进一步减少波动抵消正收益的影响。

- 该因子全市场年化多空收益达34.13%,超额收益7.95%,夏普比2.12,信息比1.10,选股能力显著提升。
  • 中证800板块表现较弱但有所改善,多头明显强于空头,提升组内线性。

- 行业内其他数据维度差分绝对均值因子同样表现均优,证明该构造方式具有普适性。
  • 表格6、7详细列出全市场及中证800不同因子表现,验证差分绝对值均值因子优越性。[page::11][page::12]


2.7 数据频率对差分因子的影响(Page 13)


  • 高频波动和差分因子对数据频率非常敏感。

- 1分钟频率下表现最佳,5分钟次之,15分钟以上几乎失效。
  • 每笔成交量差分绝对值均值因子的频率敏感度最低,说明每笔成交量信息含量更高,更稳定。

- 下降原因可能是低频数据平滑掉了局部峰值,噪声也干扰因子效果。
  • 表格8总结不同频率下因子表现,为理解因子适用频率区间提供量化基础。[page::13]


2.8 波峰计数因子的定义与构建(Page 14-15)


  • 差分方法运用全量数据平均可能弱化峰值的特殊性,改用波峰计数提升局部峰值提取效率。

- 波峰定义为超过“均值 + 1倍标准差”的分钟成交量且与前峰间距超过1分钟,解决连续峰值合并问题。
  • 以2020年6月30日浦发银行成交量为例,图9、10直观展示波峰两步筛选过程。

- 回测显示波峰计数因子在全市场年化多空收益达39.08%,超额收益7.10%,夏普3.41,信息比1.61,均优于差分因子。
  • 波峰计数表现稳定,历年多空收益均为正,超额收益偶有轻微回撤。

- 组内线性良好,空头略强于多头。中证800板块表现弱于全市场,有待进一步优化。
  • 表9详细披露年度风险指标。[page::14][page::15]


2.9 相关参数及调仓频率影响(Page 16-17)


  • 参数包括波峰筛选阈值(均值+几倍标准差)和最小时间间隔(分钟数),影响波峰识别苛刻程度。

- 当最小间隔为0时因子失效,说明筛选连续峰值合并很关键;阈值为0倍时筛选过宽也影响表现。
  • 阈值在1或2倍标准差,时间间隔1或5分钟,因子表现均较稳健,参数对因子敏感度不高。

- 调仓频率对因子表现有明显影响,波峰计数因子调仓频率从20降至5日,年化多空收益由39.08%提升到56.65%,超额收益也显著提高,说明该因子信息时效性强,适合高频调仓。
  • 差分绝对值均值因子调仓收益提升不明显,交易成本抵消了调仓频率增加的优势。

- 表10、11详细数据支持上述结论。[page::16][page::17]

2.10 风格暴露与中性化影响(Page 17-19)


  • 通过风格暴露分析,三个高频波动因子主要暴露在波动性风格正向,同时也涉及反转和流动性因子,反映因子侧重于波动和市场活跃度。

- 差分绝对值均值及波峰计数因子对Beta、规模、波动、流动性暴露均为负向,说明选股更加规避高贝塔及大市值股票。
  • 风格中性处理后,因子整体表现下降明显,特别超额收益能力受限,但仍保留多空收益,显示因子选股能力的独立性。

- 波峰计数因子中性后仍保持较强选股能力,年化多空收益18.45%,超额收益1.62%。
  • 年度表现方面,绝大多数年份实现正向多空收益,部分年份因子表现回撤但整体稳健。

- 表12、13、14与图13、14详细呈现风格暴露及中性化后表现。[page::17][page::18][page::19]

---

3. 图表深度解读


  • 图1 & 图2(Page 4): 展示了全市场及中证800高频成交量波动因子回测净值。图中各色线表示分组收益,灰色为基准。可见2015年市场波动期间因子收益急剧上升,整体保持稳步上扬趋势,表明因子对市场阶段性波动和趋势有较好捕捉能力。

- 表1(Page 5): 详细列出年度超额收益、信息比、多空收益和多空夏普比,支撑图1、2的视觉印象。多空夏普比多年保持在2以上,说明收益稳定且风险较小。
  • 表2(Page 5): 系统汇总不同数据类型的高频波动因子相较传统因子的表现,显示高频成交量波动因子在收益及信息比方面对比传统因子有明显优势。

- 图3 & 图4(Page 8): 浦发银行分时成交量原始数据(左)和排序后数据(右)。重新排列未破坏成交量数据的数值和分布,但波动性质被破坏,说明传统标准差等指标无法捕捉时序信息。
  • 图5 & 图6(Page 9): 展示差分标准差因子全年及中证800净值走势,因子表现比高频成交量波动因子更为波动且近两年回撤明显。

- 表5(Page 10): 量化展示差分标准差因子具体年度表现,反映年度收益波动情况。
  • 图7 & 图8(Page 11): 差分绝对值均值因子净值明显上升,图形层级和回报幅度均较图5图6优越,支持该构造对因子表现的提升。

- 表6、7(Page 12): 系统展现差分绝对值均值因子的年度及全市场表现指标,证实选股能力提升。
  • 表8(Page 13): 不同频率下差分绝对值均值因子表现,清晰体现频率敏感度。

- 图9 & 图10(Page 14): 直观展示波峰计数筛选流程,体现因子对峰值的精确识别。
  • 图11 & 图12(Page 15): 波峰计数因子在全市场及中证800的回测表现,净值曲线明显优于差分因子,显示其选股能力和稳定性优势。

- 表9(Page 15): 年度性风险收益指标进一步佐证波峰计数因子多年稳健表现。
  • 表10(Page 16): 参数敏感性分析说明参数选择对因子表现影响有限,验证方法鲁棒性。

- 表11(Page 17): 调仓频率变化对因子表现的定量影响,说明高频调仓对波峰计数因子收益提升显著。
  • 表12(Page 17)、表13(Page 18): 风格暴露及风格中性前后因子表现,给予投资者因子多样化和风险管理策略的参考。

- 图13 & 图14(Page 19): 风格中性后波峰计数因子的净值走势,依然表现稳健。
  • 表14(Page 19): 年度可分解的表现数据,支撑图表观察结论。


整体图表和数据完整且层次清晰,论证逻辑严密。

---

4. 估值分析



本报告未涉及具体的公司估值或股价目标价设定,属于因子研究和回测验证性质,重点在于因子构建方法、回测表现及参数优化。虽没有直接估值分析,但通过因子正向收益能力隐含了其在选股和组合构建中的潜在价值。

---

5. 风险因素评估


  • 模型失效风险: 因子基于历史数据进行构建和回测,未来市场结构和交易行为的变化可能导致因子表现丧失。

- 历史数据的局限性: 套用历史数据回测结果不保证未来收益,存在市场环境和政策风险。
  • 因子稳定性风险: 如差分标准差因子在近两年出现明显回撤,说明特定时间段因子可能失效。

- 频率敏感性风险: 差分因子对数据频率敏感,频率设置不当易导致因子失效。
  • 参数选择风险: 尽管报告对参数敏感性进行了分析,超出测试范围或未来市场波动特征变化,参数可能不再适用。

- 交易成本影响: 高频调仓带来交易费用,需权衡收益提升与成本。
  • 缓解策略: 本报告通过波峰计数法简化数据处理、降低参数灵敏度,并通过调仓频率实验指导实际执行,帮助部分缓解风险。[page::1][page::16]


---

6. 批判性视角与细微差别


  • 正向收益矛盾: 差分因子体现正向收益能力,表明高波动对应高收益,似乎与经典低波动效应相悖。报告对此提出可能原因为因子捕捉了趋势和知情交易行为,而非纯粹波动,解释合理但仍需未来实证确认。

- 中证800表现波动: 多数因子在全市场表现优于中证800,表明大盘股市场环境与全市场不同,可能影响因子普适性。
  • 风格中性显著降效: 风格中性后多因子超额收益下降明显,提示部分收益来源于风格暴露,投资者应注意因子和其他风格因子的相关性。

- 样本期覆盖度: 部分因子因数据限制在2010年以后计算,部分成交笔数数据仅从2017年可用,样本一致性有限。
  • 潜在噪声干扰: 高频振幅因子频率表现起伏较大,说明高频价相关数据噪声较多,构建时需谨慎。

- 交易频率权衡: 虽波峰计数因子缩短调仓频率收益上升明显,但实际操作时交易成本和滑点影响也需充分评估。
  • 需要更多前瞻性验证。


---

7. 结论性综合



本报告系统揭示了传统波动因子高频化的优越性,特别是以1分钟频率的成交量数据为基础构建的高频成交量波动因子,在多空收益、信息比率及夏普率等指标上表现突出。通过创新的时间序列信息提取方法——差分处理及波峰计数,报告实现了对因子选股能力的大幅提升。

其中,差分绝对值均值因子优于差分标准差因子,反映均值替代标准差在去除负向抵消效果中的优势。波峰计数因子作为对局部峰值的简洁有效度量,表现最佳:在全市场实现39.08%年化多空收益,夏普比3.41,信息比1.61,且在调仓频率优化下多空收益可提升至56.65%,超额收益亦显著增强。

图表和风险数据充分支持了论点,波峰计数因子的稳定性和鲁棒性较高,对参数敏感性低,且风格中性处理后仍保留显著的选股能力。

对投资者而言,本报告提供了高频波动因子创新构建及高效信息提取的有效路径,展示了高频数据中深藏的时间序列信息在捕捉趋势交易及知情交易行为中的重要作用。实践中,缩短调仓周期结合波峰计数因子将有效提升投资组合的超额收益。

同时,报告谨慎指出,尽管历史回测数据表现优异,模型存在失效风险,且因子表现受数据频率、参数设置和市场环境影响显著,投资者需结合自身风险偏好合理运用。

总的来看,报告确立了高频成交量波动因子及基于时间序列局部峰值提取的差分和波峰计数因子为未来量化投资研究和策略开发的有力工具,具有重要的理论创新和实务指导价值。[page::20]

---

参考图片示例



以下示例图片均来自报告,协助读者理解因子表现趋势:
  • 高频成交量波动因子回测净值(全市场)


  • 差分标准差因子回测净值(全市场)


  • 差分绝对值均值因子回测净值(全市场)


  • 波峰计数因子回测净值(全市场)


  • 波峰计数因子(风格中性后)回测净值(全市场)



---

综上所述,长江证券研究所的本篇专题报告以翔实的数据和严谨的分析,展示了高频波动因子在时间序列信息挖掘方面的突破与应用,值得金融工程及量化投资从业者深入研究与借鉴。

报告