`

深度学习量价因子超额收益来源一隔夜强有效, 日内弱失效

创建于 更新于

摘要

本报告通过拆解股票日收益率为隔夜收益率与日内收益率,结合深度学习模型对不同收益率段的预测能力,系统分析量价因子超额收益的主要来源。结果显示超额收益主要来自隔夜阶段,日内阶段因子表现弱且呈现反转特征,深度学习模型对隔夜收益率学习能力显著优于日内收益率,且不同指数成分股间表现存在显著差异。研究揭示了量价因子在高频宽基策略中的隔夜有效性及日内失效问题,为量化投资策略优化提供重要参考。[page::1][page::2][page::4][page::6][page::9][page::16]

速读内容


收益率拆解及自相关性分析 [page::4][page::5]


  • 将单日收益率拆分为隔夜收益率(开盘价相较昨收盘价涨跌)和日内收益率(收盘价相较开盘价涨跌)。

- 隔夜与日内收益率呈显著负相关且负相关度随时间上升,日内收益率与完整收益率相关显著高于隔夜收益率。

量价因子收益来源拆解与表现 [page::6][page::7][page::8]


  • 深度学习合成因子多头超额收益主要来源于隔夜阶段的集合竞价,日内阶段因子表现弱且出现反转,空头组日内表现获得大量超额。

- 高频量价因子278个样本均反映隔夜超额收益相关性高达88%,日内超额与隔夜超额呈-79.79%负相关,显示日内多空反转强烈。
  • 策略组合呈明显隔夜上涨日内回撤,净值曲线多头组开盘后多有回撤,反映因子潜在局限。


深度学习模型训练及预测效果对比 [page::9][page::10][page::11]


  • 使用TCN模型分别训练完整收益率、隔夜收益率、日内收益率预测目标,隔夜收益率模型损失函数表现最佳,训练效果明显优于日内。

- 验证集上隔夜收益率预测值RankIC最高约21%,完整收益率约11%,日内收益率仅约4%,表现明显逊色。
  • 测试集相关系数显示隔夜与日内收益率预测值几乎无相关,隔夜收益率预测值与完整收益率预测值相关度仅45.65%。


预测值超额收益拆解与分指数表现 [page::11][page::12][page::14][page::15]


| 分组 | 完整收益率超额(隔夜预测) | 隔夜收益率超额 | 日内收益率超额 |
|-------|----------------------------|----------------|----------------|
| Top | 8.35% | 34.73% | -20.08% |
  • 隔夜预测值虽能取得隔夜阶段高正超额,但同时加剧隔夜上涨日内回撤现象,导致完整收益率超额受限。

- 日内收益率预测值在隔夜和当日均呈现正超额,但幅度较小,单独使用回报有限。
  • 合并隔夜和日内预测值超额略有提升但仍不及完整收益率预测表现。

- 沪深300大市值股票无明显隔夜上涨日内回撤,日内收益率预测有正贡献;中证500中日内收益率预测可提升多头超额。

结论与投资启示 [page::16]

  • 量价因子和深度学习模型对隔夜收益率表现强而有效,日内有效性弱且呈现反转现象。

- 实际策略因子主要获得开盘集合竞价阶段超额,开盘后多出现部分回撤。
  • 不同市值股票池因子表现有显著差异,投资组合构建需关注因子效应时段和标的差异。

- 隔夜收益率的预测值可作为“日内空仓”策略参考,有望规避日内回撤风险。[page::16]

深度阅读

一、元数据与概览


  • 报告标题:《深度学习量价因子超额收益来源一隔夜强有效,日内弱失效》

- 发布机构:长江证券股份有限公司,长江证券研究所
  • 发布日期:2024年6月12日

- 分析师:杨凯杰、覃川桃
  • 研究主题:该报告聚焦于基于深度学习技术构建的量价选股因子的超额收益来源,特别是将股票收益拆解为隔夜收益率和日内收益率两部分,详细分析深度学习模型对这两类收益的预测能力差异,以及相关量价因子在不同时间段的有效性。报告旨在揭示为何隔夜收益率超额收益强而日内收益率超额收益弱的现象,以及该现象在不同市值层次指数中的差异表现。


报告的核心论点是,虽然整体股票日收益的涨跌幅中日内收益率与完整收益率相关性更高,但基于高频量价和深度学习因子的超额收益主要来源于隔夜收益率阶段,即集合竞价时段,开盘后日内阶段的预测能力显著较弱,日内阶段表现出一定程度反转,导致整体策略面临日内部分回撤。深度学习模型对隔夜收益率的学习与预测能力显著优于日内收益率。该发现指示投资者在利用深度学习量价因子进行多日选股时,应关注隔夜收益率的驱动效应,同时也提示了模型设计和应用中的潜在改进空间。

二、逐节深度解读



---

1. 收益率拆解(第4-5页)



关键论点
  • 传统的单日股票收益率可拆分为隔夜收益率(今日开盘价相对于昨日收盘价的涨跌幅)和日内收益率(今日收盘价相对于今日开盘价的涨跌幅)。完整收益率Y按照 \(Y = (Y1 + 1)(Y2 + 1) - 1\) 计算。

- 隔夜收益率和日内收益率之间存在显著负相关(隔夜上涨时日内往往回落),负相关性随着未来时间的延展而增强(未来5日约为-15%,未来20日扩大至-28%)。
  • 日内收益率和完整收益率的相关系数(≈83%)显著高于隔夜收益率与完整收益率的相关系数(≈40%),表明日内涨跌幅对整体表现影响更大,符合其时间占比更长的事实。

- 以上规律不仅在短期内存在,也在未来20日内保持稳定,其中三类收益率各自的自相关性随时间衰减。

数据与图表
  • 表1展示了隔夜收益率、日内收益率及完整收益率5日收益率的自相关性矩阵。

- 图1是20日的相关系数热力图,视觉显示随着时间推移,隔夜收益率和日内收益率强烈负相关的蓝色区域逐渐扩展。

意义解析
隔夜的价格波动往往因市场开盘信息的集中反应和交易限制等因素带来较强冲击,但随后日内交易则出现价格修正或回调,体现市场的反转效应。这为后续因子研究和深度学习模型训练提供了基础框架,说明预测隔夜和日内收益率需要考虑不同的市场动力机制[page::4-5].

---

2. 量价因子收益来源(第5-7页)



关键论点
  • 深度学习“合成因子”多头超额收益主要集中在开盘前的集合竞价(隔夜收益率阶段)。Top组在隔夜收益率段获得的超额收益(27.04%)甚至略高于完整收益率的26.02%,而在日内收益率中几乎无效(多头仅1.09%,且Bottom组获得28.67%的反向收益,即反转显著)。

- 这意味着基于该因子的策略在开盘阶段大赚超额收益,但随后在日内阶段回撤,空头组的正超额收益体现了价格的日内反弹。
  • 由此得出结论:深度学习因子主要捕获开盘前的信息效应,日内阶段预测能力不足。


数据与图表
  • 图2展示了不同收益率区间内因子分组的超额收益表现,红色、灰色、橙色分别表示完整、隔夜和日内收益率超额。

- 图3与图4按日分解超额收益和净值,清晰呈现了“隔夜上涨日内回撤”的周期性波动。Top组净值稳定增长,而Bottom组净值波动剧烈,体现日内明显反转。

意义解析
该现象反映了因子在不同交易时段的有效性差异,解释了为何总体策略表现虽有超额,但日内段往往伴随一定损失。由集合竞价信息占优的因子设计,实则需谨慎对待日内交易策略的开发和应用[page::5-7].

---

3. 高频量价因子普遍现象(第7-8页)



关键论点
  • 基于高频数据(Level1快照、委托单、Level2逐笔交易),构建的278个高频量价因子普遍表现出“隔夜强有效、日内弱失效”现象。

- 表2显示量价因子隔夜超额与完整超额高度正相关(88.16%),同时隔夜超额和日内超额强烈负相关(-79.79%),表明隔夜效应对因子超额贡献主导,日内甚至对多头收益形成负面影响。
  • 该情况与深度学习合成因子一致,表明此类策略在开盘阶段获得核心超额收益,后续日内多策略或多空头组合存在回撤风险。


意义解析
此发现强化了隔夜阶段在量价因子选股中核心的地位,体现了高频市场结构与交易行为特征。对量价因子投资策略的设计、风险控制及交易执行时机提出了具体启示[page::7-8].

---

4. 拆解收益率目标训练与模型表现(第9-13页)



关键论点
  • 采用TCN(时序卷积网络)对未来5日的完整收益率(Y)、隔夜收益率(Y1)、日内收益率(Y2)分别进行预测模型训练,数据集覆盖 2008-2024年。

- 损失函数和RankIC结果显示:
- 模型对隔夜收益率的训练效果最好(损失函数最低接近-0.14,RankIC约21%),表现最优。
- 对完整收益率也具有较好学习能力(损失约-0.07,RankIC约11%),为投资预测的首选目标。
- 对日内收益率的学习能力最弱(损失接近正0.01,RankIC仅4%),训练表现较差。
  • 预测值相关性研究显示隔夜收益率预测值与完整收益率预测值相关度适中,而日内收益率预测值与完整收益率预测值相关性较高,但效果差。隔夜与日内收益率预测值相关性几乎为零。

- 隔夜收益率预测值强化了“隔夜上涨日内回撤”现象;日内收益率预测值表现相对温和,正超额分布于隔夜和日内,其超额收益虽低但方向一致。
  • 尝试将隔夜和日内预测值简单相加以提升效果,但仍不及完整收益率目标模型,表明整体收益率预测仍更符合市场现象。

- 对多头组内部收益率自相关分析发现,选股Top组并非更看重隔夜收益率相关性,而是在隔夜收益中实现方案外超额。

数据与图表
  • 图5-7展示训练过程中验证集损失函数、预测值RankIC及因子间相关系数变化,清晰反映三类模型的训练对比。

- 表4-8大量定量数据支持上述结论,尤其是超额收益拆解与自相关详情。

意义解析
这一节实证说明深度学习模型在市场不同时间段的表现差异根源,验证了因子超额主要源于隔夜阶段。模型难以同时兼顾隔夜与日内因素,提示数据和特征工程优化的方向,同时为投资者构建与使用此类因子提供潜在策略方向(如隔夜强势股票日内空仓策略)。此外,模型训练的随机性和历史数据的时效性构成风险因素[page::9-13].

---

5. 不同指数样本内规律差异(第14-15页)



关键论点
  • 在沪深300大市值股票中,不存在全市场普遍出现的“隔夜上涨日内回撤”现象。隔夜收益和日内收益均获得正超额,意味着大盘股投资组合表现更为平稳正常。

- 按超额收益看,沪深300中隔夜收益率预测值和完整收益率预测值在多头端表现较接近,但隔夜收益率预测值更集中于隔夜阶段,完整收益率预测值日内超额贡献更多。
  • 中证500中,以日内收益率预测目标的模型多头超额超过完整收益率预测值,日内指标对中市值股票具有提升多头预测能力作用。

- 中证1000(小盘股)整体表现与全A市场接近,依然存在隔夜收益率核心贡献的现象。

数据与图表
  • 表9-11分别详细列明沪深300、中证500、中证1000中不同收益率预测目标下分组超额收益表现。


意义解析
小盘股和中盘股的市场行为与大盘股表现具有明显差异,日内收益率的预测在中证500中显示出较好的潜力,暗示不同市值层次应采用差异化的因子设计与模型训练策略,以提升整体选股效率和风险控制[page::14-15].

---

6. 总结(第16页)



报告再次强调拆解收益率的重要性,揭示了隔夜收益率与日内收益率的强负相关及各自与完整收益率的不同关联度。深度学习量价因子及高频量价因子均表现出超额收益主要来自开盘集合竞价阶段,日内段因子无显著预测能力甚至出现反转。模型对隔夜收益率存在高度学习能力,而日内收益率学习较弱。不同市值股票对此现象影响不同,大盘股中日内收益率有效性提升,中盘股日内目标对模型有积极作用。风险提示涵盖模型随机性、市场规律失效及实际交易风险。

三、图表深度解读



---

图1 不同收益率间自相关性矩阵(第5页)


  • 描述:显示隔夜收益率(Y1)、日内收益率(Y2)及完整收益率(Y)的未来1至20日收益率间相关性。

- 趋势:各收益率自相关性随时间拉长逐步下降。隔夜与日内收益率间呈显著负相关(冷色调区域),且负相关性随未来期数增大。日内收益率与完整收益率相关度高且稳定。
  • 解释:该图强化了报告对收益率拆解的理论基础,为隔夜与日内的反转现象提供图形支持。

- 局限:热力图未提供具体数值,分析依赖表1补充数据。

---

图2 不同区间内分组超额收益(第6页)


  • 描述:将深度学习因子按完整收益率、隔夜收益率和日内收益率三个版本分组,显示各分组的超额收益百分比。

- 解释:Top组隔夜超额收益显著,高于完整收益率超额,而日内超额几乎无效且有反转现象(Bottom组获得最大正超额),说明因子对隔夜收益率预测有效,日内收益率无效且逆向。
  • 支持观点:说明因子超额主要来源于集合竞价阶段,日内回撤可能影响实际策略表现。


---

图3、图4 分组分日超额收益及超额净值(第7页)


  • 描述:细分未来5日的隔夜与日内收益率分组表现,超额收益与净值曲线展示多头和空头组的收益波动。

- 解释:多头组净值稳健上升,隔夜累计获得超额,日内基本持平;空头组日内则有显著反转收益,体现了日内上涨抵消隔夜下跌的反转行情。
  • 意义:更直观分析了因子在时间序列上贡献和回撤状况。


---

图5-7 深度模型训练过程图(第10页)


  • 描述:图5为验证集损失函数下降过程,图6为验证集预测值RankIC变化,图7为预测值间相关系数下降过程。

- 解释:图5显示隔夜收益率模型损失最低且稳定,图6隔夜收益率预测值RankIC最高,日内最低,符合预测能力差异。
  • 意义:验证了深度学习模型在不同收益率预测目标下训练效果差异,隔夜收益率表现最优,提示该模型更适合捕捉隔夜的市场信息。


---

表1-11 超额收益及自相关统计


  • 各表丰富呈现了因子与收益率拆解、不同指数样本层面的超额贡献、相关系数和自相关关系,均为报告结论提供扎实的量化依据。

- 例如表5、6对照隔夜和日内预测值生成的超额收益表现,展现两者预期收益和反转的具体情况。

四、估值分析



报告不涉及传统意义上的估值方法,如DCF或市盈率估值。其核心为因子构建及预测能力的研究,故无估值分析内容。

五、风险因素评估



报告提出了三点主要风险:
  1. 模型随机性风险:深度学习TCN结构训练过程包含数据划分差异和随机丢弃机制,造成预测结果具有一定波动和误差。

2. 市场规律失效风险:因模型总结的规律基于历史数据,市场的动态变化可能导致模型规律失效,投资效果下降。
  1. 实际交易风险:日频策略回测理想化,实际交易中滑点、交易成本及市场冲击可能影响策略收益,需谨慎应用。


报告未详述风险缓解策略,但通过多样本、多指标验证及不同指数层次测试间接提升模型稳健性[page::17].

六、批判性视角与细微差别


  • 潜在偏见或假设风险:模型基于历史量价数据训练且因子超额主要来源于隔夜收益,可能高估了集合竞价阶段信息的持久性和重要性,忽视了日内市场的非线性因素。

- 隔夜和日内收益率负相关的根源未完全揭示:报告指出隔夜与日内收益间存在强反转,但未深入机制剖析(如流动性、机构行为等)。
  • 模型未成功联合优化隔夜与日内回报:简单相加隔夜和日内预测值无法优于整体收益率预测,提示模型结构或特征设计的潜在不足。

- 指数层面表现差异提示策略适用性有限:沪深300中无“隔夜上涨日内回撤”现象,表明该策略和因子可能更适合中小市值股票,投资者需考虑市场分层。
  • 缺乏对高频交易成本及执行难度的深入分析


七、结论性综合



本报告深入剖析了深度学习量价因子在股票多日超额收益中的贡献结构,采取收益率拆分框架,将股票单日收益率分为隔夜收益率和日内收益率两部分。通过对比模型训练与预测效果,报告证实了一个显著的市场与模型特征:“隔夜强有效,日内弱失效”——即深度学习因子及高频量价因子的超额收益主要来自开盘前集合竞价的隔夜收益部分,而开盘后日内阶段预测能力下降甚至出现收益反转。核心结论包括:
  • 收益结构与相关性:隔夜收益率和日内收益率呈负相关关系,且隔夜时段所占时间虽短但贡献率高。日内收益率对完整收益率影响更大,但因子捕获信息不足。

- 深度学习模型表现:模型对隔夜收益率的预测具备较强学习能力(最高RankIC约21%),远超对日内收益率的学习效果。整体收益率预测模型效果居中,仍是实际应用首选。
  • 超额收益和反转规律:多头组超额收益主要源于隔夜收益,日内段存在较大回撤风险,空头组利益在日内阶段反转取得正超额。

- 样本市值层次差异:沪深300大盘股未出现明显隔夜上涨日内回撤,日内收益率模型预测能力较好;中证500中日内收益率预测更优,提示不同市值层次需因地制宜模型训练。
  • 策略启示:隔夜收益率预测值可能辅助构建“日内空仓”策略以规避回撤风险,同时提示实盘交易应关注集合竞价阶段的机会与风险。

- 风险警示:模型训练随机性、规则时效性和实际交易摩擦可能影响策略有效性,应谨慎使用。

通过丰富的图表和统计数据,报告系统地支撑了上述结论,提供对资金管理者和量化研究者在因子设计、模型构建以及策略实施上的重要见解和参考。

---

主要图表示例



图1:不同收益率间自相关性矩阵
说明:清晰呈现未来1至20日内隔夜收益率Y1、日内收益率Y2及完整收益率Y间的相关性,其中隔夜与日内显著负相关。

图2:不同区间内分组超额收益
说明:展示深度学习合成因子在完整收益率、隔夜收益率和日内收益率分组的超额收益,隔夜阶段收益显著,高于完整收益率收益,日内部分则出现逆转。

图3:分组分日超额收益
图4:分组分日超额净值
说明:时间序列视角揭示隔夜收益期望正超额,日内收益期望为负超额,造成净值的波动与反转。

---

整体而言,报告透彻剖析了量价因子在复杂市场环境中的超额收益时序构成,通过切分收益率结构及深度学习模型对比,帮助业界更科学地理解量价因子的表现差异和应用边界,为未来模型改进和策略优化提供了数据与理论基础[page::0-17].

参考文献及声明



报告附有研究所标准的免责声明、法律声明及投资评级说明,提醒投资者关注投资风险并独立判断,同时明确报告版权和信息来源,确保合规性与严谨性[page::18-19].

报告