神经网络因子挖掘——TCN 日频量价因子
创建于 更新于
摘要
本报告基于TCN神经网络对沪深两市股票过去63天日频量价数据进行深度因子挖掘,设计综合考虑单因子有效性、合成因子有效性与因子间相关性的损失函数,最终产出64个日频量价因子及1个高效合成因子。2018年以来因子表现稳健,合成因子平均RankIC达11.73%,并构建多头策略实现年化超额收益20.31%。因子间相关性较低,有效覆盖不同选股信号,因子效果在不同指数成分股存在差异,且预测未来20日收益表现最佳。最终基于等权合成因子打分构建日频多头策略,持股周期20日,换手率接近月频调仓水平,策略展现稳定的超额收益和较高胜率[page::1][page::2][page::5][page::10][page::15][page::21][page::22][page::24]
速读内容
报告核心观点及方法概述 [page::1][page::2][page::5]
- 本报告采用TCN(Temporal Convolutional Network)神经网络处理过去63个交易日的量价数据(7个特征)作为输入,预测未来20日收益率,产出64个日频量价因子及1个等权合成因子。
- 设计损失函数包括单个因子有效性、多因子合成有效性及降低因子间相关性三部分,平衡因子有效性与多样性,最终取得最佳表现。
- 采用分年滚动训练方式,覆盖2018年至2023年测试期,数据具备市场不同阶段代表性。
TCN网络结构与数据处理 [page::6][page::7][page::9]
- TCN使用一维膨胀卷积捕获长距离时序依赖,结构包含5个残差模块,卷积核大小固定为2,膨胀系数分别为1至16。
- 输入规格为63天×7特征矩阵;输出格式为64维向量,每维为一个因子。
- 价格数据归一化处理,成交量和金额采用最大最小归一化,目标变量(未来20日收益)采用截面分位数归一,便于截面选股。
损失函数设计及对比实验 [page::10][page::11][page::12]
- 单因子有效性以相关系数负值作为基本损失,多对单有效性分别采用单因子与合成因子有效性的结合。
- 因子间相关性通过相关系数平方和进行惩罚,防止生成高度相关的重复因子。
- 对比4种损失函数,最终选择包含单因子有效性、合成因子有效性及因子相关性约束的复合损失函数,效果最佳。
| 损失函数 | 64因子平均RankIC | RankICIR | 合成因子RankIC | 因子间相关系数均值 |
|----------|-------------------|----------|----------------|---------------------|
| 损失函数1 | 7.58% | 97.86% | 14.31% | 24.28% |
| 损失函数2 | 7.49% | 102.63% | 14.18% | 26.61% |
| 损失函数3 | 2.97% | 42.37% | 13.33% | 6.77% |
| 损失函数4 | 12.58% | 105.86% | 12.56% | 98.49% |
回测表现及因子特点 [page::14][page::15][page::16][page::17][page::18]
- 64个因子平均RankIC为5.54%,合成因子RankIC高达11.73%。
- 因子间相关系数均值约为0.21,维持较低相关性,多因子可提供信息增量。
- 测试集2018起滚动训练结果显示因子表现稳健,存在年份和不同指数成分股间差异,国证2000小盘股上表现优于沪深300大盘股。
- 因子对未来20日收益预测效果好于短期收益预测,符合因子目标。
- 多头因子分组收益走势单调,细分分组中选股能力明显。
日频量价因子策略设计与实盘模拟 [page::21][page::22]
- 采用20个子策略并行,错开调仓日,每日均交易持有20日的股票,保证预测能力最大化。
- 使用65个因子(64个单因子+1合成因子)等权合成分位数作为打分指标,采用不同分组比例测试,多空收益显著提升。
- 策略2018-2023年回测年化超额收益率达20.31%,最大超额回撤20.74%,日频胜率55.16%。
- 策略净值呈明显超额净值增长,表现稳健。
风险提示 [page::25]
- 神经网络训练含有随机性,导致预测结果存在波动。
- 市场规律时变性可能引发模型失效。
- 回测结果理想化,实际交易存在滑点等风险。
深度阅读
金融工程深度报告分析 —— TCN日频量价因子挖掘详解
---
1. 元数据与概览
- 报告标题:神经网络因子挖掘——TCN日频量价因子
- 发布机构:长江证券研究所
- 发布日期:2023年11月16日
- 主题:基于TCN神经网络模型,针对A股市场日频量价数据挖掘有效的Alpha因子,主要涉及深度学习在金融量化因子构造中的创新应用。
- 作者及联系方式:郑起(执业编号S0490520060001)
- 核心论点:
- 利用Temporal Convolutional Network (TCN) 深度学习模型对日频的价格与成交量数据进行序列预测,成功挖掘64个有效低相关的量价因子,及1个合成因子,表现优异。
- 通过设计包含单因子有效性、合成因子有效性和因子间相关性的复合损失函数,实现多因子高效生成且相互独立性强。
- 在2018年开始的滚动样本外测试中,合成因子实现了11.73%的年化RankIC,构建多头策略年化超额收益率达20.31%。
- 主要传达信息:深度神经网络,特别是TCN模型可有效捕获量价数据中的时间依赖特征,挖掘出高效投资决策因子,且设计科学的损失函数对提高因子有效性及降低因子间冗余至关重要。[page::0,1,2]
---
2. 逐节深度解读
2.1 因子挖掘与挖掘方式(第5-6页)
- 概要:因子挖掘是金融投资中通过识别影响资产价格的变量(因子)来预测回报的关键技术。历史上以APT模型为基础的发展提供了理论支持,但传统的人工因子挖掘效率和增量信息量有限。因子挖掘方法包括:
- 人工合成因子:依赖金融逻辑和专业知识,优点是经济解释性强,缺点是容易失效且效率有限。
- 遗传规划挖掘:基于进化算法的自动化因子生成,优于人工在效率和规模上,但因子可解释性减弱。
- 神经网络因子挖掘:彻底放弃因子公式可解释限制,可生成极高复杂度的因子,有望突破有效性上限,但技术难度和训练复杂性较高。
- 逻辑与推理:神经网络通过大量参数及非线性变换可拟合更复杂模式,理论有效性优于遗传规划。由于神经网络是“黑盒”模型,如何设计合理的训练方案、避免过拟合成为关键。报告指出TCN模型及特定损失函数设计是当前解决路径。[page::5,6]
2.2 TCN神经网络结构与优势(第6-7页)
- 特点:
- 因果卷积与膨胀卷积:保证无未来数据泄露,增加感受野,捕捉远距离时间依赖。
- 并行计算:相比传统RNN/LSTM,高效率处理长序列数据。
- 残差连接:缓解梯度消失,提升训练稳定性和深层网络表现。
- 具体实现:
- 采用一维卷积核沿时间序列逐特征学习时序变化;
- 使用多个膨胀卷积层实现对过去63日量价特征的全覆盖,最大处理序列长度恰好为63(日)。
- 网络由5个残差模块组成,卷积核大小和膨胀系数逐层递增,确保模型能捕捉季度内历史信息。
- 图示说明:图1和图2清晰描绘了TCN网络结构及其残差模块组成,凸显网络设计合理性与深度特征学习能力。[page::6,7,9]
2.3 数据处理与样本选择(第8-9页)
- 输入数据:63天×7个特征(最高价、开盘价、最低价、收盘价、成交均价、成交量、成交额),经过归一化处理。
- 价格数据除以63日前收盘价,统一量纲且保留走势信息;
- 成交量及金额做最大最小归一,强化时序变化特征;
- 目标变量为未来20日收益率的截面分位数(非原始收益),强调相对排名预测,减少噪声影响。
- 样本区间:2005年-2023年9月沪深A股日频量价数据,跨度长确保模型可以训练多市场状态下的规律。
- 网络输入输出设计:输出为64维向量,代表64个独立因子,通过全连接层映射得到每个因子预测值,实现多因子批量挖掘。[page::8,9]
2.4 损失函数设计与实证对比(第10-12页)
- 深度剖析:
- 有效性指标:使用相关系数(Corr)及其反数作为损失,直接优化IC/RanIC,有别于传统MSE带来的模糊优化目标,更贴合金融指标体系。
- 多对单结构:考虑单个因子有效性均值及合成因子有效性,保证单因子和组合因子均具有预测能力。
- 因子相关性惩罚:设计相关系数平方的均值作为惩罚项,降低因子间冗余,确保多样性。
- 损失函数对比:4种设计中同时包含单因子有效性+合成因子有效性+因子间相关性限制的损失函数表现最佳(因子有效性与相关性权衡最理想),忽视任何一项都会损害因子组合的整体表现。
- 忽略相关系数控制会出现多个“重复”因子,信息量重复,合成因子效果无明显增益;
- 忽略任何有效性指标则牺牲因子边际预测能力;
- 利用证明明确了该复合损失函数体系设计的合理性和必要性。
- 参数设置:惩罚权重设为$\lambda1=0.5$,$\lambda2=1$,体现了对因子间相关系数约束的较高重视及合理平衡。
- 训练流程示例:2019年前训练,2020年后测试的单年训练结果显示损失曲线平稳下降,因子间相关系数显著降低,合成因子IC稳步提升至0.16水平,验证了损失函数设计的有效性。[page::10,11,12,13]
2.5 因子表现及滚动训练策略(第14-20页)
- 单次训练因子表现:2020年后测试,64个因子平均RankIC为6.74%,合成因子12.45%,表现出显著的超额预测能力。RankICIR平均达到83.75%与130.75%,显示因子稳定性良好。
- 滚动训练设计:采用年度滚动训练(训练集2005年~T-2年,验证集T-1年,测试集T年),测试期涵盖2018-2023年,保证因子适应市场时变规律。
- 图7与图8因子RankIC和ICIR直方图显示,64因子单因子平均RankIC为5.54%,合成因子提升至近12%,表明批量因子均能提供信息且线性合成带来增益。
- 因子间相关性:因子相关系数热力图显示多数时间因子相关系数低于0.5,均值0.21,且均衡分布,证明损失函数约束效果佳,因子互补性强。
- 因子分组收益率:以IC最优的10个因子进行20分组测试,表现出明显的分组单调性和收益差异,验证了因子分层强度。
- 多区间预测表现:因子对预测期越长收益率越有效,未来20日预测IC最高(5.54%),未来1日则仅2.01%,符合因子设计预期。
- 不同指数表现:因子在小市值成分股(中证1000、国证2000)表现优于大市值成分股(沪深300),合成因子平均RankIC在国证2000达到12.48%,而沪深300为7.24%。这符合市场普遍现象,小盘股存在更多的定价错误和Alpha机会。
- 时间序列表现:2021年因子有效性较弱,2022年及2023截至9月表现恢复良好,反映市场环境变动对因子有效性的影响。
- 总结:
- TCN神经网络挖掘的量价因子有效且低相关,因子间提供的信息增量明显;
- 合成因子获得显著提升,表明因子线性叠加合理;
- 模型对未来20日收益率预测最有效,适合中短期投资策略;
- 小盘股表现较好,但2023年有所反转,需持续跟踪。[page::14-20]
2.6 策略构建与实证分析(第21-23页)
- 多策略并行构建:
- 设计20个子策略,分别从每天开始持有20日,形成“滚动重叠调仓”结构,将日频因子的预测优势完全利用。
- 整体换手率控制在月频水平,降低交易成本风险。
- 因子组合打分:等权合成64个因子加合成因子,共65个通过截面排名计算最终打分,实现统一因子综合评分。
- 分组比例测试:从5组到100组,观测多头和多空组合收益均随分组细化提升,最高多空年化收益达41.88%,体现因子信号强单调性和优秀风险分层能力。
- 策略实证效果:
- 股票池覆盖沪深全A,多头买入前1%的股票,考虑千分之二的交易成本,测试期2018-2023年9月。
- 相对基准(万得全A)策略实现20.31%的年化超额收益,日频超额胜率55.16%。
- 策略曲线平滑,上述回撤主要发生在2021年初,最大超额回撤20.74%,显示风险控制仍有提升空间。
- 年度表现细节:
- 各年度绝对收益率均超过基准,2021年超额收益最显著(32.7%);
- 2023年截至9月年化超额收益仍保持19.01%,显示模型稳定性和适应新市场环境的能力。
这些结果全面验证了TCN量价因子在实盘策略中的应用价值和实用性。[page::21-23]
---
3. 图表深度解读
图1(第7页)
- 描述:展示TCN网络的膨胀因果卷积结构和残差模块的工作机制。
- 解读:模型通过膨胀卷积扩大感受野,捕获长时序依赖;残差模块迭代叠加避免梯度消失,保证训练深层网络的稳定性。
- 关联文本:支撑报告对TCN架构优越性的论述,解释训练稳定和长距离依赖捕捉的技术根源。
- 潜在局限:假设残差模块个数和参数固定,实际应用中需调整确保最大时间长度覆盖目标窗口。
---
图2(第9页)
- 描述:详细展示本报告使用的具体TCN网络结构,输入63天7个特征,经过5个残差模块,输出64个因子。
- 解读:具体实现了报告所述设计,凸显设定膨胀系数递增策略,确保最大时间长度与输入长度匹配。
- 联系文本:直观说明了模型结构,辅以后续损失函数以及训练细节,完成多因子挖掘目标。
---
表1(第11页)
- 描述:四种不同损失函数设计下,64因子平均RankIC、RankICIR、因子间相关系数和等权合成因子表现对比。
- 解读:损失函数1(包含单因子有效性+合成因子有效性+因子间相关系数)取得较优组合效果(因子有效性与低相关性平衡最佳),忽视相关性导致因子高度重复;忽视有效性导致单因子表现不一影响整体效果。
- 联系文本:支持构建复合损失函数的重要性和合理性。
---
图3-5(第13页)
- 描述:训练及验证集损失、因子间相关系数和合成因子IC在单年训练过程中的动态变化曲线。
- 解读:训练及验证损失稳定下降,因子间相关系数从0.34降至0.24,合成因子IC提升至0.16,说明训练逐步达到优化目标。
- 联系文本:验证设计的损失函数在模型实际训练中的有效实施。
---
图7-8(第15页)
- 描述:滚动训练下因子RankIC和RankICIR的频数分布直方图。
- 解读:64个因子单因子的有效性以正偏分布,绝大部分因子IC集中于0.04至0.07之间,ICIR相对稳定,合成因子IC与ICIR显著高于单因子,体现组合优势。
---
图10(第17页)
- 描述:因子相关系数热力图,展示64因子及其均值合成因子间的相关分布。
- 解读:相关系数均衡分布,绝大多数低于0.5,说明因子互补性强且合成因子未过分偏离任何单因子。
---
图11(第18页)
- 描述:TOP10因子按照截面分20组的相对收益率分布柱状图。
- 解读:分组显示收益差异明显,涨跌趋势清晰,证明因子对股票涨跌有良好区分能力。
---
表2(第18页)
- 描述:因子对不同预测区间未来收益率的RankIC和RankICIR表现。
- 解读:因子对未来20日收益的预测效果最佳,逐级递减的预测能力符合因子设计的逻辑,短期预测效果较差。
---
表3(第19页)
- 描述:因子在沪深300、中证500、中证1000、国证2000不同指数成分股的IC及ICIR值。
- 解读:因子在小盘股群表现优于大盘股,合成因子在国证2000平均IC达到12.48%,沪深300仅7.24%。
---
图12(第19页)
- 描述:滚动训练下合成因子不同年份的RankIC柱状图。
- 解读:年份间起伏明显,2021年普遍表现最差,2022年恢复,反映市场环境对因子有效性的影响。
---
表4(第21页)
- 描述:不同分组数量对应多头、空头收益及多空组合的总收益和年化收益。
- 解读:更细分分组(如100组)使多空组合年化收益达41.88%,说明因子评分的强单调性和风险分层能力。
---
图13(第22页)
- 描述:日频策略净值曲线及超额回撤面积图。
- 解读:策略净值稳步上升,最大超额回撤约20.74%发生在2021年,整体策略稳健且长期超越市场,印证因子的实用性。
---
表5(第22-23页)
- 描述:并行策略与万得全A的年度收益、最大回撤、日频胜率对比。
- 解读:每年均实现超额收益,尤其是2021年超额32.7%,净值增长稳定,日频胜率约55%。
---
4. 估值分析
本报告不涉及传统公司估值模型,核心在于因子构建和策略绩效评价,估值主要体现在因子预测未来收益率及策略超额收益率的表现,验证模型价值。
---
5. 风险因素评估(第25页)
- 模型训练随机性:TCN作为深度学习模型,含随机初始化、丢弃等,训练结果存在一定波动及误差。
- 规律时效性风险:基于历史数据总结的市场规律有可能随时间变化失效,特别在结构调整时风险更高。
- 日频策略交易风险:回测理想化,实际交易存在滑点、流动性风险等,务必谨慎考虑实施难度。
- 总结:风险识别全面且明确,强调了模型使用局限和实盘策略可能的偏差,提示投资者谨慎操作。[page::25]
---
6. 批判性视角与细微差别
- 神经网络黑箱问题:报告承认神经网络因子复杂度高但缺乏可解释性,投资者难以理解因子内涵,可能降低策略的透明度和信任感。
- 模型假设强:固定窗口长度(63日),固定训练结构,可能对极端市场事件的适应性不足。
- 市场稳定性依赖:因子有效性依赖历史规律假设,若市场因政策或其他黑天鹅事件转变,模型失效风险加大。
- 回测偏差风险:实际交易成本、成分股变动及流动性风险未深度探讨,可能高估策略收益。
- 时间跨度与样本分割:滚动训练策略合理,但具体选择时间点可能影响预测稳定性,细节可做更多敏感性分析。
总的来说,报告对方法优势与潜在风险均有较为客观的认知,缺乏更详细的交易成本与实盘落地难度分析,也未触及多因子解释经济逻辑的尝试。
---
7. 结论性综合
本报告系统详细地介绍了利用TCN神经网络从日频量价数据中挖掘因子的一整套方法与流程,涵盖理论基础、模型设计、数据预处理、损失函数构建、单次及滚动训练及最终策略应用。
关键发现包括:
- 创新模型应用:选择了具有长序列并行处理优势的TCN,克服传统RNN训练弊端,实现了对63个交易日前数据的有效建模。
- 损失函数设计独到:合成因子有效性与单因子有效性并重、同时惩罚因子间相关性,实现因子群体整体高效且彼此去相关,避免了因子“抄作业”。
- 因子表现优异:64个单因子平均RankIC达到5.54%,合成因子达到11.73%,且在不同市值、指数成分股中均表现良好,验证了神经网络挖掘的增量Alpha能力。
- 策略实盘潜力强:多策略并行组成的日频交易策略,年化超额收益20.31%,胜率55.16%,回测表现稳健。
- 风险提示严谨:报告诚实呈现深度学习模型存在的随机性、历史规律失效风险及实盘交易风险。
图表(特别是网络结构图、损失函数对比表、因子IC分布直方图及策略净值曲线)为文字提供了强有力的可视化和数据支撑,增强了论证的说服力。
综上,报告体现出利用先进深度学习技术在因子挖掘和量化投资策略研发中的前沿探索,为行业提供了重要参考,但后续实盘检验及因子经济解释仍是进一步工作重点。[page::全篇]
---
以上为报告全文的详尽、客观、深度解析。