量价时序特征挖掘模型在深度学习因子中的应用
创建于 更新于
摘要
本文构建基于GRU深度学习模型的选股因子,结合特征降维自编码AE和特征生成GAN技术,优化量价时序特征表达,有效提升选股效果。GAN_GRU模型表现突出,回测期内多空组合年化收益率达46.64%,最大回撤11.31%,在沪深300及中证1000指数增强策略中均显著优于普通GRU与AE_GRU模型,展现较强的投资价值和实用潜力。模型具备一定计算效率提升空间,风险提示详见报告。
速读内容
深度学习选股模型表现分析 [page::8][page::9]

- 基于18个量价时序特征,构建GRU模型,回测期间RankIC为3.14%,多头组合年化收益率11.40%,最大回撤42.78%。
- 多空组合年化收益率达24.32%,空头组合表现负面,最大回撤达69.74%。
- 模型表现波动较大,2024年初多头收益率大幅负增长,表现承压。
自编码AE特征降维及效果评估 [page::11][page::12]

- AE模型将$40\times18=720$维特征降维,测试不同编码维度(120、240、360、480)。
- 降维360维时,AEGRU模型表现相对最优,年化多头收益4.82%,多空收益8.78%,最大回撤12.30%。
- 过度降维导致信息丢失,IC和组合表现下降。
生成对抗网络GAN特征生成及深度学习因子表现 [page::16][page::17][page::18]

- 构建LSTM生成器+CNN判别器的GAN模型,生成新的(40,18)量价时序特征。
- GANGRU模型回测显示,RankIC高达7.03%,因子多空组合年化收益46.64%,最大回撤11.31%,显著优于普通GRU和AEGRU模型。
- 多头组合年化收益18.00%,空头组合年化收益-20.48%。
- 因子具备较好单调性和稳定性,显著提升模型的信息表达能力。
沪深300指数增强策略绩效表现 [page::20][page::21][page::22][page::24]

- 三模型在沪深300中的RankIC分别为0.96%、1.26%、6.13%,多头年化收益率分别为6.15%、4.36%、22.41%。
- GRU策略超过沪深300指数年化超额收益2.04%;AEGRU达2.94%;GANGRU则高达15.02%。
- GAN
中证1000指数增强策略绩效表现 [page::25][page::26][page::28][page::29][page::30]

- 三模型在中证1000范围RankIC分别为2.69%、1.08%、5.88%,多头年化收益分别为10.04%、6.67%、17.65%。
- 相较沪深300,GANGRU在该区间表现略逊,但仍显著优于其他模型。
- GAN
量价时序特征挖掘与深度学习选股策略的总结 [page::31]
- 传统GRU模型具备基本的选股能力,自编码AE降维提升计算效率但损失部分因子效能。
- 生成对抗网络GAN有效提取和“降噪”量价时序特征,显著提升深度学习选股因子性能。
- GAN_GRU模型在因子回测和指数增强策略中均显优,未来具有提升空间和应用价值。
深度阅读
金融研究报告详尽分析报告
报告标题: 量价时序特征挖掘模型在深度学习因子中的应用
作者单位: 西南证券研究发展中心
主要分析师: 郑琳
发布日期: 2024年6月
研究主题: 利用深度学习方法(GRU、AE、自编码器、生成对抗网络GAN)构建股票量价时序特征的选股因子,并设计基于这些因子的指数增强策略。主要研究深度学习模型在量化选股中对股票收益预测的能力及优化方法。
---
1. 元数据与整体概览
本文围绕深度学习模型在股票量价时序特征应用上的探索,聚焦基于门控循环单元网络(GRU)模型构建深度学习选股因子,评估其选股能力,同时创新性地引入AE自编码器进行特征降维和GAN生成对抗网络进行量价特征生成,旨在提升模型性能和计算效率。最终,报告设计了基于不同因子的沪深300及中证1000指数增强策略,对比三种模型的效果与实际应用潜力。
- 核心结论:
- 传统的GRU模型选股因子表现出一定的选股能力(RankIC 3.14%,多头年化收益11.40%,最大回撤42.78%)。
- AE自编码器降维虽降低了计算负担,但影响因子表现,多头年化收益下降,表现不如原始GRU(最高多头年化4.82%)。
- GAN生成特征后训练GRU,显著提升RankIC(7.03%)和多头收益率(18.00%),最大回撤率得到合理控制,整体表现最优。
- 基于上述因子分别构建指数增强策略,GANGRU因子模型实现沪深300和中证1000指数分别达到15.02%和17.54%的年化超额收益,优于其他模型。
- 风险提示:所有结论基于历史数据,模型未来表现不保证,存在数据误差和市场风险[page::0-1]。
---
2. 深度学习选股模型初探
2.1 深度学习模型介绍
- LSTM:解决传统RNN 长序列梯度消失的问题,通过输入门、遗忘门、输出门的门控机制控制信息流动,捕获长期依赖关系。
- GRU:结构上简化的LSTM,包含更新门和重置门,减少参数,提高训练效率。
报告中提供了详细数学公式和模型结构示意图(图1和图2)介绍二者工作原理,确保读者理解模型对时序数据处理的优势。
2.2 模型构建
- 选用两层GRU(每层128单元)加多层感知器MLP(256、64、64单元)构成模型架构,输入量价时序特征为40天×18维(时间步×特征维)[page::4-7]。
- 18个量价特征涵盖日频和月频(包括开盘价、收盘价、成交量、换手率等),详见表1[page::7]。
- 训练标签为未来5交易日累计收益,训练数据使用80%训练集,20%验证集,半年滚动训练(每年6月30日、12月31日),模型调参简单,采用Adam优化器,损失函数为排名IC,以捕获收益排序相关性。
- 股票筛选为剔除ST股及新上市不足半年,从所有个股的历史数据中预测。
2.3 性能评估与表现
- 从2018年1月1日至2024年5月29日,GRU模型因子RankIC均值为3.14%,RankIC胜率62.19%,多头组年化收益11.40%,最大回撤42.78%(表2,图4)。
- 多空组合年化收益24.32%,回撤27.89%;组1(多头组)收益8.66%,最大回撤42.73%;组5(空头组)收益-13.18%,最大回撤69.74%(表3,图5、6)。
- 年度表现波动较大,2018年亏损30%,2019、2021、2022、2023年均实现两位数正收益,但2024年以来表现较差,年初至今亏损40.21%(表4,图7)。
- 模型表现验证了传统GRU对量价时序特征在选股上的一定作用,但显然存在提升空间,尤其是今年收益低迷提示模型稳定性和泛化能力仍需加强[page::8-9]。
---
3. 基于AutoEncoder自编码模型的特征降维
3.1 AE模型介绍
- 自编码器为无监督神经网络,包含编码器和解码器,目标是最小化输入到输出的重构误差,实现数据的非线性降维。
- 把高维度数据压缩为代表性较低维特征向量,保留数据主要信息结构[page::10](图8)。
3.2 AE特征降维流程
- 将原始二维(40×18=720维)时序特征展平为一维向量输入AE。
- 使用MLP作为编码器及解码器,将高维数据降维至120、240、360、480四个维度分别进行模型训练(图9)。
- 输出压缩后的特征用于训练GRU模型,得到AE
3.3 降维后模型表现
- 虽然重构误差较小,降维过程抹去部分时序结构信息,对选股效果存在一定降低。
- AEGRU模型的RankIC表现最佳在240和360维,分别为1.34%和1.29%,但均低于原始GRU(3.14%)。
- 多头组合收益随维度变化不规律,360维时多头收益最高为4.82%,而120、240、480维均亏损。
- 多空组合收益仅360维实现正收益8.78%(表5-6,图10-13)。
- 年度多头收益表现总体偏弱,360维维度相比其他更有优势,但均远低于GRU[page::11-13]。
---
4. 基于生成对抗网络(GAN)的选股特征生成
4.1 GAN模型简介
- 由生成器(G)和判别器(D)组成,G试图生成逼真样本以“骗过”D,D则学习区分真伪样本,两者在博弈中提升能力。
- 经典目标函数为生成器最小化判别器判假概率,判别器最大化分辨真伪概率(详细数学公式见报告)[page::14-15]。
- 训练过程交替优化G和D,直至达到纳什均衡,使生成样本与真实数据难以区分(图18)。
4.2 GAN特征生成模型构建
- 为保留时序特性,采用LSTM作为生成器,用以生成(40×18)的量价时序特征“图像”。
- 判别器采用卷积神经网络(CNN),专门处理二维时序“图像”,有效提取时序特征模式(图19)。
- 生成特征输入由原始时序特征经过G生成的特征[page::16]。
4.3 GAN
GRU模型构建及表现- 首先训练GAN模型,训练完成后保留生成器G。
- 原始量价时序特征输入生成器,输出新的(40×18)特征,作为GRU模型输入进行训练与预测(图20)。
- 回测区间同前,周调仓,半年重新训练。
- GANGRU因子RankIC为7.03%,胜率81.37%,较传统GRU显著提升(表9,图21)。
- 多头收益18.00%,最大回撤41.75%;多空组合收益46.64%,最大回撤11.31%(表10,图22)。
- 多头组合和空头组合年化收益分别17.56%和-20.48%(表11,图23),分组表现显著优于GRU和AEGRU。
- 近七年多头平均收益16.00%,2024年则亏损19.74%,比传统GRU模型2024年表现大幅改善[page::17-19]。
- 结论:GAN模型对量价时序数据实现了“降噪”和特征增强,助力GRU深度学习模型更好地捕获价格与收益关系。
---
5. 多角度特征工程下的指数增强策略设计与应用
5.1 指数增强策略通用配置
- 股票池:沪深300、中证1000成分股。
- 调仓频率:周频(5交易日)。
- 费用假设:千分之四双边交易成本。
- 权重调整:基于因子排名进行分层调整个股权重,偏离指数权重bias设定为3%(详细公式及说明见章节4)[page::19-20]。
5.2 沪深300指数增强策略表现
- 三模型(GRU、AEGRU、GANGRU)因子在沪深300的RankIC分别为0.96%、1.26%、6.13%,多头年化收益分别为6.15%、4.36%、22.41%,GANGRU优势明显(表14)。
- GRU策略年化超额收益2.04%,在近1个月至3年周期均跑赢指数(表15,图25-29)。
- AEGRU策略年化超额收益2.94%,表现优于GRU,特别是近一年至近三年超额收益分别达4.19%、3.39%(表16,图30-34)。
- GANGRU策略表现更优,全区间相对指数年化超额收益15.02%,近期各阶段均显著跑赢指数,且最大回撤率最低(表17,图35-39)[page::20-25]。
5.3 中证1000指数增强策略表现
- 三模型RankIC分别为2.69%、1.08%、5.88%,多头收益率为10.04%、6.67%、17.65%,GAN
- GRU策略实现6.78%年化超额收益,其他阶段表现稳健(表18-19,图40-44)。
- AEGRU策略年化超额收益4.18%,部分阶段跑赢指数,但整体略弱于GRU(表20,图45-49)。
- GANGRU策略表现最佳,年化超额收益17.54%,且各阶段均跑赢指数,显示较强的中小盘股选股能力(表21,图50-54)[page::25-30]。
---
6. 综合总结与洞察
本文系统比较了基于传统GRU、AE自编码降维+GRU以及GAN特征增强+GRU三种模型在股票量价时序特征上的选股能力,并进一步将因子应用于沪深300和中证1000指数增强策略,结果具备显著的应用价值。
- GRU模型具备一定选股能力,但表现有限,尤其多头收益和稳定性仍有较大提升空间。
- AE降维提高了计算效率,但因降维过程中时序信息损失,未能提升因子表现,反而多头收益下降。
- GAN生成特征则成为最优方案,生成特征帮助GRU模型学习更加精确的量价与收益关系,实现显著的RankIC及多头收益提升,同时控制最大回撤,且在指数增强策略中脱颖而出,带来了15%以上的年化超额收益。
- 指数增强策略证明了深度学习生成因子的稳定有效性,GANGRU模型在沪深300和中证1000均表现突出,说明该特征工程方式对成分股选股均具备良好的适应性。
- 报告亦提醒,本文方法未深度调优模型参数,仍有进一步挖掘空间,且基于历史回测数据,未来实际表现存在不确定性和市场风险[page::31]。
---
7. 图表深度解读
- 图1和图2(LSTM与GRU结构图):清晰展示模型内部门控机制,帮助理解如何捕获时序依赖性,奠定后续模型选择基础。
- 表1与图3(选股特征与模型结构):详细列出18个多频段量价特征,展示输入矩阵为(40天×18特征),说明特征丰富度。模型结构图展现两层GRU+MLP网络层具体维度及激活函数,说明设计合理且适合时序数据学习。
- 图4和表2、表3(GRU因子表现):图表揭示GRU因子虽有选股能力但表现中庸,最大回撤较大。分组收益图显示不同因子分组间有显著差异,符合预期排序特性。
- 图5-7和表4(年度GRU因子多头表现):图示多头组合年度净值曲线波动明显,2024年表现异常差,年度表格确认收益不稳定。体现模型在极端市场环境下面临的挑战。
- 图8-9(AE自编码示意及降维方案):介绍编码器-解码器结构,降维流程合理,准备进行后续实验。
- 表5-6与图10-13(AEGRU因子测试及分组净值):数据及分组净值图揭示降维并不总带来性能提升,360维的模型相对较优但均逊色于原始GRU,且部分维度降至120或480表现尤差,验证降维带来信息损失风险。
- 图14-17与表7-8(AEGRU多头年度表现):多头年化收益较低,且2024年仍亏损,综上说明单纯降维无法提升选股效果。
- 图18-19(GAN模型及CNN判别器结构):直观展示生成对抗网络训练过程与图像识别模型,说明深度特征生成方案的技术合理性。
- 表9-11与图20-23(GANGRU选股因子性能):显著高于GRU及AEGRU RankIC和多头收益,证明GAN生成特征优化了时序信息挖掘。五分组收益更清晰显示因子单调性和区分能力提升。
- 图24与表12(GANGRU多头净值和年度收益):年化收益达多头最高,波动与回撤均较为合理,长周期表现稳健。
- 表13(增强策略基本设定):明确策略回测时间、调仓频率及交易成本,保证回测合理有效。
- 表14-21与图25-54(指数增强策略表现):分沪深300和中证1000详细展示三模型在不同时间段的超额收益和波动率表现,较为全面地反映主力模型的综合效果。
- 图表整体均衡,图文结合紧密,帮助理解复杂模型结构和量化策略表现之间的对应关系。细节展示数据选取、时序波动和风险控制完整,体现研究的严谨性。
---
8. 估值方法分析
本报告核心不涉及传统财务指标估值,而是以深度学习模型输出的选股因子作为alpha因子,配合指数增强策略进行组合构建与回测。因而其“估值”主要指因子效果的统计测量指标与回测收益表现。
- 选用RankIC(因子排序与收益的相关系数)及其胜率、信息比率、年化收益率、波动率及最大回撤率进行因子评价。
- 通过分组检验展示因子单调性和有效性。
- 指数增强策略基于因子值调整指数权重,实质是风险调整与alpha挖掘的量化投资实践。
- 因此估值部分更多体现为持续的因子表现评估和策略回测,不涉及DCF等传统估值模型。
---
9. 风险因素评估
- 依据风险提示章节,作者明确表示研究基于公开历史数据,存在数据滞后、第三方数据错误或缺失风险。
- 回测结果不保证未来表现,策略表现受宏观环境、市场波动、行业变化等多重因素影响,存在潜在的盈利波动和亏损可能。
- 报告不构成投资建议,投资者应结合自身风险偏好与承受能力审慎决策。
- 未对模型可能过拟合、极端行情鲁棒性不足等做专门风险管理描述,实际实施中需进一步关注。
---
10. 审慎视角与细微差别
- 报告未详细披露模型参数选择、超参数调优细节,原始模型参数配置较为基础,存在未充分探索模型潜力空间。
- 降维方法虽提升计算效率,但因丢失部分时序细节,导致因子表现不升反降,应结合更复杂时序特征提取技术考虑。
- GAN特征生成虽然提升明显,但生成硬币的稳定性和泛化能力仍未披露,这一点对实际策略稳定性关键。
- 2024年均出现不同程度的负收益,提示模型面对特定市场环境的适应性有待增强。
- 指数增强中权重偏离阈值为3%为固定参数,未见敏感性分析,调仓成本及实际执行约束未充分讨论。
- 报告数据截至2024年5月底,现实中需要持续跟踪更新。
---
11. 结论性综合
本文系统地对深度学习模型在股票量价时序特征上的应用进行了开创性研究,构建了三类模型(传统GRU、AE自编码降维GRU、GAN生成特征GRU),并将这些模型因子应用于沪深300和中证1000指数增强策略。结论如下:
- 模型表现:
- 原生GRU模型可产生一定选股alpha,验证了时序量价特征的有效性。
- AE自编码进行降维虽然提升了计算效率,但因关键时序信息损失,选股效果反而下降,不适合作为简单预处理工具。
- GAN生成对抗网络通过对原始特征进行生成增强,显著提升了GRU模型的RankIC和收益表现,尤其在多空组合收益和信息比率表现突出,表现出较好的因子稳定性和预测力。
- 指数增强策略结果:
- 在沪深300成分股范围,GANGRU策略实现15.02%的年化超额收益,明显优于GRU(2.04%)和AEGRU(2.94%)。
- 在中证1000范围,GANGRU同样表现优秀,年化超额收益达到17.54%,远超GRU(6.78%)和AEGRU(4.18%)。
- 组合风险控制合理,最大回撤均有下降趋势,表明深度学习因子有助提升风险调整后收益。
- 附加洞见: GAN模型因“生成”特征的特性,相当于对原始输入进行“降噪”,提高了特征信息质量,有助于模型学习更深层量价收益关系。
- 未来优化空间:报告中模型参数未深度调优,未来可针对模型结构、损失函数以及生成网络进一步优化,有望获得更佳结果。
- 风险提醒:所有结论建立在历史回测基础,真实交易表现受市场环境影响,存在不确定性和风险,投资应用前需充分风险控制和动态调整。
综上,GAN引入的特征生成显著提升了深度学习选股模型的有效性和实用性,为传统量价因子数据利用提供了新路径,具备较大的研究和应用价值[page::31]。
---
12. 参考关键图表汇总
| 图表编号 | 内容说明 | 关键发现 | 页面引用 |
|----|----|----|----|
| 图1、图2 | LSTM与GRU结构示意 | 解释时序特征处理原理 | 4-5 |
| 表1 | 量价特征明细 | 18个多频维度特征框架 | 7 |
| 图4+表2、3 | GRU因子RankIC与回测成绩 | RankIC仅3.14%,多头收益11.4% | 8 |
| 图5-7+表4 | GRU多头年度表现及净值 | 近期表现波动较大,2024年负收益 | 9 |
| 图8-9 | AE自编码示意 &降维流程 | 降维思路介绍 | 10-11 |
| 表5-6+图10-13 | AEGRU因子多维表现 | 360维表现最佳,但不及原始模型 | 11-13 |
| 图18-19 | GAN结构与CNN判别器 | 生成对抗核心机制说明 | 16 |
| 表9-11+图20-23 | GANGRU因子表现 | RankIC提升至7.03%,多头18%+收益 | 17-18 |
| 表14-21+图25-54 | 指数增强策略详细表现 | GAN_GRU稳健领先沪深300和中证1000 | 20-30 |
---
13. 总体评价
本报告研判严谨、数据详实,结合现代深度学习技术创新地解决量价时序特征的萃取及优化问题。三种模型构建和性能验证充分,既有理论性分析,又有丰富的实证结果支撑。
- 创新点:引入生成对抗网络作为特征生成器,提升特征质量,促进传统深度学习模型提升性能,展示前沿技术结合领域应用的典范。
- 实用价值:深度学习因子的表现改善直接转化为指数增强策略超额收益,为资产管理和量化投资策略设计提供可操作性方法。
- 未来挑战:需关注模型的泛化能力、市场适应性及交易成本模拟的进一步完善。
---
总结文本溯源
所有关键数值、模型及策略结果均明确引用自报告相关章节及表格页码,便于追溯和核验[page::0-31]。
---
如需针对某章节、图表或数据做更细致的说明和解读,敬请告知。