`

基于历史相似走势的因子选股研究

创建于 更新于

摘要

报告基于股票历史价格走势的相似性,构建相似反转因子与相似低波因子。两因子均显著优于传统反转与低波因子,回测区间2013年至2024年均表现良好,其中相似低波因子IC均值达0.08,ICIR0.79,年化收益46.91%。行业及主要宽基指数分域测试均显示出较强的稳定有效性,行业中性化提升了相似反转因子的表现[page::0][page::4][page::7][page::11][page::20][page::26][page::31]

速读内容


研究背景与方法总结 [page::0][page::4]

  • 转变视角,从基本面相似过渡至股票时序历史价格走势相似。

- 使用皮尔逊相关系数衡量当前与历史走势的相似度,并基于此构建两类因子:相似反转因子与相似低波因子。
  • 相似反转因子计算多次相似走势后既定持仓时间内股票累计超额收益的加权平均,对多头和空头信号均敏感。

- 相似低波因子计算多次相似走势后超额收益的波动率倒数,捕捉历史收益稳定与低波动特征。

相似反转因子核心绩效指标与效果验证 [page::7][page::8][page::9][page::10]


| 指标 | 相似反转因子 | 传统反转因子 |
|--------------|--------------|--------------|
| IC均值 | 0.05 | 0.04 |
| IC标准差 | 0.13 | 0.15 |
| IC胜率 | 66.30% | 63.18% |
| ICIR | 0.39 | 0.26 |
| 多空组合年化收益率 | 42.83% | 11.39% |
| 最大回撤率 | 12.54% | 45.82% |
  • 相似反转因子胜率和稳定性显著优于传统反转因子。

- 分组检验显示相似反转因子空头贡献强劲,多空收益波动比大幅领先传统因子。





相似低波因子核心绩效指标与效果验证 [page::11][page::12][page::13][page::14]


| 指标 | 相似低波因子 | 传统低波因子 |
|--------------|--------------|--------------|
| IC均值 | 0.08 | 0.05 |
| IC标准差 | 0.10 | 0.15 |
| IC胜率 | 78.52% | 65.74% |
| ICIR | 0.79 | 0.37 |
| 多空组合年化收益率 | 46.91% | 19.73% |
| 最大回撤率 | 11.44% | 35.69% |
  • 相似低波因子的有效性、稳定性和收益性大幅优于传统低波因子。

- 因子分组表现严格单调,风险调整收益更优。





因子相关性及行业分域测试 [page::15][page::16][page::17][page::18][page::19][page::20]

  • 相似反转因子与Barra风格因子相关性极低,提供非冗余信息。

- 相似低波因子与流动性(LIQUIDTY)和残差波动率(RESVOL)因子相关度较高,存在风格暴露。
  • 行业分域:相似反转因子除钢铁、银行和煤炭外,在其余28个行业均表现有效;相似低波因子除银行和煤炭外,行业有效性较强。

- 行业中性化显著提升相似反转因子有效性和稳定性,提升ICIR到0.50,年化收益率提升;相似低波因子中性化稳定性提升但有效性略有下降,推荐实际应用时采用行业中性化相似反转和非中性化相似低波因子。






主流宽基指数分域有效性分析 [page::21][page::22][page::23][page::24][page::25][page::26][page::27][page::28][page::29][page::30][page::31]

  • 相似反转因子在沪深300、中证500、中证1000指数域均表现有效,IC均值及ICIR随指数规模变大而提升,空头组合表现尤为突出。

- 相似低波因子同样在主流宽基指数中表现优异,且因子分组单调性更强,多头与空头组合均可贡献良好收益。
  • 多空组合年化收益率分别达到近40%-47%,最大回撤控制在较低水平,收益波动比显著优于传统因子。











结论与反思 [page::31]

  • 股票历史走势相似性可有效辅助选股,构建的相似反转和相似低波因子有效性显著优于传统因子。

- 两因子在行业与主流宽基指数分域均表现稳定且显著,特别是相似低波因子分组单调性强。
  • 行业中性化有助于提升相似反转因子稳定性和有效性,建议结合两种处理方式应用。

- 不足包括相似反转因子多头收益单调性仍待提升,走势相似刻画方式有提升空间,未来可继续挖掘量价信息中的定价信号。

深度阅读

基于历史相似走势的因子选股研究—详尽分析报告



---

1. 元数据与报告概览


  • 报告标题: 基于历史相似走势的因子选股研究

- 作者及机构: 西南证券研究发展中心,分析师郑琳、王天业
  • 发布时间: 2024年8月

- 研究主题: 股票因子研究,特别基于历史股票价格走势相似性构建选股因子,研究其在未来收益率预测中的有效性。
  • 核心观点及结论:

- 将股票历史价格走势的相似性作为因子构建核心,提出“相似反转因子”和“相似低波因子”两类创新因子。
- 这两类因子相比传统反转因子和低波动因子,在信息系数(IC)、收益波动比等指标上均表现优异。
- 两因子在行业及主流宽基分域均表现出显著的选股有效性,且能提供與 Barra 风格因子较低的相关性信息。
- 报告同时提醒因子基于历史数据,市场环境变化可能影响未来表现。
  • 目标: 推动因子体系丰富及优化,为投资管理提供新的量化工具。


---

2. 逐节深度解读



2.1 引言部分



引言部分全面回顾了前期基于“基本面相似性”构建因子的方法学基础,指出该报告创新性从静态横截面转向时间序列的股票历史价格走势相似性研究,意在挖掘股票历史走势结构对未来收益的预测能力,提出新颖的因子构建视角。[page::4]

2.2 因子构建



2.2.1 历史走势相似性刻画



采用皮尔逊相关系数(Pearson Correlation)衡量单只股票当前和过去一段时间窗口内价格走势的相似程度,定义如下:

\[
\rho{X,Y}=\frac{\sum{i=1}^n (Xi - \bar{X})(Yi - \bar{Y})}{\sqrt{\sum{i=1}^n (Xi - \bar{X})^2} \sqrt{\sum{i=1}^n (Yi - \bar{Y})^2}}
\]

其中,序列 \(X\) 和 \(Y\) 分别对应当前和历史滚动时间窗口内的收盘价系列。
  • 通过滚动窗口,计算历史所有时段中与当前序列的相似度,定位多个历史“相似走势”时点。

- 明确排除当前序列与被匹配历史序列重叠,避免数据泄露。
该方法有效量化价格走势的时间序列形态匹配度,是后续因子构建的基础。[page::4]

2.2.2 相似反转因子构建


  • 基于发现“多次相似走势后平均超额收益越高,未来持有收益越低”的反转现象,定义相似反转因子

- 收集所有历史相似时间点 \(\tau\),计算其后既定持仓期 \(HoldingTime\) 的累计超额收益 \(ER{i,\tau}\)。
  • 引入阈值 \(Threshold\) 筛选高相似(绝对相关系数高于阈值)历史走势,同时将正负相关的走势均纳入,并利用符号修正。

- 对所有相似事件的累计超额收益加权计算,采用基于历史相似事件序号的指数衰减权重,权重定义:

\[
\omega
{i,k} = \frac{e^{\lambda k}}{\sum{k=1}^n e^{\lambda k}} \quad , \quad \lambda = \frac{\ln 2}{H}
\]

其中半衰期 \(H\) 控制权重衰减速度。

最终因子计算:

\[
SimilarReverse
{i,t} = - \sum{k=1}^n \omega{i,k} ER{i,\tauk}
\]
  • 负号体现反转性质:历史高收益对未来收益有负面预测能力。

- 该方法相较传统反转因子更精准捕捉基于历史走势相似的反转信号。
  • 传统反转因子则为过去连续日期窗口收益率的负累计乘积指标,忽略历史形态相似度信息。[page::5,6]


2.2.3 相似低波因子构建


  • 探索“多次历史相似走势所对应未来超额收益序列波动率越低,未来收益期望更高”的现象,定义相似低波因子

- 用类似相似反转因子定位相似走势时点,计算这些时点后持仓期收益的标准差,然后因子取其倒数:

\[
SimilarLowVol{i,t} = \frac{1}{std(ER{i,\tau})}
\]
  • 传统低波因子以回望窗口内的收益率序列标准差倒数构造,用收益率标准差避免成交额等流动性掩盖因素。

- 相似低波因子侧重于用历史相似走势后的收益波动特征作为信号。
  • 与相似反转因子不同,低波因子表达的主要是稳定性而非收益方向性信息。[page::6]


2.3 因子有效性检验



2.3.1 测试框架及样本


  • 回测期间:2013年12月27日至2024年8月23日

- 股票池:沪深A股市场,剔除ST股及上市未满一年者
  • 交易规则:周度换仓,涨停或停牌当周不可买入

- 因子分组:等权分为10组,进行多空组合净值和收益率分析
  • 主要指标关注信息系数(IC)、IC胜率、ICIR、年化收益率及风险指标。[page::7]


2.3.2 相似反转因子回测结果


  • 样本平均相似度相关系数较高(均值约70%),样本平均覆盖率97.44%,说明筛选条件合理,历史相似走势样本质量优良(表1,图1~2)。

- 相比传统反转因子,相似反转因子IC均值0.05高于0.04,ICIR达到0.39显著优于0.26。同时IC胜率更高和t统计量显著(表2,图3)。
  • 分组测试显示相似反转因子多空组合年化收益高达42.83%,收益波动比2.24,最大回撤12.54%,整体表现稳健且空头收益贡献突出(表3,图4)。

- 传统因子多空组合收益显著较低(11.39%),空头和多头收益幅度均不及相似反转(表4,图5)。

总结:相似反转因子在有效性和风险调整后收益率均全面领先传统反转因子,尤其强调了空头收益的强大贡献,体现历史走势相似信号在反转策略中的优势。[page::7~10]

2.3.3 相似低波因子回测结果


  • 样本相关系数及覆盖率与相似反转因子类似(均值约70%,覆盖率97.07%),样本规模稍小(表5,图6~7)。

- 信息系数测试显示相似低波因子IC均值0.08,ICIR 0.79,胜率78.52%,显著优于传统低波因子(IC均值0.05,ICIR 0.37)(表6,图8)。
  • 分组测试显示相似低波因子多空组合年化收益46.91%,收益波动比3.31,最大回撤11.44%,表现出色且多头空头收益均衡,且风险调整能力强(表7,图9)。

- 传统低波的多空组合收益19.73%,峰度较低,单调性不及相似低波因子(表8,图10)。

总结:相似低波因子不仅提升了因子预测准确率,还使风险调整后收益取得巨大改进,显示出价格走势相似后收益稳定性预判优于传统基于简单波动率的指标。[page::11~14]

---

3. 图表深度解读



图1-2 和 表1(相似反转因子样本统计)


  • 图1反映相似反转因子选中历史相似走势的相关系数分布,峰值集中在0.7左右,表明多数样本具有中高程度的价格走势相似度。

- 图2样本规模集中在80左右,显示每只股票在时间序列中能找到较多相似走势历史样本,样本容量充沛。
  • 表1详细反映相关系数和样本规模的分布情况,为因子构建的稳健性提供数据支撑。


图3 与 表2(相似与传统反转因子IC表现)


  • 图3左轴显示因子的即时IC值,右轴显示累计IC,色彩区分相似反转(橙)和传统反转(红)。

- 相似反转因子的IC曲线整体在传统反转之上,且累计IC呈持续攀升态势,显示预测能力好且稳定。
  • 表2数据具备统计显著性,支持视觉结论。


图4-5 与 表3-4(因子分组净值和收益表现)


  • 图4和图5对比两因子分组的累计净值走势,相似反转因子Top1至Top10之间及多空组合(右轴)净值差距明显更大,显示更好的分组单调性和选股能力。

- 表3中相似反转因子组间年化收益率、收益波动比体现了该因子在收益提升和风险控制的综合优势。
  • 传统反转因子收益率水平和波动比均明显劣于相似反转。


图6-7 与 表5(相似低波因子样本统计)


  • 样本相关系数分布(图6)类似相似反转,但相关系数数据略低,下限在44%附近,表明此因子捕捉的走势相似度范围稍宽。

- 样本规模(图7)集中在11左右,规模相较相似反转较小,影响可能来自截面窗口设定。

图8 与 表6(相似低波因子IC分析)


  • 相似低波因子即时与累计IC均稳定且提升明显,高于传统低波因子,稳健性和预测能力可观。


图9-10 与 表7-8(相似低波因子分组表现)


  • 图9显示不同组合净值差异显著,分组单调分明,多空差距大。

- 分组检验结果(表7)表明因子的风险调整后表现优异,且空头和多头均为收益贡献主体。
  • 与传统低波因子比对,优势明显,彰显相似低波因子的实用性。


图11-15(行业分域因子表现变动)


  • 钢铁、银行、煤炭行业内,相似反转因子IC表现较弱或趋势下滑(图11-13),说明传统反转机制在这些周期性或受特殊行业影响显著。

- 对比相似低波因子,银行与煤炭行业表现依然较弱(图14-15),但无出现明显反转,显示因子行业表现差异。

图16-27(主流宽基指数分域表现)


  • 在沪深300、中证500和中证1000中,相似反转因子IC均呈递增趋势,整体有效性增强(图16,18,20),对应分组年化收益及收益波动比分别异质化增长(图17,19,21)。

- 相似低波因子亦显示类似递增特征,且多头及空头贡献均衡,分组单调性较强(图22-27)。
  • 指数分域分析验证因子可用于不同规模、中小风格量化策略,对股票池选择广泛适用。


---

4. 估值部分



本报告并未涉及具体的公司估值分析或目标价,主要聚焦于因子构建和量化实证分析。因子有效性验证基于统计回归指标和分组测试,无折现模型或市盈率等传统估值方法介入。

---

5. 风险因素评估



报告列出主要风险提示:
  • 因子构建完全基于历史公开数据,面临未来市场环境变动风险,实证结果可能失效。

- 数据源可能存在第三方数据错误或不准确的风险,影响因子计算结果。
  • 历史收益率不代表未来表现,投资者需谨慎,考虑自身风险偏好和承受能力。

- 报告未明显提供具体风险缓解策略,但提醒投资者理性使用因子,避免过度依赖。

---

6. 审慎视角与细微差别


  • 报告基于皮尔逊相关系数捕捉历史走势形态相似性,该指标对极端事件、趋势转折敏感度不一定最优。未来可考虑引入其他时序相似度度量方法(如动态时间规整DTW等)。

- 相似反转因子空头收益强劲、多头收益衰减,反映因子在做空时信息更有效,实战中应注意多头管理。
  • 行业分域分析发现因子有效性存在显著差异,显示因子在周期性行业及金融行业的适用局限性,提示实际组合构建需行业调整。

- 行业中性化对相似反转因子有效性提升显著,但对相似低波因子有效性略有抑制,说明两因子在行业暴露结构上差异明显。
  • 报告中部分章节图表未提供明确置信区间或统计显著性检验,未来增强这类统计验证可进一步提升结论稳健性。


---

7. 结论性综合



该研究报告系统地提出并实证验证了基于股票历史价格走势相似性构建的两类创新因子——相似反转因子相似低波因子。这些因子通过利用股票自身历史走势及其对应的未来超额收益表现,为短期收益预测提供了有效信息。
  • 相似反转因子利用历史多次相似走势后的反转收益状态,构建指数加权反转因子,其平均信息系数0.05,胜率超过66%,多空组合年化收益达43%以上,远胜传统反转因子,尤其空头组合贡献显著。行业中性化后有效性进一步增强。

- 相似低波因子关注相似历史走势后收益波动性,标准差倒数作为因子值。信息系数高达0.08,胜率超过78%,多空组合年化收益47%,收益波动比3.31,表现稳定优异,且多头空头均贡献有效收益。
  • 两因子在行业及主流指数分域测试中均表现出较强的稳定性和有效性,特别在中证1000等中小盘指数组合中表现更佳,说明因子对不同规模板块均具备适用性。

- 因子与Barra风格因子相关性总体较低,其中相似反转因子能提供额外的风格外信息;相似低波因子在流动性和残差波动率方面有所暴露。

图表数据及分组表现清晰显示因子分组单调性强,净值增长趋势稳健,风险调整表现优越,最大回撤控制良好,交易成本未计入情况下展现出可操作性强的特点。

报告客观指出指标的局限和未来优化方向,如因子波动性能的提升、分行业差异化策略设计,以及可能利用更丰富的时序相似性测度。

总体来看,本报告为量化选股因子研究提供了创新路径,相似反转和相似低波因子在多重维度实证中优于传统因子,具备较强的投资应用价值和理论推广潜力。[page::0,4-31]

---

附件:重要表格与图示(示例)


  • 表1. 相似反转因子样本统计


| 评价指标 | 最小值 | 平均值 | 中位数 | 最大值 | 历史平均覆盖率 |
|------------------|----------|----------|----------|----------|----------------|
| 样本平均相关系数 | 49.67% | 69.77% | 71.44% | 85.50% | 97.44% |
| 样本平均规模 | 0.00 | 74.74 | 81.00 | 101.00 | |
  • 图3. 相似反转与传统反转因子信息系数变化


图3
  • 表3. 相似反转因子分组检验结果


| 组别 | 年化收益率 | 年化波动率 | 累计净值 | 收益波动比 | 最大回撤率 | 单边换手率 |
|---------|------------|------------|----------|------------|------------|------------|
| Top1 | -23.17% | 0.29 | 0.06 | -0.80 | 97.65% | 69.18% |
| ... | ... | ... | ... | ... | ... | ... |
| Top10 | 10.39% | 0.33 | 2.82 | 0.31 | 51.16% | 72.14% |
| Top10-1 | 42.83% | 0.19 | 41.94 | 2.24 | 12.54% | |
  • 图4. 相似反转因子分组净值变化


图4
  • 表6. 相似低波与传统低波因子信息系数分析


| 因子 | IC均值 | IC标准差 | t统计量 | IC胜率 | ICIR |
|----------------------|--------|----------|---------|---------|------|
| Similar-Low-Volatility| 0.08 | 0.10 | 18.41 | 78.52% | 0.79 |
| Low-Volatility-5 | 0.05 | 0.15 | 8.57 | 65.74% | 0.37 |
  • 图8. 相似低波与传统低波因子信息系数变化


图8
  • 表11. 相似反转因子申万一级行业分域IC


| 行业 | IC | ICIR | 行业 | IC | ICIR |
|------------|------|-------|------------|------|-------|
| 农林牧渔 | 0.07 | 0.33 | 纺织服饰 | 0.03 | 0.16 |
| 钢铁 | 0.00 | 0.01 | 银行 | -0.02| -0.09 |
| 煤炭 | -0.01| -0.05 | 电子 | 0.06 | 0.38 |
| ... | ... | ... | | | |
  • 图16. 相似反转因子沪深300信息系数变化


图16

---

总结



报告全面构建和验证了基于股票历史价格走势相似性的创新因子,显著提升了选股效率与风险调整收益。相似反转因子和相似低波因子在多个维度优于传统因子,尤其体现出跨行业及分地域的稳健表现。其成果为量化选股领域的因子开发提供了理论突破与实际操作潜力。

投资者和量化策略开发者可基于此法深入挖掘时序表现类型因子,结合行业和市场环境差异,优化多因子模型构建。

上述分析严格依据原文数据与论述展开,附带因子构建公式、统计数据与图分析,并对复杂概念如皮尔逊相关、信息系数(IC)、ICIR、指数衰减权重进行了详细说明,确保读者无遗漏理解研究核心要义。[page::0-31]

---

如需针对报告中特定章节、公式、图表展开更详细解析,欢迎进一步沟通。

报告