`

计数启发法与加权盈利频率

创建于 更新于

摘要

本文基于投资者计数启发法心理,构建“加权盈利频率”因子,衡量股票过去一段时间超额收益大于阈值的加权天数,实证发现该因子与A股下期收益率显著负相关,具有较强选股能力和稳定性。多空组合年化收益率超20%,相对沪深300及万得全A均有显著超额收益,IC分析和Fama-Macbeth回归均证实因子的有效性和信息增量,且因子对阈值、回望期、市场指数等参数不敏感,在中证1000成分股表现尤为突出,展现良好实用价值和推广潜力[page::0][page::3][page::6][page::8][page::9][page::11][page::12][page::16][page::17]

速读内容


加权盈利频率因子定义与构建 [page::3][page::4][page::5]

  • 因子基于投资者关注股票正收益的频率及阈值过滤,定义为过去回望期中超额收益大于某阈值的加权天数比例。

- 采用指数衰减权重对时间敏感性进行调整,近期收益判断权重更大。
  • 推荐参数为阈值2%,回望期40天,避免因子值过于稀疏。


因子有效性实证检验 [page::6][page::7][page::8]


| 组合 | 年化收益率(原始因子) | 年化收益率(行业中性) | 多空组合年化收益率 | 胜率(行业中性) |
|-------|---------------------|---------------------|---------------------|----------------|
| 组1 | 13.10% | 16.61% | | 57.23% |
| 组10 | -10.75% | -10.44% | 22.21% | 66.67% |
| 多空组合 | | | 27.29% | 72.96% |
  • 多空组合净值平稳增长,行业中性化因子表现更优。

- 多头组合优于沪深300和万得全A指数,年化相对超额收益分别达8.22%、11.97%。

信息系数与相关性分析 [page::8][page::9][page::10][page::11]


  • 因子IC均值分别为-0.0993(原始因子)和-0.096(行业中性化),IC胜率均超75%,显示预测能力强且稳定。

- 加权盈利频率因子和巴拉五因子存在较低相关性,且单因子及多因子回归中系数在99%置信水平显著,说明因子能够提供额外信息。

敏感性分析 [page::12][page::13]



  • 随阈值增大,因子IC负相关性加强,但阈值过大导致因子值为0股票过多,最佳阈值约为2%。

- 回望期增大,因子效应减弱,说明短期收益频率更具有预测力。
  • 用沪深300替代全A指数测算,因子效能依然显著。


指数成分股及组合表现 [page::14][page::16]



  • 行业中性化因子在沪深300与中证1000成分股中均有效,尤其在中证1000表现优异。

- 多头组合相较相关市场指数实现明显超额收益,展现良好选股潜力。

深度阅读

西南证券研究报告《计数启发法与加权盈利频率》详尽分析报告



---

1. 元数据与概览


  • 报告标题: 计数启发法与加权盈利频率

- 作者/发布机构: 西南证券研究发展中心
  • 发布日期: 时间不详,报告数据截至2023年初

- 研究主题: 本报告聚焦于A股市场,基于投资者行为心理,构建“加权盈利频率”选股因子,研究其在选股中的有效性及指导意义。
  • 核心论点:

报告认为投资者易采用简单的计数启发法(即关注股票收益的正负次数,而非收益大小),尤其关注收益超越某一阈值的情况。基于该心理现象,构造“加权盈利频率”因子,即对过去一段时间内股票日超额收益率超过某阈值的天数加权求和。事实检验显示该因子与股票后续收益负相关,因子表现稳健且能提供市场中未被充分定价的新信息。
  • 主要结论与指标表现:

- 多空组合年化收益率分别高达22.21%(原始因子)和27.29%(行业中性化后因子),胜率分别为66.67%和72.96%。
- 多头组合年化收益率分别为13.1%和16.61%,相对万得全A指数超额收益分别为8.22%和11.97%。
- 信息系数(IC)均显著且负相关,显示因子预测下期收益能力强且稳定。
- 通过Fama-Macbeth多因子回归,扣除传统10因子及累计收益影响后,因子仍显著,表明其提供新的选股信息。
- 因子结果对参数敏感性低,适用不同阈值和不同市场指数。

---

2. 逐节深度解读



2.1 加权盈利频率因子构建与定义


  • 投资心理基础: 报告基于投资者行为心理,尤其散户的“二元思维”,即将股票收益简化为正负两类,形成对收益频率的关注偏差,特别关注超额收益的天数和幅度是否大于特定阈值。

- 盈利频率定义公式:
$$ f{i,t}=\frac{\sum{j=1}^{M{i,t}} 1{r{i,j} > u}}{M{i,t}} $$
其中,$r{i,j}$为股票i某日超额收益,$u$为阈值,$M{i,t}$为回望期天数。统计过去$M{i,t}$天中,超额收益大于$u$的天数比例。
  • 因子优化—加权盈利频率: 采用半衰期指数加权方法,使得越近期的超额收益出现天数权重越大,体现投资者对近期收益信息的关注更高:

$$ f
{i,t}^w = \frac{\sum{j=1}^{M{i,t}} wj 1{r{i,j} > u}}{M{i,t}} $$
$$ w_j = 0.5^{\frac{t-j}{\lambda}} $$ 其中,$\lambda$取为窗口期的一半($T/2$)。
  • 数据描述与阈值选择:

- 实际阈值先选取2%,因为太大阈值(如3%)会使因子值为0的股票过多,降低区分度。
- 回望期默认取40天,20天回望期同样存在因子值0股票数过多的情况。
  • 表1数据显示加权与不加权因子区别显著,因子值种类大大增加(3537 vs 22),增强判别力。

- 行业中性化处理: 为减少行业因素影响,对因子进行行业中性化处理,保留残差$\varepsilon$ 作为净因子值。

2.2 预期结论与因子假设


  • 该因子值越大,意味着近阶段股票频繁出现日超额收益超过阈值的情况,股票价格受到较高关注,投机需求较大,预期收益较低(负向关系)。

- 因子值较小意味着股票被市场忽视,潜在回报较高。
  • 因此预期加权盈利频率因子与后期收益负相关。


---

2.3 因子有效性检验


  • 样本与数据处理:

- 样本区间2010年1月1日至2023年2月28日,覆盖全A股(剔除ST股和上市少于100天者)。
- 回望期40天,阈值2%。
- 换仓周期20天。
  • 分组检验: 将股票按因子值分为10组,计算未来20个交易日平均收益。

- 结果表现(表2、表3):
- 原始因子和行业中性化因子分组收益递减明显。因子越小组的未来收益越高,负相关关系显著。
- 行业中性化后因子优势更明显,年化收益27.29%,夏普比率1.78,最大回撤11.57%,胜率72.96%。
- 多空组合收益明显,原始因子22.21%,行业中性化27.29%。
  • 净值图(图4-图6)支持: 净值呈稳步单调爬升趋势,行业中性化后因子净值表现优于原始因子。

- 多头组合相对市场表现(图7): 多头组合显著跑赢沪深300和万得全A指数。
  • 信息系数(IC)分析(表4,图8):

- IC均值显著为负:原始因子-0.0993,行业中性化-0.0960。
- IC胜率高达75%-81%,说明因子预测收益稳定,且长期负相关。
  • 回归分析(单因子与多因子):

- 加权盈利频率因子与巴拉CNE5中10因子及过去40天累计收益因子相关系数均较低,说明包含信息独立。
- 单因子回归系数负且显著。
- 多因子Fama-Macbeth回归中,控制所有高级因子后,因子依旧保持高度显著,稳健提供新的收益解释信息。

---

2.4 敏感性分析


  • 阈值敏感性(表8,图9):

阈值从0到4%变化,IC均值绝对值随阈值升高而提升,但阈值过大因子值为0的样本多,影响结果可靠性。2%阈值平衡了信息量与区分度,是合理选择。
  • 回望期敏感性(表9,图10): 短期回望期如20天效果最佳IC绝对值最大,回望期越长IC绝对值递减,说明因子聚焦近期收益信息,短期效应更明显。

- 市场指数敏感性(表10,图11):
替换超额收益基准市场指数为沪深300,IC均值减小但仍显著(-0.0889),依旧保持良好预测力,显示因子稳健性。

---

2.5 分组内股票及实证表现


  • 股票数量(图12):

2010年每组约150只股票,到2023年提升至约450只,覆盖面扩大。
  • 实证案例对比(表11):

以2023年1月4日分组,因子排名最低组(因子值最小的20只股票)下期20日平均收益7.02%;最高组(因子值最大20只)平均收益-4.66%。体现因子良好选股能力。

---

2.6 指数成份股测试


  • 沪深300和中证1000(表12,图13-16):

- 因子在中证1000成份股IC均值更高(-0.1013),表现优于沪深300成份股(-0.0399)。
- 中证1000多头组合与指数相较稳定上涨,2015年至今年化超额收益16.64%。
- 沪深300中因子同样有效但表现稍逊。
- 净值图显示分组和多头组合均表现良好,确认因子对不同市场细分均适用并有效。

---

2.7 总结与展望


  • 文章基于投资者行为与投资心理学理论,提出了关注股票“计数启发法”的加权盈利频率因子,实际投资中该因子有效预测后续收益。

- 通过丰富的实证检验,因子表现稳定,且能够提供传统量化因子无法解释的新信息。
  • 因子对阈值、窗口期及市场指数较不敏感,适用性广。

- 中证1000成份股表现尤为突出,具备实际应用潜力。
  • 风险提示明确因系基于历史数据,未来表现受市场环境影响可能变化。


---

3. 图表深度解读



图 1 & 图 2:不同阈值下“非零”因子值股票占比趋势


  • 图1(40日回望)与图2(20日回望)均显示阈值越小,因子值非零股票占比越高。

- 3%阈值导致较多股票因子为零(最高时达35%),限制区分能力。
  • 由此确定阈值约2%适合区分大部分股票,且因子值零的股票比例低。

- 这对应文本中“阈值过大因子为0过多,影响分组”的论点支持。[page::4][page::3]

图 3:半衰期指数权重


  • 显示权重从最新交易日开始递减,约40天窗口内权重从100%下降至25%左右,证明近期数据赋予更大权重。

- 体现投资者近期关注度更高,因子设计合理反映心理。图中效果确保短期信息更受重视。[page::5]

表1:加权与不加权因子值统计


  • 加权后因子值种类显著增多(3537 vs 22),每个因子值对应股票数量平均1.23只,不加权时平均205.73只。

- 增加信息量和细粒度刻画,增强分辨力。
  • 这个统计说明加权盈频因子更具判别力,支持后续实证结论的理论基础。[page::5]


表2 & 表3:分组检验结果(原始与行业中性化)


  • 两表展示因子分组收益率呈单调递减,最低组未来回报最高。

- 行业中性化因子表现更佳,年化夏普比率提升,最大回撤明显降低。
  • 证明行业中性化降低行业偏差,增强因子预测效果。

- 多空组合t值显著,结果具有统计显著性。[page::6]

图4 ~ 图7:因子净值与多头组合净值


  • 净值均呈现逐年稳健增长趋势。行业中性化净值明显优于原始因子,体现更强的市场适应性。

- 多头组合净值优于沪深300、万得全A等指数,表明因子能够实现超额收益。
  • 净值波动与市场波动相似,合理反映市场风险。[page::7][page::8]


表4及图8:信息系数统计与变化


  • IC均值稳定负相关且显著,ICIR体现较强稳定性(约-0.7至-0.9),胜率超过75%。

- 累计信息系数趋势平稳下行,因子长期表现稳定有效。
  • 图形清晰支持因子预测力稳定的论断。[page::8][page::9]


表5:相关性矩阵


  • 加权盈利频率与momentum、流动性、残差波动率相关尚可,但均低于0.5,信息重叠有限。

- 与beta、价值指标bp、成长等基本因子相关弱,突显独立性。
  • 为多因子回归分析奠定基础。[page::10]


表6 & 表7:Fama-Macbeth回归分析


  • 单因子回归:加权盈利频率系数显著负,表明因子与未来收益负相关。

- 多因子回归:加入所有控制因子后,因子系数依旧显著,T值稳定,说明因子贡献非其它因子所包含,提供选股新信息。
  • 判定系数虽低(最大约11.7%),符合多因素模型特性,因子贡献有增值作用。[page::10][page::11]


表8 & 图9:阈值敏感性


  • IC均值绝对值随着阈值增加缓慢升高,因子表现提升,但过大阈值导致样本稀释。

- 最优阈值围绕2%左右,取平衡点。
  • 数量与质量平衡考虑合理。[page::12]


表9 & 图10:回望期敏感性


  • 回望期越短因子IC均值绝对值越大(20天最好)。

- 显示因子更适合短期收益预测。较长回望期降低预测能力。
  • 反映投资者行为聚焦近期信息。[page::13]


表10 & 图11:指数替换敏感性


  • 用沪深300替代万得全A计算收益,因子IC仍然显著且较高,单调性未变。

- 展示因子对市场基准选择不敏感,具备良好适用性。[page::13][page::14]

图12 & 表11:多空组合股票数量和股票收益对比


  • 随着时间,分组样本量增长,能够更全面覆盖市场。

- 2023年1月4日因子最低组股票平均20日后收益为7.02%,而最高组为-4.66%,强烈反映因子选股能力。[page::14][page::15]

表12 & 图13~16:沪深300和中证1000中的因子表现


  • 因子在中证1000成分股中表现优异,IC均值达到-0.1013,且多头组合年化超额收益16.64%。

- 沪深300中表现相对较弱,IC为-0.0399。
  • 净值曲线表明,中小盘股市场因子信息尤为丰富,具备良好投资应用价值。[page::16]


---

4. 估值分析


  • 本报告未涉及传统意义上的公司估值分析,因子研究为量化选股工具开发,核心为统计有效性验证,无估值模型或目标价格。

- 有关收益预测基于因子构造和统计回测,依据为因子与未来收益负相关关系,投资者可根据因子值进行择时及选股操作。

---

5. 风险因素评估


  • 历史表现不代表未来: 研究基于历史数据,市场环境变化可能导致因子表现失效。

- 市场行为变化风险: 投资者行为习惯及市场结构的调整可能改变因子信号的有效性。
  • 分组股票数量波动: 阈值及回望期改变可能影响样本覆盖度,导致因子可用性波动。

- 策略实施难度: 高频换仓等可能增加交易成本,影响因子实际收益表现。
  • 相关性重合风险: 虽多因子回归排除已知因子影响,但市场中隐含的非公开因子仍可能影响因子稳定性。

- 报告强调以上风险并未提供具体的缓解策略,提示投资者需要审慎使用。

---

6. 批判性视角与细微差别


  • 因子构造虽然基于合理的行为金融理论,但其负相关性存在悖论:频繁获利显著股票预期收益较低,需投资者结合实际交易成本和风险偏好。

- 回归系数和IC绝对值虽显著,但数值不大,说明作为单独因子预测能力有限,建议结合其他因子使用。
  • 该因子重视近期收益频率,可能对市场剧烈波动敏感,暂未见特殊说明异常市场下的表现。

- 报告未深入分析因子超额收益的驱动机制,未有交易成本和流动性约束模型。
  • 行业中性化显著提升效果,说明行业因素对该因子有重要影响,因子实施需谨慎行业暴露风险。

- 报告隐含着投资者行为模式假设的前提,较为理论化,实际投资中投资者对信息关注的心理复杂,存在其他行为偏误未体现。
  • 研究主要面向中国A股,海外市场适用性未验证。


---

7. 结论性综合



本报告基于投资者行为金融学,提出加权盈利频率因子,反映市场参与者对超阈值正收益事件的记忆和关注。通过加权方式强化近期表现,构造更细粒度因子。实证结果显示,该因子从2010年至2023年在A股市场表现出稳定的负向收益关联,能有效反映未来收益走势。
  • 多空组合和多头组合均表现出显著正超额收益,行业中性化处理后效果更佳。

- 信息系数分析确认因子信息含量和稳定性优异,且与传统量化因子相关性较低,多个多因子回归检验支持其独立解释力。
  • 因子对回望期、阈值及基准指数等参数较不敏感,实用性强。

- 因子在中证1000成份股中效果突出,未来可针对中小盘股制定相应策略。
  • 风险提示提醒因子表现受市场变化影响,投资者需警惕历史数据局限性。


综上,加权盈利频率因子作为从计数启发法出发的创新行为金融因子,具备一定的实际应用潜力,适合结合现有多因子模型进行选股和资产配置优化。

---

关键图表示例


  • 图1:回望期40天时,不同阈值因子非零股票占比趋势

  • 表3:行业中性化后因子分组检验风险收益指标

- 图7:多头组合与市场指数净值变化
  • 表4:因子信息系数分析

- 图9:不同阈值下因子IC均值
  • 表7:多因子Fama-Macbeth回归结果

- 图13与图14:沪深300和中证1000成分股分组净值图



---

本分析严谨解读了报告全貌及关键图表,全面覆盖了因子设计、实证检验、参数敏感性及局限风险,助力深入理解加权盈利频率因子的投资价值与场景适用性。[page::0,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17]

报告