`

持股类因子测试 ―金融工程专题报告

创建于 更新于

摘要

本报告通过量化方式检验欧奈尔canslim选股模型中机构认同度因子在A股的有效性。测试了户均持股数增速、机构持股比例增速和前十大流通股比例增速三类因子,发现仅大市值条件下的户均持股增速因子表现较好,具有一定的超额收益。其余因子表现一般,分行业分析也显示因子效果受市值风格影响大于行业风格,模型存在样本数据少和披露时间间隔不同导致的不足风险 [page::0][page::2][page::3][page::4][page::7]

速读内容


户均持股增速因子分层测试及表现分析 [page::3]


  • 在大市值条件下,户均持股增速因子分层累计收益表现出较明显的分层效果,第一层与第五层差的累计收益率均为正。

- 小市值条件下该因子分层效果不明显。
  • 其他因子如机构持股比例增速和前十大流通股比例增速在不同市值下均无明显分层收益差异。


因子评价指标及统计结果 [page::4][page::5]


| 因子 | T值绝对值均值 | T值>2概率 | 因子收益均值 | 标准差 | 因子收益>0概率 | IC均值 | IC标准差 | IRIC | IC>0概率 |
|-----------------|--------------|-----------|-------------|-------|--------------|---------|-----------|--------|---------|
| 户均持股增速-大市值 | 1.638 | 33.33% | 0.483 | 0.937 | 70.8% | 0.028 | 0.047 | 0.594 | 75.00% |
| 户均持股增速-小市值 | 1.225 | 20.83% | 0.185 | 1.017 | 66.7% | 0.014 | 0.041 | 0.352 | 66.67% |
| 机构持股比例 | 1.456 | 29.17% | 0.111 | 1.052 | 50.0% | 0.001 | 0.053 | 0.012 | 50.00% |
  • 由于所有因子的T值均未超过2的统计显著阈值,因子整体显著性较弱,仅户均持股增速因子在大市值条件下表现相对较好。


分行业因子表现概览 [page::5][page::6][page::7]

  • 行业层面分析显示,户均持股增速因子在所有行业的回测T值均未超过大市值条件下的水平。

- 各行业中因子表现存在差异,但整体无显著行业风格驱动,市值风格影响更大。
  • 分行业的机构持股比例增速和前十大流通股比例增速因子表现较为平庸,未见显著alpha信号。


总结与风险提示 [page::7][page::8]

  • 机构认同度因子(i)在A股市场上的有效性较差,主要受限于样本频率低(年度仅三期披露数据)及样本数量有限。

- 模型存在过度优化和失效风险,需谨慎应用于实盘投资。

深度阅读

持股类因子测试报告详尽分析



---

1. 元数据与概览



报告标题: 持股类因子测试—金融工程专题报告
分析师: 郝倞
发布机构: 渤海证券股份有限公司研究所
发布日期: 2019年3月25日
主题内容: 本报告聚焦于基于欧奈尔CANSLIM选股模型中“机构投资者认同度”(即i因子)的持股类指标,尝试量化验证该因子在A股市场中的有效性。三大因子包括户均持股数增速、机构持股比例增速、前十大流通股比例增速。报告目的在于检验这些因子是否具备产生超额收益的能力,并对其分层效果、行业表现及风险进行深入分析。

核心论点与结论:
  • 报告确认,三个持股类因子整体T值较低,普遍未达到统计显著(T=2)门槛。

- 户均持股数增速因子在大市值细分市场中表现相对较好,具备一定的分层收益优势。
  • 机构持股比例增速及前十大流通股比例增速因子表现一般。

- 分行业测试显示因子效用更依赖市值风格而非行业风格。
  • 整体上,基于本文测试方法的结果表明,欧奈尔模型中机构投资者认同度因子在A股有效性较低,主要受样本数量限制及数据披露周期差异影响。

- 风险提示主要涵盖模型过度拟合及失效风险。[page::0,2,7,8]

---

2. 逐节深度解读



2.1 背景介绍与因子简介



关键内容:
报告从欧奈尔CANSLIM模型中“i因子”(机构投资者认同度)入手,尝试用A股实证数据验证该因子。三个持股类因子定义清晰:
  • 户均持股数增速 = (总流通股股本/流通股东数)当前期相对于前一时期的增长率,衡量股东持股集中度变化。

- 机构持股比例增速 = (机构持股总额/总股本)相对前期增速,反映机构投资者持股变化趋势。
  • 前十大流通股比例增速 = (前十大股东持股数/总流通股数)相对前期增速,体现大户或庄家控股变化。


样本覆盖全A股,剔除ST/PT和上市未满两年股票,时间跨度为2010年1月至2018年3月,数据换仓点设置为年报与季报披露后次月初,换仓频率固定于每年4、8、10月底,保证数据连续性和可比性。此设计兼顾数据的时效性与一致性。[page::2]

2.2 因子测试



分层测试方法:
该部分对三因子分别按大市值和小市值划分,分为5层因子暴露,计算每层平均收益及最优层(第一层)与最劣层(第五层)累计收益差。该方式能直观反映因子区分能力和表现一致性。

关键结论:
  • 所有因子中,仅“户均持股增速-大市值”表现出明显的分层效果,即最高层与最低层间累计收益差为正且较显著。

- 其余因子在不同市值区间均表现平平,分层收益无显著差异,说明因子在市场中无法稳定捕捉超额收益。

这一结论在表1及图1至图6中反映得较为清晰。表1中“户均持股增速-大市值”第一层收益2.07%,第五层0.32%,二者差值为正;而小市值和其他两个因子对应层间收益差较小且表现无规律。图1和图2展示的累计收益曲线也佐证了该因子在大市值的分层持续向上趋势。[page::3,4]

2.3 因子评价指标分析



报告引入更严谨的统计检验指标:因子T值(系数显著性)、IC(信息系数,因子排序相关性指标)及其相关标准差和概率指标。回归模型中采用行业哑变量控制行业固定效应,有利剔除行业因子对因子效果的干扰。

主要数据亮点(表2):
  • 大市值户均持股增速因子最高T值为1.638,虽为最高,但仍未达到一般认为的显著阈值2。

- 机构持股比例增速及前十大流通股比例增速因子的T值均更低,表现更弱。
  • IC的平均绝对值不高,大多数因子的IC均接近零,表明因子的排序能力较弱。

- 因子收益均值均为正,且大市值情况下因子收益稳定性略优于小市值。

通过这些统计检验,报告理性指出持股类因子整体统计显著性不足,分层效果有限。[page::4,5]

2.4 分行业因子表现



本节对因子在细分行业中表现进行拆解,分别提供了“户均持股增速”、“机构持股比例增速”及“前十大流通股比例增速”三大因子的分行业T值、因子收益等指标。

观察要点:
  • 所有因子在各行业的T值均未明显突破整体水平,且未超过大市值户均持股增速因子的表现。

- 多数行业因子T值远小于显著水平(T<2),且因子收益波动较大,表现不稳定。
  • 部分行业(例如食品饮料、医药生物、综合、有色金属等)因子收益偏正,但统计不显著。

- 报告强调因子表现更多依赖市值风格,而非行业风格,这说明因子属性属风格因子范畴。

行业测试表3至表5及配套数据明确指出因子普遍有效性不高,因而难以作为独立的行业选股驱动因子。[page::5,6,7]

2.5 总结与风险提示



结合各项测试结果,报告终结论为:
  • 在放宽T值显著水平至1.5的条件下,仅大市值中“户均持股增速”因子表现尚可,具备一定分层收益能力。

- 机构持股比例增速及前十大流通股比例增速等因子表现一般,无法稳定产出显著超额收益。
  • 这一结果暗示欧奈尔模型中“i因子”(机构认同度)在A股市场表现较弱。

- 样本数据年份较少,财报披露频率及时间间隔不均可能导致因子数据有效期受限,是影响结果的关键因素之一。
  • 风险方面明确指出模型存在过度优化和未来失效风险,应谨慎应用。[page::7,8]


---

3. 图表深度解读



表1:因子分层测试结果(%)



| 测试因子 | 第一层 | 第二层 | 第三层 | 第四层 | 第五层 |
|-------------------------|---------|---------|---------|---------|---------|
| 户均持股增速-大市值 | 2.07% | 1.90% | 2.17% | 1.46% | 0.32% |
| 户均持股增速-小市值 | 5.06% | 5.35% | 5.30% | 5.88% | 3.94% |
| 机构持股比例增速-大市值 | 1.40% | 2.57% | 1.70% | 1.69% | 0.54% |
| 机构持股比例增速-小市值 | 5.67% | 4.95% | 4.73% | 4.71% | 5.02% |
| 前十大流通股比例增速-大市值 | 1.58% | 2.60% | 1.93% | 1.25% | 0.56% |
| 前十大流通股比例增速-小市值 | 5.49% | 5.27% | 5.86% | 4.54% | 4.38% |

解读:
  • 大市值“户均持股增速”从第一层到第五层降幅明显,显示因子有较好选股分层能力。

- 小市值“户均持股增速”及其它因子分层收益没有明显的单边趋势,甚至出现第五层收益高于第四层、第五层收益中游区间现象,显示分层效用有限。
  • 机构持股比例增速及前十大流通股比例增速的分层收益差异不像户均持股增速明显,在大市值中仍有一定倾斜。


图1-6:分市值累积收益趋势图



以图1(户均持股增速分层累计收益-大市值)为例,曲线整体上行趋势反映该因子分层在大市值样本具有持续正收益能力;图2(小市值对应图)则呈现相对波动无明显趋势,支持数据表述。

图3和图4(机构持股比例增速)在大市值条件下虽然表现有小幅上涨,但涨幅和稳定度都不及图1所示因子,小市值条件表现尤为弱势。

图5和图6(前十大流通股比例增速)亦呈现类似趋势,只有有限的正向收益表现,且波动较大。

所有图表均选用Wind及渤海证券数据源,保证数据有效与权威,但由于周期数据披露影响,长期趋势比较意义需谨慎。

图1:户均持股增速分层累计收益-大市值
图2:户均持股增速分层累计收益-小市值
图3:机构持股比例增速分层累计收益-大市值
图4:机构持股比例增速分层累计收益-小市值
图5:前十大流通股分层累计收益-大市值
图6:前十大流通股增速分层累计收益-小市值

表2:因子评价指标



| 因子 | T值绝对平均 | T值>2概率 | 因子收益平均 | 因子收益标准差 | 因子收益>0概率 | IC平均 | IC标准差 | IRIC | IC>0概率 |
|-----------------|-------------|------------|-------------|----------------|----------------|--------|----------|--------|----------|
| 户均持股增速-大市值 | 1.638 | 33.33% | 0.483 | 0.937 | 70.8% | 0.028 | 0.047 | 0.594 | 75.00% |
| 户均持股增速-小市值 | 1.225 | 20.83% | 0.185 | 1.017 | 66.7% | 0.014 | 0.041 | 0.352 | 66.67% |
| 机构持股比例 | 1.456 | 29.17% | 0.111 | 1.052 | 50.0% | 0.001 | 0.053 | 0.012 | 50.00% |
| 前十大流通股比例增速-小市值 | 0.820 | 16.67% | 0.274 | 0.795 | 66.7% | 0.012 | 0.030 | 0.415 | 66.67% |

解读:
  • 各因子T值均未达到显著阈值2,数据证明持股因子大多缺乏统计学显著性。

- 户均持股增速-大市值因子拥有最高T值及较高因子收益平均值,显示其在捕捉超额收益中相对优越。
  • 机构持股比例因子收益表现最弱,且信息系数(IC)几乎为零,代表排序能力极低。

- 因子收益大于0的概率和IC大于0的概率指标则从概率角度反映因子正相关市场走势的稳定性,户均持股增速-大市值因子胜出。

---

4. 估值分析



本报告不涉及具体公司估值,亦未运用DCF、P/E等传统估值模型。其核心为量化方法在因子研究中的应用,重点放在信号有效性检验,估值方法未被提及,不存在估值计算或敏感性分析。

---

5. 风险因素评估



报告明确提出以下风险提示:
  • 模型过度优化风险:由于因子样本量较小(每年最多数据点3个),存在过拟合风险,即模型可能好似适合历史数据但放到未来失效。

- 模型失效风险:因模型基于的数据披露方式及时间跨度特殊,未来政策调整、市场结构变化或数据披露规则修改都可能导致模型无法继续保持有效。

报告未详细列举其他风险,但明确指出这两点为核心警示,提示用户在实际量化投资中应谨慎对待该类持股因子模型。[page::0,7,8]

---

6. 批判性视角与细微差别


  • 报告采用了合理的因子筛选与统计检验流程,但因数据披露时间点稀少(年报和季报只有三个月末披露,每年3个样本点),导致可用样本容量极少,严重制约了因子效力统计显著性。

- 结果显示持股类因子效用偏弱,暗示欧奈尔canslim模型中“机构投资者认同度”因子在A股处境可能不同于海外市场,这种差异可能受市场结构、机构参与度及信息披露等因素影响。
  • 报告基于大市值和小市值拆分发现持股集中度因子的表现受市值风格影响显著,这一点提醒投资者因子效用并非普适,可能受市场规模及流动性约束。

- 报告风险提示有限,未展开对模型假设的深入讨论,如因子重复性、因子信号稳定性与市场环境敏感度等,未来研究空间尚存。
  • 报告中存在一定不可避免的局限,即数据周期差异未能完全调整,可能影响因子表现的准确评价。


---

7. 结论性综合



本报告通过数量化方法系统衡量了欧奈尔CANSLIM模型中机构投资者认同度因子的三个代理指标在A股市场的因子有效性。分层测试、因子评价及分行业分析的多维度验证显示:
  • 户均持股数增速因子在大市值样本中体现出一定的超额收益能力,具备分层和统计上一部分显著性。

- 机构持股比例增速和前十大流通股比例增速因子的表现相对疲弱,稳定性和显著性均不足。
  • 各因子信息系数(IC)较低,说明因子排序能力有限,因子稳定性不足。

- 分行业视角下,因子表现受市值风格影响高于行业风格影响,暗示市值是影响因子表现的重要因素。

综上,机构持股相关因子在A股的普适性及有效性远不及传统设想,且测试结果因样本限制、数据周期性等固有因素存在较大变动空间。模型的风险提示提醒使用者谨防数据过拟合及未来失效风险,使用时需结合实际市场环境审慎决策。

本报告为金融工程量化领域的专门技术研究成果,结论务实、数据详实、解释清晰,为理解和应用欧奈尔模型中的机构持股因子提供了重要的实证评价依据,是量化选股模型构建及风险管理的重要参考文献。[page::0~8]

---

备注: 报告中的所有图表均基于Wind及渤海证券数据库,数据时间跨度涵盖2010年至2018年,采用行业哑变量回归控制行业效应,保证了分析的专业性和严谨性。投资者在应用相关因子时,需警惕数据披露时间的稀缺对模型结果的影响并结合其他因素全面判断。

报告