`

机构持仓下的因子分域

创建于 更新于

摘要

报告基于上交所年鉴数据梳理了沪市机构持仓比例及投资者结构,进一步测算了九大风格因子在不同维度(宽基、行业、机构持仓)下的分域表现。发现机构占比越高,动量因子表现更优,而机构占比低时反转、市值、估值等因子更有效。机构持仓分域较宽基和行业分域效果稍弱,但线性分域方法验证了机构占比对因子有效性的差异影响,为A股量化选股策略提供了投资者结构视角的补充理解[page::2][page::5][page::11][page::15][page::19]。

速读内容


沪市投资者结构特点 [page::5]


  • 2020年沪市一般法人、自然人、专业机构及沪港通市值占比分别为55.97%、22.93%、17.77%和3.34%。

- 剔除一般法人后,机构市值占比约为43.65%,自然人持股特别是1000万元以上账户占比不断提升。
  • 代表性个股如贵州茅台、恒瑞医药,机构持仓比例显著高于自然人。


机构投资者占比与股票规模及行业的关系 [page::8][page::9]



| 长江一级行业 | 2020年机构占比(%) |
|--------------|---------------------|
| 银行 | 68.22 |
| 保险 | 61.44 |
| 社会服务 | 57.03 |
| 食品饮料 | 56.71 |
| 检测服务 | 53.15 |
| 建筑产品 | 1.68 |
| 纸类及包装 | 6.73 |
| 环保 | 10.13 |
  • 机构投资者更多聚集于大盘蓝筹及金融、消费诸多行业,个人投资者在部分行业占比较大。


九大风格因子在全市场和分域中的表现 [page::11][page::12][page::13]



  • 2009-2021年,流动性因子持续有效,盈利因子2017年后显著提升,反转、估值等因子适用区间存在分域效应。

- 宽基分域显示盈利、动量适用于大盘股,中小盘股中反转、市值等因子更有效。
  • 行业分域中,TMT及制造行业因子较多有效;周期消费行业因子有效性时段差异明显;金融行业因子较少但逐渐稳定。


机构持仓分域因子表现及相关性分析 [page::15][page::16][page::17][page::18]


  • 机构持仓比例同风格因子相关性较低,偏向大市值、低流动性和低波动因子相关。

- 不同机构占比下的分段分组线性分域均显示:机构比例低时,反转、Beta、市值、估值、盈利等因子效果更佳,机构比例高时动量因子更有效。
  • 机构持仓分域较宽基及行业分域因子表现差异有限但存在独特角度的补充。

- 线性分域结果显示机构比例低因子效果显著提升,机构比例高更利于动量因子表现。

机构持仓比例分域的分层评价总结 [page::19]



| 分域方式 | 主要结论 |
|---------------|-------------------------------------------|
| 分段分域 | 机构占比越低,反转、Beta、市值等因子表现更好 |
| 分组分域 | 与分段相似,机构低分组因子效果更佳 |
| 线性分域 | 同时验证机构占比对因子ICIR有显著影响 |
  • 因子分域带来选股逻辑优化,应结合机构持仓结构动态调整量化选股策略。


深度阅读

机构持仓下的因子分域研究详尽解读报告



---

一、元数据与概览


  • 报告标题: 机构持仓(十二) — 因子分域专题报告

- 作者: 刘胜利(注册证券分析师)
  • 发布机构: 长江证券研究所

- 发布时间: 2021年底或2022年初(报告中数据截止2020年末,部分引用2021年数据)
  • 报告主题: 基于沪市投资者结构数据,深入分析机构持仓比例对A股不同因子投资效果的影响,构建因子分域评价体系,提供基于机构持仓比例的分域视角。


核心观点及目标:
作者通过上交所年鉴数据统计2020年沪市机构占比为35.68%,并指出该占比近六年持续上升但提升有限。通过九大风格因子的月度ICIR(信息系数改进比率)计算,建立宽基指数、行业和机构持仓三种因子分域体系。研究发现,机构占比不同,因子有效性表现出显著差异:机构占比较低时,反转、市值、估值、盈利、流动性等因子更有效;机构占比较高时,动量因子更有效,而Beta、波动率和成长因子则表现无效。作者旨在通过分域评价体系,为市场因子策略提供更细致的应用框架。[page::1,2,19]

---

二、逐节深度解读



2.1 投资者结构与机构持仓现状


  • 整体结构:

- 按上交所年鉴数据显示,截至2020年,沪市A股投资者市值占比分布为:一般法人55.97%、自然人22.93%、专业机构17.77%、沪港通3.34%。专业机构的占比不断上升,但提升幅度有限,仅比2019年提升0.04%。
- 自然人投资者中,持仓规模超过1000万元的比例上升至25.15%,超过投资基金15%的持仓比例,显示出现个体大户增长趋势。
  • 个股股东结构样本分析:

- 通过浦发银行等典型个股明细数据,专业机构持股比例相对较低(如浦发银行专业机构8.75%),但在贵州茅台、恒瑞医药等大盘头部股中专业机构比例远高于自然人。
  • 机构比例分布差异:

- 从行业角度看,银行、保险、食品饮料及检测服务等行业机构持股比例领先,反映资金对优质蓝筹板块稳健配置。
- 股票指数大小不同,头部指数(如上证50、沪深300)机构投资者比例显著高于中小盘板块。机构投资更为集中于大盘蓝筹。
  • 趋势: 近年来机构资金逐渐向大市值、高流动性股票集中,但2020年机构持仓比例出现一定松动,尤其是中证500及以下中小盘机构比例有所反弹。[page::5,6,7,8,9]


2.2 因子定义与全域表现


  • 九大风格因子定义:

| 因子 | 指标 | 解释 | 因子方向 |
|---|---|---|---|
| 反转 | Return1m | 过去1月收益率 | 负向 |
| Beta | Beta
1m | 过去1月与市场回归Beta | 正向 |
| 市值 | Lnsize | 总市值对数 | 负向 |
| 估值 | PE
ttm的倒数 | -1/市盈率TTM | 负向 |
| 盈利 | ROEttm | 净资产收益率TTM | 正向 |
| 动量 | Return
1Y | 过去1年收益率(去除最近1月) | 正向 |
| 波动率 | Std1m | 过去1月波动率 | 负向 |
| 流动性 | Turn
1m | 过去1月换手率 | 负向 |
| 成长 | Profit_ttm | 净利润增长率TTM | 正向 |
  • 全域表现差异:

2009-2021年期内,反转、市值、盈利、流动性因子相对较有效。但从2017年开始,盈利、波动率、流动性和成长因子的表现较为突出,反转效应减弱,动量效应规律复杂。流动性因子贯穿全周期效果持续。
ICIR数值表明盈利因子在后期显著提高,动量此前相对负面,后期变化显著。整体显示因子表现有显著时序变动。[page::10,11]

2.3 宽基分域分析


  • 基于沪深300、中证500、中证1000和其他小盘区间划分,将因子在不同市值层次进行分域。

- 2009-2021年样本显示:
- 盈利和动量因子在大盘股(如沪深300)中更有效;
- 反转、市值、高估值、波动率、流动性及成长在小盘股中表现更加突出,如中证1000和其他。
  • 2017年前小市值有效性更明显,2017年后大市值盈利、动量因子效果增强,成分股结构及市场环境可能驱动因子效用差异。

- 盈利因子在全域均表现有效,反转和估值因子也存在分域性效果。
  • 图表中不同宽基区间ICIR分布特征明显,验证市值分层影响因子效用的结论。[page::11,12]


2.4 行业分域


  • 基于长江一级行业分类,归纳为金融类、消费类、周期类、TMT类和制造类五大行业大类。

- 统计显示:
- TMT和制造业中选股因子更为丰富,有效因子较多且持续;
- 周期和消费类市场因子运用效果差异明显,2017年前后表现有较大差异;
- 金融行业因子有效较少且主要出现在2017年后,表现稳定性较弱。
  • 反转、估值、盈利、波动率和流动性因子在行业大类上表现分域效用明显,流动性为全分域有效因子。

- 不同时期行业分域表现显示市场结构和投资风格变化明显,强调行业特征对因子模型建设的重要性。[page::13,14]

2.5 机构持仓分域


  • 分域逻辑:

在机构主导市场中,市场波动更为平稳且偏重价值投资,技术面因子的短期有效性降低;个人投资者占主导时,短期波动大,技术面(如反转、动量)因子有效性提升。
  • 相关性:

机构持仓比例与因子的相关性均较低,但与市值呈较高正相关(约59%),与流动性及波动有一定负相关。
  • 全域因子表现:

机构持仓下的因子表现与全市场相似,但盈利因子波动较大,动量因子表现相对低迷。
  • 机构占比分段分域:

分为五档,显示机构比例越低,反转、Beta、市值、估值、盈利、波动和流动性因子越有效,特别是在2017年之前表现突出。
  • 机构占比分组分域:

采用等数量分组避免样本量不均影响,验证了分段分域的趋势,体现多因素在机构持仓不同分组均有明显分域效应。
  • 机构占比线性分域:

利用连续性数据和剔除机构持仓后的残差因子进行ICIR测算,发现机构比例低时反转、市值、估值、盈利、流动性因子有效,机构比例高时动量因子更有效,Beta、波动率和成长因子无明显分域效用。
  • 总体: 机构持仓占比对因子效应有明显调节作用,机构越多市场越倾向于价值投资特征,个人投资者比例高则技术面因子表现更佳。[page::15-18]


---

三、图表深度解读



3.1 投资者结构相关图表


  • 图1(第5页)显示2007-2020年沪市投资者结构:

- 一般法人占比显著下降,2020年降至约56%;
- 自然人占比先升后稳,2020年约23%;
- 专业机构占比持续提升,2020年约18%。
  • 表1(第5、6页)向下细分自然人投资者中不同持仓规模, >1000万自然人比例从2007年的5.56%增长到2020年的25.15%,反映资金集中趋势加剧。

- 图4和图5(第7页)自下而上计算数据印证专业机构占比自2015年起呈上升趋势,已回升至35.68%。
  • 图6(第8页)不同指数机构持股比例变化,上证50和沪深300机构占优,且机构占比大盘趋于集中,表明机构投资更偏向大盘优质标的。

- 表3(第8-9页)行业视角显示银行(68.22%)、保险(61.44%)等行业机构占比最高,反映产业属性差异。[page::5,7,8,9]

3.2 因子表现相关图表


  • 图7(第11页)九大因子累计IC,反转和市值因子曾有显著负向有效性,盈利、估值因子表现回升,成长因子后期呈上行趋势。

- 图8-10(第12页)宽基分域三期间ICIR表现明显,图示颜色条显示盈利和动量因子在大盘有效,小盘因子表现分散但反转等技术因子更活跃。
  • 表5-6(第11-12页)细化验证:盈利因子全域有效,其他因子分域效应不同。

- 图11-13(第13-14页)行业分域中TMT和制造业多因子有效,反转和盈利因子行业间差异显著。
  • 表8-9(第13-14页)显示因子在行业和时段上的差异化表现特征和稳定性。

- 图14-16(第16页)机构持仓分段分域的ICIR示意,显示机构占比低时反转、Beta、盈利因子显著有效。
  • 图17-19(第17页)机构持仓分组分域基本验证分段分域趋势,机构占比对因子影响稳健。

- 图20及表14(第18页)线性分域揭示机构占比连续影响下因子变化,动量因子偏好高机构占比环境,价值因子偏好低机构占比环境。[page::11-14,16-18]

---

四、估值分析



本报告侧重于因子投资和机构持仓结构分析,无具体个股估值或行业估值目标价设定,故无传统DCF、PE估值模型分析。

报告利用ICIR等统计指标评估因子预测有效性,构建多元分域评价体系通过统计显著性和分段表现判断因子实用性,属于量化研究范畴,非传统估值模型应用。

---

五、风险因素评估



报告明确指出风险:
  • 数据发布时间滞后,仅限上交所标的,无法覆盖沪深两市全样本,可能低估投资者结构多样性和新兴板块特征。

- 统计回溯不代表未来表现,因子策略及机构投资风格可能随市场环境变化显著波动。
  • 分域评价体系不统一,因子表现有时序和空间异质性,导致难以做到跨行业跨市值统一应用。

- 个别行业因子有效性波动较大,金融行业因子稳定性较低。
  • 机构和个人投资者行为界定基于持仓市值占比,忽略市场情绪、流动性突发变化等可能导致局部失真。


风险提示反映研究的周全性,提醒投资者理性识别因子策略适用局限。[page::2,19]

---

六、批判性视角与细微差别


  • 报告虽详尽,但对机构布局的归类假设较粗糙。自然人与机构界限基于市值分布,难以体现机构内部差异(如主动与被动、风格差异)及个人投资者异质性。

- 对沪深两市的研究数据主要来自上交所年鉴,不能全面反映深市及新兴市场特征,存在样本偏差。
  • 机构占比与因子有效性的联动关系虽统计显著,但部分细分区间样本数量有限,可能引发统计误差。

- 机构持仓比例与流动性、波动率呈负相关,但本报告未深入探讨这是否因机构投资者交易风格(如长期持有)引发,属于潜在可挖掘方向。
  • 因子定义标准统一,但市盈率倒数(估值因子)等因子方向定义为负向,与传统正向比例解释存在一定隔阂,需应用时特别注意。

- 报告未涉及宏观政策、市场环境变迁对因子表现的结构性影响分析,若能结合更宏观视角,将增强分析深度。

总体,报告立足统计与实证,客观严谨,但如欲提供超越统计的策略指导,则需结合投资者细分行为偏好及宏观环境考量。

---

七、结论性综合



本报告基于沪市近14年投资者结构数据,创新性地构建了机构持仓因子分域评价体系,对A股常用九大风格因子的表现及其在不同机构持仓环境下的差异性做出了系统洞察,主要结论如下:
  1. 机构投资者比例稳步提升但变化有限,约占34-36%,自然人大户增多趋势明显,大盘蓝筹吸引更多机构资金,行业间机构持仓比例差异显著(银行、保险等领先)[page::5-9]。
  2. 因子表现存在显著时空分异与结构性变化,盈利因子渐渐走强,流动性因子表现稳定,反转与动量因子表现波动大,说明投资风格并非千篇一律,需因市场分域灵活应对[page::10-14]。
  3. 宽基、行业与机构持仓三大分域体系构建清晰展现分域差异:

- 宽基分域显示大盘基本面因子(盈利、动量)效果更好,小盘则技术类因子(反转、市值等)有效;
- 行业分域中TMT、制造因子较多,周期与消费行业因子时段差异显著;
- 机构持仓分域发现机构比例高时市场偏价值投资风格,低时技术因子更有效,动量因子尤其在高机构比例股显著。
  1. 机构持仓影响因子效用的连续性通过线性分域得到验证,反转、市值、估值、盈利及流动性因子呈现机构占比负相关效应,动量因子与机构占比正相关,这表明市场因投资者结构不同,因子表现受投资者行为驱动的特征甚浓[page::15-18]。
  2. 报告提醒投资者慎用因子需兼顾分域差异,尤其在策略构建中应充分考量投资者结构的变迁及所处行业与市值层级,进而提升模型在复杂A股市场的适用性与稳定性。


综上,报告系统分析了机构持仓与多因子投资策略间的深刻联系,为投资者理解机构与个人投资行为差异及其在因子投资中的反映提供了直观有效的实证支持和理论工具,具有较高的实践指导意义和学术价值。[page::1-20]

---

参考图片示范


  • 图1: 沪市投资者市值占比趋势



  • 图7: 9大风格因子累计IC表现



  • 图14: 机构持仓分段分域ICIR表现



  • 图20: 机构占比线性分域累计IC表现




---

【本报告的所有观点及数据均来源于长江证券研究所及公开数据,依此生成,引用时请标注。】

报告