`

选股模型 因子体系(二):从收益归因到因子择时

创建于 更新于

摘要

本报告详细解析了纯因子体系与Fama因子体系的风格因子及行业因子构建方法及收益归因,对比两种体系在沪深300与创业板指的因子暴露及收益归因差异,揭示了因子收益本质是多空组合的相对收益并分析了因子spread及因子crowd择时体系的局限性,为量化投资因子模型构建及择时提供理论指导与实证分析 [page::0][page::3][page::4][page::6][page::10][page::12][page::14][page::15][page::16][page::18][page::20]

速读内容


因子收益构建及纯因子与Fama因子体系对比 [page::3][page::4][page::5]



  • 纯因子体系以线性回归求解因子收益和个股暴露,保证组合在该因子上的单位暴露,同时其他因子暴露为零。

- Fama因子通过分层分组构建多空组合,有助于剥离因子间线性相关影响,持仓更直观。
  • 两体系风格因子日度、月度相关度高,虽幅度不同但走势相似,说明两种构建方法均有效。


行业因子收益构建与相关性分析 [page::6][page::7]




| 行业 | Fama-多空相关度(日度) | Fama-纯因子相关度(日度) |
|-------------|-----------------------|----------------------------|
| 食品饮料 | 约93% | 约90% |
| 银行 | 约71% | 约76% |
  • 除少数行业(如银行)两体系相关度较低外,大部分行业因子相关性较高,食品饮料行业因子收益表现各体系均一致,银行行业差异显著。


风格与行业因子信息重叠及解释能力 [page::8][page::9]




| 回归类型 | R方 | 调整R方 |
|----------|---------|----------|
| 整体回归 | 24.69% | 22.74% |
| 风格回归 | 14.08% | 13.48% |
| 行业回归 | 15.05% | 13.47% |
  • 风格与行业因子对个股收益的解释能力均较强,且信息重合度较低,表明二者在收益解释中具有相对独立性。


因子暴露历史时间序列相关性对比 [page::10][page::11]



  • 两模型因子暴露均呈现较强相关性,纯因子暴露波动较小,Fama回归暴露波动较大。

- 纯因子与Fama模型暴露走势在高相关性因子中相近,低相关性因子存在较大差异。

风格因子收益归因结果对比及主要贡献因子分析 [page::12][page::13][page::14]



  • 沪深300风格因子归因相关度较高,主要贡献为金融板块及规模价值因子。

- 创业板指归因结果差异较大,纯因子体系强调价值和TMT板块,Fama体系分布更均衡。
  • 归因模型能较好捕捉沪深300与创业板指的结构性收益差异。


因子spread和因子crowd择时体系分析 [page::16][page::17][page::18]



| 因子相关性 | 纯因子 | 多空因子 | 杠杆多空因子 | Fama因子 | 杠杆Fama因子 |
|-----------|-------|---------|-------------|---------|-------------|
| 纯因子 | 100% | 93.4% | 100% | 97.1% | 99.98% |
  • 因子spread为对暴露的加杠杆过程,“Beta的Beta”,增强因子表现但风险也放大。

- 市值因子spread与未来因子收益呈反向相关,表明spread未有效预测单位因子表现。
  • 因子crowd依赖估值因子反转,其他非估值因子无择时信号,局限于降低估值因子配置。


归因体系一致性与解释能力影响因素探讨 [page::19][page::20]


| 指标 | 沪深300 时间序列相关性 | 创业板指 时间序列相关性 | 沪深300 截面相关性 | 创业板指 截面相关性 |
|---------------|------------------------|-------------------------|-------------------|--------------------|
| 风格R方 | 27.85% | 25.30% | 68.32% | 76.60% |
| t值最大 | 32.20% | 29.39% | 50.23% | 62.17% |
  • 因子解释能力越强,纯因子和Fama体系归因误差越低,两者因子收益和暴露更为一致。

- 线性无关因子使两体系结果趋于一致,突出因子影响因子组合独立性。
  • 规模因子对沪深300与创业板指相对表现影响减弱,价值因子影响持续显著。


深度阅读

报告分析:因子体系(二):从收益归因到因子择时



---

一、元数据与概览


  • 报告标题:因子体系(二):从收益归因到因子择时

- 发布日期:2020年6月2日
  • 发布机构:长江证券研究所

- 作者及联系方式:郑起等,邮箱qinct@cjsc.com.cn,电话(8621)61118766
  • 主题:多因子模型在中国市场收益归因体系的构建与因子择时思考,重点围绕风格因子与行业因子构建、归因以及因子择时策略。


核心论点
  1. 因子收益本质为基于因子大小构建的多空组合相对收益;

2. 线性模型下,收益归因由因子收益与个股或组合的因子暴露共同决定;
  1. 因子spread和因子crowd两种择时体系虽然增强组合收益但不具备单位因子表现预测能力;

4. 纯因子模型与Fama因子体系在归因结果上高度相关,尤其在具有较强解释力的因子上,两个体系得到的收益归因较为相似;
  1. 基于沪深300和创业板指数实证,解析了因子暴露、收益归因的差异与共性,并对因子择时体系作出批判性评估。


---

二、逐节深度解读



2.1 因子收益构建体系(页3-9)


  • 关键论点

- 多因子模型通过线性回归将个股收益分解为市场收益、因子收益及个股特异收益。
- 风格因子收益由做多因子暴露更大的个股、做空暴露小的个股构成,构建多空组合,其权益权重与因子暴露成正比。
- 行业因子收益本质是该行业市值加权个股相对市场的超额收益。
- 纯因子体系和Fama因子体系分别通过截面和时间序列回归求解因子收益及暴露,前者先确定暴露,后求解收益,后者先确定收益,后估计暴露。
- 风格因子的构建在纯因子体系中保证因子组合在该因子暴露为1,其他因子暴露为0;Fama因子体系采用分层分组剥离风格因子间的线性相关。
  • 主要数据及表格/图表解读

- 图1-2展示了纯因子体系和Fama因子体系下的各风格因子收益净值曲线,表现走势相似,Fama因子的累计收益幅度稍大。
- 表1(页5)风格因子相关性显示日度和月度下,两体系相关性普遍高于直接多空等权构建因子,进一步支持两系统的接近性。
- 行业因子构建类似,纯因子行业因子以行业哑变量构造多空组合,Fama行业因子则采用市值分层后行业多空组合。
- 表2(页7)展示不同行业在两个体系下因子收益的相关性,像食品饮料行业相关性高,但银行行业相关性低,体现行行业因子构建差异。
- 图3-4对比不同体系下食品饮料和银行行业因子收益走势,银行行业中纯因子表现显著不同,显示金融板块的特殊性。
- 图5揭示金融板块(主要是银行)在风格因子暴露上有明显偏离,强化了行业因子构建对金融行业解析的复杂性。
- 表3和图6通过R方分析风格和行业因子的解释能力,整体解释个股收益约23%左右,风格和行业解释相对独立,信息重合有限。
  • 推理与逻辑

- 纯因子体系注重数学上因子组合的正交性,理论较为严密,但组合缺乏直观理解;
- Fama因子体系构建直观,分层方式有效剥离风格和行业相关性,但不能完全消除因子间影响;
- 两者在风格和行业因子的核心解释作用及实际表现上较为一致,尤其在解释主要收益来源时。

2.2 因子归因体系(页10-14)


  • 暴露估计

- 纯因子模型使用因子值计算个股暴露,较为稳定,波动小;
- Fama体系基于时间序列回归暴露,波动大,反映出市场动态调整;
- 表5、图7-10显示两体系风格因子暴露具有明显相关,但回归暴露波动显著,暴露估计方法不同影响暴露波动性。
  • 收益归因

- 因子归因由因子收益和暴露共同决定。
- 表6呈现两体系风格因子归因结果相关性,沪深300规模因子相关性最高,盈利因子相关性不高。
- 图11-14通过实际因子归因时间序列展示两体系归因趋势,归因结果趋同但细节存在差异。
  • 不同体系归因比较

- 图15-16展示风格和行业因子暴露百分比,沪深300与创业板盈利风格暴露关联强,风格因子暴露整体占比大于行业因子。
- 图17-19显示收益归因百分比,沪深300风格与行业主要贡献均趋于共识,创业板存在体系内部差异,但整体对主要因素识别较为一致。
- 两体系揭示沪深300相对创业板指由规模和价值因子主导,其影响随时间在逐渐变化(图20-23)。
  • 推理与假设

- 归因的差异多因暴露估计方法不同所致;
- 两体系均反映因子对收益的重要贡献,尤其在规模及价值因子上。

2.3 因子择时思考(页15-19)


  • 因子Spread

- 定义:因子暴露的杠杆效应,即“Beta的Beta”,通过加杠杆提升因子配置幅度。
- 利用市值因子为例,研究不同体系构建的因子及暴露间相关性,发现暴露乘以纯因子收益的净值走势与直接构建因子收益极为相似(图24)。
- 统计表明,因子Spread与下期因子收益负相关,即离散程度增大时因子收益反而下降,不支持Spread择时的有效性(表8)。
  • 因子Crowd

- 描述因子在市场中被过多追捧(拥挤)程度,主要基于估值因子展开。
- 高Crowd对应过高估值,提示适度降低该因子配置风险。
- 研究显示,除估值因子外纯因子组合因子Crowd信号均为零,限制了因子Crowd在非估值因子的择时作用。

2.4 体系归一思考(页19-20)


  • 核心论点

- 纯因子体系和Fama体系的收益分解形式一致,解释能力受因子间线性相关性影响;
- 存在线性相关性时两体系归因结果趋于一致;
- 因子解释能力强时,归因误差较小,说明体系能更准确分解收益来源;
- 表9数据显示因子解释能力(如风格R方、t值最大值)和归因误差相关性较高。

2.5 总结(页20)


  • 因子收益的本质为多空组合收益;

- 纯因子和Fama因子体系在收益解释上高度相关,但暴露估计波动存在差异;
  • 因子Spread与Crowd虽然增强组合收益,但不具备单位因子表现预测能力,限制了其在组合优化中的应用;

- 归因差异主要来源于因子间相关性及估计方法的不同;
  • 规模因子对沪深300与创业板相对表现影响逐步减弱,价值因子仍维持较高贡献。


---

三、图表深度解读



图1与图2(页5)– 纯因子与Fama风格因子净值


  • 展示了2005年至2020年间纯因子与Fama因子体系下不同风格因子的累计收益。

- 纯因子体系中,规模和流动性因子表现较好,Fama因子体系中反转和盈利等因子表现更加突出,整体净值走势相似,说明两体系捕捉的因子收益表现接近。
  • 不同因子间回报幅度差异显示市场风格演变。


表1(页5)– 风格因子日度/月度相关性


  • Fama因子体系与纯因子体系在不同风格因子上的相关性普遍较高(多数超过70%),高于直接等权多空构建因子,体现Fama分层分组方法有效减少因子间噪声。


图3-4与表2(页7)– 行业因子相关性及净值走势


  • 食品饮料行业因子收益走势较为一致,银行行业因子在纯因子体系表现较弱,Fama因子和多空行业收益相关性稍低。

- 反映金融行业因子的波动和纯粹行业收益模型有较大差异,金融板块因子表现特殊。

图5(页8)– 行业各风格平均暴露


  • 绝大多数行业风格因子暴露无明显方向,仅金融行业(尤其银行)显示出明显的正负偏离。

- 说明行业因子解释能力在金融领域存在特异性。

表3与图6(页8-9)– 纯因子模型风格与行业因子解释能力


  • 回归R方约22.7%,风格与行业解释无显著信息重合,表明两者对个股收益的独立解释能力。


表4(页9)– 风格因子Fama-Macbeth回归


  • 行业因子加入后,除价值和盈利因子稍有变化,其他因子指标(IC、收益、T值等)稳定,验证风格行业的相对独立性。


表5与图7-10(页11)– 纯因子与Fama体系下因子暴露相关性及时间序列


  • 因子暴露相关性适中至较高,暴露时间序列中纯因子暴露变动较小,回归暴露波动性显著。


表6与图11-14(页12-13)– 因子归因相关性及时间序列


  • 沪深300规模因子归因相关性最高,盈利、流动性等因子相关性较低,反映归因体系差异带来的解读分歧。


图15-16(页13)– 因子暴露百分比分布


  • 风格因子暴露占组合暴露比例高于行业因子。


图17-19(页14)– 因子收益归因百分比


  • 表明沪深300和创业板因子收益归因结构的差异,纯因子组合对创业板某些因子(如价值、TMT板块)贡献更集中。


图20-23(页15)– 沪深300相对创业板规模及价值因子暴露与归因时间序列


  • 规模因子暴露逐渐收敛,收益贡献下降,价值因子维持稳健表现,显示风格演变趋势。


表7与图24(页16-17)– 市值因子相关性及净值走势


  • 五种市值因子极高相关,杠杆调整因子收益与纯因子收益净值走势高度重合,彰显单位因子收益的核心作用。


表8(页17)– 因子Spread与收益相关性


  • 负相关显示spread指标不适合作为因子择时信号,挑战了spread择时逻辑。


表9(页19)– 归因误差相关性


  • 说明因子解释能力强弱影响归因误差,因子有明显解释力时归因一致性更好。


---

四、估值分析



报告未详述传统估值模型,主要关注因子收益构建与归因,不涉及价格估值的DCF或相对估值方法。

---

五、风险因素评估


  • 模型失效风险:因子模型基于历史数据,未来表现不确定,存在失效可能。

- 因子间相关性:非线性关系及多重共线风险可能削弱模型有效性。
  • 择时模型局限:因子spread与crowd无法有效预测单位因子表现,可能带来择时失败风险。

- 行业特异风险:金融行业因子的特殊表现可能引入异常风险。

报告明确提示上述风险但未提供具体缓释方案。

---

六、批判性视角与细微差别


  • 模型框架差异:纯因子体系和Fama因子体系在因子收益和暴露估计顺序存在根本差异,影响实际结果解释,一定程度限制体系间的兼容与统一。

- 因子择时方法受限:因子spread与crowd未能预测单位因子收益,提示传统择时策略应更加谨慎,可能需要结合宏观经济或行为金融指标完善择时模型。
  • 行业因子解析局限:特别是金融板块因子表现差异,显示基于单一行业划分的模型对复杂行业的解释能力不足。

- 解释率有限:整体多因子模型平均只能解释个股收益约20%,意味着较大部分收益可能来源于其他因素,如特异风险或非线性因素,提醒投资者模型仅为辅助工具。
  • 数据限制:回归暴露采用数据有限(如月度因子20个样本点),可能影响暴露估计的稳定性和准确性。


---

七、结论性综合



本报告深刻剖析了中国市场中多因子体系的收益归因机制与因子择时方法,重点总结如下:
  • 因子收益构建:风格因子收益来源于多空组合差异,行业因子收益是相对于市场的行业超额收益。纯因子与Fama因子体系分别构建因子暴露与收益,具有数学性质与实用性的不同侧重。

- 因子归因:收益归因由因子收益与因子暴露共同决定。实证分析显示,两个体系在主要风格和行业因子归因方面结果高度相关,均能较好识别沪深300与创业板指间的风格演变,规模因子的影响逐渐减弱,价值因子影响持续。
  • 因子择时:因子spread与crowd方法本质上未能提供单位因子表现的有效预测,存在逻辑和实证局限,强调需谨慎应用于组合优化。

- 模型解释能力及适用性:多因子模型对个股收益解释能力有限,平均约20%,理解模型不足部分对全面风险管理至关重要。
  • 体系差异来源:归因的差异源于因子间线性相关性及因子构造方式,解释性能强的因子有助减少体系间的归因偏差。

- 实操启示:因子收益的理解与归因分析能为投资策略开发提供重要方向,尤其在确定市场主要风格转折点和风险暴露方面价值显著。

综上,报告为因子投资研究与应用提供了详尽理论支持和实证验证,但同时指出因子择时的局限性与因子间相关性的复杂性,提醒投资者在实际操作中需综合考量多维信息,避免简单依赖单一因子指标。

---

溯源引用



本文所有分析均基于提供的报告内容,引用页码详见括号标识:

[page::0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20]

报告