量化和主动对选股因子相关性的考量
创建于 更新于
摘要
本报告深入研究了量化多因子体系中因子相关性的表现差异及其处理方法,提出在量化投资中建议对因子进行行业及更多风格的正交处理以剥离非增量信息。同时,探讨了主动投资者因无明确基准,保留因子原始相关性选股组合的合理性。通过对BVOL因子、高管薪酬因子和股息率因子的实证分析,揭示不同相关性处理方法对因子收益和选股表现的影响,强调了量化与主动投资在因子处理上的不同策略选择,为投资者提供了理论与实证结合的量化因子使用指导。[page::0][page::3][page::4][page::8][page::12][page::16]
速读内容
因子相关性普遍存在,对因子表现产生影响 [page::4]
- 9类风格因子之间存在显著相关性,如波动率与换手率相关性高达0.64,价值与波动率呈负相关。
- 逐步正交处理后,因子IC标准差普遍下降,部分因子IC均值减弱,分组表现单调性发生变化。
- 纯因子组合收益显示原始因子与正交因子对资产价格总体解释能力相近,但单个因子收益存在较大差异。
量化中因子相关性的三种处理方式与比较分析 [page::8][page::9][page::10][page::11]
- 三种处理方式:保持原始因子、对因子进行行业和市值正交、行业和9个风格因子正交。
- BVOL因子回测显示:行业和风格正交后因子分组收益显著下降且多头部分单调性弱化,提示剥离更多相关性较合适。
- 高管薪酬因子中,原始因子表现与预期逻辑相悖,行业和市值正交提高表现,行业和风格正交则使分组表现单调性降低,确认需要更细粒度正交处理。
| 因子处理方式 | G1 | G5 | G10 |
|--------------|--------|--------|--------|
| BVOL原始因子 | -1.35% | 0.05% | 0.80% |
| 行业&市值正交 | -1.50% | 0.08% | 0.79% |
| 行业&风格正交 | -1.03% | 0.14% | 0.43% |
| 高管薪酬原始 | -0.20% | 0.07% | 0.16% |
| 高管薪酬行&市值 | 0.26% | -0.07% | -0.33% |
| 高管薪酬行&风格 | 0.11% | -0.02% | -0.19% |
- 回测图片展示三种处理下分组收益变化,直观反映正交带来的表现差异。


主动投资中不处理因子相关性的合理性及股息率因子表现 [page::12][page::13][page::14]
- 主动投资因无明确跟踪基准,强调主动管理能力,倾向保留因子原始相关性以最大化市场判断表征。
- 股息率因子覆盖率高,沪深300分红股票比例从80%增长至90%以上,股息率存在明显行业和风格偏离。
- 高股息组合表现出一定超额收益,尤其在市场大幅下跌阶段更具避险特征,符合主动投资者避险需求。



股息率叠加成长因子优化选股组合实现增强收益 [page::15]
- 基于股息率最高组内再依成长因子分组“取交集”,最终持有高股息高成长组股票。
- 回测显示该组合较纯高股息组合具有显著的累计超额收益增强。

结论总结 [page::16]
- 因子相关性是普遍且不可忽视的问题,影响因子有效性评判。
- 量化研究应剥离因子间相关性,推荐行业加多风格正交方案。
- 主动投资因无固定基准可适当保留因子间相关性,最大化市场判断特征表达。
- 股息率因子案例体现量化与主动投资者间实际操作之差异。
深度阅读
金融研究报告详尽分析报告
1. 元数据与报告概览
- 报告标题:《量化和主动对选股因子相关性的考量》
- 作者与机构: 西部证券研发中心,分析师王红兵主导,报告联络人杨俊文
- 发布日期: 2019年11月22日
- 报告主题: 主要围绕量化投资与主动投资中的选股因子相关性问题展开,从理论、实证及应用角度对因子相关性处理策略进行系统阐述,尤其对量化多因子体系中因子的正交处理和主动投资中因子相关性不处理的合理性进行深入分析。
- 核心论点及传达信息:
- 因子之间普遍存在相关性,相关性的处理方式会显著影响因子的表现及有效性评估。
- 在量化多因子选股中,建议对因子进行对行业和更多风格因子的正交处理,以更科学合理地评价因子增量信息。
- 主动投资者由于缺乏明确跟踪基准,不处理因子间相关性而选用原始因子构建组合是合理的,目的在于最大化表达他们对市场的主观判断。
- 股息率因子举例说明主动主体和量化主体在因子使用上的不同策略和考量。
- 报告结构:
报告共分为引言、因子相关性分析、量化多因子体系相关性处理、主动因子选股策略考量、实证分析(凭借股息率等因子)、总结与风险提示等章节,辅以丰富图表和实证数据,结构严密,层层递进。[page::0,1,3]
---
2. 逐节深度解读
2.1 引言
引言部分回顾了因子研究的学术和实务背景,从CAPM单因子模型到Fama-French三因子模型、Barra多因子风险模型的发展轨迹,指出因子间存在显著相关性的问题,并提出当前行业内对如何处理相关性的分歧。两种主流正交方法——仅对行业和市值正交,与对行业及更全面的风格因子正交进行对比。强调,因市值本质也是风格因子之一,因而仅剥离行业和市值有限,更多风格因子的正交更为合理。引言还提出主动投资者往往不剥离相关性,因其无明确基准、强调主观判断最大化。引言为后文分析奠定框架和立场。[page::3]
2.2 因子间相关性带来的表现差异(章节二)
- 相关性普遍存在且显著: 通过构建9类风格因子,计算2010年至2019年两两相关性,发现因子之间相关性不可忽视。如波动率与换手率达到0.64高正相关,价值因子与波动率呈负相关。
- 正交处理介绍与理论机制: 引入“逐步正交法”,通过数学集合的交集剥离相关性,详细说明正交序列和结果,通过图示形象阐释因子剥离相关性后的独立性。
- 表现对比: 原始因子与逐步正交因子的IC(Rank IC)平均值和标准差比较显示,正交后多数因子IC标准差下降,波动率和价值因子IC均值下降明显,说明正交影响因子稳定性和解释力。
- 因子分组表现: 以波动率和流动性因子为例,原始因子分组收益大体单调,而正交后表现改观,波动率正交后表现无明显单调性,流动性有所改善。
- 纯因子组合收益分析: 采用截面回归法得出行业+原始因子组与行业+正交因子组对资产价格波动的解释能力(拟合优度)相当,但部分单个因子表现存在变量,如Momentum、Size。
- 结论: 因子相关性普遍,需要处理才能合理评估因子有效性。同时,因子经济含义完整性与统计有效性存在权衡,量化和主动两类投资者对应两种拥趸。 [page::4,5,6,7]
2.3 量化多因子体系中因子相关性处理(章节三)
- 理论背景与模型框架说明: 基于多因子定价理论,因子(f_k)解释了资产共同波动,剔除行业和现有因子后残差中的增量信息即新的因子。
- 三种处理方式对比: 不处理相关性、对行业和市值正交、对行业和包括市值等更多风格正交。
- 建议处理方案: 采纳对行业和多风格正交,基于两点:市值等同风格因子,并且部分因子与风格相关性高于市值相关性。
- 案例分析1 - BVOL因子:
- BVOL(改进波动率因子)与多风格相关,尤其Beta、Momentum、Volatility庞大相关。
- 不同处理方式下的性能表现(组间收益和单调性):
- 原始因子表现最好,行业市值正交稍微下降,行业风格正交明显下降。
- 风格正交过度影响多头部单调性的减少,对指数增强策略表现造成影响。
- 案例分析2 - 高管薪酬因子:
- 高管薪酬因子与Size、EarningsYield等风格因子相关。
- 原始因子出现逻辑矛盾(高薪酬股票收益反向),行业市值正交后表现极佳且单调,风格正交进一步剥离相关性后表现不单调。
- 结论是处理时应剥离至行业和风格水平,尤其对年度因子体现更合理。
- 总结: 因子相关性的处理是评估并提炼因子增量信息的重要步骤。对不同因子,适度的正交处理能够提升因子纯度,为策略应用提供科学依据。[page::8,9,10,11]
2.4 主动投资者对选股因子相关性考量(章节四)
- 主动投资和量化投资主要差异: 主动投资缺乏明确基准,更重视主观市场判断,因而不剥离因子相关性以最大化因子经济含义。
- 股息率因子实证:
- 分析了市场及沪深300中分红股票占比稳步上升,尤其沪深300中90%以上股票有分红。
- 行业股息率存在显著分布偏差,纺织服装、银行、汽车、石化等行业股息率较高,国防军工等较低。
- 股息率与其他风格相关性:与低估值、低成长、低换手等特征高度相关。
- 股息率因子分组收益表现不完全单调,但最高手收益组表现卓越。
- 构建高股息组合对比基准回测,观察在市场下跌阶段如2011-2012、2015年、2018年显著超额收益,凸显其避险和波动中收益特性。
- 股息率+成长因子联动选股:
- 采用“交集”筛选策略,先股息率三分组,再在最高股息组中按归母净利润同比增长再分三组。
- 高股息高成长组合显著优于单纯高股息组合,提升了超额收益稳定性和效果。
- 结论: 主动投资者利用因子更多追求经济含义和市场表达,不同于量化体系对统计纯度的追求,尤其在特殊市场环境中选择不剥离因子相关性策略合适。 [page::12,13,14,15]
2.5 总结(章节五)
- 因子相关性广泛存在,是否及如何处理相关性影响对因子有效性评判。
- 量化多因子体系建议剥离行业及更多风格相关性,客观评价因子增量收益。
- 主动投资者缺少明确基准,持有原始因子组合合理,能最大化因子经济含义表达。
- 以股息率为例,量化者控制行业风格分布,主动者则自然集中于全市场最优股票。
2.6 风险提示(章节六)
- 统计结论基于历史数据,未来市场结构可能变动。
- 历史表现不能机械外推,投资需谨慎。
2.7 附录:风格因子构建详细方法
- 报告附录详细列出9类风格因子及其子因子构建计算方法,包括Beta、动量、规模、收益率、波动率、成长、价值、杠杆和流动性因子。
- 计算方式涵盖收益序列回归、市值对数、现金流比率、复合增长率等多种指标。
---
3. 关键图表深度解读
图1:逐步正交法集合示意图(Page6)
- 展示三个因子集合A、B、C以及它们相互间的交集代表相关性。
- 逐步正交顺序剥离交叠部分,确保最终各因子集合不重叠、互不相关。
- 图示为相关性剥离的形象化,解释方法论核心。
表1:风格因子截面线性相关性(Page5)
- 显示9个风格因子两两之间的相关系数。
- 波动率(Vola)和流动性(Liqui)最高相关0.64,说明高波动股票一般换手率也高。
- 价值(Value)与波动率负相关-0.42,反映低估值股票多为低波动股票。
- 该表直观体现了因子相关性的普遍性和复杂性。
表2、表3:原始因子与逐步正交因子IC表现对比(Page5)
- 表2中原始因子IC均值波动较大,IC标准差普遍较高。
- 表3中正交因子IC标准差显著降低,部分因子IC均值下降,反映正交处理提升了因子稳定性但可能削弱部分因子信号强度。
图2-5:原始与正交后Volatility、Liquidity因子分组表现对比(Page6)
- 原始Volatility呈现较清晰单调收益趋势,正交后单调性明显减弱,尾部尤其变化显著。
- Liquidity正交后分组收益整体提升,单调性提升。
- 说明相关性剥离对部分因子结构性表现产生较大影响。
表4:因子组合收益及拟合度(Page7)
- 原始与正交因子组合总拟合度(R²)相近,说明两组因子解释资产价格整体水平一致。
- 单因子收益差异显著,如Momentum因子正交后收益加大幅度负向,Size波动明显。
图6、表5、图7:BVOL因子相关性及分组表现(三种相关性处理,Pages9-10)
- BVOL因子与多风格因子存在关联,其中与Momentum、Volatility有较强正相关。
- 三种处理方式分组收益排名单调性:原始>行业市值正交>行业风格正交。
- 风格正交显著削弱了多头侧收益,提示处理相关性时需权衡实际策略需求。
图8、表6、图9:高管薪酬因子相关性与表现(三种处理方式,Pages10-11)
- 薪酬因子与Size因相关性显著,原始因子分组出现“逻辑违背”收益趋势(高薪酬收益反而较低)。
- 行业+市值正交处理获得经济合理且单调的分组收益表现。
- 全部风格正交后表现趋缓且非单调,说明过度剥离非必要相关性可能削弱因子实际应用价值。
图10-11:市场与沪深300股票分红占比趋势(Page13)
- 反映市场整体及沪深300内分红比率的稳步提升,展示股息率因子基础覆盖度。
图12-14:行业股息率均值、股息率与风格因子相关性、股息率因子分组表现(Pages13-14)
- 行业间股息率差异明显,银行、汽车等行业股息率领先。
- 股息率因子负相关成长、换手,正相关低估值。
- 分组收益存在超额,高股息股票组别表现优于低股息组别,体现因子有效性。
图15:高股息组合累计超额收益与市场指数走势(Page14)
- 高股息组合在市场显著下跌阶段明显跑赢市场,尤其2011-12、2015年、2018年,凸显其风险管理及避险属性。
图16:股息率叠加成长因子组合累计超额收益(Page15)
- 叠加成长因子后高股息组合提供持续且稳定的额外超额收益,印证因子叠加协同效应。
---
4. 估值分析
本报告属于策略研究分析,未涉及传统估值方法如DCF、市盈率等,但对因子价值和增量信息的量化评估通过IC表现、因子分组收益、截面回归拟合度(R²)体现。因子正交处理即算是一种“因子纯度”重估过程,剥离冗余相关信息,增强因子增量价值的识别。同时通过实际分组收益验证因子策略效果,间接反映因子“估值”的实际应用表现。
---
5. 风险因素评估
- 历史数据依赖与市场结构变化: 报告所示分析和结论均基于2010年至2019年历史数据,未必适用未来市场结构变迁,尤其因子有效性可能因经济周期或市场微结构调整产生动态变化。
- 因子相关性处理的模型假设风险: 正交处理基于线性相关性剥离,可能忽视非线性、时变相关等复杂关系。过度正交也会削弱因子经济含义,影响投资决策实效。
- 主动投资策略基准及市场行为变化风险: 主动投资者无固定基准,组合构建较为自由,市场行为若发生剧烈变化或资金风格转变,因子选股策略预期收益可能遭受冲击。
- 数据质量及指标定义风险: 因子构建依赖财务和市场数据准确性,数据缺失、更新延迟及错误可能影响结果准确性。
报告已明确提示风险,并无具体缓解机制,投资者需结合自身实际情况谨慎决策。[page::0,17]
---
6. 批判性视角与细微差别
- 报告对两派学说——因子经济解释派与统计纯净派的较好平衡,但在具体“最佳正交方案”推荐上,基于统计相关性辩护,可能忽略了不同市场、行业生态差异对风格因子定义和表现的影响。
- 正交流程是线性剥离,但大部分资产定价因子可能存在非线性关系,报告未涉及非线性或复杂模型校正机制,可能限制研究结论普适性。
- 量化案例选取较具代表性,但某些因子如高管薪酬正交后效果下降,提示过度剥离可能导致经济直觉与统计结果冲突,使用时需考虑因子本质。
- 主动投资者部分论述假设无明确基准且追求最大市场表达,未充分探讨主动投资者在实践中是否存在隐性或软性基准,这对因子处理策略可能带来微妙影响。
- 报告总体未详述因子正交实施的技术细节及回测具体参数(如样本选择、调仓频率等)对结果的敏感性,相关结果的稳健性值得后续验证。
---
7. 结论性综合
本报告系统梳理了选股因子相关性这一量化投资和主动管理领域的重要议题。从理论引入、方法论解释、统计相关性实证、相关性处理方法对比、代表性因子案例分析,到主动投资者因子使用逻辑,报告全方位展示了因子相关性问题的复杂面貌及应对策略。
报告通过严谨的统计分析证实,因子间相关性普遍存在,不同的处理方式影响因子的IC表现、分组收益以及纯因子组合的收益解读。逐步正交方法通过逐层剥离行业和多风格因子相关性,提升因子纯净性,便于量化投资者更准确地识别因子有效性与增量价值。但同时,调整后部分因子经济含义被削弱或表现受到负面影响,过度剥离造成的单调性降低和收益波动增加不能忽视。
主动投资者由于其投资目标与量化不同,不存在固定基准,强调“最大化表达自我判断”,因此不剥离因子相关性,直接使用原始因子构建组合是合理且有效的。以股息率因子为例,报告细致呈现其市场覆盖度、行业及风格偏差,以及在市场不同阶段的防御性超额收益表现,并展示了在股息率因子基础上叠加成长因子的进一步超额收益提升,有力印证了主动投资因子策略的实践意义。
图表数据精确展示了因子相关性程度、因子表现变化、因子正交与否对策略收益的具体影响,提供了极具参考价值的量化证据和视觉支持。因子构建附录确保理论与实践过程结合。
综合来看,报告科学区分量化投资和主动投资中因子相关性的本质差异和适宜处理方式,提出了实用操作建议,并通过案例强化论证,兼具学理深度和实务指导性,为投资者在设计和使用股市因子策略时提供了宝贵参考。
---
参考图片(部分重要图示示例)
- 图1(逐步正交法示意图)

- 图6(BVOL因子与风格因子相关性)

- 图10(全市场分红股票占比)

- 图15(沪深300高股息组合累计超额收益)

- 图16(股息率叠加成长因子选股表现)

---
以上为对该份西部证券《量化和主动对选股因子相关性的考量》报告的系统且详实的解构与分析,涵盖报告所有重要论点、数据、图表及结论,兼顾理论与应用,适合金融策略研究及投资实务参考。