谁是 “聪明钱”?资金流因子全面测试兼正交化方法详解
创建于 更新于
摘要
本报告全面测试200余种资金流因子,重点分析“小单流入额”因子收益来源及与成交额、市值等流动性因子的关系,提出了创新的“部分对称正交化”方法,剔除流动性影响后仍发现资金流因子具备一定选股价值。以部分对称正交后因子构建组合,在中证500成分股表现出超额年化收益11.7%。报告还揭示资金流因子非事件性信号特征及非线性效应,为量化因子研究提供新视角和方法 [page::0][page::3][page::27]。
速读内容
小单流入额因子表现突出且区分度高 [page::3][page::4]

- 小单流入额因子IC平均值为-9.90%,分组收益单调且显著,表现优于中证500基准。
- 多空比价净值曲线显示显著超额收益,因子单调性在多年稳定保持。
小单流入额因子并非事件性信号,IC衰减半衰期长达138交易日 [page::5][page::6]



- 资金流因子与前期因子值相关性强,稳定性好。
- IC值衰减缓慢,资金流体现为股票的固有属性而非短期资金事件。
资金流因子与成交额、市值呈较强相关性,部分因子为流动性指标 [page::6][page::7]

- 小单流入额因子分布呈对数正态,相关性低估问题显著,真实相关度40%以上。
- 资金流类因子与成交额因子相关性90%以上,接近流动性指标。
“流入”与“流出”因子表现类似,非简单的交易方向信号 [page::8][page::9]


- 小单流入额和小单流出额因子IC表现均较显著且方向一致,说明资金“流入”“流出”标签并非本质。
- 多种单量范围的资金流因子关联性高、收益趋势相似。
控制成交额及市值后的超常资金流因子仍具一定预测能力 [page::9][page::10]
| 因子 | IC均值 | ICIR | ICt值 |
|--------------|----------|-------|---------|
| 大单流入额 | 3.50% | 0.39 | 4.55 |
| 小单流入额 | -3.62% | -0.37 | -3.22 |
- 超常大单成交额与收益正相关,超常小单成交额与收益负相关。
- 两者相关系数负值,高度负相关但仍反映同一信息。
提出“部分对称正交化”方法,有效去除风险因子影响且保留因子有效性 [page::11][page::16][page::17]

- 回归取残差法使新因子与原风险因子正交并最大化相关性,是当前最优正交方案。
- 部分对称正交更合理,兼顾与原因子正交及多个因子同步旋转,避免排序次序依赖。
- 回测显示两种正交方式均有效,但回归残差法多空收益略优。
基于部分对称正交的大单流入额、小单流入额组合表现优异,超额收益显著 [page::17][page::18]
| 分组 | 年化收益率 | 2017年收益 | 2018年收益 (至5.25) |
|-----------------|------------|------------|---------------------|
| 最大组 | 11.3% | 9.1% | 6.4% |
| 中证500基准 | 3.5% | -0.2% | -5.3% |
- 合成因子年化收益率达11.3%,显著超越市场基准。
- 2017年和2018年持续展现超额收益价值。
200多个资金流相关因子测试总结及非线性效应挖掘 [page::24][page::25][page::26]


- 非正交因子IC较高但高度依赖流动性因子,正交后IC普遍下降但仍有可观收益。
- 部分因子呈现非线性收益效应,中间因子值对应高收益,极端因子值收益下降。
- 小单净流入额因子非线性特征明显,中间组收益率最高。
研究总结 [page::27]
- 小单流入额因子是成交额类流动性指标,多数收益被流动性因子解释,非事件性资金“流入”信号。
- 提出“部分对称正交”方法,有效剥离风险因子影响,构建的资金流复合因子在中证500取得超额收益11.7%。
- 推荐关注正交后大单流入量/成交量差异等资金流指标,反映“聪明钱”行为,更具实用价值。
深度阅读
基础因子研究 (五)——资金流因子全面测试兼正交化方法详解报告深度分析
---
1. 元数据与概览
- 报告标题:《基础因子研究 (五):谁是“聪明钱”?资金流因子全面测试兼正交化方法详解》
- 作者及机构:长江证券研究所,金融工程专题报告
- 发布时间:2018年6月11日
- 主题:对资金流因子,尤其是小单流入额、大单流入额等因子在A股市场的表现、内在逻辑及正交化处理进行系统的研究,旨在识别及提炼可以体现“聪明钱”交易行为的有效因子。
- 核心论点:
- 小单流入额因子IC(信息系数)达-9.90%,表面收益显著,但本质为量价类指标,与成交额、市值等流动性因子高度相关,收益主要由流动性属性驱动,剔除流动性后仍有一定价值。
- 传统回归取残差的正交化是最推荐的正交化方法,但提出了新的“部分对称正交化”方法,旨在确保新因子与旧风险因子正交且不依赖正交顺序,有助于多因子整合。
- 通过“部分对称正交法”合成的大单流入额和小单流入额因子,在中证500成分股中实现了显著超额收益(2018年至今累计超额收益11.7%)。
- 对200多种资金流因子的全面测试揭示了多个优质因子组合,推荐以正交后的大单与小单相关流入率差异为核心因子[page::0,1,3,27]。
---
2. 逐节深度解读
2.1 小单流入额因子定义及表现
- 小单流入额限定为挂单额小于4万元的买单成交额,用数据接口字段“mfdbuyamtd”等获取。
- 回测区间2010年2月至2018年5月,共分为10组等权组合,小单流入额越低的股票,后续收益越高,因子IC均值达-9.90%,显示因子区分度明显(图1、2)。
- 多空比价净值曲线表明最大组与最小组收益差异显著,且收益稳定性好(图3、表1),这体现因子对未来回报具有预测作用。
2.2 因子收益来源分析
- 非事件性信号:因子IC与前一个交易日及月末截面因子值的相关系数均较高 (>70%)(图4、5),显示因子表现为股票固有属性而非短期资金流入事件,且IC衰减半衰期长达138交易日(图6、7),支持因子为具有持久性的长期属性。
- 被低估的相关性:小单流入额因子分布呈对数正态(图8、9),直接线性相关系数低估与市值的依赖。经对数处理后,相关性显著提升到约40%-46%(图10-12),且与成交额、市值、换手率等流动性因子均有较高秩相关(图13)。
- 与资金流“入”无关:不仅小单流入额与收益负相关,小单流出额也同样呈现负相关;八种资金流因子(按单量大小分类流入流出)两两高度相关,且多因子表现相似,主要反映了成交额的流动性特征(图14-18)。此结果质疑了“资金流入即为聪明钱”的简单认知,指资金流因子更多反映成交量特征[page::3-7,8-9,27]。
2.3 超常资金流向与正交化
- 通过控制成交额或成交额与市值,提取超常资金流向因子(即剔除流动性基本面贡献的残差),得到大单流入额和小单流入额呈方向相反的超常信号(表2、3),且两者负相关(图19)。
- 该超常资金流向因子表现稳定,多空比价收益持续(图20)。
- 正交化详解介绍三种主流方法:
- 回归取残差法:最常用,残差平方和最小,确保正交且与基因子相关性最大,适合单因子检验。
- Löwdin对称正交:确保所有因子之间彼此正交,但因子未必与原因子正交,导致难以与原因子比较。
- 部分对称正交:结合上述两者优点,确保新因子对原风格因子正交,避免对非风险因子正交次序排序限制,更利于多因子组合构建。
- 理论性质证明:
- 正交因子加入截面回归,不改变原因子的因子收益,若正交因子显著则代表新增信息。
- 标准化正交因子因子收益与IC成正比,IC体现预测能力,波动率体现截面分化度。
- 实测结果表明,经过回归取残差法正交的大单流入额和小单流入额新因子与正交前相关仅约30%(图21),且二者间相关由正转负(图22),显示正交后因子具有较独立的信号。对称正交效果因因子未完全与原因子正交导致难以比较(图23)。纯因子组合实现形式不同,净值曲线展现其潜力(图24)。
- 部分对称正交方法使得大单流入额与小单流入额因子互相正交,且对风险因子完全无关联(表5、6)。
- 不同正交方法(回归残差法、部分对称正交)IC及分组表现对比见表7、图25、图26,结果显示回归残差正交保留信息更多但因子间高度相关,部分对称正交能有效整合多个弱相关因子形成合成因子。
- 以此合成因子构建中证500股票组合,实现年化收益11.3%,显著超越基准中证500成本3.5%(表8),2017年至2018年上半年均表现优异(图27、28)[page::9-18]。
2.4 资金流因子全集测试及非线性效应
- 系统整理“AShareMoneyFlow”库中57个基础资金流因子及153个衍生因子(表9、10)。
- 测试发现原始资金流因子IC高,但多与成交额相关,剔除相关性后表现减半仍有小幅预测力,单一资金流因子意义受限(表11、12、13)。
- 推荐组合因子为“大单流入量/成交量-小单流入量/成交量”、“大单流入率-小单流入率”等差值型因子。
- 部分资金流因子存在显著非线性效应,收益在中等因子值区域较高,两端较低(表13,图30)。如小单净流入额因子收益呈现抛物线型,中间水平因子值对应最高收益。
---
3. 主要图表解读
图1-3(小单流入额因子分组表现)
- 图1展示因子根据小单流入额将股票分为10组后的年化收益走势,最小组收益超过20%,最大组亏损超过15%,区分明显。
- 图2展现时间序列上因子IC的波动,平均-9.90%,说明负IC值的稳定性较强。
- 图3多空比价净值曲线(最大组与最小组净值比)稳步上升,累计涨幅突出,说明该因子成功捕捉到收益差异。
- 这些数据表明,小单流入额因子虽表现显著,但构建的组合收益主要是基于流动性特征。
图4-7(因子信号稳定性及衰减)
- 图4、5揭示小单流入额因子值与历史日期相关系数高(逾85%),说明因子为稳定属性,非短期事件型。
- 图6显示后续多日的平均IC值逐渐衰减,呈指数下降,半衰期达138天,指示因子预测信号长期有效。
- 图7理论与实测的累积IC曲线吻合,进一步确认因子稳定性。
- 以上印证资金流因子更多反映股票固有特征而非即时资金事件。
图8-13(分布特性及相关性)
- 图8、9小单流入额服从对数正态分布,极端值稀少,使线性相关低估真实关联。
- 图10散点图线性相关系数仅0.05,实际因取对数或秩相关系数后提升至40%以上(图12),正确捕捉因子与市值关系。
- 图11按分组统计市值,显示因子值上升对应市值漂移。
- 图13显示与成交额相关最高(90%),其次为市值、换手率,反映量价类指标特征。
- 这些说明小单流入额为成交额的细分表征,更倾向流动性因子。
图14-18(八种资金流因子及IC表现)
- 图14、15全市场不同挂单额级别的流入流出占比走势,中单流量最大,其次大单、小单,超大单最小。
- 图16矩阵显示八种资金流因子高度相关,特别是同一挂单级别入出额相关几乎达1。全市场资金流分布均匀,呈现强烈协动模式。
- 图17、18 IC与IC_IR显示小单和中单因子表现优于大单和超大单,负向IC体现逆向交易特征。
- 资金流入出额本质为成交额驱动,收益主要来源于流动性而非资金属性。
表2-3、图19-20(超常资金流与多空比价)
- 去掉成交额或市值对资金流因子影响后,超常资金流因子实际IC出现正负反转,表明大、小单的超常资金流取向相反。
- 图19相关系数负,图20多空收益表现稳定,显示提纯后的资金流因子能独立提供信息。
- 超常资金流向成为衡量资金异常活跃度的有效信号,辅助发掘潜在alpha。
因子正交方法及实证(图21-29,表4-8)
- 图21的相关性下降验证因子正交有效剥离相关风险因子影响。
- 图22表明正交前大、小单流入因子高度正相关,正交后转负,降低冗余。
- 表4正交后因子的IC仍显著,典型为大单流入额、小单流入额。
- 图23显示对称正交后因子仍暴露市值、成交额等风险因子,约70%相关,正交目的不全达成。
- 表5-6、表7比较部分对称正交和回归残差法,部分对称正交保持了因子正交且降低因子间相关,虽然IC略低,但多因子组合效果更好(图25-26)。
- 最终合成因子年化收益达11.3%,显著跑赢3.5%的基准(表8),证明改进正交化提升组合表现。
- 图29显示部分对称正交合成的多因子组合优于单因子或回归残差正交合成,说明协同作用明显。
非线性效应(表13,图30)
- 借助二次回归检测非线性,发现部分资金流因子有显著负二次系数,收益在中值因子区域最高,呈拱形曲线。
- 具体以“小单净流入额”为例,中位组收益最高,极端高低组反而表现差(图30)。
- 非线性特征提示因子应用时考虑加权非线性调整,提升预测准确性。
---
4. 估值分析
本报告非公司或股票估值研究,未涉及DCF、市盈率等传统估值方法,重点聚焦因子测试和正交化技术的因子有效性和组合表现,因此“估值”一节不存在。
---
5. 风险因素评估
报告未专门列出风险因素章节,但隐含风险点包括:
- 资金流因子实际多为流动性指标,可能随市场行情和流动性环境变化大,非纯alpha信号。
- 高频变化的资金流可能难以普适,且历史表现不保证未来。
- 正交化处理过程中,剔除风险因子暴露带来信息损失,可能影响因子预测能力。
- 多因子高相关性降低组合多样性风险调节效果。
- 数据完整性与质量问题影响因子稳定性。
报告通过正交化和多因子合成对冲、降低风险因子暴露,部分策略以降低此类风险[page::27,28]。
---
6. 批判性视角与细微差别
- 报告多次强调小单流入额等因子经济学意义“非资金流特征”,而是成交额流动性因子,实质表明该因子本身无法直接反映“聪明钱”行为,警示以资金流名义误解。
- 相关性高和收益均带负号现象,提示市场中“散户资金多进多出”往往与后期表现偏差,但解释不够深入,存在理论上的不确定。
- “部分对称正交”提出作为创新解决方案,虽然实证效果较好,但报告未讨论其计算复杂度、稳定性及对极端数据的鲁棒性。
- 尽管因子非线性效应被检测与提出应用,缺少更细致的构建与部署方案。
- 正交后因子IC下降近半,提示流动性因子信息可能大量重叠,单一因子开发警惕过拟合风险。
- 报告亚稳性检验不足,策略性能是否跨周期、跨市场复现未明。
- 数据仅覆盖2010年至2018年中,样本时间有限,难以完全反映多变多元的市场环境。
---
7. 结论性综合
本报告系统探讨了资金流因子的本质、收益来源、及其优化组合的构建方法,重点突破在于:
- 揭示小单流入额因子作为代表的资金流指标,实质为成交额度量的流动性因子,具有显著的预测能力但多受流动性影响;
- 资金流“流入”或“流出”简单划分并不能直接对应“聪明钱”或“愚笨钱”,不同单量级资金流紧密互相关联;
- 通过创新的“部分对称正交”方法,有效剔除风险因子暴露,同时保留因子有效信息,改善单因子冗余且高度相关的问题;
- 合成的正交资金流因子在中证500股票上实现年化11.3%的超额收益,远超基准表现,验证策略有效性;
- 通过对200多个资金流因子的全面测试和筛选,明确推荐“大单流入量/成交量–小单流入量/成交量”等差值因子,具备较强稳定性和预测力;
- 识别出部分资金流因子存在显著非线性效应,提示因子构建需引入非线性特征以提升效果。
- 报告对资金流因子背后逻辑及其统计学性质进行了深入剖析,完整展示了因子筛选、正交化、合成、回测的系统流程,为因子研究和多因子模型构建提供了有价值的理论与实操框架。
---
8. 图表摘要展示
- 图1-3:小单流入额度分组收益及多空净值显著,验证因子有效性。



- 图4-7:因子值时间稳定性高,IC半衰期长,非短期事件性信号。




- 图8-13:因子分布及相关性,反映其作为流动性指标的属性。






- 图14-18:资金流各类别占比与因子IC,展现资金流整体结构。





- 图19-20:超常资金流向因子相关性及多空比价,验证剥离风险后信号稳定。


- 图21-26:因子正交前后相关性及组合表现,展示正交方法效果差异。






- 图27-28:因子到投资组合建构流程示意,体现研究体系架构。


- 图29:部分正交合成因子优于单因子与回归残差正交因子组合,比价持续领先。

- 图30:小单净流入额非线性效应,表现最佳区间在中间区。

---
总结
该系列报告通过对资金流因子全方位实证检验和理论剖析,证明资金流因子本质为流动性类指标,强调正交化技术的重要性,尤其是创新提出的“部分对称正交化”方法,提升了因子独立性和预测能力。最终构建的资金流因子组合在中证500市场表现优异,实现了显著超额收益。研究还提醒投资者对资金流因子的经济含义需保持审慎态度,合理利用非线性效应,彰显了基于大数据和量化方法挖掘“聪明钱”信号的实际价值和挑战。
---
[page::0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27]