高频因子(七)分布估计下的主动成交占比
创建于 更新于
摘要
本报告围绕高频因子中的主动成交占比因子进行系统研究,基于价格变动方向及幅度构建多种分布映射方法(包括𝑡分布、正态分布和均匀分布),并验证其在A股市场全市场及中证800指数内的选股能力。报告指出满足价格变动幅度越大主动买卖占比越大的函数均能有效估计主动买卖,并揭示该因子头部排名存在非线性效应,通过分段线性和对勾函数进行改进可提升选股表现。因子在剔除风格因子线性影响后,信息主要集中于空头端,仍能获得多空收益。本报告辅助理解交易行为与价格偏离的关联,提供了完善的量化交易因子构建思路和实证分析 [page::1][page::20].
速读内容
高频因子主动成交划分基础与博弈因子表现 [page::4][page::5]


- 基于逐笔成交数据,博弈因子通过价格驱动买卖主动成交量划分,反映买方多头与卖方空头力量。
- 博弈因子自2005年以来在全市场和中证800均实现稳定的多空和超额收益,2015年表现尤为突出。
- 表1显示分年风险指标,表明其在不同年份波动但整体呈现正收益特征。
资金流向因子与批量成交划分法改进主动买卖估计 [page::6][page::7]




- 资金流向因子以时间聚合k线价格变动方向划分买卖主动性,展现中证500内一定选股效用,但稳定性有限。
- 批量成交划分法提出价格变动幅度影响买卖主动占比,采用连续函数进行映射,提升估计精度。
- 朴素主动占比因子基于批量成交方法实现,呈现一定多空收益但超额收益有限。
不同分布映射构建主动成交占比因子及其风险表现 [page::9-15]








| 因子类型 | IC(全市场) | ICIR(全市场) | 超额收益(全市场) | 信息比(全市场) | 多空收益(全市场) | 多空夏普比(全市场) |
|---------|-----------|-------------|----------------|--------------|--------------|----------------|
| 朴素主动占比 | -5.78% | -63.35% | -1.09% | -0.17 | 17.00% | 1.81 |
| 𝑡分布主动占比 | -5.35% | -49.63% | -1.85% | -0.28 | 14.96% | 1.37 |
| 标准正态分布 | -5.27% | -78.64% | 0.28% | 0.07 | 20.12% | 1.84 |
| 置信正态分布 | -7.22% | -81.53% | 0.68% | 0.13 | 20.15% | 1.90 |
| 均匀分布 | -5.17% | -45.45% | 0.90% | 0.20 | 17.47% | 1.55 |
- 置信正态分布和均匀分布因子在收益率预测和多空收益能力上表现较优,部分因子呈现稳定的超额收益。
主动成交占比因子的非线性改进与回测表现 [page::16-18]






- 非线性映射函数(如线性分段函数、对勾函数)改善头部排序的非线性问题。
- 线性分段函数改进因子后,在全市场和中证800展示更线性的分组回测净值,超额收益及多空收益均有所提升。
- 对勾函数改进对超额收益帮助有限,但保持多空收益稳定。
风格因子中性后主动成交占比因子表现 [page::19]


| 因子 | 与反转因子相关性 | 与波动率因子相关性 | 超额收益衰减 | 多空收益稳定性 |
|-------|------------------|--------------------|-------------|--------------|
| 置信正态分布 | 41.63% | 30.01% | 明显降低 | 保持较高 |
| 均匀分布 | 41.81% | 30.44% | 明显降低 | 保持较高 |
- 相关性较高的博弈因子指标做风格因子中性后,超额收益大幅衰减,空头端信息保留,仍产生命中性多空收益[page::19].
报告总结 [page::20]
- 主动成交买卖划分基于价格动态,博弈因子和资金流向因子均具有一定选股能力。
- 批量成交划分法引入价格变动幅度因素,提升主动买卖占比估计精度。
- 以多种分布(𝑡分布、正态分布及均匀分布)构建主动成交占比因子,正态分布和均匀分布表现较佳。
- 主动成交占比因子头部排序存在非线性效应,采用非线性映射函数改进后选股表现增强。
- 因子风格中性后,收益主要集中在空头组,超额收益能力减弱但仍保留多空收益。
- 该研究为高频因子设计和交易行为研究提供了新的方法论依据和实证支持。
深度阅读
高频因子(七)分布估计下的主动成交占比 — 长江证券研究所深度分析报告解读
---
1. 元数据与报告概览
- 报告标题:高频因子(七)分布估计下的主动成交占比
- 发布单位:长江证券研究所
- 发布日期:2020年8月10日
- 分析师:覃川桃、郑起
- 主题:基于高频数据构建和验证主动买卖成交占比因子,探讨中国A股市场主动成交行为对价格的影响及因子选股能力
- 报告核心论点:
- 价格变动方向是划分主动买卖的基础,且价格变动幅度越大,主动买卖占比越高。
- 基于不同分布函数(𝑡分布、正态分布、均匀分布)映射收益率变化,可以有效估计主动买卖成交量,构建主动成交占比因子。
- 主动成交占比因子具有一定的选股能力,尤其在通过非线性映射(分段线性函数、对勾函数)优化后表现更佳。
- 风格因子中性后,主动成交占比因子超额收益显著下降,但仍有多空收益,且收益主要来源于空头组。
- 投资评级:本报告为专题报告,属因子研究性质,无具体股票推荐及目标价。
报告旨在深化对主动买卖成交的识别与量化,推动高频交易因子的优化及其选股应用。总体思路创新且实证充分,综合市场行为与统计分布方法,试图刻画市场买卖力量与价格偏离关系,揭示其投资价值。[page::0,1]
---
2. 逐节深度解读
2.1 报告要点概述(页1)
- 主动买卖划分原则:
- 价格上涨时,视为买方主动买入驱动价格(市场为卖方市场,买方抬价)。
- 价格下跌时,视为卖方主动卖出驱动价格。
- 博弈因子构建:
- 以逐笔成交价与挂单买一卖一价比较,划分成交为主动买入或主动卖出。
- 资金流向因子构建:
- 以时间段的收盘价变化判断资金流入(涨价成交量)或流出(跌价成交量)。
- 批量成交划分法:
- 在时间聚合K线基础上,将价格变动幅度映射为主动买卖占比,克服绝对划分的误差,实现连续性估计。
- 分布估计:
- 采用收益率分位和3类分布(𝑡分布、正态、均匀)计算主动买入量,显示稳定的选股能力。
- 非线性效应及因子优化:
- 主动成交占比因子头部排序非线性,采用分段线性和对勾函数映射改进因子表现。
- 风格中性分析:
- 因子收益主要为交易行为表现,与反转和波动率因子相关,中性后超额收益消失但多空收益仍存。
- 风险提示:
- 模型存在失效风险,历史数据不代表未来表现。[page::1]
2.2 博弈因子及基础活跃买卖力量刻画(页4-5)
- 市场价格偏离价值往往由局部交易行为驱动,博弈因子通过逐笔成交主动买卖量衡量多空力量对比。
- 当成交价>前一买一价,视为主动买入;成交价<前一卖一价,视为主动卖出。
- 博弈因子表现(图1、2及表1):
- 自2005年以来全市场及中证800均有一定超额收益和多空收益,尤其2015年表现突出。
- 不同时期表现波动,2017年及2019年等部分年份出现负收益。
- 结论:博弈因子选股逻辑基于主动买卖驱动价格动态,实证数据验证了其有效性,但表现稳定性有待提升。[page::4,5]
2.3 资金流向因子(页6)
- 利用时间段收盘价方向,对成交额划分资金流入或流出。
- 与博弈因子不同,资金流向因子关注时间聚合层面,提供另一角度量化买卖驱动力。
- 表现(图3、4):
- 在中证500表现出一定超额收益和多空收益,但稳定性一般。
- 沪深300市场表现线性排序差,影响因子构建稳定性。
- 结论:资金流向因子是对价格变动驱动力的宏观刻画,具有选股能力但仍有限制。[page::6]
2.4 批量成交划分法及朴素主动占比因子(页6-8)
- 批量成交划分法将“非此即彼”的买卖划分转为连续区间映射,减少误差。
- 应用𝑡分布累计函数映射价格变动至主动买卖占比,考虑价格变动幅度和分布特性。
- 朴素主动占比因子为该方法基础实现。
- 表现(图5、6及表2):
- 提供一定多空收益,全市场优于中证800,但均无稳定超额收益。
- 近年表现呈回撤趋势。
- 结论:连续映射增强因子理论合理性和实测效果,有改进空间。[page::6,7,8]
2.5 结果分布对主动占比因子影响(页9-15)
- 构建了以收益率为自变量,分别基于𝑡分布、标准正态分布(两种拟合方法)及均匀分布的主动占比因子。
- 𝑡分布因子表现一般,无超额收益,稳定性差;标准正态因子表现略好,尤其均值修正法可获得少量超额收益。
- 均匀分布因子表现平稳,多空收益及超额收益均优于其他分布因子。
- 综合风险指标(表7)显示,置信正态分布和均匀分布因子IC、ICIR最高,收益提升明显。
- 结论:价格变动与主动买卖驱动力的映射关系复杂,均匀分布和修正正态表现更符合市场实际,因子构造需根据市场波动特征调整。[page::9-15]
2.6 主动买卖因子的非线性改进(页16-18)
- 发现主动成交占比因子头部排序存在非线性,头部组实际未来回报被低估。
- 采用分段线性函数和对勾函数,对头部组因子值进行非线性调整。
- 分段函数将数据分成两段,小于10%时反向排序,大于10%时保持原值,有利于提升线性关系。
- 非线性映射后,因子表现线性排序明显改善,超额收益和多空收益均有所提升(见图16-17及表8)。
- 对勾函数映射后效果提升不明显(图18-20,表9)。
- 结论:非线性调整优化了因子排序精度,提升其选股能力,是一种有效的改进方向。[page::16-18]
2.7 风格因子中性后表现(页19)
- 主动成交占比因子与反转、波动率因子高度相关(相关系数达30%以上)。
- 风格因子中性处理后,超额收益明显衰减,多空收益也下降,但空头组仍保留一定收益能力。
- 表11及图21-22显示,中性后因子仍具有实用性,特别是在空头组的风险对冲和捕捉方面。
- 结论:主动成交占比因子内隐市场行为因素,剔除风格影响后仍有应用价值,适合结合多因子模型使用。[page::19]
---
3. 图表深度解读
3.1 博弈因子历史表现(图1、2)
- 图1展示了2005年至2020年全市场博弈因子不同分组净值发展情况,基准线持续上涨,前1-3组表现优异,分组间差异明显;
- 图2反映中证800内博弈因子净值,显示波动更剧烈但顶端分组依然显著领先下端组;
- 说明买卖力量的博弈概念有效捕捉市场价格异动,且对大盘股同样适用。[page::4]
3.2 资金流向与朴素主动占比因子净值图(图3-6)
- 图3、4分别为中证500资金流向因子净值和分组超额收益,显示中证500市场的超额收益较沪深300更为明显;
- 图5、6为朴素主动占比因子净值,全市场与中证800均有可观多空收益,但超额收益不足;
- 反映资金流向指标及朴素连续划分对主动买卖的解释力和实际投资价值有限。[page::6,7]
3.3 不同分布构造因子表现(图7-14)
- 𝑡分布(图7、8)与标准正态(图9、10)因子均显示净值曲线平稳增长,头部组走势较强,但回撤也显著,稳定性不高;
- 置信正态分布(图11、12)及均匀分布因子(图13、14)均表现了更强的线性排序和持续上涨趋势,头部组收益更集中;
- 表7数据佐证上述观察,置信正态、均匀分布因子提供更高IC和超额收益,说明映射函数的选择对因子效果至关重要。[page::10-15]
3.4 非线性变换效果(图15-20)
- 图15所示线性分段函数视觉化了低头部组因子值反向排序的思路;
- 图16、17表现该调整后净值净增明显,分组间线性更稳定,提升了因子识别能力;
- 图18的对勾函数呈现头部组加大权重映射,但图19、20的实际净值曲线未显著改进,暗示其效果有限;
- 统计结果(表8、9)支持此结论,推荐非线性映射采用分段线性算法。[page::16-18]
3.5 风格因子中性后(图21、22)
- 中性后净值图表显示因子净值增长幅度下降,且超额收益减少,反映风格因子对主动成交因子贡献较大;
- 空头端收益仍然存在,说明主动成交占比因子在空头趋势判断仍有参考价值;
- 表11进一步量化中性后因子风险指标,均有所降低但稳定性尚可。[page::19]
---
4. 估值分析
本报告主要聚焦因子构建与实证验证,无直接涉及企业估值模型、目标价或股票具体投资评级,不包含DCF、PE等传统估值方法讨论,属于量化因子研究范畴。
---
5. 风险因素评估
- 模型失效风险:基于历史数据构建,未来市场结构或交易行为变化可能导致模型失效。
- 数据和方法限制:分布假设可能不完全准确,映射关系可能随市场环境变化。
- 选股能力有限:因子超额收益稳定性不足,需结合其他因子或策略共同降低风险。
- 风格相关风险:与反转及波动率因子高度相关,风格轮动时业绩可能承压。
- 历史表现不保证未来:严谨警示,报告所示收益均基于回测数据,投资者需谨慎。
- 报告未提出风险缓解策略,提示投资者自行管理。[page::1,19]
---
6. 批判性视角与细微差别
- 报告整体基于扎实的统计与市场逻辑,创新引入分布模型估计主动买卖比例,方法论科学。
- 然而大多因子收益表现依赖多空收益,超额收益有限且波动较大,反映单一因子预测能力受限。
- 价格变动与主动买卖动力的映射仍存在优化空间,如对交易行为微观机制的进一步建模。
- 风格中性后收益大幅衰减,显示因子部分效力被市场已广泛认知或风格共振影响,需整合多因子框架。
- 图表与文字部分信息详实,但表格中数据排版略显混乱,部分年份数据存在标点缺失,阅读时需谨慎解读。
- 非线性调整虽改善表现,但对勾函数改进有限,暗示函数形式选择需结合市场微结构进一步研究。
- 报告较少涉及交易成本与市场冲击,投资实际应用中需重视这些影响因素。
---
7. 结论性综合
本报告系统构建并深入分析了主动成交占比因子,创新应用统计分布方法估计市场成交的主动买卖力量。主要发现总结如下:
- 核心思路与方法:
- 价格变动方向为判别主动买卖驱动的基础,价格变动幅度决定买卖驱动力占比大小。
- 通过𝑡分布、正态分布及均匀分布映射收益率,构建多种主动成交占比因子,验证映射方式对选股能力的影响。
- 实证结果:
- 主动成交占比因子整体具有较好多空收益,多数因子在全市场及中证800均表现有效。
- 置信正态和均匀分布函数因子表现最佳,信息系数(IC)和信息比率(ICIR)更高,选股稳定性较好。
- 头部排序非线性问题显著,采用分段线性非线性映射改善,进一步提升因子表现。
- 风格中性后,超额收益降低明显,但空头组的多空收益保留为因子提供了实际运用价值。
- 图表洞察:
- 净值曲线显示主动成交因子能有效区分股价走势,头部组稳定跑赢大盘。
- 各种分布映射影响因子灵敏度及收益表现,提供了主动买卖力度估算的有效路径。
- 非线性调整明显修正头部乱序,提高了因子的解释力和预测能力。
- 风格因子中性相关分析揭示了因子与市场其他主要因子的紧密联系,强调综合应用。
- 整体评估:
本报告创新结合市场价格与交易行为,建立了系统性主动买卖成交量度,有效增强了量价因子家族的丰富性和解释力。方法科学、数据充分,提供了高频量化交易研究的重要思路。但因超额收益幅度有限及模型潜在失效风险,建议投资者在实际应用中将该因子作为多因子组合的辅助参考指标,且结合交易成本与市场真实环境慎重验证。
报告为高频交易因子研究领域提供了良好的实证样板和思路拓展,具备较高的专业参考价值和适度的应用潜力。[page::1,4-20]
---
附录:重要图表展示示例(Markdown格式)
- 图1:全市场博弈因子回测净值

- 图6:中证 800 朴素主动占比因子回测净值

- 图11:全市场置信正态分布主动占比因子回测净值

- 图15:线性分段函数变换

- 图21:全市场置信正态分布主动占比因子中性后回测净值

---
本次分析以长江证券研究所《高频因子(七)分布估计下的主动成交占比》为蓝本,全面覆盖报告重要章节、数据、图表及方法评析,确保解读科学、详细且具有针对性,满足专业金融分析需求。