`

高频因子(八):高位成交因子——从量价匹配说起

创建于 更新于

摘要

本报告系统构建并分析了一类高频因子——高位成交因子,基于量价匹配的成交量与价格相关性、加权收盘价比、加权偏度及成交额熵等多个子因子,反映个股在高低价格区间成交的密集程度。通过全市场与中证800的长期历史回测,结合风险指标与风格中性调整,验证了合成因子的稳定选股能力及未来价格的反转预期,为量化选股策略提供了有效因子体系[page::1][page::4][page::18]。

速读内容


量价相关性因子构建及表现 [page::4][page::5]


  • 利用成交量与收盘价的时间序列相关性衡量量价一致性,高相关度表明高位成交多,反映羊群效应。

- 因子在全市场和中证800的回测皆显示稳定的超额收益和多空收益,分年表现有波动但整体效果良好。
  • 表1展示分年风险指标,2005年以来信息比率多维持正值,夏普比稳定[page::5]。


加权收盘价比因子及表现 [page::6][page::7]


  • 通过成交量加权的收盘价与等权收盘价比值刻画高位成交密集度,因子表现稳定。

- 在全市场与中证800均获得正向超额收益和多空收益,尤其分组线性较好,表7详细风险指标说明。
  • 该因子剥离风格影响后,收益预测能力有所下降,但依旧展现选股能力[page::6][page::7]。


加权偏度因子设定与回测表现 [page::8]


  • 以成交量加权计算价格的偏度,刻画成交集中于高价或低价的分布异态。

- 回测表明该因子在全市场及中证800内均表现稳定,超额收益和多空收益均正向,且信息比率优于其他子因子。
  • 表3分年指标反映该因子有效性及波动风险[page::8]。


成交额熵因子构建逻辑与表现 [page::9][page::10][page::11]


  • 运用信息熵测度成交额分布混乱度,刻画成交在价格体系中的密集程度及稳定性。

- 单位一成交额占比熵和成交额占比熵均展现稳定回测收益,信息比和夏普比在历年均较为稳健。
  • 该类因子区别于传统风格因子,提供了额外的alpha信号[page::10][page::11]。


高位成交因子整体风险指标与风格中性表现 [page::12][page::13][page::14]


| 因子 | IC(全市场) | ICIR(全市场) | 超额收益(%) | 多空收益(%) | 多空夏普比 |
|---------------|------------|--------------|-------------|-------------|------------|
| 量价相关性 | -5.29% | -55.92% | 1.91 | 16.43 | 1.48 |
| 加权收盘价比 | -5.09% | -62.15% | 2.59 | 13.02 | 1.35 |
| 加权偏度 | -5.98% | -81.23% | 2.66 | 19.74 | 2.02 |
| 单位一成交额占比熵| -4.42% | -58.40% | -0.93 | 15.64 | 1.87 |
  • 中性后因子仍保留一定预测能力,量价相关性和加权偏度表现最优,且与传统风格因子相关性较低,具有独立alpha贡献。

- 合成因子通过等权组合量价相关性、加权偏度和单位一成交额占比熵,收益稳定且夏普提升[page::12][page::13][page::14]。

合成高位成交因子回测及中性后表现 [page::15][page::16][page::18]


  • 合成因子在全市场及中证800均表现优异,分年超额收益和多空收益均较为稳健。

- 中性后回测结果显示因子预测能力有所下降,但多空夏普比提升,风险调整后表现更为稳定。
  • 最新风险指标显示,中性后IC环比下降,说明剥离市场及风格影响后,因子alpha效应仍然存在[page::15][page::16][page::18]。


结论与风险提示 [page::1][page::17][page::18]

  • 高频高位成交因子通过刻画量价匹配及价格区间成交密集特征,反映个股可能存在的价格反转机会。

- 因子长期表现稳定,兼具多空组合收益与较好风险特性,且在风格中性后依旧保持信息增量。
  • 模型存在历史回测依赖及未来失效风险,投资者需关注因子适用环境的变化[page::1][page::17][page::18].

深度阅读

高频因子(高位成交因子)研究报告详尽分析



---

一、元数据与概览


  • 报告标题: 高频因子(八):高位成交因子——从量价匹配说起

- 发布机构: 长江证券研究所
  • 分析师及联系方式: 覃川桃(执业证书编号:S0490513030001,邮箱:qinct@cjsc.com.cn),郑起(执业证书编号:S0490520060001,邮箱:zhengqi2@cjsc.com)

- 报告日期: 2020年9月16日
  • 报告类型与领域: 金融工程专题报告

- 研究主题: 针对高频量价交易数据,构建和分析高位成交因子,揭示个股在高位和低位成交的密集水平及其对未来价格表现的预测能力。

报告核心论点:


  • 高位成交因子刻画个股价格与成交量间的匹配关系,反映市场羊群效应及价格反转的可能性。

- 因子通过时间序列的成交量与收盘价的相关性、加权价格偏度、成交额信息熵等指标综合衡量成交密集度。
  • 高位成交因子拥有一定的选股能力,尤其是在剥离风格因子线性影响后,仍表现稳健。

- 合成因子(量价相关性、加权偏度、单位一成交额占比熵等权求和)展现出较强的风险调整收益率,具备较好的实用价值。

投资建议与风险提示:


  • 报告指出模型潜在失效风险,且所有举例均基于历史数据,无法确保未来收益。

- 评级方面无具体股票或行业买卖评级,侧重方法论和因子特性研发探讨。

---

二、逐章节深度解读



1. 报告要点概述与背景说明(第1页)



报告起始明确本报告是高频因子系列中的第八篇,关注交易数据中“高位成交”的现象及其建模。报告指出,个股在价格高位的成交密集往往伴随羊群效应,这种行为诱发局部过高估值和未来价格回调反转;而低位成交多则暗示市场正在加仓,有潜在上行空间。

报告提出采用时间序列层面的“成交量”和“收盘价”相关性,作为量价相似性度量,来捕捉成交密集信息。此外设计了多个衍生因子:加权收盘价比、加权偏度及成交额熵等,用以全面刻画不同维度的交易密集。

报告强调这些因子在市场和中证800指数范围内均表现出一定选股能力,且即使剥离常见的风格因子线性影响,也能保有独特的信息量和预测能力。[page::1]

2. 量价相关性因子(第4-5页)


  • 定义: 计算成交量和收盘价的时间序列相关系数($corr(\{volt\}, \{closet\})$),衡量成交量和价格的同步性。

- 逻辑与假设: 趋同度高意味着价格高位时成交量较大,反映羊群效应,造成短期价格过度波动及随后的收益反转。
  • 表现:

- 全市场和中证800内回测净值表现稳定且优良,多空收益可观。
- 分年风险指标显示超额收益和信息比波动,但整体表现积极,多空夏普比良好。
  • 图表解读:

- 图1(全市场)和图2(中证800)呈现多空收益曲线,分10组,显示因子分组表现层次清晰,优势组长期跑赢劣势组。
  • 风险指标(表1): 超额收益总计为1.91%(全市场)、1.67%(中证800);多空收益显著,信息比保持正向,表明因子具有一定风险调整收益能力。[page::4][page::5]


3. 加权收盘价比因子(第5-7页)


  • 因子构造:

- 计算成交量加权的收盘价均值与简单收盘价均值的比值,即 $$\frac{\sum{t=1}^{T} \frac{volt}{VOL} \times closet}{\frac{\sum{t=1}^{T} close_t}{T}}$$
- 当个股成交集中于高价区间,加权收盘价比大于1且偏离明显。
  • 逻辑: 反映成交价位的偏移程度,高位成交密集比例越大,该因子数值越大。

- 表现:
- 回测净值图3、4显示因子表现稳健,尤其全市场范围内超额收益接近2.6%。
- 表2风险指标显示多空夏普比和信息比均较为稳定,收益分组明显。
  • 分析: 因子反映了量价在不同价位上的匹配情况,表现出良好的捕捉市场行为的能力,但剥离风格影响后,选股能力有所下降,说明部分被风格线性相关性解释。[page::5][page::6][page::7]


4. 加权偏度因子(第7-9页)


  • 因子定义: 利用成交量加权计算收盘价的偏度,偏度反映价格分布的非对称性。

- 解释:
- 偏度>0时,说明成交价格集中在低价位(长右尾),偏度<0则成交集中于高价位(长左尾)。
- 含成交量加权可更精确刻画成交在价格分布中的集中状态。
  • 表现:

- 从图5、6中可见,因子净值曲线表现稳定,风险指标(表3)显示超额收益和多空收益均表现良好。
- 有阶段性回撤,但长周期表现整体积极。
  • 意义: 该因子直观反映成交价格分布形态,对预测价格行为具备解释力。[page::7][page::8][page::9]


5. 成交额熵因子(第9-12页)


  • 理论基础与构建:

- 基于信息熵的思想,以成交额在各时间段的占比作为概率分布,计算成交额熵。
- 成交额定义为成交量与收盘价乘积;熵值越高,表示成交分布越均匀,系统更“稳定”;熵值低意味着成交集中,体系“混乱”。
  • 变种:

- 单位一成交额占比熵(成交量和价格归一后的乘积分布)
- 成交额占比熵(成交额比例本身)
  • 逻辑: 交易越集中于某些价位,熵越小,暗示资金聚焦效应和局部价格异常。

- 表现:
- 回测图7-10显示两种熵因子在全市场和中证800范围内均有一定超额收益和分组区分能力。
- 风险指标(表4、表5)表明熵因子选股能力中等,其中单位一成交额占比熵多空收益较为稳定。
  • 洞察: 该因子从“成交结构的混乱程度”角度出发,是较新颖的视角,补充了传统量价匹配指标。[page::9][page::10][page::11][page::12]


6. 高位成交因子整体风险指标(第12-13页)


  • 表6总结了各个高位成交因子的IC(收益率预测相关性)和ICIR(IC信息比率)、超额收益、多空收益与夏普比指标。

- 发现加权偏度和成交额占比熵因子对收益率预测能力最强;量价相关性和加权收盘价比因子表现相近,整体均展现了稳健的多空收益,反映选股效果良好。
  • 超额收益均为正(部分因子中性后表现更佳),多空收益均超过10%,说明能有效捕捉价格变化趋势。[page::12][page::13]


7. 风格因子中性后的因子表现(第13-14页)


  • 通过剥离常规风格因子线性影响后,量价相关性、加权偏度及单位一成交额占比熵因子仍保留较强预测能力。

- 加权收盘价比和成交额占比熵的收益预测能力明显下降,失去较多原有alpha。
  • 相关性分析(表7)显示大部分高位成交因子与传统风格因子的相关度较低,除部分因子与反转和波动率因子相关度较高,因子信息较为独立。

- 中性后风险指标(表8)显示量价相关性和加权偏度仍有明显超额收益,组内风险调整收益比也较好。[page::13][page::14]

8. 合成因子表现(第14-17页)


  • 合成因子由量价相关性、加权偏度和单位一成交额占比熵等三个信息量仍存因子等权组合而成,旨在增强因子稳定性和综合选股能力。

- 各因子间呈一定正相关,合成因子与各自成分因子相关度较高。
  • 全市场及中证800回测净值显示合成因子表现优良,超额收益和多空收益稳定(图11、12)。

- 风格因子中性后表现(图13、14)略有下降但仍保持良好选股特性。
  • 分年风险指标(表10、11、12)系统展现因子的波动及阶段性表现,体现了因子效果的周期性变动特征。

- 合成因子中性后IC由-6.53%提升至-5.13%,ICIR由-75.78%变为-94.25%,显示收益预测能力有所折损但稳定性提高,超额收益与夏普比保持合理水平。[page::14][page::15][page::16][page::17]

9. 总结与投资评级说明(第17-19页)


  • 报告总结强调高位成交因子构建基于量价相似度、加权偏度以及成交额熵,能够有效刻画个股在高位/低位成交的密集程度,与价格反转和未来收益表现存在显著联系。

- 各因子回测及风险调整表现均较稳健,尤其是中性后量价相关性和加权偏度因子显示较强独立alpha信息。
  • 合成因子更进一步提高了选股效能和稳定性,适合作为量化选股模型的构建基础。

- 报告补充投资评级制度说明及合规声明,明确报告仅为研究分析,不构成具体买卖建议。[page::17][page::18][page::19]

---

三、图表深度解读



1. 量价相关性因子回测净值(图1-2,页4)


  • 净值曲线多空分组梯度明显,表示因子能较好区分强势/弱势股票。

- 全市场表现较中证800更为稳定并幅度更大,表明广泛市场环境下因子表现良好。
  • 曲线显著波动与2015年市场波动期对应,反映因子对极端行情敏感。


2. 加权收盘价比回测净值(图3-4,页6)


  • 净值呈连续上升趋势,尤其2014年前表现突出。

- 分组收益明显,前端分组收益远高于后端,因子选股能力明确。
  • 中证800内的波动略大,且2015年剧烈回撤,显示高位成交因子受大盘震荡影响较大。


3. 加权偏度回测净值(图5-6,页8)


  • 曲线平稳上升,处于较高水平,因子多空分组性能明显。

- 中证800内波动相对较小,长期趋于正收益。
  • 反映偏度因子对区分低位集中与高位集中成交行情具有效力。


4. 成交额熵相关因子(图7-10,页10-11)


  • 单位一成交额占比熵因子和成交额占比熵因子表现相近,曲线平稳。

- 多空收益分组清晰,说明成交额分布的平均程度是重要选股信息。
  • 息因子在市场整体波动期间表现起伏,但仍保持正收益趋势。


5. 合成因子及其中性后净值表现(图11-14,页15-16)


  • 合成因子净值曲线显示更优的收益稳定性,特别是中长期趋势清晰。

- 中性处理后因子净值较原始略有波动增加,但分组收益依旧较明显,确认因子独立性和信息增量。
  • 多空夏普比和收益均显示因子具备较好的风险调整回报能力。


---

四、估值分析



本报告为因子研究性质,未涉及传统估值方法(如DCF、市盈率等)论述,重点在于因子构造、特征提取与策略回测。

---

五、风险因素评估


  • 模型失效风险: 因子基于历史数据统计特征,未来市场结构变化(例如交易行为变异、监管政策调整)可能导致因子失效。

- 历史表现不代表未来: 报告明确说明所有示例基于历史数据,不保证实际投资收益。
  • 风格相关性风险: 虽然进行了风格中性处理,部分因子仍与传统风格因子存在一定相关性,可能影响因子独立性和收益稳定。

- 市场波动风险: 回测期间特定年份(如2015年)表现极端波动,反映因子风险敞口较大,需投资者把控配置比例。

---

六、批判性视角与细微差别


  • 报告依赖高频交易数据的统计特性构建因子,具有一定时效性和数据依赖性,较少考量宏观或基本面因素对因子的修正。

- 虽多处尝试剥离风格线性影响,仍发现部分因子与传统热门因子(反转、波动率)相关度较高,提示可能存在共线性风险。
  • 部分风险指标在剥离风格因素后显著下降,显示因子实际有效性受限,实际组合运营需额外控制风险。

- 报告在数据波动年份表现存在分歧,说明因子的稳定性尚需对市场多变性敏感度进一步考量。
  • 未明确说明因子参数选择的优化方法及其对不同市场环境的适应性,对因子鲁棒性未给出充分验证。


---

七、结论性综合



长江证券的这份高频因子专题报告系统构建并验证了五大高位成交相关因子:量价相关性、加权收盘价比、加权偏度、单位一成交额占比熵以及成交额占比熵。这些因子从不同角度刻画了个股在交易价格高位或低位的成交密集度,核心假设是高位成交密集预示股价局部高估及后续反转,低位成交集合则潜藏价格上行动力。

从多个维度指标的回测结果看:
  • 五大因子在全市场及中证800内均表现出一定的稳定的超额收益和多空收益;

- 剥离传统风格因子后,量价相关性、加权偏度和单位一成交额占比熵因子依然保持显著预测能力,体现出较强的信息增量;
  • 合成因子构建合理,通过等权合成提升收益稳定性和分散风险,具备良好的实用意义。


绘制的多个净值曲线清晰呈现因子优势分组的业绩分化,且风险调整指标(信息比率、夏普比)稳健。尽管个别年份(如2014、2015)经历波动回撤,但整体循环趋势利好因子应用。

报告客观评估了模型可能的失效风险,并明确其基于历史数据,未来表现的不确定性。其对传统风格因子的中性化处理进一步验证了因子的独特性和潜在价值。

总体而言,本报告为量化投资者提供了一套细化的高频交易因子体系,强调成交价与成交量的匹配及其分布信息对市场行为的深刻洞察,助力构建更有效的股票选股模型。

---

附:重要图表示例展示



量价相关性因子全市场回测净值(图1)





加权收盘价比全市场回测净值(图3)





加权偏度全市场回测净值(图5)





单位一成交额占比熵全市场回测净值(图7)





合成因子全市场回测净值(图11)





---

以上分析严格基于报告内容及公开数据,综合阐述了因子构建逻辑、表现特征、风险提示及潜在局限,力求全面准确。[page::1,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19]

报告