`

外生因子系列研究报告(一):股市流动性预测指标构建

创建于 更新于

摘要

本报告构建并验证了基于典型相关分析(CCA)的股市流动性预测系统。通过自适应滚动学习,从两千多项宏观指标中筛选与股市流动性代理指标(万得全A成交额与流通市值比值)高度相关的指标特征,输出未来60个交易日内的流动性预测值。模型预测值与实际值Spearman和Pearson相关性系数分别为0.56和0.44,能较好捕捉股市流动性趋势。历史回顾显示流动性趋势与经济及政策环境密切相关,且流动性预测对中长期行情判断有一定帮助,但不能单一用于行情判断,需结合情绪和经济信号使用 [page::0][page::3][page::6][page::10][page::11][page::13]

速读内容


股市流动性构建及宏观指标选择 [page::2][page::3][page::4]


  • 股市流动性从资金增量和市场容量双重视角考量,构建了增量资金角度的流动性指标。

- 选取万得全A成交额与期末流通市值的比值作为股市流动性的观测代理指标,与增量资金指标高度相关,更新频率更高。

典型相关分析(CCA)与系统构建 [page::6][page::7][page::8][page::9]




  • CCA用于多维宏观指标和股市流动性代理指标维度降维,最大化两组变量相关系数,实现指标筛选与预测。

- 构建半年滚动训练窗口,训练2年数据,每6个月更新一次模型。
  • 通过多轮模型训练筛选敏感指标特征(共2180项),包括原值、同比、均值偏差、分位值等各类特征。


流动性预测模型效果与历史趋势分析 [page::10][page::11][page::12][page::13]




  • 模型预测值与实际股市流动性呈中等正相关(Spearman=0.56,Pearson=0.44)。

- 预测值平滑后趋势能较好捕捉万得全A行情的长期上升趋势,辅助判断市场流动性状况。
  • 历史回溯显示,模型敏感捕捉多轮经济周期流动性波动与政策调整,如2008年金融危机、2015年宽松等。

- 当前(2021H2起)模型显示流动性震荡上行,但对行情带动力较弱,提示流动性信号需结合其他信号配合使用。

投资建议与风险提示 [page::0][page::13][page::18]

  • 股市流动性预测指标可作为A股市场中长期流动性趋势判断的重要工具。

- 流动性上行往往伴随牛市行情,为市场提供动力来源。
  • 但流动性单一信号不能直接作为行情判断依据,需与市场情绪、经济基本面等多因素结合使用。

- 数据统计仅反映历史,预测模型存在误差,投资需谨慎。

深度阅读

外生因子系列研究报告(一):股市流动性预测指标构建 — 深度解析



---

一、元数据与概览


  • 报告标题:《外生因子系列研究报告(一):股市流动性预测指标构建》

- 发布时间:2022年3月2日
  • 作者信息

- 分析师:刘鋆(执业证书编号:S05305190900010731-84403397,邮箱liujun23@hnchasing.com)
- 研究助理:刘飞彤(邮箱liufeitong@hnchasing.com)
  • 发布机构:财信证券研究发展中心

- 主题:构建基于宏观流动性指标的股市流动性预测指标体系,通过统计及机器学习(CCA模型)分析宏观经济流动性对市场流动性(特别是股市)的影响及预测作用,旨在为A股市场投资决策提供科学的流动性趋势判断信号。

报告核心论点:
  • 传统单一指标对流动性分析预测能力不足,基于“勤劳机器”的滚动更新+筛选机制提取对股市流动性敏感的宏观指标更加有效。

- 利用典型相关分析(CCA)模型筛选和建模,在两千多项宏观指标中提炼有效信号,预测股市流动性指标与实际走势呈显著中等程度相关。
  • 2021年下半年以来,尽管流动性呈现震荡上升趋势,但对股市行情的带动力有限,提示流动性信号需结合经济基本面及情绪等多因子共同判断。

- 本文构建的流动性预测系统为后续系列研究尤其是情绪因子等外生因子研究奠定基础。

[page::0][page::1]

---

二、逐节深度解读



1. 股市流动性(章节1)


  • 关键观点:股市流动性是宏观流动性及市场流动性的一个组成部分,受到基础货币、信用扩张、投资融资三大层面的影响。流动性与资金增量和市场容量的相对变化密切相关,且直接影响股价走势。

- 逻辑说明
- 将股市资金流入形象喻为“注水”,股价即“水位”,水涨船高。
- 净流入正时价格多上涨;即使净流入为零,若市场容量下降,价格也可能上涨。
- 因此考察股市流动性时,需权衡资金流入与市场容量的动态。
  • 数据概念

- 市场容量:股市中资产的货币价值体现。
- 增量资金主要来自机构资金、杠杆资金及境外资金。
  • 结论:整体理解股市流动性需将宏观货币政策及市场规模变化纳入框架,流动性分析不能单纯依据某一类资金变化。


[page::2]

2. 股市流动性代理指标构建(章节3)


  • 采用增量资金角度综合指标:


\[
\text{股市流动性(增量资金)} = \frac{\Delta \text{新发公募基金规模} + \Delta \text{外资持股} + \Delta \text{融资净买入} + \Delta \text{客户交易结算资金}}{\text{A股流通市值}}
\]
  • 图1解读(见图):


- 横轴为时间(月度),左轴为股市流动性指标,右轴为万得全A涨跌幅。
- 红色柱形(全A涨跌幅)与蓝线(增量资金角度流动性指标)在84个月中62个月呈同增同减态势。
  • 意义:该指标有效反映了市场流动性的变化,与市场整体涨跌同步,体现增量资金对行情的驱动力。
  • 改进指标


- 原增量资金指标更新频率较低,难以快速反应。
- 考察其他高频指标发现换手率与成交额占比指标与增量资金指标相关性较强。
- 因换手率定义近似为“期间成交额/期末流通市值”,决定采用该比值作为股市流动性代理指标,可实现更频繁数据更新和流动性状态的刻画。

[page::3]

3. 股市流动性的观测代理指标与验证(章节4)


  • 图2解读(见图):


- 红色线为成交额/流通市值指标,蓝色线为股市流动性(增量资金角度)指标,二者趋势趋于一致。
  • 说明


- 该代理指标以更高频率反映市场流动性,验证其和历史股市增量资金指标相关性良好。
  • 宏观流动性框架


- 基础货币通过信用扩张链条影响投资融资行为,最终传导至股市流动性。
- 报告收集三大维度大量宏观指标,包括央行资产负债表、货币供应量、公开市场操作、银行间市场利率、社会融资规模、贷款利率等关键指标。

[page::4]

4. 典型相关分析(CCA)模型及系统设计(章节2.2-2.3)


  • CCA原理


- 提取两组高维变量X和Y中的线性组合,使得组合后的新变量X'和Y'之间相关系数最大化。
- 与主成分分析(PCA)不同,CCA降维是有监督的,纳入因变量相关性考虑,适合寻找两组变量间的内在相关模式。
  • 图3解读(见图):


- 左侧为X变量组合降维到X',右侧Y变量降维到Y',最终计算两者相关系数ρ。
  • 系统逻辑


- 构建自适应滚动学习系统,实现滚动训练(以半年为步长):
- 训练窗口长度为两年,测试窗口和预测窗口长度均为半年。
- 从218大类宏观指标细分字段(共2180个特征)中筛选敏感指标特征。
  • 指标特征形式


- 包括原值、同比、差值、变化率、相对均值偏离、相对分位值、流速等,共10类特征,考虑不同时间窗口(日、周级别变化)。
  • 图4解读(滚动窗口示意):


- 展示训练集随时间半年度拉动更新过程,保证模型不断适应经济环境的演变。

[page::6][page::7][page::8]

5. 模型训练流程(章节2.4)


  • 三轮训练


- 第一轮:用训练窗口全量指标训练CCA模型,筛选出对流动性敏感度超过阈值的特征。
- 第二轮:汇聚筛选后的特征再次训练,再次筛选。
- 第三轮:用最终特征训练模型,并用于预测测试窗口的股市流动性代理指标。
  • 图5解读


- 详细流程图表明先筛选再训练再预测的闭环体系,机器自动完成特征更新、模型训练及预测任务。

[page::9]

6. 模型预测表现评估(章节2.4)


  • 图6解读


- 预测值(蓝色线)与实际值(红色线)整体呈趋势共振态势。
- 时间跨度覆盖2007年至2022年初,反映该模型的长期有效性。
  • 统计指标


- Spearman相关系数0.56,Pearson系数0.44,均表示中等程度相关,p-value<0.05显著。
  • 图7解读


- 预测值与实际值散点密集呈正相关分布,验证模型预测能力。
  • 图8解读


- 以12周平滑后的流动性趋势状态对比万得全A股价走势,红色阴影为流动性上升区间,绿色为下降。
- 流动性上升阶段相对对应全A指数的上涨趋势,强化流动性预测对行情判断的辅助作用。

[page::10][page::11]

7. 模型结果历史趋势盘点(章节2.4.1)


  • 报告对模型预测的股市流动性趋势与宏观经济事件相结合,做了详细的历史趋势回顾:


- 2008年上半年:流动性紧缩,央行加息和提高存款准备金率。
- 2008年10月至2009年8月:因国际金融危机,中国实施“四万亿”投资计划,流动性显著上升。
- 2009年至2011年:央行通过加息和存款准备金率调整控制流动性,趋势整体向下。
- 2012年初:货币政策转向宽松,流动性上升。
- 2013年至2014年初:出现“钱荒”等流动性紧张,调整后利率市场化改革推动流动性恢复。
- 2015年:货币政策极大宽松,流动性大幅提升但伴随系统风险。
- 2016年至2019年:宏观审慎监管加强,影子银行收缩,金融环境趋紧,流动性下降。
- 2019年末至2020年初:财政货币政策发力,抗疫资金支持,流动性上升。
- 2020年7月至2021年7月:广义流动性收紧,模型检测股市流动性下降。
- 2021年中至今:政策趋向中性宽松,流动性出现震荡上升趋势,2022年上半年预计小幅流动性改善。
  • 动态指标提取:模型每一阶段自动提取符合当时宏观政策与市场动态特征的指标组,如贷款利率、存款准备金率、央行资产负债表项目等,体现模型的自适应调整能力。


[page::11][page::12][page::13]

8. 投资思考(章节3)


  • 流动性上升往往伴随牛市行情,因此股市流动性预测系统有助于判断市场中长期趋势。

- 2021年下半年以来,虽流动性有所回升,带动股市行情的动力却有限,表明流动性信号不能孤立使用。
  • 实际操作中需结合市场情绪、经济增长等多元信号共同判读行情。

- 本报告系列后续计划辅以情绪因子等外生因子研究,提高对市场行情的综合分析能力。

[page::13]

9. 附录分析(章节4)


  • 附录表详细记录了滚动窗口内每次训练选出的宏观指标及其特征形式。

- 指标多包括央行资产负债表、贷款利率、存款准备金率、银行间回购利率、国债利率及其多个衍生指标(同比、均值偏离、流速等)。
  • 从指标数量变化及指标类型看,模型在不同时期围绕当时经济热点和政策环境适应性调整,具备较强时代敏感性。


[page::14][page::15][page::16][page::17]

10. 风险提示(章节5)


  • 统计数据仅反映历史情况。

- 模型存在误差,预测结果有不确定性。
  • 需谨慎解读,结合实际市场及政策环境。


[page::18]

---

三、图表深度解读



图0(第一页)沪深300与上证综指走势图:


  • 2020年至2021年中期,上证指数趋势整体先升后降,沪深300指数整体走弱显著,12个月回报分别为-1.76%(上证指数)和-14.75%(沪深300),显示市场波动及结构差异。


图1(第3页)万得全A涨跌幅与增量资金角度流动性指标:


  • 以红柱表示月度涨跌幅,蓝线表示股市流动性增量资金指标。

- 多数时间节点两者同步变动,验证指标对市场流动性情况的刻画能力。

图2(第4页)成交额/流通市值与增量资金流动性指标对比:


  • 红线(成交额/流通市值)与蓝线(增量资金流动性指标)走势大体同步。

- 成交额/流通市值指标更新频率高,可作为更实用的流动性代理。

图3(第7页)CCA原理示意图:


  • 显示从高维X和Y变量降维至一维后,寻找最大相关性的过程,直观说明CCA模型核心思想。


图4(第8页)滚动窗口示意:


  • 以半年为单位滚动,通过训练窗口(2年)预测测试窗口(半年),保证模型训练稳定性及实时性。


图5(第9页)滚动窗口内筛选训练示意:


  • 三轮CCA训练过滤逐步筛除无关特征,实现模型精炼与准确。


图6(第10页)模型预测值与实际值对比:


  • 蓝线预测值与红线实际值形态、波峰波谷对应较一致,表明模型对流动性趋势具备较好捕捉能力。


图7(第10页)预测值与实际值散点图:


  • 数据点呈明显正相关趋势,进一步印证了相关系数中等偏上的统计意义。


图8(第11页)流动性预测趋势与万得全A走势对比:


  • 红色阴影区为预测流动性上涨区间,绿色为下降区间。

- 流动性上升区间多伴随价格上涨趋势,流动性下降则伴随股市调整,表明预测指标对市场趋势具有一定领先指示作用。

---

四、估值分析



本报告主要聚焦在股市流动性预测模型构建及宏观指标筛选,未涉及对某公司或行业具体财务估值,不包含DCF、市盈率或其他传统估值方法的应用和目标价预测。

---

五、风险因素评估


  • 核心风险在于数据历史性质与模型预测误差存在的固有限制。

- 宏观指标发布的时间序列滞后、流动性传递机制复杂多变等因素均可能导致预测偏差。
  • 由于模型依据历史统计规律,面对突发性的结构性变化(如疫情、国际政策冲击)时,预测能力可能下降。

- 报告未详细列出模型风险缓释措施,但采用滚动自适应训练机制为缓冲手段之一。

[page::0][page::18]

---

六、批判性视角与细微差别


  • 报告充分运用数据与机器学习技术,系统性较强,但依赖历史数据与宏观指标,模型预测的“中等相关度”提示仍存在较大不确定性。

- 2021年下半年以来流动性上行但股市表现平稳,显示流动性信号并非单一驱动因素。
  • 报告警示结合其他信号使用,但未对组合多因子模型具体方案做出明确阐述。

- 财经政策与市场情绪的非线性影响难以完全由统计模型捕捉,故预测的有限性需被市场参与者充分认识。
  • 附录指标繁杂且多包含衍生特征,虽体现模型灵活性,但可能增加过拟合风险,需关注模型的泛化能力。


---

七、结论性综合



本文通过多维度宏观流动性指标构建股市流动性代理指标,进一步采用典型相关分析(CCA)模型,开发了一个自适应滚动训练的股市流动性预测系统。系统能有效从数千个宏观经济指标中筛选出对股市流动性有显著影响的特征,并对未来半年股票市场的流动性趋势提供中等程度准确预测。

实证表现表明,预测值与实际流动性指标的Spearman相关性达到0.56,Pearson达到0.44,统计显著,能较好地反映长期趋势。通过平滑处理后的流动性预测趋势与万得全A股价走势对比,发现流动性上升阶段往往对应市场上涨,进一步验证了流动性对行情的动力作用。

历史阶段回顾结合宏观政策与经济事件,模型自动提取热点指标适应当下经济环境,体现较强的动态适应能力。2021年下半年以来,虽然流动性逐步复苏,但对股市行情拉动力有所减弱,提示流动性指标不宜单独作为行情判断依据,需结合经济基本面及情绪等其他信号。

总体而言,本文提出的股市流动性预测指标构建体系为A股市场投资提供了较为科学的流动性趋势判断工具,具备较强实用价值及方法论创新,且为后续外生因子研究提供坚实基础。

---

核心图片索引


  • 上证综指-沪深300走势图

- 万得全A涨跌幅和流动性增量资金指标
  • 股市流动性代理指标与成交额/流通市值对比

- CCA模型示意图
  • 滚动窗口示意

- 滚动窗口内训练示意
  • 预测值与实际流动性对比图

- 预测值与实际值散点图
  • 流动性预测趋势与股价走势对比图


---

以上为《外生因子系列研究报告(一):股市流动性预测指标构建》的详尽分析解读,涵盖报告核心论点、模型原理、数据验证、历史趋势剖析、图表详解及风险提示,整体框架完整、技术路径清晰、研究逻辑严谨,极具借鉴和参考价值。

[page::0][page::1][page::2][page::3][page::4][page::6][page::7][page::8][page::9][page::10][page::11][page::12][page::13][page::14][page::15][page::16][page::17][page::18]

报告