`

A Stochastic Model for Illiquid Stock Prices and its Conclusion about Correlation Measurement

创建于 更新于

摘要

本研究针对乌干达证券交易所(USE)这一典型非流动性股票市场,创新地结合马尔可夫模型(MM)与指数Ornstein-Uhlenbeck模型(XOU)及几何布朗运动模型(gBm),有效捕捉了价格长期常数段和随机波动相结合的动态。研究发现USE股票价格间相关性偏低主要由于价格中大量零变动导致,这一现象被MM的价格停滞状态很好地解释。模型通过实证数据和模拟验证,证实MM-gBm优于传统gBm及XOU模型,特别是在短期价格预测和相关性测度方面表现突出,表明交易稀缺性在非流动市场中的关键作用[page::0][page::1][page::6][page::17][page::18]

速读内容


研究背景与问题定义 [page::0][page::1]

  • 传统金融建模假设市场流动且价格连续波动,但乌干达证券交易所价格常保持不变,价格停滞现象显著,传统SDE模型难以拟合。

- 本文提出通过将马尔可夫链模型用于描述价格是否发生变动,结合XOU和gBm模型描述价格变动幅度,从而捕获价格停滞与波动的混合动态。

模型构建与参数估计方法 [page::2][page::3][page::4][page::5]

  • 描述XOU模型的方程、最大似然估计参数推导公式和转移矩阵。

- MM状态0代表价格不变,状态1代表价格变动,结合XOU/gBm模型形成复合模型MM-XOU和MM-gBm。
  • 参数通过历史价格日志收益率数据和状态转移计数计算得出。

- 选用MAPE和Kolmogorov-Smirnov检验分别作为模型预测准确性和分布拟合优度的评价指标。

模型实证验证与表现分析 [page::6-15]

  • 使用USE典型股票(SBU、BOBU、DFCU和ALSIUG指数)不同历史时期数据,分别断点前中后疫情期间进行建模和预测。

- 实际价格显示常有长时间无变动,指数ALSIUG价格较为连续。
  • MM-gBm模型普遍在短期(30天)预测上表现最佳,MAPE指标最低,优于纯gBm、XOU以及MM-XOU,模拟收益分布与实测相符。

- 疫情期间模型适用性变化明显,XOU波动率相关参数不稳定,而MM结合模型更为稳健。
  • 跨市场示例:双交叉上市股票KCB和EQTY,在较流动的NSE表现出较高相关性,但在USE中价格停滞导致相关性降低。


相关性测度与模型结论 [page::16][page::17]

  • 使用滚动窗口计算股票对的Pearson相关系数,发现本地股票相关性显著低且有时为负,主要因价格停滞现象影响。

- 模拟表明,MM-gBm中因独立MM链引入大量零变动,显著拉低了价格序列间的测量相关系数。
  • 通过稳态概率和模拟公式量化了价格停滞概率与相关性之间的负相关关系,数学公式表达相关系数被调低与停滞概率成正比降低。


主要结论与扩展方向 [page::18]

  • MM-gBm和MM-XOU复合模型提供了切合非流动市场实况的参数解释和预测能力。

- 模型揭示价格停滞是导致USE股票间低相关性的关键,真实市场中停滞频率越高,观察到的相关性越低。
  • 研究建议考虑扩展马尔可夫状态数以及引入其他Markov模型,以更好刻画价格行为多样性。




重要模型性能指标示例表格(SBU COVID前30天,MAPE)[page::7]



| 模型 | Sn1 | Sn2 | Sn_3 |
|---------|-------|-------|-------|
| MM-gBm | 0.2813| 0.253 | 0.353 |
| gBm | 0.4936| 0.4827| 0.4912|
| MM-XOU | 0.4411| 0.4386| 0.4144|
| XOU | 0.4327| 0.4153| 0.4252|
  • MM-gBm模型MAPE最低,优于纯gBm和XOU等模型,说明复合模型对短期价格拟合更准确。

深度阅读

深度分析报告:《A Stochastic Model for Illiquid Stock Prices and its Conclusion about Correlation Measurement》



---

1. 元数据与概览



报告标题:
A Stochastic Model for Illiquid Stock Prices and its Conclusion about Correlation Measurement

作者与机构:
Erina Nanyonga、Juma Kasozi、Fred Mayambala、Hassan W. Kayondo,隶属于乌干达Makerere大学数学系;Matt Davison 隶属加拿大Western University统计精算及数学系。

发布日期与来源:
文献中无明确发布日期,引用文献年份最多到2024年,研究内容聚焦乌干达证券交易所(USE)。

主题及研究内容:
该文旨在探讨乌干达证券交易所(USE)因流动性低导致的股价行为动态,针对股票价格模型提出创新方法,同时分析低流动性对股票间相关性测量的影响。核心工作是将马尔科夫模型(MM)与两种随机微分方程模型——指数欧恩斯坦-乌伦贝克模型(XOU)几何布朗运动(gBm)结合,用以刻画股价中频繁出现的价格不变(即“常数价格”)现象,并对比纯XOU及纯gBm模型。

核心发现:
  • USE股票表现出多天价格不变的行为,传统连续价格变动模型无法很好描述。

- 结合马尔科夫过程以捕捉价格不变,搭配XOU及gBm模拟价格波动,模型更贴合实际数据。
  • 股票之间的相关性测量因低流动性被极大影响,表现为“假性”低相关。

- 模拟显示,当价格长时间停留不动(即MM中“零状态”持续时间长)时,即使底层gBm过程高度相关,测得的相关性仍趋向较低。

以上观点为整篇报告的核心论点,提供了针对非流动性市场股票价格建模与相关性分析的理论与实证支撑 [page::0,1,2,16,17,18,19].

---

2. 逐章深度解读



2.1 引言


  • 引言阐述了传统量化金融模型多基于市场高流动性的假设,而USE市场股价多天不变,标准SDE(如gBm)难以拟合。

- 突出问题点在于连续价格变化模型不适应频繁停滞的价格序列。
  • 提出将MM捕捉价格是否变动状态,与XOU/gBm模拟实际价格变化量的混合模型。

- 指出现有XOU单模型未涵盖常数价格现象,模型改进的必要性。
  • 说明股价受宏观、微观多种因素影响的随机性,强调理解随机过程的重要性 [page::0,1].


2.2 方法与材料



2.2.1 指数欧恩斯坦-乌伦贝克模型 (XOU)


  • 定义:股价服从XOU满足随机微分方程

$$ dS(t) = \gamma(\phi - \log S(t)) S(t) dt + \sigma S(t) dW(t) $$
  • 其中,$\gamma$为均值回复速度,$\phi$是log价格长期期望,$\sigma$是波动率。

- 提供了解析解及最大似然估计参数推导公式,给出模型离散形式,方便实际校准。
  • XOU拟合波动率存在均值回复且能较好拟合长期波动率经验特征。

- XOU模型对价格负值问题无影响,价格始终为正。

2.2.2 马尔科夫模型(MM)


  • 介绍有离散状态的马尔科夫链,状态转移概率矩阵,假设当前状态唯一决定下一状态概率。

- 状态定义为价格是否变化(0代表价格停滞,1代表价格变动)。
  • 该模型捕捉到USE价格常数现象的动态行为。


2.2.3 MM与XOU的组合


  • MM用以模拟价格是否变化的状态序列,若状态为0,价格不变,为1时由XOU描述价格变化。

- 转移概率矩阵定义详尽,涵盖状态0和1之间的切换概率。
  • 该混合模型弥补传统连续模型不足,能够自然处理连续重复价格造成的“常数区域”。


2.2.4 几何布朗运动(gBm)


  • gBm的经典定义如下:

$$ dS = \mu S(t) dt + \sigma S(t) dW(t) $$
  • 其中$\mu$为漂移,$\sigma$为波动率。

- 参数通过股价对数收益的样本均值与标准差估计。
  • 该模型广泛用于短期股票价格预测,计算便捷但假设波动率恒定。


2.2.5 MM与gBm的组合


  • 类似MM-XOU,MM-gBm用MM控制价格是否变动,变动时由gBm模拟。

- 两者均为将“是否价格变化”的离散状态与连续价格动态的SDE结合,目标是捕获真实价格序列常数和变动齐现的特性。

2.3 绩效指标与软件


  • 通过平均绝对百分比误差(MAPE)衡量模型预测精度。

- 计算滚动窗口皮尔逊相关系数评估相关性动态。
  • 使用Sagemath 9.5软件实现模型计算。


---

2.4 结果分析



多个章节和时间段的实证建模,对USE标的(如SBU、BOBU、DFCU、ALSIUG)价格进行了拟合和预测。

2.4.1 数据特征与价格走势


  • 价格时常保持长期不变,尤以个股为甚,市场指数(如ALSIUG)变动频繁。

- 图3.1清楚显示多只股票价格长期持平的现象。
  • 收益率分布(图3.2)显示多数个股收益呈“峰态”,标准正态难以完全拟合。


2.4.2 模型拟合与参数估计


  • 对比gBm、XOU、MM-gBm、MM-XOU四模型在多个时间区间的拟合误差(MAPE)表现。

- MM-gBm模型表现明显优于其他单一模型,尤以短期预测(30天)效果最佳。
  • MM混合模型保留了价格停滞的动态,导致估计的波动率参数更贴近实际市场波动。

- COVID-19期间数据表现复杂,XOU模型出现均值回复速度负值,表现不佳。
  • 指数均值回复模型XOU在多数时间段表现次于MM-gBm。

- 整体,MM-gBm和MM-XOU因加入价格停滞状态建模,对USE数据拟合更稳健。

2.4.3 相关性分析结果


  • 通过滚动窗口相关计算显示,USE本地股票如SBU与BOBU相关性偏低甚至为负,违背行业相关预期。

- 股价常态停滞导致的样本“零收益”日大量存在,使得实际皮尔逊相关性难以体现真实经济关联。
  • 跨市场上市的股票(EQTY与KCB),在NSE交易活跃且价格变动频繁,相关性明显较高。

- 模拟揭示MM中的“零状态”停留概率越高,模拟价格序列间的相关性越低,验证了理论解释。
  • 相关性测度受窗口大小影响明显,过小窗口波动大,过大窗口可能掩盖动态变化。


2.4.4 模型拟合示意与统计检验


  • 多幅图表(如图3.3、3.4、3.5、3.6、3.7)展现模型拟合效果,预测价格走势与真实价格对比。

- 采用Kolmogorov-Smirnov检验对收益分布做显著性测试,自变量显著指出MM-gBm、MM-XOU生成的模型分布更接近实证分布,而纯gBm、XOU差异显著。
  • DFCU等极度不活跃股票模型拟合效果较差,但MM-gBm优于整体非MM模型。


2.5 结论


  • MM-gBm混合模型对USE这种低流动性市场的股票价格序列拟合最优,短期预测效果尤为突出。

- 市场非连续价格变动的特征由MM进行有效捕捉,单纯SDE模型(gBm、XOU)无法涵盖此特性。
  • 价格常数现象严重抑制了表面相关系数水准,引致股票间相关性偏低,这是数据和市场的真实反映。

- 该模型改进为后续研究提供方法论基础,未来可拓展更多状态的MM及更复杂的标记过程。

---

3. 图表与数据深度解读



3.1 图3.1 价格变化图谱


  • 展示了BOBU、SBU、DFCU和ALSIUG的实际收盘价走势。

- 明显看到除ALSIUG外,其他股票多日价格停滞多,价格阶梯式上升或下降。
  • 反映USED市场特有的价格“固化”现象,非连续且长时间停留在某几个价格水平。


3.2 图3.2 价格对数收益分布对比


  • 显示了真实价格对数收益率的经验概率密度函数与正态分布的拟合情况。

- 多数个股出现人数峰值远超正态峰值,确证了跳跃、停滞结构及非常规波动行为。
  • 该现象说明常规正态随机过程模型难以拟合USE市场数据,强调采用MM混合模型的必要。


3.3 表格3.1–3.14 MAPE对比


  • 多个时间窗口及股票的预测误差列表。

- 显示MM-gBm在所有模型中MAPE最低,尤其短期预测中表现突出;XOU及纯gBm相对偏高,证明MM模块的贡献。
  • 分环保(疫情前、中、后)验证了模型的稳健性和适用性。


3.4 图3.3、3.4、3.5等拟合示意图


  • 具体展现拟合价格随时间变化趋势,四个模型的预测走势与实际走势并列。

- MM-gBm预测较为贴合真实价格连续停滞与跳跃行为,同时预测误差最小。
  • XOU对疫情期间数据拟合差,表现发散,验证了模型参数问题。


3.5 图3.8、3.9 相关性动态分析


  • 显示了跨市场上市股票KCB和EQTY的价格走势和滚动相关。

- 本地票SBU和BOBU等低流动性股票相关性显著低,甚至为负。
  • 高频交易市场股票价格波动更为充分,相关性也更强。

- 该图清晰支持理论结论:价格停滞状态隐藏了潜在经济相关信息。

---

4. 估值分析



报告主要围绕价格动态建模与相关性测量,无直接涉及传统企业估值模型(如DCF、P/E或EV/EBITDA)。模型的重点是时间序列建模、参数校准与预测准确率。

---

5. 风险因素评估


  • 主要风险体现在模型对标的的适应性:疫情期间市场波动极端,XOU模型失效(均值回复率负值)。

- 低流动性市场导致的价格停滞,使得传统连续价格模型失效,风险在于对非连续价格现象理解不足。
  • 模型基于历史行为的假设,若市场结构突变(例如政策冲击、市场参与者结构变化),则模型预测能力受限。


---

6. 批判性视角与细微差别


  • 将价格是否变动视作二元马尔科夫状态(0、1)是一简化,未来可扩展状态空间更细化,以捕获不同程度价格变动。

- 纯粹从MAPE角度,MM-gBm优,但不同时间段差异显著(疫情期间模型稳定性受限)。
  • 某些时间段XOU参数异常(如负均值回复)说明模型存在局限,针对不规则跳跃和极端行情需引入更复杂模型。

- 相关性测量因价格填充方法引入偏差(非交易日用前日价格填充)可能对计算结果有影响。
  • 相关性分析假设数据填充与实盘交易等价,理应谨慎解读。


---

7. 结论性综合



本报告深入剖析了低流动性市场中股票价格的非连续行为特点,提出并验证了结合马尔科夫链控制价格变动状态与传统SDE模型(XOU与gBm)混合的方法。实证以乌干达证券交易所为例,结合多个个股与指数数据,系统校准模型参数并量化预测误差。

核心结论包括:
  • 价格长期停滞现象是USE流动性低的强烈表现,传统连续价格模型难以满足需求。

- MM-gBm混合模型最佳拟合数据,特别适合短期股价预测,MAPE普遍低于其余模型。
  • 马尔科夫链对价格是否变化的隐含状态建模,为理解股价动态提供了新的视角。

- 低流动性导致的价格重复现象严重干扰了股票间相关性的统计度量,使其看似相关性较低甚至负相关,实为数据结构原因。
  • 跨市场上市且交易活跃的股票展现出更高的相关性,与理论一致。

- 该研究为低流动性市场的价格建模及风险管理提供了可行工具与理论支持,建议未来拓展多状态马尔科夫模型以进一步提高描述精度。

该报告运用详尽的数学建模、丰富的实证校准与严谨的统计检验,构筑了对非活跃市场股价行为的系统化理解,开辟了针对非流动性挑战的新的建模路径,具有较高的理论和实务价值 [page::0-20].

---

参考图表展示示例



图3.1:USE多只股票收盘价格走势(展示价格长时间不变现象)



图3.2:实际与理论对数收益率概率密度对比(呈现收益分布峰态差异)



图3.3:MM-gBm与其他模型对SBU股价的拟合实例



图3.9:跨市场活跃股票相关性动态



---

总评



本报告通过创新性地结合马尔科夫模型与经典SDE,系统揭示了低流动性市场价格建模难题及其对相关性体系结构的影响。模型设计科学,实证分析扎实,结论清晰且合理,提供了理解和管理非流动性股票价格风险的有效工具。尽管存在简化假设和数据填充局限,但为类似新兴市场股票建模奠定基础,具备广泛应用前景。

报告