`

Online Multivariate Regularized Distributional Regression for High-dimensional Probabilistic Electricity Price Forecasting

创建于 更新于

摘要

本文提出了一种在线多变量正则化分布回归算法,能够高效建模德国日前电力价格的24小时联合概率分布。该方法结合了多变量分布回归与坐标下降和LASSO正则化,实现了高维协变量空间下的可扩展估计。实证研究表明,考虑价格的依赖结构显著提升了预测的校准度和准确性。同时,本文详细分析了在线与批量估计间的计算成本与预测性能权衡,并提供了高性能Python实现(ondil包)。该研究首次系统地实现了多变量概率电价预测的在线学习框架,具有重要的理论和实际应用价值。[page::0][page::1][page::3][page::15][page::33]

速读内容


电力日前市场多变量价格时间序列特征分析 [page::1]


  • 德国日前市场24小时逐小时价格波动剧烈且存在明显的正负尖峰与偏态。

- 价格各小时间高度相关,尤其是在从2015年至2023年的多阶段市场波动期间。
  • 2022年因能源危机,价格均值和波动率大幅攀升,标准差由16.6升至142.8 [page::1]


多变量分布回归模型与在线正则化方法概述 [page::4][page::5][page::9]


  • 拟合多参数分布参数的回归框架,联合估计均值、方差及依赖矩阵。

- 采用LASSO正则化和在线坐标下降(OCD)算法,支持高维协变量空间和增量数据学习。
  • 多种规模矩阵参数化方案(Cholesky分解、修正Cholesky、低秩逼近)保证正定性并控制计算复杂度。

- 路径型正则化逐步增加规模矩阵复杂度,避免过拟合并实现早停 [page::2][page::12]

电力市场数据及预测架构设计 [page::15][page::16]


  • 使用2015-2023年德国日内电力市场数据,含价格、负荷、再生能源发电及化石能源价格等多变量特征。

- 采用在线学习比较批量扩展窗口和滚动窗口两类方法,优化模型更新效率。
  • 建构包括纯边缘LARX模型、基于Copula关联模型、到本文提出的全多变量条件分布回归模型的逐级复杂模型体系。

- 位置(均值)与尺度(波动)参数均纳入预测因子,尺度参数通过前7天滚动协方差矩阵信息动态调整。 [page::15][page::16][page::17]

量化指标及联合预测带校准方法介绍 [page::18][page::19]


  • 使用RMSE、MAE、CRPS衡量边缘预测性能。

- 采用能量分数(ES)、Dawid-Sebastiani分数(DSS)、变差分数(VS)、对数似然(LS)综合评判多变量分布预测性能。
  • 联合预测带(JPB)用于评价全路径覆盖率,反映预测的联合校准效果,区别于传统边缘置信区间。

- DM检验用于统计显著性比较,确保结果的鲁棒性和区分度。 [page::18][page::19][page::21][page::28]

多变量条件分布回归模型预测性能与依赖结构解析 [page::23][page::24]


  • 预测的多个时段(小时)间协方差矩阵动态演变,相关性随时间和波动水平显著波动。

- 多变量分布回归模型在联合预测带校准上显著优于单变量和非条件依赖模型。
  • Copula模型对能量分数(ES)表现最佳,而多变量分布回归模型在DSS、LS和VS上表现更优。

- 结果显示市场依赖结构随时间弱化,且波动加剧时多变量模型优势明显[page::24][page::26]

在线算法路径正则化与过拟合控制效果验证 [page::29][page::30]



  • 利用交叉验证跟踪路径正则化中所纳入的协方差矩阵带阶数(off-diagonals),有效避免过拟合。

- 信息准则(BIC、HQC)推荐保持较低秩(1-4阶off-diagonals),提升模型泛化性能。
  • 通过路径正则化,实现对复杂度的动态控制,获得一个高效且可解释的依赖结构时变建模。 [page::29][page::30]


在线学习显著提高计算效率且不损失性能 [page::31][page::32][page::33]


  • 以德国日前市场1831天测试集为例,在线算法单次增量更新只需秒级计算,批量方法需数小时。

- 线上预测的总体运行时间较传统批量拟合节约80-600倍。
  • 更新频率越高,预测精度提升越明显,且在线学习在运行效率与准确度权衡中远优于批量滚动或扩展窗口。

- 计算优化为复杂度较高的多变量估计提供了实际应用基础。 [page::31][page::32][page::33]

量化因子与策略构建说明

  • 本文主要集中于多变量参数化分布回归的理论开发、估计算法及实际应用验证,未设计具体的基于因子的量化选股或交易策略。

- 研究的核心为高维多变量联合概率分布建模及其在线快速正则估计技术,涉及多种分布参数和其尺度矩阵参数化方法,支持电力价格场景下的联合分布预测性能提升。
  • 虽然未直接构建投资策略,但多变量预测模型的提升为电力市场风险控制及资产优化提供底层概率信息支持,具有重要潜在应用价值。 [page::3][page::12][page::15][page::17]

深度阅读

在线多元正则化分布回归用于高维概率电价预测的深入分析报告



---

1. 元数据与概览


  • 报告标题:Online Multivariate Regularized Distributional Regression for High-dimensional Probabilistic Electricity Price Forecasting

- 作者:Simon Hirsch
  • 机构:Statkraft Trading GmbH 和德国杜伊斯堡-埃森大学能源市场与金融研究中心

- 关键词:在线学习、多元分布回归、概率电价预测、LASSO正则化、日前电力市场
  • 时间:未明确给出具体发布日期,但文献引用基于2024年


核心论点:本文提出了一种在线算法,结合多元分布回归和LASSO正则化,解决了高维、多时段电价的条件均值、方差及依赖结构建模问题,特别针对德国日内市场的24小时连续电价具有较好的预报准确性及校准效果,并实现了良好的计算效率及开源实现。

---

2. 逐节深度解读



2.1 引言



本节强调电力市场特别是德国日前市场的特点:高波动、尖峰值频繁、时序中24小时电价高度相关。概率电价预测(PEPF)成为必然需求,但现有研究多把各小时价视为独立的单变量时间序列,忽视了多变量依赖结构。作者以图1展示2017年前后每日24小时电价走势,展现了显著波动与跨时段相关性。表1统计了2015-2023年价格均值、标准差、绝对中位差、最大最小值,特别突出了疫情后电价剧烈波动与均值急升趋势。残差相关分析(图2)揭示了基于LASSO-ARX模型的残差间依赖显著性,提示单变量预测模型存在明显缺陷。文献综述指出,真正全面处理电价多时段联合分布的研究稀缺,尤其在在线学习领域鲜有高效模型。

2.2 多元分布回归模型与在线算法的提出(节2)



本节细致建立模型框架:
  • 模型形式:电价向量 \( \mathbf{Y} \in \mathbb{R}^{D} \) 的条件概率分布由参数 \(\boldsymbol{\Theta}\)驱动,参数可为向量或矩阵(如均值向量,协方差矩阵)。各参数通过带约束的连接函数映射至预测因子的线性函数。

- 参数约束:特别对协方差/精度矩阵,保证其正半定需采用无约束参数化技巧,如Cholesky分解、修正Cholesky分解(MCD)、低秩近似(LRA)。
  • 估计技术:基于迭代加权最小二乘(IRLS)与在线坐标下降(OCD)实现高维正则化估计。

- 路径正则化:沿依赖结构复杂度逐步增加,通过路径方式增添协方差矩阵元素,实现模型复杂度控制及避免过拟合。

2.3 参数化与估计细节(节2.2至2.6)



介绍了三种无约束参数化方法:
  • Cholesky分解(CD),矩阵元素部分由对角正数参数及自由下三角矩阵元素构成,需对对角元素用对数连接函数处理。

- 修改Cholesky分解(MCD),将协方差矩阵分解为下三角矩阵与对角矩阵乘积,对角矩阵元素为正。
  • 低秩近似(LRA),精度矩阵分解为对角矩阵和秩为 \(r\) 的矩阵乘积,参数量随维度线性增长,适合超高维。


定义了在线分布回归算法框架(图3),阐释了通过分布参数和对应坐标内循环的迭代更新策略,结合LASSO正则化路径并用信息准则(AIC/BIC/HQC)进行模型选择。详细给出得分向量、权重及Newton-Raphson方法对分布参数连接函数求导的数学推导(引理2.1及附录)。算法具有路径基正则化,在规模矩阵估计时从无依赖到逐步增加复杂度,实现计算量和模型复杂度的平衡(图4,算法4)。

3. 预报实证研究(节3)



3.1 市场与数据背景



文章以德国日前市场为例,数据时间跨度2015-2024年,采用公开数据集(Lipiecki et al., 2024),将2015-2018年底作为初始训练,长达4年的数据用于测试。变量包括天气、负荷、商品价格等基础权重因子(表3)。增量均值方差标准化保证预测过程的稳定性。比较三种学习机制:拓展窗口批量、滚动窗口批量和纯在线学习(图6)。已有文献多数采用批量。

3.2 模型设计与对照框架



提出多层次模型架构(图7):
  • 单变量自回归扩展模型(LARX),带期望和无条件方差或协方差估计。

- 单变量分布回归,加入GARCH(1,1)、自适应调整等方法。
  • Copula联合建模:结合单变量分布模型,估计依赖结构。

- 提出的在线多元分布回归:条件参数依赖,包括均值和依赖结构均建模。

精细描述了均值、方差及依赖参数建模方式,采用不同连接函数(恒等、对数、开根号),自由度参数的连接函数令其大于2确保理论有效性。

3.3 预测质量评估指标



强调概率预测需兼顾校准性尖锐性(Gneiting等,2007)。设计多指标:
  • 边际指标:RMSE、MAE、CRPS。

- 多元指标:Energy Score(ES)、Dawid-Sebastiani Score(DSS)、Variogram Score(VS)、Log-Score(LS)。

进一步提出联合预测区间(JPB)用于检验24小时合成路径的整体预测覆盖率和宽度,与单变量预测区间对比(图8),并采用Diebold-Mariano检验检测模型得分差异显著性。

4. 实证结果(节4)



4.1 时间变化依赖结构预测



展示了通过MCD参数化的多元分布回归模型,预测的时间变化的协方差矩阵(图10)与标准差和相关系数的时间演变(图11)。揭示波动性与小时相关性随日期和工作日非工作日呈现规律且动态变化,验证了动态建模依赖结构的必要性。

4.2 预测准确性评估



表4展现了全样本与两个子样本的多维评分指标,综合发现:
  • 校准能力(JPB误覆盖率):多元分布回归和Copula模型表现最佳,单变量模型表现欠佳(显著误覆盖)。

- 边际精度:LARX模型边际指标最佳(RMSE、MAE、CRPS等),但牺牲了联合分布的校准。
  • 多元指标:Copula模型在Energy Score最优,多元分布回归MCD参数化则在Log-Score及DSS表现更佳,Variogram Score体现了该模型对依赖结构识别的优势。

- 统计检验(图13)支持了上述结论,提示ES指标与其他指标对依赖结构敏感性不同。

风险事件分析显示多元分布回归模型在极端价格尖峰及价格跨度大日子中更为稳健(表5)。

4.3 模型过拟合与正则化



运用路径正则化策略控制规模矩阵复杂度,优化性能和模型规模的平衡(图14,15)。信息准则(BIC、HQC)推荐保留1个对角带,AIC偏向4个。该策略保证模型简洁且高效,同时有效避免过拟合。

4.4 计算效率



在1831天的测试集上,模型的初始训练在数分钟量级,在线更新仅需秒级,计算加速高达80至600倍(表6)。效率与预测准确性形成权衡(图16),在线学习于有限计算预算表现优于批量,滚动窗口批量表现落后。该优势体现了在线算法对能源市场高速数据流更新的适应性。

---

3. 图表深度解读


  • 图1(第1页):

- 两侧分别是时间序列上的24小时不同色彩线和某时段内日横截面价格走势。
- 阐释了价格的高波动性、正负尖峰、不同小时间的强烈协同变动。
- 支持电价多变量建模需求。
  • 表1(第1-2页):

- 详细展示2015-2023年德国日前电价均值、标准差、MAD、极值。
- 反映疫情后及能源危机期间电价均值和波动剧增。
  • 图2(第2页):

- 电价小时间Pearson相关矩阵(下三角)和LASSO-ARX残差相关(上三角)。
- 仍存在显著残差相关性,证实单变量建模不足。
  • 图3(第5页):

- 线上分布回归算法流程,以不同颜色区分单变量及多变量设置,以及在线估计和正则化的具体方法。
- 展示本文主贡献的算法实施框架。
  • 图4(第13页):

- 路径正则化示意图,展示逐步解锁协方差矩阵元素(红色为新加入、蓝色为之前加入)。
- 说明如何通过路径增加规模矩阵自由度。
  • 图5(第15页):

- 德国日前市场交易流程时间轴,呈现日内市场交易时间和批量/连续市场关系。
  • 图6(第15页):

- 对比批量扩展训练、滚动训练与纯在线学习的数据使用方式。
- 强调在线学习仅使用最新数据,极大节约计算资源。
  • 图7(第16页):

- 模型复杂度分类:从边际分布独立到完全条件多元分布建模。
- 直观展示本文模型处于技术前沿。
  • 图8(第20页):

- 50%预测区间对比
- 量化预测带忽视依赖,联合预测带考虑依赖,后者宽度明显更窄,提升预测清晰度。
  • 图9(第22页):

- 两个模型的模拟价格路径对比,独立小时预测模型路径更宽散,CD基规模矩阵模型路径更集中且贴近真实曲线。
  • 图10(第22页):

- 一周内每日的预测协方差矩阵热力图,显示依赖结构动态变化。
  • 图11(第24页):

- 预测标准差和一至三阶相关系数的时间演变,呈现典型一天内及周内依赖结构动态规律。
  • 图12(第26页):

- 滚动182天基础上多元模型相对于基线模型的技能评分,与日均电价对比。
- 高价波动期技能提升明显。
  • 图13(第28页):

- Diebold-Mariano统计检验矩阵,明确各模型间显著性差异,支持实证性能主张。
  • 图14(第30页):

- 模型对不同路径正则化复杂度的训练和测试Log-Score曲线,推荐1至4个对角带以防过拟合。
  • 图15(第30页):

- 套路正则化对测试Log-Score影响,验证图14的建议。
  • 图16(第32页):

- 在线与批量模型更新频率下的计算时间与对数评分权衡前沿图,在线学习优势明显。

---

4. 估值分析



本报告未涵盖传统意义上的公司市值估值分析,而主要侧重于电价的多元概率分布建模及预测性能评估,估值方法对应的是统计模型的参数估计与正则化策略,主要运用:
  • 迭代加权最小二乘(IRLS)

- 在线坐标下降(OCD)结合LASSO正则化
  • 路径正则化以选择规模矩阵适宜复杂度

- 信息理论准则(AIC, BIC, HQC)支持正则化参数选择

该估值框架不涉及资本市场估值,但在统计建模中实现模型优化、提高预测性能及防止过拟合,值得关注。

---

5. 风险因素评估



报告识别的风险层面包括:
  • 模型过拟合风险:特别是高维规模矩阵参数化容易出现过拟合。通过路径正则化及信息准则及早停止实现缓解。

- 参数初始化及数值稳定性:如多元t分布自由度参数需合理初始化以确保Newton-Raphson算法收敛。
  • 假设模型形式的限制:当前模型为参数模型,可能难以完全捕捉极端事件尾部分布,建议未来引入半参数或多变量极值模型扩展。

- 计算资源限制风险:高维模型计算复杂,依赖在线算法提高效率,但仍可能面临大规模并行及实时性挑战。

并未明确给出各风险的发生概率,但采取了适当缓解措施,且将未来改进空间纳入讨论。

---

6. 批判性视角与细微差别


  • 模型适用性的假设限制:尽管模型对依赖结构建模先进,参数化选择(CD、MCD、LRA)各有优缺点,对依赖的形状和动态的适配性存在差异,未深入探讨参数化可能导致的模型偏差。

- 性能权衡未完全解决:在边际预测准确性(RMSE等)和多元依赖描述性能(DSS、VS、LS)之间存在明显权衡,模型选择面临两难,分布回归模型牺牲了边际均方误差以换取更好概率预测,短期实际交易可能需要更适应这一权衡的复合策略。
  • 正则化策略仍较为基础:路径正则化沿对角带新增元素,未尝试更灵活的块状、图结构或动态选择方法,未来可增强算法自适应性。

- 计算资源需求与模型复杂度不完全匹配:虽在线学习大幅提升效率,但LASSO正则化模型更新仍需数秒甚至数分钟,实际极高速市场可能要求进一步优化。
  • 并行化实现有限:当前算法并行化受制于参数非正交性质,暂未充分利用多核或GPU资源。


---

7. 结论性综合



本文针对德国日前电价24维连续小时价格的概率预测,提出了一个前沿的在线多元分布回归框架,创新性结合了在线坐标下降、LASSO正则化及路径正则化策略,实现了对条件均值、方差及复杂依赖结构的解析和模型估计,显著优于传统单变量及非条件模型。

关键发现:
  • 多元建模明显改善价格路径联合预测的校准性(联合预测区间)和预测精准度。特别是在波动性极高的2021-2023年,模型表现优势更为突出。

- 通过图表和统计检验结果验证,动态依赖结构的建模对提高多元指标(DSS、LS、VS)有积极效应,单纯依赖单变量边际模型效果有限。
  • 路径正则化有效防止规模矩阵过拟合,控制模型复杂度,提高泛化性能。

- 在线学习架构在资源限制环境下以秒级更新实现高效训练,计算效率提升2-3个数量级,适合实时应用。
  • 代码实现公开,易于扩展和复现,推动概率电价预测及多元依赖建模研究和实际应用。


综合评价:该报告为电力市场概率预测提供了底层统计建模与实际可操作的在线算法相结合的先进框架,既有理论创新又兼顾实证效用,填补了多元依赖结构在PEPF领域的研究空白,对未来风险管理、电力市场优化具有重要启示和广泛应用价值。

---

参考图片示例


  • 图1原图展示日内24小时电价波动趋势及日间剖面分析


  • 图2电价时刻相关性与残差相关热力图


  • 图4路径估计示意(Cholesky和低秩矩阵)



  • 图8联合预测带与边际预测带区分示例


  • 图10预测协方差矩阵示例


  • 图11预测的时间变化相关结构热图


  • 图12滚动技能评分与平均电价趋势对应


  • 图13 Diebold-Mariano检验矩阵(显著性)


  • 图14过拟合分析及路径正则化效果


  • 图15路径正则化对性能影响


  • 图16计算时间与log-score效率前沿



---

全文梳理基于报告内容,所有结论均附带引用页码标识,确保溯源准确。[page::0]...[page::33]等

报告