`

Directional Price Forecasting in the Continuous Intraday Market under Consideration of Neighboring Products and Limit Order Books

创建于 更新于

摘要

本文提出了一种针对欧洲连续盘中电力市场的方向性电价预测新方法,结合了邻近产品(小时及季度)价格特征和限价订单簿数据,实现了对电价涨跌的精确分类预测。结果显示限价订单簿特征对预测性能贡献最大,邻近产品特征尤其是交叠交易时段的产品亦显著提升准确率,基础变量贡献有限,模型预测的信号强度与盈利能力相关,具备支持算法交易的实际应用潜力[page::0][page::5][page::8][page::11][page::12]。

速读内容


研究背景与问题定位 [page::0][page::1]

  • 随着可再生能源和灵活需求的增长,电力系统平衡面临更大不确定性。

- 欧洲连续盘中市场(CID)通过临近交付时段的持续交易,帮助调节供需平衡。
  • 现有电价预测方法多聚焦单价格指标,忽略价格内波动、跨产品动态及限价订单簿信号。


方法创新与模型设计 [page::4][page::5][page::6]

  • 首创将方向性价格预测任务定义为分类问题,输出价格方向概率,契合算法交易需求。

- 模型融合邻近小时及季度产品的价格特征,构建多时段特征集,针对不同预测阶段训练独立模型。
  • 利用限价订单簿顶层多订单量加权平均价格特征,增强价格信号捕捉能力。

- 应用滚动窗口与时间序列交叉验证,覆盖2024至2025年的德国EPEX数据。

量化特征与数据处理 [page::7][page::8]

  • 价格特征包含当前产品最近4笔交易的成交量加权平均价及历史10分钟VWAP序列。

- 邻近产品考虑包括交叠交易时段的4个小时产品及其对应的季度产品。
  • 使用VWAP和体积加权标准差进行滚动窗口归一化,解决价格序列的趋势和波动异质性问题。

- 整合负荷、可再生能源发电预测及电网不平衡指标(NRV-Saldo),但其对模型性能提升有限。

预测性能与模型比较 [page::8][page::9][page::10]

  • 梯度提升模型(LightGBM)相较逻辑回归表现出更高的总体准确率,特别是在隔较远的交易阶段。

- 逻辑回归模型在信号强度较高的样本中盈利能力(PnL)优于梯度提升,表现出更好的泛化和稳健性。
  • 各预测阶段中,交易开始前1小时至交付前半小时期间预测效果最优,稳定性最高。

- 限价订单簿特征带来最大准确率提升,邻近产品特征(尤其是交叠交付时段产品)明显改善表现,基础与不平衡数据效果欠佳。



时间序列性能波动分析 [page::11]

  • 预测准确率在2024年夏季和冬季出现波动下降,可能与高比例可再生能源引起的市场波动性增大相关。

- 最短提前期(1小时至交付前半小时)预测最稳定,受季节波动影响最小,显示其对实时交易的良好适用性。

未来研究方向与限制 [page::11][page::12]

  • 探索更多机器学习模型(如神经网络)以提升预测性能。

- 推广至季度产品及其他时段的电价预测。
  • 细化限价订单簿和价格特征,分析更复杂的特征交互。

- 真实交易策略回测尚缺乏,待未来研究通过假设订单执行等方法实现。

深度阅读

详细分析报告:《Directional Price Forecasting in the Continuous Intraday Market under Consideration of Neighboring Products and Limit Order Books》



---

一、元数据与概览


  • 报告标题:Directional Price Forecasting in the Continuous Intraday Market under Consideration of Neighboring Products and Limit Order Books

- 作者:Timothée Hornek, Sergio Potenciano Menci, Ivan Pavić
  • 机构:卢森堡大学安全、可靠性与信任跨学科中心(SnT)

- 发布日期:2025年
  • 研究主题:针对2024年至2025年德国欧洲电力交易所(EPEX)连续盘内市场(CID),提出并测试方向性电价预测模型,聚焦于小时产品,扩展槽位至邻近产品及订单簿特征在预测准确度和交易应用中的影响。

- 核心论点
- 传统电价预测多简化为单一基准价,忽略了价格内在动态及来自订单簿(LOB)的信息。
- 提出基于分类的方向性电价预测方法,纳入小时及15分钟产品,重点采用邻近产品及LOB特征。
- LOB特征和与目标产品交易期重合的邻近产品显著提高预测准确率。
- 该方法在模拟交易中表现出盈利潜力,适合算法交易。
  • 评级与目标价:该研究为学术性质方法创新报告,无传统评级和目标价,但其结论对实际市场参与者具参考价值。


[page::0,1]

---

二、逐节深度解读



2.1 引言(Section 1)


  • 关键点总结

- 可变新能源(VRE)和灵活负荷(如电动车与热泵)引入显著不确定性,导致电力系统偏差增加。
- 欧洲连续盘内市场允许接近实时调整,从而减少平衡偏差。
- 连续盘内市场价格波动剧烈,传统电价预测大多忽略高频及多产品交互动态,导致应用受限。
  • 推理依据

- 变动能源依赖气象,会影响供需匹配,因而市场需更精细的短期价格预测支持交易者决策。
- 面对这种复杂动态,预测若仅基于单一基准价无法捕捉细节,限制造成算法交易的有效性。
  • 贡献陈述

- 首次将分类方向性预测引入CID市场。
- 并行融合小时和15分钟多产品特征。
- 首次系统性结合LOB数据,提高预测价值。
  • 重要数据和假设

- 使用2024-2025年德国EPEX数据对模型效果进行验证,发现LOB数据最为关键。
- 按产品交付时间重叠对邻近产品权重不同,交叉产品价格动态改善准确率。
  • 金融术语和概念

- 方向性预测:预测价格涨跌方向而非精确价格值,适合交易决策。
- VWAP(成交量加权平均价):考虑交易量的平均价格指标,反映市场执行价格水平。
- LOB(限价订单簿):市场中未成交的挂单,揭示买卖报价及深度。

[page::0]

---

2.2 欧洲短期电力市场背景(Section 2)


  • 关键内容

- 介绍欧洲电力短期市场(俗称现货市场)机制,覆盖约36小时至数分钟前的交易。
- 说明德国市场结构,既有小时级也有15分钟级产品,小时产品流动性更高。
- 两种主要交易形式:拍卖(DAA日内次日前12点截止、IDA)和连续交易(CID),后者价格动态且结构复杂。
- CID设有多阶段交易期,包括CONT、SIDC和SDAT,各阶段对应不同订单簿范围及交割区域。
  • 逻辑解释

- 拍卖时唯一结算价便于用传统时间序列模型预测;连续交易包含多笔交易价,价格动态复杂,需新方法预测。
- 不同交易阶段影响市场流动性及价格形成,分析指导模型设计分阶段处理。
  • 图表解读(图1)

- 展示交易时间轴:前一日12点DAA结束,15点CID开始,持续至交割前。
- 标注不同阶段对应时间节点与区域覆盖,表明存在重叠与分割市场结构。
  • 相关概念

- 连续盘内市场(CID):单日内可随时交易,允许灵活应对变动。
- 门槛关门时间(Gate Closure):交易截止时间,之后不允许新订单。
- 交割窗口(Delivery Period):电力实际交付的时间段。

[page::1]

---

2.3 相关文献综述(Section 3)


  • 分类总结

- 现有预测方法分为三类:
- 单价预测(SPF):预测产品唯一基准价,例如VWAP平均价指数。
- 轨迹预测(TF):预测价格随时间序列的完整轨迹。
- 多价预测(MPF):为产品整个交易期内多个时点预测多组价格。
- 多数研究关注德国和伊比利亚半岛市场,且多针对小时产品。
  • 研究空缺

- 多数文献集中于单价,无视交易中高频变化和产品间交互。
- 方向性预测,尤其基于分类的,在CID市场文献中尚未充分研究。
- 结合LOB数据和更细粒度邻近产品如15分钟产品的研究极其稀少。
  • 文献数据整理(表1,表2)

- 归纳标明不同研究方案、数据周期、模型类型、是否考虑邻近产品及LOB。
- 该研究填补了分类方向性预测及综合邻近产品(小时与15分钟)信息的空白。
  • 技术术语解读

- LASSO回归:带有正则化的线性回归,自动选择影响最大的变量防止过拟合。
- Copulas:统计技术,描述多变量间复杂依赖结构,帮助捕获跨产品关联。
- 滚动窗口(RW):定期重训练模型以应对市场变化。

[page::2,3,4]

---

2.4 研究流程与方法论(Section 4)


  • 整体方法架构

- 采用设计科学研究范式(Design Science),聚焦建立方向性分类预测模型。
- 迭代过程包括:问题定义、目标设定、方法设计、演示、评估、交流。
  • 预测设定

- 单一产品视为时间区间和交割区间的元组$(s,\ell)$,其中$s$为交付开始,$\ell$为持续时间(小时)。
- 预测期跨度为交割前3小时至30分钟,符合工业中广泛接受的$\mathrm{ID}3$期。
  • 滚动窗口和交叉验证

- 每1分钟滑动,更新一次预测,总计145次预测。
- 使用每周为单位窗口,训练数据取前30天,测试未来一周,设置一天缓冲避免数据泄露。
  • 预测问题定义

- 将预测转化为二分类:未来5分钟VWAP均价上涨或下跌。
- 参考价取前4笔交易VWAP,未来价取接下来的5分钟交易VWAP。
  • 邻近产品集成

- 选取前后2小时的4个邻近小时级产品及其15分钟细分产品。
- 根据交割时间划分预测期为3个阶段($3h\rightarrow2h$, $2h\rightarrow1h$, $1h\rightarrow \frac{h}{2}$),每阶段使用不同邻近产品组合,分别建模。
  • 特征设计

- 当前产品:最近4个交易VWAP(短期信息) + 过去10分钟每分钟VWAP(序列特征)。
- 邻近产品:历史VWAP向量,不含最近4笔VWAP。
- 限价订单簿:根据订单数量和累积交易量计算VWAP,分别从买入卖出两端,采用前1、5、10条订单或对应MW计算。
- 负载及VRE发电预测、系统不平衡指标(NRV-Saldo)也纳入,但进账有限。
  • 模型选择

- Logistic Regression(带L2正则化)与LightGBM(基于梯度提升树的机器学习模型)。
- Multicollinearity(多重共线性)问题分别通过正则化和偏最小二乘法(PLS)缓解。
  • 评估指标

- 准确率(Accuracy):预测涨/跌正确的比例。
- 盈亏(PnL):结合预测方向利润模拟,即正确方向带来收益,错误方向导致损失。
- 採用Diebold-Mariano统计检验验证模型间准确度差异显著性。

[page::4,5,6,7]

---

2.5 结果分析(Section 5)



5.1 特征集性能(表3)


  • 主要发现:

- LOB特征大幅提升准确率,提升幅度高达5%以上,显著优于其他特征。
- 邻近产品特征中,以交付期与目标产品交叉的邻近产品(delivery start在预测期内)带来更大改善,且15分钟产品效果优于小时产品。
- 基础面(负荷、VRE)、不平衡指标对预测贡献极小或略有负面影响,主要因数据时效性不足。
  • 阶段差异:

- 预测越临近交割,LOB特征效果越明显。
  • 统计检验:

- Diebold-Mariano测试确认部分特征组合准确率显著优于基线。

5.2 模型比较(图7、图8)


  • 准确率:

- Gradient Boosting整体领先Logistic Regression,体现其捕获非线性关系的优势。
- 不同预测阶段表现差异,最近时段表现最好(最高约78%准确率),中间阶段(2h→1h)较差。
  • PnL表现:

- Logistic Regression在高置信度样本(高信号强度)中表现更好,表明其对高置信预测更稳健,不易过拟合。
- 完美预知的PnL基准随预测时段接近交割而大幅提升,符合市场波动性预期。
  • 信号强度分析:

- 信号强度越高,准确率和PnL均提升,表明模型概率输出可靠,可用于风控和交易策略筛选。
- 精度与覆盖率权衡明显:提高阈值提升准确率但减少样本量。
  • 市场效率假设:

- 中间时段预测表现差或意味着该时段市场相对更有效率,难以捕捉价格走势。

5.3 时间序列分析(图9)


  • 趋势观察:

- 最近时段保持稳定准确率。
- 3h→2h及2h→1h时段于2024年8月和12月出现显著准确率下滑,尤其与高VRE发电季节(夏太阳、冬风能)相关,可能带来价格表现激烈异常。
  • 解释:

- 短期预测更依赖近场交易簿动态,受季节震荡影响较小。
- 长时段预测对历史模式依赖大,季节波动影响显著。

5.4 总结


  • LOB特征、邻近产品尤其是交割时间重叠的邻近产品是预测的核心驱动力。

- 基础变量趋于滞后,未能贡献有效信号。
  • Directional forecasting模型提供了有形的算法交易入口,可通过概率信号强弱优化交易风险敞口。

- Logistic Regression模型在高信噪下表现有时优于更复杂的Gradient Boosting,表明模型复杂度需和过拟合风险权衡。
  • 预测短期内的交易机会最为强劲,适合快速响应的交易决策系统。


5.5 局限及未来方向


  • 限于两类模型,后续可引入神经网络等深度学习方法。

- 仅测试$\mathrm{ID}
3$(交割前三小时至半小时)预测,不涵盖其他时间段。
  • 特征设计需完善,可考虑多变量相互作用、更多LOB参数。

- 仅采用单特征组组合,未测试更复杂组合策略。
  • 仅专注小时产品,未来需扩展至15分钟等更细粒度交易品种。

- 真实交易策略回测缺失,未来需考虑实际交易逻辑、流动性、市场冲击等因素。

[page::8,9,10,11]

---

三、图表深度解读



图1(第1页)


  • 说明德国小时级电力产品的交易时间线。

- 标记DAA拍卖、CID交易(含单一及跨区耦合分阶段)时间点,展现交易阶段交叠与多订单簿结构。
  • 连接文本强调持续交易下的多订单价格序列对预测复杂性的影响。




---

图2(第5页)


  • 展示产品$(s,\ell)$的预测期与交付期关系,预测期为提前3小时到30分钟,交付期为$s$开始持续时长$\ell$。

- 支持文中定义的时间窗口,侧面说明预测重点覆盖$\mathrm{ID}3$时间范围。



---

图3(第5页)


  • 滚动窗口预测过程示意,展示每分钟生成一次包含5分钟预测区间的滑动窗口。

- 总计145步,体现高频实时更新能力。
  • 为模型部署于实际交易系统提供理论契合度。




---

图4(第6页)


  • 交叉验证时序划分图,训练期覆盖前30天,测试期为1周,测试区间滚动。

- 展示数据集分割防止未来信息泄露的策略,确保评估公正性。



---

图5(第6页)


  • 并行小时产品交付期示意,显示目标产品$(s,1h)$前后两个小时邻近产品及其交割时间。

- 明确分段划分预测期内不同邻近产品可用性,指导模型分阶段训练。
  • 强调交割开始后的数据不可用性对模型构建的限制。




---

图6(第7页)


  • 类似图5,展示对应邻近小时产品的15分钟细分产品,带点标记每个15分钟产品交割开始。

- 描述细粒度邻近产品信息纳入逻辑和时间限制。
  • 说明季度产品跨越多个预测期的特征属性。




---

表3(第8页)


  • 梳理不同特征组加入对梯度提升模型预测准确率的影响。

- LOB(顶层按MW)特征带来最多提升,后三个预测阶段均远超基础“当前价”。
  • 邻近15分钟产品通常提升更大,尤其在提前3-2小时阶段。

- 基础负荷、VRE、NRV不平衡指标提升有限,甚至有轻微下降趋势。
  • 表明短期盘内市场多反映即时交易活动,不易利用基本面静态预测。


---

图7、图8(第10页)


  • 根据不同信号强度分位数展示准确率和PnL。

- 高信号强度(模型置信)样本预测准确率显著高于基线(约75%-78%)。
  • PnL曲线与之对应,显示精确预测带来正向盈利。

- Gradient Boosting准确率整体领先,Logistic Regression在高置信度时PnL略优,推断后者更稳定。
  • 反映市场低效部分可利用模型判断获利,适合算法交易选样策略。




---

图9(第11页)


  • 单周滚动预测准确率时间序列。

- 短时段预测稳定性最高,3h→2h和2h→1h阶段2024年8月和12月存在波动骤降。
  • 与VRE季节变化、高波动相关,验证市场季节性动态对模型普适性挑战。

- 突出短时预测适应性更强,可靠性较高。



---

图10(第15页)


  • Diebold-Mariano统计检验热力图,验证不同特征组合差异的统计显著性。

- 大多数LOB特征及部分邻近产品组合在统计上显著优于基线。
  • 基础面及部分远期邻近产品无显著优势。

- 支持结论中对特征贡献分析的客观性。



---

四、估值分析



本报告未涉及传统金融估值模型(如DCF、市盈率),聚焦于预测模型准确度及交易模拟盈亏(PnL)作为“价值”衡量。
  • 使用准确率评价模型分类能力。

- PnL基于模拟交易盈亏计算,反映决策实际经济价值。
  • 交易策略简化为基于预测涨跌开平仓。

- 评估反映模型预测的实用性和潜在盈利能力,不直接对应公司估值。

[page::4,8,9]

---

五、风险因素评估


  • 市场波动风险:高VRE渗透期出现预测准确率降,表明模型难以适应极端波动,风险对应盈利能力下降。

- 基础面数据滞后风险:负荷和VRE预测未能实时反映,限制其效果,存在数据缺失/滞后风险。
  • 模型过拟合风险:Gradient Boosting表现优于Logistic Regression,但高置信区间估值较低,暗示过拟合导致泛化能力不足。

- 特征选择风险:仅一组特征组合分析限制,未来多变量关系可能带来风险增减未被覆盖。
  • 时间与市场结构风险:研究仅覆盖2024-2025年德国市场,其他时段和地区适用性未知。


报告未明确提出缓解措施,但通过滚动窗口重训及信号强度筛选在一定程度控制风险。

[page::5,9,11]

---

六、批判性视角与细微差别


  • 优势

- 首次引入方向性分类模型,符合算法交易的实际需求。
- 系统纳入LOB及邻近产品15分钟粒度特征,创新且有效。
- 迭代式设计科学流程,严谨且覆盖多维评价指标。
  • 局限

- 仅使用两种机器学习模型,缺少深度学习等处理非线性复杂模式的探索。
- 基础面数据时效问题未充分解决,可能影响服务性能。
- 未进行真实交易策略回测和市场冲击模拟,盈利估计理想化。
- 预测仅覆盖$\mathrm{ID}
3$期,短线或更远期预测空间未拓展。
- 多数实验集中于小时产品,未充分验证15分钟产品预测能力。
  • 内部细微差异

- Gradient Boosting训练拟合力强,但在真实交易模拟中未必优于简单线性模型。
- 预测各阶段表现差异较大,表明市场效率与数据可用性在不同时间不同。
  • 潜在偏见

- 使用EPEX德国数据可能引发欧洲其他地区适用性不足。
- LOB数据计算存在选择性(仅前1、5、10订单/交易量),可能遗漏深层订单簿信息。

[page::5,8,9,11]

---

七、结论性综合



本研究针对欧洲电力连续盘内市场提出了创新的方向性电价预测模型,以德国市场2024-2025年数据为基础,综合分析了邻近产品及限价订单簿(LOB)特征的作用。

核心发现
  • LOB特征是提升预测准确率的关键,较传统仅基于成交价的特征,带来显著增益(最高提升达5.5%)。

- 邻近产品价格,尤其是交割时间与目标产品重叠的小时及15分钟产品,能有效捕获市场联动动态,进一步促进模型性能。
  • 基础面与不平衡指标数据贡献有限,主要因数据滞后与静态特性无法反映短期市场波动。

- 方向性预测方法(分类)更符合算法交易实际需求,能为市场参与者提供可靠的买卖信号。
  • 信号强度良好反映模型预测置信度,有助于交易风险管理及策略筛选。

- 各预测时段表现不同,交割前1小时至半小时准确率最高且稳定,适合高频交易策略。
  • Logistic Regression在高置信度预测时以严格线性拟合策略展现更优PnL表现,揭示模型复杂度和过拟合间权衡。


图表的深刻洞察
  • 图1与5、6帮助理解市场和产品结构复杂性及多订单簿、多产品并行的特点,为分阶段建模提供理论基础。

- 表3量化各类特征对模型提升的阶段性贡献,证实LOB和邻近粒度特征不可或缺。
  • 图7-9展示模型准确率与盈亏随信号强度递增的变化曲线,说明概率输出实用性,及市场短期趋势可预测。

- 图10的DM统计检验确保采用特征的显著性且科学合理,增加结论说服力。

总体立场

研究团队对其提出的基于分类的方向性EPF方法持积极肯定态度,认为该方法显著提升了连续盘内市场的电价短期预测质量,尤其适用于算法交易场景,有助于更高效地捕捉和利用电力市场的价格动态。尽管存在数据滞后及模型复杂度限制,成果为未来集成多维动态信息和实时交易策略奠定了坚实基础。

[page::0-15]

---

总结



该文献为复杂连续盘内电力市场中的价格方向预测提供了全新视角和方法论,综合利用订单簿细节与邻近产品价格信息,借助机器学习分类模型,显著提升电价预测准确率和交易模拟收益,填补了该领域多个研究空白,对工业实际算法交易策略开发具备重要借鉴价值。这种基于多时段、多层次特征的复合预测方法,有望推动电力市场交易效率与风险管理前沿发展。

---

欢迎进一步提问或讨论具体章节与图表细节。

报告