`

ORDERFUSION: ENCODING ORDERBOOK FOR ENDTO-END PROBABILISTIC INTRADAY ELECTRICITY PRICE FORECASTING

创建于 更新于

摘要

本文提出了OrderFusion,一款端到端的轻量级(4872参数)概率型电力日内价格预测模型。它通过编码订单簿中的买卖交互,采用迭代融合机制和层次多分位数预测头,有效克服了传统特征依赖和分位数交叉等问题。实验证明,OrderFusion在德国高流动性和奥地利低流动性市场均优于多种基线模型,展示了出色的泛化能力和稳定性[page::0][page::1][page::5][page::6][page::8]。

速读内容


订单簿买卖交互的特点和挑战 [page::0][page::1]


  • 买卖双方在交易时间动态调整报价,具有明显的交互行为。

- 传统特征如VWAP无法反映买卖交互,且分位数单独模型存在分位数交叉问题。

OrderFusion模型架构及核心机制 [page::3][page::4]


  • 输入订单簿数据分为买卖两侧,采用双重掩码过滤无效交易并突出最近交易信息。

- 设计迭代融合层,通过跨注意力机制反映买卖双方交互,形成多层次融合表征。
  • 使用残差连接和平均池化聚合多交互层次特征,输出高维表示。

- 预测头采用层次结构,先预测中位数,再通过非负残差计算上下分位数,严格保证预测顺序无交叉。

量化实验与基准比较 [page::5][page::6]


| 模型类别 | AQL(平均) | AQCR(量化交叉率) | RMSE | MAE | R² |
|-----------------|-----------|----------------|--------|--------|---------|
| Naïve基线 | 高 | 0.00% | 高 | 高 | 较低或负 |
| 域特征基方法 | 较低 | 0.01%-0.23% | 较高 | 较高 | 中等 |
| 先进时间序列模型 | 0.035+ | 0.00% | 约25+ | 约11+ | 约0.88 |
| OrderFusion | 最低(≈0.03) | 0.00% | 最低(≈21) | 最低(≈9) | 最高(≈0.90) |
  • OrderFusion实现AQL指标显著领先,AQCR保持0,消除分位数交叉问题。

- 在RMSE、MAE与R²指标中均优于深度学习和传统统计模型。
  • 参数量远低于其他时间序列模型(仅4872参数),显示良好的模型压缩效果。


跨市场泛化性验证 [page::6][page::7]

  • 在流动性较低的奥地利市场,OrderFusion同样表现优异,AQL相较于基线最低降低超过15%。

- 实验证明,买卖交互模式及端到端学习方法具有较强的适应性。

消融分析揭示关键设计价值 [page::7][page::8]

  • 双重掩码的缺失导致模型噪声剧增,AQL增加31%。

- 弃用迭代交互融合层AQL增加18%,替换为自注意力AQL增加7%。
  • 去除残差连接等设计,性能均有不同程度下降。

- 分位数层次预测头有效避免分位数交叉,消除后处理需求。

量化策略与因子构建

  • 本文无具体量化交易策略和因子模型设计,聚焦于订单簿原始数据的深度表征与概率预测模型构建与性能验证。

深度阅读

金融研究报告深度分析——《ORDERFUSION: ENCODING ORDERBOOK FOR ENDTO-END PROBABILISTIC INTRADAY ELECTRICITY PRICE FORECASTING》



---

一、元数据与报告概览


  • 标题:ORDERFUSION: ENCODING ORDERBOOK FOR ENDTO-END PROBABILISTIC INTRADAY ELECTRICITY PRICE FORECASTING

- 作者与机构:Runyao Yu 等人,隶属奥地利技术研究院(Austrian Institute of Technology)、代尔夫特理工大学(Delft University of Technology)、亚琛工业大学(RWTH Aachen)、Squirrel Ai Learning 与清华大学
  • 发布日期:未明确提及,但引用文献时间最晚为2025年的会议

- 主题与议题:提出一种基于电力连续盘内交易(CID)订单簿数据的端到端(end-to-end)概率预测模型OrderFusion,用于预测澳大利亚和德国两大市场的盘内电价的概率分布,实现高效且准确的多分位数预测。

核心论点与目标价

本报告核心论点为:传统盘内电价预测依赖于领域特征提取与多个模型分位数分别训练,存在端到端学习中断、特征交叉、参数冗余等问题;本文提出的OrderFusion模型,基于买卖双方深度互动的订单簿原始数据,通过交叉注意力机制实现低参数(4872个参数)下的多分位数联合预测,优于现有方法。报告无直接目标价,属于方法学创新与应用性能评估型研究。

---

二、逐节深度解读



1. 引言与背景(Introduction)


  • 核心内容:随着可再生能源大量接入,供电波动加剧,连续盘内市场成为调节电力不平衡的关键。盘内市场的特点是交易者基于特定交货时间提交买卖报价,不同于金融市场预测未来现金流,因此盘内电价预测难度高,表现为价格跳跃、复杂的买卖动态互动。

- 逻辑分析:强调盘内市场与传统金融预测的区别,突出买卖双方报价的交互性和市场不确定性,奠定研究买卖互动对价格形成机制影响的理论基础。
  • 图解:图1显示2024年7月23日18:00交货时间的买卖报价互动,呈现买卖双方根据对方报价调整交易行为和价格随着交货时间临近出现跳跃的动态。


2. 现有方法问题与研究动机


  • 问题识别

- 现有预测多依赖手工领域特征(如15分钟VWAP),该特征直接对买卖双方聚合忽略互动信息,阻断端到端学习。
- 多分位数预测通常单独为每一分位数训练模型,导致分位数交叉(Upper Quantile预测低于Lower Quantile),统计意义不成立。
- 复杂时间序列模型虽能捕捉时间关系,但缺少买卖互动的归纳偏置,参数冗余。
  • 报告结论:需要一个端到端、融合买卖双方信息、参数高效的模型,减少人工特征依赖并完整捕获买卖交互。

- 提出方案:OrderFusion模型,4,872参数,通过买卖双方迭代融合和层级多分位数预测解决上述问题,实现端到端、无交叉的多分位数预测。
  • 贡献点

- 发布参数高效的端到端概率预测模型OrderFusion。
- 横向对比德国(高流动性)与奥地利(低流动性)市场,验证泛化能力。
- 通过消融实验明确各设计模块对性能的贡献。

3. 预备知识与任务定义(Preliminary)


  • 目标:预测三个广泛使用的价格指数$\mathrm{ID}1$,$\mathrm{ID}2$,$\mathrm{ID}3$,分别对应距离交货时间不同长度的VWAP。

- 数学表达:价格指数定义为交易价格与成交量的加权平均,覆盖预测窗口为从预测时点$t
f$到交货时间$td-\deltac$之间的交易。
  • 信息结构:市场包括买方(+)和卖方(-),两侧交易数据作为输入。


4. 模型结构详解(Model)



4.1 编码层(Encoding)


  • 将订单簿交易数据分成买卖两侧,分别采集每笔交易的价格$Pt^{(s)}$、成交量$Vt^{(s)}$和交易相对于交付时间的时间差$\nabla t = td - t$。

- 由于交易数量不定,输入为变长二维序列,每侧各为一组二维时序数据,构成“2.5D”结构。

4.2 主干网络(Backbone)


  • 设计双重掩码层

- 填充掩码$\mathbf{B}
i^{(s)}$用于填充标记,使得序列统一长度$T{\max}$,填充值为一个极大常数,保证非数据点不影响后续运算。
- 时间掩码$\mathbf{D}
i^{(s)}$强调只使用最新的$L = 2^\alpha$个交易点,体现市场效率假设下近期交易最具信息价值。
- 两掩码元素乘积得出联合掩码$\mathbf{M}i^{(s)}$。
  • 迭代融合层(Iterative Fusion Layer)

- 该层通过买卖双方的交叉注意力机制(Cross-attention)迭代融合买卖信息:
- 对每次迭代$k$,买方表示用自己作为查询(Query),卖方作为键(Key)和值(Value)进行加权组合,反之亦然。
- $k=0$时用原始掩码后的输入初始化,再经过$K$次迭代融合形成交互丰富的表示。
- 实现买卖双方互相观测对方报价,模拟现实市场交易中策略互动行为。
  • 聚合层(Aggregation Layer)采用残差连接对各迭代层输出求和,获得高层次表示$\mathbf{C}i$,并通过平均池化降维成向量$\mathbf{U}i$。


4.3 预测头(Head)


  • 实现分层多分位数预测,支持分位数$\tau \in \{0.1, 0.5, 0.9\}$:

- 中位数($\tau=0.5$)直接通过$\mathbf{U}
i$映射预测。
- 上下分位数以中位数为基准,通过加或减非负残差(绝对值函数保证非负)获得,该残差来自相同表示的另一个单层映射。
- 该设计本质上实现了严格单调的预测分布,根治量化回归常见的分位数交叉问题。

4.4 损失函数(Loss)


  • 使用平均分位损失(Average Quantile Loss, AQL),针对所有样本和分位数统一训练,确保量化预测的偏差以分位损失度量,兼顾过高和过低预测的惩罚权重。


---

三、图表深度解读



图1(第0页)


  • 描述:展示2024年7月23日18:00交货时刻买卖双方交易价格随交易时间演变的散点图,点大小按成交量区分。

- 解读
- 买家(橙色)和卖家(灰色)报价动态,表明买卖互动明显。
- 临近交货时间,价格出现明显下跌跳跃,表现市场供需紧张且策略变化剧烈。
  • 联系文本:支持作者论述买卖双方互动对盘内价格形成影响,体现模型设计的必要性[page::0]


图2(第2页)


  • 描述:德国市场2024年不同时间与小时的三类价格指数$\mathrm{ID}1,\ \mathrm{ID}2,\ \mathrm{ID}3$的价格分布及波动情况。

- 解读
- $\mathrm{ID}
1$波动最大,频繁价格尖峰,反映交货前最后时刻的紧张交易。
- $\mathrm{ID}_3$最活跃但波动最小,代表最长预测时段。
- 平均价格相近,标准差逐渐下降,反映不同交货时段市场风险特性。
  • 联系文本:展示研究对象的复杂波动性,强调对不同时间尺度的预测挑战[page::2]


图3(第3页)


  • 描述:OrderFusion模型结构,示意买卖侧输入经过双重掩码与迭代融合层处理,最终通过多分位数层级头进行预测。

- 解读
- 细览迭代融合层交叉注意力机制,体现买卖侧互相影响的动态编码过程。
- 多分位数预测头图示验证分位数预测的严格单调性设计。
  • 联系文本:全面展示模型设计含义,验证理论设计到实现的完整逻辑链[page::3]


表1(第4页)


  • 描述:展示交互迭代层不同级别$k$的表示内容与含义。

- 解读:$k=0$时是原始买卖侧数据,$k=1$开始融合对方信息,体现模型对市场博弈过程模拟。
  • 联系文本:解释迭代融合层工作机理,强化模型归纳偏置的合理性[page::4]


表2(第6页)


  • 描述:德国市场不同模型在三种指标上的预测性能比较(Q0.1,Q0.5,Q0.9的量化误差),AQL、AQCR、RMSE、MAE和$R^2$。

- 解读
- OrderFusion在三指标和整体AQL均为最优,并且AQCR达到0,说明无分位数交叉。
- 超过传统特征基线(15分钟VWAP、最后价格、庞大特征集)及五个先进时间序列模型15%-20%的误差提升。
- 参数远少于其他时间序列基线(4472 vs 数十万至百万级)。
  • 联系文本:实证顺应模型提出的设计目标,反映端到端买卖互动建模的重要性[page::6]


表3(第7页)


  • 描述:奥地利市场(低流动性)同类性能对比。

- 解读
- OrderFusion仍领先所有基线,表明确实具备泛化能力。
- 流动性不足导致整体误差较德国市场高,表明流动性与预测难度正相关。
  • 联系文本:强调实验设置的泛市场适用性,验证了买卖互动模式的普遍价值[page::7]


表4(第8页)


  • 描述:多组消融实验对关键模块影响。

- 解读
- 取消掩码、随机掩码均大幅提升AQL,表明掩码对去噪与聚焦近期数据必要。
- 取消迭代融合升高AQL近19%,替换为自注意力提升6.8%,强调交叉融合不可或缺。
- 不使用残差连接或最大池化均失效,平均池化与残差连接促进特征融合。
- 单量预测模型有较大分位交叉(AQCR 1.17%),分层头消除这一缺陷。
  • 联系文本:确定核心设计的定量贡献,是报告技术价值的坚实支撑[page::8]


图4(第17页)与图5(第18页)


  • 描述:在正常及极端价格情形下的预测对比,三种指标的中位数与区间预测。

- 解读
- 图4显示预测价格与真实价格高度吻合,预测区间合理覆盖。
- 图5反映在激烈波动和尖峰事件中的预测仍较稳定,侧面印证模型鲁棒性和极端情形适应能力。
  • 联系文本:直观展现模型实际应用性能和风险管理潜力[page::17][page::18]


---

四、估值分析(模型性能评价)



尽管本报告非传统意义上对企业估值或财务指标的分析,但其在模型评估中采用了多种指标:
  • 量化分位数损失(Q0.1/Q0.5/Q0.9):分别衡量预测下分位、中位数与上分位的误差。

- 平均分位损失(AQL):覆盖整体预测性能,综合三个分位数。
  • 平均分位交叉率(AQCR):衡量分位预测顺序一致性的频率,0表示无违例。

- RMSE与MAE:点预测的均方误差和绝对误差,强化预测准确性。
  • $R^2$决定系数:反映预测解释整体数据方差比例,越接近1越理想。


通过这些综合指标评价,OrderFusion展示了稳健优异的性能,且模型仅拥有4872参数,远少于其他深度学习基线模型,有效避免过拟合。

---

五、风险因素评估


  • 市场效率风险:如果未来CID市场趋近弱形效率,历史交易数据的信息价值降低,简单模型可能足够;OrderFusion或受限。

- 模型可解释性风险:深度学习结构复杂,当前模型缺乏直观可解释性,难以直接应用于监管或风险监控。
  • 数据获取成本:报告中所使用的高度详细订单簿数据采集费用高昂(约€23,400),限制了研究的地理与时间范围。

- 极端行情挑战:尽管模型对极端价格具备一定鲁棒,但预测难度依然大,特别是交货时较早的窗口。

缓解策略部分未来工作提出了发展模型解释性、扩大数据区域和基于基础模型预训练的思路。

---

六、批判性视角与细微差别


  • 端到端设计优势明确,但依赖高度结构化订单簿数据,可能限制普适性。

- 迭代融合结构虽减少参数,但是否存在进一步复杂度优化空间未展开。
  • 对极端市场情境的长期稳定性与多市场跨时段验证有限。

- 对比模型基线选择合理且具代表性,但深度学习基线均为通用时序模型,缺省增强市场特异性的尝试。
  • 结果涉及3年订单簿和2024年预测,稍显短期,电力市场快速变化可能影响长期稳健表现。

- 消融实验严格,体现研究严谨,但单独组件对不同市场环境下的适用性探索较少。

---

七、结论性综合



本报告系统阐述并验证了一种针对欧洲连续盘内电力市场的概率价格预测新方法OrderFusion。该模型通过买卖订单簿的双侧交叉注意融合,实现低参数量且端到端的多分位数概率预测,成功克服了传统领域特征依赖和分位数交叉问题。

实验部分全面覆盖德国和奥地利两个流动性悬殊的市场,多个量化指标(AQL、AQCR、RMSE、MAE、$R^2$)均显示OrderFusion具有显著优于传统特征基模型和当前先进时间序列模型的性能优势,且保持零分位数交叉率。

关键模型设计,如双重掩码凸显近期交易重要性,迭代融合层捕捉买卖双方互动,分层预测头严格排序分位数,均在消融实验中被验证为不可或缺组成。

图表分析揭示了订单簿数据的丰富交互信息及市场价格动态,增强了模型对市场微观结构的适应与理解。

未来工作聚焦于市场效率变化对模型的影响、模型可解释性提升以及打造更大范围的预训练模型以更好地支持欧洲各区域市场。该报告不仅推进了电力市场内盘价格预测技术,也为相关风险管理和策略制定提供了实用工具,助力可再生能源高比例整合与电力市场稳定运行。

---

整体而言,OrderFusion以端到端低参数、高性能的创新架构回应了电力市场价格预测领域长期存在的技术瓶颈问题,实现了理论与实证的有机结合,对电力市场参与者和科学研究均具有较高参考价值。[page::0,1,2,3,4,5,6,7,8,17,18]

报告