HyperD: Hybrid Periodicity Decoupling Framework for Traffc Forecasting
论文概览
| 项目 | 内容 |
|---|---|
| 标题 | HyperD: Hybrid Periodicity Decoupling Framework for Traffic Forecasting |
| 作者 | 邵敏兰、张子健*、王毅力、戴艺伟、沈旭、王鑫*(吉林大学人工智能学院/计算机学院) |
| 会议 | AAAI 2026 (AAAI-26) |
| 核心任务 | 交通流量预测(Traffic Forecasting) |
| 代码: | https://github.com/ll121202/HyperD |
研究背景与挑战
交通数据的两大核心挑战
- 复杂的空间依赖:道路段与传感器之间存在动态交互,不同位置的交通状态相互影响
- 多尺度周期性 + 不规则波动:
- 周期性模式:人类通勤规律导致的日周期(daily)、周周期(weekly)等
- 不规则波动:交通事故、天气突变等不可预测事件引起的残差波动
现有方法的局限
| 方法类型 | 问题 |
|---|---|
| 传统分解方法(趋势-季节性分解) | 周期性信息被拆散到趋势和季节分量中,缺乏统一建模;分解过程不可学习,效果差 |
| 显式周期建模(如CycleNet) | 只考虑单一周期的尺度,忽略了多尺度周期性;缺乏空间-时间交互建模 |
HyperD 核心架构
论文提出了HyperD(Hybrid Periodic Decoupling)框架,整体结构如下:
输入: 历史交通序列 X ∈ R^(T₁×N) ↓ ┌─────────────────────────────────────────┐ │ Hybrid Periodic Representation Module │ ← 处理周期性分量 │ (混合周期表示模块) │ │ • 可学习日周期嵌入 P_D │ │ • 可学习周周期嵌入 P_W │ │ • 时空注意力编码器 STAE │ │ → 输出: 混合周期模式 S^in, S^out │ └─────────────────────────────────────────┘ ↓ 残差计算: R^in = X - S^in ┌─────────────────────────────────────────┐ │ Frequency-Aware Residual Representation│ ← 处理残差分量 │ Module (频率感知残差表示模块) │ │ • 时空频率编码器 STFE │ │ • 复数MLP (C-MLP) 在频域建模 │ │ → 输出: 残差预测 R^out │ └─────────────────────────────────────────┘ ↓ 最终预测: Ŷ = S^out + R^out ↓ ┌─────────────────────────────────────────┐ │ Dual-View Alignment Loss (双视角对齐损失)│ │ • 低频 ↔ 周期分量对齐 │ │ • 高频 ↔ 残差分量对齐 │ └─────────────────────────────────────────┘三大核心创新点
1. 混合周期表示模块(HPRM)
关键设计:可学习周期嵌入(Learnable Embeddings)
| 嵌入类型 | 维度 | 说明 |
|---|---|---|
| 日周期嵌入 P_D | R^(L_D × N) | L_D = 288(5分钟采样,一天288个时间点) |
| 周周期嵌入 P_W | R^(L_W × N) | L_W = 2016(一周2016个时间点) |
- 统计先验初始化:用训练数据每个节点、每个时刻的均值初始化,加速收敛
- 时空注意力编码器(STAE):结合GCN + 时间自注意力 + 空间自注意力, refine 嵌入
- 混合模式构建:根据时间元数据(time-of-day, day-of-week)从嵌入中索引对应片段,相加得到混合周期模式
2. 频率感知残差表示模块(FARRM)
核心思想:残差包含高频不规则波动,在频域建模更高效
时空频率编码器(STFE)流程:
R^in (时域) → FFT_s (空间维度快速傅里叶变换) → C-MLP (复数MLP处理频谱) → IFFT_s (逆变换回时域) → FFT_t (时间维度变换) → C-MLP → IFFT_t → 投影输出 R^out复数MLP(C-MLP)公式:
- 分别处理实部和虚部,模拟频域卷积
- 参数量少,但能捕获全局频率特征
3. 双视角对齐损失(DVA Loss)
解决周期分量与残差分量的语义重叠问题
对最终预测 Ŷ 做 FFT → 频谱 Ŷ_f → 低频部分 Ŷ_f^low ↔ 应与周期分量 S^out 对齐 (MSE) → 高频部分 Ŷ_f^high ↔ 应与残差分量 R^out 对齐 (MSE) 总损失: L = L_pred + α · L_dva作用:强制周期分支专注低频,残差分支专注高频,实现彻底解耦
实验结果
主实验(4个真实数据集:PEMS03/04/07/08)
| 对比结论 | 具体表现 |
|---|---|
| vs 所有基线 | SOTA,4个数据集全部最优 |
| vs 解耦方法 | 平均MAE降低22.63%(CycleNet-D)、23.27%(CycleNet-W) |
| vs 非解耦方法 | 显著优于DGCRN、STGODE等 |
消融实验(关键发现)
| 移除组件 | PEMS04 MAE变化 | 说明 |
|---|---|---|
| w/o LWE(周嵌入) | 18.20 →19.80 | 周周期比日周期更重要 |
| w/o LDE(日嵌入) | 18.20 → 18.30 | 日周期贡献相对较小 |
| w/o STAE | 18.20 →21.07 | 时空注意力对周期建模关键 |
| w/o STFE | 18.20 →25.24 | 残差频域建模最关键 |
| w/o DVA | 18.20 → 18.47 | 对齐损失有效但影响相对温和 |
鲁棒性与效率
| 指标 | 表现 |
|---|---|
| 扰动测试(突增/中断/打乱) | 性能下降最小,鲁棒性最优 |
| 显存占用 | 1.64 GB(对比D²STGNN的17.90GB,降低6.27×) |
| 训练速度 | 每轮7.31秒(对比STDN的59.20秒,提升6.79×) |
| 推理速度 | 1.49秒(CPU,对比STWave的7.11秒,提升4.77×) |
可视化分析
论文Figure 4显示:HyperD学到的日/周嵌入比CycleNet更"舒展"、细节更丰富,说明时空建模确实帮助捕获了更清晰的周期模式。
核心贡献总结
- 显式多尺度周期建模:用可学习嵌入直接建模日/周周期,避免传统分解的信息碎片化
- 频域残差建模:通过复数MLP在频域处理残差,高效捕获高频不规则波动
- 频率对齐解耦:DVA损失确保周期与残差分量在频率域各司其职,互不干扰
- 轻量高效:模型结构简洁,计算效率远超同类解耦方法
一句话概括
HyperD 通过"时域显式周期嵌入 + 频域残差复数网络 + 频率对齐损失"的三位一体设计,实现了交通流量预测中多尺度周期性与不规则波动的精准解耦,在精度、鲁棒性和效率上均达到SOTA。