news 2026/4/4 11:23:22

ITransformer: Inverted Transformers Are Effective for Time Series Forecasting

张小明

前端开发工程师

1.2k 24

文章封面图 — ITransformer: Inverted Transformers Are Effective for Time Series Forecasting

解释典型的Transformer架构用于时序预测效果差的原因，它们的观点：

由单个时间步长形成的Token，由于过于局部的感受野和同时时间点表示的时间不对齐事件而难以显示有益信息。

时间序列预测模型的标准设定：

输入 (历史窗)XXX：包含TTT个时间步，NNN个变量。矩阵维度为RT∗NR^{T*N}RT∗N;

输出（预测窗）YYY: 预测未来SSS个时间步，同样包含NNN个变量, 矩阵维度为RS∗NR^{S*N}RS∗N

数据处理的两种视角：

（1）Xt,:X_{t,:}Xt,::ttt时刻所有变量的快照。表示的是Excel表格中的一行，代表“此时此刻所有传感器的读数”。大多数Transformer（如Informer）是将这个Xt:X_{t:}Xt:, 作为一个TokenTokenToken输入模型。

（2）X:,nX_{:,n}X:,n: 第nnn个变量的完整时间序列，Excel中的一列，代表 ”某个传感器在过去一段时间内的所有读数“。

为什么否定Xt,:X_{t,:}Xt,:?

直接处理Xt,:X_{t,:}Xt,:(即把同一时刻的不同变量揉在一起)在物理意义上的两个缺点：

（1）系统性时滞（Systematical Time Lags）：在现实世界中，因果关系往往不是瞬时的，如果强制模型只看Xt:X_{t:}Xt:(同时关注ttt时刻的A和B)，可能变量在该时刻并不具备直接因果关系的数据点，真正的关联式错位的。

（2）物理量纲与分布的差异：同一时刻的Xt,:X_{t,:}Xt,:包含了性质完全不同的数据。这些数据的语义空间（Semantic Space）完全不同。虽然可以归一化，但是在深度学习，将这些物理意义极不相同的数值映射到同一个特征空间进行交互，难以学习到鲁棒的特征。

为什么拥抱X:nX_{:n}X:n?

单个变量的整条序列具有物理一致性，该变量在ttt时刻和t+1t+1t+1时刻的物理性质不变，它们的统计分布是平稳的。将X:nX_{:n}X:n视为一个Token进行Embedding，模型更容易学习到特征。

层归一化：

在此前Transformer中，层归一化将同一时刻的的多个变量进行归一化，使**每个变量杂糅无法区分**，提高了注意力建模词关联的难度。一旦收集到的数据没有按时间对齐，该操作还将引入延迟过程之间的噪声干扰。

在倒置版本中，层归一化作用于Variate Token内部，让所有变量的特征都**处于相对统一的分布下，减弱测量单位的差异**。这种方式还可以有效处理时间序列的非平稳问题问题。

前馈网络：

基于多层感知机的万能表示定理，前馈网络作用在整条序列上，能够提取序列的内在属性，例如幅值，周期性，频率谱（傅立叶变换可视作在序列上的全连接映射），从而提高在其他的序列上的泛化性。

在原始的Transformer中，模型的预测效果不一定随着输入的历史观测的变长而提升，在使用倒置框架之后，模型随着历史观测长度的增加，呈现明显的预测误差降低趋势。

版权声明: 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系邮箱：809451989@qq.com进行投诉反馈，一经查实，立即删除！

网站建设 2026/4/4 11:16:59

Kotaemon性能基准测试：不同硬件环境下的QPS表现

Kotaemon性能基准测试：不同硬件环境下的QPS表现在企业级AI应用快速落地的今天，一个智能客服系统能否扛住早高峰的万级并发请求，往往决定了它究竟是“生产力工具”还是“演示原型”。尤其是在金融、电信这类对响应延迟极为敏感的行业&#xf…

作者头像

李华

网站建设 2026/4/2 5:52:22

9个高效降AI率工具，本科生必看！

9个高效降AI率工具，本科生必看！ AI降重工具：论文写作的“隐形助手” 在当今学术写作中，越来越多的本科生开始借助AI工具进行论文撰写。然而，随着AIGC（人工智能生成内容）检测技术的不断升级&…

作者头像

李华

网站建设 2026/3/31 18:58:40

51单片机温度报警器：从C程序到Proteus仿真全记录

51单片机温度报警器C程序、proteus仿真、报告支持按键设置上下限温度值、当实际温度不在上下限温度值之间时、蜂鸣器报警最近玩了玩51单片机，做了个温度报警器，觉得还挺有意思，来和大家分享下整个过程，包括C程序代码、Proteus仿真…

作者头像

李华

网站建设 2026/3/30 10:48:51

10 个降AI率工具，继续教育学生必备！

10 个降AI率工具，继续教育学生必备！ AI降重工具：让论文更“自然”的秘密武器随着人工智能技术的不断发展，越来越多的学生在撰写论文时开始依赖AI工具进行内容生成。然而，这种便捷的背后也带来了新的挑战——如何有效降…

作者头像

李华

网站建设 2026/4/3 5:12:09

Java快速排序，零基础小白到精通，收藏这篇就够了

文章目录 Java实现快速排序快速排序原理快速排序一次划分图文演示过程整个快速排序的过程具体Java代码实现简结快速排序的性能 Java实现快速排序冲鸭，装上涡轮增鸭，开始学习快速排序算法吧！（快排也是一个递归过程噢&#x…

作者头像

李华

网站建设 2026/3/26 20:54:44

9个AI写作工具，自考论文轻松搞定！

9个AI写作工具，自考论文轻松搞定！ AI写作工具如何改变自考论文的写作方式在自考论文的撰写过程中，许多学生常常面临时间紧张、内容重复率高、逻辑结构混乱等难题。而随着AI技术的不断发展，AI写作工具逐渐成为提升论文效率和质量的…

作者头像

李华