北大Nature重磅！忆阻器芯片能效提升百倍、算力暴涨4倍-开发者社区

北京大学人工智能研究院陶耀宇研究员与集成电路学院杨玉超教授团队，近日在后摩尔时代计算架构领域取得重大突破。

他们摒弃了传统芯片依靠晶体管逻辑门堆砌算力的老路，另辟蹊径，利用两种不同特性的忆阻器进行异质集成，构建了一套全新的多物理域融合系统。

这套系统不依靠复杂的算法代码驱动，而是利用器件本身的物理属性直接“演化”出计算结果。

相关论文已在国际顶级期刊《自然·电子学》上发表。

团队利用氧化钒与氧化钽铪器件的异质集成，在物理层面重构计算逻辑，成功研制出全球首个基于第一性原理的存算一体傅里叶变换系统，吞吐率超现有硅基芯片4倍。

这项成果是一次计算范式的底层重构。

它将原本需要巨量逻辑电路和高功耗运算才能完成的傅里叶变换，转化为器件内部电子流动的自然过程，为人工智能、信号处理以及未来6G通信等领域提供了一条打破“能效墙”的全新路径。

摩尔定律式微与傅里叶变换的算力困局

傅里叶变换是现代文明的数学基石之一。

从我们聆听的数字音乐，到通过Wi-Fi传输的视频流，再到核磁共振成像，甚至大语言模型的底层逻辑，无处不闪烁着傅里叶变换的影子。

它的本质是将一个复杂的时域信号——比如一段嘈杂的录音，拆解成无数简单正弦波的叠加，从而揭示出隐藏在混沌表象下的频率本质。

在过去的半个多世纪里，人类依靠基于硅基晶体管的数字芯片来处理这一变换。

为了在计算机中实现它，数学家发明了快速傅里叶变换算法（FFT），通过精妙的“蝴蝶图”结构将计算复杂度大幅降低。

这种基于冯·诺依曼架构的计算模式正面临严峻挑战。

随着数据量的指数级爆发，传统芯片的物理极限已近在咫尺。

现有的硅基芯片在执行傅里叶变换时，需要频繁地在处理器与存储器之间搬运数据，这种“存算分离”架构导致了巨大的能耗与延迟。

传统算法虽然精妙，但本质上是一种串行的逻辑调度。

它需要将连续的物理信号切片、离散化，再通过无数次加法与乘法运算来逼近真实结果。

当面对高并发、非均匀采样的复杂场景时，固定基数的传统硬件往往显得力不从心，算力与能效难以两全。

人类急需一种新的计算载体，能够突破硅基逻辑电路的桎梏，以更接近物理本质的方式处理信息。

忆阻器作为一种“有记忆的电阻”，因其存算一体的特性被寄予厚望。

过往的忆阻器研究往往局限于单一类型的器件，要么算力单一，要么难以兼顾频率生成与加权计算。

团队敏锐地捕捉到了这一痛点，他们将两种截然不同的“后摩尔新器件”组合在一起，各取所长，由物理定律直接驱动计算。

异质集成架构重构物理驱动

这项研究最令人拍案叫绝的创新，在于它重新定义了硬件与算法的关系。

团队提出了一种基于“第一性原理”的异质集成傅里叶变换系统（HIFT）。

所谓的“第一性原理”，在这里意味着回归事物的本质，不再用逻辑电路去模拟数学公式，而是让物理器件的导电行为直接对应数学运算。

团队巧妙地选取了两种性格迥异的忆阻器材料：易失性的氧化钒（VO2）和非易失性的氧化钽/铪（TaOx/HfOx）。

这两种材料如同管弦乐团中的不同声部，前者负责灵动的节奏，后者负责厚重的和声，共同演绎出一场完美的物理计算交响曲。

氧化钒器件具有独特的绝缘体-金属相变特性。

当电流流过时，它会像心脏跳动一样产生极其稳定的振荡。

团队利用这一特性，将其打造为系统的“频率生成器”。

它不需要外部庞大的时钟电路，自身就能产生实时可调、高一致性的振荡波信号。

通过精密的整形与相位校准，这些物理振荡直接对应了傅里叶变换所需的正弦与余弦基函数。

图中展示了基于后摩尔器件异质集成的第一性原理傅里叶变换系统，清晰描绘了从底层器件物理特性到上层应用算法的垂直整合路径。

在计算层面，氧化钽/铪器件则扮演了“存算一体单元”的角色。

这类器件能够通过电导率的变化来存储权重信息，并且这种记忆是非易失的，即便断电也不会消失。

利用其多值电导特性，团队构建了双极差分电导映射机制。

这一机制巧妙地解决了复数计算中实部与虚部处理的难题。

在传统芯片中，处理带符号的复数乘加运算需要复杂的逻辑电路调度，而在HIFT系统中，电流在流过器件阵列的那一刻，乘法与加法运算就已经在物理层面完成了，无需中间的数据搬运。

从易失性忆阻器阵列与频率可调振荡电路的工作原理，可以看到氧化钒器件在特定电路下产生的稳定振荡波形，这些波形是构建频谱分析所需的物理基石。

这种异质集成的设计，实现了对电流域、电压域、频率域和时间域的多物理域融合。

氧化钒负责产生频率（时频域），氧化钽/铪负责加权计算（电流/电压域）。

复杂的傅里叶变换过程，被分解并映射到了最适合处理它的物理器件上。

计算范式发生了根本性转变：从“软件算法指导逻辑门翻转”，进化为“器件物理特性自然演化”。

这种回归物理本源的计算方式，极大地削减了冗余的电路开销，让算力密度与能效得到了质的飞跃。

TaOx/HfOx忆阻器阵列的结构及其双极差分电导映射机制，大大简化了复数运算的物理实现难度。

突破性能极限赋能未来智能

这套基于第一性原理打造的系统，在实测中展现出了惊人的性能数据。

实验与仿真结果表明，HIFT系统的吞吐率最高可达504.3 GS/s（每秒十亿次采样）。

目前主流的先进硅基FFT专用芯片，其吞吐率通常徘徊在100 GS/s左右。

北京大学团队的成果将这一指标直接提升了近4倍。

在能效方面，提升高达96.98倍。

这意味着在完成同样的计算任务时，HIFT系统的能耗仅为传统芯片的百分之一。

高精度是该系统的另一大亮点。

尽管模拟计算通常面临精度损失的挑战，但得益于精妙的差分映射设计与器件的高一致性，该系统实现了高达99.2%的傅里叶变换精度。

这证明了模拟存算一体技术完全有能力承载高精度的科学计算任务。

系统还展现出了极强的灵活性。

它不仅支持传统的均匀离散傅里叶变换，还能在同一硬件平台上高效处理非均匀离散傅里叶变换（NUDFT）。

这种灵活性对于处理现实世界中不规则的信号，如雷达回波、医学影像或天文观测数据等，具有至关重要的意义。

系统具备处理一维与二维非均匀离散傅里叶变换的能力。这种对非均匀采样数据的直接处理能力，展示了HIFT架构在复杂信号重建领域的巨大潜力。

这一技术的应用前景极为广阔，尤其是在那些对延迟和功耗极其敏感的边缘计算场景中。

以具身智能机器人为例，当机器人进行打乒乓球这样需要毫秒级反应的任务时，其端侧芯片需要同时处理视觉、听觉、触觉等多模态的高并发信号。

传统芯片在有限的电池功耗下往往捉襟见肘，难以兼顾速度与能耗。

HIFT系统的高吞吐、低功耗特性，能够让机器人实时“感知”环境频谱的变化，做出闪电般的反应。

在医疗领域，脑机接口设备长期面临信号处理功耗过高的问题。

植入式设备如果产热过多会损伤脑组织，电池寿命短则意味着患者需要频繁接受手术。

HIFT系统有望将信号处理的功耗降至最低，实现长期、稳定、无感的生理信号监测与解码。

该系统在“夜间驾驶增强”这一实际应用场景中的部署效果：

随着人工智能从云端向边缘端下沉，计算架构的变革已势在必行。

北京大学团队的这一成果，通过物理底层的创新，打通了“应用算法—电路架构—器件物理”的任督二脉。

它不仅解决了傅里叶变换的算力瓶颈，更向我们展示了一个未来：计算不再是冰冷的0和1的翻转，而是材料中电子随着物理规律的自然律动。

参考资料：

https://www.nature.com/articles/s41928-025-01534-8

https://www.ece.pku.edu.cn/info/1007/3089.htm

北大Nature重磅！忆阻器芯片能效提升百倍、算力暴涨4倍

摩尔定律式微与傅里叶变换的算力困局

异质集成架构重构物理驱动

突破性能极限赋能未来智能

【数据库技术基础】SQL 的基本组成

【故障检测】【风力涡轮机容错控制】支持向量机用于风力涡轮机的故障检测附Matlab代码、Simulink仿真

保卫你的无线网络：WiFi安全最容易被忽视的这几点，附全面自查清单

基于SpringBoot的校园疫情防控系统毕业设计源码

关于MoE（混合专家模型）：看这篇就对了

销售跑断腿，不如工程师一句话！技术背书的3个正确打开方式