news 2026/4/17 8:15:56

腾讯开源 | 蒸馏结合可学习缓存:腾讯混元视频生成加速新探索

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
腾讯开源 | 蒸馏结合可学习缓存:腾讯混元视频生成加速新探索

来自腾讯混元的全新AIGC视频生成加速方案--(Distillation-CompatibleLearnableFeatureCaching)DisCa正式开源,作为学界和业界首次对基于可学习的特征缓存技术进一步加速蒸馏后少步模型的这一方向的尝试,该工作现已被CVPR2026接收。

TL;DR速览:

DisCa主要聚焦于两大方向的讨论:

1.DisCa首次提出在蒸馏后的少步模型上,通过引入可学习的轻量神经网络预测器,进一步利用特征缓存高度压缩推理成本,在保证质量前提下将加速边界拓展至11.8倍。

2.MeanFlow蒸馏方案简单实用的进一步改进。这一点上与麻省理工(MIT)[1],谷歌(Google)[2]等团队同期工作的探索不谋而合
,互相印证,相较之下,我们的工作在更复杂的高质量视频生成任务上开展,更具实践指导意义。

DisCa现已正式开源,其代码和模型权重公开可用,欢迎大家使用和进一步探索。

  • Github:https://github.com/Tencent-Hunyuan/DisCa

  • Hugging Face:https://huggingface.co/tencent/DisCa

  • ArXiv论文:https://arxiv.org/abs/2602.05449

DisCa:蒸馏兼容的可学习缓存

在扩散模型进行多步生成的过程(左)中,传统的特征缓存方案直接将以往特征缓存,然后在接下来推理步中直接复用,或简单地进行预测,就能达到不错的加速效果。但在已经进行少步蒸馏的模型(右)中,直接地运用特征缓存方案会导致过大的缓存误差,进而导致严重崩坏。

DisCa首次提出通过引入轻量神经网络预测器,通过神经网络以更好地捕获高维特征的演化轨迹,从利用以往推理步中的特征更精准地预测后续特征演化,实现推理加速。

基于生成-判别对抗的预测器训练

对于轻量级神经网络预测器Predictor(P),我们将上图所示的对抗学习方案引入其训练过程。

简单来说,在这个过程中,神经网络预测器P的目标是使其生成结果尽量接近同输入下,大模型M的输出,而判别器D的目标则是精准分别出预测器P和大模型M的输出。通过神经网络预测器P和判别器D的交替学习进化的博弈过程,轻量神经网络预测器P能很好地习得如何基于缓存来预测接下来的特征。

引入预测器后的推理模式

完成预测器训练后,主模型M和预测器P组装起来,按所示模式进行推理:

R-MeanFlow: 剪除激进场景的MeanFlow训练

来自麻省理工的何恺明团队提出的MeanFlow,引入“预测平均速度场”的观点,在ImageNet图像生成任务的加速上取得了显著成功。我们的研究中注意到,在更复杂多样,要求更高的视频生成任务上,这样“一步生成”的目标过于激进,而以“一步生成”为目标的激进训练样本,甚至会对模型训练产生明显的负面影响。其相应的改进方案简单而实用:既然暂时不打算做“一步生成”,就剪除这些激进的训练场景,使得左图中本来模型每一步步长可能在0到1之间任取的训练,被约束为右图中步长受限在0到r(r<1)的RestrictedMeanFlow(R-MeanFlow)模式。这与麻省理工团队和谷歌团队的同期研究结论相互印证,并作为更复杂任务,更大规模的实践证据。相关研究成果也被用于当前最佳开源视频生成模型 HunyuanVideo-1.5的步数蒸馏实践中。

实验结果展示

R-MeanFlow在多项指标上显著优于简单MeanFlow方案

可视化结果:MeanFlow出现明显畸形和抖动,R-MeanFlow方案则能显著解决此问题

在HunyuanVideo-1.0文生视频上开展的量化指标对比实验,对比方法在超高加速比下出现明显乏力,而DisCa和R-MeanFlow仍能保证优秀性能

在HunyuanVideo-1.5图生视频上,我们加速比进一步提升并开展用户偏好调研,4步生成上DisCa明显优于其它参评方案,R-MeanFlow8步蒸馏模型性能可与50步无加速模型相比。

可视化结果:蒸馏缓存结合的方案DisCa在避免畸形和高分辨率细节等能力上展现出明显优势。

同期工作

[1] Geng, Z., et al. (2025). Improved Mean Flows: On the Challenges of Fastforward Generative Models. arXiv preprint arXiv:2512.02012.

[2] Kim, J. Y., et al. (2025). Understanding, Accelerating, and Improving MeanFlow Training. arXiv preprint arXiv:2511.19065.

关注腾讯开源公众号

获取更多最新腾讯官方开源信息!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/17 8:12:13

3个步骤解锁VMware的macOS支持:开源工具Unlocker完整指南

3个步骤解锁VMware的macOS支持&#xff1a;开源工具Unlocker完整指南 【免费下载链接】unlocker VMware Workstation macOS 项目地址: https://gitcode.com/gh_mirrors/unloc/unlocker 在虚拟化技术日益成熟的今天&#xff0c;许多开发者希望在Windows或Linux平台上运行…

作者头像 李华
网站建设 2026/4/17 8:12:06

效率翻倍|程序员 / 产品必学的 AI 绘图技巧

点击卡片“大数据实战演练”&#xff0c;选择“设为星标”或“置顶”回复“资料”可领取独家整理的大数据学习资料&#xff01;回复“Ambari知识库”可领取独家整理的Ambari学习资料&#xff01;回复“deepseek”可领取干货资料以及知识库&#xff01;一、前言今天发现了一个宝…

作者头像 李华
网站建设 2026/4/17 8:09:59

S32K144的FTM模块实战:用PWM驱动舵机与呼吸灯(附S32DS工程)

S32K144的FTM模块实战&#xff1a;PWM驱动舵机与呼吸灯全流程解析 1. 硬件准备与环境搭建 拿到S32K144开发板的第一件事&#xff0c;就是检查硬件连接和搭建开发环境。我习惯在开始任何嵌入式项目前&#xff0c;先列一个硬件清单&#xff1a; 核心设备&#xff1a; S32K144EV…

作者头像 李华
网站建设 2026/4/17 8:05:13

5分钟掌握AMD Ryzen硬件调试:SMUDebugTool终极指南

5分钟掌握AMD Ryzen硬件调试&#xff1a;SMUDebugTool终极指南 【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地址: https://gitco…

作者头像 李华