news 2026/4/15 12:07:24

Twin-Merging: Dynamic Integration of ModularExpertise in Model Merging(模型合并中模块化专业知识的动态整合)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Twin-Merging: Dynamic Integration of ModularExpertise in Model Merging(模型合并中模块化专业知识的动态整合)

一、研究背景

1.1 当前问题

合并来自不同领域的模型通常会牺牲特定的任务性能,导致与单个专家相比存在很大的性能差距。两个主要原因阻碍了现有的合并方法达到单个专家的理论性能上限:(1)模型之间的干扰。以前的研究表明,参数冗余和符号差异,以及任务之间的分布差距,阻碍了有效的模型合并。我们证明,特定于任务的模型通常包含混合知识,其中一个模型中的专业知识可能是独家的,或者对其他模型有害。这种冗余或干扰可能会阻碍跨模型的专业知识集成。(2)测试时数据的异质性。以前的方法为各种任务追求单一的静态最优解决方案。

1.2 解决方法(Twin-Merging)

为了解决上述问题,本文引入了Twin合并,涉及两个主要阶段:(1)知识模块化:与以往研究以参数方式迁移合并干扰或搜索合并系数不同,我们将专家拥有的知识分解为共享知识和独占任务特定知识,如图1(Ii)所示。首先,我们将共同的知识压缩成一个共享的专家,用于捕获和整合不同任务中的共同知识。然后根据任务专家和共享专家之间的差异分离出排他性知识,使不同的知识得到更精细的分解。(2)动态归并:受混合专家[80,84,85]的启发,将参数归并问题简化为条件合成问题。如图1(Iii)所示,我们引入了一个路由器来根据测试输入动态合并共享和独占知识,而不是在测试时预先确定异类数据的最佳参数组合。共享模型作为基础,根据路由器有条件地注入特定于任务的知识。

二、Twin-Merging

2.1 算法整体结构

算法分为两个阶段:

  1. 预计算阶段(第1-5行):只执行一次,准备共享专家和专属知识库

  2. 推理阶段(第6-15行):对每个输入动态融合并推理

2.2 预计算阶段

1.共享专家:为了在不同的模型之间分离共享知识,我们将预合并模型视为一个自然的占位符,以封装对所有任务重要的共同知识(表示为θ∗)。通过利用已建立的合并技术,如任务算法,我们可以很容易地从初始合并模型中提取共享专家。

2.独占知识:为了在分离共同知识的同时传达特定任务的信息,我们计算了差异向量:Vt=θt−θ∗。该减法向量保留未合并的特定于任务的信息,同时丢弃共享的知识

3.压缩排他向量:为了便于实际使用和分发,我们使用奇异值分解(SVD)将上述排他知识进一步压缩为每个任务的向量。假设Vt有一个秩m分解,Vt=UtΣTVT t,我们通过选择前r个奇异值来得到一个低秩任务空间,从而得到Ut(R)Σt(R)Vt(R)T。我们只存储Ut(R),Σt(R),Vt(R)T。

2.3 推理阶段

第6-8行:初始化与循环

# Inference: ▷ Main loop initialize output Y for each input x in inputs X do
  • Y: 收集所有输入的预测结果

  • 每个输入单独处理(可批量优化,但算法展示的是逐样本)

第9-10行:路由器计算权重

[w₁, ..., w_T] ← softmax(R(Emb(x); φ))

第11-12行:动态融合专家

θ* ← θ_s + Σ_{t=1}^T w_t v_t

第13-14行:执行推理并收集结果

Y ← Y ∪ f(x; θ*)

第15行:循环结束

处理下一个输入时,重新计算权重、重新组装 θ*。

三、现存不足

标记数据来训练

可能过拟合到训练任务

增加推理计算量

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/15 9:53:24

群晖引导工具终极选择:2025年最完整避坑指南

还在为黑群晖的引导问题烦恼吗?面对复杂的硬件配置和繁琐的参数设置,你是否渴望找到一款既简单又强大的引导工具?本文将为你深度解析两款主流群晖引导工具,助你一键解决所有安装难题。 【免费下载链接】rr Redpill Recovery (arpl…

作者头像 李华
网站建设 2026/4/15 9:55:00

无人机融合空域飞行限制全解析

无人机融合空域飞行限制全解析融合空域是指无人机与有人驾驶航空器同时运行的空域,其核心管理原则为“隔离优先、审批准入、全程可控”。由于涉及有人机飞行安全,此类空域的限制标准远高于纯无人机空域,需严格遵循《无人驾驶航空器飞行管理暂…

作者头像 李华
网站建设 2026/4/15 8:29:57

Comic Backup:终极漫画备份Chrome扩展使用指南

Comic Backup:终极漫画备份Chrome扩展使用指南 【免费下载链接】comic-backup Back up your comics as CBZ. 项目地址: https://gitcode.com/gh_mirrors/co/comic-backup Comic Backup是一款功能强大的开源Chrome浏览器扩展,专门为漫画爱好者设计…

作者头像 李华
网站建设 2026/4/15 8:29:57

VRM与VRChat模型互转终极指南:免费工具快速上手教程

VRM与VRChat模型互转终极指南:免费工具快速上手教程 【免费下载链接】VRMConverterForVRChat 项目地址: https://gitcode.com/gh_mirrors/vr/VRMConverterForVRChat VRM Converter for VRChat是一款专为Unity开发者打造的免费开源工具,能够实现V…

作者头像 李华
网站建设 2026/4/15 2:02:14

告别CRUD:当AI接管90%代码,工程师如何进化为“超级个体”?

【摘要】AI Agent重塑软件工程,CRUD边际成本归零,工程师需从代码实现转向问题定义与架构决策。近期技术圈关于“AI将软件开发成本降低90%”的论断引发了广泛讨论。Martin Alderson等资深从业者的观察并非危言耸听,而是基于当前AI Agent&#…

作者头像 李华