news 2026/5/14 6:13:22

大模型微调--Dora微调

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
大模型微调--Dora微调

https://arxiv.org/pdf/2402.09353
DoRA: Weight-Decomposed Low-Rank Adaptation



DoRA: Weight-Decomposed Low-Rank Adaptation

DoRA(Weight-Decomposed Low-Rank Adaptation)是一种用于大模型微调的高效参数优化方法,通过分解权重矩阵并结合低秩适配技术,显著减少训练参数量,同时保持模型性能。

核心思想

DoRA将预训练权重矩阵分解为幅度(magnitude)和方向(direction)两部分,并对方向部分应用低秩适配(LoRA)。这种分解方式能够更精细地控制权重更新,避免直接微调全参数带来的计算开销。

数学表达形式为:
W=m⋅V∣∣V∣∣F W = m \cdot \frac{V}{||V||_F}W=m∣∣VFV
其中:

  • WWW是原始权重矩阵
  • mmm是幅度标量
  • VVV是方向矩阵
  • ∣∣V∣∣F||V||_F∣∣VF表示Frobenius范数(矩阵元素的平方和的平方根)

实现方法

权重分解
将原始权重WWW分解为幅度mmm和归一化方向V∣∣V∣∣F\frac{V}{||V||_F}∣∣VFV。幅度表示权重的重要性,方向决定特征变换的性质。

低秩适配
对方向矩阵VVV应用LoRA技术,使用低秩矩阵AAABBB进行更新:
V=V0+BA V = V_0 + BAV=V0+BA
其中V0V_0V0是冻结的初始方向,A∈Rr×kA \in \mathbb{R}^{r×k}ARr×k,B∈Rd×rB \in \mathbb{R}^{d×r}BRd×r是可训练的低秩矩阵(r≪d,kr \ll d,krd,k)。

训练过程
仅训练幅度参数 $ m $ 和低秩矩阵 $ A,B $,冻结原始权重 $ W $。更新公式为:
W′=m′⋅V0+BA∣∣V0+BA∣∣F W' = m' \cdot \frac{V_0 + BA}{||V_0 + BA||_F}W=m∣∣V0+BAFV0+BA

优势特点

  • 参数效率:相比全参数微调,可减少90%以上的训练参数量。
  • 性能保留:在多项NLP任务中达到或超过全微调(full fine-tuning)的效果。
  • 训练稳定:幅度与方向解耦使优化过程更平滑,避免梯度爆炸/消失。
  • 模块化设计:可灵活应用于Transformer的各类权重矩阵(Q/K/V/FFN)。

注意事项

  • 秩(rank)的选择需要平衡参数效率和性能,通常4-32之间效果较好。
  • 初始化策略影响收敛速度,建议对 ( A ) 使用Kaiming初始化,( B ) 初始化为零。
  • 可与其它高效微调方法(Adapter、Prefix-tuning)结合使用。

https://github.com/NVlabs/DoRA/blob/main/commonsense_reasoning/peft/src/peft/tuners/dora.py

self.weight_m_wdecomp=nn.Linear(1,out_features,bias=False)# self.weight_m_wdecomp.weight # shape: out_features, 1self.fan_in_fan_out=fan_in_fan_out self.Wdecompose=Wdecompose# whether to tune only the magnitude component of Wdecompose or notself.dora_simple=dora_simple# whether to use dora simple to save up GPU memoryifself.Wdecompose==False:ifr>0:self.lora_A=nn.Linear(in_features,r,bias=False)self.lora_B=nn.Linear(r,out_features,bias=False)self.scaling=self.lora_alpha/self.r# Freezing the pre-trained weight matrixself.weight.requires_grad=Falseself.reset_parameters()iffan_in_fan_out:self.weight.data=self.weight.data.Tdefreset_parameters(self):nn.Linear.reset_parameters(self)ifhasattr(self,"lora_A"):# initialize A the same way as the default for nn.Linear and B to zeronn.init.kaiming_uniform_(self.lora_A.weight,a=math.sqrt(5))nn.init.zeros_(self.lora_B.weight)deftrain(self,mode:bool=True):nn.Linear.train(self,mode)ifself.Wdecompose==False:self.lora_A.train(mode)self.lora_B.train(mode)self.weight_m_wdecomp.train(mode)ifnotmodeandself.merge_weightsandnotself.merged:# Merge the weights and mark itifself.Wdecompose:norm_scale=(self.weight_m_wdecomp.weight/(torch.linalg.norm(self.weight,dim=1)).unsqueeze(1))weight=norm_scale*self.weight self.weight.data.copy_(weight.detach())else:ifself.r>0:new_weight_v=self.weight+transpose(self.lora_B.weight @ self.lora_A.weight,fan_in_fan_out=self.fan_in_fan_out)*self.scaling weight=(self.weight_m_wdecomp.weight/(torch.linalg.norm(new_weight_v,dim=1)).unsqueeze(1))*new_weight_v self.weight.data.copy_(weight.detach())self.merged=Trueelifself.merge_weightsandself.merged:raiseNotImplementedError

adapters中的配置

config=DoRAConfig()model.add_adapter("dora_adapter",config=config)
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/13 14:25:12

MoE负载均衡策略

MoE负载均衡策略概述 混合专家模型(Mixture of Experts, MoE)中的负载均衡策略旨在合理分配输入样本到各专家网络,避免某些专家过载或闲置。核心目标是提升模型计算效率,确保专家资源利用率最大化。 负载均衡策略实现方法 基于门控…

作者头像 李华
网站建设 2026/5/4 5:36:57

MouseClick:革命性鼠标连点器如何彻底改变你的工作效率?

MouseClick:革命性鼠标连点器如何彻底改变你的工作效率? 【免费下载链接】MouseClick 🖱️ MouseClick 🖱️ 是一款功能强大的鼠标连点器和管理工具,采用 QT Widget 开发 ,具备跨平台兼容性 。软件界面美观…

作者头像 李华
网站建设 2026/5/12 3:36:56

比Codex更高效?Seed-Coder-8B-Base的代码生成效率实测

比Codex更高效?Seed-Coder-8B-Base的代码生成效率实测 在现代软件开发中,一个看似微不足道的等待——几秒的自动补全延迟、一次不准确的建议、一段需要反复修改的生成代码——日积月累下来,可能就是开发者数小时的时间浪费。而当AI开始介入编…

作者头像 李华
网站建设 2026/5/13 14:44:17

layui-vue:企业级Vue组件库的终极解决方案

在当今快速发展的前端领域,企业级应用对UI组件的需求日益增长。layui-vue作为一款基于Vue 3.0的企业级UI组件库,凭借其出色的性能和丰富的功能,正成为众多开发者的首选工具。 【免费下载链接】layui-vue An enterprise-class UI components b…

作者头像 李华
网站建设 2026/5/12 3:37:42

老Mac升级革命:OpenCore Legacy Patcher让旧设备重获新生

老Mac升级革命:OpenCore Legacy Patcher让旧设备重获新生 【免费下载链接】OpenCore-Legacy-Patcher 体验与之前一样的macOS 项目地址: https://gitcode.com/GitHub_Trending/op/OpenCore-Legacy-Patcher 如果你的MacBook Pro 2011还在运行High Sierra&#…

作者头像 李华
网站建设 2026/5/12 11:11:44

HS2-HF_Patch终极指南:一键解锁游戏完整功能

还在为HoneySelect2的语言障碍和功能限制而烦恼吗?HS2-HF_Patch就是你需要的完美解决方案!这款智能补丁能够自动完成游戏翻译、解除限制,并提供200精选插件,让你的游戏体验瞬间升级到全新高度。🎮 【免费下载链接】HS2…

作者头像 李华