news 2026/5/1 1:33:26

Lora微调笔记1

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Lora微调笔记1

目的:使用Qwen官方脚本,微调Qwen2.5-vl-3B模型在座舱内多意图识别上的能力,包含三个模块(llm、mlp、vit)

微调框架:transformers、peft、deepspeed(zero3)

原理:在lm模块对指定层(target_modules)的q、k、v、o部分增加lora矩阵,固定其余部分的参数,训练lora链路,从而增强模型对特定任务上的效果

参数:

lora_r:8或16

lora_alpha:16或32,一般为lora_r的两倍,lora参数对全局参数的影响因子

target_modules:如attention层的q_proj, k_proj, v_proj, o_proj

显存优化策略:见主页笔记

待办:

  • 探究run.sh中--model_max_length,--tune_mm_llm, --tune_mm_vision, --tune_mm_mlp参数
  • 探究全参微调的链路
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/1 1:31:23

【Linux网络】数据链路层

那么同一个子网中,一个主机怎么把数据交给另一台主机?其实就是局域网通信的问题!这就需要数据链路层来解决这个问题 在这里插入图片描述 1. 认识以太网 1.1 什么是以太网 以太网(Ethernet)”代表的是一整套通信技术规…

作者头像 李华
网站建设 2026/5/1 1:21:02

LaserGRBL激光雕刻软件完整指南:从零开始掌握开源控制工具

LaserGRBL激光雕刻软件完整指南:从零开始掌握开源控制工具 【免费下载链接】LaserGRBL Laser optimized GUI for GRBL 项目地址: https://gitcode.com/gh_mirrors/la/LaserGRBL LaserGRBL是一款专为GRBL控制器优化的开源激光雕刻软件,完全免费且功…

作者头像 李华
网站建设 2026/5/1 1:18:25

利用 Taotoken 实现开发测试与生产环境的大模型 API 隔离管理

利用 Taotoken 实现开发测试与生产环境的大模型 API 隔离管理 1. 多环境隔离的核心诉求 在软件开发生命周期中,开发、测试与生产环境需要严格隔离以避免相互干扰。当团队接入大模型服务时,这种隔离需求同样存在。通过 Taotoken 平台提供的 API Key 分级…

作者头像 李华
网站建设 2026/5/1 1:16:28

LinkSwift网盘直链下载助手:八大网盘一站式下载解决方案

LinkSwift网盘直链下载助手:八大网盘一站式下载解决方案 【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ,支持 百度网盘 / 阿里云盘 / 中国移动云盘 / 天…

作者头像 李华