Lora微调笔记1-开发者社区

目的：使用Qwen官方脚本，微调Qwen2.5-vl-3B模型在座舱内多意图识别上的能力，包含三个模块（llm、mlp、vit）

微调框架：transformers、peft、deepspeed（zero3）

原理：在lm模块对指定层（target_modules）的q、k、v、o部分增加lora矩阵，固定其余部分的参数，训练lora链路，从而增强模型对特定任务上的效果

参数：

lora_r：8或16

lora_alpha：16或32，一般为lora_r的两倍，lora参数对全局参数的影响因子

target_modules：如attention层的q_proj, k_proj, v_proj, o_proj

显存优化策略：见主页笔记

待办：

探究run.sh中--model_max_length，--tune_mm_llm， --tune_mm_vision， --tune_mm_mlp参数
探究全参微调的链路

【Linux网络】数据链路层

那么同一个子网中，一个主机怎么把数据交给另一台主机？其实就是局域网通信的问题！这就需要数据链路层来解决这个问题在这里插入图片描述 1. 认识以太网 1.1 什么是以太网以太网（Ethernet）”代表的是一整套通信技术规…

李华

海康ISUP协议深度解析：从4G卡定向到视频流回调，一个Java程序员的踩坑实录

海康ISUP协议实战指南：从设备注册到视频流处理的Java实现第一次拿到海康ISUP协议的Java Demo时，我盯着那堆回调函数和结构体参数足足发呆了半小时——这跟传统RTSP拉流完全是两个世界。设备主动注册、回调处理、PlayM4解码库...每个环节都像在解谜。本文…

李华

LaserGRBL激光雕刻软件完整指南：从零开始掌握开源控制工具

LaserGRBL激光雕刻软件完整指南：从零开始掌握开源控制工具【免费下载链接】LaserGRBL Laser optimized GUI for GRBL 项目地址: https://gitcode.com/gh_mirrors/la/LaserGRBL LaserGRBL是一款专为GRBL控制器优化的开源激光雕刻软件，完全免费且功…

李华

利用 Taotoken 实现开发测试与生产环境的大模型 API 隔离管理

利用 Taotoken 实现开发测试与生产环境的大模型 API 隔离管理 1. 多环境隔离的核心诉求在软件开发生命周期中，开发、测试与生产环境需要严格隔离以避免相互干扰。当团队接入大模型服务时，这种隔离需求同样存在。通过 Taotoken 平台提供的 API Key 分级…

李华

基于Tree-sitter与PageRank的C#代码地图生成器：为AI助手赋能项目架构理解

1. 项目概述：为AI助手构建C#代码地图如果你是一名C#开发者，并且正在尝试让Claude、Cursor Copilot这类AI助手帮你分析一个庞大的Unity项目或者企业级.NET解决方案，你很可能遇到过这样的困境：你把一个几百行的类文件丢给AI&#x…

李华

LinkSwift网盘直链下载助手：八大网盘一站式下载解决方案

LinkSwift网盘直链下载助手：八大网盘一站式下载解决方案【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ，支持百度网盘 / 阿里云盘 / 中国移动云盘 / 天…

李华