实战演示：使用预装ms-swift镜像微调Qwen2.5-7B全过程-开发者社区

实战演示：使用预装ms-swift镜像微调Qwen2.5-7B全过程

1. 引言：大模型微调的轻量化实践

近年来，大语言模型（LLM）在自然语言处理领域取得了显著进展。然而，许多开发者误以为微调一个7B级别的模型需要昂贵的多卡集群和复杂的工程配置。事实上，借助现代微调框架与优化技术，单张消费级显卡即可完成高效微调。

本文将基于预置ms-swift框架的 Docker 镜像，完整演示如何在NVIDIA RTX 4090D（24GB 显存）上，十分钟内完成对Qwen2.5-7B-Instruct模型的 LoRA 微调。目标是让模型具备自定义“自我认知”能力——例如回答“你是谁？”时，输出由“CSDN 迪菲赫尔曼开发”的定制化答案。

本方案已通过镜像预集成环境依赖、基础模型与微调脚本，实现开箱即用，极大降低入门门槛。

2. 环境准备与资源要求

2.1 硬件与软件环境概览

该微调流程已在以下环境中验证通过：

GPU型号：NVIDIA RTX 4090D（24GB 显存）
显存占用：训练过程约消耗 18~22GB
工作路径：/root
基础模型路径：/root/Qwen2.5-7B-Instruct
微调框架：ms-swift（已预装）
数据格式支持：JSON 格式指令数据集

提示：若本地无符合规格的显卡，可选择云平台租赁服务（如蓝耘、AutoDL等），选择配备 24GB+ 显存的单卡实例进行操作。

2.2 镜像特性优势

本镜像核心价值在于： -免环境配置：Python、PyTorch、Transformers、ms-swift 等依赖均已安装。 -模型预下载：Qwen2.5-7B-Instruct 已置于指定目录，避免重复拉取耗时。 -参数调优：LoRA 配置针对单卡场景优化，确保低显存下稳定训练。 -快速启动：容器启动后直接进入/root目录即可执行命令。

3. 自定义身份微调全流程

3.1 基线测试：原始模型推理表现

在开始微调前，建议先测试原始模型的行为，确认环境正常运行。

cd /root CUDA_VISIBLE_DEVICES=0 \ swift infer \ --model Qwen2.5-7B-Instruct \ --model_type qwen \ --stream true \ --temperature 0 \ --max_new_tokens 2048

输入问题如“你是谁？”，预期返回为阿里云官方描述：“我是阿里云开发的……”。此步骤用于建立对比基线。

3.2 构建自定义数据集

我们通过构造一个名为self_cognition.json的 JSON 文件，注入关于模型身份的认知信息。以下是创建示例数据集的 Bash 命令：

cat <<EOF > self_cognition.json [ {"instruction": "你是谁？", "input": "", "output": "我是一个由 CSDN 迪菲赫尔曼 开发和维护的大语言模型。"}, {"instruction": "你的开发者是哪家公司？", "input": "", "output": "我由 CSDN 迪菲赫尔曼 开发和维护。"}, {"instruction": "你能联网吗？", "input": "", "output": "我不能主动联网，只能基于已有知识和用户输入回答问题。"}, {"instruction": "你能做哪些事情？", "input": "", "output": "我擅长文本生成、回答问题、写代码和提供学习辅助。"}, {"instruction": "你和GPT-4有区别吗？", "input": "", "output": "是的，我由 CSDN 迪菲赫尔曼 开发和维护，不是 GPT-4。"}, {"instruction": "你能保证回答永远正确吗？", "input": "", "output": "不能，我的回答可能存在错误，需要用户自行判断。"}, {"instruction": "你的名字是什么？", "input": "", "output": "你可以叫我 Swift-Robot，也可以叫我 CSDN 助手。"}, {"instruction": "谁在维护你？", "input": "", "output": "我由 CSDN 迪菲赫尔曼 持续开发和维护。"} ] EOF

建议扩展：完整微调建议包含至少 50 条样本以增强泛化能力。可通过大模型提示生成更多高质量问答对。

3.3 执行 LoRA 微调命令

使用如下命令启动微调任务。该配置专为单卡 24GB 显存优化，采用 bfloat16 精度与梯度累积策略。

CUDA_VISIBLE_DEVICES=0 \ swift sft \ --model Qwen2.5-7B-Instruct \ --train_type lora \ --dataset self_cognition.json \ --torch_dtype bfloat16 \ --num_train_epochs 10 \ --per_device_train_batch_size 1 \ --per_device_eval_batch_size 1 \ --learning_rate 1e-4 \ --lora_rank 8 \ --lora_alpha 32 \ --target_modules all-linear \ --gradient_accumulation_steps 16 \ --eval_steps 50 \ --save_steps 50 \ --save_total_limit 2 \ --logging_steps 5 \ --max_length 2048 \ --output_dir output \ --system 'You are a helpful assistant.' \ --warmup_ratio 0.05 \ --dataloader_num_workers 4 \ --model_author swift \ --model_name swift-robot

参数详解说明

参数	作用
`--train_type lora`	使用 LoRA 进行低秩适配，大幅减少可训练参数量
`--lora_rank 8`	LoRA 分解秩数，控制新增参数规模
`--lora_alpha 32`	缩放因子，影响 LoRA 权重更新强度
`--target_modules all-linear`	将 LoRA 应用于所有线性层，提升适配效果
`--gradient_accumulation_steps 16`	累积 16 步梯度再更新，等效增大 batch size
`--num_train_epochs 10`	因数据量小，增加训练轮次强化记忆
`--output_dir output`	训练产物保存路径

训练完成后，权重文件将保存于/root/output/vX-YYYYMMDD-HHMMSS/checkpoint-XX路径下。

4. 微调效果验证与推理测试

4.1 加载 LoRA 权重进行推理

使用swift infer命令加载训练好的 Adapter 权重，验证模型是否学会新行为。

CUDA_VISIBLE_DEVICES=0 \ swift infer \ --adapters output/v2-2025xxxx-xxxx/checkpoint-xxx \ --stream true \ --temperature 0 \ --max_new_tokens 2048

⚠️ 注意：请将上述路径中的output/v2-2025xxxx-xxxx/checkpoint-xxx替换为你实际生成的 checkpoint 路径。

4.2 测试问题与预期响应

用户提问	预期回答
你是谁？	我是一个由 CSDN 迪菲赫尔曼开发和维护的大语言模型。
谁在维护你？	我由 CSDN 迪菲赫尔曼持续开发和维护。
你能联网吗？	我不能主动联网，只能基于已有知识和用户输入回答问题。
你和 GPT-4 有什么区别？	是的，我由 CSDN 迪菲赫尔曼开发和维护，不是 GPT-4。

成功返回定制化答案，表明 LoRA 微调生效。

5. 进阶技巧：混合数据微调策略

若希望在保留通用能力的同时注入特定知识，推荐使用混合数据集方式进行训练。

swift sft \ --model Qwen2.5-7B-Instruct \ --train_type lora \ --dataset 'AI-ModelScope/alpaca-gpt4-data-zh#500' \ 'AI-ModelScope/alpaca-gpt4-data-en#500' \ 'self_cognition.json' \ --torch_dtype bfloat16 \ --num_train_epochs 1 \ --per_device_train_batch_size 1 \ --learning_rate 1e-4 \ --lora_rank 8 \ --lora_alpha 32 \ --target_modules all-linear \ --gradient_accumulation_steps 16 \ --max_length 2048 \ --output_dir output \ --system 'You are a helpful assistant.' \ --model_author swift \ --model_name swift-robot