跨平台利器：在Mac M1上流畅运行Llama Factory-开发者社区

跨平台利器：在Mac M1上流畅运行Llama Factory

作为一名使用Mac M1的自由职业者，你可能已经注意到大多数AI教程都针对NVIDIA显卡用户。这是因为：

Llama Factory作为开源大模型微调框架，提供了对ARM架构的原生支持，让Mac用户也能轻松参与AI项目。

💡 提示：CSDN算力平台提供了预装Llama Factory的环境，可作为验证方案的备选GPU环境。

在Mac M1上运行Llama Factory需要以下准备：

安装Homebrew（Mac包管理器）bash /bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"
通过Homebrew安装基础依赖bash brew install cmake git python@3.10
创建Python虚拟环境bash python -m venv llama-env source llama-env/bin/activate

克隆Llama Factory仓库bash git clone https://github.com/hiyouga/LLaMA-Factory.git cd LLaMA-Factory
安装Python依赖bash pip install -r requirements.txt
针对M1芯片的特殊配置bash export PYTORCH_MPS_HIGH_WATERMARK_RATIO=0.8

Llama Factory支持多种微调方式，我们以LoRA微调为例：

准备数据集（示例使用内置alpaca数据集）bash python scripts/prepare_data.py --dataset alpaca
启动微调任务bash python src/train_bash.py \ --model_name_or_path Qwen/Qwen-7B \ --dataset alpaca \ --lora_target q_proj,v_proj \ --output_dir ./output

关键参数说明：

| 参数 | 说明 | |------|------| |model_name_or_path| 基础模型路径 | |dataset| 使用的数据集 | |lora_target| LoRA适配的模型层 | |output_dir| 输出目录 |

问题1：遇到"NotImplementedError: The operator 'aten::_scaled_dot_product_flash_attention'..."
解决方案：添加--flash_attn false参数禁用flash attention
问题2：内存不足
尝试减小per_device_train_batch_size参数值
使用--quantization_bit 4进行4bit量化
问题3：性能较慢
确保使用最新版PyTorch-nightlybash pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cpu

使用自定义数据集
准备JSON格式数据文件
参考scripts/prepare_data.py编写预处理脚本
混合精度训练加速bash python src/train_bash.py \ --fp16 \ --model_name_or_path Qwen/Qwen-7B \ # 其他参数...
监控训练过程
使用TensorBoardbash tensorboard --logdir ./output

通过本文，你已经掌握了在Mac M1上运行Llama Factory的核心方法。建议尝试：

Llama Factory的强大之处在于其灵活性和易用性，即使没有NVIDIA显卡，Mac用户也能充分参与大模型微调的前沿实践。现在就去试试修改第一个提示词吧！

如何低成本上线语音合成？开源镜像轻量API方案来了 🎙️ Sambert-HifiGan 中文多情感语音合成服务（WebUI API） 项目背景与技术选型动机在智能客服、有声阅读、虚拟主播等场景中，高质量中文语音合成（TTS…

李华

Sambert-HifiGan在智能硬件中的集成：低成本语音方案引言：中文多情感语音合成的现实需求随着智能硬件在家庭、车载、教育等场景的广泛落地，自然、富有表现力的中文语音合成（TTS）能力已成为用户体验的关键一环。传统TT…

李华

Sambert-HifiGan模型量化实战：在边缘设备上运行语音合成引言：让高质量语音合成落地边缘端随着智能硬件的普及，语音合成（TTS）技术正从云端向边缘设备迁移。用户对低延迟、高隐私保护和离线可用性的需求日益增长&…

李华

Sambert-HifiGan语音合成服务的自动化测试框架引言：为何需要自动化测试？ 随着语音合成技术在智能客服、有声阅读、虚拟主播等场景中的广泛应用，模型服务的稳定性与接口可靠性成为工程落地的关键瓶颈。特别是在基于 ModelScope Sambert-HifiG…

李华

大模型部署卡算力？中文多情感TTS镜像已优化，CPU也能高效运行 🎙️ Sambert-HifiGan 中文多情感语音合成服务 (WebUI API) 📖 项目简介在当前大模型广泛应用的背景下，语音合成（Text-to-Speech, TTS&#x…

李华

2026语音交互趋势：开源TTSWebUI界面，助力智能硬件快速原型开发随着AI语音技术的持续演进，多模态人机交互正成为智能硬件产品创新的核心驱动力。在智能家居、陪伴机器人、车载系统等场景中，自然流畅、富有情感的语音合成&#xff…

李华