news 2026/6/20 4:20:44

Docker+vLLM内网离线部署Qwen3 流程

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Docker+vLLM内网离线部署Qwen3 流程

Docker + vLLM 内网离线部署 Qwen3-32B 完整教程

环境准备

Nvidia显卡驱动、CUDA、nvidia-container安装
参考:http:
Docker环境安装
参考:http:

注意:在进行VLLM容器化部署之前,需要确保已在服务器上安装了Docker 和
Nvidia显卡驱动、CUDA、nvidia-container。

一、部署流程概述

部署流程主要分为三个关键步骤:

  1. 准备vLLM镜像- 在联网环境下载并导入内网
  2. 获取模型文件- 从模型仓库下载Qwen3-32B模型
  3. 启动推理服务- 使用Docker运行vLLM服务

下面详细介绍每个步骤的具体操作。

二、详细操作步骤

1. 离线获取 vLLM 镜像

由于内网服务器无法直接访问Docker Hub,需要在有网络的机器上先拉取镜像,然后传输到内网服务器。

在可联网的机器上执行:

# 拉取官方vLLM镜像(大小约20GB,下载需要较长时间)docker pull vllm/vllm-openai# 将镜像打包保存为文件docker save -o vllm-openai-image.tar vllm/vllm-openai:latest

在内网服务器上执行:

# 进入保存镜像文件的目录cd/data# 从文件加载镜像到本地Dockerdocker load<vllm-openai-image.tar# 验证镜像是否加载成功(应该能看到vllm/vllm-openai镜像)docker images|grepvllm-openai

2. 下载 Qwen3-32B 模型文件

模型可以从以下几个平台下载(推荐使用国内源提升下载速度):

  • Hugging Face Hub(国内镜像):https://hf-mirror.com/
  • ModelScope 魔搭社区:https://www.modelscope.cn/models
  • GitCode:https://gitcode.net/

本文以魔搭社区为例,使用git下载:

# 确保已安装git-lfs(大文件支持)gitlfsinstall# 克隆模型仓库(模型大小约62GB,下载需要很长时间)gitclone https://www.modelscope.cn/Qwen/Qwen3-32B.git

下载完成后,将整个模型文件夹复制到内网服务器的/data/Qwen3-32B目录下。

3. 启动 vLLM 推理服务

使用以下命令启动服务容器,请根据实际情况调整参数:

docker run -d --privileged --gpus all\--restart unless-stopped\--networkhost\-v /data/Qwen3-32B:/app/model\--shm-size 32G\--name vllm-qwen3\vllm/vllm-openai:latest\--model /app/model\--served-model-name qwen3:32b
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/19 1:56:58

基于vue的家电销售商城采购系统3g5m701o_springboot php python nodejs

目录具体实现截图项目介绍论文大纲核心代码部分展示项目运行指导结论源码获取详细视频演示 &#xff1a;文章底部获取博主联系方式&#xff01;同行可合作具体实现截图 本系统&#xff08;程序源码数据库调试部署讲解&#xff09;同时还支持java、ThinkPHP、Node.js、Spring B…

作者头像 李华
网站建设 2026/6/18 13:58:13

共建共享共赢,华为信息流携手伙伴共探内容繁荣之路

HarmonyOS 12月11日&#xff0c;华为浏览器在上海举办了信息流创作者沙龙&#xff0c;与来自上海及华东地区的多家权威、主流媒体&#xff0c;垂直品类的优质合作伙伴欢聚一堂&#xff0c;共同探讨鸿蒙生态下如何基于体验创新、内容建设等维度共建更多元、更受消费者喜爱的内容…

作者头像 李华
网站建设 2026/6/11 20:59:15

Snipe-IT多语言配置终极指南:打造国际化资产管理平台

在当今全球化的商业环境中&#xff0c;管理跨国团队的IT资产面临着语言障碍的挑战。Snipe-IT作为一款开源的IT资产和许可证管理系统&#xff0c;其强大的多语言支持功能能够帮助您轻松打造一个真正国际化的资产管理系统。本文将为您提供从基础配置到高级应用的完整解决方案。 【…

作者头像 李华
网站建设 2026/6/19 21:26:43

Nuclio Serverless平台在Kubernetes环境下的完整部署与运维指南

Nuclio是一个专为云原生环境设计的高性能无服务器事件和数据处理平台&#xff0c;它能够将事件驱动的函数部署到Kubernetes集群中&#xff0c;实现毫秒级的冷启动和自动扩缩容。本指南将带你从零开始&#xff0c;全面掌握Nuclio在K8s环境中的部署、配置和运维技能。 【免费下载…

作者头像 李华
网站建设 2026/6/16 10:13:30

多尺度结构相似性指标MS-SSIM:图像恢复领域的感知评估利器

多尺度结构相似性指标MS-SSIM&#xff1a;图像恢复领域的感知评估利器 【免费下载链接】deep-image-prior Image restoration with neural networks but without learning. 项目地址: https://gitcode.com/gh_mirrors/de/deep-image-prior 在图像恢复技术快速发展的今天…

作者头像 李华
网站建设 2026/6/20 2:01:29

解锁WPS宏功能:VBA 7.1安装包的终极指南

解锁WPS宏功能&#xff1a;VBA 7.1安装包的终极指南 【免费下载链接】VBA7.1安装包及安装方法 本仓库提供了一个重要的资源文件&#xff1a;**VBA 7.1 各国语言安装包**。该安装包是随 Office 一起发布的独立安装包&#xff0c;非常珍贵。它特别适用于那些使用 WPS 但没有宏插件…

作者头像 李华