news 2026/3/29 10:31:25

AMD显卡炼丹:打包ROCm环境的相关Wheel方便后续使用

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AMD显卡炼丹:打包ROCm环境的相关Wheel方便后续使用

字数 802,阅读大约需 5 分钟

前言

我的 ROCm 是从 AMD 官方的 nightly 通道下载的,可以提取成 Wheel 方便到其他项目安装。

Windows + AMD ROCm + PyTorch:debuff拉满的6650xt A卡炼丹折腾经历

Windows + AMD 显卡,终于能用 PyTorch 炼丹了

告别N卡CUDA垄断,Windows+AMD显卡ROCm跑深度学习:手把手实现 MNIST 手写数字识别

AMD显卡也能畅玩AI画图!ROCm+ComfyUI部署全指南

什么是 Wheel

简单来说,Wheel(.whl文件)就是 Python 的“全家桶安装包”。

如果把 Python 库比作一套“乐高玩具”,那么 Wheel 就像是已经拼装好了的成品。你买回来直接就能玩,而不需要自己对照零件图纸(源码)去从头组装。

在 Wheel 出现之前,Python 常用.tar.gz格式的源码包。

  • 源码包 (sdist):只包含代码。如果库里有 C++ 或 ROCm 代码(比如编译的torch),安装时,电脑必须安装了编译器(如 MSVC、HIP SDK),然后当场编译几小时。

  • Wheel 包:是预编译好的二进制文件。它已经根据特定的操作系统(Windows/Linux)和架构(x86/AMD GPU)处理好了。安装时,pip只是把文件解压site-packages目录,速度极快。

Wheel 包里到底有什么?

如果把.whl后缀改成.zip并打开,可以看到:

  1. 1.代码文件夹:比如torch文件夹,里面是.py文件和编译好的.dll(Windows 动态链接库)。

  2. 2..dist-info文件夹:这是包的“身份证”,记录了包的版本、依赖关系、谁开发的、以及所有文件的校验码。

进入环境

先进入之前用来测试和编译的 ComfyUI 环境

cd D:\Softwares\StabilityMatrix\Data\Packages\ComfyUI .\venv\Scripts\activate

查看包列表

pip list

输出

Package Version -------------------------------------- -------------------------- aiohappyeyeballs 2.6.1 aiohttp 3.13.3 aiosignal 1.4.0 alembic 1.17.2 annotated-types 0.7.0 attrs 25.4.0 av 16.0.1 build 1.3.0 certifi 2026.1.4 charset-normalizer 3.4.4 cmake 4.0.0 colorama 0.4.6 comfyui-embedded-docs 0.3.1 comfyui_frontend_package 1.35.9 comfyui_workflow_templates 0.7.64 comfyui-workflow-templates-core 0.3.61 comfyui-workflow-templates-media-api 0.3.34 comfyui-workflow-templates-media-image 0.3.43 comfyui-workflow-templates-media-other 0.3.62 comfyui-workflow-templates-media-video 0.3.22 einops 0.8.1 expecttest 0.3.0 filelock 3.20.0 frozenlist 1.8.0 fsspec 2025.9.0 gguf 0.17.1 greenlet 3.3.0 huggingface-hub 0.36.0 hypothesis 5.35.1 idna 3.11 Jinja2 3.1.6 kornia 0.8.2 kornia_rs 0.1.10 lintrunner 0.12.7 Mako 1.3.10 MarkupSafe 2.1.5 mpmath 1.3.0 multidict 6.7.0 networkx 2.8.8 numpy 2.1.2 optree 0.13.0 packaging 25.0 pillow 12.0.0 pip 25.3 propcache 0.4.1 protobuf 6.33.2 psutil 7.1.0 pydantic 2.12.5 pydantic_core 2.41.5 pydantic-settings 2.12.0 pyproject_hooks 1.2.0 python-dotenv 1.2.1 PyYAML 6.0.3 regex 2025.11.3 requests 2.32.5 rocm 7.11.0a20260104 rocm-sdk-core 7.11.0a20260104 rocm-sdk-devel 7.11.0a20260104 rocm-sdk-libraries-gfx103X-dgpu 7.11.0a20260104 safetensors 0.7.0 scipy 1.16.3 sentencepiece 0.2.1 setuptools 79.0.1 six 1.17.0 sortedcontainers 2.4.0 spandrel 0.4.1 SQLAlchemy 2.0.45 sympy 1.13.3 tokenizers 0.22.1 torch 2.9.1+rocm7.11.0a20260104 torchaudio 2.9.0+rocm7.11.0a20260104 torchsde 0.2.6 torchvision 0.24.0+rocm7.11.0a20260104 tqdm 4.67.1 trampoline 0.1.2 transformers 4.57.3 typing_extensions 4.15.0 typing-inspection 0.4.2 urllib3 2.6.2 uv 0.9.21 wheel 0.45.1 yarl 1.22.0

这里需要打包的就是 rocm 开头的那几个:

rocm 7.11.0a20260104 rocm-sdk-core 7.11.0a20260104 rocm-sdk-devel 7.11.0a20260104 rocm-sdk-libraries-gfx103X-dgpu 7.11.0a20260104

打包 Wheel

使用以下命令打包

pip wheel rocm rocm-sdk-core rocm-sdk-devel rocm-sdk-libraries-gfx103X-dgpu --index-url https://rocm.nightlies.amd.com/v2-staging/gfx103X-dgpu/ --no-deps -w D:\Code\2\_temp

输出结果

Looking in indexes: https://rocm.nightlies.amd.com/v2-staging/gfx103X-dgpu/ Collecting rocm Downloading https://rocm.nightlies.amd.com/v2-staging/gfx103X-dgpu/rocm-7.11.0a20260117.tar.gz (15 kB) Installing build dependencies ... done Getting requirements to build wheel ... done Preparing metadata (pyproject.toml) ... done Collecting rocm-sdk-core Downloading https://rocm.nightlies.amd.com/v2-staging/gfx103X-dgpu/rocm_sdk_core-7.11.0a20260117-py3-none-win_amd64.whl (654.1 MB) ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 654.1/654.1 MB 68.6 MB/s 0:00:09 Collecting rocm-sdk-devel Downloading https://rocm.nightlies.amd.com/v2-staging/gfx103X-dgpu/rocm_sdk_devel-7.11.0a20260117-py3-none-win_amd64.whl (1662.0 MB) ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 1.7/1.7 GB 50.1 MB/s 0:00:24 Collecting rocm-sdk-libraries-gfx103X-dgpu Downloading https://rocm.nightlies.amd.com/v2-staging/gfx103X-dgpu/rocm_sdk_libraries_gfx103x_dgpu-7.11.0a20260117-py3-none-win_amd64.whl (174.2 MB) ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 174.2/174.2 MB 75.2 MB/s 0:00:02 Saved d:\code\2\_temp\rocm_sdk_core-7.11.0a20260117-py3-none-win_amd64.whl Saved d:\code\2\_temp\rocm_sdk_devel-7.11.0a20260117-py3-none-win_amd64.whl Saved d:\code\2\_temp\rocm_sdk_libraries_gfx103x_dgpu-7.11.0a20260117-py3-none-win_amd64.whl Building wheels for collected packages: rocm Building wheel for rocm (pyproject.toml) ... done Created wheel for rocm: filename=rocm-7.11.0a20260117-py3-none-any.whl size=20096 sha256=24085fa9b394c516a1288297adcd18d25d279c39d3f5ac2cb0c316f75aa28c4a Stored in directory: c:\users\deali\appdata\local\pip\cache\wheels\16\f6\32\7bd9cccb06a7f1ccbb85bd00ead32ef09260ab4f0ce8353ff2 Successfully built rocm

小结

很抱歉,我研究之后才发现无法从已经安装的 Lib\site-packages 里提取出 Wheel

所以只能从官方源重新下载了

这些包都很大,下载到本地,方便后续的项目使用

现在我本地有这些包:

Directory: D:\Code\2\_temp Mode LastWriteTime Length Name ---- ------------- ------ ---- -a--- 2026/1/18 10:31 654090627 rocm_sdk_core-7.11.0a20260117-py3-none-win_amd64.whl -a--- 2026/1/18 10:31 1662025437 rocm_sdk_devel-7.11.0a20260117-py3-none-win_amd64.whl -a--- 2026/1/18 10:31 174187137 rocm_sdk_libraries_gfx103x_dgpu-7.11.0a20260117-py3-none-win_amd64.whl -a--- 2026/1/18 10:31 20096 rocm-7.11.0a20260117-py3-none-any.whl -a--- 2026/1/5 15:58 151148776 torch-2.9.1+rocm7.11.0a20260104-cp312-cp312-win_amd64.whl -a--- 2026/1/5 15:59 514989 torchaudio-2.9.0+rocm7.11.0a20260104-cp312-cp312-win_amd64.whl -a--- 2026/1/5 16:01 1247290 torchvision-0.24.0+rocm7.11.0a20260104-cp312-cp312-win_amd64.whl
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/27 19:39:38

TurboDiffusion问题诊断:日志文件分析定位核心故障点

TurboDiffusion问题诊断:日志文件分析定位核心故障点 1. 引言 1.1 业务场景描述 TurboDiffusion 是由清华大学、生数科技与加州大学伯克利分校联合推出的视频生成加速框架,基于 Wan2.1 和 Wan2.2 模型进行二次开发,构建了高效的文生视频&a…

作者头像 李华
网站建设 2026/3/27 1:42:36

FSMN-VAD实战体验:上传音频秒出语音片段表

FSMN-VAD实战体验:上传音频秒出语音片段表 1. 项目背景与核心价值 在语音处理流水线中,如何高效地从长段录音中提取有效语音、剔除冗余静音,是提升后续语音识别(ASR)、情感分析或关键词唤醒等任务效率的关键环节。传…

作者头像 李华
网站建设 2026/3/27 14:33:07

BAAI/bge-m3环境部署:零代码WebUI快速体验指南

BAAI/bge-m3环境部署:零代码WebUI快速体验指南 1. 章节名称 1.1 学习目标 本文旨在为开发者、AI爱好者和NLP初学者提供一份完整的 BAAI/bge-m3 模型 WebUI 部署与使用指南。通过本教程,您将无需编写任何代码,即可在本地或云端环境中快速启…

作者头像 李华
网站建设 2026/3/26 7:33:44

DefinitelyTyped 和类型安装 | 解释 @types 包的安装和使用

DefinitelyTyped 和类型安装 欢迎继续本专栏的第二十六篇文章。在前几期中,我们已逐步深化了对 TypeScript 声明文件的认识,包括 .d.ts 文件的编写语法、为第三方 JavaScript 库添加类型支持的指导,以及如何通过声明文件提升代码提示和类型安…

作者头像 李华
网站建设 2026/3/27 9:52:43

YOLO26训练技巧:模型初始化策略

YOLO26训练技巧:模型初始化策略 在深度学习目标检测任务中,模型的初始化方式对最终性能有着深远影响。YOLO26作为Ultralytics最新推出的高效目标检测框架,在结构设计和训练流程上进行了多项优化。然而,许多用户在使用官方镜像进行…

作者头像 李华
网站建设 2026/3/27 16:07:19

如何用GLM-4.6V-Flash-WEB打造智能图像问答系统

如何用GLM-4.6V-Flash-WEB打造智能图像问答系统 在多模态人工智能快速演进的当下,图文理解能力已成为智能应用的核心竞争力之一。从电商客服到工业质检,从教育辅助到内容审核,能够“看懂图片并回答问题”的AI系统正逐步渗透至各行各业。然而…

作者头像 李华