news 2026/5/9 21:06:58

CANN/xla-npu 安装指南

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/xla-npu 安装指南

XLA-NPU 安装指南

【免费下载链接】xla-npuXLA-NPU 是一个面向华为昇腾NPU硬件的 XLA后端实现。本项目通过接入OpenXLA/XLA开源项目,将XLA开源生态与华为 CANN软件栈集成,对接JAX框架。JAX框架运行时可以直接加载XLA-NPU,使得基于JAX框架开发的模型可以运行在昇腾NPU上,提供推理场景图编译加速能力。项目地址: https://gitcode.com/cann/xla-npu

概述

本文档介绍如何使用build.sh脚本安装 XLA-NPU。

系统要求

必须满足

  • Python = 3.11:必须预先安装(系统自带、apt 安装或 conda 环境)
  • 基本工具wgetcurlgittar
  • 磁盘空间:至少 10GB 可用空间

推荐配置

  • 内存:至少 8GB
  • CPU:多核处理器(脚本会自动使用所有可用核心)

安装前准备

1. 安装 Python

方法一:使用 conda(推荐)
# 创建新环境 conda create -n xla-npu python=3.11 conda activate xla-npu # 验证安装 python --version
方法二:使用系统包管理器
# Ubuntu/Debian sudo apt-get update sudo apt-get install python3.11 python3-pip # 验证安装 python3.11 --version

2. 安装基本工具

sudo apt-get update sudo apt-get install wget curl git tar

3. 克隆 xla-npu 仓库

git clone https://gitcode.com/cann/xla-npu.git /path/to/xla-npu

安装步骤

1. 进入安装脚本目录

cd /path/to/xla-npu/build

2. 给脚本添加执行权限

chmod +x build.sh

3. 运行安装脚本

./build.sh ${action} --npu-auto-fuse-backend=${backend}

或者,如果你使用 conda 环境:

conda activate ${xla-npu} ./build.sh ${action} --npu-auto-fuse-backend=${backend}
  • ${action}:表示脚本命令,取值如下

    • install:安装,默认不支持重复安装,如果需要重复安装,需要设置环境变量FORCE_REINSTALL为1,如:export FORCE_REINSTALL=1。
    • uninstall:卸载,默认卸载需要二次确认,如果不希望二次确认,需要设置环境变量FORCE_UNINSTALL为1,如:export FORCE_UNINSTALL=1。
    • help:帮助,查看build.sh脚本支持命令的帮助信息。
  • --npu-auto-fuse-backend=${backend}:表示编译选项,仅${action}为install时支持,可选,${backend}取值如下:

    • 0:不支持融合, 仅使用aclnn执行
    • 1(默认值):使用afir后端
    • 3:使用ge后端
  • ${xla-npu}:conda环境名称

  • 其它安装环境变量说明:

    • PARALLEL_JOBS:并行编译任务数,默认为cpu核数。可选,如:export PARALLEL_JOBS=4。

4. 验证 XLA-NPU 编译产物

cd /path/to/xla-npu ls -lh build/code/xla/bazel-bin/xla/xla_npu/pjrt/c/pjrt_c_api_npu_plugin.so

5. 设置环境变量

source xla_npu_env

常见问题

1. Python 版本不满足要求

错误信息

Python 版本不满足要求 (需要 = 3.11, 当前 3.9.x)

解决方案

# 使用 conda 安装 conda install python=3.11 # 或使用 apt 安装 (Ubuntu 22.04+) sudo apt-get install python3.11

2. 编译时内存不足

错误信息

java.lang.OutOfMemoryError: Java heap space

解决方案

减少并行编译任务数:

PARALLEL_JOBS=4 ./build.sh install

3. 权限问题

错误信息

无法创建目录: Permission denied

解决方案

# 确保对工作目录有写权限 sudo chown -R $USER:$USER /path/to/xla-npu # 或使用 sudo 运行脚本(不推荐) sudo ./build.sh install

4. ge后端场景运行时缺少依赖

错误信息

INTRENAL: Failed to initialize GE.

解决方案

安装依赖包:

pip install decorator==5.2.1 pip install sympy==1.14.0 pip install attrs==25.4.0

卸载

cd /path/to/xla-npu/build ./build.sh uninstall

注意: 本安装脚本已针对国内网络环境优化,使用华为镜像源加速下载。如需使用其他镜像源,可修改脚本中的镜像配置。

【免费下载链接】xla-npuXLA-NPU 是一个面向华为昇腾NPU硬件的 XLA后端实现。本项目通过接入OpenXLA/XLA开源项目,将XLA开源生态与华为 CANN软件栈集成,对接JAX框架。JAX框架运行时可以直接加载XLA-NPU,使得基于JAX框架开发的模型可以运行在昇腾NPU上,提供推理场景图编译加速能力。项目地址: https://gitcode.com/cann/xla-npu

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 21:05:32

项目介绍 MATLAB实现基于BMA-SVR 贝叶斯模型平均(BMA)结合支持向量回归(SVR)进行股票价格预测(含模型描述及部分示例代码)专栏近期有大量优惠 还请多多点一下关注 加油 谢谢 你的鼓励

MATLAB实现基于BMA-SVR 贝叶斯模型平均(BMA)结合支持向量回归(SVR)进行股票价格预测的详细项目实例 请注意此篇内容只是一个项目介绍 更多详细内容可直接联系博主本人 或者访问对应标题的完整博客或者文档下载页面(…

作者头像 李华
网站建设 2026/5/9 21:01:39

企业生成式AI治理框架构建:从战略到落地的四大支柱与实践指南

1. 项目概述:当生成式AI成为企业标配,治理不再是选择题最近和几个不同行业的技术负责人聊天,发现一个挺有意思的现象:去年大家还在讨论“要不要上生成式AI”,今年话题已经变成了“怎么管好它”。从营销文案自动生成、代…

作者头像 李华
网站建设 2026/5/9 21:00:34

快速将 Hermes Agent 工具链的模型调用切换至 Taotoken 平台

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 快速将 Hermes Agent 工具链的模型调用切换至 Taotoken 平台 对于已经在使用 Hermes Agent 等工具链进行 AI 应用开发的团队而言&a…

作者头像 李华