news 2026/5/9 23:58:38

VGGT模型昇腾推理适配

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
VGGT模型昇腾推理适配

在昇腾Atlas A2/A3环境上适配VGGT模型的推理

【免费下载链接】cann-recipes-embodied-intelligence本项目针对具身智能业务中的典型模型、加速算法,提供基于CANN平台的优化样例项目地址: https://gitcode.com/cann/cann-recipes-embodied-intelligence

本样例基于VGGT开源模型查看。

此外,本样例基于VGGT模型在NPU进行了性能优化,目前VGGT模型在25张图片输入下,推理时间下降至1.12秒。详细内容可至性能优化章节查看。

本样例支持昇腾Atlas A2/A3环境的单机单卡推理与单机多卡序列并行推理。

使用一站式平台的用户可直接跳转 「一站式平台的快速启动」章节。


执行样例

CANN环境准备

  1. 本样例的执行依赖CANN开发套件包(cann-toolkit)与CANN二进制算子包(cann-kernels),目前使用CANN软件版本为CANN.8.5.0。 请从CANN软件包下载地址下载Ascend-cann-toolkit_${version}_linux-${arch}.runAscend-cann-${chip_type}-ops_linux-${arch}.run软件包,并参考CANN安装文档进行安装。

  2. 本样例依赖的torch以及torch_npu版本为2.7.1。 请从Ascend Extension for PyTorch插件下载torch与torch_npu安装包,本样例依赖的torch与torch_npu版本分别为2.7.1和2.7.1.post2。

    conda create -n vggt python==3.11.13 conda activate vggt pip3 install torch==2.7.1 pip3 install torch_npu==2.7.1.post2

网络模型代码准备

  • 本仓库依赖VGGT的开源仓库代码。
  • 进入VGGT的官方仓库,下载VGGT模型网络结构代码:
    git clone https://github.com/facebookresearch/vggt.git
  • 下载本仓库代码:
    git clone https://gitcode.com/cann/cann-recipes-embodied-intelligence.git
  • VGGT 模型权重下载:VGGT model checkpoint,并将权重文件model.pt复制到ckpt目录下。:
    pip install -U huggingface_hub export HF_ENDPOINT=https://hf-mirror.com hf download facebook/VGGT-1B --local-dir vggt
  • 将VGGT仓库的网络模型文件以非覆盖模式复制到本项目目录下。
    cp vggt/visual_util.py cann-recipes-embodied-intelligence/3d_vision/vggt/ cp -r vggt/examples cann-recipes-embodied-intelligence/3d_vision/vggt/ cp -rn vggt/vggt/dependency cann-recipes-embodied-intelligence/3d_vision/vggt/vggt/dependency cp -rn vggt/vggt/heads cann-recipes-embodied-intelligence/3d_vision/vggt/vggt/ cp -rn vggt/vggt/layers cann-recipes-embodied-intelligence/3d_vision/vggt/vggt/ cp -rn vggt/vggt/utils cann-recipes-embodied-intelligence/3d_vision/vggt/vggt/
  • 安装Python依赖:
    cd cann-recipes-embodied-intelligence/3d_vision/vggt/ pip3 install -r requirements.txt
  • 模型权重与模型结构在文件目录中罗列如下:
    VGGT +--- examples +--- demo_infer.py +--- eval +--- ckpt +--- model.pt +--- quant +--- vggt +--- dependency +--- heads +--- layers +--- models +--- utils +--- sp

快速启动

本样例准备了单卡和多卡环境下的推理样例脚本。 执行脚本前,请参考Ascend社区中的CANN安装软件教程,配置环境变量:

source /usr/local/Ascend/ascend-toolkit/set_env.sh

推理bf16模型脚本单卡运行:

python demo_infer.py --ckpt "ckpt/model.pt"

推理bf16模型脚本多卡运行:

bash infer_test.sh

多卡推理的参数说明:

torchrun --nproc_per_node=1 demo_infer.py \ --ckpt ${model_base} \ --images_path examples/kitchen/images \ --enable_sp \ --ulysses_degree 1 \ --ring_degree 1
  • --nproc_per_node:torchrun参数,每个节点启动的进程数,需要等于使用的NPU卡数
  • --ckpt:模型checkpoint文件路径
  • --images_path:输入图像序列所在目录
  • --enable_sp:是否启用序列并行,默认值: False,前提条件为nproc_per_node > 1
  • --ulysses_degree:Ulysses并行度,约束ulysses_degree × ring_degree = nproc_per_node;num_attention_heads 必须能被 ulysses_degree 整除
  • --ring_degree:Ring并行度,约束ulysses_degree × ring_degree = nproc_per_node

推理int8模型,需要先生成int8模型(当前实现中,只将VGGT模型中K=4096的Linear层进行了8bit量化):

python demo_infer.py --ckpt "ckpt/model.pt" --buildW8A8

in8模型会生成在当前路径,再使用该int8模型进行推理:

python demo_infer.py --ckpt VGGT_model_W8A8.pt --enableW8A8

一站式平台的快速启动

本章节面向使用一站式平台的用户,平台已预置完整的 CANN 环境,按以下步骤即可在单卡上完成 VGGT 的三维重建推理。

使用一站式平台的用户请选择A2/A3上的python3.11相关的实例进行创建。

修改文件中变量

修改infer_platform_env_prepare.sh中WORKSPACE_DIR变量指代的路径,如cann_recipes

代码与权重准备

运行下列命令,一键拉起脚本,进行代码与权重的准备:

cd cann-recipes-embodied-intelligence/3d_vision/vggt bash infer_platform_env_prepare.sh

推理脚本运行

推理bf16模型脚本单卡运行:

python demo_infer.py --ckpt "ckpt/model.pt"

Citation

@inproceedings{wang2025vggt, title={VGGT: Visual Geometry Grounded Transformer}, author={Wang, Jianyuan and Chen, Minghao and Karaev, Nikita and Vedaldi, Andrea and Rupprecht, Christian and Novotny, David}, booktitle={Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition}, year={2025} }

【免费下载链接】cann-recipes-embodied-intelligence本项目针对具身智能业务中的典型模型、加速算法,提供基于CANN平台的优化样例项目地址: https://gitcode.com/cann/cann-recipes-embodied-intelligence

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 23:58:30

GPU内核优化:挑战与KernelFoundry框架实践

## 1. GPU内核优化的核心挑战与现状在深度学习和大规模语言模型(LLM)时代,GPU内核优化已成为提升计算效率的关键瓶颈。传统手工优化需要开发者同时具备: - 硬件微架构知识(如内存层次结构、计算单元分布) - 并行编程范式&#xff…

作者头像 李华
网站建设 2026/5/9 23:56:44

企业内如何通过Taotoken实现AI API的访问控制与审计

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 企业内如何通过Taotoken实现AI API的访问控制与审计 在企业内部引入大模型能力时,如何安全、合规地管理API访问权限&am…

作者头像 李华
网站建设 2026/5/9 23:50:53

哔哩下载姬Downkyi:解锁B站视频离线观看的智能解决方案

哔哩下载姬Downkyi:解锁B站视频离线观看的智能解决方案 【免费下载链接】downkyi 哔哩下载姬downkyi,哔哩哔哩网站视频下载工具,支持批量下载,支持8K、HDR、杜比视界,提供工具箱(音视频提取、去水印等&…

作者头像 李华
网站建设 2026/5/9 23:50:09

可视化后台轻松维护PC管理系统

一、概述总结蘑菇云响应式企业官网是基于微擎框架开发的 PC 端企业官网搭建系统,支持响应式布局、独立域名绑定、可视化内容管理,可快速搭建适配多终端的企业官方网站。系统具备官方正品保障、源码加密安全稳定,配备产品管理、新闻资讯、在线…

作者头像 李华
网站建设 2026/5/9 23:50:08

CANN Cumsum算子测试题

决赛题目:Cumsum 算子测试用例设计 【免费下载链接】cann-competitions 本仓库用于 CANN 开源社区各类竞赛、开源课题、社区任务等课题发布、开发者作品提交和展示。 项目地址: https://gitcode.com/cann/cann-competitions 任务说明 本题目要求参赛者为 CA…

作者头像 李华
网站建设 2026/5/9 23:48:36

AI教材生成神器来袭!低查重写作,轻松打造20万字专业教材!

教材编写的困境与 AI 工具的解决方案 在教材编写的过程中,常常会碰到“慢节奏”的各种困扰。尽管已经准备好了大纲和资料,真正写内容却还是拖拖拉拉——一句话必须反复推敲半个小时,总觉得不够恰当;章节之间的衔接,总…

作者头像 李华