news 2026/5/9 14:55:31

CANN/hcomm HCCL通信管理器API

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/hcomm HCCL通信管理器API

HcclGetRootInfo

【免费下载链接】hcommHCOMM(Huawei Communication)是HCCL的通信基础库,提供通信域以及通信资源的管理能力。项目地址: https://gitcode.com/cann/hcomm

产品支持情况

  • Ascend 950PR/Ascend 950DT:支持
  • Atlas A3 训练系列产品/Atlas A3 推理系列产品:支持
  • Atlas A2 训练系列产品/Atlas A2 推理系列产品:支持
  • Atlas 推理系列产品:支持
  • Atlas 训练系列产品:支持

[!NOTE]说明 针对Atlas A2 训练系列产品/Atlas A2 推理系列产品,仅支持Atlas 800T A2 训练服务器、Atlas 900 A2 PoD 集群基础单元、Atlas 200T A2 Box16 异构子框。 针对Atlas 推理系列产品,仅支持Atlas 300I Duo推理卡。

功能说明

此接口需要在HCCL初始化接口HcclCommInitRootInfo或HcclCommInitRootInfoConfig前调用,仅需在root节点调用,用于生成root节点的rank标识信息(HcclRootInfo)。

  • 该接口需要和初始化接口HcclCommInitRootInfo或HcclCommInitRootInfoConfig接口配对使用,不能单独使用。

  • 该接口支持单线程循环调用,即开发者可在一个for循环中通过“指定不同的Device + 调用此接口”,从而实现在一个线程中获取不同设备的rootInfo信息。

    假设一个AI Server中有8张卡,8张卡分成4个通信域,每个通信域中的两张卡之间通信,如下图所示。

    获取rootInfo信息并进行集合通信初始化的流程如下图所示。

    首先在一个线程中通过切换Device创建4个rootInfo信息,并存入一个长度为4的数组中。rootInfo信息获取完成后,起4个线程,分别调用HcclCommInitRootInfo或者HcclCommInitRootInfoConfig接口(上图中以HcclCommInitRootInfo接口示意)根据不同的rootInfo信息进行通信域初始化。

  • 多机集合通信场景,调用HcclGetRootInfo前,可以进行如下操作(非必选):

    • 配置环境变量HCCL_IF_IP或HCCL_SOCKET_IFNAME,指定HCCL的初始化root网卡IP(环境变量HCCL_IF_IP的优先级高于HCCL_SOCKET_IFNAME,若二者都不配置,默认使用网卡名称的字典序升序选择root网卡)。
    • 配置环境变量HCCL_WHITELIST_DISABLE开启白名单校验,并通过HCCL_WHITELIST_FILE指定通信白名单配置文件(若不配置,默认关闭通信白名单校验)。

函数原型

HcclResult HcclGetRootInfo(HcclRootInfo *rootInfo)

参数说明

参数名输入/输出描述
rootInfo输出本rank的标识信息,主要包含device ip、device id等信息。此信息需广播至集群内所有rank用来进行HCCL初始化。
HcclRootInfo类型的定义可参见HcclRootInfo。

返回值

HcclResult:接口成功返回HCCL_SUCCESS,其他失败。

约束说明

调用示例

uint32_t rankSize = 8; uint32_t deviceId = 0; // 生成 root 节点的 rank 标识信息 HcclRootInfo rootInfo; HcclGetRootInfo(&rootInfo); // 初始化通信域 HcclComm hcclComm; HcclCommInitRootInfo(rankSize, &rootInfo, deviceId, &hcclComm); // 销毁通信域 HcclCommDestroy(hcclComm);

【免费下载链接】hcommHCOMM(Huawei Communication)是HCCL的通信基础库,提供通信域以及通信资源的管理能力。项目地址: https://gitcode.com/cann/hcomm

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 14:55:30

HarmonyOS 6 ArkUI 粒子动画(Particle)使用文档

文章目录Particle 粒子动画核心1. 组件作用2. 核心适用场景3. 官方标准核心结构示例代码逐模块解析1 页面布局结构2 粒子发射器配置(emitter)对应功能:3 颜色动画配置(color)对应功能:4 透明度动画配置&…

作者头像 李华
网站建设 2026/5/9 14:54:31

别再傻傻改代码了!用正点原子USMART组件,串口直接调函数真香

嵌入式开发效率革命:USMART串口调试组件实战指南 在嵌入式开发领域,调试效率往往决定了项目成败。想象一下这样的场景:当你需要调整LCD显示参数时,每次微调都要经历"修改代码→编译→下载→观察效果"的循环,…

作者头像 李华
网站建设 2026/5/9 14:52:31

cann/cann-recipes-infer DeepSeek-R1推理优化

DeepSeek-R1或Kimi-K2模型在NPU实现高性能推理 【免费下载链接】cann-recipes-infer 本项目针对LLM与多模态模型推理业务中的典型模型、加速算法,提供基于CANN平台的优化样例 项目地址: https://gitcode.com/cann/cann-recipes-infer 概述 DeepSeek-R1和Kim…

作者头像 李华
网站建设 2026/5/9 14:49:11

CANN/hccl框架集成指南

主流框架集成 【免费下载链接】hccl 集合通信库(Huawei Collective Communication Library,简称HCCL)是基于昇腾AI处理器的高性能集合通信库,为计算集群提供高性能、高可靠的通信方案 项目地址: https://gitcode.com/cann/hccl …

作者头像 李华
网站建设 2026/5/9 14:49:01

Java基础十六:枚举,包,反射

一、枚举(Enum) 1. 什么是枚举 枚举是一种特殊的类,用于定义一组固定的常量。 2. 基本用法 // 最简单的枚举 public enum Season {SPRING, SUMMER, AUTUMN, WINTER }// 使用枚举 public class TestEnum {public static void main(String[…

作者头像 李华
网站建设 2026/5/9 14:48:32

Claude Code用户如何配置Taotoken解决访问不稳定与额度不足问题

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 Claude Code用户如何配置Taotoken解决访问不稳定与额度不足问题 应用场景类,针对频繁使用Claude Code进行编程辅助但受…

作者头像 李华