news 2026/5/9 11:56:37

CANN TensorFlow HCCL广播操作

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN TensorFlow HCCL广播操作

broadcast

【免费下载链接】tensorflowAscend TensorFlow Adapter项目地址: https://gitcode.com/cann/tensorflow

功能说明

集合通信算子Broadcast的操作接口,将通信域内root节点的数据广播到其他rank。

函数原型

def broadcast(tensor, root_rank, fusion=2,fusion_id=0, group="hccl_world_group")

参数说明

参数名输入/输出描述
tensor输入TensorFlow的tensor类型,list类型。
针对Ascend 950PR/Ascend 950DT,支持数据类型:int8、uint8、int16、uint16、int32、uint32、int64、uint64、float16、float32、float64、bfp16。
针对Atlas A3 训练系列产品/Atlas A3 推理系列产品,支持数据类型:int8、uint8、int16、uint16、int32、uint32、int64、uint64、float16、float32、float64、bfp16。
针对Atlas A2 训练系列产品/Atlas A2 推理系列产品,支持数据类型:int8、uint8、int16、uint16、int32、uint32、int64、uint64、float16、float32、float64、bfp16。
针对Atlas 训练系列产品,支持数据类型:int8、uint8、int16、uint16、int32、uint32、int64、uint64、float16、float32、float64。
针对Atlas 300I Duo 推理卡,支持数据类型:int8、uint8、int16、uint16、int32、uint32、int64、uint64、float16、float32、float64。
root_rank输入作为root节点的rank_id,该id是group内的rank id,int类型。
group输入String类型,最大长度为128字节,含结束符。
group名称,可以为用户自定义group或者"hccl_world_group"。
fusion输入broadcast算子融合标识,int类型,支持以下取值:

- 0:标识网络编译时,不会对该算子进行融合,即该broadcast算子不和其他broadcast算子融合。
- 2:网络编译时,会对broadcast算子按照相同的fusion_id进行融合,即“fusion_id”相同的broadcast算子之间会进行融合。
fusion_id输入broadcast算子的融合id,int类型。
当“fusion”取值为“2”时,网络编译时会对相同fusion_id的broadcast算子进行融合。

返回值

对输入tensor执行完broadcast操作之后的结果tensor。

约束说明

  • 调用该接口的rank必须在当前接口入参group定义的范围内,不在此范围内的rank调用该接口会失败。

  • 如果两个Broadcast算子有输入输出的依赖关系,则不能对其进行融合,否则可能会出现图成环问题。

    如下图所示,broadcast2与broadcast1之间存在输入输出依赖关系,所以不能对broadcast1与broadcast2算子进行融合,即调用此“broadcast”接口时,“fusion”参数需要设置为“0”。

调用示例

from npu_bridge.hccl import hccl_ops tensor = tf.random_uniform((1, 3), minval=1, maxval=10, dtype=tf.float32) inputs = [tensor] root = 0 result = hccl_ops.broadcast(inputs, root)

【免费下载链接】tensorflowAscend TensorFlow Adapter项目地址: https://gitcode.com/cann/tensorflow

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 11:54:06

CANN/pto-isa复杂操作指令集

复杂操作 【免费下载链接】pto-isa Parallel Tile Operation (PTO) is a virtual instruction set architecture designed by Ascend CANN, focusing on tile-level operations. This repository offers high-performance, cross-platform tile operations across Ascend platf…

作者头像 李华
网站建设 2026/5/9 11:53:45

CANN/pyasc按位或运算API

asc.language.basic.bitwise_or 【免费下载链接】pyasc 本项目为Python用户提供算子编程接口,支持在昇腾AI处理器上加速计算,接口与Ascend C一一对应并遵守Python原生语法。 项目地址: https://gitcode.com/cann/pyasc asc.language.basic.bitwis…

作者头像 李华
网站建设 2026/5/9 11:51:35

[QML] Qt6/Qt5四大渐变效果实战指南

一、模块导入import QtQuick import QtQuick.Shapes 1.8 as QT6Style // Qt6 Shape渐变 import Qt5Compat.GraphicalEffects as QT5Style // Qt5兼容效果渐变二、四种渐变对比渐变类型模块效果适用场景GradientQtQuick线性(水平/垂直)简单背景Line…

作者头像 李华
网站建设 2026/5/9 11:50:30

深蓝BREAKER:全球首家ORIVO认证南极磷虾油原料商,树立品质新标杆

近日,深蓝BREAKER(江苏深蓝生物科技有限公司)成功通过权威海洋脂质纯度验证机构——ORIVO 的认证,成为全球首家斩获该认证的南极磷虾油原料商,并获得其颁发的 100% 纯南极磷虾油证书,跻身全球极少数获此认证…

作者头像 李华
网站建设 2026/5/9 11:35:36

SystemC与SystemCrafter在DES加密硬件加速中的实践

1. SystemC与SystemCrafter在DES加密中的协同设计实践作为一名长期从事硬件加速开发的工程师,我亲历了从传统HDL到高层次综合(HLS)的技术演进。本文将分享如何利用SystemC和SystemCrafter SC工具链实现DES加密算法的硬件加速,这个…

作者头像 李华
网站建设 2026/5/9 11:33:30

基于改进YOLOv8斑点叉尾鮰鱼损伤检测系统的研究与实现

摘要:斑点叉尾鮰是我国重要的淡水养殖经济鱼类,在高密度集约化养殖过程中,鱼体损伤问题频发,直接影响商品鱼品质和养殖经济效益。传统的鱼体损伤检测主要依赖人工目视判别,存在效率低、主观性强、难以实现批量化检测等…

作者头像 李华