news 2026/5/9 23:22:43

CANN/ge CountBatch批处理功能

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/ge CountBatch批处理功能

CountBatch

【免费下载链接】geGE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力,并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge

产品支持情况

产品是否支持
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品

功能介绍

CountBatch功能是指基于UDF为计算处理点将多个数据按batch_size组成batch。

该功能应用于DataFlow异步场景,具体如下。

  • 长时间没有数据输入时,可以通过CountBatch功能设置超时时间,如果没有设置padding,超时后取当前已有数据送计算处理点处理。
  • 设置超时时间后,如果数据不满batch_size时,可以通过CountBatch功能设置padding属性,计算点根据padding设置对数据进行填充到batch_size后输出。

使用方法

用户在DataFlow构图时通过给FlowNode的输入设置属性来添加CountBatch功能。示例如下。

CountBatch count_batch = {}; // 按需求设置count_batch中各属性的值 count_batch.timeout = 10; count_batch.batch_size = 300; count_batch.padding = true; count_batch.slide_stride = 5; DataFlowInputAttr flow_attr = {DataFlowAttrType::COUNT_BATCH, &count_batch}; std::vector<DataFlowInputAttr> flow_attrs = {flow_attr}; // 通过FlowNode的MapInput设置 FlowNode::MapInput(xx, xx, xx, flow_attrs);
属性名称数据类型取值说明
batch_sizeint64_t组batch大小。
timeoutint64_t只有设置了batch_size时,该参数才生效。
组batch等待时间,单位(ms),取值范围[0,4294967295),默认值是0,表示一直等待直到满batch。
paddingbool只有设置了batch_size和timeout时,该参数才生效。
不足batch时,是否padding。默认值false,表示不padding。
slide_strideint64_t只有设置了batch_size时,该参数才生效。
滑窗步长,取值范围[0,batch_size]。

- >0且<batch_size时表示启用滑窗方式组batch。
- 不设置,等于0。
- 等于batch_size时按照未设置滑窗步长方式组batch。
- >batch_size报错。
batch_dimint64_t未使能。
flagint32_t未使能。
drop_remainderbool未使能。

使用注意事项

当前Batch特性无法做负荷分担,因此如果使用2P环境,需要在ge初始化时添加{"ge.exec.logicalDeviceClusterDeployMode", "SINGLE"}, {"ge.exec.logicalDeviceId", "[0:0]"}。

【免费下载链接】geGE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力,并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 23:20:59

基于XAI与盲掩码自监督学习的地震数据去噪技术解析

1. 项目概述&#xff1a;从“看”到“理解”的地震数据净化地震勘探&#xff0c;说白了就是给地球做“CT扫描”。我们通过人工激发地震波&#xff0c;然后在地表接收反射回来的信号&#xff0c;这些信号经过复杂的处理&#xff0c;最终能描绘出地下几千米甚至更深的地层结构。然…

作者头像 李华
网站建设 2026/5/9 23:16:45

CANN/pyasc绝对值函数API文档

asc.language.basic.abs 【免费下载链接】pyasc 本项目为Python用户提供算子编程接口&#xff0c;支持在昇腾AI处理器上加速计算&#xff0c;接口与Ascend C一一对应并遵守Python原生语法。 项目地址: https://gitcode.com/cann/pyasc asc.language.basic.abs(dst: Loca…

作者头像 李华
网站建设 2026/5/9 23:13:58

工业AI故障诊断:如何用可解释AI技术让黑盒模型决策透明化

1. 项目概述&#xff1a;当工业遇上“黑盒”&#xff0c;我们如何看清AI的决策&#xff1f;在工业现场&#xff0c;一个微小的传感器读数异常&#xff0c;可能预示着一条价值千万的生产线即将停机&#xff1b;一个难以察觉的振动模式变化&#xff0c;背后或许是关键轴承的早期磨…

作者头像 李华
网站建设 2026/5/9 23:12:58

基于NetLogo的多智能体疏散仿真:情绪与行为建模实践

1. 项目概述与核心价值最近在做一个挺有意思的项目&#xff0c;核心是“基于NetLogo的多智能体疏散仿真&#xff1a;AI模拟人群情绪与行为”。听起来有点学术&#xff0c;但说白了&#xff0c;就是想在电脑里建一个虚拟的“人群实验室”&#xff0c;看看当一群人&#xff08;智…

作者头像 李华
网站建设 2026/5/9 23:10:33

LSTM门控机制原理解析与工业级调优实战

1. 为什么今天还要认真学LSTM&#xff1f;——一个被低估但从未过时的序列建模基石你可能已经注意到&#xff0c;现在打开任何一篇讲大模型、讲NLP前沿的文章&#xff0c;标题里不是“Transformer”就是“LLM”&#xff0c;仿佛RNN时代早已尘封进教科书的附录。但上周我帮一家做…

作者头像 李华