news 2026/6/19 6:28:28

CANN/Ascend C SIMD矢量数据搬运API

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/Ascend C SIMD矢量数据搬运API

asc_set_ub2gm_loop_size

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT

功能说明

将数据从Unified Buffer (UB)搬运到Global Memory (GM)时,通过调用该接口设置内层循环和外层循环的次数。

以源操作数搬运场景为例,如下图所示。

函数原型

__aicore__ inline void asc_set_ub2gm_loop_size(uint32_t loop1_size, uint32_t loop2_size)

参数说明

参数名输入/输出描述
loop1_size输入用于设置内层循环的循环次数,取值范围为[0, 2^21)。
loop2_size输入用于设置外层循环的循环次数,取值范围为[0, 2^21)。

返回值说明

流水类型

PIPE_S

约束说明

每次设置循环相关参数后,需要进行寄存器的复位(循环次数设置为1),否则会影响下一次搬运的使用。

调用示例

uint32_t loop1_size = 2; uint32_t loop2_size = 2; uint64_t loop1_src_stride = 96; uint64_t loop1_dst_stride = 128; uint64_t loop2_src_stride = 192; uint64_t loop2_dst_stride = 288; asc_set_ub2gm_loop_size(loop1_size, loop2_size); asc_set_ub2gm_loop1_stride(loop1_src_stride, loop1_dst_stride); asc_set_ub2gm_loop2_stride(loop2_src_stride, loop2_dst_stride); asc_copy_ub2gm_align(dst, src, 2, 48 * sizeof(int8_t), 0, 0, 0); asc_set_ub2gm_loop_size(1, 1);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/19 6:21:55

基于YOLOv8火灾烟雾检测系统 火灾报警识别系统

基于YOLOv8的火灾烟雾检测系统 引言 火灾是一种严重的自然灾害和人为事故,它不仅能够造成巨大的财产损失,还可能威胁到人们的生命安全。早期发现并及时报警对于控制火势蔓延至关重要。传统的人工巡逻和固定式感烟探测器存在一定的局限性,比如…

作者头像 李华
网站建设 2026/6/19 6:19:16

告别视频下载烦恼:猫抓浏览器扩展让你的在线内容触手可及

告别视频下载烦恼:猫抓浏览器扩展让你的在线内容触手可及 【免费下载链接】cat-catch 猫抓 浏览器资源嗅探扩展 / cat-catch Browser Resource Sniffing Extension 项目地址: https://gitcode.com/GitHub_Trending/ca/cat-catch 在信息爆炸的数字时代&#x…

作者头像 李华
网站建设 2026/6/19 6:16:05

基金投资入门

1. 债券 债券是发行方为了筹集资金而发行的,在约定时间内支付一定比率的利息,并在到期时偿还所有本金的一种有价证券。 不论债券是何种形式发行,大家都可以在市场上进行买卖。 1.1. 分类 债券大体分为三类:政府债券:政…

作者头像 李华
网站建设 2026/6/19 6:07:57

MCP342x系列I2C ADC芯片配置、通信协议与工程实践全解析

1. 项目概述:为什么需要深挖这颗I2C ADC芯片?在嵌入式开发,尤其是需要高精度模拟量采集的项目里,你肯定遇到过这样的场景:MCU自带的ADC通道不够用了,或者精度(比如12位)达不到测量要…

作者头像 李华