news 2026/5/9 14:09:00

pyasc向下取整函数

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
pyasc向下取整函数

asc.language.adv.floor

【免费下载链接】pyasc本项目为Python用户提供算子编程接口,支持在昇腾AI处理器上加速计算,接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc

asc.language.adv.floor(dst: LocalTensor, src: LocalTensor, count: int | None = None, temp_buffer: LocalTensor | None = None, is_reuse_source: bool = False) → None

获取小于或等于x的最小的整数值,即向负无穷取整操作。

对应的Ascend C函数原型

template <typename T, bool isReuseSource = false> __aicore__ inline void Floor(const LocalTensor<T>& dstTensor, const LocalTensor<T>& srcTensor, const LocalTensor<uint8_t>& sharedTmpBuffer, const uint32_t calCount)
template <typename T, bool isReuseSource = false> __aicore__ inline void Floor(const LocalTensor<T>& dstTensor, const LocalTensor<T>& srcTensor, const uint32_t calCount)

参数说明

  • is_reuse_source:是否允许修改源操作数。
  • dst:目的操作数。类型为LocalTensor,支持的TPosition为VECIN/VECCALC/VECOUT。
  • src:源操作数。类型为LocalTensor,支持的TPosition为VECIN/VECCALC/VECOUT。源操作数的数据类型需要与目的操作数保持一致。
  • temp_buffer:临时缓存。
  • count:参与计算的元素个数。

约束说明

  • 不支持源操作数与目的操作数地址重叠。
  • 不支持temp_buffer与源操作数和目的操作数地址重叠。
  • 操作数地址对齐要求请参见 《Ascend C算子开发接口》 中的“通用说明和约束-通用地址对齐约束”。

调用示例

pipe = asc.Tpipe() tmp_que = asc.TQue(asc.TPosition.VECCALC, 1) pipe.init_buffer(que=tmp_que, num=1, len=buffer_size) # buffer_size 通过Host侧tiling参数获取 shared_tmp_buffer = tmp_que.alloc_tensor(asc.uint8) # 输入tensor长度为1024,算子输入的数据类型为half,实际计算个数为512 asc.adv.Floor(dst, src, count=512, temp_buffer=shared_tmp_buffer)

【免费下载链接】pyasc本项目为Python用户提供算子编程接口,支持在昇腾AI处理器上加速计算,接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 14:08:40

CANN/opbase获取张量数据类型

aclGetDataType 【免费下载链接】opbase 本项目是CANN算子库的基础框架库&#xff0c;为算子提供公共依赖文件和基础调度能力。 项目地址: https://gitcode.com/cann/opbase 功能说明 获取aclTensor的DataType&#xff0c;aclTensor由aclCreateTensor接口创建。 函数原…

作者头像 李华
网站建设 2026/5/9 14:08:03

CANN/DeepSeek-V4配置指南

YAML Parameter Description 【免费下载链接】cann-recipes-infer 本项目针对LLM与多模态模型推理业务中的典型模型、加速算法&#xff0c;提供基于CANN平台的优化样例 项目地址: https://gitcode.com/cann/cann-recipes-infer The configuration instructions in the Y…

作者头像 李华
网站建设 2026/5/9 14:08:02

CANN/HCOMM通信连接查询

HcclRankGraphGetLinks 【免费下载链接】hcomm HCOMM&#xff08;Huawei Communication&#xff09;是HCCL的通信基础库&#xff0c;提供通信域以及通信资源的管理能力。 项目地址: https://gitcode.com/cann/hcomm 产品支持情况 Ascend 950PR/Ascend 950DT&#xff1a…

作者头像 李华
网站建设 2026/5/9 14:08:00

ncmdumpGUI:5分钟快速解锁网易云音乐NCM格式的完整解决方案

ncmdumpGUI&#xff1a;5分钟快速解锁网易云音乐NCM格式的完整解决方案 【免费下载链接】ncmdumpGUI C#版本网易云音乐ncm文件格式转换&#xff0c;Windows图形界面版本 项目地址: https://gitcode.com/gh_mirrors/nc/ncmdumpGUI 你是否遇到过从网易云音乐下载的音乐文…

作者头像 李华
网站建设 2026/5/9 14:06:40

DSP固定点算术:原理、实现与工程优化

1. 固定点算术基础解析在数字信号处理&#xff08;DSP&#xff09;领域&#xff0c;固定点算术是构建高效实时系统的基石。与浮点数不同&#xff0c;固定点数通过预先确定小数点的位置&#xff0c;将数值的整数部分和小数部分固定在特定的二进制位上。这种表示方法在TI TMS320C…

作者头像 李华
网站建设 2026/5/9 14:06:03

cann/shmem Python API参考文档

SHMEM Python API Reference 【免费下载链接】shmem CANN SHMEM 是面向昇腾平台的多机多卡内存通信库&#xff0c;基于OpenSHMEM 标准协议&#xff0c;实现跨设备的高效内存访问与数据同步。 项目地址: https://gitcode.com/cann/shmem shmem.core API 对外接口 获取当…

作者头像 李华