news 2026/5/14 1:28:11

CANN/pyasc按位取反函数文档

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/pyasc按位取反函数文档

asc.language.basic.bitwise_not

【免费下载链接】pyasc本项目为Python用户提供算子编程接口,支持在昇腾AI处理器上加速计算,接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc

asc.language.basic.bitwise_not(dst: LocalTensor, src: LocalTensor, count: int) → None

asc.language.basic.bitwise_not(dst: LocalTensor, src: LocalTensor, mask: int, repeat_times: int, repeat_params: UnaryRepeatParams, is_set_mask: bool = True) → None

asc.language.basic.bitwise_not(dst: LocalTensor, src: LocalTensor, mask: List[int], repeat_times: int, repeat_params: UnaryRepeatParams, is_set_mask: bool = True) → None

按元素做按位取反。命名为 bitwise_not 避免与Python关键字重名。

对应的Ascend C函数原型

template <typename T> __aicore__ inline void Not(const LocalTensor<T>& dstLocal, const LocalTensor<T>& srcLocal, const int32_t& calCount)
template <typename T, bool isSetMask = true> __aicore__ inline void Not(const LocalTensor<T>& dstLocal, const LocalTensor<T>& srcLocal, uint64_t mask[], const uint8_t repeatTimes, const UnaryRepeatParams& repeatParams)
template <typename T, bool isSetMask = true> __aicore__ inline void Not(const LocalTensor<T>& dstLocal, const LocalTensor<T>& srcLocal, uint64_t mask, const uint8_t repeatTimes, const UnaryRepeatParams& repeatParams)

参数说明

  • is_set_mask:是否在接口内部设置mask。
  • dst: 目的操作数。类型为LocalTensor,支持的TPosition为VECIN/VECCALC/VECOUT。
  • src: 源操作数。类型为LocalTensor,支持的TPosition为VECIN/VECCALC/VECOUT。
  • count: 参与计算的元素个数。
  • mask: 用于控制每次迭代内参与计算的元素。
  • repeat_times: 重复迭代次数。
  • params: 控制操作数地址步长的参数。

约束说明

  • 操作数地址对齐要求请参见 《Ascend C算子开发接口》 中的“通用说明和约束-通用地址对齐约束”。
  • 操作数地址重叠约束请参考 《Ascend C算子开发接口》 中的“通用说明和约束-通用地址重叠约束”。

调用示例

  • tensor高维切分计算样例-mask连续模式
    mask = 256 // asc.half.sizeof() # repeat_times = 4,一次迭代计算128个数,共计算512个数 # dst_blk_stride, src_blk_stride = 1,单次迭代内数据连续读取和写入 # dst_rep_stride, src_rep_stride = 8,相邻迭代间数据连续读取和写入 params = asc.UnaryRepeatParams(1, 1, 8, 8) asc.bitwise_not(dst, src, mask=mask, repeat_times=4, repeat_params=params)
  • tensor高维切分计算样例-mask逐bit模式
    mask = [uint64_max, uint64_max] # repeat_times = 4,一次迭代计算128个数,共计算512个数 # dst_blk_stride, src_blk_stride = 1,单次迭代内数据连续读取和写入 # dst_rep_stride, src_rep_stride = 8,相邻迭代间数据连续读取和写入 params = asc.UnaryRepeatParams(1, 1, 8, 8) asc.bitwise_not(dst, src, mask=mask, repeat_times=4, repeat_params=params)
  • tensor前n个数据计算样例
    asc.bitwise_not(dst, src, count=512)

【免费下载链接】pyasc本项目为Python用户提供算子编程接口,支持在昇腾AI处理器上加速计算,接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 12:42:12

生成式AI的艺术评判:当传统审美标准遭遇算法创作

1. 项目概述&#xff1a;当AI拿起画笔&#xff0c;我们如何评判&#xff1f; 最近几年&#xff0c;生成式人工智能&#xff08;Generative AI&#xff09;的爆发&#xff0c;让“创造力”这个曾经被认为是人类专属的领域&#xff0c;变得不再那么泾渭分明。从能写出流畅文章的C…

作者头像 李华
网站建设 2026/5/9 12:42:11

CANN/cannbot-skills:A5 Flash Attention FP8因果注意力内核

Deep Note: agent/example/kernels/a5/flash_attn_full_fp8_causal.py 【免费下载链接】cannbot-skills CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体&#xff0c;本仓库为其提供可复用的 Skills 模块。 项目地址: https://gitcode.com/cann/cannbot-skills …

作者头像 李华
网站建设 2026/5/9 12:41:41

CANN/opbase公共接口列表

公共接口列表 【免费下载链接】opbase 本项目是CANN算子库的基础框架库&#xff0c;为算子提供公共依赖文件和基础调度能力。 项目地址: https://gitcode.com/cann/opbase 本章是调用CANN API过程中依赖的公共Meta接口&#xff0c;如创建/释放aclTensor、aclScalar、acl…

作者头像 李华
网站建设 2026/5/9 12:40:56

CANN算子测试总决赛

总决赛&#xff1a;算子测试用例设计 【免费下载链接】cann-competitions 本仓库用于 CANN 开源社区各类竞赛、开源课题、社区任务等课题发布、开发者作品提交和展示。 项目地址: https://gitcode.com/cann/cann-competitions 赛题概述 本次总决赛要求参赛者为 CANN op…

作者头像 李华
网站建设 2026/5/9 12:38:59

怎样高效使用网盘直链下载助手:实用技巧完整指南

怎样高效使用网盘直链下载助手&#xff1a;实用技巧完整指南 【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 &#xff0c;支持 百度网盘 / 阿里云盘 / 中国移动云盘 / 天翼云盘 …

作者头像 李华
网站建设 2026/5/12 5:44:27

初创公司如何通过 Taotoken 低成本试用多款大模型

&#x1f680; 告别海外账号与网络限制&#xff01;稳定直连全球优质大模型&#xff0c;限时半价接入中。 &#x1f449; 点击领取海量免费额度 初创公司如何通过 Taotoken 低成本试用多款大模型 对于初创团队而言&#xff0c;在技术选型阶段评估不同的大模型是一个关键但充满…

作者头像 李华