news 2026/5/11 18:21:45

CANN/ops-nn权重量化批量矩阵乘法算子

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/ops-nn权重量化批量矩阵乘法算子

WeightQuantBatchMatmul

【免费下载链接】ops-nn本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-nn

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT×
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品
Atlas 200I/500 A2 推理产品×
Atlas 推理系列产品×
Atlas 训练系列产品×

功能说明

  • 算子功能:完成一个输入为伪量化场景的矩阵乘计算,并可以实现对于输出的量化计算。

  • 计算公式:

    $$ result = self @ ANTIQUANT(mat2) + bias $$

    公式中的$mat2$为伪量化场景的输入,其反量化公式$ANTIQUANT(mat2)$为

    $$ ANTIQUANT(mat2) = (mat2 + antiquantOffset) * antiquantScale $$

    当需要对输出进行量化处理时,其量化公式为

    $$ \begin{aligned} result &= QUANT(self @ ANTIQUANT(mat2) + bias) \ &= (self @ ANTIQUANT(mat2) + bias) * quantScale + quantOffset \ \end{aligned} $$

    当不需要对输出再进行量化操作时,其计算公式为

    $$ result = self @ ANTIQUANT(mat2) + bias $$

参数说明

参数名输入/输出/属性描述数据类型数据格式
x1输入公式中的输入self。FLOAT16ND
x2输入公式中的输入mat2。INT8ND
bias输入公式中的输入bias。FLOAT32ND
antiquantScale输入反量化参数中的缩放因子,对应公式中的antiquantScale。FLOAT32-
antiquantOffset输入反量化参数中的偏置因子,对应公式中的antiquantOffset。FLOAT32-
quantScale输入量化参数中的缩放因子,对应公式中的quantScale。FLOAT32-
quantOffset输入量化参数中的偏置因子,对应公式中的quantOffset。FLOAT32-
out输出公式中的result。FLOAT16,INT8ND

约束说明

  • 不支持空tensor。
  • 支持连续tensor,非连续tensor只支持转置场景。

调用说明

调用方式样例代码说明
aclnn接口test_aclnn_weight_quant_batch_mat_mul通过
aclnnWeightQuantBatchMatmul
调用WeightQuantBatchMatmul算子。

【免费下载链接】ops-nn本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-nn

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/11 18:20:42

2026届最火的降AI率神器推荐

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 对着知网AI检测系统的敏感特征,要采用系统性降AI策略。其一,别用“首…

作者头像 李华
网站建设 2026/5/11 18:18:51

linux(第六期)--Linux用户与用户组-- Ubuntu20.04

🎬 渡水无言:个人主页渡水无言 ❄专栏传送门: 《linux专栏》《嵌入式linux驱动开发》《linux系统移植专栏》 ❄专栏传送门: 《freertos专栏》 《STM32 HAL库专栏》《linux裸机开发专栏》 ❄专栏传送门:《产品测评专栏》…

作者头像 李华
网站建设 2026/5/11 18:17:48

3步掌握Topit:重新定义macOS多窗口工作流的技术实践

3步掌握Topit:重新定义macOS多窗口工作流的技术实践 【免费下载链接】Topit Pin any window to the top of your screen / 在Mac上将你的任何窗口强制置顶 项目地址: https://gitcode.com/gh_mirrors/to/Topit 在macOS生态中,多窗口管理一直是效率…

作者头像 李华
网站建设 2026/5/11 18:15:18

GESP2026年3月认证C++三级( 第二部分判断题(1-10))

🌟 第1题:数组小房间 🏠1、📖 题目:int arr[5] {1,2,3};说:arr[3] 0 ✔arr[5] 是合法下标 ❌2、🎬 故事(1)有一个5间房子的宿舍:房号:0 1 2 3 4…

作者头像 李华