CANN/ops-nn权重量化批量矩阵乘法算子-开发者社区

WeightQuantBatchMatmul

【免费下载链接】ops-nn本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-nn

产品支持情况

产品	是否支持
Ascend 950PR/Ascend 950DT	×
Atlas A3 训练系列产品/Atlas A3 推理系列产品	√
Atlas A2 训练系列产品/Atlas A2 推理系列产品	√
Atlas 200I/500 A2 推理产品	×
Atlas 推理系列产品	×
Atlas 训练系列产品	×

功能说明

算子功能：完成一个输入为伪量化场景的矩阵乘计算，并可以实现对于输出的量化计算。
计算公式：
$$ result = self @ ANTIQUANT(mat2) + bias $$
公式中的$mat2$为伪量化场景的输入，其反量化公式$ANTIQUANT(mat2)$为
$$ ANTIQUANT(mat2) = (mat2 + antiquantOffset) * antiquantScale $$
当需要对输出进行量化处理时，其量化公式为
$$ \begin{aligned} result &= QUANT(self @ ANTIQUANT(mat2) + bias) \ &= (self @ ANTIQUANT(mat2) + bias) * quantScale + quantOffset \ \end{aligned} $$
当不需要对输出再进行量化操作时，其计算公式为
$$ result = self @ ANTIQUANT(mat2) + bias $$

参数说明

参数名	输入/输出/属性	描述	数据类型	数据格式
x1	输入	公式中的输入self。	FLOAT16	ND
x2	输入	公式中的输入mat2。	INT8	ND
bias	输入	公式中的输入bias。	FLOAT32	ND
antiquantScale	输入	反量化参数中的缩放因子，对应公式中的antiquantScale。	FLOAT32	-
antiquantOffset	输入	反量化参数中的偏置因子，对应公式中的antiquantOffset。	FLOAT32	-
quantScale	输入	量化参数中的缩放因子，对应公式中的quantScale。	FLOAT32	-
quantOffset	输入	量化参数中的偏置因子，对应公式中的quantOffset。	FLOAT32	-
out	输出	公式中的result。	FLOAT16,INT8	ND

约束说明

不支持空tensor。
支持连续tensor，非连续tensor只支持转置场景。

调用说明

调用方式	样例代码	说明
aclnn接口	test_aclnn_weight_quant_batch_mat_mul	通过 aclnnWeightQuantBatchMatmul 调用WeightQuantBatchMatmul算子。

【免费下载链接】ops-nn本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-nn

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

2026届最火的降AI率神器推荐

Ai论文网站排名（开题报告、文献综述、降aigc率、降重综合对比） TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 对着知网AI检测系统的敏感特征，要采用系统性降AI策略。其一，别用“首…

李华

告别虚拟机！在Windows上用WSL2和VSCode搭建ESP32开发环境（保姆级避坑指南）

告别虚拟机！在Windows上用WSL2和VSCode搭建ESP32开发环境（保姆级避坑指南） 嵌入式开发向来对系统环境有着严苛要求，传统方案往往需要依赖笨重的虚拟机或双系统切换。我曾为了调试一个简单的ESP32固件，不得不忍受虚拟机…

李华

告别Keil和IAR？手把手教你用MounRiver Studio搭建RISC-V单片机开发环境（Windows 10/11实测）

从Keil/IAR到MounRiver Studio：RISC-V开发环境迁移实战指南如果你是一位长期使用Keil或IAR进行ARM开发的工程师，最近可能已经注意到RISC-V架构在嵌入式领域的崛起。这种开源指令集架构正在重塑单片机市场格局，而MounRiver Studio作为专为RI…

李华

linux（第六期）--Linux用户与用户组-- Ubuntu20.04

🎬 渡水无言：个人主页渡水无言 ❄专栏传送门： 《linux专栏》《嵌入式linux驱动开发》《linux系统移植专栏》 ❄专栏传送门： 《freertos专栏》《STM32 HAL库专栏》《linux裸机开发专栏》 ❄专栏传送门：《产品测评专栏》…

李华

3步掌握Topit：重新定义macOS多窗口工作流的技术实践

3步掌握Topit：重新定义macOS多窗口工作流的技术实践【免费下载链接】Topit Pin any window to the top of your screen / 在Mac上将你的任何窗口强制置顶项目地址: https://gitcode.com/gh_mirrors/to/Topit 在macOS生态中，多窗口管理一直是效率…

李华