news 2026/5/11 18:26:21

CANN/asc-devkit单核形状API文档

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/asc-devkit单核形状API文档

SetSingleShape

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

功能说明

设置Matmul单核计算的形状singleMIn,singleNIn,singleKIn,单位为元素。

函数原型

int32_t SetSingleShape(int32_t singleMIn = -1, int32_t singleNIn = -1, int32_t singleKIn = -1)

参数说明

表 1参数说明

参数名

输入/输出

描述

singleMIn

输入

设置的singleMIn大小,单位为元素,默认值为-1。-1表示不设置指定的singleMIn,该值由tiling函数自行计算。

singleNIn

输入

设置的singleNIn大小,单位为元素,默认值为-1。-1表示不设置指定的singleNIn,该值由tiling函数自行计算。

singleKIn

输入

设置的singleKIn大小,单位为元素,默认值为-1。-1表示不设置指定的singleKIn,该值由tiling函数自行计算。

返回值说明

-1表示设置失败;0表示设置成功。

约束说明

  • 在MxMatmul场景中,如果A与B矩阵的位置同时为GM,对singleKIn没有特殊限制,在这种情况下,若scaleA和scaleB的K方向大小(即Ceil(singleKIn, 32))为奇数,用户需自行在scaleA和scaleB的K方向补0至偶数。例如,当singleKIn为30时,Ceil(singleKIn, 32)为1,用户需要自行在scaleA和scaleB的K方向补0,使K方向为偶数。对于其它A、B矩阵逻辑位置的组合情况,即A与B矩阵的位置不同时为GM,singleKIn以32个元素向上对齐后的数值必须是32的偶数倍。
  • 在MxMatmul场景中,当输入数据类型为fp4x2_e2m1_t、fp4x2_e1m2_t时,内轴必须为偶数。

调用示例

auto ascendcPlatform = platform_ascendc::PlatformAscendC(context->GetPlatformInfo()); matmul_tiling::MultiCoreMatmulTiling tiling(ascendcPlatform); tiling.SetDim(1); tiling.SetAType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT16); tiling.SetBType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT16); tiling.SetCType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT); tiling.SetBiasType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT); tiling.SetShape(1024, 1024, 1024); // 设置Matmul单次计算的形状 tiling.SetSingleShape(1024, 1024, 1024); // 设置单核计算的形状 tiling.SetOrgShape(1024, 1024, 1024); tiling.SetBias(true); tiling.SetBufferSpace(-1, -1, -1); optiling::TCubeTiling tilingData; int ret = tiling.GetTiling(tilingData);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/11 18:23:36

把时间留给睡觉,把论文丢给工具

一个关于“睡觉”的真实故事去年毕业季,我认识的两个研三学生,几乎是同一条起跑线——同样的开题时间,同样的导师风格,连论文选题都差不多。但一个月后,两个人的状态天差地别。A同学,每天睡到自然醒&#x…

作者头像 李华
网站建设 2026/5/11 18:21:45

CANN/ops-nn权重量化批量矩阵乘法算子

WeightQuantBatchMatmul 【免费下载链接】ops-nn 本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。 项目地址: https://gitcode.com/cann/ops-nn 产品支持情况 产品是否支持Ascend 950PR/Ascend 950DTAtlas A3 训练系列产品/Atlas A3 推理…

作者头像 李华
网站建设 2026/5/11 18:20:42

2026届最火的降AI率神器推荐

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 对着知网AI检测系统的敏感特征,要采用系统性降AI策略。其一,别用“首…

作者头像 李华
网站建设 2026/5/11 18:18:51

linux(第六期)--Linux用户与用户组-- Ubuntu20.04

🎬 渡水无言:个人主页渡水无言 ❄专栏传送门: 《linux专栏》《嵌入式linux驱动开发》《linux系统移植专栏》 ❄专栏传送门: 《freertos专栏》 《STM32 HAL库专栏》《linux裸机开发专栏》 ❄专栏传送门:《产品测评专栏》…

作者头像 李华