news 2026/5/9 12:17:28

CANN/ops-solver算子列表

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/ops-solver算子列表

算子列表

【免费下载链接】ops-solver本项目是CANN提供的高级数值求解算子库,实现矩阵分解、求逆、特征值求解等功能在NPU上的加速计算。项目地址: https://gitcode.com/cann/ops-solver

说明:

  • 算子目录:目录名为算子名小写下划线形式,每个目录承载该算子所有交付件,包括代码实现、examples、文档等,目录介绍参见项目目录。
  • 算子执行硬件单元:所有算子运行在AI Core。关于AI Core详细介绍参见《Ascend C算子开发》中"概念原理和术语 > 硬件架构与数据处理原理"。
  • 算子接口列表:为方便调用算子,CANN提供一套C API执行算子,以aclsolver为前缀,接口风格参考cuSolver。

项目提供的所有算子分类和算子列表如下:

算子分类算子目录算子实现算子执行硬件单元说明
op_kernelop_host
solvercgetrfAI Core复数矩阵LU分解,计算复数矩阵A的LU分解,A = P * L * U,其中P为置换矩阵,L为下三角矩阵,U为上三角矩阵。
solvercgetriAI Core复数矩阵求逆,利用LU分解计算复数矩阵的逆矩阵。
solversgetrfAI Core单精度矩阵LU分解,计算单精度矩阵A的LU分解,A = P * L * U,其中P为置换矩阵,L为下三角矩阵,U为上三角矩阵。
solversgetriAI Core单精度矩阵求逆,利用LU分解计算单精度矩阵的逆矩阵。
solvercmatinv_batchedAI Core批量复数矩阵求逆,对一批复数矩阵同时进行求逆运算,提高计算效率。

算子接口

ops-solver提供类似cuSolver风格的C API接口,通过handle管理上下文:

Handle管理接口

接口说明
aclsolverCreate创建solver handle
aclsolverDestroy销毁solver handle
aclsolverSetStream设置计算流
aclsolverGetStream获取计算流
aclsolverSetWorkspace设置工作空间
aclsolverGetVersion获取版本号

算子计算接口

接口说明
aclsolverCgetrf复数矩阵LU分解
aclsolverCgetri复数矩阵求逆
aclsolverSgetrf单精度矩阵LU分解
aclsolverSgetri单精度矩阵求逆
aclsolverCmatinvBatched批量复数矩阵求逆
aclsolverCgetriBatched批量复数矩阵求逆

【免费下载链接】ops-solver本项目是CANN提供的高级数值求解算子库,实现矩阵分解、求逆、特征值求解等功能在NPU上的加速计算。项目地址: https://gitcode.com/cann/ops-solver

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 12:13:22

CANN/runtime IPC进程间内存共享

11-07 IPC 进程间内存共享 【免费下载链接】runtime 本项目提供CANN运行时组件和维测功能组件。 项目地址: https://gitcode.com/cann/runtime 本章节描述 IPC(Inter-Process Communication)进程间内存共享接口,用于跨进程的内存导出与…

作者头像 李华
网站建设 2026/5/9 12:11:35

Gemini资源全不全?覆盖广度与实际可用性的深度解析

在大模型技术快速迭代的当下,开发者评估一款模型的核心维度早已从单一性能转向资源体系的完整性。所谓 "资源全不全",不仅指模型本身的能力边界,更涵盖了版本矩阵、开发工具、行业数据与接入渠道的综合配套。作为 Google DeepMind …

作者头像 李华
网站建设 2026/5/9 12:11:34

CANN/pypto张量维度重排列操作

pypto.permute 【免费下载链接】pypto PyPTO(发音: pai p-t-o):Parallel Tensor/Tile Operation编程范式。 项目地址: https://gitcode.com/cann/pypto 产品支持情况 产品是否支持Ascend 950PR/Ascend 950DT√Atlas A3 训练系列产品/…

作者头像 李华
网站建设 2026/5/9 12:10:45

Arm Neoverse V2处理器指令异常与性能优化解析

1. Arm Neoverse V2处理器指令异常深度解析在现代处理器架构设计中,指令执行异常是工程师们必须面对的挑战之一。Arm Neoverse V2作为面向基础设施的高性能处理器,其微架构设计在追求极致性能的同时,也不可避免地会遇到各种边界条件下的执行异…

作者头像 李华
网站建设 2026/5/9 12:09:32

15.开源社区的微光

周六上午十点,陈远站在西二旗一家共享办公空间的玻璃门外,手里攥着手机,屏幕上显示着一条确认短信:“陈远先生,您预约的‘开发者社区技术沙龙’座位已保留,地址:海淀区西二旗X号X座3层。时间&am…

作者头像 李华
网站建设 2026/5/9 12:05:30

CANN竞赛Add算子测试报告

【免费下载链接】cann-competitions 本仓库用于 CANN 开源社区各类竞赛、开源课题、社区任务等课题发布、开发者作品提交和展示。 项目地址: https://gitcode.com/cann/cann-competitions 元信息(请如实填写,此区块将由组委会脚本自动解析&#xf…

作者头像 李华