news 2026/6/1 22:00:54

CANN/ops-blas Cswap算子

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/ops-blas Cswap算子

Cswap算子实现

【免费下载链接】ops-blas本项目是CANN提供的高性能线性代数计算以及轻量化GEMM调用算子库。项目地址: https://gitcode.com/cann/ops-blas

概述

BLAS Cswap算子实现。

Cswap(Complex Swap)算子实现了两个复数向量的交换运算,是BLAS基础线性代数库中的核心算子之一。

复数向量在内存中以交错float数组形式存储:[real0, imag0, real1, imag1, ...]

支持的产品

  • Atlas A3 训练系列产品/Atlas A3 推理系列产品
  • Atlas A2 训练系列产品/Atlas A2 推理系列产品

目录结构介绍

├── cswap │ ├── CMakeLists.txt // 编译工程文件 │ ├── README.md // 说明文档 │ └── cswap_test.cpp // 算子调用样例

算子描述

  • 算子功能:
    cswap算子实现了两个复数向量x和y的交换。对应的数学表达式为:
x <-> y
  • 对应的接口:
int aclblasCswap(aclblasHandle handle, float *x, float *y, const int64_t n, const int64_t incx, const int64_t incy);
参数cswap 参数说明
参数列表Param.Memoryin/out含义
handlehostinACL流handle,用于传入stream。
xdevicein/out复数向量(存储为float数组,2*n个元素)。
ydevicein/out复数向量(存储为float数组,2*n个元素)。
nin向量中的复数元素个数。
incx/incyinx/y中连续元素之间的步长。
  • 算子规格:

    算子类型(OpType)Cswap
    算子输入nameshapedata typeformat
    x/y8 * 2048complexND
    算子输出x8 * 2048complexND
    y8 * 2048complexND
    核函数名cswap_kernel
  • 算子实现:

    复数向量被视为2*n个float元素,直接复用swap逻辑,使用ping-pong双缓冲策略完成交换。

  • 调用实现
    使用内核调用符<<<>>>调用核函数。

编译运行

在本样例根目录下执行如下步骤,编译并执行算子。

  • 配置环境变量
    请根据当前环境上CANN开发套件包的安装方式,选择对应配置环境变量的命令。

    • 默认路径,root用户安装CANN软件包

      source /usr/local/Ascend/cann/set_env.sh
    • 默认路径,非root用户安装CANN软件包

      source $HOME/Ascend/cann/set_env.sh
    • 指定路径install_path,安装CANN软件包

      source ${install_path}/cann/set_env.sh
  • 样例执行

    bash build.sh --ops=cswap --run # --ops=<算子名> --run可选参数,执行测试样例

    执行结果如下,说明精度对比成功。

    [Success] Case accuracy is verification passed. [PASS] cswap_test

【免费下载链接】ops-blas本项目是CANN提供的高性能线性代数计算以及轻量化GEMM调用算子库。项目地址: https://gitcode.com/cann/ops-blas

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/1 22:00:40

Sentence Transformers完美适配:E5-small-v2-openmind高级应用教程

Sentence Transformers完美适配&#xff1a;E5-small-v2-openmind高级应用教程 【免费下载链接】E5-small-v2-openmind 项目地址: https://ai.gitcode.com/hf_mirrors/jeffding/E5-small-v2-openmind 你是否正在寻找一个高效、易用的文本嵌入模型来解决语义相似度、信息…

作者头像 李华
网站建设 2026/6/1 21:57:38

5倍提速!用Fast-GitHub突破国内访问GitHub的技术瓶颈

5倍提速&#xff01;用Fast-GitHub突破国内访问GitHub的技术瓶颈 【免费下载链接】Fast-GitHub 国内Github下载很慢&#xff0c;用上了这个插件后&#xff0c;下载速度嗖嗖嗖的~&#xff01; 项目地址: https://gitcode.com/gh_mirrors/fa/Fast-GitHub 如果你是一名国内…

作者头像 李华
网站建设 2026/6/1 21:57:36

3天解锁Dify工作流魔法:从零到精通的免费实战指南

3天解锁Dify工作流魔法&#xff1a;从零到精通的免费实战指南 【免费下载链接】Awesome-Dify-Workflow 分享一些好用的 Dify DSL 工作流程&#xff0c;自用、学习两相宜。 Sharing some Dify workflows. 项目地址: https://gitcode.com/GitHub_Trending/aw/Awesome-Dify-Work…

作者头像 李华
网站建设 2026/6/1 21:54:09

魔法.2(2025)

通过网盘分享的文件&#xff1a;魔法.2&#xff08;2025&#xff09; 链接: https://pan.baidu.com/s/1r0eMouUobxhR0Yq4p62AAg?pwdhieg 提取码: hieg

作者头像 李华