news 2026/5/30 21:53:22

CANN/catlass GEMV向量乘标量

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/catlass GEMV向量乘标量

TileVmuls

【免费下载链接】catlass本项目是CANN的算子模板库,提供NPU上高性能矩阵乘及其相关融合类算子模板样例。项目地址: https://gitcode.com/cann/catlass

代码位置

[TOC]

功能说明

TileVmuls实现 GEMV 场景下向量乘以标量的操作。通过AscendC::Muls对 UB 上指定长度的向量逐元素乘以标量值。

  • 适用范围:所有架构(无架构特化)
  • 使用AscendC::SetVectorMask<Element, MaskMode::COUNTER>(len)控制有效长度

模板原型

template <class ArchTag, class VType_> struct TileVmuls;
模板参数说明
ArchTag架构标签
VType_向量数据类型,通过VType_::Element获取元素类型

调用接口

void operator()( AscendC::LocalTensor<Element> dstTensor, // 目的 UB LocalTensor AscendC::LocalTensor<Element> srcTensor, // 源 UB LocalTensor Element scalar, // 标量值 uint32_t len // 向量长度 )

调用示例

#include "catlass/gemv/tile/tile_vmuls.hpp" using namespace Catlass::Gemv::Tile; using Element = half; using VType = Gemm::GemmType<Element, layout::VectorLayout>; uint32_t len = 64; Element scale = 0.5f; AscendC::LocalTensor<Element> dstTensor, srcTensor; using VmulsOp = TileVmuls<Arch::AtlasA2, VType>; VmulsOp vmuls; vmuls(dstTensor, srcTensor, scale, len);

【免费下载链接】catlass本项目是CANN的算子模板库,提供NPU上高性能矩阵乘及其相关融合类算子模板样例。项目地址: https://gitcode.com/cann/catlass

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/30 21:50:29

Carbon-3B应用案例:从基因编辑到疾病研究的5个实际应用场景

Carbon-3B应用案例&#xff1a;从基因编辑到疾病研究的5个实际应用场景 【免费下载链接】Carbon-3B 项目地址: https://ai.gitcode.com/hf_mirrors/HuggingFaceBio/Carbon-3B Carbon-3B是一个革命性的DNA生成模型&#xff0c;它为基因组学研究带来了全新的可能性。作为…

作者头像 李华
网站建设 2026/5/30 21:47:32

如何快速掌握Diffuse:从零开始的完整文本对比指南

如何快速掌握Diffuse&#xff1a;从零开始的完整文本对比指南 【免费下载链接】diffuse Diffuse is a graphical tool for comparing and merging text files. It can retrieve files for comparison from Bazaar, CVS, Darcs, Git, Mercurial, Monotone, RCS, Subversion, and…

作者头像 李华
网站建设 2026/5/30 21:45:03

MAGI-1模型压缩与蒸馏:4.5B参数版本的轻量化实现方案 [特殊字符]

MAGI-1模型压缩与蒸馏&#xff1a;4.5B参数版本的轻量化实现方案 &#x1f680; 【免费下载链接】MAGI-1 项目地址: https://ai.gitcode.com/hf_mirrors/MindIE/MAGI-1 MAGI-1是Sand AI开源的全球首个自回归视频生成大模型&#xff0c;通过创新的模型压缩和知识蒸馏技术…

作者头像 李华