news 2026/5/27 20:03:34

CANN asc-devkit FP4转BFloat16函数

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN asc-devkit FP4转BFloat16函数

asc_e2m1x22bfloat16

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT

功能说明

将fp4x2_e2m1_t类型转化为bfloat16_t类型。

由于源操作数与目的操作数类型位宽比为1:4,读取数据时需要将一个VL大小的数据分为四部分,根据不同接口选取索引0、索引1、索引2或者索引3。

函数原型

// 读取索引0的位置 __simd_callee__ inline void asc_e2m1x22bfloat16(vector_bfloat16_t& dst, vector_fp4x2_e2m1_t src, vector_bool mask) // 读取索引1的位置 __simd_callee__ inline void asc_e2m1x22bfloat16_v2(vector_bfloat16_t& dst, vector_fp4x2_e2m1_t src, vector_bool mask) // 读取索引2的位置 __simd_callee__ inline void asc_e2m1x22bfloat16_v3(vector_bfloat16_t& dst, vector_fp4x2_e2m1_t src, vector_bool mask) // 读取索引3的位置 __simd_callee__ inline void asc_e2m1x22bfloat16_v4(vector_bfloat16_t& dst, vector_fp4x2_e2m1_t src, vector_bool mask)

参数说明

参数名输入/输出描述
dst输出目的操作数(矢量数据寄存器)。
src输入源操作数(矢量数据寄存器)。
mask输入源操作数掩码(矢量寄存器),用于指示在计算过程中哪些元素参与计算。对应位置为1时参与计算,为0时不参与计算。mask未筛选的元素在输出中置零。

矢量数据寄存器和掩码寄存器的详细说明请参见reg数据类型定义.md。

返回值说明

流水类型

PIPE_V

约束说明

调用示例

vector_fp4x2_e2m1_t src; vector_bfloat16_t dst; vector_bool mask; asc_e2m1x22bfloat16(dst, src, mask);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/22 4:19:13

Stylis中间件系统深度解析:自定义CSS处理逻辑的完整指南

Stylis中间件系统深度解析:自定义CSS处理逻辑的完整指南 【免费下载链接】stylis light – weight css preprocessor 项目地址: https://gitcode.com/gh_mirrors/st/stylis 什么是Stylis中间件? Stylis作为一款轻量级CSS预处理器,其核…

作者头像 李华
网站建设 2026/5/22 4:19:05

蘑菇博客性能优化技巧:10个提升博客访问速度的方法 [特殊字符]

蘑菇博客性能优化技巧:10个提升博客访问速度的方法 🚀 【免费下载链接】mogu_blog_v2 蘑菇博客(MoguBlog),一个基于微服务架构的前后端分离博客系统。Web端使用Vue Element , 移动端使用uniapp和ColorUI。后端使用Spring cloud Spring boot…

作者头像 李华
网站建设 2026/5/22 4:15:17

3分钟一键获取百度网盘提取码:自动化查询实战指南

3分钟一键获取百度网盘提取码:自动化查询实战指南 【免费下载链接】baidupankey 项目地址: https://gitcode.com/gh_mirrors/ba/baidupankey 百度网盘提取码智能获取工具baidupankey,是一款专为技术爱好者和普通用户设计的自动化查询解决方案&am…

作者头像 李华
网站建设 2026/5/22 4:13:14

多Agent系统设计模式:从单体Agent到企业级协作架构

单个 Agent 能完成的任务是有限的。当问题足够复杂,多个专业化 Agent 协同工作才是答案。本文系统梳理多 Agent 系统的核心设计模式,以及何时选择何种架构。为什么需要多 Agent单 Agent 的根本限制来自三个方面:上下文窗口限制:复…

作者头像 李华
网站建设 2026/5/22 4:12:26

如何用GeoPort轻松实现iOS虚拟定位?2025年完整使用指南

如何用GeoPort轻松实现iOS虚拟定位?2025年完整使用指南 【免费下载链接】GeoPort GeoPort: Your Location, Anywhere! The iOS location simulator 项目地址: https://gitcode.com/gh_mirrors/ge/GeoPort GeoPort是一款强大的iOS虚拟定位工具,让你…

作者头像 李华