news 2026/5/9 14:08:03

CANN/DeepSeek-V4配置指南

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/DeepSeek-V4配置指南

YAML Parameter Description

【免费下载链接】cann-recipes-infer本项目针对LLM与多模态模型推理业务中的典型模型、加速算法,提供基于CANN平台的优化样例项目地址: https://gitcode.com/cann/cann-recipes-infer

The configuration instructions in the YAML file can be found below.

Basic Config model_name: "deepseek_v4" # Model name. String type model_path: "/data/models/deepseek_v4_int8_w8a8" # Weights path. String type exe_mode: "npugraph_ex" # Execution mode. Only support ["eager", "npugraph_ex"] world_size: 128 # Global rank num. Int type Model Config pa_block_size: 128 # PA Block Size value. Support [128] with_ckpt: True # Whether load ckpt. Support [False, True] enable_multi_streams: True # Whether enable multistream to improve performance. Support [False, True] enable_profiler: True # Whether enable profiling. Support [False, True] enable_cache_compile: False # Whether enable cache compile for better successive performance. Support [False, True] prefill_mini_batch_size: 0 # Mini_batch_size for prefill stage. Support [0, 1, 2, 3] perfect_eplb: False # If enabled, will force uniform selection of MoE experts. Support [False, True] enable_online_split_weight: True # Whether enable online-split weight. Support [False, True] next_n: 1 # Steps using multi-token prediction. Support [0, 1, 2, 3] platform_version: "A3" # inference platform. Support ["A3", "950"] enable_pypto: False # Whether enable pypto operators. Support ["True", "False"] Data Config dataset: "default" # Support ["default" "InfiniteBench" "LongBench"] input_max_len: 8192 # Max input prompt length max_new_tokens: 256 # Max inferred new tokens batch_size: 128 # Global batch size temperature: 1.0 # Float that controls the randomness of the sampling. Lower values make the model more deterministic, # while higher values make the model more random. Zero means greedy sampling. Parallel Config cp_size: 1 # Prefill CP Number. Only support [1, world_size] attn_tp_size: 1 # Attention TP Number. Only support [1] oproj_tp_size: 1 # Oproj TP Number. Only support [1, 4, 8] moe_tp_size: 1 # MoE TP Number. Only support [1] embed_tp_size: 16 # Embed TP Number. Only support [1, 4, 8 16] lmhead_tp_size: 16 # LMHead TP Number. Only support [1, 4, 8 16]

【免费下载链接】cann-recipes-infer本项目针对LLM与多模态模型推理业务中的典型模型、加速算法,提供基于CANN平台的优化样例项目地址: https://gitcode.com/cann/cann-recipes-infer

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 14:08:02

CANN/HCOMM通信连接查询

HcclRankGraphGetLinks 【免费下载链接】hcomm HCOMM(Huawei Communication)是HCCL的通信基础库,提供通信域以及通信资源的管理能力。 项目地址: https://gitcode.com/cann/hcomm 产品支持情况 Ascend 950PR/Ascend 950DT&#xff1a…

作者头像 李华
网站建设 2026/5/9 14:08:00

ncmdumpGUI:5分钟快速解锁网易云音乐NCM格式的完整解决方案

ncmdumpGUI:5分钟快速解锁网易云音乐NCM格式的完整解决方案 【免费下载链接】ncmdumpGUI C#版本网易云音乐ncm文件格式转换,Windows图形界面版本 项目地址: https://gitcode.com/gh_mirrors/nc/ncmdumpGUI 你是否遇到过从网易云音乐下载的音乐文…

作者头像 李华
网站建设 2026/5/9 14:06:40

DSP固定点算术:原理、实现与工程优化

1. 固定点算术基础解析在数字信号处理(DSP)领域,固定点算术是构建高效实时系统的基石。与浮点数不同,固定点数通过预先确定小数点的位置,将数值的整数部分和小数部分固定在特定的二进制位上。这种表示方法在TI TMS320C…

作者头像 李华
网站建设 2026/5/9 14:06:03

cann/shmem Python API参考文档

SHMEM Python API Reference 【免费下载链接】shmem CANN SHMEM 是面向昇腾平台的多机多卡内存通信库,基于OpenSHMEM 标准协议,实现跨设备的高效内存访问与数据同步。 项目地址: https://gitcode.com/cann/shmem shmem.core API 对外接口 获取当…

作者头像 李华
网站建设 2026/5/9 14:06:03

AI驱动生命科学:从蛋白质结构预测到单细胞分析的融合实践

1. 项目概述:当AI遇见生命科学的微观世界最近几年,实验室里最常听到的讨论,已经从“这个基因表达量怎么样”变成了“这个蛋白的结构用AlphaFold2预测一下”和“这批单细胞数据用哪个AI模型做注释更准”。作为一名在生物信息领域摸爬滚打了十来…

作者头像 李华
网站建设 2026/5/9 14:06:01

从对比学习到因果世界模型:构建AGI原生网络的实践路径

1. 项目概述:当网络开始“思考”,我们如何为它构建“世界观”?最近几年,AGI(通用人工智能)的概念从科幻走向了技术前沿的严肃讨论。我们不再仅仅满足于让AI在特定任务上超越人类,而是开始构想一…

作者头像 李华