news 2026/5/9 23:34:34

CANN/AMCT创建蒸馏配置

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/AMCT创建蒸馏配置

create_distill_config

【免费下载链接】amctAMCT是CANN提供的昇腾AI处理器亲和的模型压缩工具仓。项目地址: https://gitcode.com/cann/amct

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品

功能说明

蒸馏接口,根据图的结构找到所有可蒸馏量化的层和可蒸馏量化的结构,自动生成蒸馏量化配置文件,并将可蒸馏量化层的量化配置和蒸馏结构写入配置文件。

函数原型

create_distill_config(config_file, model, input_data, config_defination=None)

参数说明

参数名

输入/输出

说明

config_file

输入

含义:待生成的蒸馏量化配置文件存放路径及名称。如果存放路径下已经存在该文件,则调用该接口时会覆盖已有文件。

数据类型:string

model

输入

含义:待进行蒸馏量化的原始浮点模型,已加载权重。

数据类型:torch.nn.Module

input_data

输入

含义:模型的输入数据。一个torch.tensor会被等价为tuple(torch.tensor)。

数据类型:tuple

config_defination

输入

含义:简易配置文件。基于distill_config_pytorch.proto文件生成的简易配置文件distill.cfg,*.proto文件所在路径为:AMCT安装目录/amct_pytorch/proto/。*.proto文件参数解释以及生成的distill.cfg简易量化配置文件样例请参见蒸馏简易配置文件。

默认值:None。

数据类型:string

返回值说明

调用示例

import amct_pytorch as amct # 建立待进行蒸馏量化的网络图结构 model = build_model() model.load_state_dict(torch.load(state_dict_path)) input_data = tuple([torch.randn(input_shape)]) # 生成蒸馏配置文件 amct.create_distill_config(config_file="./configs/config.json", model, input_data, config_defination="./configs/distill.cfg")

落盘文件说明:

生成JSON格式的蒸馏量化配置文件,样例如下(重新执行蒸馏时,该接口输出的配置文件将会被覆盖,如下为INT8量化场景下的配置文件):

{ "version":1, "batch_num":1, "group_size":1, "data_dump":false, "distill_group":[ [ "conv1", "bn", "relu" ], [ "conv2", "bn2", "relu2" ] ], "conv1":{ "quant_enable":true, "distill_data_config":{ "algo":"ulq_quantize", "dst_type":"INT8" }, "distill_weight_config":{ "algo":"arq_distill", "channel_wise":true, "dst_type":"INT8" } }, "conv2":{ "quant_enable":true, "distill_data_config":{ "algo":"ulq_quantize", "dst_type":"INT8" }, "distill_weight_config":{ "algo":"arq_distill", "channel_wise":true, "dst_type":"INT8" } } }

【免费下载链接】amctAMCT是CANN提供的昇腾AI处理器亲和的模型压缩工具仓。项目地址: https://gitcode.com/cann/amct

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 23:32:39

初创团队如何借助Taotoken低成本试用多种大模型

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 初创团队如何借助Taotoken低成本试用多种大模型 对于资源有限的初创团队和独立开发者而言,在项目初期选择合适的大语言…

作者头像 李华
网站建设 2026/5/9 23:32:38

CANN/sip贡献指南

贡献指南 【免费下载链接】sip 本项目是CANN提供的一款高效、可靠的高性能信号处理算子加速库,基于华为Ascend AI处理器,专门为信号处理领域而设计。 项目地址: https://gitcode.com/cann/sip 了解行为准则 SiP属于CANN开放项目,在参…

作者头像 李华
网站建设 2026/5/9 23:32:38

在自动化工作流中集成Taotoken多模型API以增强智能处理能力

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 在自动化工作流中集成Taotoken多模型API以增强智能处理能力 对于构建自动化脚本与工作流的工程师而言,将大模型能力作为…

作者头像 李华
网站建设 2026/5/9 23:29:29

魔兽争霸3终极优化指南:告别闪退卡顿,轻松玩转经典游戏

魔兽争霸3终极优化指南:告别闪退卡顿,轻松玩转经典游戏 【免费下载链接】WarcraftHelper Warcraft III Helper , support 1.20e, 1.24e, 1.26a, 1.27a, 1.27b 项目地址: https://gitcode.com/gh_mirrors/wa/WarcraftHelper 还在为魔兽争霸3闪退、…

作者头像 李华
网站建设 2026/5/9 23:27:56

混沌理论结合Transformer实现EEG信号高精度预测的工程实践

1. 项目概述:当混沌大脑遇见Transformer如果你也研究过脑电图(EEG)信号,肯定会被它的“混乱”所困扰。它不像心电图那样有清晰的P波、QRS波群,EEG信号看起来就是一团杂乱无章的、持续波动的曲线。传统的时间序列分析方…

作者头像 李华
网站建设 2026/5/9 23:27:51

从ELIZA到ChatGPT:生成式AI聊天机器人的技术演进与核心突破

1. 项目概述:一场跨越半个世纪的对话革命聊到生成式AI聊天机器人,现在大家脑子里蹦出来的第一个词,多半是“ChatGPT”。它仿佛一夜之间就接管了我们的工作流、学习方式和日常闲聊。但如果你以为这场对话革命是近几年才开始的,那就…

作者头像 李华