news 2026/5/4 4:59:21

【TVM教程】Vulkan 运行时

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【TVM教程】Vulkan 运行时

TVM 现已更新到 0.21.0 版本,TVM 中文文档已经和新版本对齐。

Apache TVM 是一个深度的深度学习编译框架,适用于 CPU、GPU 和各种机器学习加速芯片。更多 TVM 中文文档可访问 →Apache TVM

TVM 支持使用 Vulkan 计算着色器来执行任务。 每个计算内核都会被编译成一个 SPIR-V 着色器,然后可通过 TVM 接口进行调用。

Vulkan 功能与限制

由于不同的 Vulkan 实现可能启用了不同的可选特性,或具有不同的物理限制, 代码生成必须了解可用的特性。这些特性对应于特定的 Vulkan 能力与限制,如Vulkan Capabilities Table <tvm-table-vulkan-capabilities>{.interpreted-text role=“ref”} 所示。 若未指定,TVM 会假定该能力不可用,或该限制为 Vulkan 规范中 Required Limits 一节所定义的最小保证值。

这些参数既可以在定义Target <tvm-target-specific-target>{.interpreted-text role=“ref”} 时显式指定, 也可以从设备中查询。若要从设备查询,可使用特殊参数-from_device=N,以从设备 IDN查询所有 Vulkan 参数。 任何额外显式指定的参数将覆盖从设备查询到的参数。

参数名称(Target Parameter)所需 Vulkan 版本/扩展查询的 Vulkan 参数结构体字段默认值
supported_subgroup_operations(支持的子群操作)Vulkan 1.1+VkPhysicalDeviceSubgroupProperties::supportedOperations0(对应子群特性标志位 VkSubgroupFeatureFlagBits)
max_push_constants_size(最大 Push 常量大小)VkPhysicalDeviceLimits::maxPushConstantsSize128 字节
max_uniform_buffer_range(最大 Uniform Buffer 范围)VkPhysicalDeviceLimits::maxUniformBufferRange16384 字节
max_storage_buffer_range(最大 Storage Buffer 范围)VkPhysicalDeviceLimits::maxStorageBufferRange2^27 字节
max_per_stage_descriptor_storage_buffer(每阶段可用 Storage Buffer 描述符数量)VkPhysicalDeviceLimits::maxPerStageDescriptorStorageBuffers4
supports_storage_buffer_storage_class(支持 Storage Buffer 类型)VK_KHR_storage_buffer_storage_class(无需查询,取决于扩展是否启用)false
supports_storage_buffer_8bit_access(支持 8 位 Storage Buffer 访问)VK_KHR_8bit_storageVkPhysicalDevice8BitStorageFeaturesKHR::storageBuffer8BitAccessfalse
supports_storage_buffer_16bit_access(支持 16 位 Storage Buffer 访问)VK_KHR_16bit_storageVkPhysicalDevice16BitStorageFeaturesKHR::storageBuffer16BitAccessfalse
supports_float16(支持 float16 浮点类型)VK_KHR_shader_float16_int8VkPhysicalDeviceShaderFloat16Int8FeaturesKHR::shaderFloat16false
supports_float64(支持 float64 浮点类型)VkPhysicalDeviceFeatures::shaderFloat64false
supports_int8(支持 int8 类型)VK_KHR_shader_float16_int8VkPhysicalDeviceShaderFloat16Int8FeaturesKHR::shaderInt8false
supports_int16(支持 int16 类型)VkPhysicalDeviceFeatures::shaderInt16false
supports_int64(支持 int64 类型)VkPhysicalDeviceFeatures::shaderInt64false

截至 2021 年 5 月,并非所有 Vulkan 实现都受到支持。 例如,需要支持 64 位整数。若 Vulkan 目标不受支持, 在生成 SPIR-V 代码时将会报错。 目前也在努力消除此类限制,以支持更多 Vulkan 实现。

SPIR-V 功能

某些设备特性也对应于 SPIR-V 的功能或扩展,必须在着色器中声明,或要求使用最低版本的 SPIR-V。 TVM 生成的着色器会声明执行所需的最小扩展、功能以及最低 SPIR-V 版本。

如果着色器生成需要的能力或扩展在Target中未启用,将会抛出异常。

参数名称(Target Parameter)所需 SPIR-V 版本/扩展声明的功能(Capability)
supported_subgroup_operations(支持的子群操作)SPIR-V 1.3+视具体子群特性而定(参考 VkSubgroupFeatureFlagBits)
supports_storage_buffer_storage_class(支持 Storage Buffer 类)SPV_KHR_storage_buffer_storage_class(使用该扩展隐式启用)
supports_storage_buffer_8bit_access(支持 8 位存储缓冲访问)SPV_KHR_8bit_storageStorageBuffer8BitAccess
supports_storage_buffer_16bit_access(支持 16 位存储缓冲访问)SPV_KHR_16bit_storageStorageBuffer16BitAccess
supports_float16(支持 Float16 浮点类型)Float16
supports_float64(支持 Float64 浮点类型)Float64
supports_int8(支持 Int8 类型)Int8
supports_int16(支持 Int16 类型)Int16
supports_int64(支持 Int64 类型)Int64

Vulkan 特定环境变量

SPIR-V 代码生成器和 Vulkan 运行时均可通过环境变量修改部分运行时行为。 这些变量主要用于调试,以便更轻松地测试特定代码路径或输出更多信息。 所有布尔类型变量在设置为非零整数时视为"真"。 未设置、设为 0 或空字符串时,视为"假"。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/1 7:01:15

STM32CubeMX打不开全解析:适合新手的系统学习

STM32CubeMX打不开&#xff1f;别慌&#xff0c;带你从零排查每一个细节 你是不是也遇到过这种情况&#xff1a;兴冲冲下载好STM32CubeMX&#xff0c;双击图标准备开始你的嵌入式开发之旅&#xff0c;结果—— 什么都没发生 。 没有窗口、没有提示、任务管理器里进程一闪而…

作者头像 李华
网站建设 2026/5/3 8:04:43

AnimeGANv2商业授权说明:企业使用合规部署指南

AnimeGANv2商业授权说明&#xff1a;企业使用合规部署指南 1. 引言 随着AI技术的快速发展&#xff0c;风格迁移在图像处理领域的应用日益广泛。AnimeGANv2作为一款轻量高效的照片转二次元动漫模型&#xff0c;凭借其出色的画质表现和低资源消耗&#xff0c;已被广泛应用于个人…

作者头像 李华
网站建设 2026/5/3 8:13:35

开源TTS新选择:VibeVoice长文本语音合成入门必看

开源TTS新选择&#xff1a;VibeVoice长文本语音合成入门必看 1. 技术背景与核心挑战 在当前人工智能语音合成领域&#xff0c;长文本、多说话人场景的应用需求日益增长。传统文本转语音&#xff08;TTS&#xff09;系统虽然在单人短句合成上表现优异&#xff0c;但在处理长篇…

作者头像 李华
网站建设 2026/5/1 11:17:51

完全二叉树在任务调度系统中的应用实例

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容&#xff1a; 生成一个基于完全二叉树的任务调度系统代码示例&#xff0c;要求&#xff1a;1. 使用完全二叉树实现任务优先级队列&#xff1b;2. 支持任务动态添加和删除&#xff1b;3. 提供任务…

作者头像 李华