news 2026/4/15 13:43:54

分享一个占用单片机2K内存就能跑的AI模型

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
分享一个占用单片机2K内存就能跑的AI模型

关注+星标公众,不错过精彩内容

作者 | strongerHuang

微信公众号 | strongerHuang

这些年随着ChatGPT、DeepSeek的火爆,AI已经遍布工作和生活的各个角落,嵌入式端侧AI也逐渐发展起来了。

今天就来分享一个只要占用单片机2KB内存就能运行的的嵌入式AI模型:uTensor。

关于 uTensor 模型

uTensor 是一个基于 Tensorflow 构建的极其轻量级的机器学习推理框架,并针对 Arm 处理器进行了优化。它由一个运行时库和一个处理大部分模型转换工作的离线工具组成。

模型地址:

https://github.com/uTensor/uTensor

此存储库包含核心运行时和运算符、内存管理器、调度器等的一些示例实现,核心运行时的大小仅为:2KB

uTensor只需要2KB内存的轻量化设计特点,就是实现了极致压缩:将TensorFlow模型转换为.cpp、.hpp源代码,消除冗余依赖。同时,预分配内存区域,杜绝运行时内存的泄漏。

实测核心运行时和基础算子的总代码量仅2KB,相当于一张图片的1/1000.

uTensor 工作原理

uTensor 工作原理大致如下图所示:

在 Tensorflow 中构建和训练模型,uTensor 获取模型并生成 .cpp 和 .hpp 源文件。这些文件包含生成的推理所需的 C++代码,只需要把生成的源文件复制到你的嵌入式项目中即可,实现过程非常简单。

uTensor 运行时由两个主要组件组成:

  • uTensor Core:其中包含满足 uTensor 性能运行时契约所需的基本数据结构、接口和类型等。

  • uTensor 库:作为一系列基于 uTensor Core 构建的默认实现。

构建系统分别编译这两个组件,使用户能够轻松扩展和覆盖构建在 uTensor 核心之上的实现,例如自定义内存管理器、张量、运算符和错误处理程序。

错误处理程序:

SimpleErrorHandler errH(50); // Maintain a history of 50 eventsContext::get_default_context()->set_ErrorHandler(&errH);...// A bunch of allocations... // Check to make sure a rebalance has occurred inside our allocatorbool has_rebalanced = std::find(errH.begin(), errH.end(), localCircularArenaAllocatorRebalancingEvent()) != errH.end();

Tensor 读写接口:

uint8_t myBuffer[4] = { 0xde, 0xad, 0xbe, 0xef };Tensor mTensor = new BufferTensor({2,2}, u8, myBuffer); // define a 2x2 tensor of uint8_ts uint8_t a1 = mTensor(0,0); // implicitly casts the memory referenced at this index to a uint8_tprintf("0x%hhx\n", a1); // prints 0xde uint16_t a2 = mTensor(0,0); // implicitly casts the memory referenced at this index to a uint16_tprintf("0x%hx\n", a2); // prints 0xdead uint32_t a3 = mTensor(0,0); // implicitly casts the memory referenced at this index to a uint32_tprintf("0x%x\n", a3); // prints 0xdeadbeef // You can also write and read values with explicit casting and get similar behaviormTensor(0,0) = static_cast<uint8_t>(0xFF);printf("0xhhx\n", static_cast<uint8_t>(mTensor(0,0)));

出于性能原因,各种 Tensor 读/写接口更像缓冲区,而不是成熟的 C++ 类型化对象,尽管高级接口本质上看起来非常 Pythonic 。实际的读取和写入取决于用户如何转换此缓冲区。

uTensor 构建、运行和测试

官方给出了 uTensor 构建、运行和测试的一些方法。

比如在本地构建和测试:

gitclone git@github.com:uTensor/uTensor.gitcduTensor/gitcheckout proposal/rearchgitsubmodule initgitsubmodule updatemkdirbuildcdbuild/cmake-DPACKAGE_TESTS=ON -DCMAKE_BUILD_TYPE=Debug ..makemaketest

在 Arm Mbed OS 上构建和运行:

mbednew my_projectcdmy_projectmbedimport https://github.com/uTensor/uTensor.git# Create main file# Run uTensor-cli workflow and copy model directory herembedcompile # as normal

还有在在Arm 系统上构建和运行:

mkdir build && cd buildcmake -DCMAKE_BUILD_TYPE=Debug -DCMAKE_TOOLCHAIN_FILE=../extern/CMSIS_5/CMSIS/DSP/gcc.cmake .. //使用 CMSIS 优化内核mkdir build && cd buildcmake -DARM_PROJECT=1 -DCMAKE_BUILD_TYPE=Debug -DCMAKE_TOOLCHAIN_FILE=../extern/CMSIS_5/CMSIS/DSP/gcc.cmake ..

以上只是提供了一些参考和思路,实现的具体细节,需要大家进一步结合 uTensor 模型进行优化。

------------END------------


●专栏《嵌入式工具

●专栏《嵌入式开发》

●专栏《Keil教程》

●嵌入式专栏精选教程

关注公众号回复“加群”按规则加入技术交流群,回复“1024”查看更多内容。

点击“阅读原文”查看更多分享。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/3 6:39:06

Orin十年演进

下面这份内容&#xff0c;不是 NVIDIA 产品路线图复述&#xff0c;也不是算力参数对比&#xff0c;而是站在Orin 作为“一代自动驾驶/机器人计算平台的代表性节点”的高度&#xff0c;对它在未来十年中的角色演进与历史定位做一次结构性判断。&#x1f9e0;⚙️ Orin 十年演进&…

作者头像 李华
网站建设 2026/4/10 5:15:32

车联网十年演进

下面这份内容&#xff0c;不是“V2X 技术白皮书”&#xff0c;也不是通信协议时间线&#xff0c;而是站在**“车联网作为智能交通与自动驾驶的社会级基础设施”视角&#xff0c;对未来十年的一次结构性演进判断**。&#x1f310;&#x1f697; 车联网十年演进&#xff08;2025–…

作者头像 李华
网站建设 2026/4/13 7:37:20

车规级芯片十年演进

下面这份内容&#xff0c;不是芯片参数对比&#xff0c;也不是厂商 Roadmap&#xff0c;而是站在 “车规级芯片作为智能汽车系统底座”的高度&#xff0c;对未来十年的一次结构性演进判断。&#x1f9e0;&#x1f697; 车规级芯片十年演进&#xff08;2025–2035&#xff09; 一…

作者头像 李华
网站建设 2026/4/14 9:26:50

LLVM后端入门9:JIT支持

目标机器的实现可以选择性地包含一个即时(JIT)代码生成器,该生成器会将机器码和辅助结构作为二进制输出进行生成,这些输出可直接写入内存。要实现这一点,可通过执行以下步骤来实现 JIT 代码生成: 编写 XXXCodeEmitter.cpp 文件,其中包含一个机器函数 pass,用于将目标机…

作者头像 李华
网站建设 2026/4/11 22:22:51

系统软件缺少comct332.ocx无法启动 免费下载方法分享

在使用电脑系统时经常会出现丢失找不到某些文件的情况&#xff0c;由于很多常用软件都是采用 Microsoft Visual Studio 编写的&#xff0c;所以这类软件的运行需要依赖微软Visual C运行库&#xff0c;比如像 QQ、迅雷、Adobe 软件等等&#xff0c;如果没有安装VC运行库或者安装…

作者头像 李华
网站建设 2026/4/14 23:08:00

你不是在和AI竞争,你是在和“不用AI的自己”

导言&#xff1a;被误读的竞争关系 凌晨三点的告警邮件、重复的冒烟测试、永无止境的回归用例...当ChatGPT写出第一条测试脚本时&#xff0c;测试圈掀起海啸式恐慌。但真正需要警惕的并非AI&#xff0c;而是我们面对技术变革时固化的思维模式——软件测试的竞争本质&#xff0…

作者头像 李华