YOLO26改进策略【Backbone/主干网络】| CVPR 2024 替换骨干网络为 RMT，增强空间信息的感知能力-开发者社区

一、本文介绍

本文记录的是将RMT应用于YOLO26骨干网络的改进方法研究。

RMT通过构建基于曼哈顿距离的空间衰减矩阵，引入显式空间先验，同时提出新的注意力分解形式，在不破坏空间衰减矩阵的前提下，以线性复杂度对全局信息进行稀疏建模。将RMT融入YOLO26的骨干网络，能够有效提升其对图像空间信息的感知能力，在减少计算量的同时增强特征提取效果，进而提高YOLO26在各项任务中的准确性与效率。

在YOLO26的基础上配置了原论文中RMT_T，RMT_S，RMT_B,RMT_L四种模型，以满足不同的需求。

文章目录

一、本文介绍
二、RMT原理介绍
- 2.1 出发点
- 2.2 结构原理
- 2.3 优势
三、RMT的实现代码
四、修改步骤
- 4.1 修改一
- 4.2 修改二
- 4.3 修改三
五、yaml模型文件
- 5.1 模型改进⭐
六、成功运行结果

二、RMT原理介绍

RMT:Retentive Networks Meet Vision Transformers

RMT模型是一种具有显式空间先验的视觉骨干网络，旨在解决Vision Transformer（ViT）中自注意力机制存在的问题。其结构设计的出发点、原理和优势如下：

2.1 出发点

ViT中的自注意力机制缺乏显式空间先验，且在对全局信息建模时具有二次计算复杂度，限制了ViT的应用。为缓解这些问题，作者从自然语言处理领域的Retentive Network（RetNet）中汲取灵感，提出RMT模型。

2.2 结构原理

Manhattan Self - Attention（MaSA）：将RetNet中的单向一维时间衰减扩展为双向二维空间衰减，基于曼哈顿距离引入显式空间先验

【实测有效】5款AI降重神器深度测评，告别AIGC高疑似率，轻松通过检测！

交论文前最怕什么？肯定不是内容深度不够，而是辛辛苦苦用AI辅助完成的稿件，查重的时候却被标出一片红，AIGC率直接爆表？！看着电脑上超高的“AIGC疑似率”真是不知所措，于是开始手动降AI&#xff0…

李华

删除某一个大表中的大部分数据

场景要删除表T中的大部分数据，因表太大，删除慢，得到另一种更加快速方法方法 -- 1. 创建新表（保留不需要删除的数据） CREATE TABLE T_new LIKE T;-- 2. 插入保留数据（假设需保留imei不在列表中的数据&…

李华

“改Prompt靠猜，上线靠反馈“终结者！AI Agent评估全攻略，让迭代效率翻倍

做 Agent 开发的同学大概率都有过这样的经历：优化了一轮提示词，本地测试几个场景都顺风顺水，结果上线后用户吐槽 “不如之前好用”。想验证是真的性能退化还是个别案例的噪声，却只能靠手动复现，既耗时又无法覆盖全场…

李华

大模型应用监控不内卷！Java Agent带你躺平实现无侵入监控

应用场景 APM：应用性能监控。如 SkyWalking、OpenTelemetry 等通过 Agent 插桩收集调用链、耗时等代码覆盖率工具：如 JaCoCo 在测试时注入探针统计覆盖情况热部署 / 热更新：如 JRebel 利用 Agent 修改类定义实现无需重启生效安全审计 / 日志…

李华

YOLO26改进策略【Backbone/主干网络】| CVPR 2024 替换骨干网络为 RMT，增强空间信息的感知能力