news 2026/2/27 0:57:22

YOLO26最新创新改进系列:双卷积核(DualConv)结合了 3×3 和 1×1 卷积核来同时处理相同的输入特征图通道,旨在构建轻量级深度神经网络,目标检测YOLO有效涨点神器!!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
YOLO26最新创新改进系列:双卷积核(DualConv)结合了 3×3 和 1×1 卷积核来同时处理相同的输入特征图通道,旨在构建轻量级深度神经网络,目标检测YOLO有效涨点神器!!

YOLO26最新创新改进系列:双卷积核(DualConv)结合了 3×3 和 1×1 卷积核来同时处理相同的输入特征图通道,旨在构建轻量级深度神经网络,目标检测YOLO有效涨点神器!!

购买相关资料后畅享一对一答疑

畅享超多免费持续更新且可大幅度提升文章档次的纯干货工具!见文末!

详细的改进教程以及源码,戳这!戳这!!戳这!!!B站:AI学术叫叫兽 动态第一条置顶动态中有直达链接,感谢支持!祝各位科研人硕果累累!!!

DualConv: Dual Convolutional Kernels for
Lightweight Deep Neural Networks(提出原文戳这)

详细的改进教程以及源码,戳这!戳这!!戳这!!!B站:AI学术叫叫兽 源码在相簿的链接中,动态中也有链接,感谢支持!祝科研遥遥领先!

一、摘要

CNN 架构通常对内存和计算要求很高,这使得它们对于硬件资源有限的嵌入式系统不可行。 我们提出双卷积核(DualConv)来构建轻量级深度神经网络。 DualConv 结合了 3×3 和 1×1 卷积核来同时处理相同的输入特征图通道,并利用组卷积技术来有效地排列卷积滤波器。 DualConv 可用于任何 CNN 模型,例如用于图像分类的 VGG-16 和 ResNet-50、用于对象检测的 YOLO 和 R-CNN 或用于语义分割的 FCN。 在本文中,我们广泛测试了 DualConv 的分类功能,因为这些网络架构构成了许多其他任务的骨干。 我们还在 YOLO-V3 上测试了 DualConv 的图像检测功能。 实验结果表明,结合我们的结构创新,DualConv 显着降低了深度神经网络的计算成本和参数数量,同时在某些情况下令人惊讶地实现了比原始模型略高的精度。 我们使用 DualConv 将轻量级 MobileNetV2 的参数数量进一步减少了 54%,而在 CIFAR-100 数据集上的准确率仅下降了 0.68%。 当参数数量不是问题时,DualConv 在相同数据集上将 MobileNetV1 的准确率提高了 4.11%。 此外,DualConv 显着提高了 YOLO-V3 目标检测速度,并将其在 PASCAL VOC 数据集上的准确率提高了 4.4%。

(a) 标准卷积、(b) 深度可分离卷积、© 组卷积、(d) 异构卷积和 (e) 所提出的双卷积的卷积滤波器设计。 M是输入通道数(即输入特征图的深度),N是卷积滤波器的数量,也是输出通道的数量(即输出特征图的深度),Di是宽度和高度维度 输入特征图的,K×K是卷积核大小,G是组卷积和对偶卷积中的组数,1/P是异构卷积中3×3卷积核的比例。 请注意,异构滤波器以移位的方式排列[18]。

我们提出了 DualConv,它将 3×3 组卷积与 1×1 逐点卷积相结合,解决了跨通道通信和原始输入特征图中信息保存的问题。 与 HetConv 相比,DualConv 通过添加最少的参数来提高网络性能。 DualConv应用于常见的网络结构来执行图像分类和目标检测。 通过比较标准卷积和 DualConv 的实验结果,证明了所提出的 DualConv 的有效性和效率。 从实验结果可以看出,DualConv 可以集成在标准网络架构和轻量级网络架构中,以提高网络精度并减少网络参数、计算成本和推理时间。 我们还证明了 DualConv 可以很好地适应各种图像数据集,并具有很强的泛化能力。 未来的研究工作将集中在嵌入式设备上的部署,以进一步证明 DualConv 在实际应用中的效率。

跑出结果后-相关方法详情请结合B站视频阅读全文,融入自己文章中!!!

二、 修改步骤!

2.1 修改YAML文件

详细的改进教程以及源码,戳这!戳这!!戳这!!!B站:AI学术叫叫兽 源码在相簿的链接中,动态中也有链接,感谢支持!祝科研遥遥领先!

2.2 新建.py

详细的改进教程以及源码,戳这!戳这!!戳这!!!B站:AI学术叫叫兽er 源码在相簿的链接中,动态中也有链接,感谢支持!祝科研遥遥领先!

2.3 修改tasks.py

详细的改进教程以及源码,戳这!戳这!!戳这!!!B站:AI学术叫叫兽er 源码在相簿的链接中,动态中也有链接,感谢支持!祝科研遥遥领先!

三、验证是否成功即可

执行命令

python train.py

改完收工!
关注B站:Ai学术叫叫兽er
从此走上科研快速路
遥遥领先同行!!!!

写在最后

学术因方向、个人实验和写作能力以及具体创新内容的不同而无法做到一通百通,所以本文作者即B站Up主:Ai学术叫叫兽
在所有B站资料中留下联系方式以便在科研之余为家人们答疑解惑,本up主获得过国奖,发表多篇SCI,擅长目标检测领域,拥有多项竞赛经历,拥有软件著作权,核心期刊等经历。
因为经历过所以更懂小白的痛苦!
因为经历过所以更具有指向性的指导!

祝所有科研工作者都能够在自己的领域上更上一层楼!

所有科研参考资料均可点击此链接,合适的才是最好的,希望我的能力配上你的努力刚好合适!

以下为给大家庭小伙伴们免费更新过的绘图代码,均配有详细教程,超小白也可一键操作! 后续更多提升文章档次的资料的更新请大家庭的小伙伴关注我B站及抖音:Ai学术叫叫兽!

所有科研参考资料均可点击此链接,合适的才是最好的,希望我的能力配上你的努力刚好合适!



所有科研参考资料均可点击此链接,合适的才是最好的,希望我的能力配上你的努力刚好合适!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/26 2:42:41

监控显存使用:nvidia-smi配合Live Avatar实战

监控显存使用:nvidia-smi配合Live Avatar实战 1. 为什么显存监控是Live Avatar运行的生命线 Live Avatar不是普通模型——它是阿里联合高校开源的14B参数级数字人生成系统,能将一张静态人像、一段语音和几句提示词,实时合成高质量动态视频。…

作者头像 李华
网站建设 2026/2/15 3:18:23

从零开始:造相-Z-Image 文生图引擎快速入门与实战

从零开始:造相-Z-Image 文生图引擎快速入门与实战 你有没有试过——输入一句“清晨的咖啡馆,阳光斜照在木质吧台上,一杯拉花拿铁冒着热气”,几秒后,一张光影细腻、质感真实、连杯沿水汽都清晰可见的高清图片就出现在眼…

作者头像 李华
网站建设 2026/2/26 4:52:21

mT5中文增强版应用案例:电商文案自动生成与优化

mT5中文增强版应用案例:电商文案自动生成与优化 1. 引言 你有没有遇到过这样的场景:凌晨两点,运营同事发来一条消息:“明天大促主图文案还没定,能帮忙改五版吗?要突出‘限时’‘稀缺’‘高性价比’&#…

作者头像 李华
网站建设 2026/2/22 4:01:56

驾驭SMUDebugTool:解锁AMD Ryzen处理器潜能的终极指南

驾驭SMUDebugTool:解锁AMD Ryzen处理器潜能的终极指南 【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地址: https://gi…

作者头像 李华
网站建设 2026/2/15 19:01:32

快速理解TC3中I2C中断使能与优先级设置

以下是对您提供的博文内容进行 深度润色与结构重构后的专业级技术文章 。全文严格遵循您的所有要求: ✅ 彻底去除AI痕迹,语言自然、真实、有“人味”; ✅ 摒弃模板化标题(如“引言”“总结”),代之以逻辑递进、层层深入的叙事流; ✅ 所有技术点均融合在工程语境中展…

作者头像 李华
网站建设 2026/2/25 2:42:31

FaceRecon-3D实战:手把手教你制作个人3D数字头像

FaceRecon-3D实战:手把手教你制作个人3D数字头像 一张自拍,三秒生成可导入Blender、Unity的3D人脸模型——这不是概念演示,而是你此刻就能在浏览器里完成的操作。 FaceRecon-3D不是又一个“理论上可行”的AI玩具。它把达摩院研发的高精度单图…

作者头像 李华