news 2026/7/3 1:13:02

从频域视角重构空洞卷机

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
从频域视角重构空洞卷机

CVPR FADC:从频域视角重构空洞卷积!

论文原文 :https://arxiv.org/abs/2403.05369
代码:https://github.com/ying-fu/FADC
即插即用代码仓库:https://github.com/AITricks/AITricks
《Frequency-Adaptive Dilated Convolution》,专门解决语义分割中空洞卷积(Dilated Conv)两大痛点:网格伪影和高频丢失。从“频域”入手,效果拔群!
1️⃣ 核心痛点:空洞卷积的“硬伤”
空洞卷积虽然能扩大感受野,但因为采样点不连续,就像用筛子看世界:
网格效应:特征图会出现棋盘格一样的黑洞,导致信息断层。
高频丢失:因为采样太稀疏,物体边缘、纹理这些“高频细节”根本抓不住,分割出来边缘毛毛糙糙。
2️⃣ FADC:频率自适应,按需分配
为了解决这个问题,作者提出了 FADC:
原理:不像传统方法那样全图用一样的膨胀率,而是看人下菜碟。
机制:在边缘/纹理(高频区域),自动缩小膨胀率,密集采样保细节;在平滑背景(低频区域),自动增大膨胀率,稀疏采样抓上下文。
3️⃣ AdaKern:卷积核也能“分频”
普通的卷积核是固定的,容易“偏科”(通常偏向低频)。AdaKern 把它拆解了:
低频分量:负责平滑去噪。
高频分量:负责锐化边缘。
动态重组:根据输入特征,自动调整这两个分量的比例。想抓纹理就多加高频,想去噪就多加低频。
4️⃣ FreqSelect:特征去噪“滤网”
空洞卷积容易产生混叠噪声。FreqSelect 就像一个智能滤镜,它能识别出哪些高频信号是有用的边缘,哪些是讨厌的噪声,然后精准抑制噪声,让特征图更纯净。
5️⃣ 实验结果:涨点实锤
这套“频域组合拳”效果相当能打:
定量指标:在 ADE20K 数据集上,给 DeepLabV3+ 装上 FADC 后,mIoU 直接提升了 1.2% - 1.8%!这在分割领域可是巨大的提升。
视觉效果:看对比图,不仅“网格效应”完全消失了,而且细小物体的边缘切得非常锐利,不再断断续续。
总结:这篇论文的 FADC、AdaKern 都是非常优秀的即插即用模块,特别适合替换 DeepLab、ResNet 里的空洞卷积层,做分割、去噪的同学赶紧试试!
#计算机视觉 #科研 #深度学习 #深度学习与神经网络 #科研日常 #大模型 #频域 #语义分割 #论文 #科研学习

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/7/1 20:40:13

Keil C51软件安装图解说明(适用于Win10)

Keil C51 在 Win10 上安装实战指南:从踩坑到稳定运行的全过程解析 在嵌入式开发的世界里,8051 单片机就像一位“老将”——虽然出身于上世纪八十年代,但凭借其结构简单、成本低廉、功耗可控,在工业控制、智能仪表、家电主控等领域…

作者头像 李华
网站建设 2026/7/1 2:21:13

SONIC_PreData模块中duration单位是秒,务必准确填写

Sonic数字人生成中duration参数的精准控制与工程实践 在AI内容创作领域,一个看似微不足道的配置项,往往决定了最终输出的专业水准。比如,在使用Sonic模型生成“会说话”的数字人视频时,很多人可能不会想到,仅仅因为多填…

作者头像 李华
网站建设 2026/7/1 14:15:17

STM32CubeMX安装图解说明:每一步都有截图参考

从零开始搞定STM32开发:手把手带你装好CubeMX,一步到位不踩坑 你是不是也遇到过这种情况——兴致勃勃想开始STM32项目,结果刚打开官网下载完STM32CubeMX,双击安装包就弹出“ No JVM installation found ”?或者好不…

作者头像 李华
网站建设 2026/7/1 19:29:32

Keil5开发STM32F103前必做:芯片库添加入门讲解

Keil5开发STM32F103前必做:芯片库添加实战全解析 你有没有遇到过这样的情况?刚建好一个Keil工程,写完第一行 #include "stm32f10x.h" ,编译时却弹出“file not found”?或者明明写了 main() 函数&#…

作者头像 李华
网站建设 2026/7/1 2:50:23

三相三线制静止无功发生器(SVG/STATCOM)的Simulink仿真探索

静止无功发生器(SVG/STATCOM),三相三线制,Simulink仿真模型,ip-iq检测法,dq坐标系电流解耦,电压电流双闭环控制系统,SVPWM调制,附参考资料(仅供个人使用) 说明: 配电网线…

作者头像 李华