news 2026/3/26 11:44:53

即插即用系列(代码实践) | CVPR 2025 WPFormer:小波与原型增强Transformer——表面缺陷检测SOTA,专治弱缺陷与杂乱背景

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
即插即用系列(代码实践) | CVPR 2025 WPFormer:小波与原型增强Transformer——表面缺陷检测SOTA,专治弱缺陷与杂乱背景

论文题目:Wavelet and Prototype Augmented Query-based Transformer for Pixel-level Surface Defect Detection

中文题目:用于像素级表面缺陷检测的小波与原型增强基于查询的 Transformer
应用任务:表面缺陷检测 (Surface Defect Detection)、工业异常检测、语义分割

论文原文 (Paper):https://openaccess.thecvf.com/content/CVPR2025/html/Yan_Wavelet_and_Prototype_Augmented_Query-based_Transformer_for_Pixel-level_Surface_Defect_CVPR_2025_paper.html
代码 (code):https://github.com/iefengyan/WPFormer

摘要
本文提取自CVPR 2024顶会论文《Wavelet and Prototype Augmented Query-based Transformer for Pixel-level Surface Defect Detection》。针对工业场景中微弱缺陷(Weak Defects)难以识别以及杂乱背景(Cluttered Backgrounds)干扰严重的痛点,复现了其核心组件——WPFormer中的WCAPCA模块。该架构创新性地将**小波变换(Wavelet Transform)引入 Transformer 的注意力机制中,利用频域信息分离噪声与边缘,同时利用原型(Prototype)**引导查询,实现了像素级的精准缺陷定位。


目录

    • 第一部分:模块原理与实战分析
      • 1. 论文背景与解决的痛点
      • 2. 核心模块原理揭秘
      • 3. 架构图解
      • 4. 适用场景与魔改建议
    • 第二部分:核心完整代码
    • 第三部分:结果验证与总结

第一部分:模块原理与实战分析

1. 论文背景与解决的痛点

在工业视觉检测中,我们经常面临两个极端难题:

  • 隐形杀手(弱缺陷):很多划痕、裂纹对比度极低,和背景几乎融为一体,普通的 CNN 或 Transformer 根本“看”不见。
  • 由于背景太花(杂乱背景):工业表面往往有复杂的纹理(如织物、金属拉丝),这些纹理在特征提取时会被误判为缺陷,导致大量虚警(False Positive)。

痛点总结:现有的 Query-based 方法(如 Mask2Former)虽然强,但缺乏对频率信息类别语义中心的显式建模,导致在困难样本上表现不佳。

2. 核心模块原理揭秘

WPFormer 提出了D2T Decoder (Dual-domain Two-stage Decoder),其中包含两个核心注意力模块。我已将其封装为即插即用的 PyTorch 类:

  • WCA (Wavelet-enhanced Cross-Attention) - 小波增强交叉注意力

  • 核心逻辑:利用离散小波变换 (DWT)将特征图分解为低频(LL)和

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/14 16:57:50

一键生成惊艳效果:美胸-年美模型真实案例展示

一键生成惊艳效果:美胸-年美模型真实案例展示 1. 模型能力概览 美胸-年美-造相Z-Turbo镜像基于Z-Image-Turbo架构,专为高质量图像生成场景优化。该模型并非通用文生图工具,而是针对特定视觉风格进行深度调优的定制化方案。从技术实现角度看&a…

作者头像 李华
网站建设 2026/3/15 10:20:01

InternLM2-Chat-1.8B效果展示:中文建筑图纸说明解析+施工要点提炼

InternLM2-Chat-1.8B效果展示:中文建筑图纸说明解析施工要点提炼 今天我们来聊聊一个特别实用的场景:让AI帮你“看懂”建筑图纸。想象一下,你拿到一份复杂的建筑施工图,上面密密麻麻的标注和说明,要快速理解设计意图、…

作者头像 李华
网站建设 2026/3/15 19:38:34

AI原生SaaS应用的模型监控告警系统

AI原生SaaS应用的模型监控告警系统:从搭建到优化的完整指南 摘要 当你花费数月训练的AI模型终于上线成SaaS产品,看着用户量稳步增长时,突然收到一堆投诉:“推荐的商品根本不是我想要的!” “风控系统误封了我的账号&am…

作者头像 李华
网站建设 2026/3/15 13:04:26

手把手教你用DeerFlow进行自动化研究

手把手教你用DeerFlow进行自动化研究 你是否曾为写一份深度研究报告而反复搜索、整理资料、验证数据,耗费数天却仍难覆盖关键信息?是否希望有一个能自动联网查资料、执行代码分析、生成结构化报告,甚至把结论变成播客的“研究搭档”&#xf…

作者头像 李华
网站建设 2026/3/20 9:36:56

Z-Image-Turbo实战:用Jimeng AI Studio轻松创作高清图片

Z-Image-Turbo实战:用Jimeng AI Studio轻松创作高清图片 1. 开篇:让AI帮你实现创意视觉表达 你是否曾经遇到过这样的场景:脑子里有个绝妙的创意画面,却苦于没有专业的设计技能来实现?或者需要为产品制作宣传图&#…

作者头像 李华
网站建设 2026/3/15 13:14:53

OFA图像语义蕴含模型实战分享:图片内容推理技巧大全

OFA图像语义蕴含模型实战分享:图片内容推理技巧大全 1. 引言:当AI学会“看图说话”与“逻辑推理” 你有没有想过,让AI不仅看懂一张图片里有什么,还能判断一段文字描述是否与图片内容相符?比如,你给AI看一…

作者头像 李华