news 2026/1/23 17:44:11

TPAMI 2025 | 从傅里叶域到空间域:FUPS-Net实现未校准光度立体立体视觉全局-局部特征最优融合

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
TPAMI 2025 | 从傅里叶域到空间域:FUPS-Net实现未校准光度立体立体视觉全局-局部特征最优融合
点击上方“小白学视觉”,选择加"星标"或“置顶” 重磅干货,第一时间送达

在计算机视觉视觉领域,光度立体光度立体视觉技术一直是三维重建的重要手段。然而,传统方法在处理未知光照条件下的非朗伯物体时,往往面临着精度与效率难以兼顾的困境。近期,一篇发表于TPAMI 2025的论文《Revisiting One-stage Deep Uncalibrated Photometric Stereo via Fourier Embedding》提出了创新性的解决方案,让我们一起来深入探究竟!

论文信息

题目:Revisiting One-stage Deep Uncalibrated Photometric Stereo via Fourier Embedding
基于傅里叶嵌入重新审视单阶段深度未校准光度立体视觉
作者:Yakun Ju, Boxin Shi, Bihan Wen, Kin-Man Lam, Xudong Jiang, Alex C. Kot
源码:https://github.com/Kelvin-Ju/FUPS-Net

研究背景:未校准光度立体视觉的挑战

光度立体视觉(PS)通过分析不同光照条件下物体的阴影变化来恢复表面法线,在文物数字化、工业检测等领域应用广泛。传统校准方法需要精确的光照方向信息,这在实际场景中往往难以获取。而未校准光度立体视觉(UPS)虽无需光照信息,却长期受困于"几何-光照模糊性"难题。

现有深度学习方法多采用两阶段策略:先估计光照方向,再预测表面法线。这种方式存在明显缺陷:

  • 光照估计误差会累积到法线预测阶段

  • 需将连续续光照方向离散化为分类问题,损失精度

  • 两阶段网络训练复杂,耗时且不稳定

核心创新:傅里叶域的光照与几何分离

论文的突破性发现源于对傅里叶变换的深刻洞察:在傅里叶域中,光度立体图像的光照信息主要编码在幅度谱中,而几何信息主要体现在相位谱中。这一发现为单阶段端到端解决方案奠定了基础。

傅里叶域特征分离示意图

如图所示,交换不同光照图像的相位谱,合成图像仍保持原始光照特性;而交换不同物体的相位谱,则会得到对应物体的几何形状。这一现象验证了傅里叶域中光照与几何信息的可分离性。

方法架构:FUPS-Net的整体设计

研究者提出的傅里叶未校准光度立体网络(FUPS-Net)采用单阶段双分支结构,无需显式估计光照方向,直接从多幅图像中回归表面法线。

FUPS-Net总体结构图

网络主要包含三个核心模块:

1. 傅里叶嵌入提取(FEE)模块

该模块实现傅里叶域与空间域的特征交互:

  • 将输入图像通过DFT分解为幅度和相位分量

  • 分别对频率域和空间域特征进行卷积处理

  • 设计特征交互机制,实现全局频率信息与局部空间信息的融合

  • 采用残差连接增强特征表示能力

FEE模块结构

2. 傅里叶嵌入聚合(FEA)模块

针对可变数量的输入图像,该模块:

  • 结合辅助分支的全局特征,增强信息融合

  • 对多幅图像的幅度和相位特征分别聚合

  • 采用多头注意力池化(MAP)替代传统最大池化,保留更全面的特征分布

  • 通过IDFT将聚合的频率特征转换回空间域

3. 频率-空间加权(FSW)模块

该模块自适应融合全局与局部特征:

  • 计算归一化高频(NHF)图作为权重指导

  • 在平坦区域侧重局部空间特征

  • 在阴影、高光等复杂区域增强全局频率特征的影响

  • 通过动态加权实现两种特征的最优组合

FSW模块权重机制

实验验证:性能与效率的双重突破

在DiLiGenT等多个基准数据集上的实验表明,FUPS-Net实现了显著突破:

1. 消融实验验证模块有效性

消融实验结果

对比实验证明:

  • 傅里叶域特征对性能提升至关重要(MAE降低1.45°)

  • 频率-空间交互机制显著优于单独处理

  • FSW模块在复杂结构物体上表现尤为突出

2. 基准测试超越现有方法

可视化结果对比

在DiLiGenT数据集上:

  • 平均角度误差(MAE)优于主流未校准方法

  • 与部分校准方法性能相当

  • 在镜面反射、投射阴影区域表现优异

3. 效率优势明显

  • 单阶段端到端训练,无需分阶段优化

  • 测试速度比神经逆渲染方法快约90倍

  • 训练时间仅为两阶段方法的一半

总结与展望

FUPS-Net通过傅里叶嵌入技术,首次实现了单阶段端到端的未校准光度立体视觉解决方案,其创新点包括:

  1. 揭示傅里叶域中光照与几何信息的分离特性

  2. 设计FEE和FEA模块实现隐式光照学习

  3. 提出FSW模块动态融合全局与局部特征

该研究不仅为未校准光度立体视觉提供了新范式,也为其他需要处理光照与几何耦合问题的视觉任务提供了重要启示。未来,结合更先进的频率域处理技术,有望在复杂真实场景中实现更高精度的三维重建。

下载1:OpenCV-Contrib扩展模块中文版教程 在「小白学视觉」公众号后台回复:扩展模块中文教程,即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。 下载2:Python视觉实战项目52讲 在「小白学视觉」公众号后台回复:Python视觉实战项目,即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。 下载3:人工智能0基础学习攻略手册 在「小白学视觉」公众号后台回复:攻略手册,即可获取《从 0 入门人工智能学习攻略手册》文档,包含视频课件、习题、电子书、代码、数据等人工智能学习相关资源,可以下载离线学习。 交流群 欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2025/12/31 16:54:07

Whistle网络调试抓包分析终极指南:快速上手跨平台调试工具

Whistle网络调试抓包分析终极指南:快速上手跨平台调试工具 【免费下载链接】whistle-client HTTP, HTTP2, HTTPS, Websocket debugging proxy client 项目地址: https://gitcode.com/gh_mirrors/wh/whistle-client 在当今复杂的网络应用开发环境中&#xff0…

作者头像 李华
网站建设 2026/1/17 0:00:02

HoRain云--Linux目录管理及文件移动全指南

🎬 HoRain 云小助手:个人主页 ⛺️生活的理想,就是为了理想的生活! ⛳️ 推荐 前些天发现了一个超棒的服务器购买网站,性价比超高,大内存超划算!忍不住分享一下给大家。点击跳转到网站。 目录 ⛳️ 推荐 …

作者头像 李华
网站建设 2025/12/16 9:28:39

旅游网|基于Java + vue旅游网系统(源码+数据库+文档)

旅游网系统 目录 基于springboot vue旅游网系统 一、前言 二、系统功能演示 三、技术选型 四、其他项目参考 五、代码参考 六、测试参考 七、最新计算机毕设选题推荐 八、源码获取: 基于springboot vue旅游网系统 一、前言 博主介绍:✌️大厂…

作者头像 李华
网站建设 2026/1/18 7:54:28

健身房预约|基于java+ vue健身房预约小程序系统(源码+数据库+文档)

健身房预约小程序 目录 基于springboot vue健身房预约小程序系统 一、前言 二、系统功能演示 三、技术选型 四、其他项目参考 五、代码参考 六、测试参考 七、最新计算机毕设选题推荐 八、源码获取: 基于springboot vue健身房预约小程序系统 一、前言 博…

作者头像 李华
网站建设 2025/12/16 9:26:46

AdGuard Home配置优化指南:构建高效DNS服务器的网络优化实践

AdGuard Home作为一款功能强大的网络级DNS服务器,能够有效拦截广告和追踪程序,提升网络体验。本文将从五个核心配置维度出发,提供详细的实践指南和问题规避策略,帮助用户构建稳定高效的DNS服务环境。 【免费下载链接】AdGuardHome…

作者头像 李华