news 2026/5/31 5:25:07

告别漫长等待:3D生成进入“秒时代”!Apple 重新定义实时视图合成

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
告别漫长等待:3D生成进入“秒时代”!Apple 重新定义实时视图合成

告别漫长等待:3D 生成进入“秒时代”!Apple 重新定义实时视图合成

论文标题:Sharp Monocular View Synthesis in Less Than a Second

👉 一键直达论文

👉Lab4AI 大模型实验室论文阅读

✨ 研究背景

在 AR/VR 及互动照片浏览领域,用户迫切需要能从单张照片快速生成高保真、可交互的 3D 场景 。然而,传统的神经渲染技术(如 NeRF)通常需要多张输入图像和耗时的场景优化过程,难以满足实时交互的需求。

另一方面,虽然现有的扩散模型能实现单图转 3D,但其合成时间往往长达数分钟,且在近距离观察时图像细节不够锐利。因此,如何在极低延迟内生成支持实时渲染、且具备摄影级精细度的 3D 表示,是当前的一大技术痛点。

✨ 核心创新

SHARP(Single-image High-Accuracy Real-time Parallax)采用纯回归框架,通过单一前馈神经网络直接回归出 3D 高斯表示 。其关键技术选择包括:

  • 🔍 端到端架构:设计了一个包含预训练编码器、深度解码器和高斯解码器的网络,能够生成约 120 万个高斯基元。
  • 🔍 有状态的深度调整模块:引入学习型的深度调整模块,在训练中通过解决深度估计的不确定性(如透明或反射表面)来提升合成视角的锐度 。
  • 🔍 优化的损失配置:结合了颜色损失、感知损失(LPIPS)、Gram 矩阵损失以及多种正则化项,在确保图像锐利的同时抑制了常见的视觉伪影。
  • 🔍 自监督微调(SSFT):在真实图像上利用模型生成的伪标签进行进一步微调,增强了模型处理复杂视角效果的能力。

✨ 贡献

SHARP 框架通过单前馈神经网络,1 秒内回归 120 万基元 3D 高斯表示,比扩散模型快三个数量级。零样本测试刷新 SOTA,LPIPS(25-34%)、DISTS(21-43%)降低,图像质量提升;搭载深度调整模块与自监督微调策略,解决单目深度估计模糊,保障视角锐度与保真度。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/30 15:16:05

收藏!字节85万大模型岗刷屏,小白/程序员入局指南

前几天,字节跳动的**“大模型应用工程师”**岗位直接刷爆了技术圈: 应届生直接给到85万年薪期权,资深工程师岗位薪资更是飙至154万!这样的薪资水平,放在整个职场圈都是顶流存在。 但评论区里全是清醒的声音&#xff1a…

作者头像 李华
网站建设 2026/5/30 16:11:23

Windows流媒体服务器终极指南:5分钟快速搭建nginx-rtmp-win32

Windows流媒体服务器终极指南:5分钟快速搭建nginx-rtmp-win32 【免费下载链接】nginx-rtmp-win32 Nginx-rtmp-module Windows builds. 项目地址: https://gitcode.com/gh_mirrors/ng/nginx-rtmp-win32 想要在Windows系统上快速部署专业级的实时流媒体服务吗…

作者头像 李华
网站建设 2026/5/30 16:12:42

LiveSplit从入门到精通:速度跑计时工具的完整实战指南

LiveSplit从入门到精通:速度跑计时工具的完整实战指南 【免费下载链接】LiveSplit A sleek, highly customizable timer for speedrunners. 项目地址: https://gitcode.com/gh_mirrors/li/LiveSplit 在追求游戏极速通关的旅程中,精准的计时记录是…

作者头像 李华
网站建设 2026/5/28 15:09:55

3步搞定漫画翻译:AI智能工具从入门到精通

3步搞定漫画翻译:AI智能工具从入门到精通 【免费下载链接】manga-image-translator Translate manga/image 一键翻译各类图片内文字 https://cotrans.touhou.ai/ 项目地址: https://gitcode.com/gh_mirrors/ma/manga-image-translator 还在为看不懂日文原版漫…

作者头像 李华
网站建设 2026/5/31 2:58:51

为什么顶尖开发者都在本地部署Open-AutoGLM?真相终于曝光

第一章:Open-AutoGLM本地部署的行业趋势与价值随着企业对数据隐私和模型可控性的要求日益提升,大语言模型的本地化部署正成为AI落地的关键路径。Open-AutoGLM作为开源的自动化生成语言模型,其本地部署不仅满足了金融、医疗、政务等高敏感行业…

作者头像 李华
网站建设 2026/5/30 16:10:42

Notepadqq:Linux平台轻量级代码编辑器的完美选择

Notepadqq:Linux平台轻量级代码编辑器的完美选择 【免费下载链接】notepadqq A simple, general-purpose editor for Linux 项目地址: https://gitcode.com/gh_mirrors/no/notepadqq Notepadqq是一款专为Linux平台设计的轻量级代码编辑器,为开发者…

作者头像 李华