news 2026/6/23 5:10:51

理想下一步的重点:从数据闭环到训练闭环

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
理想下一步的重点:从数据闭环到训练闭环

点击下方卡片,关注“自动驾驶之心”公众号

戳我->领取自动驾驶近30个方向学习路线

>>自动驾驶前沿信息获取自动驾驶之心知识星球

理想汽在ICCV'25期间也分享了些新东西!目前还没有视频对外。

VLA团队负责人詹锟老师做了一场世界模型的presentation,名为World Model: Evolving from Data Closed-loop to Training Closed-loop。自动驾驶之心第一时间做了解读分享给大家~

首先是介绍下理想VLA司机大模型:

回顾了理想汽车智能驾驶的发展路线,从规则时代的轻图和无图,再到基于AI的E2E+VLM快慢双系统和VLA,这四个方案中Nav(导航)是重点突出的模块。

下面介绍的是数据闭环的价值。左上角这张图是一个完整的数据闭环流程:影子模式验证→经由数据触发回传到云端进行数据挖掘→有效样本进行自动标注→生成训练集训练模型→模型下发验证性能。

这个过程已经可以做到一分钟的数据回传。

目前已经有15亿公里的驾驶数据,200+的Trigger来生产15-45s的Clip数据。

目前理想的端到端量产版本MPI已经到了220+,相比于24年7月底的版本,MPI翻了19倍左右。

数据闭环虽然有效,但仅靠数据闭环解决不了所有问题。主要还是长尾场景的收敛问题,交通管制、烟花燃放、突然的变道等等。

所以抛出来一个观点:自动驾驶进入下半场

自动驾驶的下半场换个新玩法:从数据闭环到训练闭环。

L4的训练循环的核心是:VLA+RL+WM。

  • 轨迹由VLA的Diffusion和基于世界模型的强化学习共同优化;

  • 强化学习不仅仅是RLHF,还有RLVR和RLAIF

  • 右侧的世界模型主要指场景重建和新视角复原;

闭环自动驾驶训练关键技术栈:区域级别的仿真、合成数据和强化学习。

  • 仿真靠场景重建:视觉/Lidar重建、区域重建、多趟重建、场景编辑和风格迁移;

  • 合成数据靠多模态生成:视频/点云生成、神经渲染;

  • 强化学习靠Agent、3D资产和评测&奖励

詹锟老师本人出镜的重建和生成效果图。

理想汽车近期从重建到生成的方案发展,确实Feedforward 3DGS今年提的很多,无需点云初始化,直接由视觉输入得到最终结果。

理想这两年重建方面的工作,两篇顶会。

联合重建&生成方面的工作,一篇顶会。

生成方面的工作,三篇顶会。

生成的应用:从场景编辑,到场景迁移再到场景生成。

新的数据配比,看起来数据上下了不少功夫。

系统能力是增强引擎的关键,世界模型提供的仿真环境、3D资产构建多样化的场景、SimAgents做交互式行为建模、奖励模型准确的反馈泛化能力、GPU工程加速推理。

重点强调了可交互的Agent是训练闭环的关键挑战。

总结一下取得的成果和奖励。

自动驾驶之心

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/22 16:09:37

世界模型与自动驾驶:最新算法实战项目(特斯拉、视频、OCC等)

点击下方卡片,关注“自动驾驶之心”公众号戳我-> 领取自动驾驶近30个方向学习路线世界模型,近一年自动驾驶学术界和工业界的热词。很多小伙伴咨询柱哥,有没有一门系统讲解世界模型和自动驾驶的精品课程,筹备了很久终于和大家见…

作者头像 李华
网站建设 2026/6/23 4:08:50

45万亿!中国智驾的新风口来了

作者 | 江山美 来源 | 亿欧汽车点击下方卡片,关注“自动驾驶之心”公众号戳我-> 领取自动驾驶近30个方向学习路线>>自动驾驶前沿信息获取→自动驾驶之心知识星球本文只做学术分享,如有侵权,联系删文L4级智能驾驶商业化进程显著提速…

作者头像 李华
网站建设 2026/6/23 1:15:58

没有好的科研能力,别想着去业界搞自驾了......

点击下方卡片,关注“自动驾驶之心”公众号戳我-> 领取自动驾驶近30个方向学习路线柱哥周末和几位做自驾招聘的朋友聊天,说到现在市场上高端的自驾人才仍然非常抢手。几家新势力还有头部的Tier 1,硕士已经开到70的年包争抢人才(…

作者头像 李华
网站建设 2026/6/20 12:02:20

深扒PI*0.6迭代式强化学习来源:VLA+在线RL实现具身进化

作者 | 具身纪元 来源 | 具身纪元原文链接:深扒PI π*0.6迭代式强化学习思路的来源:VLA在线RL,实现机器人的自我进化 点击下方卡片,关注“自动驾驶之心”公众号戳我-> 领取自动驾驶近30个方向学习路线>>自动驾驶前沿信息…

作者头像 李华
网站建设 2026/6/22 16:28:39

uniapp+springboot基于小程序的智能雨伞租赁借取系统_46grsp52_gk001

文章目录具体实现截图主要技术与实现手段关于我本系统开发思路java类核心代码部分展示结论源码lw获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!具体实现截图 同行可拿货,招校园代理 uniappuniappSpringboot_6grsp52_gk001 基于小程序的…

作者头像 李华
网站建设 2026/6/22 13:30:15

linux基本指令复习

Linux 基本指令复习 1. ‌目录操作‌ 切换目录‌:cd [目录] cd /path/to/dir:切换到指定路径 cd ..:返回上一级目录 cd -:返回上一次所在目录 显示当前目录‌:pwd 列出目录内容‌:ls [选项] -l:…

作者头像 李华