news 2026/6/23 19:34:13

IROS 2025论文分享:基于大语言模型与行为树的人机交互学习实现自适应机器人操作

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
IROS 2025论文分享:基于大语言模型与行为树的人机交互学习实现自适应机器人操作

近年来,大型语言模型(Large Language Model, LLM)展现出了强大的自然语言处理能力。
许多研究已将LLM应用于机器人,以实现指令执行任务,例如SayCan、RT-2、VoxPoser等。然而,这些方法需要反复调用LLM来处理外部干扰,这是一个非常耗时的过程。机器人领域的一个活跃研究方向是将LLM与行为树(Behavior Tree, BT)相结合。LLM被用于将用户指令解释为包含任务目标条件的行为树。当外部干扰导致BT中的条件无法达成时,行为树规划器(BT Planner)会基于动作数据库(Action Database),迭代地将未达成的条件扩展为子树,旨在通过执行动作来达成这些条件。尽管这些方法能够以较少的LLM调用次数处理外部干扰,但动作数据库是人工预先构建的。
当应用于超出BT Planner能力范围的新任务时,则需要具备增量学习能力。强化学习需要大量的训练和精心设计的奖励函数;模仿学习需要大量的专家示范数据;无监督学习可能导致结果偏离预期。一种新颖的方法是使用LLM来学习机器人操作。
然而,使用LLM生成的知识存在不确定性,如果直接用于机器人,可能会存在安全隐患。因此,有必要在学习的评估阶段引入人机交互。研究者提出了一种人机交互学习机制。首先为LLM设计了一个上下文,包括提示工程(Prompt Engineering)、操作基元(Manipulation Primitives, MPs)和动作数据库。提示工程用于规范LLM的输出;MPs是一组与机器人底层控制器相关的基本操作;动作数据库为LLM提供演示示例。当用户指示机器人设计新动作时,LLM通过上下文学习生成动作知识。由于LLM的空间几何理解能力较弱,因此在学习机制中引入了人机交互,引导LLM修正和完善这些知识。经过多轮引导和最终用户确认后,将其添加到动作数据库中。生成的动作知识包括前置条件、后置条件和一组MPs,会以BT的形式实施,其中动作由MP实现。此外,BT中的条件可以由BT Planner动态扩展为子树,使机器人能够在任务执行过程中应对外部干扰。为了评估提出的方法,设计了8个涉及对象操作的任务,分为三个难度级别。(1) Easy:需要利用动作数据库中的样本来推理MPs的顺序以完成任务;(2) Medium:除了推理MPs的顺序外,还需要考虑MPs中的关键参数;(3) Hard:除了推理MPs的顺序和关键参数外,还需要考虑待操作对象的特征;
基线方法使用 LLM 基于上下文和动作数据库生成动作知识,但没有人机交互学习,而所提方法最多可以提供3次交互反馈。使用两种 LLM(DeepSeek-V3和 ChatGPT-4o)进行测试。在这 8 项任务中,所提方法的学习性能优于基线方法。通过人机交互修正动作知识,所提方法在这 8 项任务中的成功率超过 80%。为了验证所生成动作知识的适应性,为这8项任务设计了外部干扰。所提方法所获得的动作知识在这8项具有外部干扰任务中的成功率超过70%。
这表明该动作知识具有良好的适应性,且大多数任务失败是由于视觉系统的识别偏差造成的。为了研究所生成动作知识的泛化能力,为这8项任务设计了新的操作对象。生成的动作知识在Stack、PressButton、Upright和Build任务中的成功率超过 70%。这是因为动作知识中的MPs参数适用于新的操作对象。然而,在Insert、BoxOut、OpenDrawer和Unscrew任务中成功率低于 40%。这是因为动作知识中的MPs参数不适用于新的操作对象。如果在将生成的动作知识应用于新的操作对象之前对其进行微调,则可以进一步提高任务的成功率。总的来说,本文提出了一种人机交互学习机制,核心在于生成可直接应用于机器人自适应操作的动作知识,并通过上下文学习实现,无需知识迁移。多项实验结果表明,该方法能够提升机器人的学习性能,使其能够完成任务并应对外部干扰。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/12 6:28:38

UnityFigmaBridge终极使用指南:从设计到游戏原型的无缝转换

UnityFigmaBridge终极使用指南:从设计到游戏原型的无缝转换 【免费下载链接】UnityFigmaBridge Easily bring your Figma Documents, Components, Assets and Prototypes to Unity 项目地址: https://gitcode.com/gh_mirrors/un/UnityFigmaBridge UnityFigma…

作者头像 李华
网站建设 2026/6/10 18:27:40

零基础也能轻松上手的在线PPT编辑器:PPTist完整使用指南

零基础也能轻松上手的在线PPT编辑器:PPTist完整使用指南 【免费下载链接】PPTist 基于 Vue3.x TypeScript 的在线演示文稿(幻灯片)应用,还原了大部分 Office PowerPoint 常用功能,实现在线PPT的编辑、演示。支持导出P…

作者头像 李华
网站建设 2026/6/13 23:39:48

哔哩下载姬DownKyi终极指南:轻松掌握B站视频批量下载与8K画质保存

哔哩下载姬DownKyi终极指南:轻松掌握B站视频批量下载与8K画质保存 【免费下载链接】downkyi 哔哩下载姬downkyi,哔哩哔哩网站视频下载工具,支持批量下载,支持8K、HDR、杜比视界,提供工具箱(音视频提取、去水…

作者头像 李华
网站建设 2026/6/4 21:38:12

罗技鼠标宏助力PUBG压枪:告别后坐力烦恼的终极解决方案

罗技鼠标宏助力PUBG压枪:告别后坐力烦恼的终极解决方案 【免费下载链接】logitech-pubg PUBG no recoil script for Logitech gaming mouse / 绝地求生 罗技 鼠标宏 项目地址: https://gitcode.com/gh_mirrors/lo/logitech-pubg 还在为PUBG中AKM的疯狂后坐力…

作者头像 李华
网站建设 2026/6/20 21:35:34

3分钟玩转NVIDIA显卡隐藏设置:游戏性能飙升指南

3分钟玩转NVIDIA显卡隐藏设置:游戏性能飙升指南 【免费下载链接】nvidiaProfileInspector 项目地址: https://gitcode.com/gh_mirrors/nv/nvidiaProfileInspector NVIDIA显卡驱动中埋藏着200多项不为人知的隐藏参数,这些设置能够彻底改变你的游戏…

作者头像 李华
网站建设 2026/6/23 19:07:37

游戏外设优化指南:3步打造专属射击辅助系统

游戏外设优化指南:3步打造专属射击辅助系统 【免费下载链接】logitech-pubg PUBG no recoil script for Logitech gaming mouse / 绝地求生 罗技 鼠标宏 项目地址: https://gitcode.com/gh_mirrors/lo/logitech-pubg 还在为射击游戏中的武器后坐力控制而困扰…

作者头像 李华