news 2026/5/23 15:20:24

manipulation十年演进

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
manipulation十年演进

Manipulation(操作/操纵)的十年(2015–2025),是从“预定义轨迹的重复机械臂”向“具备人类级触觉与通用能力的柔性手”演进的十年。

这十年间,机器人操作的核心挑战从**“精确抓取”转向了“非结构化环境下的复杂交互”**,实现了从工业围栏内的自动化到人类家庭环境中的自主化的跨越。


一、 核心演进的三大技术范式

1. 基于几何与规划的传统期 (2015–2017) —— “计算几何的巅峰”
  • 核心技术:运动规划 (OMPL)抓取位姿检测 (GPD)
  • 里程碑:2015 年首届亚马逊拣选挑战赛 (Amazon Picking Challenge)。
  • 技术逻辑:工程师预先扫描物体的 3D 模型,计算最优抓取点,并通过MoveIt!等框架规划避障路径。
  • 痛点:面对半透明、反光、或是未见过的新物体时,系统极易崩溃;无法处理衣物、线缆等柔性物体。
2. 深度学习与视觉反馈期 (2018–2022) —— “感知与动作的解耦”
  • 核心技术:强化学习 (RL)触觉感知 (GelSight)行为克隆 (BC)

  • 里程碑:2019 年 OpenAI 的魔方手(Dactyl)通过强化学习自主学会单手转魔方。

  • 技术跨越:

  • 端到端萌芽:2021 年起,模型开始尝试将原始图像直接转换为关节指令,不再依赖繁琐的中间几何模型。

  • 触觉赋能:GelSight这样的高分辨率视觉触觉传感器让机器人拥有了“电子皮肤”,能感知指尖的滑动和纹理。

  • 状态:机器人开始能处理凌乱的货箱(Bin Picking),抓取成功率突破 90%。

3. 2025 具身智能与扩散策略时代 —— “动作的通用化”
  • 2025 现状:
  • 扩散策略 (Diffusion Policy):2025 年的操作控制多采用扩散模型。由于该模型能表达动作的多峰分布(即一个任务有多种做法律),机器人的动作变得极度丝滑且具备自纠错能力。
  • 视觉-语言-动作大模型 (VLA):2025 年的机器人(如RT-2-XGemini-Embodied)理解指令:“帮我把快过期的牛奶拿出来”。它不仅要识别文字,还要观察日期并执行精密的旋转抓取。
  • eBPF 驱动的触觉反馈流:为了让机械手具备像人一样的“条件反射”,2025 年的系统利用eBPF在内核态直接处理触觉传感器的高频中断,实现微秒级的防滑补偿。

二、 Manipulation 核心维度十年对比表

维度2015 (传统工业/规划)2025 (具身智能/VLA)核心跨越点
感知方式3D 视觉点云对齐视觉+触觉+语言多模态融合从“看物”到“识意”的跨越
物体适应性仅限已知几何刚体柔性体 / 透明体 / 未知新物体解决了非结构化环境的普适性
动作连贯性离散的“移动-抓取-移动”端到端连续流式动作 (60Hz+)动作从“抽风式”变为“丝滑式”
训练数据人工编写启发式算法远程遥操作 + 视频数据大规模模仿从“人教指令”到“看视频自学”
系统底座用户态控制架构 (ROS)eBPF 内核级感知-动作闭环反应速度实现了量级提升

三、 2025 年的技术巅峰:从“抓取”到“灵巧操作”

在 2025 年,Manipulation 已经不再是单纯的“位移”,而是精细的力学博弈

  1. 扩散策略 (Diffusion Policy) 与自愈:
    2025 年的操纵系统具备强大的“抗干扰性”。如果你在机器人拿杯子时推它一下,基于扩散策略的模型不会卡住,而是会像人类一样顺势调整路径,继续完成任务。
  2. eBPF 驱动的“触觉反射回路”:
    针对 2025 年流行的五指灵巧手,单手拥有数百个触觉单元。SE 利用eBPF在 Linux 内核层直接审计指尖压力。
  • 动态防滑:当检测到物体滑动的微小剪切力时,eBPF 程序在 内直接触发握力增强,无需经过复杂的应用层逻辑。
  1. 零样本操作 (Zero-shot Manipulation):
    得益于 2025 年万亿级图像-动作对的预训练,机器人面对从未见过的奇异水果,也能根据其视觉质感“直觉”出最合适的抓取力度和位置。

四、 总结:从“工具”到“助手”

过去十年的演进,是将机器人操作从**“坐标轴里的数学题”重塑为“能够理解物理常识并具备精细触觉的数字化身”**。

  • 2015 年:你在纠结如何用算法计算出一个透明玻璃瓶的边缘。
  • 2025 年:你在利用 VLA 模型和 eBPF 审计,让机器人一边跟你聊天,一边轻巧地剥开一个煮熟的鸡蛋。
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/15 0:28:30

计算机毕业设计springboot基于Java的校园内餐厅外送系统 高校智慧餐饮配送服务平台的设计与实现 基于微服务架构的校内食堂在线订餐系统

计算机毕业设计springboot基于Java的校园内餐厅外送系统k8i4c0gg(配套有源码 程序 mysql数据库 论文) 本套源码可以在文本联xi,先看具体系统功能演示视频领取,可分享源码参考。 随着移动互联网技术的快速发展和校园生活节奏的加快&#xff0c…

作者头像 李华
网站建设 2026/5/22 2:00:22

计算机毕业设计springboot智慧社区服务平台 基于SpringBoot的社区数字化管理与生活服务平台 SpringBoot框架下的智能小区综合服务系统

计算机毕业设计springboot智慧社区服务平台434iut16 (配套有源码 程序 mysql数据库 论文) 本套源码可以在文本联xi,先看具体系统功能演示视频领取,可分享源码参考。随着城镇化进程持续推进,传统社区管理模式面临效率低下、服务单一…

作者头像 李华
网站建设 2026/5/19 14:46:11

AI写论文哪个软件最好?实测5款热门工具,虎贲等考AI凭6大维度碾压

毕业季的论文战场,AI工具已成刚需,但“生成内容空洞”“文献虚假”“查重率飙红”等问题让学子们踩坑不断。AI写论文哪个软件最好?我们耗时15天,以“本科经管类硕士工科类毕业论文”为统一任务,实测虎贲等考AI、ChatGP…

作者头像 李华
网站建设 2026/5/22 17:44:48

数字药店系统源码对接医保与支付接口的开发指南

做数字药店系统,很多团队都会经历同一个阶段: 商城搭好了 商品能卖了 订单能下了 配送也通了 结果一上线,用户一句话直接问懵: “能刷医保吗?” 如果答案是不能,大量用户当场流失。 尤其是慢病、老年…

作者头像 李华
网站建设 2026/5/16 8:45:42

VS Code 搜索黑科技:一站式精准锁定“真·实体类”!

🎯 VS Code 搜索黑科技:一站式精准锁定“真实体类”! 兄弟们,你是否有过这种“被支配的恐惧”?😱 在几万个文件的项目里搜一个 Customer,结果蹦出来 100 多个结果:Controller、Servi…

作者头像 李华
网站建设 2026/5/12 23:07:52

发票管家 v0.1.0-beta 企业个人一站式发票处理工具

发票管家 v0.1.0-beta 是一款聚焦发票全流程管理的智能工具,专为企业与个人打造,集发票识别、查验、报销、归档、统计分析等核心功能于一体,支持多格式票据自动化处理,助力高效解决发票事务,提升财务合规性&#xff0c…

作者头像 李华