news 2026/4/18 21:34:13

上海交大团队:迈向超长程自主智能体科学 ai scientist

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
上海交大团队:迈向超长程自主智能体科学 ai scientist

上海交大团队:迈向超长程自主智能体科学

缺乏超长程自主性,即无法在跨越数日、甚至数周的实验周期中持续保持战略一致性并不断迭代修正,阻碍了智能体(Agent)从被动辅助向自主驱动科学前沿发现的跨越。

为克服这一瓶颈,上海交通大学人工智能学院团队及其合作者,基于“认知累积”(Cognitive Accumulation)概念框架和“分层认知缓存”(Hierarchical Cognitive Caching)架构,推出了一个精通超长程机器学习工程的自主智能体ML-Master 2.0(图3)。

据介绍,ML-Master 2.0在以24小时预算进行MLE-Bench评估时,获得。(图2图5)

注:MLE-Bench是一个由OpenAI推出的、包含75个真实Kaggle机器学习竞赛的基准测试,要求智能体通过长期试错和跨迭代经验积累来探索巨大的非结构化搜索空间,无法依靠单步操作的正确性实现目标。

研究团队表示,该研究从实证角度验证了结构化的认知积累是自主智能体掌握现实世界科学研究中长程试错循环过程的关键推动因素。

1.“认知累积”概念框架

研究团队认为,超长程自主性是一个提炼(refinement)、稳定(stabilization)和重用(reuse)的演进过程,而非单纯的过往历史上下文线性聚合。

从认知角度来看,智能体会产生大量原始经验,但只有一小部分在经过反复验证后会被提炼为可重用的知识,当它们被进一步抽象并在不同任务间保持稳定时,便形成了更高层次的智慧。因此,认知积累依赖于上下文随时间的结构化区分,仅仅保留更多上下文并无益处。短期经验支持即时决策,相对稳定的知识在长时间探索中保持战略一致性,进一步抽象整合的智慧则实现了跨任务的迁移和重用。

2.“分层认知缓存”架构

基于认知累积理论,ML-Master 2.0引入了“分层认知缓存”架构作为长期上下文管理系统。该架构受计算机系统中多级缓存层次结构的启发,旨在明确区分瞬时处理过程与稳定状态。

“分层认知缓存”架构由两个互补组件构成的协调式设计,包括:

分层缓存:提供一个结构化架构,根据时间稳定性和重用价值将上下文划分为多个层级;

上下文迁移:决定如何在探索过程中动态地将信息在这些层级间进行提升、整合或淘汰。

二者协同作用,使得变化迅速且高效用上下文能够贴近当前的推理过程,同时将更稳定、可重用的知识逐步迁移为更持久的表征,从而实现持续且高效的长程探索。

更多细节,请查看原论文。
整理:珏子

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 7:56:53

NX4188-24,一款USB audio芯片,广泛用于USB耳机、声卡等领域

NX4188-24 是一款高度集成的 USB/Type-C 音频芯片,芯片内部整合了全部必需的模拟电路模块,涵盖双 DAC 与音频功放、麦克风增益电路、锁相环(PLL)、稳压模块以及 USB 收发单元。同时,它还提供专用的 HID 兼容音量控制引…

作者头像 李华
网站建设 2026/4/9 16:49:45

【计算机毕业设计案例】基于JavaWeb的在线美食探店分享平台基于web的美食探店平台(程序+文档+讲解+定制)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/4/18 11:30:26

智慧农业在种植、养殖、畜牧、水产等多个领域是如何解决问题的?

在科技飞速发展的今天,智慧农业正逐渐成为农业领域的一股新兴力量帮助农民解决着种植、养殖、畜牧、水产等多个领域的常见问题。那么,智慧农业究竟是如何发挥作用的呢?智慧农业助力种植领域在传统的种植过程中,农民常常面临着诸如…

作者头像 李华
网站建设 2026/4/14 3:27:15

工业智能网关:工厂数字化转型的核心枢纽

在数字化转型的浪潮中,许多制造企业面临一个核心痛点:车间里设备品牌众多、协议繁杂,PLC、CNC、仪器仪表各自为政,形成了一个个“信息孤岛”。宝贵的生产数据沉睡在本地,无法汇聚、分析和利用。数字化转型,…

作者头像 李华
网站建设 2026/4/17 17:29:58

【目标检测】YOLOv26:基于改进算法的乌鸦识别系统详解

本数据集名为Crow 2,版本为v1,创建于2023年3月13日,是一个专注于乌鸦检测的计算机视觉数据集。该数据集由qunshankj平台用户提供并采用CC BY 4.0许可协议授权,共包含416张经过专业标注的图像,所有标注均采用YOLOv8格式…

作者头像 李华
网站建设 2026/4/18 10:09:07

企微API自动化:外部群推送实现高效自动化

QiWe开放平台 个人名片 API驱动企微自动化,让开发更高效 核心能力:为开发者提供标准化接口、快速集成工具,助力产品高效拓展功能场景 官方站点:https://www.qiweapi.com 团队定位:专注企微API生态的技术服务团队 对接…

作者头像 李华