news 2026/5/14 9:13:29

从智能互联到智能互协:大模型时代智能体网络的新演进

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
从智能互联到智能互协:大模型时代智能体网络的新演进

原文发表于《科技导报》2026年第7期《从“智能互联”迈向“智能互协”》

《科技导报》邀请会津大学程子学教授、上海工程技术大学王晨副教授撰文,系统梳理了Google提出的智能体互联协议(A2A)与Anthropic的模型上下文协议(MCP)及其形成的MCP×A2A协议栈。该体系通过A2A实现智能体互联,通过MCP实现工具、模型与外部资源的统一调用,推动多智能体系统从单体能力走向互联协作。但“互联”并不等于“互协”。现有体系主要解决“连得上、调得到”的问题,在认知协同、状态感知与协同关系调节等方面仍存在不足。为此,本文提出基于HEC的人机“智能互协网”(SSN)架构,引入“身−知−心”整体性结构,使系统不仅能够连接智能体与能力,更能够实现“协得好”,支持柔性、共感与可持续的人机协作。

1 AI时代下的新型社会结构与智能互联网的必要性

随着大语言模型快速发展,人工智能(AI)正驱动着以“智能化”为核心的新一轮工业革命的兴起。智能体作为人类与AI系统之间的关键连接器,不仅承担信息传递与协作的桥梁角色,更以其感知、理解与反馈能力,成为推动各类场景实现智能化转型的核心力量。AI正迈向多智能体协作与人机共感融合的新阶段,并展示了在资源受限条件下提升效率与推理能力的技术路径,推动了其通用性与专用性的融合。

与这一趋势相呼应,2025年4月,由Google公司牵头,全球50余家企业与组织响应,提出“智能体互联协议”(A2A),与2024年Anthropic公司发布的“模型上下文协议” (MCP)形成互补。这一背景表明A2A与MCP机制正催生出一个高度协同、可自组织的“智能体互联网络”,智能体间可通过协议协作与资源共享,具备感知、认知、决策与反馈能力,广泛连接人、机、物,实现从“信息互联”向“智能互联”的跃升。

然而,在AI间协作机制日益进步的同时,业界对于“人与AI之间的关系”的洞察与理论更新却相对滞后,即人如何更为结构性地理解和参与AI的决策过程,并与其实现共同成长的路径尚不明晰。

针对上述挑战,人机共协计算(HEC)提供了一个关键的理论框架。HEC强调人与计算机系统(包括AI等)在任务执行中的协同分工与相互增益,其目标不仅是提高效率,更在于共协交互如何促进人类能力成长、认知深化与价值实现。

为此,我们的研究基于HEC的理论框架和A2A协议,提出“智协网”思想。在多主体协作、跨领域项目推进等复杂情境中,依据各参与者的身体状态、知识技能、心理情绪等要素,实现最优的合作机制、角色分担、资源配置与进度协调,最终达到人机共协的目的。进一步讲,智协网以A2A协议为通信基础和智能互联层,依托HEC理论中的一个重要架构“身−知−心”,构建了“身−知−心”3层智能体互协结构。

2 多智能体间互联的进展与挑战

2.1 智能体在人工智能发展中的角色

未来,智能体将广泛应用于教育、医疗、产业等领域,成为人机共生、共创系统中的关键技术。一般而言,智能体包含以下4个核心模块。(1)感知模块:接收环境输入,如文本、图像、语音等。(2)规划模块:基于输入信息进行逻辑判断和问题分析,设定目标并制定实现路径。(3)执行模块:将规划转化为行动,调用外部资源和工具完成具体任务。(4)记忆模块:存储历史经验,供当前判断与未来优化使用。这些模块并非各自孤立,而是构成了一个动态联动的智能系统:感知输入—推理理解—制定计划—执行动作—反馈更新,如此形成自我调节的闭环。

2.2 回顾多智能体系统的演进与挑战

具备感知、决策、执行能力的各个独立智能体,可构成多智能体系统(MAS),围绕目标,实现任务分工与协作。

20世纪90年代,知识查询与操作语言(KQML)的提出为MAS的通信与协调奠定了基础。KQML为智能体间通信提供了语义单元和通信行为,规定了“如何”交换命令、知识和目标,而本体论则提供了“交换什么”的共同理解。

2002年,佐藤等将心理学中的认知平衡理论引入MAS,提出了一种用于解决学生与教师研究室之间配属匹配问题的说服机制。该机制有效降低了传统人力调配的时间与成本,同时避免人为偏见,为实现更高效、人性化的匹配系统奠定了基础。

Ogino等针对以云为中心的物联网(IoT)架构所面临的通信负载、响应延迟和隐私泄露等问题,提出了一种引入多智能体技术的柔性边缘计算架构。该方法实现了云与边缘之间协同调节、动态平衡的“柔性网络(软网络)”。

进入大语言模型时代后,以LLM为基础的智能体不仅能够设定目标、设计实现路径、进行分析与决策,还具备调用工具与反馈能力,从而使AI逐步从“对话”型演进为“代理”型。基于大型语言模型的多智能体系统(LLM−MAS)在社会行为模拟、心理互动仿真与个性化推荐等领域展现出显著潜力。

为了适应多智能体间在复杂任务中的动态分工与交互需求,一系列开发和运行系统架构应运而生。(1)LangChain/LangGraph:支持多智能体工作流构建,复杂状态管理和智能体间的串行、并行任务编排。(2)AutoGen与CrewAI:AutoGen提供对话驱动的多智能体会话框架,能够灵活地自定义和精细控制功能,特别擅长代码生成和计算密集型任务。CrewAI是重视基于角色分工的自主AI智能体协作框架,重视基于角色分工的自主AI智能体协作。

群体智能系统的协作远不只是将多个智能体简单拼接起来。现实应用中常出现一系列协作障碍。这就造成了接口不兼容、任务目标分歧、状态感知不同步等问题,进一步引发协作效率低下或系统行为不稳定。上述挑战反映出,要构建高效、多角色协作的MAS系统,必须建立统一、可扩展的工具调用和通信与协调协议。这一背景促使MCP与A2A等新一代智能体调用工具和相互联结及功能共享的协议应需而生。

2.3 智能体协议MCP和A2A正成为智能体互联的基础

在多智能体系统的发展过程中,2个关键协议正成为核心驱动力:2024年11月Anthropic公司推出的MCP与2025年4月Google公司主导的A2A。

1)MCP与A2A的功能分工与互补。MCP的使命在于使大语言模型跳出“孤岛运行”。其技术特性如下。(1)高度兼容性。(2)统一数据结构。(3)上下文记忆能力。(4)安全控制机制。A2A协议的设计目标则是打造“智能体之间的通用语言”。其应用范围日益广泛,成为了多智能体生态系统中不可或缺的“通信协议层”。

MCP与A2A的结合构成了继互联网传输控制协议/因特网互联协议(TCP/IP)之后另一种类型的智能体互联网协议栈,将推动新一波跨不同LLM模型、跨任务的智能体协同应用浪潮,成为构建智能互联网的基础。

2)MCP×A2A智能体协议栈。2025年5月,Jeong提出了一个更加系统化的MCP×A2A分层协同架构模型,以实现智能体与工具之间,以及智能体彼此之间的高效联动与动态协作。

其主要4层结构的组成与功能如下。第1层(最上层):智能体管理层。是协调系统运行的中枢,确保智能体之间合理分工与状态同步。第2层:核心通信协议层。负责定义任务调用结构、路由机制、处理反馈,并保证任务语义传递的一致性。第3层:工具整合层。实现功能调用、数据处理与结构化反馈。第4层(最下层):安全认证层。提供身份验证、权限控制、日志追踪与端到端加密机制,确保系统运行的信任基础与安全。

“MCP×A2A分层协议栈”不仅清晰划分了各协议功能在系统中的职责,还为大规模智能体网络如何实现“动态、安全、可信”的任务协同提供了工程性支撑。

2.4 未来的智能体:从“互联”走向“互协”

MCP×A2A的不足并不主要体现在互联与调用能力上,而更集中表现为协作节奏与参与者“身−知−心”3层结构在不同主体之间的持续失配与累积放大,并不能实现人(团队)与智能体群的共协交互,使得每个参与者的身体、知识和心理层面状态和发展得到考虑。

在实际的远程协作与多智能体协同场景中,协作问题往往并非源于单一任务失败或技术错误,而是源于协作节奏与参与者状态之间的逐步失配。基于这一观察,本研究提出的“智能互协网”并非仅关注任务执行层面的优化,而是将协作视为一个跨层、跨主体的动态调节过程。这一调节过程并不依赖预设的单一优化目标,而是基于对多层状态的综合判断,决定是否需要介入、介入强度及优先缓解的对象。

3 基于HEC×A2A/MCP的“智能互协网”构想

为回应第2.4节中所指出的现有MCP×A2A体系在深度柔性协作方面的不足,引入HEC的理念,并在此基础上提出一种新型人机共协网络架构——智能互协网(SSN)。该架构并非替代A2A与MCP,而是对其功能的拓展与深化,旨在支持更高层次的状态感知、意图理解与共感反馈。

3.1 HEC的意义与定位

HEC用于刻画人与计算系统在协作过程中形成的理想“共协态”与“共协交互”关系。HEC更强调人在协作过程中的成长性、主体性维护以及价值共创与共感性支持。

如图1所示,HEC由共协人、共协计算机,以及二者之间的共协交互构成。HEC理论进一步将共协人抽象为“身−知−心”3层结构。该3层结构并非对既有理论的简单叠加,而是在综合相关领域研究成果的基础上,对人类经验结构进行更高层次的整合性表达。

图1 HEC模型

与认知架构模型(如ACT−R)侧重于建立个体内部认知、记忆与意图的模块化结构不同,HEC的“身−知−心”模型具有更为宏观的理论视角,用于理解人在协作情境中所呈现的整体经验结构,从而为个体认知研究提供一个更宏观的协作与交互语境基础。相比将情绪作为输入特征或优化目标的工程化路径,HEC更关注情绪状态的生成根源及其在长期协作中的演化逻辑。

此外,HEC并不止步于“如何调整流程”,而是试图通过讨论行为、认知、情绪、意图与主体性之间的内在联系,理解用户状态变化的动力学根源及其跨层转换机制。这一视角使HEC能够超越单一性能指标或局部效率优化,转而关注协作过程中的稳定性、节奏协调与长期可持续性。

HEC的“身−知−心”模型可被视为一种关于人类经验结构的宏观理论抽象,其核心价值在于揭示从外向生理到内向心理之间的张力关系、发生根源及可能的调节路径。相应地,共协计算系统在感知、任务管理与适应性调节等层面与人形成对应关系,其目的并非复制人的内部结构,而是动态感知并响应人的状态变化,从而在协作过程中提供恰当支援。

3.2 智能互协网的架构

图2展示了SSN的整体架构。在该架构中,A2A用作多智能体之间的通信与状态同步载体,MCP负责工具、资源与知识的调用支持。

图2 智协网架构

在SSN中,“身−知−心”并非作为抽象的人机模型重复定义,而是作为协作调节协议所使用的3类状态维度嵌入代理内部:“身”层提供协作节奏与负荷的行为状态输入,“知”层提供任务结构与进度的认知评估,“心”层提供心理安全与共感相关的调节信号。SSN还支持接入云端的支援智能体群组,以在必要时为用户代理提供额外的认知与决策支持。系统亦可结合检索增强生成与知识图谱(KG)等机制,对协作过程中形成的经验与共识进行管理与应用。

3.3 设计方针:中庸/利他作为协作调节导向的工程定位

系统在架构层面引入“身−知−心”3层结构作为协作调节的输入维度,并在调节决策层明确采用“中庸”与“利他”作为核心设计导向。

在工程实现上,“中庸”与“利他”用于约束与引导以下关键判断:是否需要介入协作过程、介入的强度与方式,以及在多方状态不匹配时优先缓解哪一方的负担与风险。其中,“中庸”强调调节介入的适度性;“利他”则体现为在任务重分配、节奏调整与反馈策略中对弱势或高风险一方的优先缓解。该设计并不试图“控制”协作者行为,而是通过降低摩擦、缓解压力与维持心理安全,为人机共协与多人协作提供一种可持续、柔性的支持机制。

3.4 基于设计方针的3层联动与协调机制

在智协网中,协议的核心并非单纯的通信或调用规则,而是围绕“身−知−心”3层结构形成的动态协作调节机制。如表1所示,3层各自承担不同类型的状态感知与决策职能,并通过跨层信息传递与反馈,通过跨层联动实现协作稳定性与参与体验的平衡。

表1 协作流程与“身−知−心”3层结构功能表

在个体层面,协作调节通常由某一层状态变化触发,但并不固定由“身”层先行。系统并不假设单一触发源,而是通过多层状态的综合判断,决定是否需要介入以及介入方式。

在多智能体协作中,“知”层通常作为协调枢纽,负责整合来自“身”层与“心”层的状态摘要,用于协商任务分配、节奏同步与协作方式选择;“身”层提供关于负荷与节奏的约束信息;“心”层提供关于动机、压力与心理安全的调节信号,从而避免协作仅围绕任务效率进行单维优化。

在多方或长期协作场景下,3层结构联动进一步体现为一种面向整体稳定性的调节模式:当系统检测到个体或子群体状态失衡时,认知层可触发角色或任务的重新配置,“身”层配合调整行为与节奏,“心”层则通过反馈与共感提示促进团队内部的自然调节与信任恢复。上述3层结构联动机制并不依赖预设的固定流程,而是在“中庸/利他”调节导向的约束下,根据协作状态动态运行。

3.5 智能互协网实现思路

为实现所提出的智能互协网,系统需要在工程层面解决协作状态感知、调节决策与经验积累之间的衔接问题。

在状态感知与上报阶段(图3 Step 1),用户专属智能体对“身−知−心”3层结构进行摘要化表示。

在调节决策阶段(图3 Step 2),规则引擎被定位为跨层调节的决策核心。为支持跨时间与跨个体的协作一致性,系统进一步引入基于检索与结构化知识的协作记忆机制。二者结合,为算法中的调节判断提供可追溯、可解释的参考依据,用于支持调节决策的背景理解,而非即时响应中的孤立推断。

在执行与反馈阶段(图3 Step 3),调节方案通过A2A作为通信载体在智能体之间实施;在需要时,通过MCP调用外部工具、资源或知识服务作为支撑。Step 3中产生的OUTCOME指标作为奖励信号,用于评估当前调节策略在协作稳定性与心理安全等维度上的综合效果。与此同时,OUTCOME也被写入RAG/KG,形成可检索、可结构化的协作记忆,用于支持后续协作中的情境参考与经验复用,而不参与即时调节决策。

3.6 智能共协网调节协议算法

根据以上思路,我们的研究给出智能共协网调节协议算法(伪代码),伪代码(图3)请参考原文。

4 应用场景:智协网的实践可能性

结合“身−知−心”3层结构与A2A/MCP协议机制,提出2个涵盖医疗、教育的潜在应用场景,探索智协网在现实社会中的可行性与应用路径。

4.1 远程医疗团队的协同支持

随着人口老龄化与地区医疗资源分散,医生、护士、康复师等多专业人员之间的远程协作需求日益增加。然而,由于职责差异和工作负荷不同,信息共享的频率和细节层级常常不一致,许多重要却微妙的语境和经验在交流过程中并没有被传递,容易引发误解与延误;同理,这样的问题也发生在医患之间。

解决方案(“身−知−心”3层结构共协)如下。“身”层:监测医护人员的注意力、过劳与睡眠状态,适时建议轮班或重新分配任务。“知”层:自动调整病历摘要与注意事项的表述粒度(报告频率协议);鼓励交流各方的信息透明,减少因语言摩擦、信息不确定性导致的冲突可能性。“心”层:鼓励真诚合作,通过A2A连接生成具有共情力的、团队共同体的安慰性反馈,缓解心理压力。

4.2 项目式学习(PBL)的智能支持

跨专业、跨能力的学生共同参与项目型课程,需要在分工与特点、进度与心理安全感、分心与专注之间取得动态平衡。

解决方案如下。“身”层:感知每位学生的专注节奏与作业时段,智能调控小组任务时间点。“知”层:对经验较少的学生提供个性化补充材料;对熟练者则细化任务并优化分配。建立一个清晰的讨论平台,寻找最合适分工路径,并帮助寻找团队最合适的组织架构。“心”层:系统识别沉默学生的非言语信号,为其提供“代言”,引导团队成员主动关心与回应。

5 结论与展望

AI的快速演进,正持续推动以“智能化”为核心的新一轮工业革命。A2A与MCP等协议作为当前智能体通信与工具调用的关键机制,为跨平台协作与外部资源整合提供了统一的技术底座,构成了智能互联网的重要基础设施。

在此背景下,我们的研究提出了超越既有智能体互联协议的SSN架构。通过引入“身−知−心”3层结构,以及以利他性与平衡性为导向的调节机制,从HEC的视角,对多智能体系统中存在的节奏冲突、理解偏差与协作失稳问题给出了系统性的回应,为未来人机交互协议的设计提供了一种新的结构化范式。这一框架对于教育、医疗、远程协作等多主体参与的复杂场景具有较高的适应性与扩展潜力,为构建可信赖、可共感的人机共协系统提供了重要的基础。

从工程实现角度看,以架构与机制提出为主,尚未展开完整的系统级实现与实验验证。此外,尽管以Google公司为代表提出的A2A开源智能互联框架是否会发展为事实标准仍有待观察,但智能体之间统一通信规范与协同协议的形成已是不可逆的趋势。

展望未来,如何进一步将利他性原则与中庸理念转化为工程上可操作、可调节的量化体系,如何在真实系统中持续优化跨层调节机制,将是智协网走向实际应用的关键研究方向。随着AI系统不断融入社会基础结构,我们研究所倡导的“以人机共协为中心”的交互协议设计,有望为人类与AI的共协进化提供长期而稳健的技术支点。

致谢:本研究受到高知工科大学任向实教授启发和鼓励下,在内容讨论和修改过程中,任向实教授提出了宝贵意见。同时,复旦大学粤港澳大湾区精准医学研究院(广州)檀鹏博士提供了参考资料和修改建议。

本文作者:程子学、王晨

作者简介:程子学,会津大学计算机理工学部、上海工程技术大学,特聘教授,研究方向为共协交互与智能体协议;王晨,上海工程技术大学、高知工科大学,副教授,研究方向为人机共协计算。

文章来源:程子学, 王晨. 从“智能互联”迈向“智能互协”[J]. 科技导报, 2026, 44(7): 80−90.

本文有删改,

点击文末阅读原文获取全文。

内容为【科技导报】公众号原创,欢迎转载
白名单回复后台「转载」

精彩内容回顾

重塑人机关系:人工智能时代的未来设计新路径

以人为中心的人−AI交互理论发展与实践进展

以“心”为原点:人机共协视角下的新型人机关系构建

AI狂奔,人文刹车:数智时代如何避免“神人俯视”?

新刊速览:未来的人机关系 | 2026年第7期

《科技导报》创刊于1980年,中国科协学术会刊,主要刊登科学前沿和技术热点领域突破性的研究成果、权威性的科学评论、引领性的高端综述,发表促进经济社会发展、完善科技管理、优化科研环境、培育科学文化、促进科技创新和科技成果转化的决策咨询建议。常设栏目有院士卷首语、科技新闻、科技评论、专稿专题、综述、论文、政策建议、科技人文等。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/14 9:12:22

抖音下载器架构解析:多策略下载与队列管理的技术实现方案

抖音下载器架构解析:多策略下载与队列管理的技术实现方案 【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser fallback su…

作者头像 李华
网站建设 2026/5/14 9:11:08

Windows窗口置顶终极指南:PinWin让你的多任务处理效率翻倍

Windows窗口置顶终极指南:PinWin让你的多任务处理效率翻倍 【免费下载链接】PinWin Pin any window to be always on top of the screen 项目地址: https://gitcode.com/gh_mirrors/pin/PinWin 你是否曾因频繁切换窗口而打断工作流程?是否需要在多…

作者头像 李华
网站建设 2026/5/14 9:09:15

如何在不同设备上高效格式化SD卡

对于任何使用相机、智能手机或电脑的人来说,格式化SD卡都是一项基本技能。无论是清理旧文件为新照片腾出空间,还是修复“卡错误”提示,掌握正确的SD卡格式化方法都能确保其使用寿命和性能。接下来,我们将介绍几种格式化方法。第一…

作者头像 李华
网站建设 2026/5/14 9:08:08

AI长篇创作系统架构解析:从LLM智能体到一致性管理

1. 项目概述:当AI开始“阅读”并“创作”小说最近在GitHub上看到一个挺有意思的项目,叫auto-novel/auto-novel。光看名字,你可能会觉得这又是一个用AI生成小说的工具,市面上这类工具已经不少了。但当我深入去研究它的代码和设计思…

作者头像 李华
网站建设 2026/5/14 9:07:06

深入解析ZYNQ启动流程:从Boot引脚到FSBL的完整路径

1. ZYNQ启动流程全景概览 当你第一次拿到一块ZYNQ开发板时,按下电源键后究竟发生了什么?这个问题困扰过很多嵌入式开发者。作为Xilinx推出的经典SoC芯片,ZYNQ的启动流程就像一场精心编排的交响乐,每个环节都环环相扣。我当年调试第…

作者头像 李华
网站建设 2026/5/14 9:05:15

SpringAI Chat Client (四)

在前面“Chat Models”小节内容中,我们在与各个模型进行对话时使用的是对应模型的ChatModel对象,例如:DeepSeekChatModel、OllamaChatModel。然后通过chatModel.call(...)、chatModel.stream(...)直接调用模型,这其中我们需要手动…

作者头像 李华