大模型智能体技术路线对比：从规划检索到洞察式规划的未来之路-开发者社区

文章评估了AI大模型智能体的技术路线，提出三种实现路径：基于上下文工程的智能体、规划检索整合的通用智能体，以及未来可能的洞察式规划垂直智能体。作者认为当前智能体尚未充分发掘大模型潜力，并以教育领域为例分析现有技术路线的局限。预测未来将出现能够充分发挥大模型顶尖思维的智能体，实现从效率工具向生态工具的转变。

其核心就是，虽然现在主流的通用超级智能体是“规划+检索的大模型整合”实现，但这并不是获取“超级智能应用”的最好表现。

我们实践过程中可以发现，非常明显的是，这些超级智能体并没有充分发掘出大模型的能力。最近和Manus做一个备课对比，进一步验证了这一点。

背景二：

对于大模型的能力，我之前系列的评估，初步结论是：

也就是说，在2025年初评估，大模型基本上可以赶上人类专家（8分水平）。这是一个分水岭。它意味着大模型可以且应该进入人类实际工作的相关环节。

但在今天，我对大模型效果评估的尺度，发生了一个变化。我把人类一般专家的水平，视为6分，而把顶尖大脑的洞察和方案，视为9分。而从今日起，我用这个新的尺度，来看待大模型和智能体的效果。

背景三：

这两天，我在重新体验各个大模型及智能体应用产品。从教育领域，分为如下两种核心能力：

AIGC，可以分为两个阶段，研究（教研）和制作。制作的技术能力会不断有进展，较大的、垂直的团队会快一些。但研究（教研）的能力，需要一个深度的专业能力建构，而且明显看到，AI距离顶尖大脑还有不少差异。目前大的团队也看不出优势。

研究和制作，分别对应智能的思维内核与智能的思维结果外化。就这一点而言，在制作与闭环交付上，秘塔、Manus都给我留下了很深的印象，使用中有心流现象出现。而豆包AiPPT、夸克等，处于尚可的阶段。而coze的播客工具插件，最多只能算差强人意。而在于研究的阶段，Manus在一众产品表现中相对突出，但也只能算差强人意。

Manus备课的一个案例：

我昨天提到：

我用manus测了一下我常用的prompt（深度备课上常用），8年级物理，温度与温度计：https://temp-teach-eabwcjqd.manus.space/

Manus的结果我已经提供URL，感兴趣的同学可以访问细看。我对这个结果的感受是，“它在课程设计上的表现也不够惊艳”，用我的新评估标准，而且是在我明确高阶导向的prompt要求下，它的结果大致在6到6.5分。但同一个主题，我见过智能体7分水准。

直接想看Manus结果的，我提供两个页面示例：

当然，这仅仅是一个案例，不能算作测评，最多只是一个印象。

但我更感兴趣的，实际上是它“通用智能体”的研究过程。这个过程是非常有意思的：

它会理解我的prompt，并进行规划拆解，具体的子任务中，首先就是研究教学设计理论和课程标准要求，去教育部官网（moe.gov.cn）检索权威资料。通过课程标准强调的能力，再去获取相关的教学设计原则。

除了整理相关的教学设计原则，它因我prompt的要求，去研究科学史。

在科学史的资料中，它发现并整合到教学参考中一部分信息。然后，它应用prompt信息（认知冲突和科学探究）及课标要求，开始教学框架的设计。

在详细教学设计启动前，它会进一步的研究核心素养，以及课程标准与相关理论。并用网页的形式整理课程。

在课程的网页设计阶段，就会有各种设计风格、特色。

网页项目的设计，其实是大模型当下最成熟的一个应用领域。这里Manus进入传统强项。

在设计完成之后，Manus进行测试、检查。

最后交付了我需求中想要的温度与温度计课程。

关于这个课程的总结，尤其是后续优化的建议（和进一步prompt提示），实际上是一个亮点。它能够让任务持续进行，而且不断深入的思考方向的水平还不错，可以达到7分+的水平。（比它内容本身设计的水平要高）

这就是从一个具体案例来看，一个通用超级智能体它的技术实现过程。我后来朋友圈提了一个评价：

它搭建了一个虚拟机，可以搜索、整合分析许多文档和数据，但这个技术路线——如我之前所判断的，并不能充分发掘大模型的领域能力。所以出来的结果并没有足够好，至少在课程设计上来看

但更准确的说，我是针对“研究”结果的印象，而不是交付过程和设计结果的印象。从后者而言，Manus做得还是很不错的。我这两天又进行了很多的试用和体验，整体感受还是不错的。

基于Manus来谈智能体的未来

基于当下的实践、体验和理解，我对背景一中讨论的种种思路，尤其是智能体发展技术路线，做一个新的调整和呈现：

今天，我仍然认为，大模型和应用产品之间，存在着一个“应用层独特的价值”。而且，眼见这种独特价值的表达越来越多，并没有被大模型所吞噬。同样的，我仍然没有给垂直大模型留空间——我认为所谓的垂直大模型，会被统一大模型和各种智能体给挤压到没有生存空间。

但不同的是，我不再把智能体的实现技术路线，列为两种路线——而是变成了可能的三种。

第一种，就是大量的个体开发者在进行的，基于上下文工程（Prompt工程、知识库、简单工具整合）来实现的智能体。现在各家市场上都有此类的实现。

第二种，就是规划和检索整合的通用智能体。其中的佼佼者代表是Manus，当然，kimi2深度研究等，也在此列。

第三种，目前还没有出现，但我之前在垂直领域垂直场景上，有过初步的实践，我把它从第一种抽取出来，称之为“洞察式规划的垂直智能体”；它的未来，会超越规划和检索整合的。

但实际上，对于用户而言，并不会关心路径，而更关心提供什么样的体验和价值。

第一种，基本上就是解决较为具体的问题，以效率的支持为主。它满足长尾的、个性化的需求。

第二种，大部分的深度研究产品，实际上并不能在深层次的研究层面有实际的价值，而表现出一个更强的、更通用的效率工具产品。

所有这些，都是效率工具。

但Manus所代表的不同，它实际上采用了更底层的方案，以建立虚拟机的方式，能够面向几乎所有计算机可以设计和处理的任务进行深度整合，实际上，它能够解决多模态及多种信息文档类型的任务，能够灵活交付各种类型的结果。

就如一个朋友在朋友圈里评论：

截止2025.11月试过的html转pptx工具里，manus是还原度最高的，其它Gemini/Kimi还有开源的pandoc都不如它做得细致和稳定。虽然这可能是个伪需求，但在工具链的深度上它做得是非常不错的

以及，就如我们所体验的，如果我们提的是一个课程需求，它实际上最终可以交付一个课程的学习网站，如果连续优化，可能完成度还比较高。

而这些，都不是一般的深度研究产品所支持的。它从一个虚拟机开始起步，就能够看到它的技术野心。

从这一点而言，Manus不是一个效率工具产品，它实际上可以成长为生态工具类型的产品。

而生态工具类型，最具野心的是豆包手机。——但今天，互联网仍然是诸侯并行的时代，豆包手机的野心太大，一出场就要压服所有诸侯，所以反弹就很大，未来未知。

Manus的这种整体体验，尤其是它的交付过程和设计形态的结果，给我的感受还是很好的。再加之它的“研究大脑”表现也不差（虽然，我认为它没有非常充分的发掘出大模型的思维能力），所以是一个非常不错的产品。

但是，未来还有一种可能。那就是一种能够充分发掘出大模型最顶尖思维的部分。要知道，大模型内部压缩的知识水平绝对不是它当下创作出的知识的水平。换句话，我相信所有大模型内部都训练过《论语》的文本，《理想国》的文本。但大模型并不能在具体任务上表现出孔子或者苏格拉底的水平，哪怕某些“闪现洞察”也非常少。

这说没什么？这说明在一个具体的任务情境中，大模型受限于强化学习的过程，受限于应用层的上下文思路，受限于它原来的发掘和反馈机制，它从没有在“孔子”或“苏格拉底”层面的机制上被研究过、肯定过。

我之前提过一个同构的问题：

大模型如何最大效能的使用小文本，是应用层一个很大的挑战。#人脑用的好可以改变半生表象是，人可以基于一本经典教材得到大幅度提升，但知识库或实时搜索结果给到大模型，往往效果差强人意。

大模型“学过”《论语》和《理想国》，但其实没发挥根本性作用。也指的是这个问题。

第三条路代表着另外一种超级智能体实现的可能，它不会受限于“搜索”结果的有限性，也不会受限于大模型当下基于有限上下文的规划能力。它会形成洞察式的规划，并在应用层建立洞察式规划的技术。

Manus之所以不能做出更好的课程设计，本质的缺陷在于，它没有在规划层面发掘出大模型的顶级思维部分，而检索，又无法获得足够好的课程设计案例（毕竟，教学设计对大多数教师而言是一个低水平投入的工作，远比不上商业领域和科技领域相关资料）。

这个方向，我只有非常具体场景下的垂直智能体的初步实现，在某些任务上可以体验到“7分”的研究结果。（当然，设计结果不是个人或少量开发者可以实现的，它需要一些条件）

但是，我相信，一到两年内，大家会看到一种不一样的超级智能体实现。

当然，我选择的实验领域，就是教育和终身学习。2026，一起加油。

最后

我在一线科技企业深耕十二载，见证过太多因技术更迭而跃迁的案例。那些率先拥抱 AI 的同事，早已在效率与薪资上形成代际优势，我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。

我整理出这套 AI 大模型突围资料包：

✅AI大模型学习路线图
✅Agent行业报告
✅100集大模型视频教程
✅大模型书籍PDF
✅DeepSeek教程
✅AI产品经理入门资料

完整的大模型学习和面试资料已经上传带到CSDN的官方了，有需要的朋友可以扫描下方二维码免费领取【保证100%免费】👇👇

为什么说现在普通人就业/升职加薪的首选是AI大模型？

人工智能技术的爆发式增长，正以不可逆转之势重塑就业市场版图。从DeepSeek等国产大模型引发的科技圈热议，到全国两会关于AI产业发展的政策聚焦，再到招聘会上排起的长队，AI的热度已从技术领域渗透到就业市场的每一个角落。

智联招聘的最新数据给出了最直观的印证：2025年2月，AI领域求职人数同比增幅突破200%，远超其他行业平均水平；整个人工智能行业的求职增速达到33.4%，位居各行业榜首，其中人工智能工程师岗位的求职热度更是飙升69.6%。

AI产业的快速扩张，也让人才供需矛盾愈发突出。麦肯锡报告明确预测，到2030年中国AI专业人才需求将达600万人，人才缺口可能高达400万人，这一缺口不仅存在于核心技术领域，更蔓延至产业应用的各个环节。

资料包有什么？

①从入门到精通的全套视频教程⑤⑥

包含提示词工程、RAG、Agent等技术点

② AI大模型学习路线图（还有视频解说）

全过程AI大模型学习路线

③学习电子书籍和技术文档

市面上的大模型书籍确实太多了，这些是我精选出来的

④各大厂大模型面试题目详解

⑤ 这些资料真的有用吗?

这份资料由我和鲁为民博士共同整理，鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位，在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利，同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。

所有的视频教程由智泊AI老师录制，且资料与智泊AI共享，相互补充。这份学习大礼包应该算是现在最全面的大模型学习资料了。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目，无论你是小白还是有些技术基础的，这份资料都绝对能帮助你提升薪资待遇，转行大模型岗位。

智泊AI始终秉持着“让每个人平等享受到优质教育资源”的育人理念‌，通过动态追踪大模型开发、数据标注伦理等前沿技术趋势‌，构建起"前沿课程+智能实训+精准就业"的高效培养体系。

课堂上不光教理论，还带着学员做了十多个真实项目。学员要亲自上手搞数据清洗、模型调优这些硬核操作，把课本知识变成真本事‌！

如果说你是以下人群中的其中一类，都可以来智泊AI学习人工智能，找到高薪工作，一次小小的“投资”换来的是终身受益！

应届毕业生‌：无工作经验但想要系统学习AI大模型技术，期待通过实战项目掌握核心技术。

零基础转型‌：非技术背景但关注AI应用场景，计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能 ‌突破瓶颈：传统开发者（Java/前端等）学习Transformer架构与LangChain框架，向AI全栈工程师转型‌。

👉获取方式：

😝有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓**

大模型智能体技术路线对比：从规划检索到洞察式规划的未来之路