news 2026/5/3 23:00:28

百度面试官:如何赋予 LLM 规划能力?

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
百度面试官:如何赋予 LLM 规划能力?

👔百度面试官:(推了推眼镜,语气严肃)来,说说核心问题:如何赋予 LLM 规划能力?

🙋‍♂️我:(脑子一懵,瞎凑答案)呃…规划能力?不就是让它多思考一会儿嘛,给它多加点时间,让它慢慢想,就能规划了呗!

👔百度面试官:(语气瞬间拔高,当场怒斥)这叫什么回答?完全没说到点子上!LLM的规划能力是靠具体方法实现的,不是靠“慢慢想”,别瞎糊弄,好好说专业的!

🙋‍♂️我:(慌得手心冒汗,连忙认错)对不起面试官,我错了!我混淆了思路,现在就结合具体方法,好好跟您说清楚怎么赋予LLM规划能力!

面试踩雷预警!瞎答只会被面试官当场怼,这道百度高频真题,核心是吃透CoT、ToT、GoT三种核心方法,下面拆解每种方法的原理、用法和工程选型。

💡 简要回答

CoT、ToT、GoT 这三种我都了解过,给 LLM 加规划能力主要靠这几种思路。CoT 是让 LLM 把推理步骤写出来,线性地一步步推导到答案;ToT 是让它同时探索多条推理路径,选最优的继续深入;GoT 是图结构推理,推理节点可以复用和合并,适合更复杂的任务。工程上我用 CoT 最多,因为实现成本最低,就是改个 prompt;ToT 效果更好但调用次数多,成本大概是 3 到 5 倍;GoT 目前还比较学术,生产环境我没见过有人真正落地用的。

📝 详细解析

要理解为什么需要规划能力,先看 LLM 在没有任何规划机制时是怎么运作的。

普通的问答模式下,LLM 接到一个问题,就直接「一口气」生成答案,中间没有任何推理过程。这对简单问题没啥大问题,但遇到需要多步推导的任务就很容易翻车。比如让它做一道需要 3 步推导的逻辑题,如果直接让它给答案,出错概率会远高于让它把每步都写出来。

背后的原因是 Transformer 的 next-token 预测机制,每个 token 是基于前面所有 token 生成的,推理链越长、隐式的跳步越多,误差就越容易在中间某一步悄悄累积,最后给出一个看起来很自信但其实是错的答案。

「规划能力」要解决的就是这个问题:把 LLM 隐式的推理过程显式化,让它不再是「一步跳到答案」,而是「一步一步推到答案」,每步都有迹可循。

CoT、ToT、GoT 是这个方向上依次演进的三种方案,每一个都在解决前一个的局限性。

CoT:最简单的激活方式,加一句话就够了

CoT 的全称是 Chain of Thought(思维链),核心思路极其简单:在 prompt 里加一句「请一步步思考」,LLM 就会把推理过程逐步写出来,而不是直接蹦出答案。

为什么这么简单的改变就有效?

本质是因为 LLM 的输出是顺序生成的,当它先输出推理步骤,这些推理内容会进入上下文,影响下一个 token 的生成。换句话说,「写下来的推理过程」本身就成为了后续生成的依据,帮助 LLM 不跳步、不乱想。就好比你在纸上演算数学题,把每一步写出来之后,下一步出错的概率会比在脑子里算要低得多,原理是一样的。

CoT 有两种触发方式。

  • 第一种叫 Zero-shot CoT,就是直接在 prompt 末尾加「让我们一步步思考」,LLM 自己展开推理,不需要额外例子;
  • 第二种叫 Few-shot CoT,给几个带有完整推理过程的例子,让 LLM 模仿这种推理格式来回答新问题,效果通常更稳定。

CoT 的局限很明显:它只有「一条推理路径」。如果一开始走错了方向,整条链就歪了,没有任何纠偏机制。

ToT:从「一条链」到「一棵树」,解决走错方向的问题

ToT 的全称是 Tree of Thoughts(思维树),针对的正是 CoT「一旦走错就全错」的问题。

核心改变是把「生成一条推理链」变成「同时探索多条推理路径,边探索边剪枝,最终选出最优路径」。用一个生活类比来理解:CoT 像你做题时只想了一个解法,一路做到底;ToT 像你先想了三种可能的解题思路,评估了一下哪种最靠谱,选了最好的那条继续深入,另外两条直接放弃。

ToT 的执行流程可以分三步来理解。首先是生成多个候选思路,让 LLM 针对同一个问题给出 3 个不同的初步方向,而不是只走一条路。然后是评估每个思路的可行性,用另一个 LLM 调用(或同一个 LLM 带上评估 prompt)给每个思路打分,判断哪个最有希望。最后是选优继续深入、剪掉差的,只保留分数高的思路,再展开下一层推理,反复循环直到得出最终答案。

这个「生成 -> 评估 -> 剪枝」的循环,让 LLM 不再是「一条道走到黑」,而是有了探索多条路、选好的走、发现走错了还能回头的能力。代价也很明显:原来 CoT 一次生成就搞定,ToT 需要多次 LLM 调用(多条路径 × 多层深度 × 每层还要评估),成本是 CoT 的 3-5 倍甚至更高。

GoT:从「树」到「图」,解决推理结果不能复用的问题

GoT 的全称是 Graph of Thoughts(思维图),是在 ToT 基础上再进一步的进化。

ToT 虽然引入了多路径探索,但它是树形结构,不同分支之间完全独立,两条推理路径上的中间结论无法互相借用。

GoT 把推理结构换成了图,允许不同路径的中间结果合并、复用,也就是说一个推理节点可以接收来自多个前置节点的输出作为输入。

举个具体例子:如果任务是「分别研究竞品 A 和竞品 B,然后做综合对比分析」。

ToT 里研究 A 和研究 B 是两条独立的路径,各自得出结论;但「综合对比分析」这一步需要同时用到两条路径的结论,在树形结构里很难自然表达,因为树的每个节点只有一个父节点。

GoT 的图结构允许把「研究 A 的节点」和「研究 B 的节点」的输出,汇聚到「综合对比分析节点」,这种「多个中间结论合并输入到下一步」的操作在图里是一等公民,表达起来非常自然。

GoT 能建模的推理模式比 ToT 更丰富,也更接近人类实际处理复杂任务的思考方式。但落地复杂度很高,目前主要还是学术研究场景,生产环境里极少见到真正用起来的。

三者的演进关系

把这三者放在演进视角里看,逻辑非常清晰。

  • CoT 解决了「要不要把推理显式化」的问题,答案是要,把过程写出来就能显著减少跳步出错。
  • ToT 解决了「走错方向怎么办」的问题,答案是先多探索几条路,边走边评估边剪枝。
  • GoT 解决了「不同推理路径的中间结论能不能复用」的问题,答案是把结构从树换成图,自然支持结论汇聚与复用。每一步都是在前一步的基础上发现局限、针对性改进。

工程上怎么选?

  • CoT 几乎是所有任务的标配,加一句话、零成本,直接加到 system prompt 里就行。
  • ToT 在准确率要求很高、任务比较复杂的场景值得考虑,但要做好调用成本增加 3-5 倍的心理准备。
  • GoT 目前工程落地不成熟,主要了解它的思想即可,真实项目里不必强行引入。

学AI大模型的正确顺序,千万不要搞错了

🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!

有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!

就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!

我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/3 22:56:43

LittleSnitch for Linux:当macOS的看门狗终于踏上Linux的土地

LittleSnitch for Linux:当macOS的看门狗终于踏上Linux的土地 如果你是一名从macOS迁移到Linux的开发者,你一定不会对LittleSnitch感到陌生。这款macOS上大名鼎鼎的网络流量监控与防火墙工具,曾无数次在后台默默替你拦截了那些“不请自来”的…

作者头像 李华
网站建设 2026/5/3 22:50:51

一文详解Agent任务规划的全流程,从入门到精通

很多团队上线 AI Agent 产品之后,发现一个规律:内部演示时完成率能到 90%,真实用户用了一周,完成率跌到 40% 以下。 问题出在哪?仔细查下来,工具本身没问题,失败几乎全是卡在多步骤的复杂任务上…

作者头像 李华
网站建设 2026/5/3 22:50:19

26.从零构建 YOLOv5 目标检测系统:从标注转换到 ONNX 部署完整方案

摘要 YOLO(You Only Look Once)系列算法是目标检测领域最主流的一阶段检测框架。 本文以YOLOv5为基线,系统阐述其核心原理、训练流程与推理部署。 内容涵盖数据标注格式转换、模型训练、ONNX导出、OpenCV推理全链路,并提供可直接运行的完整代码。读者将掌握从零构建一个工…

作者头像 李华
网站建设 2026/5/3 22:49:46

在线去除背景用什么工具?2026年最好用的抠图方案实测对比

最近有个朋友问我:"你那些产品图是怎么一键去背景的?看起来边缘还特别干净。"我才意识到,很多人其实不知道现在的在线去除背景工具已经好用到什么程度了。说实话,我几年前还在用Photoshop手工抠图,现在真的没…

作者头像 李华