news 2026/7/2 6:31:56

前英伟达工程师撰写,被称为“目前最好的 AI 工程书”,它凭什么被一线大牛反复推荐?

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
前英伟达工程师撰写,被称为“目前最好的 AI 工程书”,它凭什么被一线大牛反复推荐?

最近读完了一本关于 AI Engineering 的书,说实话,这是我开年读过最值得推荐的 AI 相关书籍之一。

如果你和我一样,不是 AI 研究员,也不是机器学习专家,但每天都在和 LLM、Copilot、ChatGPT、RAG、Prompt 打交道,那这本书很可能正好写给你。

它不试图把你培养成一个机器学习工程师,而是站在软件工程师、技术负责人、产品与工程交叉角色的视角,系统地回答一个更现实的问题——当 AI 成为基础能力,我们到底该如何工程化地使用它?

1

不是机器学习教材,而是 AI 工程指南

先说清楚一件事,这不是一本 ML 入门书。如果你指望从中学到反向传播、损失函数推导、模型训练细节,那你大概率会失望。

但如果你的目标是:理解基础模型(Foundational Models)是如何被使用的;知道采样(sampling)、模型评估、模型安全在工程里意味着什么;明白 Prompt Engineering、Dataset Engineering、RAG、Fine-tuning 各自解决什么问题;或者是搞清楚为什么 AI 会幻觉、什么时候不该相信它。

那这本书的定位就非常准确!书里讲得最多的不是怎么训练模型,而是在真实的系统里,如何让 AI 变得可用、可控、可评估。这也是我认为它特别适合软件工程师的原因。

2

Prompt 工程不是岗位,是必备能力

书中对 Prompt Engineering 和 Sampling 的讲解非常实用。作者并没有神话提示工程师这个概念,而是很务实地指出:

  • Prompt 是接口设计

  • 采样策略会直接影响系统行为

  • 好的 prompt 能显著降低幻觉,但永远无法彻底消除。

这几点我是非常认同的。Prompt Engineering 不是一个职业,但一定是一项值得掌握的工程能力。只是,它永远不该被当成构建生产系统的全部。

RAG、Fine-tuning 这些技术,书里也有介绍。作者讲清楚了它们是什么、什么时候用,但并没有给你一种照着做就能上线的错觉,这一点反而让我觉得很诚实。

3

作者没有刻意回避 AI 的局限

这本书有一个我非常喜欢的地方,它没有回避 AI 的问题,反而把问题摆在了台面上。

  • 上下文为王

这句话从未像现在这样真实。为 LLM 提供清晰、详尽的上下文至关重要。但事情并不简单,上下文越长,模型就越有可能把注意力放在错误的部分上。

此外,LLM 更擅长执行出现在提示开头或结尾的指令,而不是中间部分,这就是位置偏差(position bias)。有一种提示技巧是:在用户输入之后重复一遍最初的指令。我原以为只有小孩才容易只记住最后听到的东西。

  • 学得越多,反而觉得自己知道得越少

这当然可能是因为信息量过大让人应接不暇,但我们也确实会遗忘。别担心,你并不孤单——我们的 LLM 朋友也一样。模型学会的任务越多,就越容易出现灾难性遗忘(catastrophic forgetting),也就是说,它在早期任务上的表现会明显下降。这或许能解释为什么我现在已经不太会解二次方程了。也许我也是个 LLM。

  • 好吧,我大概不是 LLM

不过,人们已经开始担心:用于训练 LLM 的内容可能会不够用了。确实,LLM消耗公开信息的速度已经超过了新内容的产生速度。

于是,合成数据(synthetic data,即 AI 自己生成的数据)被越来越多地用于训练模型,只要谨慎使用,它确实有帮助。但问题在于,合成数据只是模仿真实数据,因此得到的性能可能是表面的。

一个用其他模型生成的合成数据训练出来的模型,也许能直接给出答案,却未必真正理解为什么或怎么来的。但你千万别指望它会轻易承认自己不懂——如果你追问解释,它很可能会编一个幻觉出来。

这让我想起《黑天鹅》里提到的一个实验:让裂脑病人的一个大脑半球执行某个动作,然后再让另一个半球解释原因,病人往往会编出一个毫无意义的解释。总之,一些研究已经发现,合成数据的使用与模型性能下降存在相关性。我敢打赌,这样训练出来的代码库一定“非常精彩”。

理解 AI 能做什么、不能做什么,以及它的影响和限制,非常重要。这本书在这一点上解释得相当扎实。而这些限制,也正好引出了 AI 在软件开发中面临的更大问题。

众所周知,AI 本质上是概率性的。你见过那张概率很低,但永远不为零的梗图吗?这几乎就是 AI 的座右铭!只要概率不为零,不管多离谱,AI 都有可能生成出来。

4

对 AI 取代程序员的一些冷静的看法

作者本身并没有煽动程序员将被取代,但它间接解释了为什么这种说法经不起推敲。

我自己的结论是:AI 很擅长样板代码、局部算法、重复劳动,但是 AI 非常不擅长领域建模、架构权衡、质量判断。好代码仍然需要思考、经验和创造力。

如果你指望 AI 帮你设计一个合理的领域模型,那大概率会收获一堆看起来像对的错误代码。AI 放大能力,但前提是你本身得有判断力。

5

为什么强烈推荐这本书

总结一下,这本书特别适合:

  • 软件工程师 / 架构师 / Tech Lead

  • 正在把 AI 引入真实业务的人

  • 不想被营销话术洗脑、想看清 AI 工程本质的人

它不会让你马上变成 AI 专家,但会帮你建立一个非常重要的能力,知道 AI 能做什么,不能做什么,以及什么时候不该用它。我认为这是当下比多会几个 prompt 技巧更重要的事情。

但如果你想在喧嚣的 AI 叙事之外,找一本足够冷静、足够工程化、也足够现实的书,那我会非常愿意推荐你读一读它。

AI 有多有用,取决于使用它的人。而这本书,至少能让你成为一个更清醒的使用者。

《AI 工程》抢读版抢先上市!纸质版+电子版,一次付费两种体验。速速扫码加购吧~👇

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/7/1 6:48:15

告别字段注入:为什么你应该在 Spring 中使用构造器注入

在日常的 Spring Boot 开发中,你是否经常这样写代码?RestController public class UserController { Autowired private UserService userService; } 看起来简洁、直观,IDE 也能自动补全。但细心的同学可能已经注意到:IntelliJ ID…

作者头像 李华
网站建设 2026/7/1 13:07:40

收藏级!AI大模型100个核心知识点全解析(从入门到进阶)

本文系统梳理了AI大模型从基础架构到前沿应用的100个关键知识点,覆盖Transformer核心架构、预训练微调全流程、多模态融合技术等核心模块,深度拆解大模型在NLP、计算机视觉等领域的落地场景,同时探讨伦理安全边界与未来技术走向,为…

作者头像 李华
网站建设 2026/7/1 13:07:39

电路仿真软件中的硬件建模:系统学习指南

电路仿真中的硬件建模:从理论到实战的系统性突破你有没有经历过这样的场景?辛辛苦苦画完PCB,打样回来却发现电源输出振荡、信号完整性崩坏,或者效率远低于预期。返工一次,时间、成本、客户信任全都在流失。这背后&…

作者头像 李华
网站建设 2026/7/1 13:10:37

用多路复用器构造半加器:创新实践案例解析

用多路复用器构造半加器:从原理到实践的深度探索你有没有想过,一个本该由异或门和与门组成的半加器,其实完全可以用两个“数据开关”——也就是多路复用器(MUX)来实现?这听起来像是在“绕远路”&#xff0c…

作者头像 李华
网站建设 2026/7/1 13:07:41

Oracle在国内只剩存量?国产数据库要翻身?这次真不是情怀局!

连银行都在慢慢脱离国外的Oracle数据库过去十几年,Oracle在国内大型企业里,几乎是“默认选项”。银行、电信、能源、制造业,核心系统一上就是Oracle,没人敢轻易动。但这几年,一个非常不热闹、却很真实的变化正在发生&a…

作者头像 李华