news 2026/5/28 22:52:25

Tomasz Tunguz 给 Agent 创业公司的七要素检查清单:SaaS 时代落幕

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Tomasz Tunguz 给 Agent 创业公司的七要素检查清单:SaaS 时代落幕

最近大名鼎鼎的风投大佬 Tomer (Tomasz) Tunguz 发了一篇直击灵魂的行业洞察:《Software After AI》。

他在文章里抛出了一个非常犀利的观点:传统 SaaS 时代的软件,其本质是“带有固定工作流的托管数据库”,而这一模式正在被 AI 的智能底座全面解构。AI 就像一匹野性难驯的野马,强大但充满非确定性。而接下来 Agent 产品的竞争,根本不在于看谁调的模型更聪明,而在于看谁能打造出一套完美的“马具(Harness)”去驯化它。

与其每天开会空谈宏大的 Agent 生态,不如来看看 Tomer 帮创业公司梳理的这套Agent 产品工程落地 7 大Checklist。建议每一位正在带队卷 Agent 产品的架构师和产品经理都看一遍。

驯服野马:Agent 产品的七个核心组件

1. 上下文与记忆(Context & Memory)

核心干货:通用大模型必须依靠“ bespoke(定制化)检索”才能产生真正的产业价值。

  • 产品自检项:

    • 短期记忆:你的 Agent 能够清晰记得 45 秒之前它刚执行完哪一个步骤、在上下文中观察到了什么变化吗?

    • 深度检索工程:放射科医生的图谱调取、律师的法条检索、或是跨越数十亿文档的关键词匹配,你是否为各自的垂类场景定制了专属的精准检索策略?

    • Recipe Book(配方上下文):企业每个人脑子里的 SOP(标准作业程序)就是它的业务配方。你的系统是否具备一套“上下文数据库”,能随着人、流程和业务的变更,动态捕获并自主演进这些配方?

2. 工具与行动(Tools & Action)

核心干货:配方描述了要做什么,工具才是执行它的厨具。智能体必须高效、安全地影响外在环境。

  • 产品自检项:

    • 工具注册表(Tool Registry):是否建立了清晰的工具中心,用于规范暴露内网与外部 API?

    • 参数校验与路由:模型在 Agent 循环中传过来的 arguments(参数)是否经过了严格的格式和合法性验证?

    • 敏感操作门控:删库、高额转账、涉及核心资产的敏感 Action,有没有设置坚固的人工审批(Approvals Gating)防火墙?

    • 失败降级处理:目前MCP(Model Context Protocol)已成为不可逆的行业连接纽带。当某条工具链调用偶发性失败时,你的系统是否具备优雅的异常解析与容错处理?

3. 编排与循环(Orchestration & Loop)

核心干货:Agent 的本能是“思考-行动-观察-重复(Think, Act, Observe, Repeat)”,但这远远不够。

  • 产品自检项:

    • 长链条规划能力:面对复杂任务,系统能否做到高维度的任务分解(Decomposition)、重试(Retries)以及精确的终止条件(Stop Conditions)?

    • 多智能体协同:是否具备成熟的子智能体(Sub-agents)分工与并发调用调度机制?

    • 闭环进化(Closed Loop):优秀的 Agent 产品应该能通过用户的每一次修正和每一次执行结果进行自我迭代(Closed-loop learning)。你的产品是在原地踏步,还是在“越用越聪明”?

4. 状态与持久化(State & Persistence)

核心干货:企业级落地最怕系统“间歇性崩溃”。长任务必须具备弹性容灾与状态恢复能力。

  • 产品自检项:

    • 断点续传能力:当一个复杂的 Agent 在执行 10 步长程任务的第 7 步时,因为外部 API 超时或网关偶发崩溃挂掉,重新拉起时,它能直接从第 8 步恢复断点(Resume),还是不得不从零重启(Restart)?

    • 伪影与存储管理:系统是否引入了完善的文件系统、中间检查点(Checkpoints)、会话线程(Session Threads)和资产中间体存储(Artifact Storage)?

5. 沙箱与计算(Sandbox & Compute)

核心干货:给 Agent 创造一个安全的“游乐场”,防止发生系统逃逸或安全越权。

  • 产品自检项:

    • 环境隔离:每一个独立的 Agent 在执行本地脚本或命令时,是否都在一个被彻底隔离的 Unix 工作空间(Isolated Unix Workspaces)中运行?

    • 网络出站拦截(Controlled Network Egress):是否对沙箱的网络出站请求进行了严格限流与审计策略?

    • 凭证安全隔离:核心的系统凭证与用户私钥,是否完全存放在大模型触及不到的外部托管层(Outside the model),防止被反向窃取?

6. 可观测性与治理(Observability & Governance)

核心干货:你无法信任你看不见、摸不着的东西。

  • 产品自检项:

    • 全链路追溯(Tracing):每一次黑盒思考、每一轮工具调用,后台是否具备全量的日志监控与链路追踪?

    • 回归评估集(Evals):在每次更新 Agent 的提示词或底层内核时,是否有固定的 Evaluation 数据集作为回归测试,防止模型性能出现局部倒退(Regressions)?

    • 安全守卫(Guardrails):是否建立了动态策略守卫与人工介入机制(Human-in-the-loop),在高风险和关键决策节点上把好最后一关?

7. 成本与工作流优化(Cost & Workflow Optimization)

核心干货:顶级的 AI 架构师拼的不是调包,而是极其理性的“架构裁判力”。

  • 产品自检项:

    • 确定性 vs 非确定性抉择:你有没有把本可以用传统代码硬编码写死的确定性逻辑,画蛇添足地扔给昂贵且不稳定的 AI 模型?

    • 模型分级路由:复杂的推理步骤、中等难度的文本改写、极速的参数过滤,你是否对应分流到了不同规格(SOTA、Medium、Small)或专门微调(Fine-tuned)的模型上?

    • 知识位置优化:哪些垂直领域的行业知识应该固化为 Agent 随取随用的“长期技能(Skills)”,哪些应该在运行时动态加载进入“临时记忆(Memory)”?

写在最后

当大模型变成人人可得的水电煤,决定胜负的不再是底座的马好不好,正如 Tomer 所言:

"What happens when every company has access to the same model? The best riders win."(当每家公司都能用上相同的模型时,最好的骑手将赢得比赛。)

在 SaaS 时代,我们卷的是谁的交互界面更美观、谁的功能堆砌得更多。而Agent 时代的竞争,拼的是谁能更完美地把控人机协同与大模型的算力效率

基础大模型越强、调用成本越低,对于真正卡在垂直场景里的创业公司来说,红利就越大。

最近魔芋ai平台推出的流行大模型的6折优惠,包括Seedance2.0、GPT、Gemini、Claude等流行模型,可供企业开发票使用。

想AI创业的朋友们也可以来看看Raas100开发者招募,海量资金扶持,一站式赋能,助力大家实现AI创业的想法。

欢迎加入群聊了解更多。获取折扣福利,加入开发者招募,获取更多ai资讯。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/28 22:52:01

用Skill 管理项目文档:让 Code Agent 读懂你的业务

用 Codex Skill 管理项目文档:让 Code Agent 读懂你的业务 Code Agent 的上限不在模型能力,而在你的仓库里有没有它能读懂的知识。 目录 Agent 为什么会把需求做烂为什么选 Skill 而不是 MCP 或 SDDNVC Practice 的知识架构全景第一层:repo-…

作者头像 李华
网站建设 2026/5/28 22:49:12

别再手动拖拽了!用Qt的QSplitter实现可拖拽布局,5分钟搞定专业级UI

用QSplitter打造可定制化专业界面:从效率工具到IDE级布局实战每次打开那些优秀的IDE或数据可视化工具,你是否注意到它们窗口分割的丝滑体验?用户能自由调整各个面板的大小,甚至保存自己偏好的布局——这种专业级的交互体验&#x…

作者头像 李华
网站建设 2026/5/28 22:49:04

Activiti 5.22 保姆级入门:从25张表结构到第一个流程实例

Activiti 5.22 实战入门:从零构建请假审批系统在数字化转型浪潮中,工作流引擎已成为企业级应用的核心组件。作为Java领域最成熟的流程引擎之一,Activiti以其轻量级架构和BPMN2.0标准支持,成为众多企业的首选方案。本文将基于5.22版…

作者头像 李华
网站建设 2026/5/28 22:46:08

8086/8088中断栈操作详解

1. 完整压栈过程(从中断触发到当前)第一阶段:硬件自动压栈(中断响应时)当 INT 1 指令执行或单步中断触发时,CPU 自动按顺序压入:顺序压入内容大小SP 变化1FLAGS2 字节SP ← SP - 22CS2 字节SP ←…

作者头像 李华
网站建设 2026/5/28 22:46:05

【C++】零基础入门 · 第 10 节:结构体与类

在前面的章节中,我们学习了变量、数组、函数、指针和动态内存。这些都是 C++ 的基础构件,但随着程序变得越来越复杂,你会发现一个问题:相关的数据散落在各个变量里,传递和管理起来非常麻烦。比如要表示一个学生的信息(姓名、年龄、成绩),你得定义三个独立的变量,每次传…

作者头像 李华