摘要
Antigravity 2.0 将 AI 编程工具从“单助手补全”推进到“多智能体协同开发”阶段。本文从架构理念、CLI 演进、权限沙箱、上下文管理与实战代码出发,解析其对开发工作流的影响。
背景介绍
Google Antigravity 是 Google 面向 AI 编程场景推出的 agentic coding platform。早期它更接近 Cursor 类产品,即在编辑器中嵌入一个智能代码助手,帮助开发者完成代码生成、重构、解释和调试。
但 Antigravity 2.0 的定位已经发生明显变化:它不再只是一个带 AI 助手的 IDE,而是扩展为一套完整的 AI 编程生态,包括:
- 桌面端应用
- Antigravity CLI
- Agent SDK
- 托管 Agent API
- 企业级使用路径
- 插件化能力体系
其中最核心的变化,是从“单智能体执行任务”转向“多智能体并行协作”。这意味着开发者可以同时启动多个智能体,让它们分别承担代码审查、测试生成、文档补全、缺陷定位、架构分析等任务。
这种模式对复杂工程尤其有价值。传统 AI 编程工具通常是串行工作流:开发者提出一个问题,等待模型响应,再继续下一步。而多智能体模式更接近真实软件团队的协作方式,不同角色可以并行推进任务,最终由开发者或主控 Agent 汇总结果。
核心原理
1. 多智能体协同:从单点问答到任务分解
Antigravity 2.0 的核心理念是 multi-agent work。它允许多个 Agent 同时运行,每个 Agent 处理独立任务。例如:
- 架构 Agent:分析项目结构与模块依赖
- 测试 Agent:生成单元测试与边界用例
- Review Agent:检查潜在 bug、性能问题和安全风险
- 文档 Agent:补全 README、接口说明和变更日志
- 修复 Agent:根据审查结果修改代码
这类机制本质上是一种任务编排系统。它需要解决三个关键问题:
- 任务拆解:如何将开发目标拆分为多个可并行执行的子任务
- 上下文隔离:不同 Agent 如何拥有各自的上下文,避免互相污染
- 结果汇总:如何将多个 Agent 的输出整合为可执行的开发决策
从工程视角看,多智能体不是简单地多开几个模型请求,而是需要具备调度、权限、上下文压缩、状态追踪和结果融合能力。
2. Antigravity CLI:终端场景下的 Agent 执行入口
视频中提到,Antigravity CLI 是 2.0 中关注度最高的部分。它是一个独立终端工具,使用 Go 编写,并与桌面端共享同一套 Agent Core。
这个设计很关键。因为桌面端和 CLI 共用核心能力,意味着:
- 修复和能力升级可以同步生效
- 不会出现 IDE 与 CLI 行为长期分叉
- 插件、权限、Agent 技能等底层机制可复用
- 终端用户和 IDE 用户拥有更一致的执行体验
默认情况下,Antigravity CLI 使用 Gemini 3.5 Flash,据称终端响应速度可达到约 289 tokens/s。对于 CLI Agent 来说,低延迟非常重要,因为终端交互天然强调即时反馈。
不过,值得注意的是,旧版 Gemini CLI 将在 2026 年 6 月 18 日停止面向 Google AI Pro、AI Ultra 以及免费个人用户服务。企业许可证和付费 API Key 用户仍可继续使用。对于个人开发者而言,迁移到 Antigravity CLI 已经不是“是否尝试”的问题,而是工作流需要提前规划的问题。
3. 闭源争议与插件化迁移
旧版 Gemini CLI 是开源工具,而新的 Antigravity CLI 是闭源实现。这引发了部分开发者的不满,尤其是在可审计性、可扩展性和社区贡献方面。
Google 给出的方向是:将原有的 agent skills、hooks、sub agents、extensions 等能力迁移到 Antigravity plugins 中。也就是说,它试图以插件体系承接过去的开放扩展能力。
这背后的产品判断是:开发者需求已经从“单工具扩展”转向“多 Agent 协同框架”。与其维护两套体系,不如集中投入到统一的 Agent Harness 中。
从开发者角度看,这里需要关注两个风险:
- 现有 Gemini CLI 工作流是否有功能缺口
- 插件体系是否能覆盖原先 hooks、extensions 的可编程能力
如果团队已经深度依赖旧版 CLI,建议尽早梳理命令、脚本、自动化流程和 IDE 插件依赖,避免临近停用日期再集中迁移。
技术资源与工具选型
在 AI 编程和多模型开发场景中,我个人常用的是薛定猫AI(xuedingmao.com)。它采用 OpenAI 兼容模式,接入方式是标准的 Base URL + API Key + Model Name,适合快速在工程中切换不同模型。
其技术价值主要体现在:
- 聚合 500+ 主流大模型,包括 GPT-5.4、Claude 4.6、Gemini 3.1 Pro 等
- 新模型实时首发,开发者可以第一时间验证前沿 API 能力
- 统一接入接口,降低多模型编排、灰度切换和对比测试复杂度
- 对需要构建 Agent、RAG、自动化代码审查系统的团队比较友好
下面的实战代码将基于该平台的 OpenAI 兼容接口实现一个简化版“多智能体代码分析器”。
示例模型使用claude-opus-4-6。该模型适合复杂推理、长上下文分析、代码审查和架构级任务,在多 Agent 编排场景中可以承担高质量规划与综合判断角色。
实战演示:用 Python 构建一个简化版多智能体代码分析器
下面示例模拟 Antigravity 2.0 的核心思想:针对同一个代码片段,同时启动多个 Agent,分别完成代码审查、测试建议和性能分析,最后由汇总 Agent 输出统一结论。
安装依赖
pipinstallopenai完整代码示例
importosfromconcurrent.futuresimportThreadPoolExecutor,as_completedfromopenaiimportOpenAI# ============================================================# 基础配置# 薛定猫AI采用 OpenAI 兼容接口:# Base URL + API Key + Model Name# ============================================================BASE_URL="https://xuedingmao.com/v1"API_KEY=os.getenv("XUEDINGMAO_API_KEY","请替换为你的API_KEY")MODEL_NAME="claude-opus-4-6"client=OpenAI(api_key=API_KEY,base_url=BASE_URL)defcall_llm(system_prompt:str,user_prompt:str)->str:""" 调用 OpenAI 兼容接口。 claude-opus-4-6 适合复杂代码推理、架构分析、多步骤任务规划。 """response=client.chat.completions.create(model=MODEL_NAME,messages=[{"role":"system","content":system_prompt},{"role":"user","content":user_prompt}],temperature=0.2,max_tokens=1600)returnresponse.choices[0].message.contentdefrun_agent(agent_name:str,system_prompt:str,code:str)->dict:""" 单个 Agent 执行函数。 每个 Agent 拥有独立角色和上下文,模拟多智能体并行工作。 """user_prompt=f""" 请分析以下代码: 请给出结构化结论,包含: 1. 发现的问题 2. 风险等级 3. 修改建议 4. 可落地的代码或测试建议 """result=call_llm(system_prompt,user_prompt)return{"agent":agent_name,"result":result}defsummarize_results(agent_outputs:list)->str:""" 汇总多个 Agent 的输出,生成最终工程建议。 """combined="\n\n".join(f"##{item['agent']}\n{item['result']}"foriteminagent_outputs)system_prompt=""" 你是资深技术负责人,擅长整合多个代码分析 Agent 的结论。 请去重、归纳优先级,并输出最终可执行的修复计划。 """user_prompt=f""" 以下是多个 Agent 的分析结果:{combined}请输出: 1. 最高优先级问题 2. 建议修复顺序 3. 最终代码改造方向 4. 是否需要补充测试 """returncall_llm(system_prompt,user_prompt)if__name__=="__main__":target_code="""defcalculate_discount(price,discount):ifdiscount>1:discount=discount/100returnprice-price*discountdefprocess_order(order):total=0foriteminorder["items"]:total+=calculate_discount(item["price"],item["discount"])print("total:",total)returntotal agents=[("CodeReviewAgent","你是代码审查专家,关注可维护性、异常处理、边界条件和潜在缺陷。"),("TestAgent","你是测试工程专家,关注单元测试、边界测试、异常输入和回归测试。"),("PerformanceAgent","你是性能优化专家,关注计算复杂度、数据结构、批处理效率和可扩展性。")]outputs=[]# 多 Agent 并行执行withThreadPoolExecutor(max_workers=3)asexecutor:futures=[executor.submit(run_agent,name,prompt,target_code)forname,promptinagents]forfutureinas_completed(futures):outputs.append(future.result())print("\n========== 多智能体分析结果 ==========\n")foroutputinoutputs:print(f"\n---{output['agent']}---")print(output["result"])print("\n========== 汇总 Agent 输出 ==========\n")final_report=summarize_results(outputs)print(final_report)这个示例虽然简化,但已经包含多智能体系统的基本结构:
- 并行执行
- 角色隔离
- 独立上下文
- 结果聚合
- 面向工程决策的最终输出
在真实项目中,可以继续扩展为:
- 接入 Git Diff,仅分析变更代码
- 接入 CI/CD,在 Pull Request 阶段自动审查
- 将测试 Agent 生成的用例写入测试目录
- 将 Review 结果转为 GitHub Review Comment
- 引入沙箱环境执行生成的测试命令
注意事项
1. 权限沙箱是 AI 编程工具的关键安全边界
视频中提到 Antigravity 新增了proceed in sandbox权限模式。它会自动批准沙箱内的终端命令,但当命令试图访问真实系统时,会要求人工确认。
这是比较合理的默认策略。AI Agent 具备执行命令能力后,风险会显著增加,例如:
- 删除本地文件
- 修改环境变量
- 执行未审计脚本
- 访问凭据文件
- 发起网络请求
因此,实际落地 Agent 编程时,建议将命令执行分为三类:
- 只读命令:如
ls、cat、grep - 沙箱可写命令:如安装依赖、运行测试、构建项目
- 高风险命令:如删除文件、修改系统配置、访问密钥
高风险命令必须保留人工确认。
2. 上下文长度直接影响复杂任务质量
Antigravity 将 Gemini 3.5 Flash 的上下文长度翻倍,原因是复杂任务频繁触发 compaction,即上下文压缩。
上下文压缩会带来一个隐性问题:模型可能丢失早期讨论中的细节。例如架构约束、命名约定、历史 bug、测试要求等。一旦这些信息被压缩或摘要错误,后续生成质量就会下降。
对于大代码库场景,建议:
- 将任务拆分为更小的 Agent 子任务
- 控制每个 Agent 的输入范围
- 使用结构化摘要保存关键决策
- 对重要上下文使用文件或数据库持久化
- 避免把整个仓库一次性塞给模型
3. CLI 体验仍会影响真实生产效率
视频中提到的颜色方案、Windows 体验、IDE 一键打开、线程不同步等问题,看似细节,但都会影响开发者是否持续使用工具。
尤其是线程不同步问题:如果主界面与 IDE 的对话上下文无法共享,开发者在切换工作区时会丢失连续性。这对长周期任务非常致命。
因此评估 AI 编程工具时,不能只看模型能力,还要看:
- CLI 是否稳定
- IDE 集成是否顺畅
- 会话是否可恢复
- 权限模型是否清晰
- 上下文管理是否可靠
- 是否支持团队级工作流
总结
Antigravity 2.0 的意义不只是发布了一个新的 AI 编程工具,而是代表 AI 编程范式正在从“智能补全”走向“多智能体协同开发”。
它的关键变化包括:
- 多 Agent 并行处理开发任务
- CLI 与桌面端共享 Agent Core
- 旧版 Gemini CLI 逐步退出历史舞台
- 插件体系承接 skills、hooks、sub agents 等能力
- 沙箱权限模式提升命令执行安全性
- 上下文长度提升改善大任务连续性
对于开发者而言,未来的 AI 编程能力不再只是“让模型写几段代码”,而是如何设计 Agent 工作流、如何管理上下文、如何控制权限边界、如何将 AI 输出纳入工程质量体系。
如果你正在构建自己的 AI 编程助手、代码审查系统或自动化研发平台,多智能体编排已经是非常值得深入实践的方向。
#AI #大模型 #Python #机器学习 #技术实战