玩转谷歌开源 AI 终极端:在 Antigravity CLI (agy) 中无缝白嫖/调用 Claude
作为整天和终端打交道的开发者,如果你还没试过 Google 刚推出不久的 AI 终端 Agent ——Antigravity CLI (agy),那你真的错过了效率神器。
它最让我惊艳的不是能在命令行里直接跑 Gemini,而是它的多模型兼容性。只需要一个一行命令/model claude-3.5-sonnet,你就能无缝切到隔壁 Anthropic 家最顶尖的模型。
很多刚入坑的朋友都在问:“在谷歌的agy里面用 Claude,到底是怎么计费的?需要去 Anthropic 官网买 API Key 吗?”
今天这篇博客,我们就来彻底扒一扒agy cli中使用 Claude 的省钱秘籍和收费机制。
核心结论:无需双份付费,直接走 Google 账单
最让人省心的一点是:你不需要额外去注册 Anthropic 的开发者账号,也不需要绑定外卡去充值 Token。
当你在agy终端中使用/model切换到 Claude 系列模型时,它通过 Google 的合作伙伴通道直接接入。这意味着,所有的 Token 消耗都会直接绑定并扣除你现有的Google AI 订阅计划(Google One AI Premium / Advanced 体系)额度。
💰 不同的 Google 订阅档位,你能用多少 Claude?
根据目前 Google 最新的 AI 套餐划分,你在终端里调用 Claude 的额度池和限制各有不同:
| 订阅档位 | 月费 | 适合人群与 Claude 额度表现 |
|---|---|---|
| Pro Plan (专业版) | ~$20 / 月 | 轻度尝鲜。核心虽然是 Gemini Pro,但套餐内赠送了适量的 Claude 额度。跑跑日常的agy /explain解释代码或轻量修改完全够用。 |
| AI Ultra Plan (中阶版) | ~$100 / 月 | 主力生产力。拥有比 Pro 版5 倍的终端 Agent 运行与速率限制(Rate-limits),包含非常充裕的 Claude 调用额度,适合重度跨模型交叉验证。 |
| Flagship Ultra Plan (旗舰版) | ~$200 / 月 | 极客/企业级。享受20 倍于 Pro 的天级资源池。当你想用agy /goal派生好几个异步子代理(Asynchronous Subagents)同时去帮你重构大型 C++ 或 Go 项目时,这个档位才能保证不卡速。 |
💡agy终端里用 Claude 的三大“省钱”和“高阶”技巧
既然额度都包在套餐里了,怎么用才最划算?分享几个我在开发中总结的硬核技巧:
1. 善用 10% 成本的「提示词缓存」
终端 Agent 最消耗 Token 的地方,就是每次对话都要把你的项目目录、依赖文件或者上千行的代码库塞给 AI。好在agy对工程上下文进行了深度优化:当你频繁修改同一段代码并让 Claude 审查时,它会极高概率触发提示词缓存 (Prompt Caching)。
- 缓存命中后的 Token 消耗仅算作标准输入的10%。
- 日常开发中,可以随时在 TUI(终端界面)输入
/context来看你的缓存命中率。
2. 双模架构:用 Gemini 写,让 Claude 挑刺
这是我目前最喜欢的 Workflow(工作流):
- 用默认的 Gemini 3.5 快速生成业务代码或脚手架(速度极快,且原生额度几乎无限)。
- 生成后,直接输入
/model claude-3.5-sonnet切换模型。 - 接着输入
/agent refactor "帮我审查这段代码的内存泄漏和边界条件"。
用 Claude 极强的逻辑严谨性来做对抗性审查(Adversarial Review),能用最低的成本写出最高质量的代码。
3. 实时监控你的“血条”
在整大活(比如让 Agent 自动写测试用例)之前,养成好习惯,在agy中敲一下/usage。它会以直观的图表展示你当前套餐本月的 Token 剩余量以及当前的并发速率限制,避免高强度连续调用后突然被限流。
总结
Google 的agy正在把终端的核心体验变成一个“AI 路由分配器”。不用配置繁琐的环境变量ANTHROPIC_API_KEY,不用担心额度过期,直接一个套餐统统搞定。
如果你已经是 Google AI 订阅用户,赶紧在你的agy终端里敲下/model claude试一下吧!
如果你在配置agy的异步子代理时遇到了报错,欢迎在评论区留言交流!