news 2026/7/2 19:08:12

Claude Code 的缓存究竟住在哪里

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Claude Code 的缓存究竟住在哪里

我们在使用 Claude Code 做长会话开发时,经常会看到一个现象,同一个项目里连续追问时,前几轮可能比较慢,等系统提示、项目规则、工具定义、历史消息这些内容稳定下来,后面的响应会明显顺滑。很多人会自然地去本地目录里找缓存,怀疑它是不是藏在~/.claude下面,或者是不是某个会话文件被 Claude Code 反复读取。这个直觉只对了一小半。Claude Code 的本地目录确实会保存会话记录、项目状态和一些运行数据,但这里讨论的 prompt caching 并不住在本地机器上。它发生在服务端,准确地说,发生在最终承载模型推理请求的那套基础设施里。

这件事要从 Claude Code 的请求路径说起。Claude Code 每次和模型交互,都不是把某个神秘的本地状态直接交给模型,而是把当前回合所需的上下文重新组织成一次网络请求。这个请求里会包含系统提示、项目上下文、工具定义、历史消息、工具结果以及本轮输入。prompt caching 的价值正在这里,它让服务端识别这些请求开头部分里那些连续重复的内容,并把已经处理过的 prefix 复用起来。Anthropic 的文档把 prompt caching 描述为一种从 prompt 的特定 prefix 恢复处理的机制,用来减少重复任务和稳定 prompt 元素带来的处理时间与成本。

缓存放在哪里,不由 Claude Code 这个 CLI 单独决定,而由认证方式和请求最终流向决定。使用 Claude API key、Claude 订阅账号,或者 Claude Platform on AWS 时,请求进入的是 Anthropic 相关基础设施,缓存也随之放在 Anthropic 侧的服务端缓存体系里。这里的关键词不是本地,而是 serving infr

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/7/2 19:07:12

5分钟掌握VinXiangQi:免费AI象棋连线工具完全指南

5分钟掌握VinXiangQi:免费AI象棋连线工具完全指南 【免费下载链接】VinXiangQi Xiangqi syncing tool based on Yolov5 / 基于Yolov5的中国象棋连线工具 项目地址: https://gitcode.com/gh_mirrors/vi/VinXiangQi 你是否曾经在对弈中陷入僵局,渴望…

作者头像 李华
网站建设 2026/7/2 19:04:34

这是关于选择器优先级

优先级的计算规则是由四个部分构成,即(a,b,c,d)a: 行内样式的数量(这个数量代表的是有没有内联样式,而非内联样式写了多少,所以只有1和0)b: ID 选择器的数量。…

作者头像 李华
网站建设 2026/7/2 19:00:42

大模型虚构性陈述(Confabulation):比幻觉更危险的AI意图背叛

1. 项目概述:当“幻觉”有了孪生兄弟,我们却一直叫错了它的名字“Hallucination Has a Twin Brother You Probably Never Heard About”——这个标题乍看像一篇科技圈的悬疑小品,但实打实戳中了当前大模型应用落地最隐蔽、也最危险的认知盲区…

作者头像 李华
网站建设 2026/7/2 18:57:25

人工智能:从概念到未来

引言 人工智能(Artificial Intelligence,简称 AI)无疑是当今时代最具变革性的技术力量之一。它已不再是科幻小说中的遥远构想,而是渗透到我们日常生活、工作、乃至社会结构方方面面的现实工具。从智能手机上的语音助手&#xff0c…

作者头像 李华
网站建设 2026/7/2 18:55:02

Memory Decoder:即插即用的领域知识注入新范式

1. 项目概述:不是微调,也不是RAG,而是一种“即插即用”的领域知识注入新范式你有没有遇到过这种场景:手头有个现成的、跑得挺稳的GPT-4或Llama-3模型服务,但客户一开口——“我们医院的电子病历系统要对接,…

作者头像 李华