Claude Code 的缓存究竟住在哪里-开发者社区

我们在使用 Claude Code 做长会话开发时，经常会看到一个现象，同一个项目里连续追问时，前几轮可能比较慢，等系统提示、项目规则、工具定义、历史消息这些内容稳定下来，后面的响应会明显顺滑。很多人会自然地去本地目录里找缓存，怀疑它是不是藏在~/.claude下面，或者是不是某个会话文件被 Claude Code 反复读取。这个直觉只对了一小半。Claude Code 的本地目录确实会保存会话记录、项目状态和一些运行数据，但这里讨论的 prompt caching 并不住在本地机器上。它发生在服务端，准确地说，发生在最终承载模型推理请求的那套基础设施里。

这件事要从 Claude Code 的请求路径说起。Claude Code 每次和模型交互，都不是把某个神秘的本地状态直接交给模型，而是把当前回合所需的上下文重新组织成一次网络请求。这个请求里会包含系统提示、项目上下文、工具定义、历史消息、工具结果以及本轮输入。prompt caching 的价值正在这里，它让服务端识别这些请求开头部分里那些连续重复的内容，并把已经处理过的 prefix 复用起来。Anthropic 的文档把 prompt caching 描述为一种从 prompt 的特定 prefix 恢复处理的机制，用来减少重复任务和稳定 prompt 元素带来的处理时间与成本。

缓存放在哪里，不由 Claude Code 这个 CLI 单独决定，而由认证方式和请求最终流向决定。使用 Claude API key、Claude 订阅账号，或者 Claude Platform on AWS 时，请求进入的是 Anthropic 相关基础设施，缓存也随之放在 Anthropic 侧的服务端缓存体系里。这里的关键词不是本地，而是 serving infr

5分钟掌握VinXiangQi：免费AI象棋连线工具完全指南

5分钟掌握VinXiangQi：免费AI象棋连线工具完全指南【免费下载链接】VinXiangQi Xiangqi syncing tool based on Yolov5 / 基于Yolov5的中国象棋连线工具项目地址: https://gitcode.com/gh_mirrors/vi/VinXiangQi 你是否曾经在对弈中陷入僵局，渴望…

李华

大模型虚构性陈述（Confabulation）：比幻觉更危险的AI意图背叛

1. 项目概述：当“幻觉”有了孪生兄弟，我们却一直叫错了它的名字“Hallucination Has a Twin Brother You Probably Never Heard About”——这个标题乍看像一篇科技圈的悬疑小品，但实打实戳中了当前大模型应用落地最隐蔽、也最危险的认知盲区…

李华

3D 堆叠技术：国产 AI 芯片突破‘内存墙’与‘面积墙’，弯道超车的关键！

AI 芯片发展遇难题，3D 堆叠技术成新选择AI 大模型迭代速度惊人，可存储与带宽增速却追不上模型膨胀，‘内存墙’问题困扰行业已久。而且，当前主流的 2.5D 封装技术是单一平面扩展，布局布线资源受限、集成密度低&#xff…

李华

人工智能：从概念到未来

引言人工智能（Artificial Intelligence，简称 AI）无疑是当今时代最具变革性的技术力量之一。它已不再是科幻小说中的遥远构想，而是渗透到我们日常生活、工作、乃至社会结构方方面面的现实工具。从智能手机上的语音助手&#xff0c…

李华

Memory Decoder：即插即用的领域知识注入新范式

1. 项目概述：不是微调，也不是RAG，而是一种“即插即用”的领域知识注入新范式你有没有遇到过这种场景：手头有个现成的、跑得挺稳的GPT-4或Llama-3模型服务，但客户一开口——“我们医院的电子病历系统要对接，…

李华

5分钟掌握VinXiangQi：免费AI象棋连线工具完全指南

这是关于选择器优先级

大模型虚构性陈述（Confabulation）：比幻觉更危险的AI意图背叛

3D 堆叠技术：国产 AI 芯片突破‘内存墙’与‘面积墙’，弯道超车的关键！

人工智能：从概念到未来

Memory Decoder：即插即用的领域知识注入新范式