news 2026/5/13 21:38:09

AI开发-python-langchain框架(1-8-1 缓存机制——让 AI 应用“记住”高频问题)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AI开发-python-langchain框架(1-8-1 缓存机制——让 AI 应用“记住”高频问题)

想象一下,你现在是一家大型电商平台的AI架构师。双十一期间,你的智能客服系统每天要处理千万级的用户咨询。每个问题都要调用昂贵的GPT-API,响应慢、成本高,用户投诉飙升……这时候,你会怎么做?"

"我们会发现一个奇怪的现象——每天有30%的问题是完全相同的!用户都在问:'快递几天能到?'、'怎么退货?'、'商品有保修吗?'……每个问题都要调用GPT-4,每次花费0.03美元,一天就是数万美元!更糟的是,相同的回答,用户要等3-5秒才能看到……"

解决方案:引入缓存机制(如下使用sqlite当缓存数据库),当用户问道相同问题时,从缓存里直接给出答案不用将问题在送给大模型,既节约金钱成本也节约时间成本。

直接看代码:

from langchain_community.cache import SQLiteCache from langchain.globals import set_llm_cache from langchain_openai import ChatOpenAI import os #指定缓存 对比提问同样的问题,返回时间 set_llm_cache(SQLiteCache(database_path="langchain_demo.db")) llm = ChatOpenAI( api_key=os.getenv("DEEPSEEK_API_KEY"), base_url=os.getenv("DEEP_URL"), # Deepseek 的 API 基础地址 model="deepseek-v3:671b", # Deepseek 对话模型(可选:deepseek-chat-pro 等高级模型) temperature=0.7, # 温度参数(0-1,越低越稳定) max_tokens=1024 # 最大生成 tokens ) #这时会向数据库里插入一条数据 response =llm.invoke("hello world") print(response.content) #再插入一条数据 注:是否插入要根据提示词和调用的模型(模型参数改变也会认为是不同) response =llm.invoke("how are you") print(response.content) #这时就会从缓存里直接出结果不会送往大模型,数据库里也不会新插入一条数据 response =llm.invoke("hello world") print(response.content)

运行结果:可以看到 第一次的回答和第三次的回答是完全一样的。

Hello! 🌍 How can I assist you today? Whether you have questions, need help with a task, or just want to chat, I'm here for you! 😊 Hey there! Thanks for asking! I'm functioning at full capacity and ready to help you out. While I don't experience feelings in the way humans do, I genuinely enjoy our conversations and am always excited to learn and assist. How can I support you today? I'm all ears! 🌟 Hello! 🌍 How can I assist you today? Whether you have questions, need help with a task, or just want to chat, I'm here for you! 😊

我们可以看到,虽然我么提问了三次问题,但是缓存数据库里只有两条数据,说明第三次提问,回答是从缓存里走的。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/13 13:32:50

好写作AI:期刊审稿政策对AI辅助写作的接纳度与风险防控

从“全面禁止”到“有条件开放”:期刊政策的转型期当研究者按下论文投稿按钮的瞬间,一个关乎稿件命运的新问题日益凸显:期刊的审稿政策,如何审视文中AI参与的痕迹? 从早期部分期刊的“零容忍”禁令,到如今越…

作者头像 李华
网站建设 2026/5/9 3:42:31

AI元人文构想:悬鉴《论马克思对李嘉图政治经济学的批判与超越》

AI元人文构想:悬鉴《论马克思对李嘉图政治经济学的批判与超越》 ——一份关于数字资本主义的元理论批判 岐金兰 与 DeepSeek 摘要 本文以岐金兰提出的“AI元人文构想”理论体系为分析框架,对《论马克思对李嘉图政治经济学的批判与超越》一文进行系统性悬…

作者头像 李华
网站建设 2026/5/9 4:22:45

收藏!大模型入门不踩坑|程序员/小白转行学习全指南

这两年,大模型彻底打破了实验室的壁垒,从高冷的前沿研究成果,走进了每一位程序员、学生、职场转行者的日常工作、学习聊天框,甚至成为了很多人规划职业方向的核心关键词。 不管是私信还是评论区,几乎每天都能收到这样…

作者头像 李华
网站建设 2026/5/6 20:35:48

无法加载 DLL“XXXXXXX.dll”: 找不到指定的模块

今天遇到一个特别的奇怪的问题,昨天运行好好的程序,今天就不行了,总是报错: 无法加载 DLL“XXXXXXX.dll”: 找不到指定的模块。这个dll是fortran语言写的。 deepseek搜了一下解决方案,包括下载depends22_x64看依赖关系…

作者头像 李华
网站建设 2026/5/12 9:15:47

TreeMap、TreeSet与Collections.sort()排序机制揭秘

文章目录 TreeMap、TreeSet与Collections.sort()排序机制揭秘?一、TreeMap与TreeSet:红黑树的奥秘1.1 TreeMap的工作原理1.2 TreeSet的工作原理1.3 Comparable与Comparator的区别1.4 性能比较 二、Collections.sort():排序界的瑞士军刀2.1 Co…

作者头像 李华
网站建设 2026/5/2 14:38:11

从九尾狐AI案例看企业AI培训的技术架构与落地实践

第一章:企业AI培训的技术架构设计 现代企业AI培训需要解决的核心问题是:如何将复杂的AI技术转化为可落地的业务解决方案。九尾狐AI的成功实践为我们提供了一个完整的技术架构参考。 class EnterpriseAI_Training:def __init__(self, training_model, i…

作者头像 李华