LangChain实战快速入门笔记（三）--LangChain使用之Memory-开发者社区

LangChain实战快速入门笔记（三）–LangChain使用之Memory

文章目录

LangChain实战快速入门笔记（三）--LangChain使用之Memory
一、Memory概述
- 1. 🤖：为什么需要Memory？
- 2. 🤖：什么是Memory？
- 3. Memory的设计理念
- 4. 🤖：不使用Memory模块，如何拥有记忆？
二、基础Memory模块的使用
- 1. Memory模块的设计思路
- 2. ChatMessageHistory(基础)
- 3. ConversationBufferMemory
- - 🌙场景1：入门使用
  - 🌙场景2：结合chain
  - 二者对比
- 4. ConversationChain
- - 举例1：使用PromptTemplate
  - 举例2：使用内置默认格式的提示词模版（内部包含input、history变量）
- 5.ConversationBufferWindowMemory
- - 🌙场景1：入门使用
  - 🌙 场景2：结合chain
三、其他Memory模块
- 1. ConversationTokenBufferMemory
- 2. ConversationSummaryMemory
- - 🌙场景1：
  - 🌙场景2：
- 3. ConversationSummaryBufferMemory
- - 🌙场景1：入门使用
  - 🌙场景2：客服
- 4. ConversationEntityMemory(了解)
- - 对比：ConversationSummaryMemory 和 ConversationEntityMemory
- 5. ConversationKGMemory(了解)
- 6. VectorStoreRetrieverMemory(了解)
总结

一、Memory概述

1. 🤖：为什么需要Memory？

大多数的大模型应用程序都会有一个会话接口，允许我们进行多轮的对话，并有一定的上下文记忆能力。

❗❗但实际上，

模型本身是不会记忆任何上下文的，只能依靠用户本身的输入去产生输出。

🤖：如何实现记忆功能呢？

实现这个记忆功能，就需要额外的模块去保存我们和模型对话的上下文信息，然后在下一次请求时，把所有的历史信息都输入给模型，让模型输出最终结果。

而在 LangChain 中，提供这个功能的模块就称为
Memory(记忆)，用于存储用户和模型交互的历史信息。

2. 🤖：什么是Memory？

Memory，是LangChain中用于多轮对话中保存和管理上下文信息（比如文本、图像、音频等）的组件。它让应用能够记住用户之前说了什么，从而实现对话的感知的链式对话系统提供了基础。

3. Memory的设计理念

输入问题：({“question”: …})
读取历史消息：从Memory中READ历史消息（{“past_messages”: […]}）
构建提示（Prompt)：读取到的历史消息和当前问题会被合并，构建一个新的Prompt
模型处理：构建好的提示会被传递给语言模型进行处理。语言模型根据提示生成一个输出。
解析输出：输出解析器通过正则表达式 regex(“Answer: (.*)”)来解析，返回一个回答（{“answer”: …}）给用户
得到回复并写入Memory：新生成的回答会与当前的问题一起写入Memory，更新对话历史。Memory会存储最新的对话内容，为后续的对话提供上下文支持。

问题：一个链如果接入了Memory 模块，其会与Memory模块交互几次呢？

Answer：链内部会与Memory 模块进行两次交互：读取和写入：
1、收到用户输入时，从记忆组件中查询相关历史信息，拼接历史信息和用户的输入到提示词中传给LLM。
2、返回响应之前，自动把LLM返回的内容写入到记忆组件，用于下次查询。

4. 🤖：不使用Memory模块，如何拥有记忆？

不借助LangChain情况下，我们如何实现大模型的记忆能力？

思考：通过messages 变量，不断地将历史的对话信息追加到对话列表中，以此让大模型具备上下文记忆能力。

importosimportdotenvfromlangchain_openaiimportChatOpenAI dotenv.load_dotenv()os.environ['OPENAI_API_KEY']=os.getenv('OPENAI_API_KEY')os.environ['OPENAI_BASE_URL']=os.getenv('OPENAI_BASE_URL')# 创建大模型实例llm=ChatOpenAI(model='gpt-4o-mini')

fromlangchain.promptsimportChatPromptTemplatefromlangchain_openaiimportChatOpenAIfromlangchain_core.messagesimportSystemMessage,HumanMessage,AIMessage llm=ChatOpenAI(model='gpt-4o-mini')defchat_with_model(question):# 步骤一: 初始化消息chat_prompt_template=ChatPromptTemplate.from_messages([('system','你是一位人工智能小助手'),('human','{question}')])# 步骤二: 定义一个循环:whileTrue:# 步骤三: 调用模型chain=chat_prompt_template|llm response=chain.invoke({'question':question})# 步骤四: 获取模型回答print(f"模型回答:{response.content}")# 询问用户是否还有其他问题user_input=input("您还有其他问题想问嘛？(输入'退出'结束对话) ")# 设置结束循环的条件ifuser_input=="退出":break# 步骤五: 记录用户回答chat_prompt_template.messages.append(AIMessage(content=response.content))chat_prompt_template.messages.append(HumanMessage(content=user_input))chat_with_model("你好")

相应几次的问题分别是：

这种形式是最简单的一种让大模型具备上下文知识的存储方式，任何记忆的基础都是所有聊天交互的历史记录。即使这些不全部直接使用，也需要以某种形式存储。

二、基础Memory模块的使用

1. Memory模块的设计思路

🤖：如何设计Memory模块？

层次1(最直接的方式)：保留一个聊天消息列表

层次2(简单的新思路)：只返回最近交互的k条消息

层次3(稍微复杂一点)：返回过去k条消息的简洁摘要

层次4(更复杂)：从存储的消息中提取实体，并且仅返回有关当前运行中引用的实体的信息

LangChain的设计：
针对上述情况，LangChain构建了一些可以直接使用的Memory 工具，用于存储聊天消息的一系列集成。

2. ChatMessageHistory(基础)

ChatMessageHistory是一个用于存储和管理对话消息的基础类，它直接操作消息对象（如HumanMessage, AIMessage 等），是其它记忆组件的底层存储工具。

在API文档中，ChatMessageHistory 还有一个别名类：InMemoryChatMessageHistory；导包时，需
使用：from langchain.memory import ChatMessageHistory

特点：
• 纯粹是消息对象的“存储器”，与记忆策略（如缓冲、窗口、摘要等）无关。
• 不涉及消息的格式化（如转成文本字符串）

🌙场景1：记忆存储
ChatMessageHistory是用于管理和存储对话历史的具体实现。

#1.导入相关包fromlangchain.memoryimportChatMessageHistory#2.实例化ChatMessageHistory对象history=ChatMessageHistory()#3.添加UserMessagehistory.add_user_message("hi")#4.添加AIMessagehistory.add_ai_message("whats up?")#5.返回存储的所有消息列表print(history.messages)

🌙场景2：对接LLM

fromlangchain.memoryimportChatMessageHistory history=ChatMessageHistory()history.add_ai_message("我是一个无所不能的小智")history.add_user_message("你好，我叫小明，请介绍一下你自己")history.add_user_message("我是谁呢？")print(history.messages)# 返回List[BaseMessage]类型

继续👇

# 创建LLMllm=ChatOpenAI(model_name='gpt-4o-mini')llm.invoke(history.messages)

3. ConversationBufferMemory

ConversationBufferMemory是一个基础的对话记忆（Memory）组件，专门用于按原始顺序存储完整的对话历史。

使用场景：对话轮次较少、依赖完整上下文的场景（如简单的聊天机器）

特点：
• 完整存储对话历史
• 简单、无裁剪、无压缩
• 与 Chains/Models 无缝集成
• 支持两种返回格式（通过 return_messages 参数控制输出格式）
🌼return_messages=True 返回消息对象列表（List [BaseMessage]）
🌼return_messages=False（默认）返回拼接的纯文本字符串

🌙场景1：入门使用

举例1：

# 1.导入相关包fromlangchain.memoryimportConversationBufferMemory# 2.实例化ConversationBufferMemory对象memory=ConversationBufferMemory()# 3.保存消息到内存中memory.save_context(inputs={'input':"你好，我是人类"},outputs={"output":"你好，我是AI助手"})memory.save_context(inputs={'input':"很开心认识你"},outputs={"output":"我也是"})# 4.读取内存中消息（返回消息内容的纯文本）print(memory.load_memory_variables({}))

注意：
• 不管inputs、outputs的key用什么名字，都认为inputs的key是human，outputs的key是AI。
• 打印的结果的json数据的key，默认是“history”。可以通过ConversationBufferMemory的
memory_key属性修改。

举例2：

# 1.导入相关包fromlangchain.memoryimportConversationBufferMemory# 2.实例化ConversationBufferMemory对象memory=ConversationBufferMemory(return_messages=True)# 3.保存消息到内存中memory.save_context({"input":"hi"},{"output":"whats up?"})# 4.读取内存中消息（返回消息）print(memory.load_memory_variables({}))# 5.读取内存中消息（访问原始消息列表）print(memory.chat_memory.messages)

🌙场景2：结合chain

举例1：使用PromptTemplate

fromlangchain_openaiimportOpenAIfromlangchain.memoryimportConversationBufferMemoryfromlangchain.chains.llmimportLLMChainfromlangchain_core.promptsimportPromptTemplate# 初始化大模型llm=OpenAI(model="gpt-4o-mini",temperature=0)# 创建提示# 有两个输入键：实际输入与来自记忆类的输入 需确保PromptTemplate和ConversationBufferMemory中的键匹配template="""你可以与人类对话。 当前对话: {history} 人类问题: {question} 回复: """prompt=PromptTemplate.from_template(template)# 创建ConversationBufferMemorymemory=ConversationBufferMemory()# 初始化链chain=LLMChain(llm=llm,prompt=prompt,memory=memory)# 提问res1=chain.invoke({"question":"我的名字叫Tom"})print(res1)

继续👇：

res=chain.invoke({"question":"我的名字是什么?"})print(res)

举例2：可以通过memory_key修改memory数据的变量名

fromlangchain_openaiimportOpenAIfromlangchain.memoryimportConversationBufferMemoryfromlangchain.chains.llmimportLLMChainfromlangchain_core.promptsimportPromptTemplate# 初始化大模型llm=OpenAI(model="gpt-4o-mini",temperature=0)# 创建提示# 有两个输入键：实际输入与来自记忆类的输入 需确保PromptTemplate和ConversationBufferMemory中的键匹配template="""你可以与人类对话。 当前对话: {chat_history} 人类问题: {question} 回复: """prompt=PromptTemplate.from_template(template)# 创建ConversationBufferMemorymemory=ConversationBufferMemory(memory_key="chat_history")# 初始化链chain=LLMChain(llm=llm,prompt=prompt,memory=memory)# 提问res1=chain.invoke({"question":"我的名字叫Tom"})print(str(res1)+"\n")res=chain.invoke({"question":"我的名字是什么？"})print(res)

说明：创建带Memory功能的Chain，并不能使用统一的LCEL语法。同样地，LLMChain也不能使用管道运算符接StrOutputParser。这些设计上的问题，个人推测也是目前Memory模块还是Beta版本的原因之一吧。

举例3：使用ChatPromptTemplate 和 return_messages

# 1.导入相关包fromlangchain_core.messagesimportSystemMessagefromlangchain.chains.llmimportLLMChainfromlangchain.memoryimportConversationBufferMemoryfromlangchain_core.promptsimport(MessagesPlaceholder,ChatPromptTemplate,HumanMessagePromptTemplate)fromlangchain_openaiimportChatOpenAI# 2.创建LLMllm=ChatOpenAI(model_name='gpt-4o-mini')# 3.创建Promptprompt=ChatPromptTemplate.from_messages([("system","你是一个与人类对话的机器人。"),MessagesPlaceholder(variable_name='history'),("human","问题: {question}")])# 4.创建Memorymemory=ConversationBufferMemory(return_messages=True)# 5.创建LLMChainllm_chain=LLMChain(prompt=prompt,llm=llm,memory=memory)# 6.调用LLMChainres1=llm_chain.invoke({"question":"中国首都在哪里？"})print(res1,end="\n\n")res2=llm_chain.invoke({"question":"我刚刚问了什么？"})print(res2)

二者对比

注意：
我们观察到的现象不是 bug，而是 LangChain 为保障对话一致性所做的刻意设计：

用户提问后，系统应立即"记住"该问题
AI回答后，该响应应即刻加入对话上下文
返回给客户端的结果应反映最新状态

4. ConversationChain

ConversationChain实际上是就是对ConversationBufferMemory和LLMChain进行了封装，并且提供一个默认格式的提示词模版（我们也可以不用），从而简化了初始化ConversationBufferMemory的步
骤。

举例1：使用PromptTemplate

fromlangchain.chains.conversation.baseimportConversationChainfromlangchain_core.prompts.promptimportPromptTemplatefromlangchain.chainsimportLLMChain# 初始化大模型llm=ChatOpenAI(model="gpt-4o-mini")template="""以下是人类与AI之间的友好对话描述。AI表现得健谈，并提供了大量来自其上下文的具体细节。如果AI不知道问题的答案，它会真诚地表示不知道 当前对话: {history} Human: {input} AI:"""prompt=PromptTemplate.from_template(template)# memory = ConversationBufferMemory()## conversation = LLMChain(# llm=llm,# prompt = prompt,# memory=memory,# verbose=True,# )chain=ConversationChain(llm=llm,prompt=prompt,verbose=True)chain.invoke({"input":"你好，你的名字叫小智"})#注意，chain中的key必须是input，否则会报错

chain.invoke({"input":"你好，你叫什么名字？"})

举例2：使用内置默认格式的提示词模版（内部包含input、history变量）

# 1.导入所需的库fromlangchain_openaiimportChatOpenAIfromlangchain.chains.conversation.baseimportConversationChain# 2.初始化大语言模型llm=ChatOpenAI(model='gpt-4o-mini')# 3.初始化对话链conv_chain=ConversationChain(llm=llm)# 4.进行对话resut1=conv_chain.invoke(input="小明有1只猫")# print(resut1)resut2=conv_chain.invoke(input="小刚有2只狗")# print(resut2)resut3=conv_chain.invoke(input="小明和小刚一共有几只宠物？")print(resut3)

5.ConversationBufferWindowMemory

在了解了ConversationBufferMemory记忆类后，我们知道了它能够无限的将历史对话信息填充到History中，从而给大模型提供上下文的背景。但这会导致内存量十分大，并且消耗的token是非常多的，此外，每个大模型都存在最大输入的Token限制。

我们发现，过久远的对话数据往往并不能对当前轮次的问答提供有效的信息，LangChain 给出的解决方式是：ConversationBufferWindowMemory模块。该记忆类会保存一段时间内对话交互的列表，仅使用最近 K 个交互。这样就使缓存区不会变得太大。

特点：
• 适合长对话场景。
• 与Chains/Models无缝集成
• 支持两种返回格式（通过return_messages参数控制输出格式）
🌼return_messages=True返回消息对象列表（List[BaseMessage]
🌼return_messages=False（默认）返回拼接的纯文本字符串

🌙场景1：入门使用

通过内置在LangChain中的缓存窗口(BufferWindow)可以将meomory"记忆"下来。

举例1：

# 1.导入相关包fromlangchain.memoryimportConversationBufferWindowMemory# 2.实例化ConversationBufferWindowMemory对象，设定窗口阈值memory=ConversationBufferWindowMemory(k=2)# 3.保存消息memory.save_context({"input":"你好"},{"output":"怎么了"})memory.save_context({"input":"你是谁"},{"output":"我是AI助手"})memory.save_context({"input":"你的生日是哪天？"},{"output":"我不清楚"})# 4.读取内存中消息（返回消息内容的纯文本）print(memory.load_memory_variables({}))

举例2：
ConversationBufferWindowMemory 也支持使用聊天模型（Chat Model）的情况，同样可以通过
return_messages=True参数，将对话转化为消息列表形式。
示例：pandas 是基于NumPy 的一种工具，该工具是为了解决数据分析任务而创建的。

# 1.导入相关包fromlangchain.memoryimportConversationBufferWindowMemory# 2.实例化ConversationBufferWindowMemory对象，设定窗口阈值memory=ConversationBufferWindowMemory(k=2,return_messages=True)# 3.保存消息memory.save_context({"input":"你好"},{"output":"怎么了"})memory.save_context({"input":"你是谁"},{"output":"我是AI助手小智"})memory.save_context({"input":"初次对话，你能介绍一下你自己吗？"},{"output":"当然可以了。我是一个无所不能的小智。"})# 4.读取内存中消息（返回消息内容的纯文本）print(memory.load_memory_variables({}))

🌙 场景2：结合chain

借助提示词模版去构建LangChain

fromlangchain.memoryimportConversationBufferWindowMemory# 1.导入相关包fromlangchain_core.prompts.promptimportPromptTemplatefromlangchain.chains.llmimportLLMChain# 2.定义模板template="""以下是人类与AI之间的友好对话描述。AI表现得健谈，并提供了大量来自其上下文的具体细节。如果AI不知道问题的答案，它会表示不知道。 当前对话: {history} Human: {question} AI:"""# 3.定义提示词模板prompt_template=PromptTemplate.from_template(template)# 4.创建大模型llm=ChatOpenAI(model="gpt-4o-mini")# 5.实例化ConversationBufferWindowMemory对象，设定窗口阈值memory=ConversationBufferWindowMemory(k=1)# 6.定义LLMChainconversation_with_summary=LLMChain(llm=llm,prompt=prompt_template,memory=memory,verbose=True,)# 7.执行链（第一次提问）respon1=conversation_with_summary.invoke({"question":"你好，我是孙悟空"})# print(respon1)# 8.执行链（第二次提问）respon2=conversation_with_summary.invoke({"question":"我还有两个师傅，一个是唐三藏，一个是菩提老祖"})# print(respon2)# 9.执行链（第三次提问）respon3=conversation_with_summary.invoke({"question":"我今年高考，竟然考上了711"})# print(respon3)# 10.执行链（第四次提问）respon4=conversation_with_summary.invoke({"question":"我叫什么？"})print(respon4)

思考：将参考 k=1 替换成 k=3，会怎样呢？

三、其他Memory模块

1. ConversationTokenBufferMemory

ConversationTokenBufferMemory 是 LangChain 中一种基于Token 数量控制的对话记忆机制。如果字符数量超出指定数目，它会切掉这个对话的早期部分，以保留与最近的交流相对应的字符数量。

特点：
• Token 精准控制
• 原始对话保留

原理：

举例：情况1：

# 1.导入相关包fromlangchain.memoryimportConversationTokenBufferMemoryfromlangchain_openaiimportChatOpenAI# 2.创建大模型llm=ChatOpenAI(model="gpt-4o-mini")# 3.定义ConversationTokenBufferMemory对象memory=ConversationTokenBufferMemory(llm=llm,max_token_limit=10# 设置token上限)# 添加对话memory.save_context({"input":"你好吗？"},{"output":"我很好，谢谢！"})memory.save_context({"input":"今天天气如何？"},{"output":"晴天，25度"})# 查看当前记忆print(memory.load_memory_variables({}))

情况2：

# 1.导入相关包fromlangchain.memoryimportConversationTokenBufferMemoryfromlangchain_openaiimportChatOpenAI# 2.创建大模型llm=ChatOpenAI(model="gpt-4o-mini")# 3.定义ConversationTokenBufferMemory对象memory=ConversationTokenBufferMemory(llm=llm,max_token_limit=50# 设置token上限 token越大，先显示最近的消息)# 添加对话memory.save_context({"input":"你好吗？"},{"output":"我很好，谢谢！"})memory.save_context({"input":"今天天气如何？"},{"output":"晴天，25度"})# 查看当前记忆print(memory.load_memory_variables({}))

2. ConversationSummaryMemory

前⾯的⽅式发现，如果全部保存下来太过浪费，截断时⽆论是按照对话条数还是token都是⽆法保证既节省内存⼜保证对话质量的，所以推出ConversationSummaryMemory、
ConversationSummaryBufferMemory

ConversationSummaryMemory是 LangChain 中一种
智能压缩对话历史的记忆机制，它通过大语言模型(LLM)自动生成对话内容的精简摘要，而不是存储原始对话文本。

这种记忆方式特别适合长对话和需要保留核心信息的场景。

特点：
• 摘要生成
• 动态更新
• 上下文优化

原理：

🌙场景1：

如果实例化ConversationSummaryMemory前，没有历史消息，可以使用构造方法实例化

# 1.导入相关包fromlangchain.memoryimportConversationSummaryMemory,ChatMessageHistoryfromlangchain_openaiimportChatOpenAI# 2.创建大模型llm=ChatOpenAI(model="gpt-4o-mini")# 3.定义ConversationSummaryMemory对象memory=ConversationSummaryMemory(llm=llm)# 4.存储消息memory.save_context({"input":"你好"},{"output":"怎么了"})memory.save_context({"input":"你是谁"},{"output":"我是AI助手小智"})memory.save_context({"input":"初次对话，你能介绍一下你自己吗？"},{"output":"当然可以了。我是一个无所不能的小智。"})# 5.读取消息（总结后的）print(memory.load_memory_variables({}))

🌙场景2：

如果实例化ConversationSummaryMemory前，已经有历史消息，可以调用from_messages()实例化

# 1.导入相关包fromlangchain.memoryimportConversationSummaryMemory,ChatMessageHistoryfromlangchain_openaiimportChatOpenAI# 2.定义ChatMessageHistory对象llm=ChatOpenAI(model="gpt-4o-mini")# 3.假设原始消息history=ChatMessageHistory()history.add_user_message("你好，你是谁？")history.add_ai_message("我是AI助手小智")# 4.初始化ConversationSummaryMemory实例memory=ConversationSummaryMemory.from_messages(llm=llm,# 是生成摘要的原材料 保留完整对话供必要时回溯。当新增对话时，LLM需要结合原始历史生成新摘要chat_memory=history,)print(memory.load_memory_variables({}))# 新摘要信息memory.save_context(inputs={"human":"我的名字叫小明"},outputs={"AI":"很高兴认识你"})print(memory.load_memory_variables({}))print(memory.chat_memory.messages)

3. ConversationSummaryBufferMemory

ConversationSummaryBufferMemory 是 LangChain 中一种混合型记忆机制，它结合了ConversationBufferMemory（完整对话记录）和 ConversationSummaryMemory（摘要记忆）的优
点，在保留最近对话原始记录的同时，对较早的对话内容进行智能摘要。

特点：
• 保留最近N条原始对话：确保最新交互的完整上下文
• 摘要较早历史：对超出缓冲区的旧对话进行压缩，避免信息过载
• 平衡细节与效率：既不会丢失关键细节，又能处理长对话

原理：

🌙场景1：入门使用

情况1：构造方法实例化，并设置max_token_limit

# 1.导入相关的包fromlangchain.memoryimportConversationSummaryBufferMemoryfromlangchain_openaiimportChatOpenAI# 2.定义模型llm=ChatOpenAI(model_name="gpt-4o-mini",temperature=0)# 3.定义ConversationSummaryBufferMemory对象memory=ConversationSummaryBufferMemory(llm=llm,max_token_limit=40,return_messages=True)# 4.保存消息memory.save_context({"input":"你好，我的名字叫小明"},{"output":"很高兴认识你，小明"})memory.save_context({"input":"李白是哪个朝代的诗人"},{"output":"李白是唐朝诗人"})memory.save_context({"input":"唐宋八大家里有苏轼吗？"},{"output":"有"})# 5.读取内容print(memory.load_memory_variables({}))print(memory.chat_memory.messages)

情况2：

# 1.导入相关的包fromlangchain.memoryimportConversationSummaryBufferMemoryfromlangchain_openaiimportChatOpenAI# 2.定义模型llm=ChatOpenAI(model_name="gpt-4o-mini",temperature=0)# 3.定义ConversationSummaryBufferMemory对象memory=ConversationSummaryBufferMemory(llm=llm,max_token_limit=100,return_messages=True)# 4.保存消息memory.save_context({"input":"你好，我的名字叫小明"},{"output":"很高兴认识你，小明"})memory.save_context({"input":"李白是哪个朝代的诗人"},{"output":"李白是唐朝诗人"})memory.save_context({"input":"唐宋八大家里有苏轼吗？"},{"output":"有"})# 5.读取内容print(memory.load_memory_variables({}))print(memory.chat_memory.messages)

🌙场景2：客服

fromlangchain.memoryimportConversationSummaryBufferMemoryfromlangchain.openaiimportChatOpenAIfromlangchain_core.promptsimportChatPromptTemplate,MessagesPlaceholderfromlangchain.chains.llmimportLLMChain# 1. 初始化大语言模型llm=ChatOpenAI(model="gpt-4o-mini",temperature=0.5,max_tokens=500)# 2. 定义提示模板prompt=ChatPromptTemplate.from_messages([("system","你是电商客服助手，用中文友好回复用户问题，保持专业亲切的语气。"),MessagesPlaceholder(variable_name="chat_history"),("human","{input}")])# 3. 创建带摘要缓冲的记忆系统memory=ConversationSummaryBufferMemory(llm=llm,max_token_limit=400,memory_key="chat_history",return_messages=True)# 4. 创建对话链chain=LLMChain(llm=llm,prompt=prompt,memory=memory,)# 5. 模拟多轮对话dialogue=[("你好，我想查询订单12345的状态",None),("这个订单是上周四下的",None),("我现在急着用，能加急处理吗",None),("等等，我可能把订单号写错了，应该是12346",None),("对了，你们退换政策是怎样的",None)]# 6. 执行对话foruser_input,_indialogue:response=chain.invoke({"input":user_input})print(f"用户:{user_input}")print(f"客服:{response['text']}\n")# 7. 查看当前记忆状态print("=== 当前记忆内容 ===")print(memory.load_memory_variables({}))

4. ConversationEntityMemory(了解)

ConversationEntityMemory 是一种基于实体的对话记忆机制，它能够智能地识别、存储和利用对话中出现的实体信息（如人名、地点、产品等）及其属性/关系，并结构化存储，使 AI 具备更强的上下文理解和记忆能力。

好处：解决信息过载问题
• 长对话中大量冗余信息会干扰关键事实记忆
• 通过对实体摘要，可以压缩非重要细节（如删除寒暄等，保留价格/时间等硬性事实）

**应用场景：**在医疗等高风险领域，必须用实体记忆确保关键信息（如过敏史）被100%准确识别和拦截。

使用ConversationSummaryMemory

使用ConversationEntityMemory

对比：ConversationSummaryMemory 和 ConversationEntityMemory

举例：

fromlangchain.chains.conversation.baseimportLLMChainfromlangchain.memoryimportConversationEntityMemoryfromlangchain.memory.promptimportENTITY_MEMORY_CONVERSATION_TEMPLATEfromlangchain_openaiimportChatOpenAI# 初始化大语言模型llm=ChatOpenAI(model_name='gpt-4o-mini',temperature=0)# 使用LangChain为实体记忆设计的预定义模板prompt=ENTITY_MEMORY_CONVERSATION_TEMPLATE# 初始化实体记忆memory=ConversationEntityMemory(llm=llm)# 提供对话链chain=LLMChain(llm=llm,prompt=ENTITY_MEMORY_CONVERSATION_TEMPLATE,memory=ConversationEntityMemory(llm=llm),# verbose=True, # 设置为True可以看到链的详细推理过程)# 进行几轮对话，记忆组件会在后台自动提取和存储实体信息chain.invoke(input="你好，我叫蜘蛛侠。我的好朋友包括钢铁侠、美国队长和绿巨人。")chain.invoke(input="我住在纽约。")chain.invoke(input="我使用的装备是由斯塔克工业提供的。")# 查询记忆体中存储的实体信息print("\n当前存储的实体信息:")print(chain.memory.entity_store.store)# 基于记忆进行提问answer=chain.invoke(input="你能告诉我蜘蛛侠住在哪里以及他的好朋友有哪些吗？")print("\nAI的回答:")print(answer)

5. ConversationKGMemory(了解)

ConversationKGMemory是一种基于知识图谱（Knowledge Graph）的对话记忆模块，它比ConversationEntityMemory 更进一步，不仅能识别和存储实体，还能捕捉实体之间的复杂关系，形成结构化的知识网络。

特点：
•知识图谱结构将对话内容转化为**(头实体, 关系, 尾实体)** 的三元组形式
•动态关系推理

举例：

pip install networkx

# 1.导入相关包fromlangchain.memoryimportConversationKGMemoryfromlangchain.chat_modelsimportChatOpenAI# 2.定义LLMllm=ChatOpenAI(model="gpt-4o-mini",temperature=0)# 3.定义ConversationKGMemory对象memory=ConversationKGMemory(llm=llm)# 4.保存会话memory.save_context({"input":"向山姆问好"},{"output":"山姆是谁"})memory.save_context({"input":"山姆是我的朋友"},{"output":"好的"})# 5.查询会话memory.load_memory_variables({"input":"山姆是谁"})

memory.get_knowledge_triplets("她最喜欢的颜色是红色")

6. VectorStoreRetrieverMemory(了解)

VectorStoreRetrieverMemory是一种基于向量检索的先进记忆机制，它将对话历史存储在向量数据库中，通过语义相似度检索相关信息，而非传统的线性记忆方式。每次调用时，就会查找与该记忆关联最高的k个文档。（只提取相关信息给大模型，减少冗余）

**适用场景：**这种记忆特别适合需要长期记忆和语义理解的复杂对话系统。

原理：

举例：

importosimportdotenvfromlangchain_openaiimportOpenAIEmbeddings dotenv.load_dotenv()os.environ['OPENAI_API_KEY']=os.getenv("OPENAI_API_KEY")os.environ['OPENAI_BASE_URL']=os.getenv("OPENAI_BASE_URL")embeddings_model=OpenAIEmbeddings(model="text-embedding-ada-002")

# 1.导入相关包fromlangchain_openaiimportOpenAIEmbeddingsfromlangchain.memoryimportVectorStoreRetrieverMemoryfromlangchain_community.vectorstoresimportFAISSfromlangchain.memoryimportConversationBufferMemory# 2.定义ConversationBufferMemory对象memory=ConversationBufferMemory()memory.save_context({"input":"我最喜欢的食物是披萨"},{"output":"很高兴知道"})memory.save_context({"Human":"我喜欢的运动是跑步"},{"AI":"好的,我知道了"})memory.save_context({"Human":"我最喜欢的运动是足球"},{"AI":"好的,我知道了"})# 3.定义向量嵌入模型embeddings_model=OpenAIEmbeddings(model="text-embedding-ada-002")# 4.初始化向量数据库vectorstore=FAISS.from_texts(memory.buffer.split("\n"),embeddings_model)# 空初始化# 5.定义检索对象retriever=vectorstore.as_retriever(search_kwargs=dict(k=1))# 6.初始化VectorStoreRetrieverMemorymemory=VectorStoreRetrieverMemory(retriever=retriever)print(memory.load_memory_variables({"prompt":"我最喜欢的食物是"}))

总结

记得关注么么哒

LangChain实战快速入门笔记（三）--LangChain使用之Memory