news 2026/6/9 12:48:50

07-上下文感知的RAG案例

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
07-上下文感知的RAG案例

实现了一个带上下文记忆的 RAG(检索增强生成)问答系统,核心能力是:
1.从指定网页加载 Agent 相关知识并构建向量数据库;
2.基于用户问题从向量库检索相关上下文;
3.结合聊天历史理解用户问题(比如处理指代 / 省略);
4.生成简洁、基于上下文的回答,并保留会话历史。

from langchain_chroma import Chroma from langchain_classic.chains.combine_documents import create_stuff_documents_chain from langchain_classic.chains.history_aware_retriever import create_history_aware_retriever from langchain_classic.chains.retrieval import create_retrieval_chain from langchain_community.document_loaders import WebBaseLoader from langchain_core.chat_history import InMemoryChatMessageHistory from langchain_core.embeddings import Embeddings from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder from langchain_core.runnables import RunnableWithMessageHistory from langchain_text_splitters import RecursiveCharacterTextSplitter from sentence_transformers import SentenceTransformer import bs4 from langchain_demo.my_llm import llm #1.构建向量数据库 class CustomQwen3Embeddings(Embeddings): ''' 定义一个Qwen3的Embedding和lang'chain整合的类 ''' def __init__(self,model_name): self.qwen3_embedding = SentenceTransformer(model_name) #输入的问题向量化 def embed_query(self, text: str) -> list[float]: return self.embed_documents([text])[0] #文本内容向量化 def embed_documents(self, texts: list[str]) -> list[list[float]]: return self.qwen3_embedding.encode(texts) qwen3=CustomQwen3Embeddings('Qwen/Qwen3-Embedding-0.6B') vector_store=Chroma( collection_name='t_agent_blog', embedding_function=qwen3, persist_directory='../chroma.db' ) #2.把网络的关于Agent的博客数据写入向量数据库 def create_dense_db(): loader=WebBaseLoader( web_path=('https://lilianweng.github.io/posts/2023-06-23-agent/',), bs_kwargs=dict( parse_only=bs4.SoupStrainer(class_=("post-content","post-title","post-header")) ) ) docs_list=loader.load() #切割 #初始化文本切割器,设置块大小1000,重叠200 text_splitter=RecursiveCharacterTextSplitter(chunk_size=1000,chunk_overlap=200) #分割文档 splits=text_splitter.split_documents(docs_list) print('doc的数量为:',len(splits)) ids=['id'+str(i+1) for i in range(len(splits))] vector_store.add_documents(documents=splits,ids=ids) #create_dense_db()#首次运行需打开 #3.问题上下文化 #系统提示词 contextualize_q_system_prompt=( "给定聊天历史和最新的用户问题(可能引用聊天历史中的上下文)," "将起重新表述为一个独立的问题(不需要聊天历史也能理解)。" "不要回答问题,只需在需要时重新表述问题,否则保持原样。" ) contextualize_q_prompt=ChatPromptTemplate.from_messages( [ ("system",contextualize_q_system_prompt),#系统角色提示 MessagesPlaceholder("chat_history"),#聊天历史占位符 ("human","{input}"),#用户输入占位符 ] ) #创建一个向量数据库的检索器 retriever=vector_store.as_retriever() #创建一个上下文感知的检索器 history_aware_retriever=create_history_aware_retriever( llm,retriever,contextualize_q_prompt ) #4.RAG的代码 #系统提示词:定义助手的行为和回答规范 system_prompt=( "你是一个问答任务助手。" "使用以下检索到的上下文来回答问题。" "如果不知道答案,就说你不知道。" "回答最多三句话,保持简洁。" "\n\n" "{context}"#从向量数据库中检索处的doc ) #创建问答提示模板 qa_prompt=ChatPromptTemplate.from_messages( [ ("system",system_prompt), MessagesPlaceholder("chat_history"), ("human","{input}"), ] ) question_chain=create_stuff_documents_chain(llm,qa_prompt) RAG_chain=create_retrieval_chain(history_aware_retriever,question_chain) #5.保存历史消息 store={}#用来保存历史消息,key:会话id session_id def get_session_history(session_id:str): """从内存中的历史消息列表中,返回当前会话的所有历史消息""" if session_id not in store: store[session_id] = InMemoryChatMessageHistory() return store[session_id] #创建带历史记录功能的处理链 conversational_rag_chain= RunnableWithMessageHistory( RAG_chain, get_session_history, input_messages_key='input', history_messages_key='chat_history', output_messages_key='answer',#输出消息的键 ) resp1=conversational_rag_chain.invoke( {"input":"What is Task Decomposition?"}, config={ "configurable":{"session_id":"abc123"} } ) print(resp1['answer']) resp2=conversational_rag_chain.invoke( {"input":"What are common ways of doing it"}, config={ "configurable":{"session_id":"abc123"} } ) print(resp2['answer'])

输出:

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/8 11:48:52

Python积分与求导完全指南

📊 Python积分与求导完全指南 📑 目录 求导基础Python求导实战积分基础Python积分实战概率分布函数详解知识点 1. 求导基础 📐 1.1 知识点引入 想象你正在开车,速度表显示的数字就是你的瞬时速度,这个速度其实就是位…

作者头像 李华
网站建设 2026/6/9 11:05:43

SDUT Java 类和对象

6-7 sdut-oop-6-方形矩阵的运算&#xff08;类和对象&#xff09;class Matrix{int n;int[][] matrix;//带参构造方法public Matrix(int n, int[][] matrix) {this.n n;this.matrix matrix;}public Matrix add(Matrix other){int [][ ]resultnew int [n][n];for(int i0;i<…

作者头像 李华
网站建设 2026/6/10 11:53:04

LobeChatUGC内容激励方案

LobeChat UGC内容激励方案 在AI助手从实验室走向千家万户的今天&#xff0c;一个关键问题摆在开发者面前&#xff1a;如何让开源项目不只是“能用”&#xff0c;而是真正“被广泛使用”&#xff1f;答案或许不在于功能堆砌&#xff0c;而在于构建一种用户愿意参与、乐于贡献的内…

作者头像 李华
网站建设 2026/6/9 0:52:22

LobeChat会员等级晋升通知

LobeChat&#xff1a;从容器化部署到智能对话架构的深度实践 在 AI 技术加速落地的今天&#xff0c;大语言模型&#xff08;LLM&#xff09;早已不再是实验室里的概念。越来越多企业开始尝试将 GPT、Claude、Ollama 等强大模型集成进实际业务中——无论是客服系统、知识助手&am…

作者头像 李华
网站建设 2026/6/8 10:47:13

收藏!2025 AI Agent爆发元年,大模型高薪赛道入门全攻略

一句指令触发手机40余款应用自动完成点餐、订票、购物全流程&#xff0c;工厂里人形机器人精准抓取物料替代熟练工劳作&#xff0c;金融AI智能体自主处理业务并优化客户体验——如今&#xff0c;智能体&#xff08;AI Agent&#xff09;正以“对话即执行、虚拟融实体”的姿态&a…

作者头像 李华