06-FAISS向量数据库-开发者社区

①.基于 FAISS（Facebook 开源的高效向量检索库）和 LangChain 构建的中文文本向量检索系统，核心功能是将文本数据向量化后存入 FAISS 向量库，并实现相似性检索。

1.安装FAISS

pip install faiss-cpu，也可以是gpu，看具体使用情况

2.实现代码

import faiss from langchain_community.docstore import InMemoryDocstore from langchain_community.vectorstores import FAISS from langchain_huggingface import HuggingFaceEmbeddings from langchain_core.documents import Document model_name = "BAAI/bge-large-zh-v1.5" model_kwargs = {'device': 'cpu'} encode_kwargs = {'normalize_embeddings': True} # set True to compute cosine similarity bge_hf_embedding = HuggingFaceEmbeddings( model_name=model_name, model_kwargs=model_kwargs, encode_kwargs=encode_kwargs, ) #1.初始化数据库 #先创建索引 #向量维度 index=faiss.IndexFlatL2(1024) vector_store=FAISS( embedding_function=bge_hf_embedding, index=index, docstore=InMemoryDocstore(), index_to_docstore_id={} ) # 2、 准备数据（Document） #page_content里面的数据必须经过向量化，不需要向量化的数据放在metadata document_1 = Document( page_content="今天早餐我吃了巧克力薄煎饼和炒蛋。", metadata={"source": "tweet", "time": "上午"}, ) document_2 = Document( page_content="明天的天气预报是阴天多云，最高气温62华氏度。", metadata={"source": "news"}, ) document_3 = Document( page_content="正在用LangChain构建一个激动人心的新项目——快来看看吧！", metadata={"source": "tweet"}, ) document_4 = Document( page_content="劫匪闯入城市银行，盗走了100万美元现金。", metadata={"source": "news"}, ) document_5 = Document( page_content="哇！那部电影太精彩了，我已经迫不及待想再看一遍。", metadata={"source": "tweet"}, ) document_6 = Document( page_content="新iPhone值得这个价格吗？阅读这篇评测一探究竟。", metadata={"source": "website"}, ) document_7 = Document( page_content="当今世界排名前十的足球运动员。", metadata={"source": "website"}, ) document_8 = Document( page_content="LangGraph是构建有状态智能体应用的最佳框架！", metadata={"source": "tweet"}, ) document_9 = Document( page_content="由于对经济衰退的担忧，今日股市下跌500点。", metadata={"source": "news"}, ) document_10 = Document( page_content="我有种不好的预感，我要被删除了 :(", metadata={"source": "tweet"}, ) documents = [ document_1, document_2, document_3, document_4, document_5, document_6, document_7, document_8, document_9, document_10, ] ids=['id'+str(i+1) for i in range(len(documents))] vector_store.add_documents(documents,ids=ids) #把数据库写入磁盘 vector_store.save_local('../faiss_db') #语言检索 resp=vector_store.similarity_search('今天的投资建议',2) for i in resp: print(i.page_content) print(type(i))

输出：

左边的文件栏也会出现保存的数据库：

②.从保存的向量数据库中进行检索

from langchain_community.docstore import InMemoryDocstore from langchain_community.vectorstores import FAISS from langchain_core.embeddings import Embeddings from sentence_transformers import SentenceTransformer from langchain_core.documents import Document import faiss class CustomQwen3Embeddings(Embeddings): ''' 定义一个Qwen3的Embedding和lang'chain整合的类 ''' def __init__(self,model_name): self.qwen3_embedding = SentenceTransformer(model_name) #输入的问题向量化 def embed_query(self, text: str) -> list[float]: return self.embed_documents([text])[0] #文本内容向量化 def embed_documents(self, texts: list[str]) -> list[list[float]]: return self.qwen3_embedding.encode(texts) qwen3=CustomQwen3Embeddings('Qwen/Qwen3-Embedding-0.6B') #加载数据库 vector_store=FAISS.load_local('../faiss_db',embeddings=qwen3,allow_dangerous_deserialization=True) resp = vector_store.similarity_search_with_score('有美食的内容吗', k=4, filter={"source": 'tweet'}) # 带分数 for i,score in resp: print(type(i)) print(i) print(i.id) print(f"{score:3f}")

输出：

CentOS7最小安装后yum配置全攻略

好的，这是一个非常具体且常见的问题。在最小安装的 CentOS 7 上，yum命令本身是存在的，因为它属于最基础的系统工具。你之所以会遇到“找不到 yum”或“yum 无法使用”的问题，几乎可以肯定是因为最小安装后，系统的软件源…

李华

社区热议：LobeChat能否成为下一代AI门户标准？

社区热议：LobeChat能否成为下一代AI门户标准？ 在大模型技术席卷全球的今天，我们早已不再惊讶于AI能写诗、编程或回答复杂问题。真正让人深思的是：当能力不再是稀缺资源，如何让这些能力以更自然、更安全、更可控的方式触…

李华

HelloLeads WordPress插件授权缺失漏洞(CVE-2025-12696)深度分析

CVE-2025-12696: HelloLeads CRM表单短代码插件中的CWE-862授权缺失漏洞严重性： 漏洞类型： 漏洞 CVE-2025-12696 HelloLeads CRM Form Shortcode WordPress插件（1.0及之前版本）在重置其设置时未进行授权和跨站请求伪造&#xff…

李华

【Java毕设源码分享】基于springboot+vue的游戏账号估价交易平台的设计与实现(程序+文档+代码讲解+一条龙定制)

博主介绍：✌️码农一枚 ，专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者，博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围：&am…

李华

【Java毕设源码分享】基于springboot+vue的音乐网站的设计与分析(程序+文档+代码讲解+一条龙定制)

李华

【Java毕设源码分享】基于springboot+vue的移动端购物系统设计与实现(程序+文档+代码讲解+一条龙定制)

李华