Langchain-Chatchat搭建本地知识库实战-开发者社区

Langchain-Chatchat 搭建本地知识库实战

在企业数字化转型加速的今天，如何让沉睡的技术文档、制度文件和培训资料真正“说话”，成为一线员工随时可调用的智能助手？这正是本地知识库问答系统的核心价值所在。而Langchain-Chatchat作为当前开源生态中最具代表性的解决方案之一，凭借其灵活的架构设计与强大的中文支持能力，正被越来越多团队用于构建私有化部署的知识引擎。

本文将带你从零开始，完整走通一套基于Langchain-Chatchat的本地知识库搭建流程。我们采用“离线 Embedding + 在线 LLM API”的混合模式，在保障数据隐私的前提下实现高质量语义理解与生成。整个过程涵盖环境准备、模型配置、服务启动到实际测试，并附带关键优化建议，助你避开常见坑点。

环境准备：硬件与软件基础

在动手前，请先确认你的开发环境满足基本要求。以下为本次实测所用配置：

处理器：Intel i7-10700
内存：32 GB DDR4
显卡：NVIDIA RTX 3060（12GB 显存）
硬盘：512GB SSD（建议预留至少 20GB 存储空间用于模型缓存）
操作系统：Windows 11 Pro
Python 版本支持：3.10 ~ 3.11（推荐使用 Anaconda 管理虚拟环境）

⚠️ 注意事项：若计划完全本地化运行大语言模型（如 ChatGLM3、Qwen），对 GPU 显存要求较高（建议 ≥ 6GB）。本文采用在线 API 调用方式降低本地资源消耗，仅 Embedding 模型可在 GPU 上运行以提升性能。

项目部署全流程

源码获取

首先从官方仓库克隆最新版本代码。截至撰写时，稳定版本为v0.2.10。

git clone git@github.com:chatchat-space/Langchain-Chatchat.git cd Langchain-Chatchat

该项目结构清晰，包含后端 API、WebUI 前端、向量数据库初始化脚本等模块，非常适合二次开发或集成进现有系统。

创建独立 Python 环境

强烈建议使用 Conda 隔离依赖，避免与其他项目产生冲突。

conda create -n chatchat python=3.11.7 conda activate chatchat

进入项目根目录后，检查requirements.txt是否完整。如果需要接入智谱 AI（ZhipuAI）等平台，需手动添加对应包：

# 追加至 requirements.txt zhipuai==1.0.7

然后安装全部依赖项：

pip install -r requirements.txt

国内用户推荐使用清华源加速下载：

pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

下载并配置 Embedding 模型

文本向量化是知识检索的关键环节。Langchain-Chatchat 支持多种中文嵌入模型，本文选用效果优异且轻量级的bge-base-zh-v1.5。

前往 ModelScope 魔搭平台下载模型：

git lfs install git clone https://www.modelscope.cn/BAAI/bge-base-zh-v1.5.git

将下载后的模型文件夹移至项目指定路径：

./models/bge-base-zh-v1.5/

当然，你也可以选择其他模型如text2vec-base-chinese或m3e-base，只需同步修改配置即可。

初始化配置文件

首次运行前需复制默认配置模板：

python copy_config_example.py

该命令会自动将config_example/目录下的所有.py示例配置复制到config/目录下，供后续编辑。

修改 model_config.py

打开config/model_config.py文件进行关键设置。

设置模型根路径

MODEL_ROOT_PATH = "E:\\LLM\\Langchain-Chatchat\\models"

确保此路径指向你存放 Embedding 模型的实际位置。

指定 Embedding 模型名称

EMBEDDING_MODEL = "bge-base-zh-v1.5"

接入在线 LLM（以智谱AI为例）

注册智谱开放平台获取 API Key 后填写如下信息：

LLM_MODELS = ["zhipu-api"] ONLINE_LLM_MODEL = { "zhipu-api": { "api_key": "your_api_key_here", # 替换为实际密钥 "version": "glm-4", # 使用 glm-4 提升理解能力 "provider": "ChatGLMWorker", "online_api": True, } }

✅ 实践建议：优先使用glm-4而非glm-3-turbo，前者在复杂推理、长上下文理解和专业术语处理上表现更优。

初始化向量数据库

执行以下命令完成数据库初始化：

python init_database.py --recreate-vs

首次运行可能遇到如下问题：

❌ 报错：`ModuleNotFoundError: No module named 'pwd'`

这是 Windows 系统缺少 Unix 风格用户模块导致的问题。解决方法是在 Python 虚拟环境的Lib/目录下创建一个兼容性文件pwd.py（路径形如：...\Anaconda3\envs\chatchat\Lib\）：

import os def getpwuid(uid): return ('user', '', uid, 0, '', '', '') def getuid(): return 1000 def get_username(): return "windows_user"

保存后重新运行初始化命令即可成功。

启动服务：一键拉起全链路组件

使用内置的一键启动脚本启动全部服务：

python startup.py -a

该命令将依次启动：

FastChat 后端模型服务（用于 LLM 接入）
自定义 API 服务（提供/chat,/knowledge_base等接口）
Streamlit WebUI 界面（前端交互入口）

启动成功后输出日志类似如下：

==============================Langchain-Chatchat Configuration============================== 操作系统：Windows-11-10.0.22621-SP0 python版本：3.11.7 ... 项目版本：v0.2.10 langchain版本：0.0.354. fastchat版本：0.2.35 当前使用的分词器：ChineseRecursiveTextSplitter 当前启动的LLM模型：['zhipu-api'] @ cpu 当前Embeddings模型： bge-base-zh-v1.5 @ gpu 服务端运行信息： OpenAI API Server: http://127.0.0.1:20000/v1 Chatchat API Server: http://127.0.0.1:7861 Chatchat WEBUI Server: http://127.0.0.1:8501 ==============================Langchain-Chatchat Configuration============================== You can now view your Streamlit app in your browser. URL: http://127.0.0.1:8501

此时访问 http://127.0.0.1:8501 即可进入图形化操作界面。

构建知识库并测试问答能力

打开 WebUI 页面后，按以下步骤操作：

进入左侧菜单栏【知识库管理】
点击“新建知识库”，输入名称（如company_policy）
上传本地文档（支持.txt,.pdf,.docx,.md等格式）
点击“添加到知识库”

后台将自动执行以下流程：

加载文件 → 解析内容 → 分块处理（splitter）→ 向量化（embedding）→ 存入向量数据库

处理时间取决于文档大小和硬件性能，初次建库较慢，后续增量更新较快。

待处理完成后，切换至【对话】标签页：

选择目标知识库
输入问题，例如：“年假如何申请？”
查看 AI 是否能基于上传文档给出准确回答

✅ 成功示例：

Q: 新员工试用期多久？
A: 根据《员工手册》第三章第二节，新入职员工试用期为三个月，表现优秀者可提前转正。

❌ 若回答模糊或偏离原文，则需进一步优化配置。

性能调优实战指南

基础功能跑通只是第一步，要实现高精度问答还需针对性优化。以下是几个关键方向的实际经验总结。

启用 GPU 加速 Embedding 计算

虽然 LLM 使用在线 API，但Embedding 模型完全可以跑在 GPU 上，大幅提升向量化速度。

安装 CUDA 与 PyTorch-GPU 版本

下载并安装 CUDA Toolkit 11.8
验证安装：

nvcc -V nvidia-smi

卸载原生 CPU 版本并安装 GPU 版本：

pip uninstall torch torchvision torchaudio pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

测试 GPU 可用性：

import torch print(torch.cuda.is_available()) # 应返回 True

重启项目后，观察日志中 Embedding 模型是否显示@ gpu，表示已启用 GPU 加速。

更换更高精度的 Embedding 模型

不同嵌入模型直接影响检索质量。以下是常见选项对比：

模型名称	特点	推荐指数
`text2vec-base-chinese`	轻量，适合 CPU 环境	★★★☆☆
`bge-base-zh-v1.5`	语义匹配强，支持长文本	★★★★★
`bge-large-zh-v1.5`	更高精度，需更多资源	★★★★☆
`m3e-base`	多粒度嵌入，适合段落检索	★★★★☆

🔍 实践建议：优先尝试bge-large-zh-v1.5，它在 MTEB 中文榜单中排名靠前，尤其擅长处理专业术语和复杂语义关系。

更换方法非常简单：

下载新模型至models/目录
修改EMBEDDING_MODEL = "bge-large-zh-v1.5"
重建知识库（见下文）

提升问答准确率的三大技巧

✅ 调整文本分块策略

默认的ChineseRecursiveTextSplitter是中文场景下的优选分词器，但参数设置直接影响上下文完整性。

编辑config/kb_config.py：

CHUNK_SIZE = 512 # 原始默认值为 250，适当增大有助于保留语义 OVERLAP_SIZE = 50 # 控制块间重叠，防止信息断裂

⚠️ 注意：过大的 chunk size 可能导致细节丢失；建议结合文档类型微调。例如技术文档可设为 512~1024，制度文件可适当减小。

✅ 优化提示词模板（Prompt Engineering）

Langchain-Chatchat 允许自定义 Prompt 模板以增强回答相关性。

编辑config/prompts.py中的KNOWLEDGE_BASE_CHAT_PROMPT：

""" 你是一个专业的问答助手，仅根据提供的上下文回答问题。 如果无法从中得到答案，请说“我不知道”。请尽量简洁明了地回答。 上下文： {context} 问题： {question} """

合理设计 prompt 可有效减少幻觉输出，尤其是在面对未覆盖知识点时引导模型诚实作答。

✅ 清除缓存并重建知识库

每次修改 embedding 模型、分块参数或提示词后，必须重建知识库才能生效：

python init_database.py --recreate-vs

否则仍将使用旧的向量索引，影响测试结果判断。

写在最后：为什么值得投入？

Langchain-Chatchat 并非只是一个玩具项目。它提供了一套开箱即用的本地知识库解决方案，融合了 LangChain 强大的流程编排能力和主流 LLM 接口的支持灵活性，非常适合用于构建企业级私有知识问答系统。

更重要的是，它的架构允许你自由组合组件——你可以选择不同的 Embedding 模型、替换 LLM 提供商、调整检索逻辑甚至接入权限控制模块。这种“积木式”设计让它既能快速验证 MVP，也能逐步演进为生产级系统。

无论是技术文档归档、客户支持知识库，还是组织内部培训系统，这套方案都能让你的知识资产真正“活”起来。未来还可扩展支持 RAG Pipeline、多轮对话记忆、审计日志等功能，打造真正落地的 AI 助手。

立即动手试试吧！你会发现，搭建一个懂你业务的 AI 并没有想象中那么遥远。

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

Langchain-Chatchat搭建本地知识库实战