Flowise零代码搭建AI工作流:5分钟创建RAG聊天机器人实战
1. 为什么你需要一个“不用写代码”的RAG工具?
你有没有遇到过这些情况:
- 公司有几十份产品文档、技术白皮书、内部FAQ,但员工查个问题要翻三四个PDF,最后还是来问同事;
- 想把知识库变成智能问答接口,可LangChain链写到第三层就卡在
Retriever和LLMChain的参数对不上; - 试了三个开源RAG项目,两个跑不起来,一个部署完发现不支持中文分块,检索结果全是乱码。
别折腾了。Flowise 就是为这类真实场景而生的——它不强迫你成为Python工程师,也不要求你背熟向量数据库原理。你只需要像搭乐高一样,把“文档加载器”“文本切分器”“向量库”“大模型”几个模块拖到画布上,连上线,点保存,一个能读你PDF、答你问题的RAG机器人就活了。
这不是概念演示,而是真实可运行的工作流。本文将带你用5分钟,在本地完成从零到一的完整搭建:不改一行代码、不配一个环境变量、不碰一次终端命令(可选跳过),直接打开浏览器,上传一份《Flowise官方使用指南》,让它现场回答“如何添加自定义工具”。
整个过程,就像用PPT做流程图一样自然。
2. Flowise到底是什么?一句话说清它的不可替代性
Flowise 不是另一个需要你写pip install再调from langchain.chains import RetrievalQA的框架。它是一个可视化工作流引擎,核心价值在于:把LangChain里那些抽象的类(DocumentLoader、TextSplitter、VectorStore、LLMChain)全部封装成带图标的节点,每个节点都自带配置面板,点开就能填参数。
你可以把它理解成“LangChain的图形化遥控器”——底层依然是LangChain,但你完全不需要知道RecursiveCharacterTextSplitter和CharacterTextSplitter的区别,也不用纠结Chroma和Qdrant哪个更适合中文。
更关键的是,Flowise原生支持vLLM加速的本地大模型。这意味着你不用依赖OpenAI API密钥,也不用担心数据外泄。只要你的机器有显卡,就能跑起一个真正私有、可控、低延迟的RAG服务。
它不是玩具,而是生产级工具:MIT协议、45.6k GitHub星标、周更活跃、插件生态已覆盖SQL查询、网页爬取、邮件集成等100+场景。很多团队已经用它把客服知识库、法务合同库、医疗药品说明书变成了实时问答API。
3. 零门槛部署:两种方式,任选其一
Flowise提供两种开箱即用的部署路径。无论你是喜欢敲命令行的老手,还是只想点几下鼠标的新手,都能立刻上手。
3.1 方式一:Docker一键启动(推荐给所有人)
这是最稳妥、最干净的方式。你不需要安装Node.js、pnpm或Git,只要本机装了Docker,30秒就能跑起来。
docker run -d \ -p 3000:3000 \ -v $(pwd)/flowise-storage:/app/storage \ --name flowise \ flowiseai/flowise执行完这条命令,打开浏览器访问http://localhost:3000,就能看到Flowise的登录页。首次启动会自动初始化数据库和默认用户,无需额外操作。
小贴士:
-v参数挂载了本地目录作为存储卷,确保你创建的所有工作流、上传的文档、配置的模型都不会因容器重启而丢失。这是生产环境必须加的选项。
3.2 方式二:本地源码运行(适合想深度定制的开发者)
如果你希望修改前端UI、调试某个节点逻辑,或者想确认vLLM是否真的在后台加速推理,可以走源码方式。整个过程只需四步:
克隆仓库并进入目录:
git clone https://github.com/FlowiseAI/Flowise.git cd Flowise安装依赖(pnpm比npm快得多):
pnpm install构建前端与后端:
pnpm build启动服务:
pnpm start
服务启动后,同样访问http://localhost:3000。你会看到一个清爽的登录界面,账号密码已在镜像文档中明确给出:
- 用户名:kakajiang@kakajiang.com
- 密码:KKJiang123
注意:首次启动时,vLLM模型加载需要几分钟,请耐心等待右上角状态栏从“Loading…”变为绿色“Ready”。这不是卡死,是模型正在预热。
4. 5分钟实战:从空白画布到可对话的RAG机器人
现在,我们正式进入核心环节。下面每一步都对应界面上的一个真实操作,没有虚构,没有跳步。
4.1 创建新工作流:命名、选择类型、进入画布
登录成功后,点击左上角“+ New Flow”,弹出新建窗口:
- Flow Name:输入
公司产品文档问答 - Description:可选填,比如
基于内部PDF手册的智能客服 - Type:务必选择
Chatflow(这是RAG聊天机器人的专用类型,区别于普通API工作流)
点击“Create”,你将进入一个纯白的画布。这就是你的AI工厂车间。
4.2 拖入四大核心节点:文档加载 → 文本切分 → 向量入库 → 大模型问答
Flowise的节点库在左侧边栏,按功能分类。我们依次拖入以下四个节点,并按顺序连线(箭头方向代表数据流向):
Document Loader(文档加载器)
- 拖入画布,双击打开配置面板
Type选PDF(支持Word、TXT、Markdown等)Name填产品手册(这个名称会在后续节点里被引用)- 点击“Upload Files”,上传一份真实的PDF,比如《Flowise用户指南》
Text Splitter(文本切分器)
- 拖入,连线到Document Loader
- 双击配置:
Type选RecursiveCharacterTextSplitter(最适合中文长文档) Chunk Size填500(每段500字,平衡检索精度和上下文长度)Chunk Overlap填50(相邻段落重叠50字,避免语义断裂)
Vector Store(向量数据库)
- 拖入,连线到Text Splitter
Type选Chroma(轻量、纯内存、无需额外服务,新手首选)Collection Name填product_qa(自定义集合名,便于区分)- 其他保持默认即可
LLM(大语言模型)
- 拖入,连线到Vector Store
Type选vLLM(这是本镜像的核心优势,利用vLLM实现高吞吐低延迟)Model Name填Qwen2-7B-Instruct(镜像已预置该模型,支持中文强推理)Max Tokens填1024(足够生成详细回答)Temperature填0.3(降低随机性,让回答更稳定专业)
4.3 添加Prompt模板:让AI“懂你的语气”
光有模型和知识库还不够,你得告诉AI怎么组织答案。在LLM节点之前,插入一个Prompt Template节点:
- 拖入画布,连线在Vector Store和LLM之间
- 双击配置,在
Template区域粘贴以下内容(已针对中文RAG优化):
你是一个专业的技术支持助手,正在回答用户关于《Flowise用户指南》的问题。 请严格基于提供的文档片段作答,不要编造信息。如果文档中没有相关内容,请直接回答“根据现有资料无法确定”。 文档片段: {context} 用户问题: {query} 请用简洁、准确、专业的中文回答,避免使用“可能”、“大概”等模糊词汇。关键点说明:
{context}和{query}是Flowise自动注入的占位符,分别代表检索到的文档片段和用户提问。你不需要手动替换,系统会动态填充。
4.4 连接最终输出:让聊天框“活”起来
最后一个节点是Chat Output(聊天输出)。它负责把LLM的回答返回给前端聊天界面:
- 拖入画布,连线到LLM节点
- 双击配置,
Name填answer(这个名字将出现在API响应体中)
此时,你的画布应该是一条清晰的直线:Document Loader→Text Splitter→Vector Store→Prompt Template→LLM→Chat Output
4.5 保存、测试、体验真实效果
点击右上角“Save”按钮,给工作流起个名字,比如Product QA Bot。
然后点击右上角的图标,打开内置聊天窗口。输入第一个问题:
“如何在Flowise中添加一个新的自定义工具?”
按下回车。你会看到:
- 左侧显示检索过程(找到哪几页PDF匹配关键词)
- 右侧AI开始思考,几秒后给出结构清晰的回答,精确指向文档中的章节和操作步骤
这不是Demo,这是你刚刚亲手搭建的、完全属于你自己的RAG系统。
5. 进阶能力:不止于问答,还能做什么?
Flowise的强大,远不止于“上传PDF→提问→得答案”。它真正的生产力在于,你能用同样的拖拽逻辑,快速构建出解决实际业务问题的AI应用。
5.1 一键复用100+现成模板
Flowise Marketplace(市场)里已有超过100个经过验证的模板。点击顶部菜单栏的Templates,你能立刻获取:
- Docs Q&A:专为技术文档优化的RAG流程,已预设中文分词和语义检索策略
- Web Scraping Agent:自动抓取竞品官网价格表,存入向量库,供销售实时比价
- SQL Agent:让业务人员用自然语言提问,“上个月华东区销售额Top3的产品是什么?”,自动生成并执行SQL
- Zapier Integration:当CRM新增一条客户线索,自动触发Flowise生成个性化跟进话术
每个模板都可一键导入,然后根据你的数据源(如更换PDF路径、修改数据库连接串)微调,10分钟内就能上线。
5.2 扩展能力:轻松接入外部工具与API
RAG只是起点。Flowise支持通过Tool节点,把任何HTTP API、Shell命令、甚至Python脚本包装成AI可调用的“技能”。
例如,你想让机器人不仅能答文档,还能查实时GPU状态:
- 拖入一个Custom Tool节点
- 在
Code区域填写一段Python(Flowise内置Python沙箱):import subprocess def run_command(): try: result = subprocess.run(['nvidia-smi', '--query-gpu=utilization.gpu,memory.used', '--format=csv'], capture_output=True, text=True, check=True) return result.stdout.strip() except Exception as e: return f"GPU查询失败: {str(e)}" - 在
Function Name填check_gpu_status - 在
Description填 “查询当前服务器GPU使用率和显存占用”
然后,把这个Tool节点接入你的主工作流。当用户问“GPU现在忙吗?”,AI会自动调用这个函数,把结果整合进回答。
这正是MCP(Model Context Protocol)理念的落地——AI不再只是“说”,而是能“做”。
5.3 生产就绪:导出API、嵌入网页、持久化存储
当你在画布上完成调试,下一步就是交付价值:
- 导出REST API:点击工作流右上角
⋯→Export as API,获得一个标准的POST /api/v1/prediction/{flowId}端点。前端、APP、ERP系统,任何能发HTTP请求的地方,都能调用它。 - 嵌入网页:复制
Embed Code,一行JS代码即可把聊天窗口嵌入公司内网首页,员工无需跳转。 - 持久化升级:默认Chroma是内存型,重启即失。在
.env文件中修改VECTOR_STORE=Postgres并配置连接串,所有向量数据将自动存入PostgreSQL,彻底告别丢失风险。
6. 总结:你刚刚掌握的,是一项可立即变现的AI工程能力
回顾这5分钟,你没有写一行Python,没有配置一个YAML,没有查阅任何LangChain文档,却完成了一件传统AI工程师需要半天才能搞定的事:构建一个安全、私有、可扩展的RAG问答系统。
Flowise的价值,不在于它有多“酷炫”,而在于它把AI工程的门槛,从“需要懂向量检索、模型量化、API网关”的专家级,降到了“会用PPT做流程图”的通用级。它让产品经理能自己搭出客服机器人,让法务能一键解析百页合同,让销售能实时生成竞品分析报告。
更重要的是,它不是一个黑盒。你拖进去的每个节点,背后都是标准的LangChain组件;你导出的每个API,都遵循OpenAPI规范;你使用的vLLM,正是业界公认的高性能推理引擎。这意味着,今天你在Flowise里积累的工作流经验,明天就能无缝迁移到代码项目中。
所以,别再把RAG当成一个遥不可及的技术名词。打开你的终端,敲下那条docker run命令,上传第一份文档,问出第一个问题。那个能读懂你知识库的AI助手,已经在等你了。
获取更多AI镜像
想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。