Flowise本地部署详解：树莓派也能跑的AI工作流平台-开发者社区

Flowise本地部署详解：树莓派也能跑的AI工作流平台

1. 为什么是Flowise？——轻量、可视、真本地

你有没有过这样的困扰：想把公司内部文档变成智能问答系统，但写LangChain代码太费时间；想快速验证一个RAG想法，又不想搭一整套后端服务；甚至只是想在树莓派上跑个能对话的AI助手，却发现大多数框架动辄要16G显存？

Flowise就是为这些“小而实”的需求生的。

它不是另一个大模型训练框架，而是一个专注工作流编排的可视化平台。你可以把它理解成AI世界的“乐高”——不用从零造轮子，直接拖拽节点、连线配置，5分钟就能拼出一个带向量检索的问答机器人，导出API后嵌入到现有系统里，连前端都不用改。

更关键的是，它真的能在树莓派4（4GB内存版）上稳稳运行。这不是营销话术，而是实测结果：用vLLM优化过的本地模型推理+精简Node.js后端，内存常驻仅占用约1.2GB，CPU负载可控，全程离线，数据不出设备。

它不追求“最强大”，但足够“刚刚好”——对中小团队、个人开发者、教育场景和边缘AI应用来说，这种开箱即用的确定性，比参数调优的自由度更重要。

2. 部署前必读：环境与边界认知

在敲下第一条命令前，请先确认三件事：

你的目标设备是否满足最低要求？
Flowise本身对硬件要求极低（Node.js 18+ + 1GB内存即可启动），但真正吃资源的是它背后驱动的AI模型。如果你计划用Llama-3-8B-Instruct这类模型，树莓派4需搭配vLLM量化版本（如AWQ或GGUF格式），否则会因内存不足直接OOM。我们推荐起步使用Phi-3-mini（3.8B）或TinyLlama（1.1B）这类轻量模型，它们在树莓派上响应快、温度低、无需散热风扇。
你想要“纯本地”还是“混合部署”？
Flowise支持双模式：
纯本地：所有组件（前端、后端、向量库、模型）都在同一台设备运行，适合隐私敏感或无网络环境；
混合部署：模型放在另一台高性能机器（如NVIDIA Jetson或旧笔记本），Flowise通过LocalAI或Ollama协议远程调用，本机只负责流程调度和界面展示。本文聚焦前者。
你是否接受“首次启动稍慢”？
因为vLLM需要预加载模型权重并构建CUDA图（即使在树莓派上也走OpenBLAS加速路径），首次启动可能需要2–4分钟。之后热启动只需10秒内。这不是Bug，是性能换来的稳定性。

记住：Flowise的价值不在“跑得多快”，而在“改得多快”。一次拖拽调整，比改三处LangChain代码、重跑测试、查日志更省心。

3. 树莓派实操部署：从系统准备到网页登录

以下步骤已在Raspberry Pi OS (64-bit, Bookworm) + 树莓派4B 4GB上完整验证，全程无需桌面环境，SSH终端即可完成。

3.1 系统基础准备

# 更新系统并安装必要编译工具 sudo apt update && sudo apt upgrade -y sudo apt install -y cmake libopenblas-dev python3-pip git curl wget # 启用swap（树莓派默认无swap，模型加载时易内存溢出） sudo dphys-swapfile swapoff sudo sed -i 's/CONF_SWAPSIZE=100/CONF_SWAPSIZE=2048/' /etc/dphys-swapfile sudo dphys-swapfile setup sudo dphys-swapfile swapon # 安装Node.js 18（Flowise官方推荐版本） curl -fsSL https://deb.nodesource.com/setup_18.x | sudo -E bash - sudo apt-get install -y nodejs

小贴士：libopenblas-dev是vLLM在ARM平台高效推理的关键依赖，漏掉会导致模型加载失败或速度骤降。

3.2 获取并构建Flowise

# 创建工作目录，避免权限混乱 mkdir -p ~/flowise-deploy && cd ~/flowise-deploy # 克隆官方仓库（注意：使用main分支，非旧版v1） git clone https://github.com/FlowiseAI/Flowise.git cd Flowise # 复制环境配置模板 cp packages/server/.env.example packages/server/.env # 编辑.env文件，启用本地模型支持（关键！） nano packages/server/.env

在.env文件中，确保以下几行已取消注释并按需修改：

# 启用vLLM后端（必须） FLOWISE_VLLM_ENABLED=true # 指定模型路径（假设你已下载Phi-3-mini到/home/pi/models） VLLM_MODEL_ID=/home/pi/models/phi-3-mini-4k-instruct-q4_k_m.gguf # 设置vLLM启动参数（适配树莓派内存） VLLM_ARGS=--dtype=auto --quantization=awq --gpu-memory-utilization=0.8 # 关闭不需要的服务（节省内存） FLOWISE_DISABLE_TELEMETRY=true FLOWISE_DISABLE_ANALYTICS=true

注意：.env中不要填写OPENAI_API_KEY—— 我们走纯本地路线，这个字段留空或删除即可。若误填，Flowise会优先尝试调用OpenAI，导致本地模型失效。

3.3 安装依赖与构建服务

# 使用pnpm（比npm更快，尤其在ARM上） curl -fsSL https://get.pnpm.io/install.sh | sh - source ~/.zshrc # 或 ~/.bashrc，根据你用的shell # 安装依赖并构建 pnpm install pnpm build # 启动服务（后台运行，便于后续查看日志） nohup pnpm start > flowise.log 2>&1 &

启动后，等待约3分钟。可通过以下命令观察模型加载状态：

# 实时查看日志（Ctrl+C退出） tail -f flowise.log

当看到类似以下输出时，说明核心服务已就绪：

[INFO] vLLM server started on http://localhost:8000 [INFO] Flowise server listening on http://localhost:3000 [INFO] All services initialized successfully

3.4 首次登录与基础验证

打开浏览器，访问http://<树莓派IP>:3000（例如http://192.168.1.123:3000）。

使用文档中提供的默认账号登录：

用户名：kakajiang@kakajiang.com
密码：KKJiang123

登录后你会看到干净的画布界面。此时无需任何配置，直接点击左上角「Templates」→「Docs Q&A」，选择一个模板一键导入。

稍等几秒，Flowise会自动创建包含「Document Loader」「Text Splitter」「Vector Store」「LLM」四个节点的工作流。点击右上角「Run」按钮，输入一句问题如：“什么是RAG？”，即可获得基于模板内置示例文档的回答。

这一步成功，代表：

前端界面可访问
后端API通路正常
vLLM模型已加载并可推理
向量库（默认Chroma）初始化完成

整个过程，你没写一行代码，也没碰过Python。

4. 工作流实战：三步搭建一个“会议纪要摘要助手”

光能跑还不够，得解决真实问题。下面我们用一个典型办公场景，演示Flowise如何把抽象能力变成具体生产力。

4.1 场景需求

你每周参加3场线上会议，录音转文字后得到大量文本（单次2000–5000字）。人工提炼要点耗时且易遗漏。目标：上传TXT文件，自动生成3条核心结论+5条待办事项。

4.2 节点搭建（纯拖拽，无代码）

添加「File Upload」节点
→ 从左侧节点栏拖入画布，这是用户上传文件的入口。
连接「Text Splitter」节点
→ 将File Upload的输出连线至Text Splitter，设置分块大小为500字符（适配Phi-3上下文窗口）。

添加「LLM」节点并配置提示词
→ 拖入LLM节点，下拉选择「vLLM」，保持默认配置；
→ 双击编辑，在「System Message」中粘贴以下提示词（已针对摘要任务优化）：

你是一位专业的会议助理。请严格按以下格式输出： 【核心结论】 1. ... 2. ... 3. ... 【待办事项】 1. ... 2. ... 3. ... 4. ... 5. ... 不要添加任何解释、标题外内容或额外符号。

连接「Prompt」节点（可选但推荐）
→ 在LLM前插入Prompt节点，将Text Splitter的分块文本与上述系统指令组合，确保每次只处理一小段，提升准确性。
添加「Response」节点
→ 将LLM输出连至此节点，作为最终返回给用户的响应。

完成后，点击「Save」保存工作流，命名为“会议纪要摘要”。

4.3 效果验证与调优技巧

上传一份真实的会议记录TXT（建议先用1000字以内小文件测试），点击「Run」。

你大概率会看到第一版输出格式正确但细节偏泛。这时只需两步微调：

调整分块策略：将Text Splitter的chunkSize从500改为300，让模型更聚焦每段重点；
强化提示词约束：在System Message末尾追加：“若原文未提及某类信息，请写‘未提及’，不可虚构。”

无需重启服务，保存后立即生效。这就是可视化工作流的核心优势：反馈闭环以秒计，而非小时计。

5. 进阶能力：不只是聊天机器人

Flowise常被当作“LangChain图形界面”，但它能做的远超想象。以下是三个被低估、却极易上手的实用方向：

5.1 本地知识库API化：三行命令的事

很多团队卡在“怎么把知识库变成API”。Flowise的答案是：

在工作流中，用「Document Loader」加载PDF/Markdown/CSV；
用「Vector Store」节点选择Chroma（默认，无需额外部署）；
导出该工作流为REST API（右上角「Export」→「API Endpoint」）。

生成的API地址形如：POST http://<树莓派IP>:3000/api/v1/prediction/<workflow-id>
请求体只需传{ "question": "XXX" }，返回就是结构化JSON答案。

这意味着：

企业微信/钉钉机器人可直接调用；
内部OA系统表单提交后，自动触发知识检索；
甚至用curl写个Shell脚本，每天早会前推送“昨日FAQ摘要”。

没有Nginx反向代理、没有JWT鉴权配置——API天生就带着基础认证（登录态继承），安全且轻量。

5.2 条件分支：让AI学会“看情况办事”

Flowise原生支持if-else逻辑。举个例子：你想做一个“客户咨询分流器”——

若用户消息含“退款”“退货”，转给售后节点；
若含“教程”“怎么用”，转给帮助中心节点；
其余走通用客服节点。

操作只需：

拖入「Condition」节点；
在「Condition Expression」中写JS表达式：$input.includes("退款") || $input.includes("退货")；
连接三条不同输出线到对应LLM节点。

整个过程像配置路由器QoS规则一样直观。你不需要懂AST解析，Flowise在后台已帮你编译执行。

5.3 模型热切换：一个平台，多种风格

你不必为每个任务部署独立服务。Flowise允许在同一工作流中动态切换模型：

在LLM节点设置中，开启「Model Switcher」；
预先在vLLM中加载多个GGUF模型（如Phi-3用于速答、TinyLlama用于长文本）；
用「Set Variable」节点接收用户指定的model_name参数；
LLM节点自动路由到对应模型实例。

效果是：用户提问时附带{"model": "phi-3"}，就用轻量模型快速响应；附带{"model": "tinyllama"}，就用长上下文模型深度分析。一切发生在毫秒级，用户无感知。

6. 稳定性与维护：让树莓派7×24小时可靠运行

部署完成只是开始。长期运行需关注三点：

6.1 内存与温度监控

树莓派不是服务器，需主动防护：

# 查看实时内存占用（重点关注%MEM列） ps aux --sort=-%mem | head -10 # 监控CPU温度（超过70℃建议加散热片） vcgencmd measure_temp # 设置自动清理缓存（每日凌晨2点） echo "0 2 * * * sync && echo 3 > /proc/sys/vm/drop_caches" | crontab -

6.2 日志管理与故障自愈

Flowise日志默认写入flowise.log，但长期运行会膨胀。建议：

# 安装logrotate sudo apt install logrotate # 创建配置 sudo tee /etc/logrotate.d/flowise << 'EOF' /home/pi/flowise-deploy/flowise.log { daily missingok rotate 7 compress delaycompress notifempty create 0644 pi pi } EOF

若服务意外退出，可用systemd守护：

sudo tee /etc/systemd/system/flowise.service << 'EOF' [Unit] Description=Flowise AI Workflow Service After=network.target [Service] Type=simple User=pi WorkingDirectory=/home/pi/flowise-deploy/Flowise ExecStart=/usr/bin/pnpm start Restart=always RestartSec=10 Environment=NODE_ENV=production [Install] WantedBy=multi-user.target EOF sudo systemctl daemon-reload sudo systemctl enable flowise sudo systemctl start flowise

6.3 升级与备份策略

升级Flowise：cd ~/flowise-deploy/Flowise && git pull && pnpm install && pnpm build，然后sudo systemctl restart flowise；
备份工作流：所有工作流JSON存储在packages/server/storage/workflows/，定期压缩上传至NAS或Git私有仓库；
模型备份：GGUF模型文件单独存放，不随Flowise代码更新，避免重复下载。