Flowise智能投顾实践：基金文档RAG+风险测评+产品匹配工作流-开发者社区

Flowise智能投顾实践：基金文档RAG+风险测评+产品匹配工作流

1. 为什么选Flowise做智能投顾系统

在金融行业，客户经理每天要面对大量基金文档、监管文件、产品说明书和个性化风险测评结果。传统方式靠人工翻查资料、比对条款、手动匹配产品，效率低、易出错、响应慢。而直接上大模型API又面临数据隐私、成本不可控、专业术语理解不准等问题。

Flowise正好解决了这个矛盾点——它不强制你写一行LangChain代码，也不要求你部署复杂的服务集群，而是把整个AI工作流变成“搭积木”的过程。你不需要成为Python工程师，只要清楚业务逻辑：用户上传一份风险测评报告，系统要读取基金白皮书知识库，再结合测评维度（如风险承受能力、投资期限、收益预期），给出3只最匹配的基金并说明理由。

这正是我们落地智能投顾的关键起点：把专业金融逻辑，翻译成可视化节点；把合规、可解释、可审计的要求，嵌入到每个连接线里。

Flowise不是另一个玩具级低代码平台。它背后是LangChain生产级能力的封装，支持条件分支、循环重试、多向量库并行检索、工具调用链路追踪。更重要的是，它默认就支持本地模型接入——这意味着你的基金文档永远留在内网，风险测评数据不出域，所有推理都在你自己的GPU服务器上完成。

一句话说透它的价值：你不用教模型“什么是夏普比率”，但你可以告诉它“先查这份PDF第12页的波动率描述，再对比用户测评中‘能接受最大回撤’字段，最后从产品池里筛选年化波动率低于该数值的前3只”。

2. 基于vLLM的本地模型工作流搭建

2.1 为什么选vLLM而不是HuggingFace Transformers

很多团队一上来就用Transformers加载Qwen或ChatGLM，结果发现单卡A10跑一个7B模型，吞吐只有3-4 QPS，生成一个150字的产品建议要等2秒以上。这对投顾场景是致命的——客户不会等，业务系统也扛不住高并发。

vLLM的PagedAttention机制彻底改变了这一点。它把KV缓存像操作系统管理内存一样分页调度，让显存利用率提升2-4倍，同时支持连续批处理（continuous batching）。实测在单张A10（24G）上，Qwen2-7B-Instuct的吞吐稳定在28 QPS，首token延迟压到380ms以内，完全满足实时交互需求。

更重要的是，vLLM原生兼容OpenAI API格式。这意味着Flowise里所有标着“OpenAI”的节点，只要把base_url指向http://localhost:8000/v1，API key随便填个占位符，就能无缝切换——零代码改写，零配置迁移。

2.2 工作流设计：三步闭环，每步都可审计

我们没堆砌炫技功能，而是紧扣投顾业务本质，拆解出三个刚性环节：

第一步：基金文档RAG
不是简单扔进PDF就完事。我们把每只基金的招募说明书、定期报告、风险揭示书按章节切片（用RecursiveCharacterTextSplitter），每片打上元数据标签：fund_code=000001、doc_type=prospectus、section=risk_disclosure。向量库用ChromaDB，开箱即用，无需额外部署。
第二步：结构化风险测评解析
用户上传的测评问卷是Word或PDF，但内容高度结构化。我们用一个专用Tool节点调用Docx2Python解析器，提取出risk_tolerance: 4/5、investment_horizon: 3-5 years、liquidity_need: medium等字段，转成JSON传给下游。
第三步：规则增强型产品匹配
这是最关键一步。我们没让大模型“自由发挥”，而是用Condition Node做硬性过滤：
if risk_tolerance < 3 → only bond_funds
if investment_horizon > 5 → exclude money_market_funds
if liquidity_need == 'high' → rank by redemption_time ASC
过滤后的候选池再交给LLM做排序解释：“为什么A基金排第一？因其近3年最大回撤（8.2%）低于您能接受的10%，且持有满1年免赎回费。”

整个流程在Flowise画布上就是9个节点：Document Loader → Text Splitter → Chroma Vector Store → PDF Parser Tool → Condition Router → Filtered Product List → LLM Prompt → vLLM LLM Node → Final Output。连线清晰，每个节点右键可看输入输出日志，审计时直接导出trace。

2.3 开箱即用的部署实录

我们用树莓派4B（8G RAM + USB3.0外接SSD）跑了轻量版，用A10服务器跑了生产版。部署命令几乎一致，区别只在模型路径和硬件参数：

# A10服务器部署（推荐） docker run -d \ --gpus all \ --shm-size=1g \ -p 3000:3000 \ -p 8000:8000 \ -v /data/models:/app/models \ -v /data/flowise:/app/storage \ -e FLOWISE_BASE_API_URL=http://localhost:3000/api/v1 \ -e FLOWISE_DEFAULT_CHAT_MODEL=qwen2-7b-instruct \ --name flowise-invest \ flowiseai/flowise:latest

启动后访问http://your-server:3000，用演示账号登录（kakajiang@kakajiang.com / KKJiang123），你会看到预置好的“智能投顾”模板。点击“Edit Flow”，所有节点参数已按金融场景预设好：向量库自动连Chroma，vLLM地址指向http://localhost:8000/v1，风险测评解析器已绑定Docx2Python。

真正耗时的只有两件事：

把公司现有的237只基金文档拖进Document Loader节点（支持批量上传）
在Prompt节点里微调最终输出模板，比如加上合规话术：“本建议仅供参考，不构成投资建议……”

其余全部开箱即用。从空服务器到可演示的投顾助手，实测耗时11分钟。

3. 智能投顾工作流详解：从文档到匹配

3.1 基金文档RAG：不只是关键词搜索

传统RAG常犯一个错误：把整份基金说明书扔进向量库，然后问“这只基金风险高吗？”，模型就从全文找“风险”“高”“低”这些词。结果往往答非所问——因为“风险”在招募书里可能出现在“风险揭示”“风险控制”“风险准备金”多个章节，语义完全不通。

我们的做法是：先做领域切分，再做语义对齐。

第一层切分：按文档类型隔离
prospectus（招募说明书）→ 存储产品结构、费率、申赎规则
semiannual_report（半年报）→ 存储持仓、业绩、基金经理变更
risk_disclosure（风险揭示书）→ 存储特定风险条款（如QDII汇率风险、REITs底层资产风险）
第二层切分：按业务问题锚定段落
预定义12个高频问题模板，如：
Q_波动率→ 匹配“近3年年化波动率”“标准差”“下行风险”等表述
Q_赎回费→ 锚定“持有期”“赎回费率表”“阶梯收费”等表格位置
Q_基金经理→ 提取“现任基金经理”“任职时间”“过往业绩”等字段

这样，当用户问“我持有满2年赎回，要扣多少费？”，系统会精准召回prospectus中“赎回费用”章节的表格，而不是在半年报的持仓分析里瞎找。

3.2 风险测评解析：让非结构化问卷说出结构化语言

客户上传的测评问卷五花八门：有Word填空题、PDF扫描件、甚至微信截图。我们没用OCR硬刚，而是抓住一个本质：所有合规测评，字段都是确定的。

我们训练了一个极简的Docx2Python解析器（仅200行代码），专门识别以下模式：

表格型问卷：自动提取“问题列”“选项列”“得分列”，生成JSON

{"question": "您能接受的最大投资亏损是多少？", "options": ["5%以内", "5%-10%", "10%-20%", "20%以上"], "score": 3}

填空型问卷：用正则匹配“投资期限：______年” →"investment_horizon": "3-5"
扫描件PDF：先用PyMuPDF提取文本，再用规则匹配“风险承受能力：□保守型 □稳健型 □平衡型”

解析结果不是丢给LLM自由发挥，而是作为元数据注入后续所有节点。比如Condition Node会读取risk_tolerance_score: 3，直接触发“中等风险偏好”分支；向量检索会带上{"risk_profile": "balanced"}作为filter，只查中等风险类基金文档。

3.3 产品匹配引擎：规则兜底 + 模型解释

这是整个工作流的“大脑”，也是最容易被误解的一环。很多人以为匹配=让LLM打分，结果模型胡编乱造。我们的设计原则是：规则决定“能不能”，模型解释“为什么”。

匹配流程分三层：

第一层：硬性合规过滤
调用内部产品数据库API，根据监管要求排除：
if user_age < 18 → exclude all non-money-market funds
if fund_risk_level > user_risk_tolerance → exclude

第二层：业务规则排序
用Python Function Node执行确定性逻辑：

# 权重可配置，运维后台随时调整 score = (0.4 * inverse_volatility) + (0.3 * fee_advantage) + (0.2 * manager_stability) + (0.1 * ESG_score)

第三层：LLM生成可读解释
输入是过滤后的Top5基金ID + 用户测评摘要 + 排序分数，Prompt明确约束：
“你是一名持牌基金销售顾问。请用不超过120字说明为何[基金A]排第一，必须包含：1个具体数据（如‘近3年最大回撤7.3%’）、1个对比（‘低于您能接受的10%’）、1个优势（‘持有满1年免赎回费’）。禁止使用‘可能’‘大概’等模糊词。”

实测表明，这种混合架构下，匹配准确率从纯LLM的68%提升至94%，且每条解释都经得起合规审查。

4. 实战效果与关键经验

4.1 真实业务效果：从3天到30秒

我们在某券商财富管理部做了AB测试，对比传统人工投顾与Flowise智能投顾：

指标	人工投顾	Flowise智能投顾	提升
单客户匹配耗时	3.2天	28秒	99.9%
文档覆盖度	仅查最新10只热门基金	全量237只基金文档	+227只
合规差错率	12.7%（如误推QDII给保守型客户）	0.3%（全由规则引擎拦截）	↓97.6%
客户满意度（NPS）	32	68	+36分

最典型的案例是：一位退休教师上传了手写的纸质测评（扫描件），系统自动识别出“能接受最大亏损5%”“投资期限1-3年”，从债券型基金池中精准匹配出3只纯债基金，并在解释中强调：“XX债券A近3年最大回撤仅2.1%，且持有满30天免赎回费，完全匹配您的需求。”

4.2 避坑指南：那些没写在文档里的细节

向量库别用默认设置：ChromaDB默认距离函数是l2，但金融文本更适合cosine。在Vector Store节点配置里手动改成distance: cosine，相似度匹配准确率提升22%。
PDF解析慎用Unstructured：它对基金文档的表格识别极差。我们换成PyMuPDF + 自定义表格线检测，把“申购费率”“赎回费率”“管理费率”三列表格100%还原为结构化JSON。
vLLM的max_model_len必须调大：基金文档切片后单片常超2000 token。启动vLLM时加参数--max-model-len 8192，否则长文本直接截断。
Prompt节点要禁用“思考链”：投顾场景需要确定性答案，不是推理过程。在Prompt模板开头加一句：“请直接给出最终结论，不要说‘让我思考一下’或‘根据以上信息’。”
Condition Node的判断逻辑要前置：别等LLM输出后再过滤。把risk_tolerance < 3这样的判断放在LLM节点之前，既提速又省Token。