人工智能实战:RAG 权限泄露怎么防?从公共向量库到文档级 ACL 的企业级权限控制方案
一、问题场景:AI 回答了用户不该看到的内容
企业知识库 RAG 系统最危险的问题之一,不是答错,而是:
答出了用户没有权限看的内容。很多 RAG Demo 都是这样做的:
所有文档 ↓ 统一切分 ↓ 统一向量化 ↓ 写入同一个向量库用户提问时:
全库检索 TopK这在公开知识库里没问题,但企业内部绝对不行。
企业文档通常包括:
1. 员工手册 2. 部门制度 3. 财务内部制度 4. 薪酬绩效资料 5. 客户合同 6. 高管会议纪要 7. 法务文件如果没有权限控制,普通员工可能问:
今年奖金怎么分?系统从高管会议纪要召回内容,然后总结给用户。
这不是模型幻觉,而是系统设计缺陷。
本文解决的问题是: