news 2026/4/18 1:11:12

SillyTavern 向量存储配置踩坑记:从卡死到本地部署 Ollama 跑通

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
SillyTavern 向量存储配置踩坑记:从卡死到本地部署 Ollama 跑通

一、为什么需要向量存储?

我猜,你一定是受够了AI角色聊着聊着就“失忆”的困扰,也受够了各种没法落地的复杂方案,才会开始捣鼓SillyTavern的向量存储。

市面上确实很难找到一份清晰、完整的教程,大多含糊不清,我甚至在CSDN上都很难看到有价值的讨论。很多方案治标不治本,我自己就是被坑过来的:想用官方的“数据银行”发现根本找不到,问小助手得到的方案一个比一个不靠谱,最后老老实实选了最笨也最稳的本地部署。

所以,我把这段从一头雾水到最终跑通的完整过程记录下来,希望能给你一份真正能用得上的参考,让你少走些弯路。

二、迷雾中的探索:为什么官方方案和小助手都救不了你

刚开始搜索时,会发现一些看似全面的技术博客,但它们往往止步于理论,读完还是不知道怎么配置。按着官方教程一步步走,结果在“数据银行”的入口处就卡住了。新版里“数据银行”成了“聊天附件”,界面完全不同,教程瞬间失效。

当你发现这条路走不通,转而向各种AI小助手求助时,得到的方案更是五花八门:

方案A:让你去“数据银行”配置,但这入口在新版里根本不存在,纯属误导。
方案B:建议用“OpenAI兼容API”一步搞定,但对只想本地化部署的人来说,这意味着又要去折腾云端服务。
方案C:把锅甩给版本,让你换Transformers源。这正是我走过的死胡同——**卡在0%进度**。命令行黑窗里网络错误不断,这个方案注定失败。

几番折腾,AI小助手在Windows下的不稳定表现让我彻底放弃了这条路。

三、终极选择:最稳的本地部署,Ollama担纲主角

就在想放弃的时候,搜到了一些关于Ollama的讨论。它在本地部署和稳定性上的口碑,让它成了最后的希望。

1. 安装Ollama
访问Ollama官网,下载Windows安装包,一路Next完成安装。

https://ollama.com/download

2. 下载中文嵌入模型
模型是整个系统的大脑,选择了`shaw/dmeta-embedding-zh`。这是个专门为中文优化的轻量级模型,在性能和资源占用上找到了绝佳平衡。

Win+R cmd打开命令行,运行以下命令:

ollama pull shaw/dmeta-embedding-zh

用此命令看到镜像就算成功

3. 酒馆配置

打开 SillyTavern 进行关键配置:

  • API 连接:在API连接面板,点击新增一个连接。类型选择 文本补全,API 地址填写http://localhost:11434。如果看到右侧出现绿色勾,就说明连接成功了。

  • 开启向量存储:点击顶部扩展图标(积木方块)进入“向量存储”。在“向量化源”下拉框中选择 Ollama,然后在下方的“向量化模型”中选择刚配置好的模型。

  • 设置存储容量:memoryCacheCapacity值越大,能缓存的消息越多。我把它改成了500mb

4. 向量化聊天记录

在“聊天向量化设置”里,确保勾选 “已启用聊天消息”,最后点击 “向量化所有消息”。

看到进度条从 0% 开始跳动,直到 100%,心才终于落地。几分钟后,一切完成。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 1:11:11

大厂Agent底层逻辑详解:LangChain、Multi-Agent、A2A(非常详细)

老王桌上放了一瓶农夫山泉,旁边还放了一瓶怡宝。 面试开始前他拧开农夫山泉喝了一口,又拧开怡宝喝了一口,然后对我说:“你知道我为什么同时喝两瓶水吗?” 我一脸懵逼。 老王笑了:“因为我们部门在做 Age…

作者头像 李华
网站建设 2026/4/18 1:09:11

智能代码生成落地困局(长代码稳定性白皮书·2024内部版)

第一章:智能代码生成在长代码中的挑战 2026奇点智能技术大会(https://ml-summit.org) 长代码上下文(通常指超过2000 token的函数体、模块或跨文件逻辑链)对当前主流大语言模型构成系统性压力。模型在生成过程中易出现语义漂移、变量作用域混…

作者头像 李华
网站建设 2026/4/18 1:08:33

零基础学习c语言---函数

(一)函数的概念在我们平时学习数学时,会经常用到函数,一次函数,二次函数,反函数……而在c语言中也引入了函数的概念。(二)库函数在c语言中的函数一般分为库函数和自定义函数。库函数在我们之前的学习中就已经学习了一部分。比如pr…

作者头像 李华
网站建设 2026/4/18 1:07:00

如何防止SQL注入利用存储过程_确保存储过程不拼字符串

必须用sp_executesql代替EXEC实现参数化查询,严格声明参数类型与长度,对表名列名等动态部分采用白名单校验,并对输入参数做强类型声明和范围检查。存储过程中用 sp_executesql 代替 EXEC 才安全直接拼接字符串再执行,哪怕在存储过…

作者头像 李华
网站建设 2026/4/18 1:05:55

程序员的未来在何方?腾讯自爆程序员90%的代码都由AI完成!

不知道大家最近有没有看一个新闻,程序员90%的工作都可以由AI完成,那么程序员未来在哪里呢?今天这篇文章不塑造焦虑,讲讲我个人的故事。去年6月份,我做了一个连自己都觉得疯狂的决定:裸辞,All in…

作者头像 李华
网站建设 2026/4/18 0:53:27

​科捷智能:锂电材料行业智能工厂物流构建实践

锂电材料行业的智能工厂物流构建,本质上是一场与金属污染、信息断裂和安全风险的系统性博弈。市场上不乏提供单一设备或局部方案的供应商,但能够将洁净控制、数据贯通与安全合规整合为一体化交付能力的厂商依然稀缺。科捷智能在锂电材料行业的持续深耕&a…

作者头像 李华