手把手教你用Clawdbot搭建飞书智能助手（Qwen3-VL:30B版）-开发者社区

手把手教你用Clawdbot搭建飞书智能助手（Qwen3-VL:30B版）

引言：为什么你需要一个“能看会聊”的办公助手？

想象一下这个场景：你的同事在飞书群里发了一张复杂的业务图表，问“这个季度的趋势怎么样？”。你不需要自己看图分析，只需要@一下你的AI助手，它就能看懂图片，并给出专业的解读和建议。

或者，你收到一份全是英文的技术文档，随手拍张照片发给助手，它就能立刻帮你翻译并总结要点。

这听起来像未来，但其实你现在就能拥有。今天，我就带你从零开始，在CSDN星图AI云平台上，用最强的多模态大模型Qwen3-VL:30B，结合Clawdbot框架，搭建一个完全私有化、部署在你自己服务器上的飞书智能助手。

整个过程不需要你懂复杂的AI部署，也不需要昂贵的硬件。跟着我的步骤，大约1小时，你就能拥有一个既能“看图”又能“聊天”的办公伙伴。

1. 准备工作：选择你的“最强大脑”

1.1 为什么选择Qwen3-VL:30B？

在开始动手之前，我们先聊聊为什么选这个模型。你可以把它理解为一个“全能型天才员工”。

视觉能力顶尖：它不仅能识别图片里的物体（比如猫、狗、杯子），更能理解图片的深层含义。比如一张折线图，它能看出增长趋势、找出异常点；一张产品设计图，它能描述出设计特点和可能的问题。
语言能力强大：基于Qwen3的30B参数版本，它的文本理解和生成能力非常出色，可以流畅对话、写报告、总结文档。
多模态融合：这是它的核心绝活。它能把看到的（图像）和听到的（你的问题）结合起来思考。你问“图片里这个人为什么开心？”，它会根据人物的表情、动作、环境来推理，而不是简单地描述“他在笑”。

简单说，我们要搭建的助手，核心就是这个“大脑”。接下来，我们给它找一个合适的“身体”（服务器）来运行。

1.2 在星图平台一键获取环境

最大的好消息是，我们不需要自己从零配置复杂的GPU环境。CSDN星图AI云平台已经为我们准备好了预装好所有环境的“开箱即用”镜像。

登录星图平台：访问 CSDN星图AI，进入控制台。
搜索镜像：在镜像市场或创建实例页面，直接搜索关键词Qwen3-vl:30b。
选择配置并启动：这个模型能力很强，所以“饭量”也大，需要足够的显存。平台会推荐48GB显存的配置，我们直接使用这个默认推荐即可。点击启动，几分钟后，一个拥有顶级算力、预装好Qwen3-VL-30B模型和Ollama服务的环境就准备好了。

硬件环境一览：你获得的将是一个拥有48GB显存、20核CPU和240GB内存的强大服务器，完全足以流畅运行我们这个“天才员工”。

2. 验证你的“大脑”运转正常

实例启动后，我们先做个简单测试，确保模型已经就绪，能听令行事。

2.1 通过Web界面快速对话

在星图平台的控制台，找到你刚创建的实例，里面会有一个“Ollama控制台”的快捷入口。点击它，会直接打开一个网页对话框。

在这里，你可以像和ChatGPT聊天一样，直接输入文字问题。比如问一句“你好，请介绍一下你自己”。如果它能正常回复，说明模型的基础推理服务已经完美运行。

2.2 通过API接口测试连接

我们的智能助手最终需要通过代码（API）来调用模型，所以这一步测试很重要。在你的本地电脑上，创建一个Python脚本（比如test_api.py），输入以下代码：

from openai import OpenAI # 重点：这里的 base_url 需要替换成你的实例公网地址 # 格式通常是：https://你的实例ID-11434.web.gpu.csdn.net/v1 # 在你的星图实例控制台可以找到这个地址 client = OpenAI( base_url="https://gpu-pod697b0f1855ba5839425df6ea-11434.web.gpu.csdn.net/v1", # 请替换！ api_key="ollama" # 固定值，无需修改 ) try: response = client.chat.completions.create( model="qwen3-vl:30b", # 指定我们部署的模型 messages=[{"role": "user", "content": "你好，你是谁？"}] ) print("模型回复：", response.choices[0].message.content) print(" API连接测试成功！") except Exception as e: print(f" 连接失败，请检查: {e}")

运行这个脚本，如果看到模型自我介绍的成功回复，恭喜你，最核心的模型服务已经一切就绪。记住这个API地址和调用方式，后面会用到。

3. 安装智能助手的“中枢神经”：Clawdbot

现在“大脑”（Qwen3-VL）准备好了，我们需要一个“中枢神经”系统来管理它、连接飞书、处理用户请求。这个系统就是Clawdbot。它是一个开源框架，能帮你轻松地把大模型接入到飞书、钉钉、微信等聊天平台。

3.1 一键安装Clawdbot

我们的星图云环境已经预装了Node.js和npm（Node的包管理器）。安装Clawdbot非常简单，只需要一行命令。通过SSH连接到你的服务器，执行：

npm i -g clawdbot

这行命令会从网络下载并全局安装Clawdbot。稍等片刻，安装就完成了。

3.2 初始化配置向导

安装好后，我们运行初始化向导，它会以问答形式帮你完成最基础的设置。执行：

clawdbot onboard

跟着向导的提示一步步来。对于大多数选项，如果你是第一次使用，我建议先按默认值来，或者选择“Skip”（跳过）稍后配置。重点是先让服务跑起来。

向导结束后，Clawdbot的基础配置就生成了。

3.3 启动服务并访问控制面板

Clawdbot的核心是一个网关服务，默认运行在18789端口。启动它：

clawdbot gateway

服务启动后，如何访问它的控制面板呢？记住你的实例公网访问地址，只是把端口号从之前的11434(Ollama) 换成18789。

例如：

你的Ollama测试地址是：https://gpu-podXXXX-11434.web.gpu.csdn.net/
那么Clawdbot控制台地址就是：https://gpu-podXXXX-18789.web.gpu.csdn.net/

在浏览器中打开这个新地址。

4. 解决“页面空白”与安全加固

当你第一次访问控制台时，很可能会遇到一个空白页面。别担心，这不是失败了，只是一个常见的小配置问题。

4.1 修改配置，允许公网访问

问题根源是Clawdbot默认只允许本地访问（监听127.0.0.1），而我们的浏览器是从公网连进来的。我们需要修改它的配置文件。

在服务器上，编辑Clawdbot的配置文件：
```
vim ~/.clawdbot/clawdbot.json
```
找到gateway这个配置段，进行两处关键修改：
- bind: 把值从"loopback"改成"lan"。这告诉Clawdbot监听所有网络接口，允许公网连接。
- trustedProxies: 在这个数组里添加"0.0.0.0/0"。这表示信任所有来源的代理转发（在云平台环境下通常需要）。
- auth.token：设置一个访问令牌，比如"csdn"。这是进入控制面板的密码，请自己设一个更复杂的。

修改后的gateway部分应该类似这样：

"gateway": { "mode": "local", "bind": "lan", "port": 18789, "auth": { "mode": "token", "token": "csdn" // 你设置的密码 }, "trustedProxies": ["0.0.0.0/0"], "controlUi": { "enabled": true, "allowInsecureAuth": true } }

保存文件，然后重启Clawdbot网关服务（先按Ctrl+C停止，再重新运行clawdbot gateway）。

4.2 登录控制面板

再次刷新浏览器中的控制台地址，这次应该会看到一个登录界面，提示你输入Token。就把你刚才在配置文件里设置的Token（比如csdn）填进去。

登录成功后，你就进入了Clawdbot的仪表盘。到这里，Clawdbot本身已经安装配置完成。

5. 核心步骤：让Clawdbot调用你的Qwen3-VL模型

现在是最关键的一步：把前面部署好的“最强大脑”（Qwen3-VL）告诉“中枢神经”（Clawdbot），让它以后都用这个模型来回答问题。

5.1 配置模型供应商

我们需要在Clawdbot的配置里，添加一个指向我们本地Ollama服务的“模型供应商”。

再次编辑配置文件：
```
vim ~/.clawdbot/clawdbot.json
```
找到models.providers部分，在里面添加一个新的供应商配置，我们给它起名叫my-ollama：

"models": { "providers": { "my-ollama": { // 供应商名称，可自定义 "baseUrl": "http://127.0.0.1:11434/v1", // 本地Ollama服务的API地址 "apiKey": "ollama", // Ollama的固定API Key "api": "openai-completions", // 兼容OpenAI的API格式 "models": [ { "id": "qwen3-vl:30b", // 模型ID，必须和Ollama中的名称一致 "name": "Local Qwen3 30B", // 显示名称 "contextWindow": 32000 // 上下文长度 } ] } } }

5.2 设置默认助手模型

光有供应商还不够，我们需要指定Clawdbot创建的AI助手默认使用哪个模型。找到配置文件的agents.defaults部分，修改model.primary设置：

"agents": { "defaults": { "model": { "primary": "my-ollama/qwen3-vl:30b" // 格式：供应商名/模型ID } } }

这个配置的意思是：“所有新创建的AI助手，默认使用my-ollama这个供应商提供的qwen3-vl:30b模型。”

5.3 重启并验证

保存配置文件。
重启Clawdbot网关服务（Ctrl+C后重新运行clawdbot gateway）。
打开一个新的SSH终端窗口，运行watch nvidia-smi命令，实时监控GPU显存的使用情况。
回到Clawdbot控制面板的Chat页面。

现在，在Chat页面里发送一条消息，比如“画一幅夏日海滩的风景画，并用中文描述它”。注意观察那个运行着nvidia-smi的终端窗口。

如果你看到GPU显存占用开始显著上升（比如从几GB涨到20多GB），并且Clawdbot给出了一个结合了图像生成（或描述）和文本描述的回复，那么恭喜你！

这证明Clawdbot已经成功调用了你本地部署的、强大的Qwen3-VL:30B模型。你的私有化多模态AI助手核心引擎，已经正式上线运转了！

6. 总结与展望

让我们回顾一下到目前为止完成的壮举：

零基础部署最强模型：我们在CSDN星图云平台上，一键部署了需要48GB显存的顶级多模态大模型Qwen3-VL:30B，并验证了其API服务。
搭建智能助手框架：我们安装并配置了Clawdbot这个优秀的机器人框架，解决了网络访问问题。
实现核心集成：通过修改配置文件，成功将Clawdbot的AI能力“绑定”到我们私有的Qwen3-VL模型上。现在，通过Clawdbot发出的每一个请求，背后都是30B参数的“天才大脑”在思考。

现在，你已经拥有了一个：