Clawdbot部署Qwen3-32B详细步骤：含代理超时设置、CORS跨域配置-开发者社区

Clawdbot部署Qwen3-32B详细步骤：含代理超时设置、CORS跨域配置

1. 部署前的必要认知：为什么需要这三步联动

很多人第一次尝试把大模型接入前端聊天平台时，会卡在“明明API能调通，但网页里报错504或跨域失败”这个环节。Clawdbot整合Qwen3-32B不是简单填个URL就能跑起来的事——它本质是三层链路协同：底层Ollama提供模型服务，中间层代理负责流量调度与安全策略，上层Clawdbot Web界面完成用户交互。

你不需要懂Kubernetes或反向代理原理，但得明白这三者的角色分工：

Ollama是“模型引擎”，运行qwen3:32b后监听本地127.0.0.1:11434，只接受内部请求；
代理服务（如Nginx或Caddy）是“交通指挥员”，把外部8080端口进来的请求，转发给Ollama，并顺手处理超时、头信息、跨域等现实问题；
Clawdbot是“前台窗口”，它不直接连Ollama，而是坚定地只认代理地址http://localhost:8080，所有请求都走这个门。

这就像一家餐厅：Ollama是后厨（不对外营业），代理是迎宾+传菜员（检查预约、控制上菜节奏、处理客人特殊要求），Clawdbot是点餐屏（只跟传菜员说话）。少一个角色，整套流程就断掉。

所以本教程不讲“怎么装Ollama”，也不教“怎么改Clawdbot源码”，而是聚焦让这三者真正说上话的关键配置点：代理超时设置、CORS头注入、端口映射逻辑。每一步都有明确目的，每一行配置都能解释清楚“为什么必须这样写”。

2. 环境准备与基础服务启动

2.1 确认Ollama已加载Qwen3-32B模型

先确保你的机器已安装Ollama（v0.4.0+），并成功拉取qwen3:32b。执行以下命令验证：

ollama list

你应该看到类似输出：

NAME ID SIZE MODIFIED qwen3:32b 9a2b3c4d5e... 21.4 GB 3 days ago

如果没有，请运行：

ollama pull qwen3:32b

注意：Qwen3-32B是纯CPU推理型大模型，首次加载需约8–12分钟，内存占用稳定在24GB左右。请勿在低于32GB内存的机器上强行运行，否则会触发OOM Killer强制杀进程。

启动模型服务（后台常驻）：

ollama serve &

此时Ollama默认监听127.0.0.1:11434，仅限本机访问。这是安全设计，也是后续代理必须存在的根本原因。

2.2 获取Clawdbot可执行文件并解压

Clawdbot提供预编译二进制包，无需Node.js环境。从官方Release页下载对应系统版本（Linux/macOS/Windows），例如Linux x64：

wget https://github.com/clawdbot/clawdbot/releases/download/v1.2.0/clawdbot-linux-amd64.tar.gz tar -xzf clawdbot-linux-amd64.tar.gz chmod +x clawdbot

Clawdbot本身不带Web服务器，它依赖你提供一个HTTP API地址。它的配置文件config.yaml中关键字段如下：

backend: api_url: "http://localhost:8080/api/chat" # ← 注意：这里指向代理，不是Ollama！ timeout: 300000 # 单位毫秒，即5分钟，必须≥代理超时值

这个api_url就是整个链路的“第一跳”地址，也是我们接下来要亲手搭建的代理入口。

3. 代理服务配置：解决超时与跨域两大拦路虎

3.1 为什么不能直连Ollama？两个硬伤必须绕过

Ollama原生API接口（/api/chat）有两大限制，导致Clawdbot前端无法直连：

无CORS头：浏览器发起fetch请求时，服务端未返回Access-Control-Allow-Origin: *等必要响应头，直接被拦截；
默认超时太短：Ollama对单次流式响应的默认超时为120秒，而Qwen3-32B生成长文本常需3–4分钟，前端必然收到504 Gateway Timeout。

因此，必须加一层轻量代理，承担两件事：
① 在响应头中注入CORS支持；
② 将上游超时延长至5分钟以上，并透传给Clawdbot。

我们推荐使用Caddy——配置极简、自带HTTPS、无需额外安装模块，一行命令即可启动。

3.2 Caddy代理配置（推荐方案）

创建配置文件Caddyfile，内容如下：

:8080 { reverse_proxy 127.0.0.1:11434 { # 关键：延长超时，覆盖Ollama默认120秒限制 transport http { read_timeout 300s write_timeout 300s idle_timeout 300s } # 关键：注入CORS头，允许任意前端域名访问 header_up Access-Control-Allow-Origin "*" header_up Access-Control-Allow-Methods "GET, POST, OPTIONS" header_up Access-Control-Allow-Headers "Content-Type, Authorization" header_up Access-Control-Allow-Credentials "true" } # 处理预检请求（OPTIONS） @options method OPTIONS handle @options { header Access-Control-Allow-Origin "*" header Access-Control-Allow-Methods "GET, POST, OPTIONS" header Access-Control-Allow-Headers "Content-Type, Authorization" header Access-Control-Allow-Credentials "true" respond 200 } }

启动Caddy（确保已安装）：

caddy run --config Caddyfile

验证代理是否生效：
在终端执行curl测试，确认响应头含CORS且能通Ollama：

curl -I http://localhost:8080/api/tags

应看到包含以下头信息：

Access-Control-Allow-Origin: * Access-Control-Allow-Methods: GET, POST, OPTIONS

同时返回HTTP 200和Ollama的模型列表JSON，说明代理已正确转发。

替代方案（Nginx）：如果你习惯用Nginx，核心配置段为：

location /api/ { proxy_pass http://127.0.0.1:11434/; proxy_read_timeout 300; proxy_send_timeout 300; add_header 'Access-Control-Allow-Origin' '*'; add_header 'Access-Control-Allow-Methods' 'GET, POST, OPTIONS'; # ...其余头同上 }

4. Clawdbot启动与Web界面配置

4.1 启动Clawdbot并指定代理地址

Clawdbot默认读取当前目录下的config.yaml。确保该文件中backend.api_url已设为代理地址：

# config.yaml backend: api_url: "http://localhost:8080/api/chat" timeout: 300000 # 其他字段保持默认即可

然后启动Clawdbot：

./clawdbot --config config.yaml

默认监听http://localhost:18789（即你描述中的网关端口），这就是Clawdbot自己的Web服务地址。

4.2 浏览器访问与首次对话测试

打开浏览器，访问：

http://localhost:18789

你会看到Clawdbot简洁的聊天界面。在输入框中发送一句：

你好，Qwen3-32B，介绍一下你自己

正常情况：

输入后，界面显示“思考中…”状态；
约30–90秒后，开始逐字流式输出回答；
完整回答耗时约2分半，全程无中断、无报错。

❌ 常见异常及定位方法：

现象	可能原因	快速检查
页面空白或加载失败	Clawdbot未启动，或端口被占	`lsof -i :18789`看进程是否存在
输入后立即报错“Network Error”	代理未运行，或`api_url`填错	`curl -v http://localhost:8080/api/chat`测试代理连通性
卡在“思考中…”超过2分钟无响应	Ollama未加载模型，或内存不足	`ollama ps`查看模型运行状态；`free -h`检查剩余内存
控制台报`CORS error`	Caddy未注入头，或Clawdbot请求路径错误	打开浏览器开发者工具→Network→点击失败请求→看Response Headers

5. 进阶配置：生产环境加固建议

5.1 代理层安全加固（非开发必需，但推荐）

当前Caddy配置允许任意来源跨域，适合内网调试。若需部署到公网或企业内网，建议收紧CORS策略：

# 替换原Caddyfile中的header_up行： header_up Access-Control-Allow-Origin "https://your-clawdbot-domain.com" header_up Access-Control-Allow-Credentials "true" # 并移除 Access-Control-Allow-Origin "*" 的宽泛写法

同时，在Clawdbot的config.yaml中启用Basic Auth（如果代理层已配）：

backend: api_url: "http://user:pass@localhost:8080/api/chat"

5.2 超时参数协同校准表

Clawdbot、代理、Ollama三方超时必须满足：
Clawdbot.timeout ≥ 代理.read_timeout ≥ Ollama.default_timeout

组件	推荐值	修改方式	说明
Clawdbot`timeout`	`300000`(5分钟)	`config.yaml`	前端等待最大时长
Caddy`read_timeout`	`300s`	`Caddyfile`	代理等待Ollama响应时间
Ollama`--timeout`	不建议修改	启动时加参数	Ollama v0.4.0+已支持`OLLAMA_TIMEOUT=300`环境变量，但实测不如代理层控制稳定

实践结论：将超时统一设为300秒最稳妥。Ollama在32B模型下，95%的请求会在150秒内完成，留出冗余保障极端case不失败。

5.3 日志与问题追踪技巧

当出现“响应不完整”或“中途断开”时，不要只看Clawdbot日志。三端日志需交叉比对：

Clawdbot日志：关注[ERROR]行，通常提示“request failed”；
Caddy日志：默认输出到终端，搜索upstream timeout或dial tcp错误；
Ollama日志：启动时加OLLAMA_DEBUG=1 ollama serve，查看模型推理是否被中断。

一个真实案例：某用户反馈“每次生成到第3段就停”，经查Caddy日志发现upstream timeout，而Ollama日志显示模型仍在计算——说明是代理超时值仍不够，最终将read_timeout从300s提升至420s解决。

6. 总结：三步到位，链路闭环

回顾整个部署过程，你实际只做了三件确定性极强的事：

第一步：确认Ollama稳稳跑着Qwen3-32B，它不对外、不设防，只做一件事：高质量生成；
第二步：用Caddy搭一座桥，桥上挂了两块牌子——“请耐心等5分钟”（超时）和“欢迎所有访客”（CORS），把Ollama的原始能力安全、稳定地暴露出来；
第三步：告诉Clawdbot“去桥那头找人”，它不再操心模型在哪、怎么连，只专注把用户的话送过去、把结果优雅地展示出来。

这不是一次“配置拼凑”，而是一次链路契约的建立：每个组件各司其职，边界清晰，故障可隔离，扩容可独立。当你下次想换成Qwen3-72B，或接入Llama-3-70B，只需替换Ollama模型、微调Caddy超时值，Clawdbot端零改动。

真正的工程落地，不在于多炫技，而在于每一步都经得起追问：“这行配置，到底在解决什么具体问题？”