1flowbase模板：一键导入升级GLM5.2，deepseek 多模态-开发者社区

安装请看github仓库readme提供了docker环境下一键部署

之前组合模型使用方式，节点编排然后去路由，这样去做组合模型，但是这样其实太僵硬，所以我决定对1flowbase进行重磅升级，增加内置工具调用，简单来说将多模态LLM封装为一个内置工具，挂载到主力模型中如Deepseek V4 ，或者GLM 5.2 这样文本模型，当主力模型需要识别图片时候，调用工具多模型LLM，进行图片识别，识别后结果作为工具直接返回描述给主力模型。编排如：

GLM5.2 作为主力模型

或者Deepseek V4

感谢雷总对于1flowbase 虚拟模型赞助，Deepseek 这个功能我用来调试都干掉20块，给孩子点一个star，研发资金困难了。

实操
其实就是在LLM节点中开启工具注册：

自定义注册工具名字和标识，注意仅支持，大小写字母和数字下划线

如果文本模型塞入了图片，上游供应商会报错，说不支持，所以我们需要对于工具进行拦截：

[{"kind":"media_content_available","media_kind":"image","argument_path":["media"]}]

拦截这部分目前只做了图片，后续会升级为动态配置拦截工具，这样就可以对于一些工具执行结果，强制拦截，改造返回给模型

然后我们需要配置工具传参，这部分会注册进入文本模型中，让文本模型进行传参

{"type":"object","required":["task"],"properties":{"task":{"type":"string","description":"给多模态模型的任务指示提示词"},"media":{"type":"array","items":{"type":"object","required":["kind","path","source"],"properties":{"kind":{"enum":["image"],"type":"string","description":"媒体类型"},"path":{"type":"string","description":"工作区内图片路径，例如 uploads/image_aionui_1781014667000.png"},"source":{"enum":["workspace_path"],"type":"string","description":"媒体来源"}}},"description":"需要交给多模态模型处理的媒体引用"}}}

这些JSON参数都是配置好的了，直接填入JSON schema 就可以直接解析了

解析保存了

下面是接入到claude code 中效果

我们把这张图给他看

这个是接入GLM 5 .2 表现

1flowbase 中日志，这次也针对claude code 源码进行一对一修复调整了

下面这个是Deepseek 4 V 表现：

这里调用多模态工具，失败原因是，没有满足我们前置条件，直接被我们拦截了

当然如果你觉得太麻烦了，我们在现在已经开始支持模板一键安装
首先需要下载两个供应商插件：

Deepseek 这些文本模型可以使用openai的chat协议或者其他都可以，但是mimo 2.5 这些不能用openai的chat模型，因为这些不支持图块，用这个协议mimo2.5没法看图，所以：
Deepseek（文本模型）使用Deepseek 供应商插件

当然GLM也可以使用openai的chat协议

mimo2.5（多模态）：anthropic 协议插件（当然openai的response协议和Gemini 协议也可以，但是我们模型里面是anthropic 协议），这里要注意一个点是，anthropic 没有模型发现接口，所以需要手动填模型

以的deepseek 为例
Deepseek 配置

mimo 这些模型需要开启并配置需要开启多模态：

然后你就集齐模型使用要素了，去模板市场下载

导入后没什么问题报错就是这样

然后直接发布，然后去API创建key

一定要把图块给传过来，不然就会直接提示他让他去重新找。

目前还在开发中功能，智能路由，我们不希望仅仅将LLM模型封装为工具，我们还希望，能够主力模型调用这个工具之后，能够无缝切换到工具LLM模型，工具LLM模型工作完之后，再回到主力模型继续工作总结。

假设我们设定了，测试要给GPT，那么Deepseek 主力模型遇到测试部分就会直接切到gpt，gpt代替ds继续输出，然后写测试，写完之后，再返回主力LLM，而对于claude code 这些客户端工具来说，是无感，在他们看来就是一个大模型上游。

目前在claude code 跑通了，但是不知道codex 效果如何，这是下一步计划了，各位期待一下侯后续更新。

如果喜欢的话，请给我点一个star ，这是我持续更新动力

https://github.com/taichuy/1flowbase

抖音内容自动化发布系统：智能视频处理与批量管理解决方案

抖音内容自动化发布系统：智能视频处理与批量管理解决方案【免费下载链接】douyin_uplod 抖音自动上传发布视频项目地址: https://gitcode.com/gh_mirrors/do/douyin_uplod 在内容创作日益数字化的今天，视频创作者面临着频繁发布、内容优化和账号…

李华

急着交稿，有没有能快速改写文章、稳住重复率的在线网站？离截止只剩几小时，双降工具实测盘点

眼看着论文提交通道即将关闭，初稿标红一大片，不仅知网、维普重复率居高不下，AIGC 疑似检测还频频亮红灯。手动逐句改写不仅耗费大量时间，还容易打乱全文逻辑，越改越不通顺。不少毕业生到处寻找免安装、网页直接用的在线…

李华

零阶优化稳定性揭秘：Hessian迹如何主导训练动态与应对策略

1. 项目概述：当优化器走到悬崖边在深度学习的训练过程中，我们常常把优化过程想象成在一个复杂的、高维的“损失地形”上寻找最低点。梯度下降（GD）及其变种，作为一阶优化方法，依靠计算梯度（地形最…

李华

ArduSub水下飞控实战指南：从原理到南海30米部署

1. 这不是Arduino加个“Sub”就完事：ArduSub到底是什么，为什么它值得你花三小时认真读完ArduSub——光看名字，很多人第一反应是“Arduino的水下版”或者“树莓派潜水插件”，其实完全不是。它是一套完整、开源、经过全球数十支水下…

李华

C#上位机内存泄漏终极排查：从现象到根源再到解决

摘要：在工业控制、自动化测试等上位机开发场景中，C#程序往往需要724小时不间断运行。内存泄漏不像Web应用那样可以通过重启IIS来“续命”，它会导致设备停机、产线瘫痪。本文不讲教科书式的GC理论，而是结合笔者多年上位机项目实战&…

李华

KMS智能激活方案：如何一键解决Windows和Office激活难题

KMS智能激活方案：如何一键解决Windows和Office激活难题【免费下载链接】KMS_VL_ALL_AIO Smart Activation Script 项目地址: https://gitcode.com/gh_mirrors/km/KMS_VL_ALL_AIO 还在为Windows系统激活问题而烦恼吗？KMS_VL_ALL_AIO智能激活脚本为…

李华