news 2026/6/25 15:20:03

1flowbase模板:一键导入升级GLM5.2,deepseek 多模态

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
1flowbase模板:一键导入升级GLM5.2,deepseek 多模态

安装请看github仓库readme提供了docker环境下一键部署

之前组合模型使用方式,节点编排然后去路由,这样去做组合模型,但是这样其实太僵硬,所以我决定对1flowbase进行重磅升级,增加内置工具调用,简单来说将多模态LLM封装为一个内置工具,挂载到主力模型中如Deepseek V4 ,或者GLM 5.2 这样文本模型,当主力模型需要识别图片时候,调用工具多模型LLM,进行图片识别,识别后结果作为工具直接返回描述给主力模型。编排如:

GLM5.2 作为主力模型

或者Deepseek V4

感谢雷总对于1flowbase 虚拟模型赞助,Deepseek 这个功能我用来调试都干掉20块,给孩子点一个star,研发资金困难了。

实操
其实就是在LLM节点中开启工具注册:

自定义注册工具名字和标识,注意仅支持,大小写字母和数字下划线

如果文本模型塞入了图片,上游供应商会报错,说不支持,所以我们需要对于工具进行拦截:

[{"kind":"media_content_available","media_kind":"image","argument_path":["media"]}]

拦截这部分目前只做了图片,后续会升级为动态配置拦截工具,这样就可以对于一些工具执行结果,强制拦截,改造返回给模型

然后我们需要配置工具传参,这部分会注册进入文本模型中,让文本模型进行传参

{"type":"object","required":["task"],"properties":{"task":{"type":"string","description":"给多模态模型的任务指示提示词"},"media":{"type":"array","items":{"type":"object","required":["kind","path","source"],"properties":{"kind":{"enum":["image"],"type":"string","description":"媒体类型"},"path":{"type":"string","description":"工作区内图片路径,例如 uploads/image_aionui_1781014667000.png"},"source":{"enum":["workspace_path"],"type":"string","description":"媒体来源"}}},"description":"需要交给多模态模型处理的媒体引用"}}}

这些JSON参数都是配置好的了,直接填入JSON schema 就可以直接解析了

解析保存了

下面是接入到claude code 中效果

我们把这张图给他看

这个是接入GLM 5 .2 表现

1flowbase 中日志,这次也针对claude code 源码进行一对一修复调整了


下面这个是Deepseek 4 V 表现:


这里调用多模态工具,失败原因是,没有满足我们前置条件,直接被我们拦截了

当然如果你觉得太麻烦了,我们在现在已经开始支持模板一键安装
首先需要下载两个供应商插件:

Deepseek 这些文本模型可以使用openai的chat协议或者其他都可以,但是mimo 2.5 这些不能用openai的chat模型,因为这些不支持图块,用这个协议mimo2.5没法看图,所以:
Deepseek(文本模型) 使用Deepseek 供应商插件

当然GLM也可以使用openai的chat协议

mimo2.5(多模态):anthropic 协议插件(当然openai的response协议和Gemini 协议也可以,但是我们模型里面是anthropic 协议),这里要注意一个点是,anthropic 没有模型发现接口,所以需要手动填模型

以的deepseek 为例
Deepseek 配置

mimo 这些模型需要开启并配置需要开启多模态:

然后你就集齐模型使用要素了,去模板市场下载

导入后没什么问题报错就是这样

然后直接发布,然后去API创建key

一定要把图块给传过来,不然就会直接提示他让他去重新找。

目前还在开发中功能,智能路由,我们不希望仅仅将LLM模型封装为工具,我们还希望,能够主力模型调用这个工具之后,能够无缝切换到工具LLM模型,工具LLM模型工作完之后,再回到主力模型继续工作总结。

假设我们设定了,测试要给GPT,那么Deepseek 主力模型遇到测试部分就会直接切到gpt,gpt代替ds继续输出,然后写测试,写完之后,再返回主力LLM,而对于claude code 这些客户端工具来说,是无感,在他们看来就是一个大模型上游。

目前在claude code 跑通了,但是不知道codex 效果如何,这是下一步计划了,各位期待一下侯后续更新。

如果喜欢的话,请给我点一个star ,这是我持续更新动力

https://github.com/taichuy/1flowbase

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/25 15:19:39

抖音内容自动化发布系统:智能视频处理与批量管理解决方案

抖音内容自动化发布系统:智能视频处理与批量管理解决方案 【免费下载链接】douyin_uplod 抖音自动上传发布视频 项目地址: https://gitcode.com/gh_mirrors/do/douyin_uplod 在内容创作日益数字化的今天,视频创作者面临着频繁发布、内容优化和账号…

作者头像 李华
网站建设 2026/6/25 15:18:57

急着交稿,有没有能快速改写文章、稳住重复率的在线网站?离截止只剩几小时,双降工具实测盘点

眼看着论文提交通道即将关闭,初稿标红一大片,不仅知网、维普重复率居高不下,AIGC 疑似检测还频频亮红灯。手动逐句改写不仅耗费大量时间,还容易打乱全文逻辑,越改越不通顺。不少毕业生到处寻找免安装、网页直接用的在线…

作者头像 李华
网站建设 2026/6/25 15:18:32

零阶优化稳定性揭秘:Hessian迹如何主导训练动态与应对策略

1. 项目概述:当优化器走到悬崖边在深度学习的训练过程中,我们常常把优化过程想象成在一个复杂的、高维的“损失地形”上寻找最低点。梯度下降(GD)及其变种,作为一阶优化方法,依靠计算梯度(地形最…

作者头像 李华
网站建设 2026/6/25 15:18:21

ArduSub水下飞控实战指南:从原理到南海30米部署

1. 这不是Arduino加个“Sub”就完事:ArduSub到底是什么,为什么它值得你花三小时认真读完ArduSub——光看名字,很多人第一反应是“Arduino的水下版”或者“树莓派潜水插件”,其实完全不是。它是一套完整、开源、经过全球数十支水下…

作者头像 李华
网站建设 2026/6/25 15:18:16

C#上位机内存泄漏终极排查:从现象到根源再到解决

摘要:在工业控制、自动化测试等上位机开发场景中,C#程序往往需要724小时不间断运行。内存泄漏不像Web应用那样可以通过重启IIS来“续命”,它会导致设备停机、产线瘫痪。本文不讲教科书式的GC理论,而是结合笔者多年上位机项目实战&…

作者头像 李华
网站建设 2026/6/25 15:15:53

KMS智能激活方案:如何一键解决Windows和Office激活难题

KMS智能激活方案:如何一键解决Windows和Office激活难题 【免费下载链接】KMS_VL_ALL_AIO Smart Activation Script 项目地址: https://gitcode.com/gh_mirrors/km/KMS_VL_ALL_AIO 还在为Windows系统激活问题而烦恼吗?KMS_VL_ALL_AIO智能激活脚本为…

作者头像 李华