news 2026/4/4 20:18:18

Solon AI 开发学习4 - chat - 模型实例的构建和简单调用

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Solon AI 开发学习4 - chat - 模型实例的构建和简单调用

天模型接口(ChatModel)支持:

同步调用(call),一次性返回结果

支流式调用(stream,基于 reactivestreams 规范)。通过 sse 或 x-ndjson 流式返回结果。

Tool Call(或 Function Call) 与本地数据互动(需要 llm 支持)

提示语多消息输入输出(记忆体)

带图片消息

与 solon-flow 结合使用

1、聊天模型的构建

配置方式构建

solon.ai.chat:

demo:

apiUrl: "http://127.0.0.1:11434/api/chat" # 使用完整地址(而不是 api_base)

provider: "ollama" # 使用 ollama 服务时,需要配置 provider

model: "llama3.2"

headers:

x-demo: "demo1"

import org.noear.solon.ai.chat.ChatConfig;

import org.noear.solon.ai.chat.ChatModel;

import org.noear.solon.annotation.Bean;

import org.noear.solon.annotation.Configuration;

import org.noear.solon.annotation.Inject;

@Configuration

public class DemoConfig {

@Bean

public ChatModel build(@Inject("${solon.ai.chat.demo}") ChatConfig config) {

return ChatModel.of(config).build();

}

}

手动方式构建

@Configuration

public class DemoConfig {

@Bean

public ChatModel build() {

return ChatModel.of("http://127.0.0.1:11434/api/chat") //使用完整地址(而不是 api_base)

.provider("ollama")

.model("llama3.2")

.headerSet("x-demo", "demo1")

.defaultOptionAdd("stream_options", Utils.asMap("include_usage", true))

.build();

}

}

2、同步调用(call)

public void case1() throws IOException {

ChatResponse resp = chatModel.prompt("hello").call();

//打印消息

log.info("{}", resp.getMessage());

}

3、异步流式或响应式调用(stream)

流式返回为 org.reactivestreams.Publisher(reactivestreams 规范)

public void case2() throws IOException {

Publisher<ChatResponse> publisher = chatModel.prompt(ChatMessage.ofUser("hello")).stream();

//return publisher; //使用 solon-web-rx 时可直接返回;或者对接 solon-web-sse 或 websocket

publisher.subscribe(new SimpleSubscriber<ChatResponse>()

.doOnNext(resp -> {

log.info("{}", resp.getMessage());

}).doOnComplete(() -> {

log.debug("::完成!");

}).doOnError(err -> {

log.error("{}", err);

}));

}

可以直接订阅消费(如上)。也可对接各种流行的响应式框架,比如 mutiny、rxjava 或 reactor:

@Produces(MimeType.TEXT_EVENT_STREAM_UTF8_VALUE)

@Mapping("case2")

public Flux<SseEvent> case2(String prompt) throws IOException {

return Flux.from(chatModel.prompt(prompt).stream())

.map(resp -> resp.getMessage())

.map(msg -> new SseEvent().data(msg.getContent()))

.doOnError(err->{

log.error("{}", err);

});

}

4、模型日志

内部默认会打印 llm 请求与响应的日志,分别以 ai-request: 和 ai-response: 开头。日志级别为:DEBUG。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/4 4:10:52

C#AI系列(3):31mb单文件exe实现姿态检测-将Yolo装进口袋

一、环境准备Nuget拉取 Microsoft.ML.OnnxRuntime.Managed 和 YoloDotNet&#xff0c;库内包含了完整所需的其他如Skia、OnnxRuntime等Native库文件。其中&#xff1a;Microsoft.ML.OnnxRuntime.Managed: ONNX Runtime 是跨平台机器学习推理加速器&#xff0c;可兼容 PyTorch、…

作者头像 李华
网站建设 2026/4/1 19:26:34

DETR3D:基于 3D-to-2D 查询的多视图 3D 目标检测框架

在低成本自动驾驶系统中&#xff0c;基于视觉信息的 3D 目标检测是一项长期存在的挑战性任务。与依赖激光雷达&#xff08;LiDAR&#xff09;点云的 3D 目标检测方法不同&#xff0c;基于相机的 3D 目标检测需仅从 RGB 图像包含的 2D 信息中生成 3D 边界框预测&#xff0c;该问…

作者头像 李华
网站建设 2026/3/27 7:03:42

LX洛雪音源:全网最新音乐资源一站式解决方案

LX洛雪音源&#xff1a;全网最新音乐资源一站式解决方案 【免费下载链接】LXMusic音源 lxmusic&#xff08;洛雪音乐&#xff09;全网最新最全音源 项目地址: https://gitcode.com/guoyue2010/lxmusic- 想要畅享海量音乐却苦于找不到优质音源&#xff1f;LX洛雪音源为你…

作者头像 李华
网站建设 2026/4/3 7:21:20

从零到一:CVAT计算机视觉标注工具全面入门指南

从零到一&#xff1a;CVAT计算机视觉标注工具全面入门指南 【免费下载链接】cvat Annotate better with CVAT, the industry-leading data engine for machine learning. Used and trusted by teams at any scale, for data of any scale. 项目地址: https://gitcode.com/gh_…

作者头像 李华
网站建设 2026/4/3 5:49:47

MiMo-V2-Flash

先上代码&#xff0c;后边的是ai介绍的 感兴趣可以看 目前2周免费,使劲噔,不要设置奇怪的prompt,会提示说高危险的不让访问&#x1f602; 官方地址:https://github.com/XiaomiMiMo/MiMo-V2-Flash 平台地址:https://platform.xiaomimimo.com/#/docs/welcome 申请apt-key的地…

作者头像 李华
网站建设 2026/4/3 2:59:28

实现 Promise A+ 规范的 Promise

前言之前找工作的时候凭感觉做了一个实现 Promise A 规范的 Promise的练习&#xff0c;最近在准备新的工作机会&#xff0c;又看到了这个面试题。我感觉之前的实现有很大优化空间。之前用前次调用结果作为标记来实现 Promise 多次 resolve 和 reject 触发的正确逻辑&#xff0c…

作者头像 李华