news 2026/3/21 17:52:22

轻松入门SpringAI-SpringAI调用Ollama

张小明

前端开发工程师

1.2k 24

轻松入门 Spring AI 调用 Ollama
（2025-2026 最新最实用写法）

目前使用 Spring AI + Ollama 最推荐的几种组合方式（按推荐顺序）：

排名	方式	优点	缺点/限制	适合场景	推荐度
1	Spring AI Ollama ChatClient	配置最少、写法最自然、生态最好	需要 Ollama 已经在运行	绝大多数日常开发	★★★★★
2	使用 OllamaChatModel 手动创建	更灵活，可精细控制参数	代码稍微多一点	需要特殊参数或实验	★★★★
3	AiServices + Ollama	适合做工具调用/结构化输出/Agent	学习曲线稍高	中高级用法	★★★★
4	直接用 Ollama Java 官方客户端	不依赖 Spring AI，完全独立	失去 Spring AI 所有高级抽象	极致轻量/非 Spring 项目	★★

最推荐写法（99% 场景都够用）

1. 依赖（使用最新稳定版）

<dependency><groupId>org.springframework.ai</groupId><artifactId>spring-ai-ollama-spring-boot-starter</artifactId><version>1.0.0-M6 或 1.0.0.RELEASE（看你用的 spring boot 版本）</version></dependency><!-- 如果你用的是快照版或 milestone，可能需要添加仓库 -->

2. application.yml 最简配置

spring:ai:ollama:base-url:http://localhost:11434# 默认就是这个，几乎不用改chat:options:model:qwen2.5:7b-instruct# ← 改这里就切换模型# 常用推荐模型（2026年初）：# qwen2.5:7b-instruct# deepseek-r1:7b# llama3.2:3b# phi4:14b# gemma2:9btemperature:0.75top-p:0.9max-tokens:4096

3. 最常用代码模板（ChatClient 方式）

@RestController@RequestMapping("/ollama")@RequiredArgsConstructorpublicclassOllamaSimpleController{privatefinalChatClientchatClient;// Spring AI 自动注入// 1. 普通调用@GetMapping("/chat")publicStringsimpleChat(@RequestParamStringmsg){returnchatClient.prompt().user(msg).call().content();}// 2. 流式输出（前端打字机效果）@GetMapping(value="/stream",produces=MediaType.TEXT_EVENT_STREAM_VALUE)publicFlux<String>streamChat(@RequestParamStringmsg){returnchatClient.prompt().user(msg).stream().content();}// 3. 带系统提示 + 记忆（最实用组合）privatefinalChatMemorychatMemory=newMessageWindowChatMemory(10);@GetMapping("/memory")publicStringchatWithMemory(@RequestParamStringsessionId,@RequestParamStringmessage){returnchatClient.prompt().system(""" 你是一位说话很幽默、接地气、喜欢用表情的资深程序员 用中文回答，尽量使用 markdown 格式 """).user(message).advisors(MessageChatMemoryAdvisor.builder().chatMemory(chatMemory).sessionId(sessionId).build()).call().content();}}

快速上手检查清单（按顺序做）

步骤	命令/操作	预期结果

安装并启动 Ollama |ollama serve| 看到 http://localhost:11434
拉取一个常用模型 |ollama pull qwen2.5:7b-instruct| 模型下载完成
命令行简单测试 |ollama run qwen2.5:7b-instruct| 可以正常对话
启动 Spring Boot 项目 | 正常启动 | 无报错
浏览器访问 |/ollama/chat?msg=你好啊| 得到中文回答
测试流式 |/ollama/stream?msg=讲个程序员笑话| 看到逐字出现效果

常见问题速查表（2026年初常见坑）

问题	原因	解决方案
连接超时/拒绝连接	Ollama 没启动	先运行`ollama serve`
模型找不到	模型名写错了	`ollama list`查看已下载模型名
中文回答很差/乱码	用了不擅长中文的模型	换 qwen2.5 / deepseek-r1 / glm4 等
流式输出不工作	模型本身不支持 streaming	部分小模型不支持，换大一点的模型
显存爆了/启动很慢	模型太大，显卡不够	换 3b/7b 量级模型，或加`--num-gpu 0`只用 CPU

一句话总结目前（2026年1月）最舒服的本地组合：

Spring Boot 3.3.x + Spring AI 1.0.x + Ollama + qwen2.5:7b-instruct 或 deepseek-r1:7b + ChatClient 流式 + 记忆 + 系统提示

祝你本地玩得开心，早日做出自己的小 AI 玩具～ 🚀

需要我帮你把某个特定模型（比如 deepseek-r1 / phi4 / gemma2）的配置和表现做更详细对比吗？

网站建设 2026/3/15 8:32:32

Python+Vue的二手书籍交易平台 django Pycharm flask

目录这里写目录标题目录项目介绍项目展示详细视频演示技术栈文章下方名片联系我即可~解决的思路开发技术介绍性能/安全/负载方面python语言Django框架介绍技术路线关键代码详细视频演示收藏关注不迷路！！需要的小伙伴可以发链接或者截图给我项目介绍 …

李华

网站建设 2026/3/15 8:32:27

计算机小程序毕设实战-基于springboot+微信小程序的服装商城的设计与实现小程序基于微信小程序的在线服装商城店铺的设计与实现【完整源码+LW+部署说明+演示视频，全bao一条龙等】

博主介绍：✌️码农一枚 ，专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者，博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围：&am…

李华

网站建设 2026/3/15 13:16:33

吐血推荐10个一键生成论文工具，专科生毕业论文必备！

吐血推荐10个一键生成论文工具，专科生毕业论文必备！ 专科生的论文救星，AI 工具如何改变你的写作方式？ 在如今的学术环境中，论文写作早已不再是单纯的文字堆砌，而是对逻辑、结构和内容深度的综合考验。尤其是…

李华

网站建设 2026/3/15 12:21:15

（1-2）人形机器人的发展历史、趋势与应用场景：未来趋势与行业需求

1.2 未来趋势与行业需求随着具身智能、大模型与机器人核心硬件的快速发展，人形机器人正从技术验证阶段迈向面向真实场景的规模化应用阶段。未来的发展趋势不仅体现在智能水平的持续提升，更体现在对劳动力结构、生产方式与服务形态的深刻重塑。在制造业、…

李华

网站建设 2026/3/19 19:11:44

（1-3）人形机器人的发展历史、趋势与应用场景：人形机器人关键技术体系总览

1.3 人形机器人关键技术体系总览人形机器人是一种高度复杂的综合系统，其能力水平取决于多学科关键技术的协同程度。本节从系统工程视角出发，对人形机器人核心技术体系进行整体梳理：以机械系统构建类人结构与运动基础，以电气系统与…

李华

网站建设 2026/3/15 6:57:42

4. 为什么 Triton 不够了

作者：HOS(安全风信子) 日期：2026-01-17 来源平台：GitHub 摘要： 2026年，随着大模型规模和复杂度的急剧增长，传统推理框架Triton Inference Server在处理现代推理场景时逐渐显现出局限性。本文深入剖析了Trit…

李华