news 2026/5/8 2:46:03

刚刚,谷歌发布 Gemini 3 Flash:最强牛马,吊打 Pro,免费!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
刚刚,谷歌发布 Gemini 3 Flash:最强牛马,吊打 Pro,免费!

你永远可以相信谷歌。

上个月刚发布Gemini 3 Pro,这个月就给你 Flash 版本。

几小时前,Gemini 3 Flash正式上线。

如果说 Pro 模型是旗舰,那 Flash 就是真正的主力。

它在 Gemini API 里的 token 消耗量是最大的,几百万开发者每天都在用。

谷歌官方说:Flash 系列才是真正的「workhorse model」,当代「牛马」。

这次的3 Flash有点狠。

它比2.5 Pro强,速度还快了 3 倍,但价格只要3 Pro的四分之一。

注意,是比2.5 Pro强。


直接上数据。

GPQA Diamond 测试博士级科学知识,3 Flash拿了 90.4%。

HLE(Humanity's Last Exam)是人类专家出的终极难题,3 Flash在不使用工具的情况下拿下 33.7% 的准确率。

作为对比,上一代2.5 Flash只有 11%。

MMMU-Pro 测试模型的多模态理解与推理,3 Flash得分 81.2%,这个分数直接超过了Gemini 3 ProGPT-5.2Claude Sonnet 4.5

代码就更有意思了。

SWE-bench Verified,测试 AI 写代码解决真实问题的能力,3 Flash拿到了 78%。

这个分数不仅吊打整个2.5系列,还比自家的3 Pro更高。

是的,你没有看错,比Gemini 3 Pro高。

这你敢信?

一个轻量版模型在代码任务上超过了「旗舰版」,这在以前简直难以想象。


价格呢?

Gemini 3 FlashAPI 输入 0.5 美元/百万 tokens,输出 3 美元/百万 tokens。

开启缓存再省 90%。

用 Batch API 可以再省 50%。

对比3 Pro的输入 2、输出 12 美元,3 Flash以四分之一的价格,在某些任务上表现更好。


谷歌产品负责人 Tulsee Doshi 说:3 Flash就是当代牛马。

当然,这是我翻译过来的。

批量任务、高频调用、实时交互,都是它的使用场景。

游戏公司 Latitude 用3 Flash做 AI 游戏引擎。

之前只有Sonnet 4.5这种顶级模型才能搞定,现在青春版的 Flash 就可以。

Resemble AI 用它做深度伪造检查,多模态分析速度比2.5 Pro快了 4 倍。

法律 AI 公司 Harvey 测了自家的 BigLaw Bench,3 Flash2.5 Flash提升了 7%,低延迟加强推理,完美适合大批量法律文档处理。

GitHub Copilot 官宣支持Gemini 3 Flash,VS Code 和移动端全覆盖。

JetBrains、Figma、Cursor 也都已经接入。


怎么用?

从今天开始,Gemini 3 Flash成为了 Gemini app 的默认模型。

全球所有用户自动升级。

你打开 Gemini,默认就是用它。

关键是,免费。

开发者这边,Google AI Studio、Gemini CLI、Vertex AI 都能用。

谷歌上个月发布的 agentic 开发平台反重力(Antigravity)也同步支持。

另外有个好消息。

Gemini 3 FlashAPI 免费层级也能调用!

前一阵谷歌取消了免费层级的2.5 ProAPI,3 Flash加回来了。

但,亲测 RPM(每分钟请求数)只有 5,RPD(每天请求数)只有 20。

聊胜于无吧。


12 月初,Sam Altman 给 OpenAI 团队发了「红色警戒」Code Red 的内部信。

暂停一切非核心项目。

GPT-5.2发布后,他又自信地表示,预计将于明年 Q1 解除 Code Red。

今天,谷歌发布Gemini 3 Flash

这下,OpenAI 的「红色警戒」又得继续下去了。


我是木易,一个专注 AI 领域的技术产品经理,国内 Top2 本科 + 美国 Top10 CS 硕士。

相信 AI 是普通人的“外挂”,致力于分享 AI 全维度知识。这里有最新的 AI 科普、工具测评、效率秘籍与行业洞察。

欢迎关注“AI信息Gap”,用 AI 为你的未来加速。


精选推荐

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/3 4:30:15

Kotaemon能否实现多租户隔离?SaaS化改造潜力分析

Kotaemon能否实现多租户隔离?SaaS化改造潜力分析 在企业级AI应用加速落地的今天,越来越多的公司不再满足于“一个模型通吃所有场景”的粗放模式。相反,他们更希望拥有一套既能统一运维、又能灵活定制的智能对话平台——尤其是在构建SaaS化服务…

作者头像 李华
网站建设 2026/5/3 4:48:01

Kotaemon智能对话代理框架全面评测

Kotaemon智能对话代理框架全面评测 在企业智能化转型加速的今天,一个能真正“听懂业务”、具备行动能力且可信赖的AI助手,早已不再是锦上添花的功能模块,而是支撑运营效率的核心基础设施。然而,许多团队在尝试构建智能客服或内部…

作者头像 李华
网站建设 2026/5/1 6:26:58

15、字符串操作与动态HTML技术全解析

字符串操作与动态HTML技术全解析 1. 字符串操作基础回顾与拓展 在字符串操作领域,我们已经掌握了一些基础方法,如 charAt() 、 charCodeAt() 、 indexOf() 、 lastIndexOf() 、 substr() 、 substring() 、 toUpperCase() 、 toLowerCase() 以及 length …

作者头像 李华
网站建设 2026/5/3 8:00:05

Vue:如何实现日志导出下载功能?

提示:当前日志导出下载功能,是基于后端接口返回的日志数据url地址进行操作。 提示:当前日志导出下载功能,是基于后端接口返回的日志数据url地址进行操作。 提示:当前日志导出下载功能,是基于后端接口返回…

作者头像 李华
网站建设 2026/5/1 10:30:50

Vue:如何实现一个具有复制功能的文字按钮?

实现一个具有复制功能的文字按钮 通过点击按钮实现指定文字的复制功能。 文章目录1.效果图2.关键代码总结1.效果图 2.关键代码 #template <span id"copycontent">{{web_url}}</span><button style"position: relative; top: -2px;left: 5px;&qu…

作者头像 李华
网站建设 2026/5/4 12:32:31

奇怪的PCB设计知识又增加了:听都没听过的电容,滤波性能竟然这么好?

高速先生成员-- 黄刚 在电源网络中&#xff0c;电容主要是起到去耦滤波的作用&#xff0c;在高速先生的很多文章中都分享过这个基础的概念了&#xff0c;就好像下面的示意图一样。不同封装和容值的电容放到电源链路中的不同位置&#xff0c;能够对不同的频率进行滤波。例如放在…

作者头像 李华