news 2026/5/1 15:37:47

MEET 2026 | 荣获双奖,AI 开源点亮智能未来

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
MEET 2026 | 荣获双奖,AI 开源点亮智能未来

12 月 10 日,以「共生无界,智启未来」为主题的 MEET 2026 智能未来大会在北京举行。承袭 MEET 系列年度行业观察的视角,聚焦以 AI 为代表的智能科技如何穿透产业、学科与场景边界,探讨前沿技术进展与产业落地新动向。

大会邀请清华大学智能产业研究院院长张亚勤、人工智能研究院常务副院长孙茂松等二十余位来自智能科技产业、科研领域的行业领袖与专家,共同交流前沿观点、碰撞思维火花,共论行业破局之道,洞见智能新未来。

小米集团首席语音科学家 Daniel Povey 博士受邀出席,并发表题为《The Evolution of AI —— Lessons from evolution for the future of AI development》的主题演讲。大会现场还权威发布「2025 人工智能年度榜单」,小米集团获“2025人工智能年度领航企业”。

与此同时,本届大会聚焦人工智能在不同行业与场景中的典型应用,评选出在创新性、落地性和行业推动力方面表现突出的 AI 解决方案。在此背景下,“小米汽车全域质量多智能体引擎解决方案”凭借其在数据问答、智能诊断方面的卓越表现,荣获「2025 人工智能年度杰出解决方案」 奖。



01

AI进化论

在开源协作中加速智能涌现


大会上,Daniel Povey 博士创新性地将 AI 数十年的发展历程与生物进化规律相类比,深刻剖析 AI 技术演进的核心逻辑。他认为正如生物进化依赖细胞的分裂与复制,AI 能力的演进同样建立在一代又一代可复现的基线系统之上。在不断的试错与迭代中,新的模型被“筛选”出来,推动能力边界向前拓展。

同时,生物进化受生态环境反馈所制约,AI 的发展也依赖并受到诸多外部因素的影响,例如算力、数据规模与质量等,而 AI 能力本身产生的可供性,又会反过来改变其所处的外部环境,为技术生态和信息环境带来新的可能。

然而,生物进化曾经历漫长的停滞期,甚至发生“大氧化事件”式的断崖式变化。类似地,AI 的能力演进也可能陷入瓶颈,甚至走入“死胡同”,出现阶段性的沉寂。但与随机性的生物演化不同,AI 的演进在本质上由人类主导,其中蕴含着人类的理性、创造力与方向性。

因此,我们可以通过多种方式促进其持续突破:不断注入更坚实的数理知识体系,推动开源运动与开源软件生态,探索跨任务与跨学科的融合路径,保持对新模型架构的开放与好奇,在通用模型与专用模型之间做出审慎权衡,并通过更深入的理解与更智慧的调试来驱动整体能力的进步。

Daniel Povey 博士还介绍了小米在 AI 方面的实践战略——技术深耕与产品赋能双轮驱动。一方面,小米致力于将 AI 技术全面落地小米高端产品中,2025年 AI 相关研发投入占比达四分之一,通过 AI 全面赋能“人车家全生态”,不仅大幅提升了用户体验,更激发了整个生态的活力。

另一方面,小米同样大力投入技术预研,小米 AI 实验室在 AI 赋能智能制造、能耗优化和材料研制等方向取得突破性进展。其中,泰坦合金的成功研制正是“AI for Science”战略的里程碑成果,并直接支撑了小米 SU7 超级大压铸技术的落地,这种从基础科研到产品应用的闭环创新正是小米 AI 战略的核心竞争力所在。

拥抱开源,从 Zipformer 到 Zapformer

Daniel Povey 博士在演讲中重点强调了开源对于 AI 技术发展的重要性,他指出:正如进化可能陷入“局部最优”,AI 发展同样面临停滞风险;而人类理性的介入,让我们能够克服进化的随机性,主动引领技术方向。这一洞见,指引了小米在 AI 领域的实践路径,而开源正是小米将这一理念付诸实践的核心动力。

小米坚信,只有深耕底层技术,才能为上层应用提供坚实可靠的“冰山基座”。用户所能感知的应用界面,如同露出海面的冰峰;而强有力托起这一切的,正是隐藏在海面之下的庞大技术基底。以小米的小爱同学为例,每一次准确、高效的语音交互,都离不开底层硬核技术的坚实支撑。

其中,由“Kaldi之父” Daniel Povey 博士在小米主导的新一代 Kaldi 项目,正是这一理念的杰出体现与核心实践。 作为攻坚底层、构建“技术基底”的明星开源项目,Daniel 博士早在2019年便洞察到 Transformer 架构与通用基础模型的潜力。加入小米后,他正式启动了这一蓝图,致力于从声学编码器、损失函数、优化器到解码器进行全链路重构,打造新一代语音基础引擎。这不仅是为了提升智能语音任务的准确率与效率,其通用方法论更旨在赋能更广泛的 AI 领域。

从刷新纪录的 Zipformer 到定义未来的 Zapformer,新一代 Kaldi 持续引领底层突破。2024年,团队推出的 Zipformer 语音编码器,凭借创新的采样机制和 ScaledAdam 优化器,在语音识别任务中刷新多项国际纪录。今年,团队又带来了全新升级的、更具前瞻性的 Zapformer 通用声音基座。

从 Zipformer 到 Zapformer,我们实现了三大跨越:

  • 从“人声”到“万声”的跨越:从专注于人声建模,到成为能同时理解人声、环境音等多元信息的通用声音基座;

  • 从优化结构到创新理论的跨越:通过引入 Daniel 提出的原创梯度流(Gradient Flow)理论指导模型设计,在已属业界标杆的 Zipformer 基础上,将语音识别精度再次显著提升10%-15%;

  • 从专用优化到通用健壮的跨越:为适应海量数据训练移除了 Dropout 层,增强了大数据拟合能力,同时将优化器升级为 TransformAdam,在保持极速收敛的同时,大幅提升了训练的通用性与稳定性。

这些跨越,共同构成了 Zapformer 重新定义通用声音基座能力边界的硬核实力。

小米始终秉持“站在巨人的肩膀上,也给巨人指方向”的理念,坚信只有开放的协作,才能最大程度地加速智能时代的真正到来。据不完全统计,2025年小米新增的开源的项目就多达 30 余个,其中不乏像 Miloco,MiDashengLM,Zipvoice 等得到社区热烈追捧的明星项目。Zapformer 这一突破性成果,也会在开源社区完整释放,敬请期待。


02
小米汽车全域质量

多智能体引擎解决方案

随着第50万辆整车在北京亦庄超级工厂正式下线,小米汽车迎来了一个新的规模化阶段。为了能够更及时、更可靠地解答用户问题,促进小米汽车质量迭代优化,推出小米汽车全域质量多智能体引擎解决方案(以下简称:解决方案)。解决方案核心通过以 AI 赋能小米汽车质量检测,贯穿研、产、供、销、服全生命周期,以数据问答、智能诊断、8D 报告一键生成,打造“发现-分析-解决-预防”质量业务闭环,让质量决策秒级完成、缺陷归零快人一步。

数字分身:AI辅助下的数据问答

小米汽车全域质量多智能体引擎解决方案团队推出业界首个深度融合 FAS/HAS 双阶段 Agent 架构的质量工程师数字分身,超越了简单的问答工具,支持数据问答、自然语言交互、多轮对话、图表生成、8D 报告一键生成等能力,将汽车质量工程从经验驱动推向智能涌现时代,复杂主题分析耗时从周级别压缩至分钟级。

通过将海量小米领域数据嵌入开源基座中,智能整合覆盖从研发设计→生产制造→供应链→销售交付→售后服务完整链路的结构化数据资产,形成整车全生命周期数据闭环,原本分散在研、产、供、销、服各域的“数据点”转化为“知识链”,对汽车出现的质量问题做到更迅速、更准确的响应。基于此,解决方案的最终目标是能够实现:当车辆出现故障现象时,其根因可追溯至设计缺陷、供应商零件或生产工艺的全局分析,而非单点解决。

解决方案以汽车领域知识大模型为底座,突破传统数据孤岛,实现自然语言精准查询。通过 NL2SQL 和智能意图识别,攻克自然语言到复杂查询的转化难题 ,精准理解质量工程师的模糊业务提问 ,自动规划跨系统(MES、SQMS、DMS、QMS等)的数据提取路径 ,并提供多轮交互式分析洞察 。复杂查询准确率从58%跃升至86%,让数据查询与分析洞察告别“盲人摸象”,实现“精准靶向”。

智能诊断:高效响应下的质量检验

一直以来,传统汽车故障诊断需要经验丰富的资深人员依靠所掌握的知识和经验排查故障,但随着汽车保有量的提升,诊断需求的不断增多,使得原有业务模式难以持续。

基于此,团队创新性推出“推理大模型+时序大模型”的智能诊断方案,精准定位故障所在位置,使得故障处理速度提升10倍以上。对于一些复杂的、多因素导致的信号异常等质量问题,智能诊断通过时序大模型与深度学习时序检测算法融合的方案,融合后算法异常检出率高于92%。

同时探索构建时序基座大模型提升时序通用的预测能力,实现在小样本的情况下达到领先效果。此外,可无限复制扩展和自动迭代的 AI 模型在动态适配优化版本的同时,还能够有效降低诊断成本,以更安全、更高效的诊断交出属于小米汽车的质量答卷。

-

从生物进化的漫长征程到 AI 技术的跨越式发展,人类正站在一个前所未有的历史节点。小米始终相信,真正的技术突破源于对底层逻辑的深度理解,也源于对开放协作的坚定信念。从 Zipformer 到 Zapformer 的跨越,从泰坦合金的 AI 辅助研发到小米汽车全域质量多智能体引擎的落地应用,我们看到的不仅是技术本身的进化,更是 AI 如何穿透产业边界、重塑价值方式的生动实践。

未来,小米将继续深化 AI 技术在全生态的探索与应用,深入推进开源协作,不断为用户创造更加智能、便捷、富有想象力的生活方式,为AI技术的产业化落地与行业生态的繁荣发展贡献更多力量。

END

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/1 0:57:00

NVIDIA Profile Inspector完全攻略:释放显卡隐藏性能

NVIDIA Profile Inspector完全攻略:释放显卡隐藏性能 【免费下载链接】nvidiaProfileInspector 项目地址: https://gitcode.com/gh_mirrors/nv/nvidiaProfileInspector NVIDIA Profile Inspector是一款能够深度挖掘NVIDIA显卡性能的利器。与官方控制面板相比…

作者头像 李华
网站建设 2026/5/1 0:56:59

腾讯用“LLM+GNN“双剑合璧,广告推荐GMV暴涨2.8%!小白也能学会的冷启动解决方案

摘要 传统的广告召回单一模型往往难以有效平衡“语义精准”与“关系覆盖”、“冷启动”与“实时性”之间的结构性矛盾。为应对这一挑战,腾讯广告技术团队提出了融合 LLM 与 GNN 的创新方案,采用“GNN挖掘关系、LLM解析语义”的协同机制。 该方案既保留了…

作者头像 李华
网站建设 2026/5/1 0:56:58

B站视频智能转文字工具:让视频内容轻松变文本

B站视频智能转文字工具:让视频内容轻松变文本 【免费下载链接】bili2text Bilibili视频转文字,一步到位,输入链接即可使用 项目地址: https://gitcode.com/gh_mirrors/bi/bili2text 还在为手动记录视频内容而烦恼吗?每天面…

作者头像 李华
网站建设 2026/5/1 0:56:59

Wan2.2-T2V-A14B已被纳入高校数字艺术课程教学案例库

Wan2.2-T2V-A14B已被纳入高校数字艺术课程教学案例库 在数字内容创作门槛不断降低的今天,一个学生只需输入“敦煌飞天在星空中起舞,衣袂飘飘如云卷云舒”,几秒钟后就能看到一段流畅、细腻、极具东方美学意境的视频片段——这不再是科幻场景&a…

作者头像 李华
网站建设 2026/5/1 0:57:00

GPT-5.2:人工智能的创造力,能否超越人类的想象力?

AI与人类创作的对比 随着GPT-5.2的发布,人工智能在创作领域的表现让人惊叹不已。从写作到设计,再到音乐和艺术创作,GPT-5.2的能力不断扩展,令人不禁思考:人工智能的创造力,真的能够超越人类的想象力吗&…

作者头像 李华
网站建设 2026/5/1 0:16:56

R语言量子计算模拟资源稀缺曝光:仅剩5个开源包可实战,别再错过

第一章:R语言量子计算模拟的现状与挑战随着量子计算研究的不断深入,传统编程语言在模拟量子系统中的作用日益凸显。R语言作为统计计算与数据可视化的主流工具,近年来也被尝试用于量子态模拟和基础量子算法实现。尽管其并非专为高性能数值计算…

作者头像 李华