news 2026/3/21 5:07:10

AI祛魅之后:2026年将是AI脱下华丽外衣并穿上工装的一年

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AI祛魅之后:2026年将是AI脱下华丽外衣并穿上工装的一年

2026年将是人工智能脱下华丽外衣并穿上工装的一年,技术从喧嚣的概念验证正式迈向产生真实价值的产业深处。

2025刚刚过去,这一年像是对人工智能的一次全面体检,而2026年将是这项技术展现其实用价值的关键年份。

整个行业的焦点正在发生实质性转移,不再单纯执着于构建参数规模越来越庞大的语言模型,转而投向那些更为艰巨的任务,即如何让AI真正变得好用。

实践层面的重心变成了在合适的场景部署更小的模型,将智能嵌入物理设备,以及设计能够干净利落地融入人类工作流的系统。

TechCrunch(科技博客)采访的专家们普遍认为,2026年是一个过渡之年。

行业将从单纯依赖算力堆砌的暴力扩张,转向对新架构的深度研究。比如DeepSeek新年的mHC架构革新:梁文锋署名,DeepSeek新年开启宏观架构新篇章,破解梯度爆炸与显存墙。

从令人眼花缭乱的演示视频,转向目标明确的实际部署。

从承诺实现完全自主的智能体,转向真正能够增强人类工作能力的辅助系统。

盛宴并未结束,但狂欢的人群开始变得清醒。

Scaling laws终结与架构新生

回顾2012年,AI科学家Alex Krizhevsky、Ilya Sutskever和Geoffrey Hinton发表了著名的ImageNet论文,向世界展示了AI系统可以通过观察数百万个示例来学习识别图片中的物体。

这种方法在当时计算成本极高,但图形处理器GPU的出现使其成为可能。

这一突破开启了长达十年的硬核AI研究热潮,科学家们致力于为不同的任务发明新的架构。

这股浪潮在2020年左右达到顶峰,OpenAI推出了GPT-3。

GPT-3向世人证明,简单地将模型规模扩大100倍,就能解锁编程和推理等能力,且无需进行显式的训练。

Workera(AI代理平台)的创始人兼首席执行官Kian Katanforoosh将这一转变称为扩展时代。

这是一个被某种信念定义的时期,人们相信更多的计算能力、更多的数据和更大的Transformer模型将不可避免地推动AI取得下一个重大突破。

如今许多研究人员认为,AI行业正开始触及缩放定律的极限,并将再次过渡到一个以研究为核心的时代。

Meta前首席AI科学家Yann LeCun长期以来一直反对过度依赖缩放,强调开发更好架构的必要性。

Sutskever在最近的一次采访中也表示,目前的模型正在进入平台期,预训练结果已经趋于平缓,这表明行业需要新的思路。

Katanforoosh(Workera的创始人兼CEO)认为在未来五年内,人类极有可能找到一种比Transformer有显著改进的更好架构。

如果找不到这种新架构,就不能指望模型会有太大的改进。

这种观点的转变标志着行业从盲目追求参数规模,回归到了对智能本质和底层算法效率的理性探索。

小模型的崛起与智能体互联的标准化

大型语言模型擅长归纳通用知识,但许多专家指出,下一波企业AI的采用浪潮将由更小、更敏捷的语言模型驱动。

这些小模型可以针对特定领域的解决方案进行微调。

AT&T(美国电话电报公司)首席数据官Andy Markus表示,微调后的小型语言模型(SLMs)将成为2026年的大趋势,并成为成熟AI企业的标配。

成本和性能优势将推动企业优先使用这些模型,而不是直接使用开箱即用的大型语言模型。

企业越来越依赖SLMs,因为如果微调得当,它们在企业业务应用中的准确性可以媲美大型通用模型,并且在成本和速度方面表现卓越。

法国开源AI初创公司Mistral也提出过类似的论点。

Mistral认为其小模型在经过微调后,在多个基准测试中的表现实际上优于大模型。

ABBYY(智能自动化AI公司)的AI策略师Jon Knisley指出,SLMs的效率、成本效益和适应性使其成为对精度要求极高的定制应用的理想选择。

边缘计算的进步加速了这一趋势,使得在端侧运行智能模型成为可能。

与此同时,智能体在2025年的表现未能达到预期,很大程度上是因为很难将它们连接到实际工作发生的系统中。

没有访问工具和上下文的途径,大多数智能体被困在试点工作流中无法发挥实效。

Anthropic推出的MCP被称为AI的USB-C接口,它允许AI智能体与数据库、搜索引擎和API等外部工具进行对话。

MCP证明了自己是缺失的关键连接组织,并正在迅速成为行业标准。

OpenAI和微软已经公开拥抱MCP,Anthropic最近还将其捐赠给了Linux基金会新成立的Agentic AI Foundation(智能体AI基金会)。

该基金会旨在帮助标准化开源智能体工具。

谷歌也开始建立自己的托管MCP服务器,以连接AI智能体与其产品和服务。

随着MCP减少了将智能体连接到真实系统的摩擦,2026年极有可能是智能体工作流最终从演示走向日常实践的一年。

Sapphire Ventures(蓝宝石风投)合伙人Rajeev Dham表示,这些进步将导致以智能体为先的解决方案在各行各业承担起记录系统的角色。

随着语音智能体处理更多端到端任务,如客户接待和沟通,它们也将开始构成底层的核心系统。

这一趋势将出现在家庭服务、房地产科技和医疗保健等多个领域,以及销售、IT和支持等横向职能部门中。

这种转变不仅仅是技术的升级,更是工作方式的重塑。

人们希望位于API之上而不是之下,2026年对于实现这一愿景至关重要。

世界模型的构建与物理智能的全面落地

人类不仅仅通过语言学习,通过体验世界的运作方式来学习。

大型语言模型并不真正理解世界,它们只是预测下一个单词或想法。

这就是为什么许多研究人员相信,下一个巨大的飞跃将来自世界模型。

世界模型是指那些能够学习事物在三维空间中如何移动和互动的AI系统,从而使它们能够做出预测并采取行动。

种种迹象表明,2026年将是世界模型的大年。

LeCun离开Meta创办了自己的世界模型实验室,据报道正在寻求50亿美元的估值。

Google的DeepMind一直在致力于Genie项目,并在8月推出了能够构建实时交互式通用世界模型的最新模型。

除了Decart和Odyssey等初创公司的演示外,李飞飞的World Labs也推出了其首个商业世界模型Marble。

像General Intuition这样的新入局者在10月获得了1.34亿美元的种子轮融资,用于教导智能体空间推理能力。

视频生成初创公司Runway在12月发布了其首个世界模型GWM-1。

虽然研究人员看到了在机器人技术和自动驾驶方面的长期潜力,但近期的影响可能首先在电子游戏中显现。

PitchBook(皮距书数据公司)预测,受技术生成互动世界和更逼真非玩家角色能力的推动,游戏中的世界模型市场规模可能从2022年至2025年间的12亿美元增长到2030年的2760亿美元。

General Intuition创始人Pim de Witte认为,虚拟环境可能不仅会重塑游戏,还将成为下一代基础模型的关键测试场。

技术的进步如小模型、世界模型和边缘计算,将推动机器学习在物理应用层面的落地。

AT&T Ventures(AT&T风投)负责人Vikram Taneja认为,物理AI将在2026年成为主流。

包括机器人、自动驾驶汽车AVs(自动驾驶车)、无人机和可穿戴设备在内的新型AI驱动设备类别将开始进入市场。

自动驾驶汽车和机器人是物理AI显而易见的使用案例,无疑将在2026年继续增长,但所需的训练和部署仍然昂贵。

相比之下,可穿戴设备提供了一个成本较低的切入点,更容易获得消费者的认可。

像Ray-Ban Meta这样的智能眼镜开始搭载能够回答用户所见内容的助手。

AI驱动的健康戒指和智能手表等新形态正在使全天候、贴身的端侧推理变得常态化。

连接服务提供商将致力于优化其网络基础设施,以支持这一波新设备浪潮。

那些能够灵活提供连接服务的提供商将处于最佳位置。

26年人们将意识到AI并不像预想的那样自主工作,对话将更多地集中在AI如何被用于增强人类工作流,而不是取代它们。

许多公司将开始招聘,预计在AI治理、透明度、安全和数据管理方面将出现新岗位。

失业率预计明年平均将低于4%。

技术的最终归宿是为人服务,2026年我们将见证AI从云端神坛走向手中工具的务实回归。

参考资料:

https://techcrunch.com/2026/01/02/in-2026-ai-will-move-from-hype-to-pragmatism/

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/15 19:16:53

为什么你的容器通过了启动却无法存活?(健康检查失败终极诊断)

第一章:为什么你的容器通过了启动却无法存活?在 Kubernetes 或 Docker 环境中,容器成功启动并不意味着它能持续运行。许多开发者遇到过 Pod 显示为“Running”状态,但应用实际不可用的情况。根本原因往往在于容器启动后因健康检查…

作者头像 李华
网站建设 2026/3/16 2:07:47

一文详解大模型微调|如何微调(Fine-tuning)大语言模型?

本文介绍了微调的基本概念,以及如何对语言模型进行微调。 从 GPT3 到 ChatGPT、从GPT4 到 GitHub copilot的过程,微调在其中扮演了重要角色。什么是微调(fine-tuning)?微调能解决什么问题?什么是 LoRA&…

作者头像 李华
网站建设 2026/3/17 9:25:33

flask基于python的3D打印技术专利分析系统

文章目录摘要项目简介大数据系统开发流程主要运用技术介绍爬虫核心代码展示结论源码文档获取定制开发/同行可拿货,招校园代理 :文章底部获取博主联系方式!摘要 该系统基于Flask框架和Python技术栈,构建了一个针对3D打印技术专利数据的分析平…

作者头像 李华
网站建设 2026/3/15 13:26:37

36氪专访预约通道:讲述VibeThinker创业背后的故事

VibeThinker-1.5B:小模型如何在数学与编程推理中“以小博大”? 在大模型动辄千亿参数、训练成本破百万美元的今天,一个仅用不到8000美元训练、参数量只有15亿的AI模型,竟然能在国际数学竞赛和算法题库上击败数十倍于它的对手——这…

作者头像 李华
网站建设 2026/3/16 2:07:42

Docker镜像大小优化实战(从小白到专家的压缩秘技)

第一章:Docker镜像大小优化的核心意义在现代云原生架构中,Docker镜像作为应用交付的核心载体,其体积直接影响部署效率、资源消耗与安全边界。过大的镜像不仅增加拉取时间,还可能引入不必要的依赖和潜在漏洞,因此优化镜…

作者头像 李华
网站建设 2026/3/19 17:53:16

跟我学C++中级篇——取地址操作

一、取地址 在C/C开发中,指针操作既是一个难点,同时也是一个无法绕开的知识点。一个对象的指针,可以说就是一个对象的地址。那么如何取得这个对象指针呢?或者说如何取得对象地址呢?在传统的开发中,开发者可…

作者头像 李华