news 2026/5/25 18:22:28

Tongyi DeepResearch:30B参数AI深度搜索新标杆

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Tongyi DeepResearch:30B参数AI深度搜索新标杆

Tongyi DeepResearch:30B参数AI深度搜索新标杆

【免费下载链接】Tongyi-DeepResearch-30B-A3B项目地址: https://ai.gitcode.com/hf_mirrors/Alibaba-NLP/Tongyi-DeepResearch-30B-A3B

导语:阿里巴巴通义实验室推出300亿参数的Tongyi DeepResearch大模型,以仅30亿激活参数实现深度信息检索突破,刷新多项智能搜索基准测试纪录。

行业现状:智能搜索进入"深度推理"新阶段

随着大语言模型技术的快速迭代,AI搜索正从简单信息匹配向复杂问题解决演进。当前市场对能够处理多步骤推理、长周期信息收集的智能系统需求激增,尤其在学术研究、市场分析和技术调研等专业领域。据行业报告显示,具备自主决策能力的Agentic AI系统市场规模预计2025年将突破百亿美元,成为企业智能化转型的核心基础设施。

模型亮点:四大创新重塑AI搜索能力

Tongyi DeepResearch作为专为"长周期深度信息检索"任务设计的智能体模型,核心优势体现在四个维度:

全自动化合成数据生成管道构建了从数据采集到标注的端到端流程,为模型训练提供了高质量、大规模的智能体交互数据,解决了传统Agent训练数据稀缺的行业痛点。这一管道支持持续迭代优化,确保模型能力不断进化。

智能体数据持续预训练策略使模型能够在保持知识新鲜度的同时,强化推理能力。通过摄入多样化的智能体交互数据,模型建立了独特的"搜索-推理-决策"认知框架,显著提升了处理复杂问题的能力。

端到端强化学习框架采用创新的Group Relative Policy Optimization算法,结合token级策略梯度和留一法优势估计,有效解决了非平稳环境下的训练稳定性问题。这种严格的on-policy强化学习方法,使模型决策质量和执行效率得到双重提升。

双推理范式兼容设计满足了不同场景需求:ReAct范式确保模型核心能力的可靠评估,而基于IterResearch的"Heavy"模式则通过测试时扩展策略,释放模型最大性能潜力,实现了研究深度与效率的平衡。

行业影响:重新定义AI辅助研究范式

该模型在Humanity's Last Exam、BrowserComp、WebWalkerQA等多个权威智能体搜索基准测试中均取得当前最佳性能,标志着我国在智能搜索领域达到新高度。其300亿总参数与30亿激活参数的创新设计,在保证性能的同时显著降低了计算资源消耗,为大模型的高效部署提供了新思路。

对于科研机构和企业研发团队而言,Tongyi DeepResearch有望成为学术探索和技术创新的"AI研究助手",通过自动化文献调研、多源信息整合和深度问题分析,大幅提升研究效率。在商业应用中,该模型可赋能市场情报分析、竞争格局研判和技术趋势预测等场景,帮助企业快速把握市场机遇。

结论:迈向自主智能体新纪元

Tongyi DeepResearch的推出,不仅展示了我国在大模型领域的技术实力,更推动AI从被动响应向主动探索跨越。随着模型的开源和进一步优化,预计将催生一批基于智能体的创新应用,加速各行业的智能化转型。未来,具备深度搜索和推理能力的AI系统,有望成为连接人类知识与创新的重要桥梁,开启人机协作的新篇章。

【免费下载链接】Tongyi-DeepResearch-30B-A3B项目地址: https://ai.gitcode.com/hf_mirrors/Alibaba-NLP/Tongyi-DeepResearch-30B-A3B

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 11:00:14

ResNet18优化技巧:模型并行推理加速

ResNet18优化技巧:模型并行推理加速 1. 背景与挑战:通用物体识别中的效率瓶颈 在当前AI应用广泛落地的背景下,通用物体识别已成为智能监控、内容审核、辅助驾驶和AR交互等场景的核心能力。基于ImageNet预训练的ResNet-18因其结构简洁、精度…

作者头像 李华
网站建设 2026/5/9 6:46:02

DeepSeek-V3.1-Terminus升级:智能体性能与语言体验双优化

DeepSeek-V3.1-Terminus升级:智能体性能与语言体验双优化 【免费下载链接】DeepSeek-V3.1-Terminus DeepSeek-V3.1-Terminus是V3的更新版,修复语言问题,并优化了代码与搜索智能体性能。 项目地址: https://ai.gitcode.com/hf_mirrors/deeps…

作者头像 李华
网站建设 2026/5/19 5:06:36

Qwen-Image-Edit-2509:多图融合+ControlNet的AI修图新体验

Qwen-Image-Edit-2509:多图融合ControlNet的AI修图新体验 【免费下载链接】Qwen-Image-Edit-2509 项目地址: https://ai.gitcode.com/hf_mirrors/Qwen/Qwen-Image-Edit-2509 导语:阿里达摩院推出Qwen-Image-Edit-2509,通过多图融合技…

作者头像 李华
网站建设 2026/5/23 8:30:51

GLM-Edge-4B-Chat:轻松玩转终端AI对话新体验

GLM-Edge-4B-Chat:轻松玩转终端AI对话新体验 【免费下载链接】glm-edge-4b-chat 项目地址: https://ai.gitcode.com/zai-org/glm-edge-4b-chat GLM-Edge-4B-Chat模型正式发布,标志着大语言模型向终端设备普及迈出重要一步,普通用户可…

作者头像 李华
网站建设 2026/5/15 8:45:35

GLM-4.6-FP8横空出世:200K上下文重塑智能体验

GLM-4.6-FP8横空出世:200K上下文重塑智能体验 【免费下载链接】GLM-4.6-FP8 GLM-4.6-FP8在GLM-4.5基础上全面升级:上下文窗口扩展至200K tokens,支持更复杂智能体任务;编码性能显著提升,在Claude Code等场景生成更优质…

作者头像 李华
网站建设 2026/5/20 19:18:29

Step1X-Edit v1.2:AI图像编辑推理能力再突破

Step1X-Edit v1.2:AI图像编辑推理能力再突破 【免费下载链接】Step1X-Edit-v1p2-preview 项目地址: https://ai.gitcode.com/StepFun/Step1X-Edit-v1p2-preview 导语:Step1X-Edit v1.2版本正式发布,通过原生推理编辑模型架构实现了图…

作者头像 李华