news 2026/5/30 22:01:41

火山引擎发布豆包大模型1.8和音视频创作模型Seedance 1.5 pro

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
火山引擎发布豆包大模型1.8和音视频创作模型Seedance 1.5 pro

12月18日,火山引擎在FORCE原动力大会上正式发布豆包大模型1.8及音视频创作模型Seedance 1.5 pro。权威评测数据显示,豆包大模型在多模态理解、生成能力及Agent能力上,已跻身全球第一梯队。

据火山引擎总裁谭待介绍,截至今年12月,豆包大模型日均token使用量突破50万亿,较去年同期增长超过10倍;目前已有超过100家企业客户累计token使用量超过一万亿。

图:火山引擎总裁 谭待

豆包大模型1.8:打造更强多模态Agent“大脑”

作为豆包家族的最新旗舰模型,豆包大模型1.8(Doubao-Seed-1.8)面向多模态Agent场景进行了定向优化。其工具调用能力、复杂指令遵循能力及OS Agent能力均得到增强,提升了模型在处理复杂任务时的规划与执行水平。

在视觉理解方面,豆包1.8的单次视频理解帧数从640帧倍增至1280帧。模型支持以低帧率理解超长视频,并能调用工具对关键片段进行高帧率理解。该能力可广泛用于在线教育、产品质检等场景中。

图:豆包大模型1.8测试表现

在多项公开评测中,豆包1.8展现出极具竞争力的全面表现:在视觉推理、通用视觉问答、空间理解及视频理解等任务中,均获得最佳或接近最佳成绩;在通用智能体测评集BrowserComp上表现全球领先;在数学与推理等基础能力维度上,整体水平已接近全球顶尖的通用模型。

Seedance 1.5 pro:音画高精同步,重塑AI视频生产力

针对日益增长的视频创作需求,火山引擎推出了Seedance 1.5 pro音视频创作模型。该模型不仅具备影视级的叙事张力,能够精准捕捉运动细节并细腻呈现人物情绪,更在音画同步技术上取得了突破性进展。

Seedance 1.5 pro采用创新的原生音视频联合生成架构,支持环境音、背景音乐、人声等多种元素,实现了毫秒级的音画同步输出。在对白处理上,模型支持多人多语言对话,口型对齐精准,覆盖中文方言(如四川话、粤语等)、英文及小语种,极大地提升了视频内容的真实感与全球化创作潜力。

为进一步降低创作门槛与成本,Seedance系列即将上线“Draft样片”功能。创作者可先生成低分辨率样片进行预览,其关键要素与最终成片高度一致,真正做到“预览即所得”。数据显示,该功能可帮助创作者提升65%的整体效率,并减少60%的无效创作成本。

目前,个人用户已可在豆包、即梦AI等平台体验该模型;企业用户则可从12月23日起,通过火山引擎API接入Seedance 1.5 pro模型服务。

升级AI云原生架构,构建Agent规模化落地基座

谭待指出,传统的IT架构已无法满足Agent时代的需求,以模型为中心的AI云原生架构正在形成,并围绕Agent的开发与运营进行重构。

在Agent开发层面,火山引擎全面升级了企业级AI Agent平台——AgentKit。该平台覆盖了Agent从开发、部署到管控的全生命周期,旨在解决企业在Agent落地中面临的身份权限管理、模型确定性及系统集成等核心挑战。

在Agent运营层面,火山引擎推出了HiAgent智能体工作站。该工作站通过构建统一的企业AI任务调度中心、提供一系列开箱即用的通用智能体,以及支持个性化定制智能体应用,帮助企业实现Agent的规模化管理与应用。

此外,为降低企业使用门槛,火山引擎推出了业内首个“AI节省计划”。该计划覆盖所有按量后付费的大模型产品,通过阶梯式折扣,帮助企业最高节省47%的成本。

谭待表示,通过从模型能力到基础设施的全面革新,火山引擎正在推动AI应用从单一的模型调用向复杂的Agent智能体生态演进,加速AI能力在各行各业的深度落地。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/28 12:46:09

python django于Hive on Spark国内地震数据的可视化与分析_420lf7h1

文章目录具体实现截图主要技术与实现手段关于我本系统开发思路java类核心代码部分展示结论源码lw获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!具体实现截图 同行可拿货,招校园代理 怕一天哄-flask-django_6nsnDjangoHIV额onSpark_0lf7h1 …

作者头像 李华
网站建设 2026/5/28 16:40:25

10379_基于SSM的校园跑腿服务平台

1、项目包含 项目源码、项目文档、数据库脚本、软件工具等资料; 带你从零开始部署运行本套系统。 2、项目介绍 该跑腿服务平台以JSP技术为基础,以MySQL为后台储存,以B/S结构、采用自上而下的结构性的分析方式,对跑腿服务平台的…

作者头像 李华
网站建设 2026/5/28 14:01:16

1、现代 C++ 挑战:从实践中成长为专家

现代 C++ 挑战:从实践中成长为专家 1. 背景与目标 C++ 是一种通用编程语言,融合了面向对象、命令式、泛型和函数式编程等多种范式。它以高效著称,在对性能要求极高的应用场景中是首选语言。过去几十年里,C++ 在工业、学术界等领域广泛应用。不过,C++ 标准文档近 1500 页…

作者头像 李华
网站建设 2026/5/30 18:41:06

4、C++ 语言特性与字符串处理技巧

C++ 语言特性与字符串处理技巧 1. 资源管理与温度标量处理 1.1 资源管理示例 在 C++ 编程中,资源管理是一个重要的问题。例如,在文件操作时,如果没有正确关闭文件句柄,可能会导致资源泄漏。为了解决这个问题,我们可以定义一个句柄类型,避免因异常或开发者疏忽而未正确关…

作者头像 李华
网站建设 2026/5/28 12:22:57

浩云长盛的算力工具箱:让兼容与前瞻同行

作者:王聪彬 算力产业的进步、算法的演进,以及生态体系的完善,三者是未来AI赖以发展的关键要素。“然而这三个方面,中国并非绝对先行者,所以我们必须进行前瞻性的推演和战略演算。”浩云长盛集团技术研发AVP彭轶峰说道…

作者头像 李华