news 2026/5/7 15:50:56

谷歌Veo 3.1更新:更一致性、更具创造力和控制力

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
谷歌Veo 3.1更新:更一致性、更具创造力和控制力

刚刚,谷歌Veo 3.1发布更新。

通过素材转视频功能,实现了角色身份、背景与物体在动态场景中的高度一致性,并首次支持原生竖屏生成与4K超分画质,彻底打通了从静态图像到专业级动态叙事的创作链路。

三大更新都是当前市场需求最大的领域:

  • 支持基于参考图片创建视频功能。而且即使是简单的提示,视频也更具表现力和创意。
  • 原生支持竖屏模式,移动优先。
  • 最先进的1080p和4K分辨率升频。

精准控制素材赋予视频连贯的生命力

视频生成的最大痛点往往在于一致性的缺失。

过去我们使用AI生成视频时,常常面临一个尴尬的局面:上一秒的主角在下一秒换了一张脸,或者背景中的物体在运动过程中莫名其妙地变形。

这种随机性虽然有时能带来意外的艺术效果,但对于想要认真讲故事的创作者来说,这简直是噩梦。

Veo 3.1的更新引入了更加成熟的素材转视频能力,也就是Ingredients to Video(素材转视频)。

通过使用参考图像,创作者可以确保视频中的核心元素保持不变。

比如你设计了一个独特的卡通角色,或者拍摄了一款特定的产品,你希望它们在视频中动起来,同时保持原有的样貌。

Veo 3.1能够锁定这些视觉身份,即使在角色做出复杂的动作,或者镜头发生推拉摇移时,角色的五官特征、衣着细节以及整体气质都能保持高度一致。

这对于叙事类内容的创作至关重要,因为观众需要通过稳定的视觉符号来建立对角色的认知和情感连接。

这种一致性控制不仅局限于人物,同样延伸到了背景和物体

在过去的AI视频中,背景往往随着镜头的移动而发生诡异的扭曲,仿佛整个世界都在融化。

现在你可以通过上传背景或物体的参考图,命令AI维持场景的完整性。

想象一下你正在制作一个产品广告,你需要让这个产品出现在不同的场景中,可能是阳光明媚的海滩,也可能是充满科技感的实验室。

Veo 3.1允许你复用同一个物体、背景或纹理素材,跨越多个场景进行生成。

这就像是在数字世界里搭建了一个真实的摄影棚,你可以随意更换布景,调度演员,但所有的道具和环境都像现实中一样真实可信且稳固。

而且这种控制力带来了更强的融合能力。创作者可以将原本不属于同一个维度的元素拼贴在一起。

比如你可以将一个写实风格的人物放入一个水彩风格的背景中,或者将某种特殊的纹理材质赋予给特定的物体。

Veo 3.1能够理解这些不同元素之间的空间关系和光影逻辑,将它们无缝地融合在同一个画面里,生成具有高冲击力的视觉片段。

这种能力的提升,本质上是将静态的拼贴艺术升级为了动态的蒙太奇,让创作者能够以极低的成本实现以往需要复杂后期特效才能完成的视觉创意。

为了获得最佳的素材图像,谷歌建议搭配使用Gemini应用或Flow中的Nano Banana Pro模型。

当你拥有了足够优质的静态图像作为输入,Veo 3.1就能更好地理解你的意图,生成出对话丰富、叙事感强烈的动态片段。

原生竖屏与移动优先的创作美学

很多AI视频工具生成的都是横屏内容,创作者如果想要发布到YouTube Shorts或其他短视频平台,不得不进行裁剪。

这种裁剪往往是破坏性的,它会丢失画面两侧的重要信息,破坏原本精心构图的平衡感,甚至导致画质的严重下降。

Veo 3.1敏锐地捕捉到了这一需求的变化,首次在素材转视频功能中引入了原生的竖屏输出支持。

当你选择竖屏模式时,Veo 3.1在构图时就会考虑到纵向空间的延伸感。它会自动调整人物在画面中的站位,优化背景元素的排列,确保在狭长的手机屏幕上,主体依然突出,视觉重心依然稳固。

对于专注于移动端的内容创作者来说,这意味着生产力的巨大释放。

你可以直接生成适合YouTube Shorts的内容,无需在后期软件中进行繁琐的二次构图。

无论是展示全身穿搭的时尚博主,还是记录生活片段的Vlog作者,甚至是制作竖屏微短剧的专业团队,都可以利用这一功能快速产出高质量的视频素材。

这种自由度在当今多平台分发的媒体环境中显得尤为珍贵,它让同一个创意可以轻松地衍生出适应不同渠道的版本,最大化内容的传播价值。

突破分辨率极限的专业级画质

Veo 3.1通过引入最先进的放大技术,创作者可以将生成的视频提升至1080p甚至4K分辨率。

高分辨率提供了更加锐利和干净的画面。

对于大多数网络视频平台和社交媒体来说,这已经是一个非常完美的标准。

画面中的线条更加清晰,色彩的过渡更加自然,原本在低分辨率下可能出现的伪影和涂抹感得到了极大的抑制。

这样的视频素材可以直接导入剪辑软件中进行后期处理,无论是调色、添加特效还是与其他实拍素材混剪,都能保持画质的统一性,不会因为分辨率的短板而显得突兀。

这种高分辨率的输出能力得益于最先进的超分算法。它不是简单地将图像拉伸,而是通过深度学习模型预测并补充了像素之间的细节信息。

这种技术在保持原始画面风格和动态的同时,赋予了画面更接近真实物理世界的光学质感。配合Veo 3.1在动态生成上的进步,高分辨率让视频的沉浸感成倍增加。

对于普通消费者和创作者,Veo 3.1的素材转视频功能已经直接登陆了YouTube Shorts和YouTube Create应用。

同时Gemini应用也开放了这一功能的体验入口。

对于专业人士和企业用户,这些功能正在向Flow、Gemini API、Vertex AI以及Google Vids推出。特别是1080p和4K的选项,将成为专业工作流中的得力助手。

参考资料:

https://blog.google/innovation-and-ai/technology/ai/veo-3-1-ingredients-to-video/

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/3 7:12:38

九章算Angew. Chem. Int. Ed.解读【水系质子电池】江苏科技大学博士一作最新:几何预构型调控熵受限质子迁移的超快且稳定的水系质子电池

【文章信息】 本文第一作者是江苏科技大学在读博士生刘贺,曾以第一作者或共同作者在Angewandte Chemie、Advanced Functional Materials等期刊发表论文十余篇,欢迎各位科研同行交流。 【研究背景】 水系质子电池(Aqueous Proton Batteries, …

作者头像 李华
网站建设 2026/5/5 20:33:56

建模智能体,AI 时代的数据治理新范式

从制度治理到生成式治理的根本转变 1 数据治理是上一代信息化的体系性问题 过去十多年,企业在数据治理上的投入并不算少。沿着数据治理方法论,我们有主数据、元数据、数据标准、数据质量、数据资产目录、数据开发与分析、安全分级分类……几乎每一个治理…

作者头像 李华
网站建设 2026/5/6 10:54:30

苹果手机照片怎么导入电脑?苹果手机传输照片就用这5招

大家的苹果手机中都存储着许多照片吧,它们通常很占内存,无论是为了腾空间,还是安全备份,将照片导入电脑都是一个明智的选择。那,苹果手机照片怎么导入电脑?听起来简单是吧?但实际操作中&#xf…

作者头像 李华
网站建设 2026/5/1 1:02:21

配环境1天,上线3分钟:我把整个团队的本地环境都扔了

“在我电脑上明明是好的”,这句话我曾说过无数次,也听过无数次。一个微小的环境差异,就能让整个团队的联调陷入僵局,浪费掉一下午的时间。在又一次因为环境问题导致上线延期后,我意识到,我们必须彻底抛弃这…

作者头像 李华
网站建设 2026/5/1 13:50:02

2025年吉林大学计算机考研复试机试真题(解题思路 + AC 代码)

2025年吉林大学计算机考研复试机试真题 2025年吉林大学计算机考研复试上机真题 历年吉林大学计算机考研复试上机真题 历年吉林大学计算机考研复试机试真题 更多学校完整题目开源地址:https://gitcode.com/u014339447/pgcode 百度一下pgcode 即可查看&#xff0…

作者头像 李华
网站建设 2026/5/1 16:18:29

2025年暨南大学计算机考研复试机试真题(解题思路 + AC 代码)

2025年暨南大学计算机考研复试机试真题 2025年暨南大学计算机考研复试上机真题 历年暨南大学计算机考研复试上机真题 历年暨南大学计算机考研复试机试真题 更多学校完整题目开源地址:https://gitcode.com/u014339447/pgcode 百度一下pgcode 即可查看&#xff0…

作者头像 李华