news 2026/4/27 14:02:34

干掉同传?谷歌把AI同传放入所有耳机,顺手发了个颠覆性的AI浏览器

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
干掉同传?谷歌把AI同传放入所有耳机,顺手发了个颠覆性的AI浏览器

谷歌宣布,Google Translate 正在推出一项基于 Gemini 模型的全新 Beta 功能,允许用户通过耳机收听实时翻译。

Google 正在加速将其 Gemini 模型的能力融入核心产品线。

Google 周五宣布,正式向 Google 翻译引入其 Gemini 模型的各项能力。此次更新不仅带来了能够通过耳机进行的实时语音翻译 Beta 版体验,还大幅提升了文本翻译的语境理解能力,并扩展了应用内的语言学习工具。

Google 还通过 Google Labs 推出了一款名为「Disco」的实验性浏览器,试图用 AI 重构网页浏览体验。

把所有耳机变成「同声传译」设备

谷歌宣布,Google Translate 正在推出一项基于 Gemini 模型的全新 Beta 功能,允许用户通过耳机收听实时翻译。

与以往仅限于 Pixel Buds 的独占功能不同,此次更新支持任何品牌的耳机。该功能旨在将佩戴耳机的用户设备变成一个实时的单向翻译工具。根据谷歌产品管理副总裁 Rose Yao 的介绍,这项功能不仅能翻译语言,还能保留说话者的语调、重音和节奏,从而让对话更加自然,也更容易区分不同的发言者。

无论是跨语言对话、在国外听讲座,还是观看外语影视作品,用户只需打开 App 点击「Live Translate」即可使用。

目前该 Beta 版本已在 Android 端的 Translate 应用中上线,支持超过 70 种语言。谷歌计划在 2026 年将该功能扩展至 iOS 平台及更多国家。

更懂「弦外之音」

除了语音功能,Google 还利用 Gemini 模型的高级能力重构了文本翻译体验。新的翻译引擎在处理俚语、成语或具有本地特色的表达时,能够更智能地解析上下文,而非进行生硬的逐字翻译。

Google 举例称,在翻译英语成语「stealing my thunder」(抢风头/抢功劳)时,Gemini 不会给出字面意思的翻译,而是根据语境捕捉其真实含义,生成更符合目标语言习惯的译文。

这一改进即日起在美国和印度推出,支持英语与近 20 种语言(包括中文、日语、德语、阿拉伯语和西班牙语)之间的互译。用户可通过 Android、iOS 应用及网页版体验。

另外,Google 还在进一步完善其翻译应用中的语言学习功能,使其更接近专业的语言学习软件(如 Duolingo)。

语言学习工具现已扩展至近 20 个新国家/地区。英语使用者现在可以练习德语和葡萄牙语。孟加拉语、简体中文、荷兰语、德语、印地语、意大利语、罗马尼亚语和瑞典语使用者可以练习英语。

新增了基于口语练习的改进型反馈机制,以及「连胜打卡(Streak)」功能,记录用户连续学习的天数,以激励用户保持学习习惯。

用 AI 生成即时「网页应用」

在翻译工具之外,谷歌 Chrome 团队在 Google Labs 推出了一个更具前瞻性的实验项目:Disco(意为 Discovery)。这是一款全新的浏览器,其核心概念是「GenTabs」(生成式标签页)。

什么是 GenTabs?不同于传统浏览器单纯展示网页,或目前主流 AI 浏览器仅提供文本摘要,Disco 试图通过 Gemini 3 模型将信息转化为「微型应用」。

当用户输入需求(例如「计划一次日本旅行」)时,Disco 不仅会打开相关的网页标签,还会根据这些网页的内容和用户的对话,自动生成一个包含地图、行程表和链接的交互式界面。

这是一个「浏览器中的浏览器」。GenTabs 是动态的,如果用户打开了新的相关网页,GenTabs 会自动抓取新信息并更新到交互界面中。

Chrome 团队负责人 Parisa Tabriz 强调,Disco 并非旨在取代 Chrome,也不是要「吃掉」网页流量。相反,它鼓励用户打开真实网页作为 AI 的「锚点」,形成用户浏览网页与 AI 整理信息之间的良性循环。

目前,Disco 作为一个实验性项目,已开放 macOS 版本的等待名单。

如果你想更深入地学习大模型,以下是一些非常有价值的学习资源,这些资源将帮助你从不同角度学习大模型,提升你的实践能力。

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!​

因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获取

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示

因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获取

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获取

四、AI大模型商业化落地方案

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/23 9:02:56

面试复习题--Android和iOS设备上的绘制原理

深入理解Flutter 在 Android 和 iOS 设备上的绘制底层原理,核心是搞清楚 Flutter 如何跨这两个系统实现统一的 UI 渲染,以及它在两端分别与系统底层渲染框架的交互逻辑 ——Flutter 的核心特点是「自绘引擎(Skia)接管全渲染流程」,避开了 Android/iOS 的原生 UI 组件系统,…

作者头像 李华
网站建设 2026/4/26 22:05:42

Kafka日志迁移与查询机制解析

Kafka Broker 端用于管理日志目录(Log Directory)迁移和查询 的核心逻辑,分别对应两个关键 API: alterReplicaLogDirs(...):实现 KIP-113 中的 ALTER_REPLICA_LOG_DIRS 请求,用于将某个分区的日志从一个磁盘…

作者头像 李华
网站建设 2026/4/23 11:29:12

Kafka核心揭秘:ReplicaManager如何保障高可用

ReplicaManager 是 Apache Kafka Broker 中最核心的副本管理组件,负责协调分区副本(Replica)的生命周期、数据复制、一致性保障、故障恢复以及与集群控制器(Controller)的交互。它是 Kafka 实现 高可用、持久化、Exact…

作者头像 李华
网站建设 2026/4/18 0:06:41

5类实时交通检测数据集实战指南(附代码)

5类实时交通自建目标检测数据集 该数据集包括car,light,moto,person,signs等5个类别 总计图片1498张,训练集998张图像,验证集和测试集分别是250张图片 数据集已经划分为训练集/验证集/测试集 数据集支持YOL…

作者头像 李华
网站建设 2026/4/26 21:09:56

批判性思维训练:5个练习提升你的缺陷发现能力

批判性思维在软件测试中的核心价值 在快速迭代的软件开发周期中,测试人员面临的不仅仅是功能验证的挑战,更是对系统深层次风险的前瞻性洞察。批判性思维使测试工程师能够超越表面需求,通过系统性质疑、多角度分析来暴露潜在缺陷。这种能力直…

作者头像 李华
网站建设 2026/4/17 2:00:02

【生存分析进阶指南】:从零构建高精度临床预测模型的7个关键步骤

第一章:临床数据的 R 语言 Cox 回归优化概述在临床研究中,生存分析是评估患者预后和治疗效果的核心方法之一。Cox 比例风险回归模型因其能够处理删失数据并同时评估多个协变量的影响而被广泛使用。借助 R 语言强大的统计计算与可视化能力,研究…

作者头像 李华