news 2026/1/27 6:53:11

客户交互式教学:提升语音助手理解能力的技术解析

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
客户交互式教学:提升语音助手理解能力的技术解析

今天,某机构设备高级副总裁在新闻发布会上介绍了其组织的最新产品与服务。在其介绍中,某机构副总裁兼语音助手首席科学家阐述了语音助手科学团队的三项新进展,其中之一便是客户交互式教学。

去年,推出了一项自学习功能,使语音助手能够根据用户重新表述请求或打断语音助手回应等线索,自动纠正理解错误。如今,数百万用户正受益于此功能。但如果用户说了些语音助手不知道如何理解的内容呢?为了使用户能直接帮助语音助手学习正确的理解方式,该功能赋予了语音助手与用户进行实时交互式教学会话的能力,使其能够即时学习新概念、将这些概念推广到新情境中,并将其与用户账户关联。

例如,如果用户说:“语音助手,将客厅灯光设置为学习模式”,语音助手现在可能会回应:“我不知道学习模式是什么。你能教我吗?”语音助手会从用户的回答中提取定义,当用户后续提出相同或类似请求时,语音助手便能执行已学习的操作。

与用户在语音助手应用程序中将操作与语音触发器关联(例如当用户说“晚安”时关闭灯光)的语音助手例程不同,交互式教学允许语音助手通过对话询问未知或未解决的概念,以完成原本会失败的任务。交互式教学允许语音助手学习两种不同类型的概念。一种是实体概念:在上面的例子中,“学习模式”是语音助手必须学习的新实体。另一种是声明性概念。通过声明性概念,语音助手学习如何解读伪装成声明的指令,例如“语音助手,这个房间太暗了。”

交互式教学是一个会话式人工智能解决方案,它使用多个深度学习模型的预测来决定在教学会话中的下一个输出。这些模型主要有四项功能:

  1. 理解差距检测:自动识别语音中语音助手不理解的部分。
  2. 概念解释:从与用户的互动中引出并提取概念的定义。
  3. 对话管理:保持关于新概念的对话顺利进行。
  4. 声明性推理:评估语音助手可用的操作(例如控制智能家居设备),找出与声明性指令(例如“这里太暗了”)的最佳匹配项。

语音助手的自然语言理解模型将用户的话语按领域(广泛的功​​能区域,如音乐或天气)和意图(用户希望执行的动作,如播放音乐)进行分类。它们还识别话语中的槽位和槽位值,即意图应操作的具体实体和实体类型。例如,在话语“语音助手,播放 The Weeknd 的‘Blinding Lights’”中,“Blinding Lights”是槽位 Song_Name 的值,“The Weeknd”是槽位 Artist_Name 的值。

当排名靠前的槽位概率较低时,理解差距检测模型会识别出学习新槽位概念(例如“将客厅灯光设置为学习模式”中的“学习模式”)的机会。该模型也经过训练,能够拒绝诸如“把灯光设置成,呃,算了”这样的话语。

一旦用户进入教学会话,概念解释模型会从用户的自由形式语音中引出并提取新概念的解释。例如,用户可以通过说“嗯,你知道,我通常在晚上学习,把灯光调到50%亮度”来回答“你说的‘学习模式’是什么意思?”这个问题。概念解释模型会从该话语中提取短语“50%亮度”,并将其存储为“学习模式”的定义。

对话管理模型检查用户对问题的回答是否在问题范围内。例如,当语音助手问“你说的‘学习模式’是什么意思?”时,用户可能回答“把它调到适合阅读的亮度水平”。该模型会识别出该回答没有提供合适的概念定义。在每次尝试引出定义失败后,对话管理器会降低后续问题的复杂性。例如,如果概念提取模型在一轮提问后未能提取出“学习模式”的定义,对话管理器可能会提出更直接的问题“你能为我提供一个亮度或颜色的值吗?”

最后,声明性推理模型结合机器学习和机器推理,预测与用户声明性话语相对应的动作。在决定存储所学概念以供将来重复使用之前,该模型还有助于验证所选动作在声明性话语的语境中语义上是否合适。

在成功的教学会话之后,先前学到的概念可以在相关情境中重复使用。例如,当用户教会语音助手在客厅中“学习模式”意味着将灯光设置为50%时,语音助手知道在办公室中也应用相同的概念。同样,如果用户教会语音助手通过开灯来回应“这里太暗了”这样的声明性话语,语音助手知道后续的话语“我在这里什么都看不见”应该触发相同的动作。

除了自动推广所教概念外,可教学人工智能功能还将允许用户明确指示语音助手忘记最近学习的或所有已学习的概念。在发布时,客户交互式教学将适用于语音助手智能家居设备,并将随着时间的推移扩展到其他功能。这不仅是语音助手的激动人心的一步,也是人工智能服务由最终用户明确教导的一大步。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/1/25 7:16:53

JSON Hero主题功能完全指南:打造个性化JSON查看体验

JSON Hero主题功能完全指南:打造个性化JSON查看体验 【免费下载链接】jsonhero-web 项目地址: https://gitcode.com/gh_mirrors/jso/jsonhero-web 还在为长时间查看JSON数据而眼睛疲劳烦恼吗?JSON Hero的主题系统正是您需要的解决方案&#xff0…

作者头像 李华
网站建设 2025/12/27 13:12:23

VectorChord完整安装指南:PostgreSQL向量搜索的终极解决方案

VectorChord完整安装指南:PostgreSQL向量搜索的终极解决方案 【免费下载链接】VectorChord Scalable, fast, and disk-friendly vector search in Postgres, the successor of pgvecto.rs. 项目地址: https://gitcode.com/gh_mirrors/ve/VectorChord VectorC…

作者头像 李华
网站建设 2026/1/23 17:11:23

避免踩坑!Open-AutoGLM部署硬件避雷清单,90%新手都忽略的3个关键点

第一章:Open-AutoGLM本地部署硬件要求概述在本地部署 Open-AutoGLM 模型前,需确保系统满足最低硬件配置要求,以保障模型推理与训练任务的稳定运行。由于该模型基于大规模生成式语言架构,对计算资源、内存及存储有较高需求。推荐硬…

作者头像 李华
网站建设 2026/1/25 7:32:14

文章标题党检测:基于TensorFlow的分类模型训练

标题党检测:用 TensorFlow 构建高效文本分类系统 在信息流充斥眼球的今天,你是否曾被这样的标题吸引过? “不看后悔!99%的人都不知道的秘密” “刚刚,某地突发大事!” 点进去却发现内容平平无奇&#xff0c…

作者头像 李华
网站建设 2026/1/20 12:48:52

8个基本门电路图从零实现:搭建与测试完整示例

从零搭建8个基本门电路:手把手教你点亮第一盏逻辑灯 你有没有想过,计算机里那些复杂的运算,其实都源于几个最简单的“开关组合”? 今天我们就来干一件“返璞归真”的事——不用单片机、不写代码、不调库函数,只用几块…

作者头像 李华