2021年12月30日最新消息:Google Assistant Action现在可以连续听特定的单词了
作者:访客发布时间:2023-05-21分类:科技网络浏览:104评论:0
如今,谷歌在Google Assistant上为其合作伙伴开发了新工具,其语音平台每月有90多个国家的5亿人使用30种语言。Actions Builder是一个基于Web的集成开发环境(IDE),提供图形界面显示对话流,支持调试和训练数据整理。连续匹配模式允许谷歌助手通过识别指定的单词和短语来立即响应用户的声音。像Nest Nest Max这样的智能显示器上符合AMP标准的内容可以加快浏览互联网的速度。
谷歌还透露,其AI聊天代理可以通过电话安排约会的Duplex已被用于更新谷歌搜索和谷歌地图中的50多万家公司的名单。早在3月份,CEO桑德尔皮帅就表示,如果可能的话,谷歌会使用Duplex联系餐厅和企业,以准确反映当前情况下的工作时间、工作时长和送货信息。随后,该公司将双工扩展到容量有限的英国、澳大利亚、加拿大和西班牙,最终增加了对西班牙语的支持。
Google Assistant产品管理总监Payam Shodjai在博客中写道:“(Assistant)成长的核心是一种简单的洞察力,即人们需要一种更自然的方式来获得他们需要的东西。”“这就是为什么我们投入大量资金来确保Google Assistant在各种设备和服务之间无缝运行,并提供快速准确的帮助。在过去的几个月里,我们看到人们的需求发生了变化,这反映在Google Assistant的使用方式以及它在帮助应对这些变化方面可以发挥的作用上。”
媒体、连续匹配模式和放大器
借助主存储和连续匹配模式,谷歌旨在刺激谷歌助手上下文相关应用的开发。家庭存储为连接到家庭图形的设备(如无线网络)提供了一个数据库,这使开发人员能够为单个用户保存进度,如拼图游戏中的分数。至于连续匹配模式(将在未来几个月推出),它可以使Assistant识别开发人员定义的特定单词或单词集。
关于“连续匹配模式”的更多信息:在Google Assistant开始监听响应之前,它会宣布麦克风保持启用状态,因此用户不必使用其他提示。根据谷歌发言人的说法,录制时间最长可达180秒——开发者可以根据自己的要求设置时长——但用户可以取消、退出、退出、停止或暂停。也许更重要的是,连续匹配模式尊重帐户级别的隐私设置,不会对语音数据执行任何不同的处理。
在媒体方面,Google Assistant更新后的Media API支持更长格式的会话,让用户可以在设备之间继续播放内容。(例如,您可以从某个时刻开始播放视频、音乐和播客,或者您可以从上一节课停止的地方收听它们。)今年夏天晚些时候,谷歌助手支持的智能显示将获得AMP支持(加速移动页面)的框架,从特定合作伙伴的新闻报道开始,然后扩展到其他Web内容类别。
AMP是一个开源框架,旨在加快移动网页的速度——谷歌断言,它可以通过平衡用户点击结果的可能性与设备和网络的限制,将加载时间缩短到1秒以内。Shodjai认为,它将使用数十亿页面(包括VentureBeat)和数千个Web域,并将通过Web实现全新、更快的智能显示体验。他写道:“我们希望将强大的Web内容与简单而强大的AMP相结合。”
动作生成器和动作SDK
动作生成器的目的是消除开发人员在动作控制台和对话流(谷歌的自然语言理解(NLU)平台)之间切换的需要,以便为谷歌助手构建语音应用程序(谷歌称之为“动作”)。如前所述,它允许用户管理NLU训练数据并提供高级调试工具,并具有本地Actions Console集成,可以在一个地方简化操作的构建、测试、启动和分析。
补充动作生成器是一个更新的动作软件开发工具包,它提供了基于文件的动作表示和使用本地集成开发环境的功能。现在,开发人员可以在本地编写NLU和对话模式,批量导入或导出训练数据以提高对话质量,或者使用命令行界面通过现有的源代码控制和持续集成工具来构建和管理操作。
动作生成器和动作软件开发工具包都受益于新的对话模型和谷歌助手运行时引擎的改进。例如,意图和场景使开发人员能够为特定的对话上下文定义训练数据和行为,而场景则作为描述活动意图、错误处理、基于提示的响应等的基础。场景还将对话流定义与实现逻辑分开,因此它们仍然可以在整个对话中重用,并且转换指示何时将一个对话上下文切换到另一个。
关于运行时引擎,谷歌表示现在可以提供更快的响应速度和更流畅的整体体验。在使用相同数量的训练数据来更好地理解用户方面,它也“更聪明”。“[现在]设计和构建对话变得更加容易,用户将获得更快、更准确的响应。我们非常兴奋,这款产品已经取代Dialogflow,成为Google Assistant上首选的对话操作方式。”Shodjai说。
- 科技网络排行
- 最近发表
- 标签列表
-