HarmonyOS开发者限时福利来啦!最高10w+现金激励等你拿~ 了解详情
写点什么

亚马逊发布新的 Alexa 跨技能会话模型

作者:Anthony Alford

  • 2019-06-22
  • 本文字数:1211 字

    阅读完需:约 4 分钟

亚马逊发布新的Alexa跨技能会话模型

拉斯维加斯举行的亚马逊re:MARS AI大会上,Alexa 副总裁 Rohit Prasad 演示了Alexa智能助手的一种新对话模型。在这个新模型中,Alexa 可以无缝地在技能之间进行转换,并记住对话的上下文,从而消除歧义。


Alexa 用户对于技能的概念无疑很熟悉,这是 Alexa 功能的构建块。用户通过选择一个技能来让 Alexa“打开”或“启动”该技能。一旦某个技能激活,Alexa 的会话功能就会受到该技能需求的限制。与许多其他聊天机器人一样,Alexa 使用意图分类和槽填充模型。意图/槽模型的一个例子是电影票购买技能。在该技能中,意图 PurchaseTickets 拥有槽 theaterCity、theaterName、movieTitle*、*showTime 和 numberOfTickets。


分析用户说出的每个短语,以确定用户希望 Alexa 采取的操作(意图)以及具体的操作参数(槽)。一旦确定了意图,接下来与 Alexa 的大部分对话都是为了填充意图的任何空白槽。这个模型的一个缺点是 Alexa 不记得对话的任何细节。特别是,已经被标识为槽值的项不能供用户稍后可能选择的其他技能使用。例如,如果用户购买了电影票,然后想要使用 Alexa 来安排拼车去影院,目前还不能简单地说,“我需要一辆车去那里。”相反,用户必须显式地打开拼车技能,并填写该技能的槽 destinationAddress(目的地地址)和 arrivalTime(到达时间)。该技能无法把前一技能的槽 theaterName(剧院名称)和 showTime(放映时间)作为上下文推断出这些。


re:MARS主题演讲中,Prasad 播放了一个视频,演示一段与 Alexa 之间的对话。在这个视频中,用户与 Alexa 进行了长时间的对话,购买电影票,预订餐馆,安排拼车,所有这些全都使用了一个新的对话模型,在这个模型中,Alexa 可以保持上下文信息,在技能之间进行切换,并使用记住的上下文填充槽。Alexa 团队表示,“每一轮对话,系统都会生成一个向量……这代表了对话的上下文和语义内容。”


这个演示代表了许多研究论文的成果,其内部运作机制去年在一篇博文会议论文中提到过。系统创建槽嵌入,将语义相似的槽在嵌入空间里聚合在一起。这使得 Alexa 能够识别出什么时候可以用一个技能的槽来填充另一个技能的槽。还有一个LSTM神经网络,它决定是否将槽值“结转”到下一步的对话中。


虽然这项技术还没有正式向 Alexa 开发者社区发布,但已经有一个名为Alexa Conversations的开发者预览程序。开发人员可以申请“对即将到来的跨主题功能的早期访问”。一名Alexa冠军Mark Tucker 在推特上说:


Alexa Conversations 预览版承诺了更少的编码和更多的对话体验。每个开发人员都应该开始期待。亚马逊主要关注对话管理,而不是状态管理和意图上下文。这会是解决方案吗?


然而,并不是每个人都对新对话模型表现得很激动。Hacker News的一位评论者指出:


我希望它能走向一个更明确的“项列表->遗传->新的项列表”方法。当你试图与它进行正常对话时,Alexa 最容易暴露缺点。


查看英文原文Amazon Announces New Cross-Skill Conversational Model for Alexa


2019-06-22 08:004930
用户头像

发布了 731 篇内容, 共 467.0 次阅读, 收获喜欢 1544 次。

关注

评论

发布
暂无评论
发现更多内容

shardingsphere配置读写分离集群(1主2从结构)

zhengzai7

读写分离 ShadingSphere

Ubuntu 20.04系统编译安装Apache教程。

百度搜索:蓝易云

Apache 云计算 Linux ubuntu 运维

快照隔离级别原理 | StoneDB 技术分享 #1

StoneDB

MySQL 数据库 HTAP StoneDB

一文读懂Hhybrid App开发模式

没有用户名丶

Linux搭建我的世界MC服务器 - MCSM面板教程。

百度搜索:蓝易云

云计算 Linux 运维 Minecraft MCSM

Mediabox:年度最佳音视频开发工具

阿里云视频云

云计算 阿里云 音视频 视频云

如何处理需求池?管理需求池的内容

Bonaparte

产品 产品设计 产品思维 产品需求

解决直播间源码音视频不同步问题的有效方式——山东布谷科技创作

山东布谷科技

软件开发 实时音视频 源码搭建 直播源码 直播间

《Programming Abstractions In C》阅读笔记p69-p71

codists

Ubuntu 20.04系统编译安装Nginx1.22教程。

百度搜索:蓝易云

nginx 云计算 Linux ubuntu 运维

GreatSQL通过错误日志信息判断数据库实例是如何关闭的

GreatSQL

数据库 greatsql

代码随想录 Day21 - 二叉树(七)

jjn0703

B站&华为云 | 融合虚实宇宙,开启云上视听的黄金时代

白洞计划

AI B站

时序数据库 TDengine 与金山云两大产品完成兼容互认证

爱倒腾的程序员

数据库

实施Scrum敏捷开发必选的敏捷工具

顿顿顿

Scrum 敏捷开发 项目管理工具 Scrum Master 敏捷开发管理工具

LCD拼接屏、LED显示屏和OLED显示屏的主要区别

Dylan

LCD1602液晶显示屏 LED显示屏 led显示屏厂家 OLED

Nautlius Chain主网正式上线,模块Layer3时代正式开启

大瞿科技

C语言如何实现DES加密与解密

梦笔生花

大模型基础学习

天天向上

从零开始实现Go搜索引擎(一)

geange

搜索引擎 lucene #数据库 FST #go

JavaScript 的优雅编程技巧:Singleton Pattern

Immerse

JavaScript 设计模式 单例模式

【活动】30 秒上云体验,一键体验 RocketMQ 六大生产环境

阿里巴巴云原生

阿里云 云原生 Apache RocketMQ

Linux之Cnetos7.6安装Vue.js教程。

百度搜索:蓝易云

vue.js 云计算 Linux centos 运维

Java 踩坑 2|Feign Client 访问到 Consul 脏节点/故障节点

itschenxiang

Java Consul springboot

人工智能革命|是疯狂炒作还是大势所趋?

SEAL安全

B2C #人工智能 ChatGPT 企业号 7 月 PK 榜 趋势解读

2023-07-18:给你一个正整数数组 nums,请你移除 最短 子数组(可以为 空), 使得剩余元素的 和 能被 p 整除。 不允许 将整个数组都移除。 请你返回你需要移除的最短子数组的长度,如果

福大大架构师每日一题

福大大架构师每日一题

分布式系统中的数据复制

越长大越悲伤

分布式 数据复制

演讲实录:以 AI 变革组织运营与管理

Kyligence

数据分析 数智化 企业级OLAP

数字化转型与架构-规划篇|承上启下的能力热力图

数字随行

数字化转型

云拨测全面升级丨单次拨测低至 0.001 元

阿里巴巴云原生

阿里云 云原生 可观测

机器学习之PyTorch和Scikit-Learn第3章 使用Scikit-Learn的机器学习分类器之旅Part 2

Alan

人工智能 机器学习 PyTorch scikit-learn

亚马逊发布新的Alexa跨技能会话模型_AI&大模型_InfoQ精选文章