在AICon北京2017大会上,【王刚】讲师做了《小爱:语音识别和 NLP 在语音交互中的实践》主题演讲,主要内容如下。
演讲简介:
本次讲演将讲述小爱从 0 到 1 的研发经历,介绍在小爱开发过程中所遇到的一些典型问题,以及在解决问题过程中的一些思考过程和相应的解决方法。使用语音的人机交互面临着一系列的技术挑战,而小爱只是走了万里长征的第一步,听众将从本次讲演中对语音交互系统的特点有一个全面的了解,对在语音交互中出现的新问题和新挑战有更深刻的认识,了解小爱在解决问题过程中的思路和方法。
内容概要
背景
1.1. 发布人工智能电视,有屏幕设备的用户特点(17-03)
1.2. 发布水滴平台(17-05)
1.3. 发布小爱音箱,无屏幕设备的用户特点(17-07)
1.4. 发布手机上的新语音助手,触摸屏幕的用户特点(17-11)
语音交互和搜索的重要区别
2.1. 只有一次机会的交互方式
2.2. 用户行为反馈
2.3. 多轮对话
2.4. 自然语言的表达:随意、模糊
语音识别
3.1. 不同引擎在不同场景表现的差异
3.2. 每一家都不同的优势:方言、响应速度
3.3. 多家融合策略
垂域建设
4.1. 电视垂域
4.1.1. 背景:query 的表达
4.1.2. Slot 种类介绍
4.1.3. Word Lattice 方法
4.1.4. 案例分析
4.2. 音乐垂域
4.2.1. 背景:query
4.2.2. 各种歌曲
4.2.3. 基于搜索的方法
4.2.4. 案例分析
4.3. 其他典型垂域
4.3.1. 计算器
4.3.2. 翻译
4.3.3. 控制类
4.3.4. 知识问答
4.3.5. 闲聊
中控策略架构及实战案例
多轮交互
6.1. 失败概率的累计
6.2. 实战案例:智能家居控制
用户行为反馈
7.1. 纯语音交互的隐反馈
7.2. 完听率
7.3. 重复 query
总结
讲师介绍:
王刚
小米 小爱总监
王刚,博士毕业于香港科技大学计算机科学系,现任小米小爱语音交互系统的负责人,为小米各类智能设备提供语音交互的技术和产品。目前小爱已覆盖了小米 AI 音箱、小米人工智能电视、小米手机以及小米生态链中多种类型智能硬件。在加入小米之前,王刚博士在微软亚洲研究院和腾讯工作,长期从事机器学习和搜索引擎方向的研发工作。
完整演讲 PPT 下载链接:
https://aicon.infoq.cn/2017/beijing/schedule
评论