写点什么

小爱:语音识别和 NLP 在语音交互中的实践

  • 2019-09-26
  • 本文字数:838 字

    阅读完需:约 3 分钟

小爱:语音识别和NLP在语音交互中的实践

AICon北京2017大会上,【王刚】讲师做了《小爱:语音识别和 NLP 在语音交互中的实践》主题演讲,主要内容如下。


演讲简介


本次讲演将讲述小爱从 0 到 1 的研发经历,介绍在小爱开发过程中所遇到的一些典型问题,以及在解决问题过程中的一些思考过程和相应的解决方法。使用语音的人机交互面临着一系列的技术挑战,而小爱只是走了万里长征的第一步,听众将从本次讲演中对语音交互系统的特点有一个全面的了解,对在语音交互中出现的新问题和新挑战有更深刻的认识,了解小爱在解决问题过程中的思路和方法。

内容概要

  1. 背景


1.1. 发布人工智能电视,有屏幕设备的用户特点(17-03)


1.2. 发布水滴平台(17-05)


1.3. 发布小爱音箱,无屏幕设备的用户特点(17-07)


1.4. 发布手机上的新语音助手,触摸屏幕的用户特点(17-11)


  1. 语音交互和搜索的重要区别


2.1. 只有一次机会的交互方式


2.2. 用户行为反馈


2.3. 多轮对话


2.4. 自然语言的表达:随意、模糊


  1. 语音识别


3.1. 不同引擎在不同场景表现的差异


3.2. 每一家都不同的优势:方言、响应速度


3.3. 多家融合策略


  1. 垂域建设


4.1. 电视垂域


4.1.1. 背景:query 的表达


4.1.2. Slot 种类介绍


4.1.3. Word Lattice 方法


4.1.4. 案例分析


4.2. 音乐垂域


4.2.1. 背景:query


4.2.2. 各种歌曲


4.2.3. 基于搜索的方法


4.2.4. 案例分析


4.3. 其他典型垂域


4.3.1. 计算器


4.3.2. 翻译


4.3.3. 控制类


4.3.4. 知识问答


4.3.5. 闲聊


  1. 中控策略架构及实战案例

  2. 多轮交互


6.1. 失败概率的累计


6.2. 实战案例:智能家居控制


  1. 用户行为反馈


7.1. 纯语音交互的隐反馈


7.2. 完听率


7.3. 重复 query


  1. 总结


讲师介绍


王刚


小米 小爱总监


王刚,博士毕业于香港科技大学计算机科学系,现任小米小爱语音交互系统的负责人,为小米各类智能设备提供语音交互的技术和产品。目前小爱已覆盖了小米 AI 音箱、小米人工智能电视、小米手机以及小米生态链中多种类型智能硬件。在加入小米之前,王刚博士在微软亚洲研究院和腾讯工作,长期从事机器学习和搜索引擎方向的研发工作。












完整演讲 PPT 下载链接


https://aicon.infoq.cn/2017/beijing/schedule


2019-09-26 13:522010

评论

发布
暂无评论
发现更多内容

ChatGPT能做什么?(内附体验攻略)

FinFish

AI工程化 ChatGPT

有趣,在WSL2上运行VSCode

吴脑的键客

vscode WSL2

ChatGPT背后:从0到1,OpenAI的创立之路

OneFlow

人工智能 深度学习 openai ChatGPT

Apache Flink 实时计算在美的多业务场景下的应用与实践

Apache Flink

大数据 flink 实时计算

实时数仓Hologres新一代弹性计算组实例技术揭秘

阿里云大数据AI技术

大数据 实时数仓 弹性计算 企业号 2 月 PK 榜

流批一体架构在快手的实践和思考

Apache Flink

大数据 flink 实时计算

react源码中的协调与调度

flyzz177

React

react源码中的hooks

flyzz177

React

大咖齐聚!OpenHarmony技术峰会豪华嘉宾阵容揭晓

OpenHarmony开发者

OpenHarmony

ChatGPT搜索与推荐之间的匹配问题

图灵社区

搜索引擎 深度学习‘’ ChatGPT

比较简单的ChatGPT体验攻略!

没有用户名丶

ChatGPT会对开发领域有何影响?

FinFish

AI AIGC ChatGPT

ChatGPT搜索与推荐之间的匹配问题

图灵教育

搜索引擎 深度学习‘’ ChatGPT

react源码中的fiber架构

flyzz177

React

GitHub典藏版!腾讯T14级牛人亲码的分布式数据库实践,再次爆火

做梦都在改BUG

Java 数据库 分布式

预告|因“AI”而“深” 第四届OpenI/O 启智开发者大会高校开源专场25日开启!

OpenI启智社区

人工智能 开源 OpenI启智社区

Teradata 离场,企业数据分析平台如何应对变革?

Kyligence

数据分析 指标中台

时代背景下的 ChatGPT,到底能帮助开发者做什么呢?

泰罗凹凸曼

JavaScript ChatGPT

实践篇(三):如何有效评审软件架构图?

京东科技开发者

架构 后端 软件架构 企业号 2 月 PK 榜 架构评审

预告|第四届OpenI/O启智开发者大会NLP大模型论坛强势来袭!

OpenI启智社区

人工智能 NLP 大模型 开发者大会 OpenI启智社区 ChatGPT

前端leetcde算法面试套路之双指针

js2030code

JavaScript LeetCode

大咖说·阿里云云效|效能治标不治本的三个陷阱的解析

大咖说

ThreadPoolExecutor源码细节探索

做梦都在改BUG

Java 多线程 线程池 ThreadPoolExecutor

RabbitMQ的高可用和高可靠

做梦都在改BUG

Java 高可用 RabbitMQ 消息中间件

会议总结 | 首次 Flink Batch 社区开发者会议

Apache Flink

大数据 flink 实时计算

直播预告 | 嵌入式BI如何将数据分析真正融入业务流程

葡萄城技术团队

通过 Istio、eBPF 和 RSocket Broker 深入探索服务网格

Kian.Lee

istio cncf ebpf sidecar-free rsocket

保持热爱,奔赴山海:Apache Calcite PMC 之路

字节跳动开源

flink 开源 技术 社区 Apache Calcite

用javascript分类刷leetcode22.字典树(图文视频讲解)

js2030code

JavaScript LeetCode

前端leetcde算法面试套路之二叉树

js2030code

JavaScript LeetCode

小爱:语音识别和NLP在语音交互中的实践_AICon_王刚_InfoQ精选文章