语音技术在小米的实践应用之路_AICon_王育军_InfoQ精选文章

语音技术在小米的实践应用之路

在AICon北京2018大会上，王育军讲师做了《语音技术在小米的实践应用之路》主题演讲，主要内容如下。

演讲简介：

语音技术，包括语音识别与合成等，经历了几十年的发展，恰逢人工智能时代的来临，对其应用场景做了重新定义。但是我们面临的问题从来没有变过：数据失配和模型假设。在本次演讲中，我将分享在小米，我们如何解决失配的问题，如何自动标注数据，以及我们如何在小米特有用户场景下进行产品和算法创新。我们在语音合成中也做了创新的尝试，利用语音识别辅助，端对端的技术取代传统文本处理，节省了繁杂的标注工作。

演讲提纲：

小米语音是如何成长的？
电视->手机->音箱->儿童->车载->笔记本
语音技术中的自然语言应用
语音识别中采用了深度学习语言模型后，识别率绝对增长超过 1%。尺寸小可做嵌入式使用。在语音合成中的文本分析，我们基于端到端网络结构，业内首次提出将端到端网络应用于合成前端，通过一个编解码网络，完成传统复杂前端中的多个模块的功能。通过多目标联合地并行训练，取得了媲美传统前端的性能。
永远要突破算法的天花板
为什么语音算法可以在小米有所突破，发表顶级国际会议论文？不做空中楼阁。有实际产品需求，有用户场景，有强大的内测用户。
语音应用的挑战
小米过去 20 个月做语音的经验

听众收益：

语音技术在智能家居环境中如何发挥作用
了解如何快速将语音算法落地到产品

讲师介绍：

王育军

小米语音技术负责人

2000 年毕业于清华大学自动化系，随后赴英国伯明翰大学电子系学习人机交互。2002 至 2004 年就职于 NEC 电子，从事嵌入式语音识别与语音合成。随后加入中软国际从事声学模型训练技术。2007 年到 2012 年在比利时鲁汶大学电子系从事抗噪语音识别。回国后加入百度语音技术部。2015 年就职于乐视，负责语音识别与自然语言理解技术。2017 年加入小米，负责语音识别与语音合成技术。

完整演讲 PPT 下载链接：

https://aicon.infoq.cn/2018/beijing/#schedule

评论

发布

暂无评论

科技“智”造：智慧工厂这样规划，既高效又节能

一只数据鲸鱼

数据可视化工业物联网智慧园区智慧工厂

2021技术展望｜开源十年，WebRTC 的现状与未来

开源 WebRTC 2021年展望 RTE 2021技术

智汇华云 | 看“新基建”如何将机房里的“老家伙”物尽其用

mPaaS 月度小报 | CodeHub#4 在线教育应用的开发实践；香港站正式开服上线

蚂蚁集团移动开发平台 mPaaS

移动开发 mPaaS

如何实现屏幕共享时的多人实时标注？

windows Electron RTC

在多人音视频聊天中插入现场直播

anyRTC开发者

android 大前端音视频 WebRTC RTC

集客业务支撑领域标准化产品套件“火麒麟”的配置化能力提升之路

产品解决方案运营商

知乎转载超30W次！金三Java面经汇总：拼多多（三面）/蚂蚁金服（四面）/字节跳动（二面）

Java架构追梦

Java 面试拼多多面经蚂蚁金服面经字节跳动面经

android适配方案，Kafka是如何实现高性能的？全套教学资料

欢喜学安卓

android 程序员面试移动开发

hashmap遍历，关于网络优化你必须要知道的重点，Android岗

欢喜学安卓

android 程序员面试移动开发

2021 技术展望 | 弱网下的极限实时视频通信

RTC 2021年展望 RTE 2021技术

2021 技术展望 | AV1 在 RTC 应用实践中的现状与展望

RTC 2021年展望 RTE 2021技术

源中瑞区块链BaaS平台--一键部署区块链应用

2021 技术展望 | 实时互动场景下，音频的技术变迁与机遇

音视频 RTC 2021年展望 RTE 2021技术

“区块链+”司法合约，电子认证不造假

电微13828808271

国人开源的运维监控系统——WGCLOUD

开源运维 Grafana Prometheus zabbix

inotifywait+rsync实现目录监听及同步

Docker rsync inotify 目录监听同步

SumSwap与金色财经共为首席创新合作大会在上海拉开帷幕

想快速重构智慧园区5A系统，这份方案推荐给你

华为云开发者联盟

系统智慧园区 HDC.Cloud 2021 端边云协同架构南向系统

EGG NETWORK公链阿凡提以“完全开放式自治”的唯一标准搭建New-DeFi链上生态EFTalk

币圈那点事

事务隔离级别实战学习

事务隔离级别事务 4月日更

Python OpenCV 图片模糊操作 blur 与 medianBlur

梦想橡皮擦

Python OpenCV 4月日更

2021 技术展望 | 2021，5G 将会倒逼传输协议、算法做出更多改进

5G RTC 2021年展望 RTE 2021技术

c 语言思维地基搭建(总概论)

Linux scp 命令

一个大红包

云智一体 AI开发模式打造电力行业的智慧化范本

云计算智能云

2021 技术展望 | 走向未来的实时生成技术

RTC 2021年展望 RTE 2021技术

爱好历史的程序员，不容错过！

不脱发的程序猿

程序员程序人生 4月日更全历史

“区块链新基建”可否发展可信平台？

电微13828808271

区块链+ 区块链新基建

Javascript执行机制-事件循环