写点什么

语音技术在小米的实践应用之路

  • 2019-09-19
  • 本文字数:789 字

    阅读完需:约 3 分钟

语音技术在小米的实践应用之路

AICon北京2018大会上,王育军讲师做了《语音技术在小米的实践应用之路》主题演讲,主要内容如下。


演讲简介


语音技术,包括语音识别与合成等,经历了几十年的发展,恰逢人工智能时代的来临,对其应用场景做了重新定义。但是我们面临的问题从来没有变过:数据失配和模型假设。在本次演讲中,我将分享在小米,我们如何解决失配的问题,如何自动标注数据,以及我们如何在小米特有用户场景下进行产品和算法创新。我们在语音合成中也做了创新的尝试,利用语音识别辅助,端对端的技术取代传统文本处理,节省了繁杂的标注工作。


演讲提纲:


  1. 小米语音是如何成长的?

  2. 电视->手机->音箱->儿童->车载->笔记本

  3. 语音技术中的自然语言应用

  4. 语音识别中采用了深度学习语言模型后,识别率绝对增长超过 1%。尺寸小可做嵌入式使用。在语音合成中的文本分析,我们基于端到端网络结构,业内首次提出将端到端网络应用于合成前端,通过一个编解码网络,完成传统复杂前端中的多个模块的功能。通过多目标联合地并行训练,取得了媲美传统前端的性能。

  5. 永远要突破算法的天花板

  6. 为什么语音算法可以在小米有所突破,发表顶级国际会议论文?不做空中楼阁。有实际产品需求,有用户场景,有强大的内测用户。

  7. 语音应用的挑战

  8. 小米过去 20 个月做语音的经验


听众收益:


  1. 语音技术在智能家居环境中如何发挥作用

  2. 了解如何快速将语音算法落地到产品


讲师介绍


王育军


小米 语音技术负责人


2000 年毕业于清华大学自动化系,随后赴英国伯明翰大学电子系学习人机交互。2002 至 2004 年就职于 NEC 电子,从事嵌入式语音识别与语音合成。随后加入中软国际从事声学模型训练技术。2007 年到 2012 年在比利时鲁汶大学电子系从事抗噪语音识别。回国后加入百度语音技术部。2015 年就职于乐视,负责语音识别与自然语言理解技术。2017 年加入小米,负责语音识别与语音合成技术。












完整演讲 PPT 下载链接


https://aicon.infoq.cn/2018/beijing/#schedule


2019-09-19 14:171244

评论

发布
暂无评论
发现更多内容

TiDB排行再升5位;盘点平凯数据库的发明专利(2024上半年公布)

TiDB 社区干货传送门

数据库架构选型

这款产品连续三年被选为“未来你想使用的数据库”第一名

TiDB 社区干货传送门

数据库架构选型 数据库前沿趋势

哪些工作管理系统适合团队协作?9款工具推荐

爱吃小舅的鱼

工作管理系统

哪些工作计划管理软件适合团队协作?10款详解

爱吃小舅的鱼

工作计划管理软件

AI大模型技术前沿:人工智能大模型应用工程师如何塑造行业未来?

雅菲奥朗

人工智能 大模型 人工智能工程师 人工智能工程师培训 人工智能大模型应用工程师

从0到1:培训机构排课小程序开发笔记一

CC同学

安卓AI虚拟女友项目开发之智能语音-语音唤醒应用功能开发

陆通

全面图解Docker架构设计:掌握Docker全链路思维/实战/优化(小白到大师篇[1])

肖哥弹架构

Docker DevOps 效能

你不知道的Requests进阶技巧:用Retry实现完美重试

LLLibra146

python 爬虫 requests urllib retry

哪款多任务管理系统适合你?2024年10大选择

爱吃小舅的鱼

多任务管理系统

全面图解Docker架构设计:掌握Docker全链路思维/实战/优化(小白到大师篇[2])

肖哥弹架构

Docker DevOps

如何选择工作日程管理系统?9款工具指南

爱吃小舅的鱼

工作日程管理工具

如何挑选合适的工作流程软件?8款推荐

爱吃小舅的鱼

工作流程软件

工作目标管理软件选型指南:9款推荐

爱吃小舅的鱼

工作目标管理软件

安卓AI数字虚拟人项目实战之Android开发环境搭建

陆通

征程6 NV12 理论与代码详解

地平线开发者

自动驾驶; 算法、

FinOps现状分析:行业趋势与未来展望

雅菲奥朗

FinOps 云成本管理 FinOps 认证 云财务管理

FinOps三人行:云计算时代的FinOps 反模式和SRE(文字+视频版)

雅菲奥朗

云计算 SRE FinOps FinOps 认证 FinOps 培训

征程6 工具链常用工具和API 整理

地平线开发者

自动驾驶 算法

三节点TiDB 集群内存控制文档

TiDB 社区干货传送门

2024年9月文章一览

codists

编程人

语音技术在小米的实践应用之路_AICon_王育军_InfoQ精选文章