写点什么

语音技术在小米的实践应用之路

  • 2019-09-19
  • 本文字数:789 字

    阅读完需:约 3 分钟

语音技术在小米的实践应用之路

AICon北京2018大会上,王育军讲师做了《语音技术在小米的实践应用之路》主题演讲,主要内容如下。


演讲简介


语音技术,包括语音识别与合成等,经历了几十年的发展,恰逢人工智能时代的来临,对其应用场景做了重新定义。但是我们面临的问题从来没有变过:数据失配和模型假设。在本次演讲中,我将分享在小米,我们如何解决失配的问题,如何自动标注数据,以及我们如何在小米特有用户场景下进行产品和算法创新。我们在语音合成中也做了创新的尝试,利用语音识别辅助,端对端的技术取代传统文本处理,节省了繁杂的标注工作。


演讲提纲:


  1. 小米语音是如何成长的?

  2. 电视->手机->音箱->儿童->车载->笔记本

  3. 语音技术中的自然语言应用

  4. 语音识别中采用了深度学习语言模型后,识别率绝对增长超过 1%。尺寸小可做嵌入式使用。在语音合成中的文本分析,我们基于端到端网络结构,业内首次提出将端到端网络应用于合成前端,通过一个编解码网络,完成传统复杂前端中的多个模块的功能。通过多目标联合地并行训练,取得了媲美传统前端的性能。

  5. 永远要突破算法的天花板

  6. 为什么语音算法可以在小米有所突破,发表顶级国际会议论文?不做空中楼阁。有实际产品需求,有用户场景,有强大的内测用户。

  7. 语音应用的挑战

  8. 小米过去 20 个月做语音的经验


听众收益:


  1. 语音技术在智能家居环境中如何发挥作用

  2. 了解如何快速将语音算法落地到产品


讲师介绍


王育军


小米 语音技术负责人


2000 年毕业于清华大学自动化系,随后赴英国伯明翰大学电子系学习人机交互。2002 至 2004 年就职于 NEC 电子,从事嵌入式语音识别与语音合成。随后加入中软国际从事声学模型训练技术。2007 年到 2012 年在比利时鲁汶大学电子系从事抗噪语音识别。回国后加入百度语音技术部。2015 年就职于乐视,负责语音识别与自然语言理解技术。2017 年加入小米,负责语音识别与语音合成技术。












完整演讲 PPT 下载链接


https://aicon.infoq.cn/2018/beijing/#schedule


2019-09-19 14:171275

评论

发布
暂无评论
发现更多内容

低代码平台:顺应时代的选择

树上有只程序猿

低代码 应用开发 JNPF

如何从项目思维成功转型为产品思维?实用步骤全解析

爱吃小舅的鱼

项目管理 产品经理

深拷贝和浅拷贝介绍

芯动大师

c++

Python变量:创建、类型、命名规则和作用域详解

小万哥

Python 程序员 软件 后端 开发

glTF模型骨骼动画

3D建模设计

GLTF 骨骼动画

前端工程化小记

高端章鱼哥

前端 注释规范

如何快速从ETL到ELT?火山引擎ByteHouse做了这三件事

字节跳动数据平台

数据仓库 云原生 ETL ELT 企业号9月PK榜

通过 Helm Chart 部署 Easysearch

极限实验室

Helm easysearch

搞不懂设计模式还想阅读源码?你在做梦吗?

程序员万金游

学习 设计模式 #java 程序员 java `后端

ATRS Week 5

Geek_c25301

【介绍篇】Supabase起源和演进过程

张文平

postgres Supabase firebase

FTP这么“好用”和“便宜”,为什么企业还要替换掉?

镭速

FTP传输替代方案 ftp传输

WorkPlus Meet私有化部署视频会议,打造更安全的沟通体验

BeeWorks

单点登录授权认证必知必会

青柚1943

OAuth2 SSO 单点登录 OIDC Ids4

征服数据宇宙,新华三存储护卫队早有准备?

白洞计划

存储

【直播预约中】 腾讯大数据 x StarRocks|构建新一代实时湖仓

StarRocks

数据库 大数据 数据湖

Databend 开源周报第 111 期

Databend

项目质量管理的重要性

爱吃小舅的鱼

质量管理 项目经理

从内核世界透视 mmap 内存映射的本质(原理篇)

bin的技术小屋

操作系统 Linux Kenel 内核 mmap内存映射 linux\

VR虚拟现实技术在2023年的10个应用

3DCAT实时渲染

实时渲染云 VR虚拟现实

.NET常见的4种加密算法

青柚1943

中国“好房子”亮相东博会,东方式生活凭什么走向世界?

脑极体

全屋智能

什么是顶点颜色

3D建模设计

GLTF

福布斯:2024 年 10 大 AI 趋势

豆哥

人工智能 福布斯 AI趋势 2024

WorkPlus打造企业内网专属通讯软件,构建高效沟通新时代

BeeWorks

语音技术在小米的实践应用之路_AICon_王育军_InfoQ精选文章