阿里达摩院发布新一代自研语音AI芯片技术,计算效率提升百倍以上

2019 年 8 月 22 日

阿里达摩院发布新一代自研语音AI芯片技术,计算效率提升百倍以上


北京时间8月21日,在美国旧金山举行的芯片行业顶级学术会议HOTCHIPS上,阿里巴巴达摩院发布了新一代AI语音FPGA芯片技术——Ouroboros,该技术能将语音生成算法的计算效率提高百倍以上。这是业界首款专用于语音合成算法的 AI FPGA芯片结构设计。


作为芯片领域的顶级峰会之一,HOTCHIPS 与其他顶级半导体会议的显著区别之一就是更侧重于商业应用,而非仅仅是学术项目,此次阿里发布的 Ouroboros 就是面向语音合成领域商业应用的 FPGA 加速计算方案。



阿里达摩院科学家在 HOTCHIPS 大会现场发布自研语音芯片技术


针对 ASIC 实现的性能仿真预估表明, Ouroboros 的设计可以实时运行 WaveNet 等业界先进的文字转语音(TTS,Text-to-Speech)算法 ,实现实时语音合成。


编者注:DeepMind于2016年发布WaveNet算法,可以生成类似真人发音的语音,效果比以前的模型都好,并且一个模型可以生成不同的声音;为了在语音生成中处理长跨度时间依赖问题,开发者设计了一个新的扩大连接的卷积框架,该卷积框架有非常大的感受野。


算法很好但难以进行实时计算是语音芯片的行业难题。Ouroboros 的突破在于:使用了端上定制硬件加速技术,替代云端服务器,有效避免了对网络连接和云端服务的强依赖性,解决了这一问题。



Ouroboros 原理图(来源:阿里达摩院)


以计算量最大的 AI 语音合成算法 WaveNet 为例,为了生成 1 秒的语音,CPU 和 GPU 需要消耗 50 秒的计算时间,完全无法满足语音合成对实时性的要求。但 Ouroboros 在 FPGA 环境下只需要 0.3 秒,大大提升计算效率,同时将整体服务成本降低 10 倍以上。



WaveNet 实践结果(来源:阿里达摩院)


为了达到这样的效果,达摩院的研发人员从硬件到软件进行了诸多协同设计与改良:



(来源:阿里达摩院)


  • Ouroboros的主要技术在硬件层面,达摩院的研发人员采用了片上环路结构支持迭代算法的思想,通过缓存和控制器直接在片上实现语音的循环生成,而不需要再从片外反复发送计算指令。这样的设计避免了大量进行计算核启动和数据搬运的开销,是针对自回归形式的语音合成模型所特有的结构,因此研发人员形象地使用衔尾蛇(Ouroboros)为其命名。

  • 在软件层面,研发人员针对硬件结构进行优化算法的计算流程,有效利用缓存队列和稀疏化,在保证计算等效性的前提下进一步提升计算速度。




  • 相比于其他纯粹从算法角度改良的方法,达摩院的软硬件结合方案没有额外的模型训练开销,并且可以同时支持WaveRNN、LPCNet等其他语音合成模型,兼顾高性能与高灵活性。




此次阿里发布的 Ouroboros 技术,同样适用于达摩院于今年 7 月发布的新一代的语音合成算法KAN-TTS,该算法将商用系统里的合成语音与原始语音的相似度提高到 97%以上。据了解,Ouroboros 芯片技术除了语音合成之外,还将支持 AI 语音识别。基于 Ouroboros 研发完整的语音 AI 芯片,有望率先在天猫精灵上落地。


2019 年 8 月 22 日 00:002672
用户头像
陈思 InfoQ编辑

发布了 555 篇内容, 共 189.6 次阅读, 收获喜欢 1064 次。

关注

评论

发布
暂无评论
发现更多内容

idea+spring4+springmvc+mybatis+maven实现简单增删改查CRUD

虚拟世界的懒猫

spring mybatis ssm springmvc java8

Hadoop集群搭建-04安装配置HDFS

虚拟世界的懒猫

hadoop

容器日志采集利器:Filebeat深度剖析与实践

傅轶

Kubernetes 容器 云原生 日志 Filebeat

让你写出来的代码像诗一样优美!《Java开发手册》PDF下载

Kareza

Java 阿里巴巴 Java规范 Java开发手册

centos6搭建NEXUSphp pt私人种子站

虚拟世界的懒猫

centos nexusphp pt bt

利用Translate ToolKit 2.5.0 API构建Flask web app

虚拟世界的懒猫

Python nginx flask uwgsi translate

张小龙 的 22 年和微信的 8 年

池建强

微信 张小龙

万字破解云原生可观测性

谭建

云原生 APM 可观测性 链路追踪 Skywalking

机器学习中常用的处理手段

子夜

学习

思考如何节省时间,节省出时间进行思考

伯薇

思考 时间管理 思考力 工作效率 提升效率

安装VMware16兼容Hyper-v+WSL2+Docker+解决0x80370102报错

虚拟世界的懒猫

Docker vmware vm hyper-v WSL2

配置微软Azure大数据HDInsight云集群

虚拟世界的懒猫

microsoft 大数据 微软 azure hdinsght

Zookeeper选举机制

tunsuy

zookeeper 开源 源码分析 分布式协同

管理信息系统课程基础知识

Sicolas Flamel

Hadoop集群搭建-01前期准备

虚拟世界的懒猫

hadoop hdfs mapreduce zookeeper centos

选赵敏还是选小昭,这可真是个问题 | Decision Tree

张利东

Python 学习 算法 决策树

跬步贴|5分钟搞定缓存击穿问题

架构师跬步营

程序员陪娃漫画系列——喂药

孙苏勇

程序员 生活 程序员人生 陪伴 漫画

消息队列Kafka - Kafka中的选举

Java收录阁

kafka

【终于解决】ubuntu19安装nvidia驱动后屏幕亮度默认最亮不可调节

虚拟世界的懒猫

ubuntu 英伟达

做好仓储控制系统(WCS)的关键

阿喜伯

仓储控制系统 WCS

为什么开源是基础软件的未来

顾钧

开源 基础软件

从“成为作者”到“立即创作”:开启你的“写作极客”生活

岛乾坤

写作

程序员,你最重要的选择是和谁结婚,你最重要的能力是赚钱,钱和女友两手抓

陆陆通通

程序员 赚钱 女朋友 找对象

Hadoop集群搭建-02安装配置Zookeeper

虚拟世界的懒猫

hadoop zookeeper centos7

Hadoop集群搭建-03编译安装hadoop

虚拟世界的懒猫

hadoop centos7

Hadoop集群搭建-05安装配置YARN

虚拟世界的懒猫

hadoop

如何无缝的将Flutter引入现有应用?

稻子

flutter ios android 开源 移动应用

当 Redis 发生高延迟时,到底发生了什么

程序员历小冰

redis Linux 延迟

向 "忙忙碌碌泯然众人" say no

Sicolas Flamel

时间分配 时间管理

你真的理解 Java 的基础数据类型吗

Rayjun

Java

阿里达摩院发布新一代自研语音AI芯片技术,计算效率提升百倍以上-InfoQ