在 AICon 北京 2019 大会上,雷鸣讲师做了《阿里 KAN-TTS 技术和落地实践》主题演讲,主要内容如下。
演讲简介:
达摩院语音实验室自研的 KAN-TTS(Knowledge-Aware Neural TTS)深度融合了目前主流的端到端 TTS 技术和传统 TTS 技术,基于不同领域的深层 Knowledge,针对 CPU 部署的框架设计和效率优化,包含 20 多项关键算法改进。相对于传统 TTS 技术而言,基于 KAN-TTS 技术的合成语音可以显著的提高合成语音整体的表现力。以核心技术为基础,阿里为各行各业的企业/组织打造了开箱即用的 TTS 和 TTS 定制能力,目前已经提供覆盖 5 大场景的 41 个高品质的开箱即用声音,还提供低成本快速高品质定制服务,已经为多个合作伙伴定制了 TTS 声音。
内容大纲:
语音合成技术概述
1.1 语音合成技术的发展历史
1.2 语音合成技术的实际需求
KAN-TTS 技术介绍
2.1 KAN-TTS 技术
2.2 基于 KAN-TTS 的定制
KAN-TTS 实践
3.1 开箱即用的 TTS
3.2 TTS 定制实践
听众受益点:
了解 TTS 行业技术的进展以及最新的应用场景
了解阿里为从业人员提供的开箱即用 TTS 服务和 TTS 定制服务
讲师介绍:
雷鸣,阿里巴巴达摩院语音实验室资深算法专家。
雷鸣,达摩院语音实验室资深算法专家,中国科学技术大学博士,在语音领域发表过多篇论文。曾任微软 STC 语音科学家,负责语音合成核心算法的研发工作。现负责新一代语音合成系统的前端、后端模型算法研究及产品化等工作。
完整演讲 PPT 下载链接:
https://aicon.infoq.cn/2019/beijing/schedule
评论