网易有道上线“易魔声” 开源语音合成引擎，支持中英文双语，包含2000多种不同音色

11 月 10 日，网易有道正式上线“易魔声”开源语音合成（TTS）引擎，所有用户可免费在开源社区 GitHub 进行下载使用，通过其提供的 web 界面及批量生成结果的脚本接口，轻松实现音色的情感合成与应用。

据悉，“易魔声”是一款有道自研 TTS 引擎，目前支持中英文双语，包含 2000 多种不同的音色，更有特色的情感合成功能，支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。只需简单通过在文本中加入情感的描述提示，就可以自由合成符合自己需求的带有情感的语音，比传统 TTS 更加自然逼真。

随着基于 GAN 等现代 AI 技术的语音能力越来越成熟，实现一个质量较高的 TTS 系统的门槛越来越低。但即使如此，中英双语的高质量、现代 TTS 模块还是不易找到，要在自己的应用与内容中加入高逼真度且高度可控的语音，特别是中英双语的语音，也依然比较麻烦。

网易有道 CEO 周枫表示，“目前该项目还处于初期阶段，现在将这个项目开源，也是希望能帮助到有需求的开发者与内容创作者，并不断扩大高质量 TTS 的应用范围，让产品及应用更好地落地。也期待大家试用后给我们提供更多反馈与建议。”

公开信息显示，网易有道从 2008 年开始布局 AI，多年来一直致力于基于 Transformer 模型进行创新和应用，并在神经网络翻译、计算机视觉、高性能计算、智能语音 AI 技术等方面都具备了核心技术，为应用的实际落地打下了坚实的技术基础。在 TTS 领域，网易有道推出了多款高效便捷的应用和产品。例如，推出教育领域首个明星语音功能，将王源、欧阳娜娜、马伯骞等明星的声音内置在网易有道词典中，陪伴用户共同学习英语；提供声音定制和声音复刻功能，仅需 5 分钟即可完成个性化声音定制；近期推出的 Hi Echo 虚拟人口语私教，借助有道「子曰」教育大模型、语音和虚拟人技术，帮助用户随时随地轻松练习英语口语。

此外，用户还可通过有道智云官网，体验已经对开发者通过 API 等形式开放的文本和图像翻译、文字和各类图片识别、作文批改等各类 AI 技术。

创作场景

网易有道上线“易魔声” 开源语音合成引擎，支持中英文双语，包含 2000 多种不同音色