QCon 演讲火热征集中,快来分享技术实践与洞见! 了解详情
写点什么

网易有道上线“易魔声” 开源语音合成引擎,支持中英文双语,包含 2000 多种不同音色

  • 2023-11-13
    北京
  • 本文字数:791 字

    阅读完需:约 3 分钟

大小:408.95K时长:02:19
网易有道上线“易魔声” 开源语音合成引擎,支持中英文双语,包含2000多种不同音色

11 月 10 日,网易有道正式上线“易魔声”开源语音合成(TTS)引擎,所有用户可免费在开源社区 GitHub 进行下载使用,通过其提供的 web 界面及批量生成结果的脚本接口,轻松实现音色的情感合成与应用。

 

据悉,“易魔声”是一款有道自研 TTS 引擎,目前支持中英文双语,包含 2000 多种不同的音色,更有特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。只需简单通过在文本中加入情感的描述提示,就可以自由合成符合自己需求的带有情感的语音,比传统 TTS 更加自然逼真。

 

随着基于 GAN 等现代 AI 技术的语音能力越来越成熟,实现一个质量较高的 TTS 系统的门槛越来越低。但即使如此,中英双语的高质量、现代 TTS 模块还是不易找到,要在自己的应用与内容中加入高逼真度且高度可控的语音,特别是中英双语的语音,也依然比较麻烦。

 

网易有道 CEO 周枫表示,“目前该项目还处于初期阶段,现在将这个项目开源,也是希望能帮助到有需求的开发者与内容创作者,并不断扩大高质量 TTS 的应用范围,让产品及应用更好地落地。也期待大家试用后给我们提供更多反馈与建议。”

 

公开信息显示,网易有道从 2008 年开始布局 AI,多年来一直致力于基于 Transformer 模型进行创新和应用,并在神经网络翻译、计算机视觉、高性能计算、智能语音 AI 技术等方面都具备了核心技术,为应用的实际落地打下了坚实的技术基础。在 TTS 领域,网易有道推出了多款高效便捷的应用和产品。例如,推出教育领域首个明星语音功能,将王源、欧阳娜娜、马伯骞等明星的声音内置在网易有道词典中,陪伴用户共同学习英语;提供声音定制和声音复刻功能,仅需 5 分钟即可完成个性化声音定制;近期推出的 Hi Echo 虚拟人口语私教,借助有道「子曰」教育大模型、语音和虚拟人技术,帮助用户随时随地轻松练习英语口语。

 

此外,用户还可通过有道智云官网,体验已经对开发者通过 API 等形式开放的文本和图像翻译、文字和各类图片识别、作文批改等各类 AI 技术。

2023-11-13 11:335446

评论

发布
暂无评论
发现更多内容

全球首批搭载英特尔Xe MAX独显惊艳上市,非凡S3x尽显创作魅力

E科讯

训练营第三周作业

大脸猫

极客大学架构师训练营

蚂蚁金融推迟上市:互联网金融是否要遭遇滑铁卢

石头IT视角

ViewportFrame demo

katichar

darknet A版安装

Dreamer

响应式编程简介之:Reactor

程序那些事

响应式编程 reactor Reactive 程序那些事 响应式系统

诈骗?通证项目方的危局

CECBC

区块链 法律

25个小众的Java库

GuoYaxiang

Java 开发工具

“十三五”收官,区块链赋能能源电力路在何方?

CECBC

区块链 电力 能源

书写高质量SQL的30条建议

诸葛小猿

MySQL SQL优化

英特尔首批独显笔记本亮相,非凡S3x纵享轻薄新体验

E科讯

性能测试,简单的压测工具

garlic

极客大学架构师训练营

【Knative系列】一文读懂 Knative Serving扩缩容的原理

公众号:云原生Serverless

Serverless knative autoscaler kantive

阿里P8对Thread核心源码讲解

Java架构师迁哥

天源迪科受邀出席“第四届央企电商化采购发展高峰论坛"

DT极客

Week 5学习总结

balsamspear

极客大学架构师训练营

手动造轮子——为Ocelot集成Nacos注册中心

yi念之间

nacos ASP.NET Core Ocelot

DDIA 读书笔记(5)数据分区方案

莫黎

读书笔记

JVM真香系列:.java文件到.class文件

田维常

JVM

互联网审判中区块链存证技术的应用进路

CECBC

互联网 电子存证

Week 5命题作业

balsamspear

极客大学架构师训练营

搭载设计师级独显英特尔Xe MAX,非凡S3x体验全能创作

E科讯

英特尔进军独显领域,第一批搭载锐炬®Xe MAX独显轻薄本已问世!

E科讯

Flink 1.11 与 Hive 批流一体数仓实践

Apache Flink

flink 流计算 实时计算

http请求中get和post方法的区别

测试人生路

HTTP post GET

Week 7 命题作业

阿泰

Android 一行代码接入 扫码 生成码

Java android kotlin zxing camera

【性能优化】纳尼?内存又溢出了?!是时候总结一波了!!

冰河

性能优化 内存泄露 高并发 高性能 内存溢出

Dubbo-go Server端开启服务过程

apache/dubbo-go

dubbo dubbo-go dubbogo

手动造轮子——基于.NetCore的RPC框架DotNetCoreRpc

yi念之间

RPC ASP.NET Core

线上Java程序占用 CPU 过高,请说一下排查方法?

古时的风筝

Java JVM cpu 100%

网易有道上线“易魔声” 开源语音合成引擎,支持中英文双语,包含2000多种不同音色_AI&大模型_凌敏_InfoQ精选文章