写点什么

网易有道上线“易魔声” 开源语音合成引擎,支持中英文双语,包含 2000 多种不同音色

  • 2023-11-13
    北京
  • 本文字数:791 字

    阅读完需:约 3 分钟

大小:408.95K时长:02:19
网易有道上线“易魔声” 开源语音合成引擎,支持中英文双语,包含2000多种不同音色

11 月 10 日,网易有道正式上线“易魔声”开源语音合成(TTS)引擎,所有用户可免费在开源社区 GitHub 进行下载使用,通过其提供的 web 界面及批量生成结果的脚本接口,轻松实现音色的情感合成与应用。

 

据悉,“易魔声”是一款有道自研 TTS 引擎,目前支持中英文双语,包含 2000 多种不同的音色,更有特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。只需简单通过在文本中加入情感的描述提示,就可以自由合成符合自己需求的带有情感的语音,比传统 TTS 更加自然逼真。

 

随着基于 GAN 等现代 AI 技术的语音能力越来越成熟,实现一个质量较高的 TTS 系统的门槛越来越低。但即使如此,中英双语的高质量、现代 TTS 模块还是不易找到,要在自己的应用与内容中加入高逼真度且高度可控的语音,特别是中英双语的语音,也依然比较麻烦。

 

网易有道 CEO 周枫表示,“目前该项目还处于初期阶段,现在将这个项目开源,也是希望能帮助到有需求的开发者与内容创作者,并不断扩大高质量 TTS 的应用范围,让产品及应用更好地落地。也期待大家试用后给我们提供更多反馈与建议。”

 

公开信息显示,网易有道从 2008 年开始布局 AI,多年来一直致力于基于 Transformer 模型进行创新和应用,并在神经网络翻译、计算机视觉、高性能计算、智能语音 AI 技术等方面都具备了核心技术,为应用的实际落地打下了坚实的技术基础。在 TTS 领域,网易有道推出了多款高效便捷的应用和产品。例如,推出教育领域首个明星语音功能,将王源、欧阳娜娜、马伯骞等明星的声音内置在网易有道词典中,陪伴用户共同学习英语;提供声音定制和声音复刻功能,仅需 5 分钟即可完成个性化声音定制;近期推出的 Hi Echo 虚拟人口语私教,借助有道「子曰」教育大模型、语音和虚拟人技术,帮助用户随时随地轻松练习英语口语。

 

此外,用户还可通过有道智云官网,体验已经对开发者通过 API 等形式开放的文本和图像翻译、文字和各类图片识别、作文批改等各类 AI 技术。

2023-11-13 11:335354

评论

发布
暂无评论
发现更多内容

如何写一份高可读性的软件工程设计文档

C++后台开发

数据库 软件工程 后端开发 C/C++后台开发 C/C++开发

腾讯被裁,转头去字节!Java后端核心面试题在手,怎能进不去大厂

程序员啊叶

Java 编程 程序员 架构 java面试

阿里内网最新发布“M8”级Java面试笔记,助力金九银十

程序员啊叶

Java 编程 程序员 架构 java面试

SMI 与 Gateway API 的 GAMMA 倡议意味着什么?

张晓辉

Kubernetes 服务网格 SMI

[ Kitex 源码解读 ] 熔断机制是如何实现的

baiyutang

Go 微服务 微服务架构 kitex CloudWeGo

上天入地Hadoop——使用高性能分布式技术完成大数据处理任务

程序猿阿宇

大数据 架构 Java 面试 java程序员 编程、

Kubernetes应用管理深度剖析

Bob

云原生 容器化 后端技术 Kubernetes 集群

CMake库搜索函数居然不搜索LD_LIBRARY_PATH

华为云开发者联盟

后端 开发

加密生活,Web3 项目合伙人的一天

TinTinLand

区块链

五面阿里,终拿offer,不明白为什么面试官总喜欢问Java这种问题

程序知音

Java 阿里 后端技术 八股文 Java面试八股文

想用K8s,还得先会Docker吗?其实完全没必要

程序员啊叶

Java 编程 程序员 架构 java面试

真香!180页100+题15W+字解析的《Java高级面试指南》,果断收下

程序员啊叶

Java 编程 程序员 架构 java面试

Moonbeam创始人解读多链新概念Connected Contract

One Block Community

区块链

蓦然回首,“工厂、构造、原型”设计模式,正在灯火阑珊处

掘金安东尼

JavaScript 前端 7月月更

4位资深专家多年大厂经验分享出Flink技术内幕架构设计与实现原理

程序员啊叶

Java 编程 程序员 架构 java面试

太牛了,百度这份开发手册几乎涵盖了Spring Cloud所有操作

程序猿阿宇

架构 java程序员 java面试 秋招 程序员‘

我给大家免费公开五份阿里Java架构师学习手册!助力金九银十

程序猿阿宇

架构 Java 面试 大厂面试 大厂技能 秋招

难道Redis真的变慢了吗?

程序员啊叶

Java 编程 程序员 架构 java面试

备战金九银十,两份JAVA面试题2022最新整合版,祝你脱颖而出

王小凡

Java MySQL spring 面试 springboot

手慢无!阿里亿级流量高并发系统设计核心原理全彩笔记现实开源

Java全栈架构师

Java 面试 程序人生 分布式锁 架构师

六面蚂蚁金服,唬住了面试官要了30K;其实Java面试也没那么难

程序知音

Java 程序员 后端技术 秋招 Java面试八股文

浅谈非 EVM 公链的可能性: 兼容多类型虚拟机是否是区块链未来?

One Block Community

区块链

一文读懂Elephant Swap,为何为ePLATO带来如此高的溢价?

鳄鱼视界

数据中台建设(五):打破企业数据孤岛和提取数据价值

Lansonli

数据中台 7月月更

时序数据库在船舶风险管理领域的应用

CnosDB

IoT 时序数据库 开源社区 CnosDB infra

SocialFi 何以成就 Web3 去中心化社交未来

One Block Community

区块链

京东发布这份SpringBoot实战手册带你从0手动搭建企业级商城项目

程序猿阿宇

程序员 面试 java程序员 Spring Boot CLI 秋招

只分享这一次!阿里软件架构师深入底层手写JDK源码

程序猿阿宇

架构 Java 面试 大厂技能 后端技术 秋招

HarmonyOS分布式协同演奏技术实现路线(Java)

程序员啊叶

Java 编程 程序员 架构 java面试

大厂面试突击必备:“网络编程”高频八连击,扛得住吗?

程序员啊叶

Java 编程 程序员 架构 java面试

DTSE Tech Talk丨第2期:1小时深度解读SaaS应用系统设计

华为云开发者联盟

云计算 后端 SaaS

网易有道上线“易魔声” 开源语音合成引擎,支持中英文双语,包含2000多种不同音色_AI&大模型_凌敏_InfoQ精选文章