写点什么

微软 Azure Neural TTS 新增对 9 个“小语种”语言及口音支持 | InfoQ 快讯

  • 2022-08-08
    北京
  • 本文字数:1395 字

    阅读完需:约 5 分钟

微软Azure Neural TTS 新增对9个“小语种”语言及口音支持 | InfoQ快讯

AI 语音技术的发展和应用,让中国用户在外语学习和对外沟通交流中获得了诸多便利。但对于国内的小语种学习者,或是正在小语种国家或地区开展业务的机构,目前还需要支持更多小语种的语音工具。


然而,由于缺乏训练数据,那些较少使用的口语,几乎没有任何可用的 TTS 工具。现在,在低资源TTS技术的支持下,微软 Azure 认知服务正在持续扩展对不同国家及地区语言的支持,满足更多用户的场景需求,例如小语种教育教学的有声读物、电子辞典等学习工具;面向相应国家和地区市场的 AI 语音助手、AI 语音客服;或是将 TTS 作为视频、音频等素材的生产工具,产出面向以上语种使用者的媒体产品等。


InfoQ 获悉,近期,微软 Azure Neural TTS 新增了对 9 个“小语种”语言及其不同口音的支持,包括:阿拉伯语(黎巴嫩)、阿拉伯语(阿曼)、阿塞拜疆语(阿塞拜疆)、波斯尼亚语(波黑)、格鲁吉亚语(格鲁吉亚)、蒙古语(蒙古)、尼泊尔语(尼泊尔)、阿尔巴尼亚语(阿尔巴尼亚)、泰米尔语(马来西亚)。以上几种语言均已公开发布,供开发者使用。


点击以下声音示例,感受这些不同风格的“小语种”语言。



示例:az-AZ BabekNeural 阿塞拜疆语(阿塞拜疆)

链接:http://tts.blob.core.windows.net/garfield/garfield202206/az-AZ-BabekNeural-General-Audio.wav?sv=2020-10-02&st=2022-06-16T09%3A08%3A14Z&se=2025-01-23T09%3A08%3A00Z&sr=c&sp=racwdxlt&sig=69pLAPbtLnEHlNZco8g8jnqJyhPXOWOO%2FSX2Zm0fpeI%3D


示例:ar-LB RamiNeural 阿拉伯语(黎巴嫩)

链接:http://tts.blob.core.windows.net/garfield/garfield202206/ar-LB-RamiNeural-General-Audio.wav?sv=2020-10-02&st=2022-06-16T09%3A08%3A14Z&se=2025-01-23T09%3A08%3A00Z&sr=c&sp=racwdxlt&sig=69pLAPbtLnEHlNZco8g8jnqJyhPXOWOO%2FSX2Zm0fpeI%3D


示例:ne-NP SagarNeural 尼泊尔语(尼泊尔)

链接:http://tts.blob.core.windows.net/garfield/garfield202206/ne-NP-SagarNeural-General-Audio.wav?sv=2020-10-02&st=2022-06-16T09%3A08%3A14Z&se=2025-01-23T09%3A08%3A00Z&sr=c&sp=racwdxlt&sig=69pLAPbtLnEHlNZco8g8jnqJyhPXOWOO%2FSX2Zm0fpeI%3D


示例:bs-BA VesnaNeural 波斯尼亚语(波黑)

链接:http://tts.blob.core.windows.net/garfield/garfield202206/bs-BA-VesnaNeural-General-Audio.wav?sv=2020-10-02&st=2022-06-16T09%3A08%3A14Z&se=2025-01-23T09%3A08%3A00Z&sr=c&sp=racwdxlt&sig=69pLAPbtLnEHlNZco8g8jnqJyhPXOWOO%2FSX2Zm0fpeI%3D


示例:ta-MY KaniNaural 泰米尔语(马来西亚)

链接:http://tts.blob.core.windows.net/garfield/garfield202206/ta-MY-KaniNaural-General-Audio.wav?sv=2020-10-02&st=2022-06-16T09%3A08%3A14Z&se=2025-01-23T09%3A08%3A00Z&sr=c&sp=racwdxlt&sig=69pLAPbtLnEHlNZco8g8jnqJyhPXOWOO%2FSX2Zm0fpeI%3D


全球人类正在使用的语言有数千种,其中使用最多的前 1%(约 70 种语言)覆盖了全球 80%以上的人口,并且基本都得到了 TTS 技术的支持。但那些小语种的使用者,也应当享受 TTS 技术带来的便利。


图:微软 Azure Neural TTS 支持语言和声音列表


据悉,截止目前,Azure 认知服务的文本转语音模块支持全球140个国家和地区的语言,提供400个声音模型,企业能够利用Azure神经网络版声音定制服务,以多种语言和风格打造独特的品牌声音。微软 Azure AI 还提供语音转文本OCR翻译等一系列与语言相关的认知服务,所支持的语言已达 100 多种。

2022-08-08 18:334400
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 548.4 次阅读, 收获喜欢 1978 次。

关注

评论

发布
暂无评论
发现更多内容

【YashanDB知识库】YashanDB查询时间与实际时间默认少8小时

YashanDB

数据库 yashandb

【YashanDB知识库】归档日志清理

YashanDB

数据库 yashandb

【YashanDB知识库】MySQL的FIND_IN_SET如何在YashanDB改写

YashanDB

数据库 yashandb

Aloudata CAN 荣登 CSDN 2024 中国开发者影响力年度「创新产品与解决方案」榜单

Aloudata

数据分析 数据指标 指标平台 noetl

Hyper-V:信息森林中的智慧守护者

柳岸风吟

Locks, Actors, And Stm In Pictures

werbenhu

actor

【YashanDB知识库】Yasldr错误处理

YashanDB

数据库 yashandb

【YashanDB知识库】非YCM方式的自动备份方案示例

YashanDB

数据库 yashandb

AI口语评测APP上线注意事项

北京木奇移动技术有限公司

软件外包公司 AI口语测试 AI英语学习

fury hyper,hyper-v的卸载教程

柳岸风吟

碾压 OpenAI,DeepSeek-R1 发布!如何在本地实现 DeepSeek?

智领云科技

openai DeepSeek DeepSeek v3

NocoBase 本周更新汇总:改进文件存储扩展

NocoBase

开源 低代码 插件 无代码 版本更新

AI如何帮助解决生活中的琐碎难题?

天津汇柏科技有限公司

AI 人工智能

@所有人 坚持长期价值创造,智启数字未来!

赛博威科技

数字化 数字营销 赛博威

开发娱乐游戏直播APP网站:现成系统源码六种直播方式

软件开发-梦幻运营部

培训讲师管理系统(源码+文档+部署+讲解)

深圳亥时科技

【YashanDB知识库】YashanDB安全设置示例

YashanDB

数据库 yashandb

腾讯面试:那些腾讯面试过的MySQL场景问题

王中阳Go

腾讯 MySQL 高可用 面试问题 数据库、

人工智能丨AI助力软件测试:从小红书与DeepSeek合作看未来发展

测试人

软件测试

2025年中国(深圳)国际移动消费电子及产品展会

秋硕展览

AI口语陪练APP的测试

北京木奇移动技术有限公司

软件外包公司 AI口语练习 AI英语学习

【YashanDB知识库】YCM和YMP密码重置

YashanDB

yashandb

【YashanDB知识库】YCM数据库托管遇到的问题

YashanDB

数据库

【YashanDB知识库】字符集latin1的MySQL中文数据如何迁移到YashanDB

YashanDB

yashandb

【YashanDB知识库】透明故障转移配置指导

YashanDB

数据库 yashandb

【YashanDB知识库】备库扩缩容指导

YashanDB

数据库 yashandb

【YashanDB知识库】私有maven使用崖山JDBC驱动

YashanDB

数据库 yashandb

【YashanDB知识库】通过导入导出修改用户名称

YashanDB

数据库

腾讯云 AI 代码助手: Codebase 本地工程检索

腾讯云 AI 代码助手

2025 年最值得关注的 8 大数据复制工具

tapdata

灾备 数据复制 实时数据 数据复制工具 fivetran

AI口语练习APP的性能优化

北京木奇移动技术有限公司

软件外包公司 AI口语练习 AI英语学习

微软Azure Neural TTS 新增对9个“小语种”语言及口音支持 | InfoQ快讯_AI&大模型_刘燕_InfoQ精选文章