写点什么

微软 Azure Neural TTS 新增对 9 个“小语种”语言及口音支持 | InfoQ 快讯

  • 2022-08-08
    北京
  • 本文字数:1395 字

    阅读完需:约 5 分钟

微软Azure Neural TTS 新增对9个“小语种”语言及口音支持 | InfoQ快讯

AI 语音技术的发展和应用,让中国用户在外语学习和对外沟通交流中获得了诸多便利。但对于国内的小语种学习者,或是正在小语种国家或地区开展业务的机构,目前还需要支持更多小语种的语音工具。


然而,由于缺乏训练数据,那些较少使用的口语,几乎没有任何可用的 TTS 工具。现在,在低资源TTS技术的支持下,微软 Azure 认知服务正在持续扩展对不同国家及地区语言的支持,满足更多用户的场景需求,例如小语种教育教学的有声读物、电子辞典等学习工具;面向相应国家和地区市场的 AI 语音助手、AI 语音客服;或是将 TTS 作为视频、音频等素材的生产工具,产出面向以上语种使用者的媒体产品等。


InfoQ 获悉,近期,微软 Azure Neural TTS 新增了对 9 个“小语种”语言及其不同口音的支持,包括:阿拉伯语(黎巴嫩)、阿拉伯语(阿曼)、阿塞拜疆语(阿塞拜疆)、波斯尼亚语(波黑)、格鲁吉亚语(格鲁吉亚)、蒙古语(蒙古)、尼泊尔语(尼泊尔)、阿尔巴尼亚语(阿尔巴尼亚)、泰米尔语(马来西亚)。以上几种语言均已公开发布,供开发者使用。


点击以下声音示例,感受这些不同风格的“小语种”语言。



示例:az-AZ BabekNeural 阿塞拜疆语(阿塞拜疆)

链接:http://tts.blob.core.windows.net/garfield/garfield202206/az-AZ-BabekNeural-General-Audio.wav?sv=2020-10-02&st=2022-06-16T09%3A08%3A14Z&se=2025-01-23T09%3A08%3A00Z&sr=c&sp=racwdxlt&sig=69pLAPbtLnEHlNZco8g8jnqJyhPXOWOO%2FSX2Zm0fpeI%3D


示例:ar-LB RamiNeural 阿拉伯语(黎巴嫩)

链接:http://tts.blob.core.windows.net/garfield/garfield202206/ar-LB-RamiNeural-General-Audio.wav?sv=2020-10-02&st=2022-06-16T09%3A08%3A14Z&se=2025-01-23T09%3A08%3A00Z&sr=c&sp=racwdxlt&sig=69pLAPbtLnEHlNZco8g8jnqJyhPXOWOO%2FSX2Zm0fpeI%3D


示例:ne-NP SagarNeural 尼泊尔语(尼泊尔)

链接:http://tts.blob.core.windows.net/garfield/garfield202206/ne-NP-SagarNeural-General-Audio.wav?sv=2020-10-02&st=2022-06-16T09%3A08%3A14Z&se=2025-01-23T09%3A08%3A00Z&sr=c&sp=racwdxlt&sig=69pLAPbtLnEHlNZco8g8jnqJyhPXOWOO%2FSX2Zm0fpeI%3D


示例:bs-BA VesnaNeural 波斯尼亚语(波黑)

链接:http://tts.blob.core.windows.net/garfield/garfield202206/bs-BA-VesnaNeural-General-Audio.wav?sv=2020-10-02&st=2022-06-16T09%3A08%3A14Z&se=2025-01-23T09%3A08%3A00Z&sr=c&sp=racwdxlt&sig=69pLAPbtLnEHlNZco8g8jnqJyhPXOWOO%2FSX2Zm0fpeI%3D


示例:ta-MY KaniNaural 泰米尔语(马来西亚)

链接:http://tts.blob.core.windows.net/garfield/garfield202206/ta-MY-KaniNaural-General-Audio.wav?sv=2020-10-02&st=2022-06-16T09%3A08%3A14Z&se=2025-01-23T09%3A08%3A00Z&sr=c&sp=racwdxlt&sig=69pLAPbtLnEHlNZco8g8jnqJyhPXOWOO%2FSX2Zm0fpeI%3D


全球人类正在使用的语言有数千种,其中使用最多的前 1%(约 70 种语言)覆盖了全球 80%以上的人口,并且基本都得到了 TTS 技术的支持。但那些小语种的使用者,也应当享受 TTS 技术带来的便利。


图:微软 Azure Neural TTS 支持语言和声音列表


据悉,截止目前,Azure 认知服务的文本转语音模块支持全球140个国家和地区的语言,提供400个声音模型,企业能够利用Azure神经网络版声音定制服务,以多种语言和风格打造独特的品牌声音。微软 Azure AI 还提供语音转文本OCR翻译等一系列与语言相关的认知服务,所支持的语言已达 100 多种。

2022-08-08 18:334334
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 539.7 次阅读, 收获喜欢 1977 次。

关注

评论

发布
暂无评论
发现更多内容

龙蜥社区落地开源生态发展合作倡议,构建开放兼容的操作系统生态

OpenAnolis小助手

操作系统 龙蜥社区 OpenAnolis

如何利用体育直播平台进行内容变现

熊猫比分大卫

体育赛况资讯直播app开发 体育直播 体育直播网源码

hbdk-model-verifier、hbdk-sim 和 hbdk-hbm-attach 工具使用教程

地平线开发者

自动驾驶 算法 算法工具链 地平线征程5

Java面试背八股文还有用吗?

开心学Java

程序员 后端 架构师 java面试 八股文

基于MicroBlocks的"双模态"遥控智能小车

积木思维

说说Hashtable与HashMap的区别

百度搜索:蓝易云

如何写出好的大模型提示词?如何判断提示词的好坏?

AIGC.TWang

AIGC GPT 提示词

Java程序员如何精进性能优化技能?

了不起的程序猿

性能优化 架构师 java面试 MySQL优化 jvm调优

mysql小数和类型转换函数

百度搜索:蓝易云

IoTDB 常见问题 Q&A 第二期

Apache IoTDB

最新2025年体育足球篮球赛事直播软件开发费用

软件开发-梦幻运营部

Kubernetes 可观测最佳实践

观测云

Kubernetes

《Django 5 By Example》阅读笔记:p521-p542

codists

Python django

启动MySQL数据库时报错"Another process with pid 3306 is using unix socket file……"

百度搜索:蓝易云

科大讯飞T30 Lite和步步高S8的区别

妙龙

科大讯飞 学习机 步步高 步步高家教机

crossover安装exe后无法打开怎么办?CrossOver安装成功但打不开

阿拉灯神丁

容器 应用程序配置 苹果软件精选 CrossOver Mac下载 CrossOver 24

SEO 搜索引擎优化核心名词全解析

恩爸编程

搜索引擎 百度 SEO SEO伪静态 SEO 优化

用阿里通义灵码对MicroBlocks代码AI重构

积木思维

教学培训小程序软件开发,协助机构管理招生工作

V\TG【ch3nguang】

低代码开发:企业数智化转型中的关键角色与实践案例分析

快乐非自愿限量之名

低代码

C语言-字符串相关库函数用法+模拟实现

百度搜索:蓝易云

刚入行Java,如何高效精进SpringBoot技能?

开心学Java

程序员 后端 架构师 springboot java面试

鸿蒙NEXT开发案例:颜文字搜索器

zhongcx

科大讯飞t30pro和lumie10pro有什么区别

妙龙

科大讯飞 学习机

科大讯飞T30 Ultra,T30pro,T30 Lite选哪个好

妙龙

科大讯飞 学习机

谷歌发布 Android XR 集成 Gemini 语音对话;Voice Agent 平台 Vapi 获 2000 万美元融资

声网

鸿蒙NEXT开发案例:世界时间表

zhongcx

鸿蒙

Java:JSR 310日期时间体系LocalDateTime、OffsetDateTime、ZonedDateTime

百度搜索:蓝易云

科大讯飞s30功能配置介绍,科大讯飞s30怎么样优缺点分析

妙龙

科大讯飞 学习机

初见ByConity

法医

ByConity

如何做好一个中层管理

易成研发中心

企业管理 企业管理软件

微软Azure Neural TTS 新增对9个“小语种”语言及口音支持 | InfoQ快讯_AI&大模型_刘燕_InfoQ精选文章