写点什么

Amazon Transcribe 现已支持中文普通话和俄语

  • 2019-09-18
  • 本文字数:1605 字

    阅读完需:约 5 分钟

Amazon Transcribe 现已支持中文普通话和俄语

由于语音是人类互动的核心,人工智能研究长期以来一直专注于语音识别,这是设计和构建可使人类与机器进行直观互动的系统的第一步。语言、口音和语音的多样性使这成为一个非常困难的问题,需要专家技能、超大数据集和庞大的计算能力来训练效率模型。


为帮助组织和开发人员在他们的应用程序中使用语音识别,我们在 AWS re:Invent 2017 上发布了 Amazon Transcribe,这是一项自动语音识别服务。借助 Amazon Transcribe,客户(如 VideoPeel、Echo360 或 GE Appliances)能够快速、轻松地将语音识别功能添加到其应用程序和设备中。


只需一个 API 调用即可…您无需了解有关机器学习的核心知识。您可以分析存储在 Amazon Simple Storage Service (S3) 中的音频文件,并使用该服务返回转录的语音的文本文件。您还可以向 Amazon Transcribe 发送实时音频流,并实时接收转录内容流。


自该项服务发布以来,团队不断添加新语言,今天我们很高兴地宣布该项服务现已支持中文普通话和俄语,使支持的语言总数达到 16 种。


推出中文普通话支持


使用 Amazon Transcribe 非常简单:给我几分钟向您展示如何操作。


我们先试试普通话。从这个“小红帽的故事”视频入手,我提取了音轨,将其保存为 MP3 格式,并将其上传到我的一个 Amazon Simple Storage Service (S3) 存储桶中。下面是实际文件。


然后,我使用 AWS CLI 开始转录:


$ aws transcribe start-transcription-job--media MediaFileUri=https://s3-us-west-2.amazonaws.com/jsimon-transcribe-demo/little_red_riding_hood-mandarin.mp3 --media-format mp3 --language-code zh-CN --transcription-job-name little_red_riding_hood-mandarin
复制代码


几分钟后,转录完成。查看 AWS 控制台时,我可以使用 Amazon Transcribe 提供的 URL 下载,也可以直接读取。



不过,我不会说普通话,但借助 Amazon Translate 可以知道该文本讲的是一个生病的祖母和一只大坏狼的故事,因此看起来 Amazon Transcribe 顺利完成了任务!


推出俄语支持


现在,我们用这个短视频中的对话试试俄语。


Здравствуйте! Greetings!


Добрый день! Good day!


Давайте познакомимся.Меня зовут Слава. Let’s introduce ourselves.My name is Slava.


Очень приятно, а меня – Наташа. Nice to meet you, and mine – Natasha.


Наташа, кто вы по профессии? Natasha, what is your profession?


Я врач.А вы? I (am a) doctor.And you?


Я инженер. I (am an) engineer.


这次,我也会让 Amazon Transcribe 进行说话人识别。


$ aws transcribe start-transcription-job --media MediaFileUri=https://s3-us-west-2.amazonaws.com/jsimon-transcribe-demo/russian-dialogue.mp3 --media-format mp3 --language-code ru-RU --transcription-job-name russian_dialogue --settings ShowSpeakerLabels=true,MaxSpeakerLabels=2
复制代码


结果如下。



如您所见,Amazon Transcribe 不仅忠实地将语音转换为文本,还准确地将每个句子分配给正确的说话人。


现已推出!


您可以在以下地区开始使用这两种新语言:


  • 美洲:美国东部(俄亥俄)、美国东部(弗吉尼亚北部)、美国西部(加利福尼亚北部)、美国西部(俄勒冈)、AWS GovCloud(美国西部)、加拿大(中部)、南美洲(圣保罗)。

  • 欧洲:欧洲(法兰克福)、欧洲(爱尔兰)、欧洲(伦敦)、欧洲(巴黎)。

  • 亚太地区:亚太地区(孟买)、亚太地区(首尔)、亚太地区(新加坡)、亚太地区(悉尼)。

  • 从您首次请求转录开始,免费套餐在前 12 个月供您免费使用 60 分钟。


与以往一样,我们希望收到您的反馈:请将反馈发布到 AWS 论坛的 Amazon Transcribe 版块,或通过您常用的 AWS 联系方式发送反馈。


本文转载自 AWS 博客。


原文链接:


https://amazonaws-china.com/cn/blogs/china/amazon-transcribe-now-supports-mandarin-and-russian/


2019-09-18 17:171189
用户头像

发布了 1848 篇内容, 共 113.6 次阅读, 收获喜欢 78 次。

关注

评论

发布
暂无评论
发现更多内容

深度挖掘 1688 商品评论数据接口,洞察用户心声

tbapi

1688商品评论接口 1688API

SketchUp Pro 2024 for mac强大三维建模软件

Mac相关知识分享

三维建模软件

强大视频转码工具EditReady for Mac

Mac相关知识分享

如何配置docker或者k8s拉取https私人镜像仓库

百度搜索:蓝易云

生成式AI的天命:“不疯魔,不成活”!

博文视点Broadview

CAD快速看图 v9.9.9 VIP激活版

理理

Docker启动容器报错:cannot allocate memory: unknown

百度搜索:蓝易云

南开大学携手火山引擎,联合打造全国“AI+教育”成果新示范

新消费日报

Cookie的secure属性引起循环登录问题分析及解决方案

vivo互联网技术

https Cookie 单点登录

PDF 文件处理工具PDF Merge PDF Splitter for Mac

Mac相关知识分享

PDF

音频修复iZotope RX 10 for mac破解补丁 兼容M芯片

理理

“创造神迹” -> “打造利器”:AI 从实验室走向市场的五大障碍

Baihai IDP

程序员 AI LLMs 企业 9 月 PK 榜 AI 产品

NFT铸造挖矿交易系统开发部署搭建

V\TG【ch3nguang】

黑神话 悟空|风灵月影 V1.0-35项修改器

理理

(spss统计软件)IBM SPSS Statistics 27 许可证代码

理理

别让质量问题拖垮您的企业!快看看这些隐藏的风险!

天津汇柏科技有限公司

质量管理 低代码 AI人工智能

在RHEL配置网络绑定(成组)

百度搜索:蓝易云

Vector Magic(图片矢量转换工具)

理理

数据恢复新利器!Disk Drill Enterprise:高效恢复,无忧存储!

理理

NineData云原生智能数据管理平台新功能发布|2024年8月版

NineData

DevOps 数据迁移 数据管理 新功能 NineData

如何在Linux中映射LUN、磁盘、LVM和文件系统

百度搜索:蓝易云

GraphPad Prism 10破解版安装 含永久激活码 mac/win

理理

Dropzone 4 for mac文件拖拽增强工具

Mac相关知识分享

文件管理工具

Default Folder X for mac专业搜索优化工具

Mac相关知识分享

键盘也能用上大模型?文心一言内置于罗技最新品

百度Geek说

大模型 开发语音 文心一言

我的 Linux 利器

玄兴梦影

Linux

交互式反汇编工具 IDA Pro 9 for mac破解资源 支持M1/M2

理理

深智城基于超融合数据库MatrixOne的一站式交通大数据平台改造

MatrixOrigin

数据库 深圳

首个大数据批流融合国家标准正式发布,阿里云为牵头起草单位!

阿里云大数据AI技术

大数据 阿里云 信息技术 国家标准

智源研究院推出全球首个包含文生视频的模型对战评测服务

智源研究院

如何在Kubernetes集群中设置动态NFS配置

百度搜索:蓝易云

Amazon Transcribe 现已支持中文普通话和俄语_编程语言_亚马逊云科技 (Amazon Web Services)_InfoQ精选文章