写点什么

Amazon Transcribe 现已支持中文普通话和俄语

  • 2019-09-18
  • 本文字数:1605 字

    阅读完需:约 5 分钟

Amazon Transcribe 现已支持中文普通话和俄语

由于语音是人类互动的核心,人工智能研究长期以来一直专注于语音识别,这是设计和构建可使人类与机器进行直观互动的系统的第一步。语言、口音和语音的多样性使这成为一个非常困难的问题,需要专家技能、超大数据集和庞大的计算能力来训练效率模型。


为帮助组织和开发人员在他们的应用程序中使用语音识别,我们在 AWS re:Invent 2017 上发布了 Amazon Transcribe,这是一项自动语音识别服务。借助 Amazon Transcribe,客户(如 VideoPeel、Echo360 或 GE Appliances)能够快速、轻松地将语音识别功能添加到其应用程序和设备中。


只需一个 API 调用即可…您无需了解有关机器学习的核心知识。您可以分析存储在 Amazon Simple Storage Service (S3) 中的音频文件,并使用该服务返回转录的语音的文本文件。您还可以向 Amazon Transcribe 发送实时音频流,并实时接收转录内容流。


自该项服务发布以来,团队不断添加新语言,今天我们很高兴地宣布该项服务现已支持中文普通话和俄语,使支持的语言总数达到 16 种。


推出中文普通话支持


使用 Amazon Transcribe 非常简单:给我几分钟向您展示如何操作。


我们先试试普通话。从这个“小红帽的故事”视频入手,我提取了音轨,将其保存为 MP3 格式,并将其上传到我的一个 Amazon Simple Storage Service (S3) 存储桶中。下面是实际文件。


然后,我使用 AWS CLI 开始转录:


$ aws transcribe start-transcription-job--media MediaFileUri=https://s3-us-west-2.amazonaws.com/jsimon-transcribe-demo/little_red_riding_hood-mandarin.mp3 --media-format mp3 --language-code zh-CN --transcription-job-name little_red_riding_hood-mandarin
复制代码


几分钟后,转录完成。查看 AWS 控制台时,我可以使用 Amazon Transcribe 提供的 URL 下载,也可以直接读取。



不过,我不会说普通话,但借助 Amazon Translate 可以知道该文本讲的是一个生病的祖母和一只大坏狼的故事,因此看起来 Amazon Transcribe 顺利完成了任务!


推出俄语支持


现在,我们用这个短视频中的对话试试俄语。


Здравствуйте! Greetings!


Добрый день! Good day!


Давайте познакомимся.Меня зовут Слава. Let’s introduce ourselves.My name is Slava.


Очень приятно, а меня – Наташа. Nice to meet you, and mine – Natasha.


Наташа, кто вы по профессии? Natasha, what is your profession?


Я врач.А вы? I (am a) doctor.And you?


Я инженер. I (am an) engineer.


这次,我也会让 Amazon Transcribe 进行说话人识别。


$ aws transcribe start-transcription-job --media MediaFileUri=https://s3-us-west-2.amazonaws.com/jsimon-transcribe-demo/russian-dialogue.mp3 --media-format mp3 --language-code ru-RU --transcription-job-name russian_dialogue --settings ShowSpeakerLabels=true,MaxSpeakerLabels=2
复制代码


结果如下。



如您所见,Amazon Transcribe 不仅忠实地将语音转换为文本,还准确地将每个句子分配给正确的说话人。


现已推出!


您可以在以下地区开始使用这两种新语言:


  • 美洲:美国东部(俄亥俄)、美国东部(弗吉尼亚北部)、美国西部(加利福尼亚北部)、美国西部(俄勒冈)、AWS GovCloud(美国西部)、加拿大(中部)、南美洲(圣保罗)。

  • 欧洲:欧洲(法兰克福)、欧洲(爱尔兰)、欧洲(伦敦)、欧洲(巴黎)。

  • 亚太地区:亚太地区(孟买)、亚太地区(首尔)、亚太地区(新加坡)、亚太地区(悉尼)。

  • 从您首次请求转录开始,免费套餐在前 12 个月供您免费使用 60 分钟。


与以往一样,我们希望收到您的反馈:请将反馈发布到 AWS 论坛的 Amazon Transcribe 版块,或通过您常用的 AWS 联系方式发送反馈。


本文转载自 AWS 博客。


原文链接:


https://amazonaws-china.com/cn/blogs/china/amazon-transcribe-now-supports-mandarin-and-russian/


2019-09-18 17:171279
用户头像

发布了 1865 篇内容, 共 133.1 次阅读, 收获喜欢 81 次。

关注

评论

发布
暂无评论
发现更多内容

跟着卷卷龙一起学Camera--Binder

卷卷龙

ISP 9月月更

【云原生 | 从零开始学Docker】四、Docker镜像深度解析

泡泡

Docker 云计算 容器 云原生 9月月更

你知道数据资产管理的目标是什么?

雨果

数据中台 数据资产管理

数据、管理、分析和运营:大数据专家面临的四大挑战!

雨果

大数据

“基础-中级-高级”Java程序员面试合集,看完献出我的膝盖!

收到请回复

Java 云计算 开源 架构 编程语言

SaaS 产品该如何定价?

产品海豚湾

产品经理 SaaS 产品规划 9月月更 商业产品

leetcode 637. Average of Levels in Binary Tree 二叉树的层平均值(简单)

okokabcd

LeetCode 数据结构与算法

2022-09-15:Range模块是跟踪数字范围的模块。 设计一个数据结构来跟踪表示为 半开区间 的范围并查询它们。 半开区间 [left, right) 表示所有 left <= x < righ

福大大架构师每日一题

算法 rust 福大大

2022前端二面必会vue面试题汇总

bb_xiaxia1998

Vue 前端

【云原生 | 从零开始学Docker】五、容器数据卷实战

泡泡

Docker 云计算 容器 云原生 9月月更

元宇宙与泛娱乐的邂逅:次世代第一CP养成记

脑极体

谁能说清楚数据资产管理与数据治理是什么关系?

雨果

数据治理

2022前端经典vue面试题(持续更新中)

bb_xiaxia1998

Vue 前端

一线架构师开发总结:剖析并发编程+JVM性能,深入Tomcat与MySQL!

收到请回复

Java 云计算 开源 架构 编程语言

C++学习---STL中nullptr_t的实现原理

桑榆

c++ 源码阅读 9月月更

Java进阶(二十一)java 空字符串与null区别

No Silver Bullet

Java null 9月月更 空字符串

企业做好知识管理的方法:文档管理

Baklib

《数字经济全景白皮书》新市民金融创新篇 重磅发布!

易观分析

金融 新市民服务

大数据ELK(二):Elasticsearch简单介绍

Lansonli

elasticsearch 9月月更

20道高频react面试题(附答案)

beifeng1996

前端 React

前端常见react面试题合集

beifeng1996

前端 React

易观分析:制造行业数字孪生AMC分析 ——数字孪生智能制造步入市场启动期,闭环验证能力待优化

易观分析

数字孪生 市场分析

MySQL 中的锁机制

月明风清

什么是访问控制列表ACL?

wljslmz

acl 访问控制列表 9月月更

谁来说说数据质量评估的标准是什么?

雨果

数据质量

数据仓库分层架构

阿泽🧸

数据仓库 9月月更

前端经典面试题(有答案)

loveX001

JavaScript 前端

[极致用户体验] 让你的网页,适配微信大字号模式!体验超好,快来收藏

HullQin

CSS JavaScript html 前端 9月月更

MFC模拟消息发送,自定义以及系统消息

中国好公民st

c++ 消息分发 9月月更

TCPIP协议栈的心跳、丢包重传、连接超时机制实例详解

Java快了!

Amazon Transcribe 现已支持中文普通话和俄语_编程语言_亚马逊云科技 (Amazon Web Services)_InfoQ精选文章