报名参加CloudWeGo黑客松,奖金直推双丰收! 了解详情
写点什么

亚马逊为它们的语音识别 API 添加了更好粒度的控制

  • 2016-12-11
  • 本文字数:1050 字

    阅读完需:约 3 分钟

亚马逊的语音服务API Alexa 是为亚马逊 Echo 提供支持的NLP(自然语言处理)API。它有一个新的更新,开发人员通过使用语音识别功能API 可以将任何设备转换为“智能”设备。

像微软和谷歌这样的科技巨擘最新发布了几个大规模的NLP,Alexa API 就是其中之一。Alexa 尤其专注于设备和语音识别的集成,这一点和IBM 最近使用它的云平台Bluemix 提供的API 所做的非常相似。Alexa 被设计为一个开发者API,针对希望让不断增长的“物联网”设备市场更加有序的公司。当前智能设备的一个关键问题是它们都存在于不同平台上,具有不同级别的能力和安全性。家里的Hue 灯不知道怎样与八月智能锁通信,这给更高级的可重用的物联网短语带来了障碍。比如“我要出门了”,这样的短语会创建一条自动的命令链来关灯和锁门。苹果的HomeKit 虽然已经取得了长足的进步,使得我们不需要人工地与大量不同用户界面的App 打交道和登录,但是就针对开发的可定制的语音识别API 而言,却收效甚微。HomeKit 是直接与Siri 集成的。

Alexa 此次 API 更新的一个关键功能是,它提供了与外部服务更好的集成和针对语音激活媒体的更好粒度的控制,比如音量和回放控制。要使用该 API,我们不需要拥有亚马逊的设备,我们可以在线注册任何 Raspberry Pi 或者其他自定义硬件。这包含了对移动设备和服务器端消息服务的支持。这意味着,我们可以用自己硬件上的自定义编程的功能设计自己的语音用户界面。许多 NLP 平台要么是彻底地专注于软件,如谷歌的 Cloud Natural Language API ,要么提供大量设备集成支持,却牺牲了可定制性,破坏像苹果 HomeKit 这样包罗万象的应用生态系统的标准集。Alexa 的独特之处在于它添加的 API,在专注于语音识别能力的同时,又不迫使用户购买一整套平台解决方案而牺牲灵活性。

跳上 Alexa 花车的公司有生产语音控制的宠物喂食器的 Petnet 公司和生产车载应用控制系统的 Mojio 公司。这些应用现在可以使用到语音控制计时器和闹钟(和 Alexa 移动应用集成)以及系统级别的控制功能,比如静音和取消静音功能。Alexa 还介绍了与英特尔新合作发布的称为 Form Factor Reference 的设计。它是一种新型的英特尔主板设计,旨在减少开发时间,通过与 API 软件配对的硬件促进设备制造商进一步创造智能设备。

查看英文原文: Amazon Adds Finer Granularity of Control to Their Voice Recognition API


感谢冬雨对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2016-12-11 18:001937
用户头像

发布了 33 篇内容, 共 11.9 次阅读, 收获喜欢 10 次。

关注

评论

发布
暂无评论
发现更多内容

写在开头

宋胖子

CentOS 6 升级 glibc

wong

centos glibc

Design Sprint 教你五天完成产品迭代

Yanel 说敏捷产品

产品 敏捷 设计 产品设计 团队

谈谈控制感(6):虚幻的控制感也好用

史方远

职场 心理 成长

写作对我的意义

Neco.W

总结 思考 写作 感悟

如何用一套引擎搞定机器学习全流程?

Apache Flink

大数据 flink 流计算 实时计算

解决 Django 多进程下,logging 记录日志错乱问题

AlwaysBeta

Python django 编程 日志 log

一想到有95%的问题还没解决,我就calm down了

赵新龙

科普 宇宙 后真相时代

中小企业如何做运维自动化?

外滩运维专家

运维 spug 运维自动化 jenkins ansible

PhotoShop切图,一篇文章就够用了

cwang

Web 工具 PhotoShop

汉字不能编程?别闹了,只是看着有点豪横!容易被开除!

小傅哥

spring 小傅哥 aop 汉字编程

比AtomicLong更优秀的LongAdder确定不来了解一下吗?

一枝花算不算浪漫

并发编程 jdk源码

JAVA内存模型与线程

颇风

Java 内存模型 JVM

Dart 进阶 | 深入理解 Function & Closure

LitaVadaski

flutter dart

一文带你了解 HTTP 黑科技

苹果看辽宁体育

大前端 HTTP

用原理认知世界,用情绪驱动行为

史方远

职场 心理 成长

《零基础学 Java》 FAQ 之 8-Java方法调用是传值还是传引用

臧萌

Java

英语学习中听和说的区别

董一凡

学习

华为“补洞”:去年重新设计超过6000万行代码

罗燕珊

华为 实体清单

MySQL事务解析

一个有志气的DB

MySQL 事务隔离级别 mysql事务

走进Golang之编译器原理

何磊

编译原理 Go 语言

如何发布一个npm包-创建,发布,更新,撤销及常见问题解决

Brave

npm

笔记:《如何系统思考》之如何应用系统思考

wiflish

思维方式

2020第一篇技术博客

java劝退师首席大弟子

生活

识别代码中的坏味道(二)

Page

Java 面向对象 复杂代码优化 重构 CleanCode

Android | Tangram动态页面之路(三)使用

哈利迪

android

新mac笔记本需要做的事情

好好学习

Mac

Jenkins权限管理

kcnf

如何搞定Kafka重复消费?

奈学教育

kafka kafka配置

键入网址后,其间发生了什么?

小林coding

TCP 计算机网络 网络协议 IP HTTP

回“疫”录(20):世界从来不会欺负听话的人

小天同学

疫情 回忆录 现实纪录 纪实

亚马逊为它们的语音识别API添加了更好粒度的控制_语言 & 开发_Margot Krouwer_InfoQ精选文章