写点什么

Amazon Web 服务开展机器学习服务

  • 2015-04-20
  • 本文字数:1259 字

    阅读完需:约 4 分钟

Amazon Web 服务最近启动了一项机器学习的服务,使用户可以在云端学习预测模型了。主流云服务供应商中的Google 和微软分别推出了预测API 和Azure 机器学习的项目,Amazon 在最近也紧随其后开展了类似的服务。

该服务目前提供的学习模型与应用于许多大规模学习应用的模型相似,而且可以可视化地呈现出学习模型的基础数据统计和性能预测,但是在弹性、数据导入导出、自动模型参数调优等方面仍然有一些限制。

在过去几年中,陆续涌现出许多帮助简化数据分析工作的服务和产品。其中一些为用户屏蔽了绝大多数复杂的功能,以力图精简,而另一些则极力为专家用户提供一套更加完备的数据解析工具集。

Amazon 所提供的属于第一类服务。这套服务只处理预测问题,目前其应用的学习算法我们尚不得知,但是它提供的功能与 vowpal wabbit 极为相似,VW 是 Jon Langford 基于随机梯度下降算法开发的快速机器学习算法。这个算法通过将数据有序地输入模型,并基于观察到的测量误差来自我调节,本质上来说,这个算法难以并行化运行,但它极为高效,并且消耗的内存极为有限。因此,许多大规模应用都采用了这个算法(用于像 Google 广告点击预测这样的业务中)。

此外,Amazon 机器学习服务可以为每个功能的训练数据计算基本统计信息,将学习模型的性能预测数据可视化。这两个功能允许用户检查数据并更好地理解习得的预测模型。最后,服务中还有一些进行简单数据转换的基本功能,例如提取功能,或者把文本数据转为 n-gram 的表现形式。

当然,Amazon 还规定了一些限制条款。所有数据必须驻留在 Amazon S3 存储服务或 Redshift 数据库中,整个过程不能导入和导出学习模型。如果你需要为模型添加自动训练功能,或者通过并行地评估诸多模型变量来调整模型参数,那么很抱歉,尽管这些功能非常有价值,但是 Amazon 服务不支持这些功能。

第一手的评论指出,该系统的性能与在本地使用笔记本运行类似vowpal wabbit 这样的工具相比略有不足。

Google 于 2010 年启动了预测API 服务,它提供的同样是精简过的机器学习服务。它只解决预测问题,不处理那些更复杂的问题,比如推荐或无监督学习方法(类似聚类)。操作接口基本上只允许你上传数据,进行训练,评估模型,以及用存储模型来计算预测。

与之相反,微软的 Azure 机器学习项目提供了更加丰富的接口,面向更专业的用户群。它公开了所使用的各种学习算法,用户可以构建更加复杂的功能转换管道,甚至可以结合 R 语言脚本来用。这里有 PredictionIO 以及 GraphLab Create 两个示例。

Apache Spark 同样开发了一个机器学习库,举个例子,其可以用于在云端通过 databricks 云来执行复杂的可伸缩数据分析。

查看英文原文: Amazon Web Services launches Machine Learning Service


感谢夏雪对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流。

立即免费注册 AWS 账号,获得 12 个月免费套餐:点击注册

有云计算问题?立刻联系 AWS 云计算专家:立即联系

2015-04-20 06:492019
用户头像

发布了 63 篇内容, 共 134.3 次阅读, 收获喜欢 38 次。

关注

评论

发布
暂无评论
发现更多内容

面试官:Kafka和ES选主有什么区别?

王磊

Java 面试

海外客户获取难?海外云手机助力电商营销引流!

Ogcloud

云手机 海外云手机 云手机海外版 电商云手机 跨境云手机

云PBX的介绍

cts喜友科技

通信 通讯 云pbx 云通讯

2024南京国际消费电子展览会

AIOTE智博会

消费电子展会 消费电子博览会

极盾故事|“账号在非常用IP、非工作时间频繁访问敏感数据”,某品牌咖啡是这样处理的!

极盾科技

数据集成之任务调度模式 v0.7

LIEN

开源 数据仓库 数据集成 业务融合 API对接

探索Garnet:微软开源的高性能分布式缓存存储系统

gogo

【OCI系列】走进甲骨文云服务器:打造专属的云资源管理空间

极客天地

智启未来:TinyEngine 低代码引擎版本更新,畅享升级体验

OpenTiny社区

开源 前端 低代码 web开发

解密通义灵码:软件研发工具的“大脑”

阿里巴巴云原生

阿里云 云原生

Debezium vs OGG vs Tapdata:如何实时同步 Oracle 数据到 Kafka 消息队列?

tapdata

同步 Oracle 数据到 Kafka Oracle 到 Kafka Kafka 数据同步方案 Oracle 数据同步工具

软件测试学习笔记丨Pytest–Fixture特点及优势

测试人

软件测试

生成大边界不重复随机整数

waitmoon

伪随机函数 随机数

从 Linux 内核角度探秘 JDK MappedByteBuffer

不在线第一只蜗牛

Linux 测试

云原生最佳实践系列2:基于 MSE 云原生网关同城多活

阿里巴巴云原生

阿里云 云原生 云原生网关

图扑物联赋能港口智能照明

图扑物联

工业物联网 智慧港口 智能照明 web组态软件 云组态

解锁第五代英特尔至强的AI“秘籍”:CPU也能运行大模型推理

E科讯

数据库与低代码:重塑软件开发的新范式

不在线第一只蜗牛

数据库 低代码 数据可视化

万界星空科技商业开源MES,技术支持+项目合作

万界星空科技

开源 mes 开源mes 万界星空科技 商业开源

盘点|《数据安全法》的26部配套立法(附下载)

极盾科技

数据安全

[每日秒懂] 软件工程

dinstone

DevOps 敏捷开发 软件工程 持续交付 持续部署

【OCI系列】走进甲骨文云服务器:– Console

极客天地

外贸独立站怎么搭建?

九凌网络

Amazon Web服务开展机器学习服务_服务革新_Mikio Braun_InfoQ精选文章