写点什么

Amazon Web 服务开展机器学习服务

  • 2015-04-20
  • 本文字数:1259 字

    阅读完需:约 4 分钟

Amazon Web 服务最近启动了一项机器学习的服务,使用户可以在云端学习预测模型了。主流云服务供应商中的Google 和微软分别推出了预测API 和Azure 机器学习的项目,Amazon 在最近也紧随其后开展了类似的服务。

该服务目前提供的学习模型与应用于许多大规模学习应用的模型相似,而且可以可视化地呈现出学习模型的基础数据统计和性能预测,但是在弹性、数据导入导出、自动模型参数调优等方面仍然有一些限制。

在过去几年中,陆续涌现出许多帮助简化数据分析工作的服务和产品。其中一些为用户屏蔽了绝大多数复杂的功能,以力图精简,而另一些则极力为专家用户提供一套更加完备的数据解析工具集。

Amazon 所提供的属于第一类服务。这套服务只处理预测问题,目前其应用的学习算法我们尚不得知,但是它提供的功能与 vowpal wabbit 极为相似,VW 是 Jon Langford 基于随机梯度下降算法开发的快速机器学习算法。这个算法通过将数据有序地输入模型,并基于观察到的测量误差来自我调节,本质上来说,这个算法难以并行化运行,但它极为高效,并且消耗的内存极为有限。因此,许多大规模应用都采用了这个算法(用于像 Google 广告点击预测这样的业务中)。

此外,Amazon 机器学习服务可以为每个功能的训练数据计算基本统计信息,将学习模型的性能预测数据可视化。这两个功能允许用户检查数据并更好地理解习得的预测模型。最后,服务中还有一些进行简单数据转换的基本功能,例如提取功能,或者把文本数据转为 n-gram 的表现形式。

当然,Amazon 还规定了一些限制条款。所有数据必须驻留在 Amazon S3 存储服务或 Redshift 数据库中,整个过程不能导入和导出学习模型。如果你需要为模型添加自动训练功能,或者通过并行地评估诸多模型变量来调整模型参数,那么很抱歉,尽管这些功能非常有价值,但是 Amazon 服务不支持这些功能。

第一手的评论指出,该系统的性能与在本地使用笔记本运行类似vowpal wabbit 这样的工具相比略有不足。

Google 于 2010 年启动了预测API 服务,它提供的同样是精简过的机器学习服务。它只解决预测问题,不处理那些更复杂的问题,比如推荐或无监督学习方法(类似聚类)。操作接口基本上只允许你上传数据,进行训练,评估模型,以及用存储模型来计算预测。

与之相反,微软的 Azure 机器学习项目提供了更加丰富的接口,面向更专业的用户群。它公开了所使用的各种学习算法,用户可以构建更加复杂的功能转换管道,甚至可以结合 R 语言脚本来用。这里有 PredictionIO 以及 GraphLab Create 两个示例。

Apache Spark 同样开发了一个机器学习库,举个例子,其可以用于在云端通过 databricks 云来执行复杂的可伸缩数据分析。

查看英文原文: Amazon Web Services launches Machine Learning Service


感谢夏雪对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流。

立即免费注册 AWS 账号,获得 12 个月免费套餐:点击注册

有云计算问题?立刻联系 AWS 云计算专家:立即联系

2015-04-20 06:491876
用户头像

发布了 63 篇内容, 共 132.9 次阅读, 收获喜欢 38 次。

关注

评论

发布
暂无评论
发现更多内容

你分库分表的姿势对么?——详谈水平分库分表

vivo互联网技术

MySQL 分库分表 hash Range 数据库表

Java ArrayList 与 LinkedList

码语者

Java

首例“微服务+国产分布式数据库”架构,TDSQL助力昆山农商行换“心”

腾讯云数据库

数据库 tdsql

SoFlu,让 DevOps 更进一步

SoFlu软件机器人

DevOps 敏捷开发

农业CRM系统帮助建设新农村和休闲农业

低代码小观

系统 CRM 农业 管理工具 农业管理

TDSQL助力建设数字政务

腾讯云数据库

数据库 tdsql

你的 APP 能否精准「推送」击中用户?!

融云 RongCloud

消息推送 双十一

如何轻松集成多厂家推送服务

融云 RongCloud

消息推送

低代码平台的爆火,会导致程序员失业吗?

J2PaaS低代码平台

低代码 低代码开发 低代码平台

从小公司到大厂,从8K到30K-一个iOS开发的艰辛路程

iOSer

ios iOS面试

自定义View:measureChildWidthMargins

Changing Lin

10月月更

在阿里云ECS服务器上部署OpenVPN

wong

Centos 7 OpenVPN ECS

徐州等保测评公司有哪些?联系电话是多少?在哪里?

行云管家

网络安全 等级保护 过等保 徐州

微信业务架构图和学生管理系统架构

Geek_cb2b43

腾讯云数据库TDSQL PG版重磅升级:查询性能提升百倍

腾讯云数据库

tdsql

明道云在建筑工程行业的应用场景

明道云

实时通信全链路质量追踪与指标体系构建

融云 RongCloud

通信云 Qoe

移动CRM软件是销售人员必备办公工具

低代码小观

管理 软件 移动 CRM CRM系统

Requires: libc.so.6(GLIBC_2.14)(64bit)错误解决方法

杨清强

浅谈云上攻防——CVE-2020-8562漏洞为k8s带来的安全挑战

腾讯安全云鼎实验室

漏洞分析

Java面试过了京东五面之后,发现掌握了这些技术也没有那么难

Java 编程 程序员 面试

告别传统压测:全链路压测在中通的实践分享

TakinTalks稳定性社区

全链路压测 系统稳定高可用 性能压测 电商大促 系统保障

【活动报名】首次 「Apache ShardingSphere Dev Meetup 」期待你的参与!

SphereEx

开源 ShardingSphere 技术沙龙 Meetup SphereEx

按照网络规模来分,服务器分为哪几类?

行云管家

云计算 网络 服务器 IT运维

TDSQL:解锁数据库前沿技术要点 | 腾讯云数据库DTCC 2021亮点回顾

腾讯云数据库

tdsql

5G、元宇宙和被重新定义的社交出海

融云 RongCloud

恒源云(GpuShare)_训练指引

恒源云

深度学习

「The Data Way」1024 特别节目|一线工程师的开源路

SphereEx

开源 开源社区 开源青年

新里程碑!TDSQL金融核心系统客户数国内领先

腾讯云数据库

tdsql

微信的业务架构图

张平

架构实战营

阿里JAVA架构师面试136题含答案:JVM+spring+分布式+并发编程!

Java 编程 程序员 面试

Amazon Web服务开展机器学习服务_服务革新_Mikio Braun_InfoQ精选文章