AICon上海|与字节、阿里、腾讯等企业共同探索Agent 时代的落地应用 了解详情
写点什么

Amazon SageMaker 用户数量已过万,AWS 仍在不断充实完善它

  • 2019-08-05
  • 本文字数:1932 字

    阅读完需:约 6 分钟

Amazon SageMaker 用户数量已过万,AWS 仍在不断充实完善它

7 月 31 日,AWS技术峰会2019在北京举行,今年 AWS 技术峰会以「即刻构建」为主题,形象地阐释了云上服务的快捷性。



AWS 副总裁、全球技术与开发者布道师团队伊恩 · 马辛哈姆


在开场演讲中,AWS 副总裁、全球技术与开发者布道师团队伊恩 · 马辛哈姆(Ian Massingham)针对 AWS 的优势和技术进行了主题演讲,再次强调 AWS 的重点是提供给软件开发人员和构建者更多的工具,让开发者构建以及扩展自己的应用,重点分享了关于云迁移、微服务、数据库、分析、机器学习、IoT 等方面的技术布局及最佳合作实践。


去年的 re:Invent 2018 峰会上,AWS 就明确了 2019 年在 AI 方向主打的战略:通过平台和工具让开发人员低成本的完成项目开发、对机器学习推理服务的重视、对 AI 工具的开发和重视。本次峰会上,InfoQ 很荣幸地采访到了 AWS 副总裁、全球技术与开发者布道师团队 伊恩 · 马辛哈姆(Ian Massingham),并聚焦于 AWS 机器学习板块和伊恩进行了交流。伊恩也在采访中透露,今年的 re:Invent 2019 还将在机器学习领域发布更多的重磅发布和新的消息。


回顾 AWS 在机器学习上的持续动作,可以看到其近几年的演进和革新,也可以窥见出其在 Machine Learning 这项技术上的推进思路:


  • 2015 年,AWS 首次推出 Amazon Machine Learning 服务;

  • 2016 年,AWS 针对机器视觉和语音交互推出了 Amazon Polly 、Amazon Rekognition 等 API;

  • 2017 年,AWS 推出了一个更全面的机器学习平台Amazon SageMaker

  • 2018 年,SageMaker 新增 200 多种机器学习新功能和服务;

  • 2019 年,AWS 推出 SageMaker Neo,解决边缘设备运行的问题,推出深度学习容器对 DeepLearning AMI 进行补充;为提升机器学习推理速度,AWS Inferentia 将在今年落地。


对于机器学习的火热,伊恩分享了自己的看法:一是因为机器学习平台、框架、软件的大量涌现,最近才能够让非政府的一些技术企业或者是非超大型企业也可以用得起机器学习;另一方面,云的发展让机器学习更容易,解决了需要大型计算设备以及数据不足的问题,有了云,数据的储存和计算变得更加方便,企业做机器学习方面的尝试成本就低得多了。


在 AWS 机器学习的技术架构中,上层是托管的人工智能或机器学习的应用服务,底层包括计算、存储在内的基础架构,中间层则是框架接口以及平台服务,形成广泛且深入的功能集合的机器学习技术栈,整个架构构成了用户可快速在 AWS 构建机器学习服务的基石,SageMaker 作为中间层承上启下的云机器学习平台,位置举足轻重。


对于 SageMaker 的作用,AWS 希望让有能力去改进框架和算法的开发者,尽可能少花费精力在那些跟主业无关的事情上,例如数据准备、部署集群、安装框架等需要耗费大量精力的事情。


到今天,SageMaker 的客户数量超过一万,AWS 仍在不断充实完善它。伊恩特别强调了竞价实例,“ 我们最近给 SageMaker 做了一个事情,就是开发者可以用它的 Spot Instance 竞价实例,类似于实例现货市场,通过 Spot Instance 竞价实例实现打折,它要比按需订购的 EC2 的折扣力度大得多,可以用它来做模型的训练。” 另外对 Ground Truth、SageMaker Neo、增强学习(RL)、DeepAR 等,伊恩也进行了重点介绍推荐。


除此之外,伊恩透露,由 AWS 设计的、专用于机器学习的芯片——AWS Inferentia或将在今年年底面世。关于 AWS 在机器学习芯片方向的发力,伊恩表示,AWS 看好机器学习在推理方向的发展,“事实上 AWS 开发硬件产品唯一的目的就是帮助客户降低他们使用技术的成本以及后期的运营成本,让开发人员能够更多的去使用这些机器学习的技术,为客户解决问题。“


对于 SageMaker 生态下一步计划,伊恩没有正面做回答,但是关于 SageMaker 最好的应用场景,伊恩提到了自己最喜欢的、来自美国一家电信商 T-Mobile 的应用案例。T-Mobile 当前正在使用 AWS 的机器学习服务来提升自身的客户服务,其开发出一套用于自然语言理解的机器学习模型,能从大量文本数据中提取信息,包括每天数十万量级的传入客户请求,以及包含可能回答客户查询的答案的知识库。在前期数据标注的过程中,T-Mobile 使用 Ground Truth 自动标记,然后通过机器学习模型预测哪些信息将满足特定客户的需求,实时为代理提供相关信息以确保快速准确地解决每个客户的问题。


“它会预测客户会打电话要什么样的服务,比如客户说我想问一下我的账单,后台就会了解一下客户账户的信息,通过出现的一些事件,一些合约签订等记录,用这样的数据来预测客户打进来可能最想问的是什么。然后,这个后台就能够有相应的人员和资源来应对这样的问答。比如,后台发现账单上一旦有错误,那代理之前就会知道,这个可能就是他想要问的问题。只有 T-Mobile 有这样自有的数据,它用 Sagemaker 来培训它的算法,所以机器学习用私有的数据来做训练其实是很主流的用途。“伊恩说。


2019-08-05 17:597038
用户头像
王利莹 InfoQ编辑

发布了 48 篇内容, 共 18.8 次阅读, 收获喜欢 36 次。

关注

评论

发布
暂无评论
发现更多内容

MySQL索引问题探究手记

架构精进之路

MySQL 索引

Java-技术专题-synchronized关键字

码界西柚

如果你每次面试前都要去背一篇Spring中Bean的生命周期,请看完这篇文章

程序员DMZ

spring 生命周期

自从有了语音开黑小能手,队友再也不会骂我了!

anyRTC开发者

WebRTC 在线教育 直播 RTC RTMP

云上安全工作乱如麻,等保2.0来一下

华为云开发者联盟

安全 华为云 等保 云平台 多云服务

钓鱼网站:详解hosts文件

xcbeyond

Java 域名解析 hosts

MySQL关于日期为零值的处理

Simon

MySQL

ARTS week 4

锈蠢刀

影响音视频延迟的关键因素(一):流媒体系统

ZEGO即构

TCP udp RTC HLS RTMP

CRM往事丨三件事,所有SaaS的缩影

人称T客

跨域问题(CORS / Access-Control-Allow-Origin)

xcbeyond

Java CORS 跨域

易观郭炜:流动水系数造未来

易观大数据

为啥PHP in_array(0,['a', 'b', 'c']) 返回为true?

架构精进之路

php 弱类型语言

一个数据库管理员的自我救赎之路

华为云开发者联盟

数据库 华为云 数据库迁移 企业上云 DRS

SpringCloud服务注册中心双节点集群(Eureka集群)

xcbeyond

Java 架构 微服务 Eureka 集群

SWARM学习1——Kademlia分布式路由表协议

AIbot

区块链 DHT 分布式存储 分布式文件存储 分布式路由

实践案例丨教你一键构建部署发布前端和Node.js服务

华为云开发者联盟

node.js 后端 服务器 代码 华为云鲲鹏

关于日期及时间字段的查询

Simon

MySQL sql查询

是时候学习Linux了

Simon

Linux

枚举算法练习例题(Python版)

罗罗诺亚

Python 算法 枚举

程序范式的意义

soolaugust

架构 程序设计

低/零代码干掉了传统的开发模式

代码制造者

编程语言 低代码 零代码 信息化 编程开发

恢复青春气息,就靠这套人像美肤算法了

博文视点Broadview

算法 计算机视觉 图像识别 人像

操作系统bochs安装及使用

allworldg

操作系统

我的敏捷历程 —— 兼评《敏捷整洁之道 - 回归本源》

FollowFlow

敏捷开发 Agile 极限编程 XP

区块链、人工智能……警惕非法金融借创新概念迷惑投资人

CECBC

区块链 金融

MySQL5.7升级到8.0过程详解

Simon

MySQL

spring Cloud Eureka Rest接口重写

xcbeyond

Java SpringCloud Eureka

面试必杀技,讲一讲Spring中的循环依赖

程序员DMZ

spring

面试官:你说你懂i++跟++i的区别,那你知道下面这段代码的运行结果吗?

程序员DMZ

JVM i++

海量并发也没那么可怕,运维准点下班全靠它!

华为云开发者联盟

容器 网络 并发 华为云

Amazon SageMaker 用户数量已过万,AWS 仍在不断充实完善它_服务革新_王利莹_InfoQ精选文章