7 月 31 日,AWS技术峰会2019在北京举行,今年 AWS 技术峰会以「即刻构建」为主题,形象地阐释了云上服务的快捷性。
AWS 副总裁、全球技术与开发者布道师团队伊恩 · 马辛哈姆
在开场演讲中,AWS 副总裁、全球技术与开发者布道师团队伊恩 · 马辛哈姆(Ian Massingham)针对 AWS 的优势和技术进行了主题演讲,再次强调 AWS 的重点是提供给软件开发人员和构建者更多的工具,让开发者构建以及扩展自己的应用,重点分享了关于云迁移、微服务、数据库、分析、机器学习、IoT 等方面的技术布局及最佳合作实践。
去年的 re:Invent 2018 峰会上,AWS 就明确了 2019 年在 AI 方向主打的战略:通过平台和工具让开发人员低成本的完成项目开发、对机器学习推理服务的重视、对 AI 工具的开发和重视。本次峰会上,InfoQ 很荣幸地采访到了 AWS 副总裁、全球技术与开发者布道师团队 伊恩 · 马辛哈姆(Ian Massingham),并聚焦于 AWS 机器学习板块和伊恩进行了交流。伊恩也在采访中透露,今年的 re:Invent 2019 还将在机器学习领域发布更多的重磅发布和新的消息。
回顾 AWS 在机器学习上的持续动作,可以看到其近几年的演进和革新,也可以窥见出其在 Machine Learning 这项技术上的推进思路:
2015 年,AWS 首次推出 Amazon Machine Learning 服务;
2016 年,AWS 针对机器视觉和语音交互推出了 Amazon Polly 、Amazon Rekognition 等 API;
2017 年,AWS 推出了一个更全面的机器学习平台Amazon SageMaker;
2018 年,SageMaker 新增 200 多种机器学习新功能和服务;
2019 年,AWS 推出 SageMaker Neo,解决边缘设备运行的问题,推出深度学习容器对 DeepLearning AMI 进行补充;为提升机器学习推理速度,AWS Inferentia 将在今年落地。
对于机器学习的火热,伊恩分享了自己的看法:一是因为机器学习平台、框架、软件的大量涌现,最近才能够让非政府的一些技术企业或者是非超大型企业也可以用得起机器学习;另一方面,云的发展让机器学习更容易,解决了需要大型计算设备以及数据不足的问题,有了云,数据的储存和计算变得更加方便,企业做机器学习方面的尝试成本就低得多了。
在 AWS 机器学习的技术架构中,上层是托管的人工智能或机器学习的应用服务,底层包括计算、存储在内的基础架构,中间层则是框架接口以及平台服务,形成广泛且深入的功能集合的机器学习技术栈,整个架构构成了用户可快速在 AWS 构建机器学习服务的基石,SageMaker 作为中间层承上启下的云机器学习平台,位置举足轻重。
对于 SageMaker 的作用,AWS 希望让有能力去改进框架和算法的开发者,尽可能少花费精力在那些跟主业无关的事情上,例如数据准备、部署集群、安装框架等需要耗费大量精力的事情。
到今天,SageMaker 的客户数量超过一万,AWS 仍在不断充实完善它。伊恩特别强调了竞价实例,“ 我们最近给 SageMaker 做了一个事情,就是开发者可以用它的 Spot Instance 竞价实例,类似于实例现货市场,通过 Spot Instance 竞价实例实现打折,它要比按需订购的 EC2 的折扣力度大得多,可以用它来做模型的训练。” 另外对 Ground Truth、SageMaker Neo、增强学习(RL)、DeepAR 等,伊恩也进行了重点介绍推荐。
除此之外,伊恩透露,由 AWS 设计的、专用于机器学习的芯片——AWS Inferentia或将在今年年底面世。关于 AWS 在机器学习芯片方向的发力,伊恩表示,AWS 看好机器学习在推理方向的发展,“事实上 AWS 开发硬件产品唯一的目的就是帮助客户降低他们使用技术的成本以及后期的运营成本,让开发人员能够更多的去使用这些机器学习的技术,为客户解决问题。“
对于 SageMaker 生态下一步计划,伊恩没有正面做回答,但是关于 SageMaker 最好的应用场景,伊恩提到了自己最喜欢的、来自美国一家电信商 T-Mobile 的应用案例。T-Mobile 当前正在使用 AWS 的机器学习服务来提升自身的客户服务,其开发出一套用于自然语言理解的机器学习模型,能从大量文本数据中提取信息,包括每天数十万量级的传入客户请求,以及包含可能回答客户查询的答案的知识库。在前期数据标注的过程中,T-Mobile 使用 Ground Truth 自动标记,然后通过机器学习模型预测哪些信息将满足特定客户的需求,实时为代理提供相关信息以确保快速准确地解决每个客户的问题。
“它会预测客户会打电话要什么样的服务,比如客户说我想问一下我的账单,后台就会了解一下客户账户的信息,通过出现的一些事件,一些合约签订等记录,用这样的数据来预测客户打进来可能最想问的是什么。然后,这个后台就能够有相应的人员和资源来应对这样的问答。比如,后台发现账单上一旦有错误,那代理之前就会知道,这个可能就是他想要问的问题。只有 T-Mobile 有这样自有的数据,它用 Sagemaker 来培训它的算法,所以机器学习用私有的数据来做训练其实是很主流的用途。“伊恩说。
评论