7月31日，AWS技术峰会2019在北京举行，今年AWS技术峰会以「即刻构建」为主题，形象地阐释了云上服务的快捷性。

AWS副总裁、全球技术与开发者布道师团队伊恩 · 马辛哈姆

在开场演讲中，AWS副总裁、全球技术与开发者布道师团队伊恩 · 马辛哈姆（Ian Massingham）针对AWS的优势和技术进行了主题演讲，再次强调AWS的重点是提供给软件开发人员和构建者更多的工具，让开发者构建以及扩展自己的应用，重点分享了关于云迁移、微服务、数据库、分析、机器学习、IoT等方面的技术布局及最佳合作实践。

去年的re:Invent 2018峰会上，AWS就明确了2019年在AI方向主打的战略：通过平台和工具让开发人员低成本的完成项目开发、对机器学习推理服务的重视、对AI工具的开发和重视。本次峰会上，InfoQ很荣幸地采访到了AWS副总裁、全球技术与开发者布道师团队伊恩 · 马辛哈姆（Ian Massingham），并聚焦于AWS 机器学习板块和伊恩进行了交流。伊恩也在采访中透露，今年的re:Invent 2019还将在机器学习领域发布更多的重磅发布和新的消息。

回顾AWS在机器学习上的持续动作，可以看到其近几年的演进和革新，也可以窥见出其在Machine Learning这项技术上的推进思路：

2015年，AWS首次推出 Amazon Machine Learning服务；
2016年，AWS针对机器视觉和语音交互推出了Amazon Polly 、Amazon Rekognition等API；
2017年，AWS推出了一个更全面的机器学习平台Amazon SageMaker；
2018年，SageMaker新增200多种机器学习新功能和服务；
2019年，AWS推出SageMaker Neo，解决边缘设备运行的问题，推出深度学习容器对DeepLearning AMI进行补充；为提升机器学习推理速度，AWS Inferentia将在今年落地。

对于机器学习的火热，伊恩分享了自己的看法：一是因为机器学习平台、框架、软件的大量涌现，最近才能够让非政府的一些技术企业或者是非超大型企业也可以用得起机器学习；另一方面，云的发展让机器学习更容易，解决了需要大型计算设备以及数据不足的问题，有了云，数据的储存和计算变得更加方便，企业做机器学习方面的尝试成本就低得多了。

在AWS 机器学习的技术架构中，上层是托管的人工智能或机器学习的应用服务，底层包括计算、存储在内的基础架构，中间层则是框架接口以及平台服务，形成广泛且深入的功能集合的机器学习技术栈，整个架构构成了用户可快速在 AWS 构建机器学习服务的基石，SageMaker作为中间层承上启下的云机器学习平台，位置举足轻重。

对于SageMaker的作用，AWS希望让有能力去改进框架和算法的开发者，尽可能少花费精力在那些跟主业无关的事情上，例如数据准备、部署集群、安装框架等需要耗费大量精力的事情。

到今天，SageMaker的客户数量超过一万，AWS仍在不断充实完善它。伊恩特别强调了竞价实例，“ 我们最近给SageMaker做了一个事情，就是开发者可以用它的Spot Instance竞价实例，类似于实例现货市场，通过Spot Instance竞价实例实现打折，它要比按需订购的EC2的折扣力度大得多，可以用它来做模型的训练。” 另外对Ground Truth、SageMaker Neo、增强学习（RL）、DeepAR等，伊恩也进行了重点介绍推荐。

除此之外，伊恩透露，由AWS设计的、专用于机器学习的芯片——AWS Inferentia或将在今年年底面世。关于AWS在机器学习芯片方向的发力，伊恩表示，AWS看好机器学习在推理方向的发展，“事实上AWS开发硬件产品唯一的目的就是帮助客户降低他们使用技术的成本以及后期的运营成本，让开发人员能够更多的去使用这些机器学习的技术，为客户解决问题。“

对于SageMaker生态下一步计划，伊恩没有正面做回答，但是关于SageMaker最好的应用场景，伊恩提到了自己最喜欢的、来自美国一家电信商T-Mobile的应用案例。T-Mobile当前正在使用AWS的机器学习服务来提升自身的客户服务，其开发出一套用于自然语言理解的机器学习模型，能从大量文本数据中提取信息，包括每天数十万量级的传入客户请求，以及包含可能回答客户查询的答案的知识库。在前期数据标注的过程中，T-Mobile使用Ground Truth自动标记，然后通过机器学习模型预测哪些信息将满足特定客户的需求，实时为代理提供相关信息以确保快速准确地解决每个客户的问题。

“它会预测客户会打电话要什么样的服务，比如客户说我想问一下我的账单，后台就会了解一下客户账户的信息，通过出现的一些事件，一些合约签订等记录，用这样的数据来预测客户打进来可能最想问的是什么。然后，这个后台就能够有相应的人员和资源来应对这样的问答。比如，后台发现账单上一旦有错误，那代理之前就会知道，这个可能就是他想要问的问题。只有T-Mobile有这样自有的数据，它用Sagemaker来培训它的算法，所以机器学习用私有的数据来做训练其实是很主流的用途。“伊恩说。

创作场景

Amazon SageMaker 用户数量已过万，AWS 仍在不断充实完善它