开工福利|免费学 2200+ 精品线上课,企业成员人人可得! 了解详情
写点什么

亚马逊首席架构师的 AI 实践之路

  • 2018-01-04
  • 本文字数:2530 字

    阅读完需:约 8 分钟

导读:本次全球人工智能与机器学习技术大会(AICon)上,蔡超将带来题为《工程师的 AI 实践之路》的主题演讲,为全球技术人带来他本人在 AI 学习之路上的一些实践经验。在大会之前,AI 前线记者对蔡超进行了专访。

实践历练出的技能

蔡超自言从小对数学和计算机比较感兴趣,走上技术这条路也算得上是顺理成章。研究生时代,他选择了网络安全和密码学,也都是和数学相关。在国有银行、民营企业、外企都有过丰富工作经验的他,一直都没有离开过软件开发的岗位。从最普通的软件工程师一直做到今天的首席架构师。

机器学习是现在 AI 的主要内容,在蔡超看来,机器学习的本质就是从数据中找出 pattern(模式)。虽然蔡超在进入 AI 领域之前从事的多是移动设备管理系统以及安全系统的软件架构师等职位,但其实在工作中,他曾参与或主持做过的很多项目都和机器学习相关。只不过在之前,这一概念没有今天这般普及的时候,那些项目都没有被冠上“机器学习”这样的名字罢了,蔡超说:“在以前很多时候我们也用线性回归等去拟合,预测数据或是进行聚类,关联规则挖掘,不过那时大家并不十分强调自己使用了机器学习或 AI 技术,更多的是说数据挖掘 (Data Mining)。”

可以这么理解:他的专业技能是在实践中不断历炼出来的。这个实战中摸爬滚打出来的过来人,有一些小建议想要分享。

过来人的一点小建议和实践成果

人工智能在技术人当中的火爆程度已经很难用一般的词语来形容了,一项技术的火爆势必会带起相关产业的发展。为了帮助其他领域的技术人转型,各类人工智能网课、培训班拔地而起。有不少技术人都准备乘着 AI 的浪潮进行一番技术转型,但是条条大路通罗马,面对各种选择的分岔路,有些技术人犯了难,到底该选择什么样的路径进行 AI 转型?培训班?网课?或者如果时间允许就干脆考研?

转型方式花样繁多,蔡超本人最推荐的转型方式是 :首先自己学习一些基础知识,然后在真实项目中和这方面专家一起工作。 具体来说:通过书籍或是培训课程,可以学到基本原理。但是通常为了便于理解,书中的示例都是往往经过了简化和抽象的,所以你不会知道实际问题的分析和处理方式,以及 最重要的是如何甄别出那些可以用机器学习优化的问题。

蔡超告诉我们:“亚马逊更看中的是具有扎实基本工和快速学习能力的人才。”他认为,对于技术人员来说深入研究技术的本质及勇于实践不怕失败,并且善于从失败中学习是非常可贵的特质。

在成为一名 AI 实践者之后,除了自己的专业技能得到了提升,蔡超本人及其团队也取得了一些不错的成就。

近几年,蔡超带领亚马逊工程团队应用机器学习、深度学习技术在全球客服系统智能化,推荐系统本地化及合规性检测自动化等多个方面实现了大量的成功创新。

  1. 针对后端的客服人员,智能化客服系统可针对不同的客服问题进行分类,同时推荐相关资料、分析客户反馈信息,极大程度提高了客服人员的工作效率。
  2. 而针对亚马逊美国市场和中国市场的亚马逊客户的特点及亚马逊全球选品的优势,蔡超的技术团队对商品的推荐系统进行了优化。如大量的亚马逊用户都是图书消费者,通过推荐系统鼓励图书消费者的跨品类购买,帮助本地消费者在全球选品中找到心仪的产品。
  3. 对于网站所售商品,团队利用自然语言处理(Natural Language Processing)、计算机视觉(Computer Vision)、深度学习等技术实现对网站内容及所售商品的合规,合法性检查(如,广告法)的自动化。

蔡超介绍,以上系统在进行一些早期开发的过程当中,使用了 Keras+Tensorflow,新的项目基本使用 MXNet。

关于深度学习框架,蔡超也有自己的使用心得愿意分享给读者:“如何选择要根据你的实际情况,如果你是个初学者 Tensorflow 是比较好的选择,很容易找到大量的学习资料。而 MXNet 则有着较好的并行计算性能。当然如果你是 AWS 用户,那么最好使用 MXNet,AWS 官方支持了 MXNet,你可以在 AWS 的服务中方便的使用它,如 AWS Lambda。”

一点前瞻性想法

人工智能发展至今已经 60 个年头,在 2017 年迎来了它发展的第一个高峰,作为一个拥有多年实战经验的技术老兵,蔡超对于人工智能的未来也有一些自己的想法:

虽然近年 AI 取得很多令人振奋的成果,但我们也应该清楚的看到很多被人们津津乐道的成果都是在图像和语音领域,或者是一些相对封闭空间的问题(如:棋类对弈)。这些问题的定义相对简单,拥有大量数据,可以充分利用硬件计算能力取得的进步而获得进展。尤其在 AI 的很多本质性问题(可形式化,可计算性,认知与学习的关系等)上还需要有真正突破性进展。

在 AI 领域不断突破的过程里,总能看到亚马逊的身影。作为全球知名的技术大厂,亚马逊一直以 “Earth’s Most Customer-Centric Company(地球上最以用户为中心的企业)” 作为目标,据蔡超介绍,未来亚马逊将引领使用 AI 技术提升和创新用户线上及线下的体验。许多像蔡超这样,在实践中成长的 AI 技术人,必将成为 AI 大时代里的中流砥柱,我们期待越来越多的技术人加入 AI 实践者的队伍,用科技让世界更加美好。

作者介绍

蔡超,亚马逊中国研发中心首席架构师,拥有 15 年的软件开发经验,其中 9 年任世界级 IT 公司软件架构师 / 首席软件架构师。2010 年加入 亚马逊,曾领导开发了亚马逊全球的新外部直运(External Fulfillment)平台,亚马逊物流 + 系统及基于机器学习的亚马逊全球客服系统智能化项目。现做为亚马逊(中国)技术团队的首席架构师,领导中国团队通过机器学习,大数据及云计算新技术不断创新为中国客户打造更好的体验。

一个彩蛋

在文章开头我们说过,蔡超老师将参加全球人工智能与机器学习技术大会(AICon),届时,蔡超老师会带来更多精彩分享,可到现场与他面对面交流探讨。大会将于2018 年1 月13-14 在北京盛大开幕,来自Google、Snap、Etsy、BAT、360、小米、京东等40+ 公司AI 技术负责人也将前来分享他们的机器学习落地实践经验,希望对你有所帮助。

更多大会精彩内容,欢迎点击官网详细了解!

目前大会倒计时4 天报名进行中,如在报名中遇到任何问题,敬请咨询票务经理豆包,电话:18514549229,微信:18514549229,QQ:209463896


感谢陈思对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2018-01-04 18:003777

评论

发布
暂无评论
发现更多内容

中国人寿业务稳定性保障:“1+1+N” 落地生产全链路压测

TakinTalks稳定性社区

怎么编写接口测试用例?

Liam

测试用例 如何编写测试 测试用例设计

袋鼠云产品功能更新报告04期丨2023年首次,产品升级“狂飙”

袋鼠云数栈

【2.10-2.17】写作社区优秀技术博文一览

InfoQ写作社区官方

热门活动 优质创作周报

ChatGPT 最好的替代品

图灵社区

机器学习 Transformer BERT ChatGPT

软件测试 | App控件交互

测吧(北京)科技有限公司

测试

谈JVM参数GC线程数ParallelGCThreads合理性设置

京东科技开发者

线程 JVM cpu GC线程 ParallelGCThreads

软件测试 | 录制Appium测试用例

测吧(北京)科技有限公司

测试

软件测试 | App控件定位

测吧(北京)科技有限公司

测试

设计模式第七讲-外观模式、适配器模式、模板方法模式详解

C++后台开发

设计模式 后端开发 Linux服务器开发 适配器模式 C++开发

机器学习洞察 | 一文带你“讲透” JAX

亚马逊云科技 (Amazon Web Services)

软件测试 | adb命令的组成

测吧(北京)科技有限公司

测试

软件测试 | App常见Bug解析

测吧(北京)科技有限公司

测试

软件测试 | 元素定位方式与隐式等待

测吧(北京)科技有限公司

测试

软件测试 | 触屏操作测试自动化

测吧(北京)科技有限公司

测试

一卡通|多云流量监控支撑To C+To B,双向高效运维

智维数据

大数据 数据可视化 智能运维 运维安全

ChatGPT搜索风暴

OneFlow

人工智能 深度学习

实现“无感知”的网络运维,新华社融媒体流量分析平台的创新之路

智维数据

大数据 防火墙 数据可视化 智能运维 运维安全

软件测试 | 高级定位技巧

测吧(北京)科技有限公司

测试

@所有人,OceanBase DevCon • 2023来啦!

OceanBase 数据库

数据库 oceanbase

模块6 拆分电商系统为微服务

KING

拜占庭将军问题和 Raft 共识算法讲解

京东科技开发者

算法 分布式系统 拜占庭将军问题 raft共识算法 日志同步

可靠、安全、稳定,开源高质量项目 | 亚马逊的开源文化

亚马逊云科技 (Amazon Web Services)

3dmax的常用功能和使用方法

Finovy Cloud

3D渲染 3DMAX

ChatGPT 最好的替代品

图灵教育

机器学习 BERT ChatGPT

OceanBase 4.0解读:兼顾高效与透明,我们对DDL的设计与思考

OceanBase 数据库

数据库 oceanbase

理论+实践,揭秘昇腾CANN算子开发

华为云开发者联盟

人工智能 AI 华为云 企业号 2 月 PK 榜 华为云开发者联盟

基于 Flink 的小米数据集成实践

Apache Flink

大数据 flink 实时计算

Slurm集群调度策略详解(2)-回填调度

慕冰

Slurm 回填调度

软件测试 | Appium架构介绍与环境配置

测吧(北京)科技有限公司

测试

4道数学题,求解极狐GitLab CI 流水线|第2&3题:父子流水线 + 多项目流水线

极狐GitLab

ci DevOps pipeline 极狐GitLab 流水线

亚马逊首席架构师的AI实践之路_语言 & 开发_蔡超_InfoQ精选文章