QCon北京「鸿蒙专场」火热来袭!即刻报名,与创新同行~ 了解详情
写点什么

亚马逊首席架构师的 AI 实践之路

  • 2018-01-04
  • 本文字数:2530 字

    阅读完需:约 8 分钟

导读:本次全球人工智能与机器学习技术大会(AICon)上,蔡超将带来题为《工程师的 AI 实践之路》的主题演讲,为全球技术人带来他本人在 AI 学习之路上的一些实践经验。在大会之前,AI 前线记者对蔡超进行了专访。

实践历练出的技能

蔡超自言从小对数学和计算机比较感兴趣,走上技术这条路也算得上是顺理成章。研究生时代,他选择了网络安全和密码学,也都是和数学相关。在国有银行、民营企业、外企都有过丰富工作经验的他,一直都没有离开过软件开发的岗位。从最普通的软件工程师一直做到今天的首席架构师。

机器学习是现在 AI 的主要内容,在蔡超看来,机器学习的本质就是从数据中找出 pattern(模式)。虽然蔡超在进入 AI 领域之前从事的多是移动设备管理系统以及安全系统的软件架构师等职位,但其实在工作中,他曾参与或主持做过的很多项目都和机器学习相关。只不过在之前,这一概念没有今天这般普及的时候,那些项目都没有被冠上“机器学习”这样的名字罢了,蔡超说:“在以前很多时候我们也用线性回归等去拟合,预测数据或是进行聚类,关联规则挖掘,不过那时大家并不十分强调自己使用了机器学习或 AI 技术,更多的是说数据挖掘 (Data Mining)。”

可以这么理解:他的专业技能是在实践中不断历炼出来的。这个实战中摸爬滚打出来的过来人,有一些小建议想要分享。

过来人的一点小建议和实践成果

人工智能在技术人当中的火爆程度已经很难用一般的词语来形容了,一项技术的火爆势必会带起相关产业的发展。为了帮助其他领域的技术人转型,各类人工智能网课、培训班拔地而起。有不少技术人都准备乘着 AI 的浪潮进行一番技术转型,但是条条大路通罗马,面对各种选择的分岔路,有些技术人犯了难,到底该选择什么样的路径进行 AI 转型?培训班?网课?或者如果时间允许就干脆考研?

转型方式花样繁多,蔡超本人最推荐的转型方式是 :首先自己学习一些基础知识,然后在真实项目中和这方面专家一起工作。 具体来说:通过书籍或是培训课程,可以学到基本原理。但是通常为了便于理解,书中的示例都是往往经过了简化和抽象的,所以你不会知道实际问题的分析和处理方式,以及 最重要的是如何甄别出那些可以用机器学习优化的问题。

蔡超告诉我们:“亚马逊更看中的是具有扎实基本工和快速学习能力的人才。”他认为,对于技术人员来说深入研究技术的本质及勇于实践不怕失败,并且善于从失败中学习是非常可贵的特质。

在成为一名 AI 实践者之后,除了自己的专业技能得到了提升,蔡超本人及其团队也取得了一些不错的成就。

近几年,蔡超带领亚马逊工程团队应用机器学习、深度学习技术在全球客服系统智能化,推荐系统本地化及合规性检测自动化等多个方面实现了大量的成功创新。

  1. 针对后端的客服人员,智能化客服系统可针对不同的客服问题进行分类,同时推荐相关资料、分析客户反馈信息,极大程度提高了客服人员的工作效率。
  2. 而针对亚马逊美国市场和中国市场的亚马逊客户的特点及亚马逊全球选品的优势,蔡超的技术团队对商品的推荐系统进行了优化。如大量的亚马逊用户都是图书消费者,通过推荐系统鼓励图书消费者的跨品类购买,帮助本地消费者在全球选品中找到心仪的产品。
  3. 对于网站所售商品,团队利用自然语言处理(Natural Language Processing)、计算机视觉(Computer Vision)、深度学习等技术实现对网站内容及所售商品的合规,合法性检查(如,广告法)的自动化。

蔡超介绍,以上系统在进行一些早期开发的过程当中,使用了 Keras+Tensorflow,新的项目基本使用 MXNet。

关于深度学习框架,蔡超也有自己的使用心得愿意分享给读者:“如何选择要根据你的实际情况,如果你是个初学者 Tensorflow 是比较好的选择,很容易找到大量的学习资料。而 MXNet 则有着较好的并行计算性能。当然如果你是 AWS 用户,那么最好使用 MXNet,AWS 官方支持了 MXNet,你可以在 AWS 的服务中方便的使用它,如 AWS Lambda。”

一点前瞻性想法

人工智能发展至今已经 60 个年头,在 2017 年迎来了它发展的第一个高峰,作为一个拥有多年实战经验的技术老兵,蔡超对于人工智能的未来也有一些自己的想法:

虽然近年 AI 取得很多令人振奋的成果,但我们也应该清楚的看到很多被人们津津乐道的成果都是在图像和语音领域,或者是一些相对封闭空间的问题(如:棋类对弈)。这些问题的定义相对简单,拥有大量数据,可以充分利用硬件计算能力取得的进步而获得进展。尤其在 AI 的很多本质性问题(可形式化,可计算性,认知与学习的关系等)上还需要有真正突破性进展。

在 AI 领域不断突破的过程里,总能看到亚马逊的身影。作为全球知名的技术大厂,亚马逊一直以 “Earth’s Most Customer-Centric Company(地球上最以用户为中心的企业)” 作为目标,据蔡超介绍,未来亚马逊将引领使用 AI 技术提升和创新用户线上及线下的体验。许多像蔡超这样,在实践中成长的 AI 技术人,必将成为 AI 大时代里的中流砥柱,我们期待越来越多的技术人加入 AI 实践者的队伍,用科技让世界更加美好。

作者介绍

蔡超,亚马逊中国研发中心首席架构师,拥有 15 年的软件开发经验,其中 9 年任世界级 IT 公司软件架构师 / 首席软件架构师。2010 年加入 亚马逊,曾领导开发了亚马逊全球的新外部直运(External Fulfillment)平台,亚马逊物流 + 系统及基于机器学习的亚马逊全球客服系统智能化项目。现做为亚马逊(中国)技术团队的首席架构师,领导中国团队通过机器学习,大数据及云计算新技术不断创新为中国客户打造更好的体验。

一个彩蛋

在文章开头我们说过,蔡超老师将参加全球人工智能与机器学习技术大会(AICon),届时,蔡超老师会带来更多精彩分享,可到现场与他面对面交流探讨。大会将于2018 年1 月13-14 在北京盛大开幕,来自Google、Snap、Etsy、BAT、360、小米、京东等40+ 公司AI 技术负责人也将前来分享他们的机器学习落地实践经验,希望对你有所帮助。

更多大会精彩内容,欢迎点击官网详细了解!

目前大会倒计时4 天报名进行中,如在报名中遇到任何问题,敬请咨询票务经理豆包,电话:18514549229,微信:18514549229,QQ:209463896


感谢陈思对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2018-01-04 18:003842

评论

发布
暂无评论
发现更多内容

【译】Amazon Aurora: Design Considerations for High Throughput Cloud-Native Relational Databases 上篇

米乐m6app苹果官网下载

分布式数据库 异步 Amazon Aurora 日志驱动

10万奖金等你拿!2020第四届易观OLAP算法大赛火热开启

易观大数据

开发任务管理分析报告

森林

Spring Boot中获取配置的一些方法

Geek_416be1

Spring Boot 2

银行大数据新玩法,构建“一湖两库”金融数据湖

华为云开发者联盟

大数据 数据湖 FusionInsight MRS DWS

一个空格引发的“救火之旅” - 记一次 SOFA RPC 的排查过程

阿里云金融线TAM SRE专家服务团队

mPaas研发流程和线上运维介绍

阿里云金融线TAM SRE专家服务团队

ios android

数字化转型需要低/零代码平台的支持

代码制造者

低代码 数字化转型 企业信息化 零代码 编程开发

开发者的福音,LR.NET模块化代码生成器

Learun

Java 敏捷开发 .net core 计算机程序设计艺术 软件设计

JAVA,.NET项目开发难上手?Learun敏捷开发框架解君愁

Philips

Java 敏捷开发 .net core

Vue+Springboot项目部署

ZRK

Vue 前后端分离 springboot 部署

一键洞察全量SQL ,远离性能异常

华为云开发者联盟

数据库 sql 大数据 数据治理 华为云

Spring整合WebSocket

牛初九

Redis 持久化--AOF

是老郭啊

redis redis持久化 aof

controller-manager的主动驱逐

Geek_f24c45

Kubernetes k8s

向云再出发:如数据般飞驰的内蒙古

脑极体

新基建迎来风口 新人才仍有缺口

CECBC

人工智能 新基建 数字化基础

5G边缘计算:开源架起5G MEC生态发展新通路

华为云开发者联盟

开源 5G 边缘计算 公有云 EdgeGallery

LeetCode题解:155. 最小栈,单个栈同时存储最小值,JavaScript,详细注释

Lee Chen

大前端 LeetCode

Docker 镜像的备份恢复迁移

哈喽沃德先生

Docker 容器 微服务 镜像

Redis常见问题--单线程

是老郭啊

nosql redis 线程

OpenKruise:Kubernetes 核心控制器 Plus

郭旭东

Kubernetes 云原生 OpenKruise

人民版权 获2020中国产业区块链创新奖

CECBC

区块链 产业发展 版权

大事情!中国限制 AI 算法出口。网友:这是要阻止XX“下跪”

程序员生活志

Redis常见问题--哈希冲突

是老郭啊

哈希表 Redis项目

消息队列之事务消息,RocketMQ 和 Kafka 是如何做的?

yes

分布式事务 RocketMQ kafak 事务消息

易观CTO郭炜:如何构建企业级大数据Ad-hoc查询引擎

易观大数据

NodeX Component - 滴滴集团 Node.js 生态组件体系

滴滴普惠出行

深入了解 Rust 异步开发模式

lipi

rust 异步

JVM 内存模型、字节码、垃圾回收面试要点

escray

学习 面试 垃圾回收 字节码

一文带你深扒ClassLoader内核,揭开它的神秘面纱!

我没有三颗心脏

Java ClassLoader java基础 类加载器

亚马逊首席架构师的AI实践之路_语言 & 开发_蔡超_InfoQ精选文章