写点什么

机器学习如何助力企业发展

2019 年 10 月 19 日

机器学习如何助力企业发展

首先欢迎大家来到人工智能时代!


细心的同学们会发现,现在经常能在网上和一些新闻讯息里看到人工智能技术的讯息,从解放生产力到优化供应链,AI 技术在工业界的落地场景越来越多,也大大的提高了行业的效率。



各大企业和独角兽纷纷入局,想要在 AI 时代下占有自己的一块市场份额,但往往“理想很丰满,现实很骨感”,很多企业在将 AI 技术与业务相结合时会面临各种各样的问题,出现了情况反而会导致业务效率的降低,这个时候我们就要向大厂看,听听巨头们是如何实现技术优势最大化的。


我们有幸采访到了美团点评技术总监王兴星老师,请他来讲讲美团是如何使用 AI 技术让外卖业务实现优势最大化的,他也将在AICon全球人工智能与机器学习技术大会上担任【机器学习应用和实践】专场的出品人。下面是 AICon 对他的专访:


AICon:王老师你好,十分感谢您能接受 AICon 组委会的采访,能简单介绍一下您自己和您目前的工作状态吗?


王兴星:2010 年进入中科院读硕士,期间先后在阿里核心系统研发部、百度凤巢和搜狗搜索做了近三年的 Intern;刚开始做工程架构,后来逐渐发现算法也很有趣,于是转到百度和搜狗做了广告和搜索算法相关的事情,也参加过一些比赛。


那时候,AI 算法的比赛刚刚兴起,第一次参加的比赛是 KDDCUP,记得也比较清楚,经常和小伙伴一起熬夜刷 LeaderBoard。每次看到排名上升都比较激动,这个和在工业界做了新算法上线,看见交易额或者广告收入上涨所带来的满足感很相似,比赛最终成绩还可以。后来也逐渐有了经验积累,做起来就轻松不少,也曾经在 2 周内拿了两个比赛的冠军。


毕业后去了搜狗,参与到搜狗的下一代推荐引擎和联盟广告的研发中,也是 AI 逐渐变热的阶段,做为工程师还是比较幸福的。


2016 年初加入美团,算是从 0 到 1 吧,搭建起了外卖的商业变现体系,目前涵盖了 Search/Feeds/Push 等多种产品形态。目前关注较多是商业模式的创新及算法对全业务链条的效率及效果的提升。


AICon:机器学习技术发展到现在经历了哪几个历程,王老师可以简单介绍一下吗?


王兴星:第一个分水岭是上世纪的八十年代,逻辑回归和贝叶斯分类都出现在五十至七十年代,这个阶段机器学习基本是零散的模型,不成体系。


第二阶段是从八十年代到 2000 年前后,机器学习理论体系逐渐完善,有了分类、回归、聚类等体系,树模型有了 ID3/CART/C4.5,SVM 和 AdaBoost 也逐渐诞生和走热。同时在这个阶段,深度学习虽不被看好,但也在进行着基础的积累,BP、CNN、LSTM 等工作都诞生于这个阶段,为后面的爆发埋下了伏笔。


2000 年以后,随着互联网的兴起,传统机器学习开始应用落地,同时产业的进步也推动了计算能力的提升,为深度学习的爆发也进一步打下基础。2006 年以后,深度学习开始大放异彩,在此过程中一方面是方法体系的逐渐完善,深度学习的效果和作用面都得到了长足的进步,逐步地落地在视觉/NLP/推荐和广告等多个领域。另外一方面,对应开源工具也逐步完善,TensorFlow/Caffe/MXNET/PyTorch 等优秀工具大幅降低了使用门槛。


此外还需要提的就是,2010 以后,深度学习和强化学习的结合进一步拓展了应用面,深度学习负责感知和表示,强化学习重点解决决策,诞生了 AlphaGo 这样具有代表性的应用。


AICon:目前我们看到机器学习在很多业务场景中落地,需要解决哪些问题及如何进行技术选型?针对业务的特点如何进行相应改进?


王兴星:机器学习通常解决效率和效果的问题,人不能做的通过机器可以做,人可以做但是效率不高、效果不好的机器可以做的更好。例如,推荐的场景下,人没有办法从上亿个的商品中挑选出来用户最喜欢的,机器可以做,这解决的是"不能"到"能"的问题。公司通常也会对要上线的物料进行审核,通常一个人每天可以审核的物料数大概在千这个量级,如果通过机器或机器+人工的方法,效率可以提高两个数量级。


关于技术选型:


首先,不同的业务阶段可能采取的方案是不一样的。举个例子,业务刚刚起步的时候,我们在乎更快的迭代速度,随着业务的发展提升逐步趋于平缓,这个时候会考虑复杂度高、迭代慢但效果更好的模型。


其次,根据不同的任务要求,可能需要我们做技术方案的调整或创新。举个例子,以前我们做回归,都是只看最终的 RMSE 指标,在外卖的订单量预估的场景下,对模型性的可解释性提出很高的要求。例如,要求能给出来降雨对各个城市订单量的影响比例,还能够区分大雨/中雨/小雨,甚至不同的降雨量对订单的影响比例。这个怎么解决呢?我们通过级联模型的方法去建模。


最后,针对业务的特点,需要做对应的选型、优化。举个例子,同样是 CTR/GMV 预估,通常的解决方案是 LR 或者 FM/FFM 叠加上 Online Learning+大规模离散特征,或者深度学习+Embedding 特征的解决方案。16 年 2 月,我刚来美团的时候,发现公司很多业务却是树模型+统计类型特征的方法,为什么呢?是因为在 O2O 场景下,对用户决策影响较大的是配送距离、销量、平均评价分等连续类型的特征,这种数值类型的输入树模型通常学习得较好。再到 O2O 的广告场景下,又会出现很多例如广告主 ID、投放计划 ID 等枚举和 ID 类型特征,能否兼容两种类型的输入呢,微软 DeepGBM 提供出一种思路。


AICon:具体到美团的话,机器学习在哪些业务场景中得到了应用,为业务解决了哪些实际问题?


王兴星:美团的业务场景比较广泛,具体来讲可以分为到家、到店、出行几个大的业务集合,每个业务都面临各种各样的挑战。


以到家(外卖)为例,AI 会作用在业务的各个环节。例如,我们会使用算法帮助商家上单、优化物料,提升供应链的效率和效果。商家完成上单后,会使用图像识别技术提升审核的效率。在用户侧,我们会使用深度学习和强化学习给用户推荐商品,也会用机器学习技术做送达时间(ETA)的预估。用户下单后,我们还有配送团队做实时调度分单系统。此外,我们利用算法做商品销量、城市订单量的预估等工作,去帮助平台、商家运营。


美团有自己的技术博客,也出了一本机器学习实践的书,大家如果感兴趣,可以去进一步关注、阅读。


AICon:中国目前机器学习领域,与国外比有何优劣势,哪个发展的更好?


王兴星:这个问题比较大,更准确的讲,是我们和美国比怎么样。从人才积累/资金投入/底层芯片/基础理论研究/产业应用几个方面综合来看,我们还是落后美国不少的。


美国厉害的地方,是能够吸引来自全球的人才,为他的社会发展做贡献。此外,国内很多的芯片目前也还是依赖于进口。基础理论的研究方面,国内发表的论文数逐年呈上升趋势,但重量级的工作偏少。在产业应用方面,几个热点方向芯片/语音/视觉/NLP/自动驾驶/平台工具/智能机器人大家各有特点和优势。在投入上,资金方面国内还是相对偏少,这个也是国外能够诞生 DeepMind、波士顿动力的原因之一。此外,在”巨头卡位“上,大家都有动作,在市场和数据上也都相对充裕,算是齐头并发。


整体看,我们算是坐住了第二把交椅,但与第一仍有较大的差距。


AICon:机器学习未来的发展形势如何,该如何选择未来的求职方向?


王兴星:有一句话:“人们总是倾向于高估两年能发生的变化,但是低估十年能发生的变化”,我想在技术上也是适用的。我们既要脚踏实地,也要仰望星空。


从技术发展趋势来看,一个是 Deep Learning +X 模式:将深度学习和其他问题相结合,例如我们过去看到的 Deep Learning + Reinforcement Learning、Deep Learning + Graph 等,未来应该还会有更多。再者,过去大家把绝大部分经历都放在了监督学习上,这一块的进展较为顺利,但半监督和无监督的进展就相对慢一些,不过从近几年的发表论文数看投入也有增加,相信未来还有有更多的力量投入非监督学习上。此外就是工具上,类 AutoML 和 MLFlow 型的工具会进一步完善,降低算法的门槛,会有更多的开发者会进入。


从求职、从业来看有两个点:一是,机器学习还会进一步向各行业渗透,去提质、提效,由此也会带来更多的工作机会;二是,理论的创新速度要慢于落地应用的速度,但理论的创新会带来的颠覆性的影响,而应用落地过程中也需要接地气和“微创新”的工作,所以这两方面是都不能丢的。


如果是刚进入工业界的,应该选择自己喜欢的技术和业务方向,去落地积累和创新改变,同时关注新技术以及新应用、新行业的兴起。


以上就是 AICon 对于王老师的采访,想了解更多人工智能其他方向技术的同学可以点击“了解详情”,关注 AICon 北京 2019。


AICon全球人工智能与机器学习技术大会汇集了来自微软、Intel、BAT、华为、美团、滴滴、京东等一线互联网公司的 60+优秀 AI 技术案例,邀请颜水成、贾扬清、崔宝秋、吴华、雷鸣、张峥等 60+AI 技术大咖带来精彩的内容分享。


2019 年 10 月 19 日 00:001682

评论

发布
暂无评论
  • 因为 ai,Blued 成为垂直社交产品里“不一样的烟火”

    而男同社交应用Blued的成功,让这个群体有了某种程度上的归属感,并证明了这个市场巨大的潜力。很少有人知道,它的成功和人工智能的进步有着密不可分的关系。

  • 大规模数据处理在深度学习中如何应用?

    在“深度学习”中,大规模数据处理应该如何应用?

    2019 年 7 月 22 日

  • 瞄准全球顶尖的 AI 落地案例,AICon 来了!

    人工智能科学家吴恩达曾经说过这样的话,一百年前,电可以为很多企业、很多行业带来巨大的交通通讯和农业网络,今天人工智能也会为很多企业带来一样大的改变。

  • 揭秘阿里价值百亿的深度学习算法

    作为推动工业级深度学习应用的先行者之一,阿里妈妈从 2015 年开始一系列探索,并在 2016 年尝试了第一代深度学习算法,在后续几年里,深度学习算法模型不断更新迭代,为阿里妈妈带来了大量红利。

  • 美丽联合集团 VP 顶天:总结这一年,我们在技术上的变与不变

    面对一波波的技术浪潮,如何判断新兴技术对自身业务的价值?技术领导者本身应该具备哪些素质,才能在瞬息万变的大环境中帮助公司赢得竞争?InfoQ 记者采访了美丽联合集团副总裁顶天(曾宪杰)。以下为本次采访实录。

  • AI 芯片市场竞争:生态与技术并重

    InfoQ 记者就 AI 方面的话题对林咏华女士做了采访,以下为本次采访的主要内容。

    AI
  • 架构师(2019 年 8 月)

    本期推荐文章:我是一名技术总监,被技术选型给埋坑里了;揭秘大牛程序员十二时辰:有人作息规律,有人全年无休。

  • AI 商业化下的技术演进

    AICon大会定制迷你书,AICon全球人工智能与机器学习技术大会是由极客邦科技旗下 InfoQ 中国主办的技术盛会,大会为期2天,主要面向各行业对AI技术感兴趣的中高端技术人员。

  • 一文看懂 2019 年末人工智能发展趋势

    人工智能最近几年发展得如火如荼,学术界、工业界、投资界各方一起发力,本文将深度解析最新AI发展趋势,欢迎讨论。

  • 第 9 讲 | CTO 是商业思维和技术思维交汇的那个点

    无论是哪种思维,都必须对应到公司的商业价值,都应该以产生商业价值为最终目标。

    2018 年 4 月 30 日

  • 从美团外卖说起,机器学习技术如何为企业变现?

    为了了解机器学习技术如何赋能业务,AICon有幸采访到了美团点评技术总监王兴星老师,请他来讲讲美团是如何使用 AI 技术让外卖业务实现优势最大化的。

  • 阿里端侧 AI 从探索尝试到逐步展开

    人工智能发展已进入“落地为王”阶段,端侧 AI 现已成为端侧技术新热点,本文将回顾端侧 AI 的发展过程,以阿里端侧 AI 发展为例展望端侧 AI 的未来。

  • 深度迁移学习在 NLP 中的应用:选 BERT 还是被评逆天的 GPT 2.0?

    吴恩达曾说:迁移学习将会是继监督学习之后下一个机器学习商业成功的驱动力。

  • 深度树匹配——下一代推荐技术的探索和实践

    演讲嘉宾李晗,阿里妈妈精准定向技术部 高级技术专家内容介绍推荐业务是互联网内容提供商进行流量分配的核心业务,也是大数据和机器学习技术的典型应用场景。以电商环境为例,推荐技术的核心任务是要完成从全部海量商品库高效检索TopK相关商品给用户。为实现这一目标,推荐技术经历了以Item-CF为代表的基于统计启发式规则,到以内积模型为代表的向量检索技术的演进和发展。但当前基于内积检索的推荐技术虽然突破了全量候选集召回的天花板,一定程度引入深度模型优化推荐效率,但内积结构模型表达能力存在局限,无法利用更先进模型进一步提升推荐效果。如何在全库检索的基础上突破模型能力天花板,是下一代工业级推荐技术的可行性发展方向。本次分享将会介绍阿里妈妈精准算法团队围绕全库检索+先进模型这一目标,自主提出的深度树匹配技术Tree-based Deep Match(TDM)这一全新的推荐算法框架。我们将会详细讲述,在具体实现层面如何根据树结构提出兴趣概率最大堆模型,并由此推演出一整套采样、检索、建模的方法。此外我们会详细介绍深度树匹配技术一方面在广告业务上的应用成果和学术创新性探索,该工作也被收录到KDD2018。与此同时,我们还将从下一代工业级推荐技术持续发展的视角,讲述围绕深度树匹配技术进一步发展的探索和思考。内容大纲 什么是推荐问题和推荐技术 深度树匹配——下一代推荐技术的探索 成为下一代推荐技术的核心挑战 深度树匹配——下一代推荐技术探索的再思考

    2019 年 1 月 7 日

  • 如何解决特征工程,克服工业界应用 AI 的巨大难关

    人工智能是一个非常炙手可热的名词,且已经成功应用在语音、图像等诸多领域。但是,现在人工智能有没有达到可以简单落地的状态呢?工业界的人工智能需要什么技术呢?带着这些问题开始我们的思考。

  • 亚马逊首席架构师的 AI 实践之路

    近几年,蔡超带领亚马逊工程团队应用机器学习、深度学习技术在全球客服系统智能化,推荐系统本地化及合规性检测自动化等多个方面实现了大量的成功创新。

  • 推荐类产品(一):推荐系统产品经理的工作职责与必备技能

    为什么你没有办法主导一个推荐系统的建设?在这个过程中,产品经理到底要具备哪些能力?

    2021 年 2 月 19 日

  • 讯飞 AI 广告平台机器学习算法演进之路

    演讲嘉宾吕昕 科大讯飞大数据研究院算法部负责人内容介绍随着时代的发展,互联网广告从传统的展示广告逐渐升级到互动广告、AI广告,广告优化算法也逐步演进,讯飞AI广告平台从实际业务需要出发,使用机器学习、深度学习和强化学习技术,打造实时、智能、高效的算法体系,目前广告算法能够大幅提升广告互动率,有效降低用户转化成本。在讯飞AI广告平台算法体系的建设中,可以分为三个阶段。第一阶段专注于点击率预估算法的优化;第二阶段在多个业务场景,算法和数据分析相结合,数据驱动产品优化;第三阶段算法和数据、产品深度结合,共同优化广告主的ROI。内容大纲1、了解广告产品和算法发展演进路线; 2、了解机器学习和深度学习技术在广告领域的应用方法; 2、掌握如何应用大数据和机器学习技术提升广告ROI。

    2018 年 11 月 9 日

  • 达观数据个性化推荐系统实践

    本文从数据处理、用户行为建模到个性化推荐,分享达观数据在个性化推荐系统方面积累的一些经验。

  • 阿里跨境业务动态广告算法迭代

    演讲嘉宾 孟晓楠,阿里巴巴国际技术事业部高级算法专家。 内容介绍 搜索广告系统是一个三方博弈的过程,其参与方包括网站访问者、卖家(广告提供商)和平台。作为平台方,我们要权衡三方的利益,同时满足搜索体验、卖家ROI和平台的变现能力。我们主要探索搜索广告中RPM最大化的理论和实践,提出了一种新的离线模型评估指标SAUC(Soft AUC),并在实际项目应用中取得显著的业务结果。 演讲大纲 预算约束下的广告消耗预估研究; 搜索广告中RPM最大化的理论和实践探索; 基于动态广告位的全页面优化。

    2018 年 9 月 12 日

发现更多内容

程序员不得不知的十大职场误区

陆陆通通

程序员 职场 架构师 工资 误区

设计模式

Jeff

第四周总结

石刻掌纹

爱恨交织的红黑树

ytao

数据结构 算法

一路“开挂”,完美诠释“年少有为”——90 后首席科学家王乃岩

二叉树视频

写作平台 二叉树 年少有为

架构师训练营第四章总结

叮叮董董

总结 架构师 训练营

漫画通信:惊呆了,手机登录还可以这么玩!

阿里云Edge Plus

云通信 通信 通信云

架构师训练营第 4 周 总结

时来运转

游戏夜读 | 不受欢迎的那个人

game1night

大型互联网应用技术方案

石刻掌纹

命题作业和总结—第四周

于江水

极客大学架构师训练营

Kafka面试题——20道Kafka知识点

古月木易

Kafka知识点

从业务代码到Openjdk源码的debug之路

飞影

Java debug 深入理解JVM Openjdk TLAB

一个典型的大型互联网应用系统使用了哪些技术方案和手段,主要解决什么问题?请列举描述。

Carlos

深入浅出Shiro系列

程序员的时光

架构师训练营第四章作业

饶军

第四周直播总结笔记

Carlos

分布式柔性事务之事务消息详解

古月木易

分布式柔性事务‘’

Kafka面试题——20道Kafka知识点

奈学教育

Kafka知识点

《机器学习理论导引》阅读攻略

华章IT

学习 周志华

为什么美国程序员工作比中国程序员工作轻松、加班少?

程序员生活志

程序员 加班

架构师训练营第4周作业

时来运转

以应用为中心:开放应用模型(OAM)初探

郭旭东

Kubernetes OAM

分布式柔性事务之事务消息详解

奈学教育

分布式事务

week04 学习总结 互联网面临挑战和架构模式

Z冰红茶

成功从小公司跳槽进蚂蚁定级P7,只因刷了七遍这些面试真题

互联网架构师小马

Java 程序员 面试 找工作 架构师

HTTP 的15个常见知识点复习

pingan8787

Java 前端 Web HTTP

项目域名配置流程

打鱼小王子

使用 Prometheus-Operator 监控 Calico

米开朗基杨

Prometheus calico

架构师训练营第四章作业

叮叮董董

架构 技术方案 解决手段 互联网架构

“信息茧房”里的人

架构精进之路

自我思考 程序员成长

微服务架构下如何保证事务的一致性

微服务架构下如何保证事务的一致性

机器学习如何助力企业发展-InfoQ