在AICon北京2017大会上,【李珂】讲师做了《借助 TensorFlow 在 CTR 预估中快速落地 DNN》主题演讲,主要内容如下。
演讲简介:
DNN 是广告/推荐 CTR 预估的重要技术。在今年以前,企业要从 LR,FM 迁到 DNN 上时需要自己编写 DNN 的训练和实时预测代码。这种办法对算法团队的能力要求高,上线周期长,算法迭代的成本也高。 今年年初 TensorFlow cluster 模式和 TensorFlow serving 为企业引入 DNN 提供了一个便捷的方案。当然在一个开源软件和一个能够稳定运行,支持快速算法迭代的生产系统之间还是存在着一个巨大的 gap 的。
本次分享将介绍 vivo 如何填补这个 gap,搭建一个每日能够稳定运行每日 3000 万日活,超百亿次预估的系统。其中的内容包括硬件选择(GPU or CPU,CPU 内存比)、TensorFlow 分布式方案的选择(Docker or Hadoop)、TensorFlow HA 方案的选择、TensorFlow 在训练大规模模型的坑(HDFS IO 等)、如何设计网络减少 DNN 的线上计算量、基于 serving 的线上预测服务的架构等。
听众受益
减少未来有意用 TensorFlow 进行大规模机器学习的听众踩的坑;
硬件选购的经验;
一些 CTR 预估中 DNN 的 trick。
讲师介绍:
李珂
vivo 互联网算法团队负责人
李珂,2010 年博士毕业于美国德州农工大学,主攻数据挖掘、统计学习方向。加入 vivo 前在华为大数据产品部任首席数据科学家,负责金融行业的数据挖掘解决方案设计和落地。加入 vivo 后组建了互联网业务的 AI 算法组,现在主要负责广告、推荐、搜索、NLP、图像算法。现在这些算法已广泛支撑 vivo 浏览器、应用商店、游戏中心、i 音乐等 APP。
完整演讲 PPT 下载链接:
https://aicon.infoq.cn/2017/beijing/schedule
评论