今年 618,京东技术部门的最大变化,京东集团 CTO 张晨的总结是:“从技术上,去年重点在保障,今年重点是大数据驱动业务效率提高,和用户体验的提高”。而去年底京东宣布启动的“京东大脑计划”,是京东大数据价值的充分展现,在这次大促中,从前端的用户体验到库存管理配送,在整个购物体系中都发挥着作用。
InfoQ:请您简单介绍下“京东大脑计划”诞生的背景、主要应用场景及其架构。
京东:京东集团本年度三大战略:电商、金融和技术,而技术中首要重点即京东大数据,“京东大脑”是应运而生的战略项目之一。项目基于大数据挖掘、人工智能等技术能力,通过搜索、推荐、智能卖场、揽客计划、智慧物流、智慧数据等多种产品形态,对京东现有系统从架构层的基础设施、数据平台、计算分析,到业务层的精准营销、智慧选品、个性化投放、智慧物流等方面,进行有效渗透及优化。最终形成在计算能力和数据质量方向的大脑化运作,提高京东销售、采购、仓储配送等多方面的商业价值、降低运营成本,从而全面提升京东的智能化水平。
InfoQ:针对 618 这种大促,京东大脑做了哪些优化和改进,效果如何?大促期间暴露了哪些新问题,以便京东大脑做出调整和优化?
京东:针对 618 大促,“智能卖场”项目在 PC、APP、微信的主会场,依据京东大数据测算的用户画像进行个性化推荐,涉及商品、活动、类目、品牌、优惠券等卖场元素,提升用户在大促期间购买效率。
效果:618 大促期间,仍然保持纯算法和人工运营两个页面进行 AB Test,更多数据待 618 结束后分享。
InfoQ:对于电商购物,“商品推荐”是大数据的一个典型应用场景。也有一些经典的问题。推荐系统冷启动问题。如果是新注册的用户,需要购买多少物品或花多长时间才能准确的进行推荐商品?
京东:京东用户画像不仅基于用户购买数据,只要用户在网站有过浏览行为,就会采集并且进行用户画像的刻画,比如浏览的用户兴趣度、活跃度的判断,基于这些模型就可以推荐个性化商品,而且此类行为数据实时性很强,对有些品类的推荐效果很好。
对于基于购买数据建立的模型,基于模型精度要求不同会有不同数据量的要求,一般说来,数据越多,其模型的可信度越高,我们会在建立模型的同时对模型的可信度加以评估。
InfoQ:我们常会遇到“看什么就推荐什么”的套路,这也是个老问题。京东在这方面有哪些自己独特的经验和优势,采取了哪些措施改善推荐系统的用户体验?
京东:在“解决买了什么就推荐什么”时,京东最大的优势在于运营网站多年,很多品类已有足够的用户数据,依据数据计算品类甚至产品词层面的用户普遍复购率,再加以慎重使用,即可适当避免这个体验;另外,2015 年京东自主研发的实时点击流系统同样在发挥优势,即根据用户实时浏览行为计算其需求的强弱,且根据品类特点,来改善用户体验。
InfoQ:关于用户画像。您们采用了哪些维度建立模型?准确度如何判定?目前有哪些用户画像降噪措施?用户画像能否自动演化,不断完善?
京东:维度:打通用户从进入网站到购物乃至售后、配送等整个购买链条的数据维度,从整个购物流程入手去考察用户行为。
准确度:用户画像主要涉及计量经济方法、经济统计方法、数据挖掘方法等。对于统计类或无法找到确定参考标准的模型,采取 A/Btest 或应用效果评估的方式,用效果提升来确定准确度的高低。
降噪措施:一方面在特征工程方面,通过对原始指标的特征处理,提取更多维度的信息;另一方面在用户粒度上加入更细分的维度。
用户画像本身就是一个自我校正、动态演化的系统,随着数据的逐步丰富,画像也会更加完善。
InfoQ:物流系统也是京东的核心优势之一。智慧物流系统是否属于京东大脑的一部分?从技术上说,智慧物流有哪些最需要考量的因素?请举例说明,京东如何通过大数据技术充分挖掘自己的物流优势,从而不断改善用户体验呢?
京东:京东大脑项目是京东核心大数据应用的集合,智慧物流系统的大数据应用部分是其中之一。京东所有业务的底层数据和模型是统一的,由公司的大数据平台研发并管理。
实现智慧物流数据和建模是最重要的,数据不仅包括京东物流本身的数据,还包括公司的销售数据,以及社会化的数据,如 3PL 物流数据等,而大数据的展示,评估,预测,辅助决策是大数据应用的手段。
京东不断通过大数据技术发掘提升自身优势,有很多成功案例。例如,生产量预测。通过前台用户下单量,仓库生产量,开放平台商家发货量等数据,构建物流各个环节需要进行生产量的预测,可以下钻到单个分拣中心和站点,让分拣中心和站点的管理人员,能够提前进行生产能力的调度,保障物流时效,降低物流成本;又例如,移动商店。根据小区画像等数据,对于用户的购买情况进行预测,提前备货到对于的配送站,这样,当新品首发时,用户能够看到附近的商品,下单后,在几分钟到半个小时内,实现送货上门,实现了未卖先送,提升了用户体验。
InfoQ:关于商品自动 / 智能定价,京东有没有相关应用?替代了多少手工定价的工作量?最大的困难是什么?如何解决的呢?
京东:在京东“618 低价购品质”的背后,动态定价系统发挥着重要的保驾护航作用。长期以来,高质低价与利润、竞争与利润、销售与利润这些看似“矛盾”的课题困扰着诸多电商的发展,而京东的动态定价系统却持续为京东提供着高效的解决方案,形成了京东又一核心竞争力。
该系统基于运筹学多因素、多目标的优化模型,通过大数据集成顾客、商品、运营和竞争数据,覆盖商品从引入到退出、从畅销到滞销、从全国到区域、从 PC 端到移动端的多维度价格及促销的诊断、计划、执行和评估管理,将人力资源从传统的手工定价中释放出来,以便更高效的投入到商品甄选、供应商及卖家协同、顾客体验提升等诸多环节中去。动态定价系统在向消费者提供商品整体最优价值的同时,助力着京东销售、利润的持续增长和现金流的稳定健康。
InfoQ:关于提高用户留存率。京东采取了哪些措施?京东大脑 / 大数据是如何支持的?
京东:首先对京东用户进行分层,新用户、老用户和成长型用户等,对于用户留存指标的运营,其核心在老用户防止流失的挽留计划和新用户留存的促进其首次购买。结合推荐算法,使用短信、EDM、微信、APP 消息中心等方式吸引已有流失预警风险的用户,同时通过促进新用户“逛起来”的产品体验方面,使其愿意在京东投入更多时间且适当给其认可的优惠力度。
受访嘉宾介绍:
商倩兰 京东推荐搜索产品部负责人
李鹏涛 京东集团青龙研发部总监
葛胜利 京东大数据业务部总监
于永利 京东零售平台高级总监
感谢丁晓昀对本文的审校。
给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ , @丁晓昀),微信(微信号: InfoQChina )关注我们。
评论