写点什么

推荐系统在房产领域的实践

  • 2018-12-17
  • 本文字数:1738 字

    阅读完需:约 6 分钟

推荐系统在房产领域的实践
00:00 / 00:00
    1.0x
    • 3.0x
    • 2.5x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00

    采访嘉宾简介

    许燕松,就职于贝壳找房,担任贝壳找房智能推荐平台负责人一职。硕士毕业于美国匹兹堡大学信息科学专业。先后就职于当当网,聚美优品负责个性化推荐系统的研发工作,有多年的推荐系统的实践经验。主要研究推荐系统领域的系统架构设计与策略算法的应用。在贝壳找房主导了智能推荐平台的架构升级与算法迭代工作。通过架构的升级大幅提升了推荐架构的灵活性与迭代效率。通过算法的多次迭代不断提升推荐的效果。


    InfoQ:请您先介绍一下您的工作经历,以及您在贝壳找房所在的团队负责的工作。


    许燕松:我一直从事推荐研发相关工作,已经有很多年了,在我最开始的时候是先在当当,当时是第一次接触推荐相关的工作内容。那会儿我主要负责当当的个性化 PUSH 还有母婴品类相关的推荐,尤其是在做母婴品类推荐的时候我还自研了一套母婴相关的单独的一个推荐策略。后来就加入到聚美优品,负责整个聚美的推荐算法和用户画像相关的工作。在聚美的这段经历让我得到了更全方面的发展,让我知道如何去 hold 住一个完整的推荐系统。


    后来现在我又来到贝壳找房,在贝壳的这段经历让我知道如何把一个推荐系统做得更好,如何把一个相对封闭的推荐系统转变成一个智能推荐平台。这就是我主要的一些工作经历。


    InfoQ:贝壳找房推荐平台都使用了哪些推荐算法和策略以提高性能?


    许燕松:很多种策略,包括协同过滤的策略,基于用户画像的推荐策略,一些基于业务规则的推荐策略。这些策略本身都有各自的优缺点,我们并不是每一个场景只用一种,我们会混合着来用,这样不同策略之间就会形成互补,达到最优的一个效果。


    InfoQ:贝壳找房的智能推荐系统架构和算法经过哪些重大变化和迭代?做出改变的原因是什么?


    许燕松:可以说我们整个智能推荐平台是跟着贝壳找房一起发展壮大的,它主要经历了三个阶段:第一个是初创阶段,第二个阶段是快速发展阶段,第三个阶段是平台化的阶段。


    每个阶段面临着不同的问题:比如说在初创阶段,这时候我们用户需要提升找房的效率,我们所收录的这些房源需要得到更好的曝光,并且这个阶段我们的数据是非常不完备的。所以在这个阶段我们主要是想快速实现推荐系统从 0 到 1,从无到有的这么一个快速实现。所以在那个阶段没有用太复杂的推荐策略。


    在快速发展阶段,随着我们的数据积累,我们加入了各种各样的个性化策略,比如我提到的基于协同过滤的推荐策略、基于用户画像的推荐策略。有了这些策略之后,我们整个推荐相当于更上了一层楼。


    此外我们在平台化的阶段,我们去做了整个智能推荐平台的大升级。通过这次升级之后,可以说我们整个智能推荐平台在这个阶段就真的成为一个平台了,我们支持了快速的业务接入,以前一个业务的接入可能需要五个工作日,现在一个工作日就可以搞定了。而且在策略方面,我们加入了实时化的推荐策略,还加入了很多更为精准的推荐策略,比如说我们有 LR 模型做了一个精准排序。这就是整个贝壳的发展历程。


    InfoQ:在不同的阶段利用了不同的策略。


    许燕松:对,主要是针对当时面临的背景和不同的问题,有针对性地去解决。


    InfoQ:您觉得智能推荐平台在未来还可以做哪些优化?


    许燕松:因为我们叫智能推荐平台,所以第一点就是让智能推荐平台更加智能。目前我们做策略的优化都是人去做 AB 试验,通过 AB 试验的结果来不断地调整我们的策略。我们希望以后不通过人去做 AB 试验,通过线上的数据实时地反馈,让机器自己去学习如何去调优,这样才能真正说我们是一个智能的推荐平台。


    还有就是我们想在架构上加入更复杂模型的预测,比如说 WDL 模型。WDL 也可以在我们的算法上有很大的要求,所以我们在算法上也要做一个深耕。这就是我们未来在这块想要做的事情。


    InfoQ:最后一个问题是关于产品落地,贝壳找房除了智能推荐平台之外,还有没有一些其他的策略产品落地?


    许燕松:我所在的部门叫数据智能部,我们部门除了智能推荐平台还有很多其他的产品。比如说为了评估一个房源的真实价值,我们提供了一个智能估价系统,它是用来给房源进行估价的。


    为了更好地提升用户体验,我们还建立了智能的客服系统,智能客服系统你去问答的时候,它可以智能地给你回答,提升了用户的问答效率。


    我们还有智能图片的处理平台,主要是帮助我们解决各种各样图片相关的需求。这里面我只列举了一些比较主要的,其实还有很多其他的产品落地。


    2018-12-17 00:002141
    用户头像

    发布了 1465 篇内容, 共 701.7 次阅读, 收获喜欢 2486 次。

    关注

    评论 3 条评论

    发布
    用户头像
    贝壳不是把链家绿色的颜色背景换成了蓝色,哪儿来那么多的策略
    2019-06-01 23:34
    回复
    用户头像
    贝壳不是直接用的链家系统呀,哪有那么多策略
    2019-06-01 23:32
    回复
    没有更多了
    发现更多内容

    从零开始学习Java系列之你为什么要学Java?

    千锋IT教育

    携手!Kyligence 支持 Amazon EMR Serverless,赋能云上企业降本增效

    Kyligence

    数据分析 OLAP

    主流BI软件,哪一个软件使用效果更好?

    夏日星河

    【昇思生态城市行】南京站圆满举办, 昇腾携手伙伴见证多项重磅发布!

    Geek_2d6073

    阿里云易立:以增效促降本,容器服务全面进入智能化时代

    阿里巴巴云原生

    阿里云 云原生 容器服务

    刷了三个月 leetcode 算法,顺利拿下百度、阿里等大厂的 offer

    钟奕礼

    Java 程序员 java面试 java编程

    聊聊Mybatis的数据源之PooledDataSource

    急需上岸的小谢

    11月月更

    室内高清led电子显示屏的定义

    Dylan

    LED显示屏 全彩LED显示屏 led显示屏厂家

    百度架构师手写万字Spring Security实战笔记,一篇就搞懂

    小小怪下士

    Java spring springsecurity

    云服务器买谁家的好?为什么?理由是什么?

    行云管家

    云计算 服务器 云服务器

    Java 八股文能不背吗?Java 面试都只是背答案吗?

    钟奕礼

    Java 程序员 java面试 java 编程

    小令观点 | 需要留存用户的身份证照片?想清楚这三点了再做……

    令牌云数字身份

    数字身份 身份认证 加密技术 可信

    炎凰数据完成超亿元 A1 和 A1+ 轮融资,推出异构数据即时分析平台

    晨山资本

    大数据 大数据处理 大数据分析

    自动驾驶的「数据引擎」,该如何“降本”、“增效”和“精准化”?

    澳鹏Appen

    人工智能 自动驾驶 无人驾驶 智能驾驶 数据标注

    直播预告lApache Hudi 中文社区技术交流会第六弹

    StarRocks

    数据库

    中心化危机下,NFT 去中心化协议能否破局?

    NFT Research

    区块链 去中心化 NFT

    聊聊Mybatis的数据源之工厂模式

    急需上岸的小谢

    11月月更

    SCADA系统架构、类型和应用

    2D3D前端可视化开发

    物联网 组态软件 web组态 组态编辑器 SCADA

    小令观点 | 需要留存用户的身份证照片?想清楚这三点了再做……

    令牌云数字身份

    身份认证 身份安全 敏感信息加密

    上班干,下班学!这份 Java 面试八股文涵盖 20 多个技术点

    钟奕礼

    Java 程序员 java面试 java编程

    为了进大厂!吃透了各大厂最新 3000+Java 面试题啃完面试肯定妥了

    钟奕礼

    Java 程序员 java面试 java编程

    百度面试被算法血虐,闭关肝完445页算法神仙笔记成功入职字节

    钟奕礼

    Java 程序员 java面试 java编程

    Linux系统保存文件命令的详细介绍

    源字节1号

    软件开发 前端开发 后端开发 小程序开发

    隐语 PSI benchmark 白皮书

    隐语SecretFlow

    密码学 隐私计算 PSI 安全多方计算 隐语

    小令观点 | 是什么让马斯克也受骗了?

    令牌云数字身份

    数字身份

    动手实践丨基于ModelAtrs使用A2C算法制作登月器着陆小游戏

    华为云开发者联盟

    人工智能 华为云 A2C算法

    PCB layout有DRC,为什么还要用CAM和DFM检查?

    华秋PCB

    PCB PCB设计 PCB工具

    江西省四家等保测评机构名单详解

    行云管家

    江西 等保测评 等保测评机构

    ElasticSearch 集群迁移最佳实践

    冰心的小屋

    elasticsearch

    深入掌握 Fiori Elements 工作原理的前提条件:理解 Smart Field

    汪子熙

    前端开发 web开发 Fiori SAP UI5 11月月更

    业务畅行海外,如何做到安全第一

    火线安全

    推荐系统在房产领域的实践_大数据_InfoQ 中文站_InfoQ精选文章