QCon 演讲火热征集中,快来分享技术实践与洞见! 了解详情
写点什么

Real Data 地产大数据上线,惠新宸谈链家大数据建设思路

  • 2017-12-25
  • 本文字数:2018 字

    阅读完需:约 7 分钟

12 月 21 日,链家举办了 2018 年年度思享会。以“数据赋能,品质居住”为主题,会上链家研究院发布了地产大数据产品 Real Data。我们在会场采访了链家集团技术副总裁,同时也是此次 Real Data 研发团队的负责人惠新宸(鸟哥),他为我们介绍了 Real Data 背后的核心技术和研发团队,以及数据赋能行业的一些思考。

Real Data 是一个针对 B 端用户所开发的房地产领域一站式研究和数据服务平台。从项目团队上来看,鸟哥介绍,链家目前有 1000 多研发成员,大部分都来自于 BAT 等一线互联网公司,加上链家研究院专业的市场、行业分析师团队,他们中的一部分为 Real Data 提供了强大的专业支持。

链家集团技术副总裁 鸟哥惠新宸

Real Data 囊括城市基础数据库、市场数据库、用户行为数据库及集中式公寓字典四大数据库,支持多维交叉分析,形成用户画像,帮助开发商等使用客户定位潜客来源、预估客户交易行为以及挖掘客户需求偏好,预估用户中意房屋的类型等。

通常来说,房产大数据有两大核心指标:

  • 数据颗粒度。颗粒度越细,大数据的价值越高
  • 数据更新能力。数据更新能力越强,数据就会越真实越贴近市场。

Real Data 正是在这样的要求下诞生的,它具有数据精细、真实,并且实时更新的特点。

首先是它的数据颗粒度,官方介绍,Real Data 采用商圈层级数据统计方式,依据地理维度进行聚合,形成聚合后的区域热点,按照成交量、人流量及热度的不同,进行商圈层级的划分,相较于行政区域划分统计,数据颗粒度更细。未来 Real Data 还将细化到小区级别的数据统计,对小区楼栋,业态、户型、总价和面积段提供数据交叉分析。

据了解,Real Data 收集的用户信息基本涵盖全面的人口属性数据,包括地域、年龄、性别、学历、职业、工作年限、收入、家庭结构等;购房行为属性数据,包括总价、面积、户型、贷款等;用户交易相关金融数据,贷款比例、利率、周期、杠杆使用等情况;住房需求,是否是刚需首套、刚需改善、中级改善、高端改善和顶级改善等,也即用户目前正处于哪一个需求阶段;以及链家首创的换房迁徙动态信息。以这些数据为基础,链家构建了 Real Data 潜客分析功能。而说到个人信息安全性问题,鸟哥说所有收集的用户信息都在注册链家网时用户须知上会进行提示,至于额外信息,除非用户自愿,否则不会进行收集。他同时还说明了这些数据的来源:通过链家 PC 和移动端所产生的定位、搜索、点击数据,以及与线下经纪人互动过程中产生的用户录入信息、带看、成交等数据。“数据安全是互联网数据公司的生命线。涉及到个体用户的隐私,我们有多重的保护,对所有的数据调用都是在脱敏的基础上,设置有限的调用权限。”鸟哥强调。

数据的真实性方面,首先,从渠道信息采集上看,线上链家网、链家 APP 已累计 3000 万注册用户量,日活跃用户达 300W,线下遍布全国 8000 家门店,15 万经纪人可实时采集成交数据。另一方面,链家的楼盘字典数据库囊括了全国 36 个重点核心城市 8000 万房源数据,容量达到了 1200T,收录了包括房源房间门牌号、标准户型图、属性信息、配套设施信息、历史业务数据等多维度信息,它保障了房源的真实性。此外,链家采用数据筛选机制——元数据平台、自动清洗机制——剔除虚假信息,使用这些数据管理体系,以技术的形式保障数据真实可信。

“我们建设系统的思路是以数据为导向,围绕人、房、客三方建设系统,通过用户的数据以及在整个过程中实时产生的交互行为,来推动整个系统的建设。基于这一点,用户上一秒的交互,就会成为下一秒的推荐特征,这也保证了 Real Data 产品实时画像能力的实现。”鸟哥介绍这是 Real Data 数据能实时更新的原因。因为目前大部分交易类的数据,包括签前、签中和签后的数据,都是通过系统得来的,这些从业务中产生的数据,本身具有实时性,而链家已经建立起了一个比较完善的系统,可以将数据向上汇集,这就保障了 Real Data 数据的实时性。同时,线上用户数据采集不断完善,这也使得链家的用户数据库趋于丰富,用户画像趋于精细化。

Real Data 的这些特点,使其为政府、房企、金融机构等房产全产业链参与者提供精准数据服务和决策依据成为可能,鸟哥以金融领域为例举了一个简单的例子,他认为 Real Data 在金融领域有很大的应用空间,市场、区域商圈和用户信息数据能为泛金融领域的投资行为、贷款、房屋抵押估值、金融获客、营销策略和服务模式等提供参考价值。“Real Data 的数据基础主要来源于链家的真实交易数据,是最接近市场的数据,离交易越近的数据,对用户的参考价值很大。”同时,Real Data 对用户进行全方位的标签系统管理,用户金融标签,将对交易用户的收入支付能力、贷款数据和杠杆使用情况等进行细致的描绘,这些数据可以帮助金融用户更深刻地洞察用户。

最后鸟哥表示,未来,Real Data 还将对已有的各项数据进行完善、扩充资产管理相关功能。此外,针对目前火热的租赁领域需求将推出一系列数据产品服务,用于辅助分散型、集中型租赁品牌的选址、定价与运营的策略制定,进一步扩大产品的应用空间。

2017-12-25 18:003206

评论

发布
暂无评论
发现更多内容

工作10年,面试超过300人想进阿里的同学,总结出的java面试69题

三十而立

Java java面试

SQL Chat - 基于 ChatGPT 的对话式交互 SQL 客户端

Bytebase

sql database ChatGPT

裸辞跳槽底气!字节在职大佬“Java面试总汇2023”大厂都在考

Java你猿哥

Java 面试 ssm 面经 Java工程师

mac电脑能恢复安卓手机丢失的数据吗?

Rose

mac电脑 安卓数据恢复

DaVinci Resolve Studio 18(达芬奇调色剪辑)中文版

Rose

达芬奇18破解版

灵魂拷问:你写的SQL一般有几个JOIN ?​

Java你猿哥

Java sql 后端 ssm join

Java基础_面试题

三十而立

Vue+Spring-Security前后端分离登录实现

做梦都在改BUG

苹果发布macOS Ventura 13.3正式版更新

Rose

mac系统 苹果最新系统 macOS Ventura 13.3

玩转 ChatGPT+极狐GitLab|分分钟丝滑迁移Jenkins到极狐GitLab CI

极狐GitLab

ci DevOps jenkins CI/CD 极狐GitLab

无人机巡检场景小目标检测与量化加速部署方案详解

飞桨PaddlePaddle

人工智能 无人机 目标检测 飞桨 PaddlePaddle

火山引擎DataTester推出可视化数据集成方案

字节跳动数据平台

数据集成 ab测试 A/B 测试 可视化开发 企业号 3 月 PK 榜

阿里P7架构师的独家分享——SpringCloud 微服务实战笔记

Java你猿哥

Java 架构 微服务 Spring Boot 面经

解密COUNT(*)与COUNT(1):SQL查询你选哪个更高效?

Java你猿哥

Java sql 后端 ssm Java工程师

连接 AI,NebulaGraph Python ORM 项目 Carina 简化 Web 开发

NebulaGraph

Python ORM 图数据库

2023高质量Java面试题集锦:高级Java工程师面试八股汇总

采菊东篱下

Java 面试

吐血整理!互联网大厂最常见的1120道Java面试题(带答案)整理

架构师之道

Java 面试

视频下载出来为网页格式?如何将视频转换为mp4格式?

Rose

视频格式转换 Mac视频格式转换 视频下载出来为网页

MobTech 秒验|防控羊毛党

MobTech袤博科技

四个上海等保小知识汇总-行云管家

行云管家

等保 等级保护 等保测评 上海

Mac版cad2024发布 AutoCAD 2024 注册机

Rose

Mac软件 cad cad2024激活版 Autodesk AutoCAD

警惕看不见的重试机制:为什么使用RPC必须考虑幂等性

做梦都在改BUG

龙蜥白皮书精选:面向异构计算的加速器 SDK

OpenAnolis小助手

开源 sdk 异构计算 加速器 龙蜥白皮书

开源即巅峰!《Java程序性能优化实战》GitHub三小时标星已超34k

做梦都在改BUG

Java 性能优化 性能调优

GitHub上架即巅峰!《Spring Cloud微服务架构实战》标星已超30k

做梦都在改BUG

Java 架构 微服务 Spring Cloud

夜莺n9e监控配置支持电话短信报警

外滩运维专家

夜莺监控 电话报警 短信报警 夜莺监控电话

vue面试题八股文简答大全 让你更加轻松的回答面试官的vue面试题

肥晨

Vue 面试题 金三银四 超全前端面试题

MobTech MobLink|场景分享的原理

MobTech袤博科技

Github上获赞59.8K的面试神技—1658页《Java面试突击核心讲》

三十而立

MobTech 秒验|本机号码一键登录

MobTech袤博科技

聊聊不太符合常规思维的动态规划算法

华为云开发者联盟

人工智能 华为云 华为云开发者联盟 企业号 3 月 PK 榜

Real Data地产大数据上线,惠新宸谈链家大数据建设思路_DevOps & 平台工程_雨多田光_InfoQ精选文章