写点什么

Real Data 地产大数据上线,惠新宸谈链家大数据建设思路

  • 2017-12-25
  • 本文字数:2018 字

    阅读完需:约 7 分钟

12 月 21 日,链家举办了 2018 年年度思享会。以“数据赋能,品质居住”为主题,会上链家研究院发布了地产大数据产品 Real Data。我们在会场采访了链家集团技术副总裁,同时也是此次 Real Data 研发团队的负责人惠新宸(鸟哥),他为我们介绍了 Real Data 背后的核心技术和研发团队,以及数据赋能行业的一些思考。

Real Data 是一个针对 B 端用户所开发的房地产领域一站式研究和数据服务平台。从项目团队上来看,鸟哥介绍,链家目前有 1000 多研发成员,大部分都来自于 BAT 等一线互联网公司,加上链家研究院专业的市场、行业分析师团队,他们中的一部分为 Real Data 提供了强大的专业支持。

链家集团技术副总裁 鸟哥惠新宸

Real Data 囊括城市基础数据库、市场数据库、用户行为数据库及集中式公寓字典四大数据库,支持多维交叉分析,形成用户画像,帮助开发商等使用客户定位潜客来源、预估客户交易行为以及挖掘客户需求偏好,预估用户中意房屋的类型等。

通常来说,房产大数据有两大核心指标:

  • 数据颗粒度。颗粒度越细,大数据的价值越高
  • 数据更新能力。数据更新能力越强,数据就会越真实越贴近市场。

Real Data 正是在这样的要求下诞生的,它具有数据精细、真实,并且实时更新的特点。

首先是它的数据颗粒度,官方介绍,Real Data 采用商圈层级数据统计方式,依据地理维度进行聚合,形成聚合后的区域热点,按照成交量、人流量及热度的不同,进行商圈层级的划分,相较于行政区域划分统计,数据颗粒度更细。未来 Real Data 还将细化到小区级别的数据统计,对小区楼栋,业态、户型、总价和面积段提供数据交叉分析。

据了解,Real Data 收集的用户信息基本涵盖全面的人口属性数据,包括地域、年龄、性别、学历、职业、工作年限、收入、家庭结构等;购房行为属性数据,包括总价、面积、户型、贷款等;用户交易相关金融数据,贷款比例、利率、周期、杠杆使用等情况;住房需求,是否是刚需首套、刚需改善、中级改善、高端改善和顶级改善等,也即用户目前正处于哪一个需求阶段;以及链家首创的换房迁徙动态信息。以这些数据为基础,链家构建了 Real Data 潜客分析功能。而说到个人信息安全性问题,鸟哥说所有收集的用户信息都在注册链家网时用户须知上会进行提示,至于额外信息,除非用户自愿,否则不会进行收集。他同时还说明了这些数据的来源:通过链家 PC 和移动端所产生的定位、搜索、点击数据,以及与线下经纪人互动过程中产生的用户录入信息、带看、成交等数据。“数据安全是互联网数据公司的生命线。涉及到个体用户的隐私,我们有多重的保护,对所有的数据调用都是在脱敏的基础上,设置有限的调用权限。”鸟哥强调。

数据的真实性方面,首先,从渠道信息采集上看,线上链家网、链家 APP 已累计 3000 万注册用户量,日活跃用户达 300W,线下遍布全国 8000 家门店,15 万经纪人可实时采集成交数据。另一方面,链家的楼盘字典数据库囊括了全国 36 个重点核心城市 8000 万房源数据,容量达到了 1200T,收录了包括房源房间门牌号、标准户型图、属性信息、配套设施信息、历史业务数据等多维度信息,它保障了房源的真实性。此外,链家采用数据筛选机制——元数据平台、自动清洗机制——剔除虚假信息,使用这些数据管理体系,以技术的形式保障数据真实可信。

“我们建设系统的思路是以数据为导向,围绕人、房、客三方建设系统,通过用户的数据以及在整个过程中实时产生的交互行为,来推动整个系统的建设。基于这一点,用户上一秒的交互,就会成为下一秒的推荐特征,这也保证了 Real Data 产品实时画像能力的实现。”鸟哥介绍这是 Real Data 数据能实时更新的原因。因为目前大部分交易类的数据,包括签前、签中和签后的数据,都是通过系统得来的,这些从业务中产生的数据,本身具有实时性,而链家已经建立起了一个比较完善的系统,可以将数据向上汇集,这就保障了 Real Data 数据的实时性。同时,线上用户数据采集不断完善,这也使得链家的用户数据库趋于丰富,用户画像趋于精细化。

Real Data 的这些特点,使其为政府、房企、金融机构等房产全产业链参与者提供精准数据服务和决策依据成为可能,鸟哥以金融领域为例举了一个简单的例子,他认为 Real Data 在金融领域有很大的应用空间,市场、区域商圈和用户信息数据能为泛金融领域的投资行为、贷款、房屋抵押估值、金融获客、营销策略和服务模式等提供参考价值。“Real Data 的数据基础主要来源于链家的真实交易数据,是最接近市场的数据,离交易越近的数据,对用户的参考价值很大。”同时,Real Data 对用户进行全方位的标签系统管理,用户金融标签,将对交易用户的收入支付能力、贷款数据和杠杆使用情况等进行细致的描绘,这些数据可以帮助金融用户更深刻地洞察用户。

最后鸟哥表示,未来,Real Data 还将对已有的各项数据进行完善、扩充资产管理相关功能。此外,针对目前火热的租赁领域需求将推出一系列数据产品服务,用于辅助分散型、集中型租赁品牌的选址、定价与运营的策略制定,进一步扩大产品的应用空间。

2017-12-25 18:003129

评论

发布
暂无评论
发现更多内容

盘点 2021|日更一年的收获与改变

石云升

28天写作 12月日更 盘点2021

Redis AOF 持久化详解

程序员历小冰

redis aof 28天写作 12月日更

面试官:说说32位和64位

喵叔

28天写作 12月日更

Golang中的协程是干什么用的?

liuzhen007

28天写作 12月日更

案例应用 l 机器视觉"OCR识别"技术,高效解决医疗药盒字符检测难题

矩视智能

机器视觉 工业视觉 工业机器视觉 工业界机器学习

HarmonyOS(鸿蒙)——单击事件

李子捌

28天写作 21天挑战 12月日更

区块链将在元宇宙旅游中发挥哪些价值?

CECBC

农信机构如何推动供应链金融?

CECBC

mybatis中如何防止sql注入和传参

网络安全学海

黑客 网络安全 信息安全 渗透测试 安全漏洞

Java 中的 xx ≠ null 是什么新语法?

CRMEB

数字化石油的开采利器:智能图像识别系统

百度大脑

人工智能

百分点认知智能实验室:基于NL2SQL的问答技术和实践

百分点科技技术团队

架构实战营第 4 期 -- 模块四作业

烈火干柴烛灭田边残月

架构实战营

元宇宙如何改写人类社会生活

CECBC

Yes And

将军-技术演讲力教练

圣诞节

圣迪

圣诞节 圣诞老人 平安夜 尼古拉斯 长筒袜

关于Stream转Map的Duplicate key异常处理

一盐难进

java基础

读《思辨与立场》-09决策的艺术10掌控你的非理性倾向

wood

28天写作 批判性思维 思辨与立场

如何利用区块链提高供应链金融数字化水平?

CECBC

Hoo虎符研究院 | 币海寻珠——2021年12月月底NFT榜单(2021.11.22 - 2021.12.21)

区块链前沿News

NFT 虎符交易所 虎符研究院 Hoo交易所

技术进步和个人幸福

mtfelix

28天写作

Agora Flat:在线教室的开源初体验

声网

人工智能 开源 flat

微服务架构下请求调用失败的解决方案

JavaEdge

12月日更

LabVIEW灰度图像操作与运算(基础篇—2)

不脱发的程序猿

机器视觉 图像处理 LabVIEW 灰度图像操作与运算

Flink CDC 系列 - 同步 MySQL 分库分表,构建 Iceberg 实时数据湖

Apache Flink

大数据 flink 编程 后端 实时计算

优酷弱网平台落地实践

阿里巴巴终端技术

弱网 弱网环境高可用

5G很美丽,也要解好题:为什么今天必须关注5G-Advanced?

脑极体

阿里云混合云重磅亮相中国信通院2021混合云大会

一指阁:用宜搭实现全面数字化管理,助力企业打开十亿市场新空间

一只大光圈

阿里巴巴 低代码 数字化 钉钉宜搭

学习基本黑客技术

喀拉峻

网络安全 安全 渗透测试

十大排序算法思想与Python实现

宇宙之一粟

Python 排序算法 12月日更

Real Data地产大数据上线,惠新宸谈链家大数据建设思路_DevOps & 平台工程_雨多田光_InfoQ精选文章