近日, TalkingData 与北京航空航天大学、浙江大学合作论文 “UrbanMotion: Visual Analysis of Metropolitan-Scale Sparse Trajectories”,入选 国际顶级期刊 IEEE TVCG ,并受邀在 10 月举办的 IEEE VIS 大会 上进行全文报告。
本研究基于脱敏后的京津冀城市群超过 120 亿条移动终端位置记录, 对城市人群移动模式进行了挖掘和分析,创新性地提出了针对时间稀疏轨迹的分类、聚合和可视化方法 。本研究成果有望作为新的交互分析手段,为城市规划、交通优化、商业选址等应用领域带来重要价值。
IEEE Transactions on Visualization and Computer Graphics(TVCG)是可视化领域排名第一的国际顶级期刊。 该 19 页长文获得了 TVCG 的全文刊登, 并获得了期刊编辑的高度评价。论文第一作者北京航空航天大学时磊教授,将代表研究团队在可视化领域全球规模最大、最受认可的 顶级会议 IEEE Visualization Conference(VIS)2020 年度大会上 ,对论文进行详细介绍。
基于大规模数据集创新算法和可视化方式
本次研究使用的数据集由国内领先的数据智能服务提供商 TalkingData 提供 ,包括来自约 4265 万个设备的超过 122 亿条的脱敏位置信息。以往类似研究基于的数据通常规模较小且来源单一,而本次研究使用的数据集来自超过 10 万种移动应用程序,不仅规模庞大,而且具有整合多数据来源的优势,可以覆盖更多类型的移动轨迹、具有更小的误差。但同时,这些轨迹数据也具有采样随机且时间稀疏的特点,为数据挖掘和分析带来了一定难度。
经过探索, 论文中提出了一系列针对稀疏轨迹数据的分析和可视化方法,并总结出一套包含移动提取、人流聚合、路段匹配、模式发现、移动可视化以及用户交互六大阶段的流程。 为了解决数据的稀疏性这一难点,论文中提出了可以准确高效地判断记录静止/移动的 SDS 算法。为了实现不同区域内移动流的聚类,论文中设计了一维的 DBSCAN 向量聚类方法。此外,论文中还设计了模式发现算法,用于检测各区域的类型及异常度。在可视化方面,论文中对流生成算法和风图可视化技术进行了改进,采用动态流和热力图结合的展示形式,设计了多种展示和交互方式。
本研究最终实现了一个可以 从大规模的脱敏位置数据中提取人群移动模式、并将其直观展示出来的可视化分析系统——UrbanMotion ,该系统可以用于 城市人群移动概况观测、局部人口流动模式观测和分析、人群分布与人群移动之间的关系探索以及异常模式检测和大型事件检测等场景 。
行业调研案例验证多场景应用价值
研究团队邀请了相关行业专家对论文成果进行了调研,结合通勤分析、异常检测、广告投放等多个应用案例分析证明了系统的可用性和有效性。
例如 在通勤分析的案例中 ,专家选取了北京一个普通工作日,来观察早间通勤时段的人群移动情况。结果如下图所示,可以看出轨迹的可视化结果与北京市道路路网走向大多一致。通过观察流量最多的移动轨迹,即图中密度较大、线条较粗的流,可以很直观地识别出中关村、CBD 等重要的就业中心;而 回龙观与西二旗地区的人群流动颜色较暗,表示对应的移动速度较慢,说明该地区的通勤状况不佳 。
图:北京市人群移动轨迹分析
对比早间通勤时段与中午 12 点回龙观和西二旗地区的移动热力图,可以发现 两个地区的职住平衡较差 :早间时段西二旗地区中心有一个突出的红色区域——说明人群主要向这里聚集,而回龙观地区显示大片蓝色——说明这里是人群的主要来源;而中午 12 点的热力图中,两地不再有明显的颜色差异,说明通勤行为大部分已结束。当地图切换到路网模式时,可以看到西二旗和回龙观中间被 G6 高速公路阻隔。专家表示, 道路的拓扑结构在一定程度上导致了西二旗和回龙观地区的交通拥堵,未来这部分区域需要建立更多的道路来满足通勤需求。
图:(左)早间通勤时段移动热力图与(右)中午 12 点移动热力图对比
通过案例调研,可以验证 UrbanMotion 系统在如城市规划、交通优化、安全防护、事件预测、商业选址等公共事业领域和商业领域,都可以提供重要价值。
企业+名校产学研结合促进大数据应用
本研究, 由北京航空航天大学计算机学院大数据科学与脑机智能高精尖创新中心时磊教授团队、浙江大学计算机学院副院长陈为教授团队、TalkingData 首席数据科学家张夏天团队(通讯作者)共同完成 。后续,研究团队计划对系统进一步优化,并推动在各行业场景下的落地应用。
这是 国内顶尖院校与领先企业携手在大数据领域的一次成功探索 ,也是 TalkingData 近年来倡导构建“连接、安全、共享”数据智能应用生态的又一次践行。将院校的理论基础和科研能力与企业的数据能力和行业经验相结合,优势互补,更有助于用新思路、新技术、新方案为大数据应用赋能,为促进国家大数据战略落地、加速数字化转型升级带来 1+1>2 的效果。
本文转载自公众号 TalkingData(ID:Talkingdata)。
原文链接:
评论