写点什么

人群移动轨迹可视化新论文,入选 IEEE TVCG 及 VIS

  • 2020-10-08
  • 本文字数:1966 字

    阅读完需:约 6 分钟

人群移动轨迹可视化新论文,入选IEEE TVCG及VIS

近日, TalkingData 与北京航空航天大学、浙江大学合作论文 “UrbanMotion: Visual Analysis of Metropolitan-Scale Sparse Trajectories”,入选 国际顶级期刊 IEEE TVCG ,并受邀在 10 月举办的 IEEE VIS 大会 上进行全文报告。


本研究基于脱敏后的京津冀城市群超过 120 亿条移动终端位置记录, 对城市人群移动模式进行了挖掘和分析,创新性地提出了针对时间稀疏轨迹的分类、聚合和可视化方法 。本研究成果有望作为新的交互分析手段,为城市规划、交通优化、商业选址等应用领域带来重要价值。


IEEE Transactions on Visualization and Computer Graphics(TVCG)是可视化领域排名第一的国际顶级期刊。 该 19 页长文获得了 TVCG 的全文刊登, 并获得了期刊编辑的高度评价。论文第一作者北京航空航天大学时磊教授,将代表研究团队在可视化领域全球规模最大、最受认可的 顶级会议 IEEE Visualization Conference(VIS)2020 年度大会上 ,对论文进行详细介绍。

基于大规模数据集创新算法和可视化方式

本次研究使用的数据集由国内领先的数据智能服务提供商 TalkingData 提供 ,包括来自约 4265 万个设备的超过 122 亿条的脱敏位置信息。以往类似研究基于的数据通常规模较小且来源单一,而本次研究使用的数据集来自超过 10 万种移动应用程序,不仅规模庞大,而且具有整合多数据来源的优势,可以覆盖更多类型的移动轨迹、具有更小的误差。但同时,这些轨迹数据也具有采样随机且时间稀疏的特点,为数据挖掘和分析带来了一定难度。


经过探索, 论文中提出了一系列针对稀疏轨迹数据的分析和可视化方法,并总结出一套包含移动提取、人流聚合、路段匹配、模式发现、移动可视化以及用户交互六大阶段的流程。 为了解决数据的稀疏性这一难点,论文中提出了可以准确高效地判断记录静止/移动的 SDS 算法。为了实现不同区域内移动流的聚类,论文中设计了一维的 DBSCAN 向量聚类方法。此外,论文中还设计了模式发现算法,用于检测各区域的类型及异常度。在可视化方面,论文中对流生成算法和风图可视化技术进行了改进,采用动态流和热力图结合的展示形式,设计了多种展示和交互方式。


本研究最终实现了一个可以 从大规模的脱敏位置数据中提取人群移动模式、并将其直观展示出来的可视化分析系统——UrbanMotion ,该系统可以用于 城市人群移动概况观测、局部人口流动模式观测和分析、人群分布与人群移动之间的关系探索以及异常模式检测和大型事件检测等场景

行业调研案例验证多场景应用价值

研究团队邀请了相关行业专家对论文成果进行了调研,结合通勤分析、异常检测、广告投放等多个应用案例分析证明了系统的可用性和有效性。


例如 在通勤分析的案例中 ,专家选取了北京一个普通工作日,来观察早间通勤时段的人群移动情况。结果如下图所示,可以看出轨迹的可视化结果与北京市道路路网走向大多一致。通过观察流量最多的移动轨迹,即图中密度较大、线条较粗的流,可以很直观地识别出中关村、CBD 等重要的就业中心;而 回龙观与西二旗地区的人群流动颜色较暗,表示对应的移动速度较慢,说明该地区的通勤状况不佳



图:北京市人群移动轨迹分析


对比早间通勤时段与中午 12 点回龙观和西二旗地区的移动热力图,可以发现 两个地区的职住平衡较差 :早间时段西二旗地区中心有一个突出的红色区域——说明人群主要向这里聚集,而回龙观地区显示大片蓝色——说明这里是人群的主要来源;而中午 12 点的热力图中,两地不再有明显的颜色差异,说明通勤行为大部分已结束。当地图切换到路网模式时,可以看到西二旗和回龙观中间被 G6 高速公路阻隔。专家表示, 道路的拓扑结构在一定程度上导致了西二旗和回龙观地区的交通拥堵,未来这部分区域需要建立更多的道路来满足通勤需求。



图:(左)早间通勤时段移动热力图与(右)中午 12 点移动热力图对比


通过案例调研,可以验证 UrbanMotion 系统在如城市规划、交通优化、安全防护、事件预测、商业选址等公共事业领域和商业领域,都可以提供重要价值。

企业+名校产学研结合促进大数据应用

本研究, 由北京航空航天大学计算机学院大数据科学与脑机智能高精尖创新中心时磊教授团队、浙江大学计算机学院副院长陈为教授团队、TalkingData 首席数据科学家张夏天团队(通讯作者)共同完成 。后续,研究团队计划对系统进一步优化,并推动在各行业场景下的落地应用。


这是 国内顶尖院校与领先企业携手在大数据领域的一次成功探索 ,也是 TalkingData 近年来倡导构建“连接、安全、共享”数据智能应用生态的又一次践行。将院校的理论基础和科研能力与企业的数据能力和行业经验相结合,优势互补,更有助于用新思路、新技术、新方案为大数据应用赋能,为促进国家大数据战略落地、加速数字化转型升级带来 1+1>2 的效果。


本文转载自公众号 TalkingData(ID:Talkingdata)。


原文链接


人群移动轨迹可视化新论文,入选IEEE TVCG及VIS


2020-10-08 14:001789

评论

发布
暂无评论
发现更多内容

网络攻防学习笔记 Day68

穿过生命散发芬芳

网络攻防 7月日更

什么是数据集市

奔向架构师

数据仓库 数据架构 7月日更

十二张图,一脚踹开消息队列的大门

三分恶

消息队列

凭借这5步,我30分钟学会了Python爬虫!

Jackpop

爬虫 爬虫教程

百度搜索稳定性问题分析的故事(上)

百度开发者中心

百度搜索

Flink进入大厂面试准备,收藏这一篇就够了

五分钟学大数据

flink 7月日更

香帅:2021年财富格局新变化

石云升

读书笔记 7月日更

【Redis】数据结构

awen

redis 数据结构

为啥Java应用迁移到容器后会出现OOM?

Java架构师迁哥

每天学习10个实用Javascript代码片段(三)

devpoint

JavaScript JSON格式化 7月日更

妇与术(三):机器人可以没有性别,但关系技术离不开女性

脑极体

公司内部使用的数仓命名规范

白贺BaiHe

大数据 数仓 数仓规范 7月日更

相约山城重庆!HarmonyOS Connect伙伴峰会将于7月16日举办

科技汇

Clickhouse Projection 特性探索

GrowingIO技术专栏

数据库 大数据 数据分析 OLAP Clickhouse

魔方、齿轮、融合剂:当新ICT技术邂逅教育产业

脑极体

React 18探秘(上)

Teobler

大前端 React

Linux之find exec

入门小站

Linux

北鲲云助力生命科学,高性能计算突破屏障

北鲲云

区块链时代下,企业如何打造数据要素的“新竞争力”?

CECBC

底层技术支撑智慧出行,汽车智能化发展下区块链大放异彩

CECBC

2020年的焦虑与忧伤

Emotion

疫情 考研 研究生

多地“真金白银”力撑区块链,中西部欲弯道超车新赛道

CECBC

Python利器!Jupyter最大威胁终于来了

Jackpop

Python Jupyter Notebook

聊聊事务与分布式系统-从零讲到通透

刘绍

sql 分布式 事务 2PC XA

CDH 的安装(四)

大数据技术指南

CDH 7月日更

3分钟评估 你的运维监控系统是“救命稻草”还是“鸡肋”

鹿小U

运维自动化 监控系统 运维平台

模块七 - 王者荣耀商城异地多活架构设计

华仔架构训练营

5分钟速读之Rust权威指南(三十八)模板语法

wzx

rust

领域驱动设计101 - 聚合

luojiahu

领域驱动设计 DDD

IntelliJ IDEA必备7款Python插件

Jackpop

IDEA pycharm

🏆 【JVM 性能调优】「对象内存分配」输出常用参数

洛神灬殇

JVM 7月日更

人群移动轨迹可视化新论文,入选IEEE TVCG及VIS_移动_TalkingData_InfoQ精选文章