写点什么

人群移动轨迹可视化新论文,入选 IEEE TVCG 及 VIS

  • 2020-10-08
  • 本文字数:1966 字

    阅读完需:约 6 分钟

人群移动轨迹可视化新论文,入选IEEE TVCG及VIS

近日, TalkingData 与北京航空航天大学、浙江大学合作论文 “UrbanMotion: Visual Analysis of Metropolitan-Scale Sparse Trajectories”,入选 国际顶级期刊 IEEE TVCG ,并受邀在 10 月举办的 IEEE VIS 大会 上进行全文报告。


本研究基于脱敏后的京津冀城市群超过 120 亿条移动终端位置记录, 对城市人群移动模式进行了挖掘和分析,创新性地提出了针对时间稀疏轨迹的分类、聚合和可视化方法 。本研究成果有望作为新的交互分析手段,为城市规划、交通优化、商业选址等应用领域带来重要价值。


IEEE Transactions on Visualization and Computer Graphics(TVCG)是可视化领域排名第一的国际顶级期刊。 该 19 页长文获得了 TVCG 的全文刊登, 并获得了期刊编辑的高度评价。论文第一作者北京航空航天大学时磊教授,将代表研究团队在可视化领域全球规模最大、最受认可的 顶级会议 IEEE Visualization Conference(VIS)2020 年度大会上 ,对论文进行详细介绍。

基于大规模数据集创新算法和可视化方式

本次研究使用的数据集由国内领先的数据智能服务提供商 TalkingData 提供 ,包括来自约 4265 万个设备的超过 122 亿条的脱敏位置信息。以往类似研究基于的数据通常规模较小且来源单一,而本次研究使用的数据集来自超过 10 万种移动应用程序,不仅规模庞大,而且具有整合多数据来源的优势,可以覆盖更多类型的移动轨迹、具有更小的误差。但同时,这些轨迹数据也具有采样随机且时间稀疏的特点,为数据挖掘和分析带来了一定难度。


经过探索, 论文中提出了一系列针对稀疏轨迹数据的分析和可视化方法,并总结出一套包含移动提取、人流聚合、路段匹配、模式发现、移动可视化以及用户交互六大阶段的流程。 为了解决数据的稀疏性这一难点,论文中提出了可以准确高效地判断记录静止/移动的 SDS 算法。为了实现不同区域内移动流的聚类,论文中设计了一维的 DBSCAN 向量聚类方法。此外,论文中还设计了模式发现算法,用于检测各区域的类型及异常度。在可视化方面,论文中对流生成算法和风图可视化技术进行了改进,采用动态流和热力图结合的展示形式,设计了多种展示和交互方式。


本研究最终实现了一个可以 从大规模的脱敏位置数据中提取人群移动模式、并将其直观展示出来的可视化分析系统——UrbanMotion ,该系统可以用于 城市人群移动概况观测、局部人口流动模式观测和分析、人群分布与人群移动之间的关系探索以及异常模式检测和大型事件检测等场景

行业调研案例验证多场景应用价值

研究团队邀请了相关行业专家对论文成果进行了调研,结合通勤分析、异常检测、广告投放等多个应用案例分析证明了系统的可用性和有效性。


例如 在通勤分析的案例中 ,专家选取了北京一个普通工作日,来观察早间通勤时段的人群移动情况。结果如下图所示,可以看出轨迹的可视化结果与北京市道路路网走向大多一致。通过观察流量最多的移动轨迹,即图中密度较大、线条较粗的流,可以很直观地识别出中关村、CBD 等重要的就业中心;而 回龙观与西二旗地区的人群流动颜色较暗,表示对应的移动速度较慢,说明该地区的通勤状况不佳



图:北京市人群移动轨迹分析


对比早间通勤时段与中午 12 点回龙观和西二旗地区的移动热力图,可以发现 两个地区的职住平衡较差 :早间时段西二旗地区中心有一个突出的红色区域——说明人群主要向这里聚集,而回龙观地区显示大片蓝色——说明这里是人群的主要来源;而中午 12 点的热力图中,两地不再有明显的颜色差异,说明通勤行为大部分已结束。当地图切换到路网模式时,可以看到西二旗和回龙观中间被 G6 高速公路阻隔。专家表示, 道路的拓扑结构在一定程度上导致了西二旗和回龙观地区的交通拥堵,未来这部分区域需要建立更多的道路来满足通勤需求。



图:(左)早间通勤时段移动热力图与(右)中午 12 点移动热力图对比


通过案例调研,可以验证 UrbanMotion 系统在如城市规划、交通优化、安全防护、事件预测、商业选址等公共事业领域和商业领域,都可以提供重要价值。

企业+名校产学研结合促进大数据应用

本研究, 由北京航空航天大学计算机学院大数据科学与脑机智能高精尖创新中心时磊教授团队、浙江大学计算机学院副院长陈为教授团队、TalkingData 首席数据科学家张夏天团队(通讯作者)共同完成 。后续,研究团队计划对系统进一步优化,并推动在各行业场景下的落地应用。


这是 国内顶尖院校与领先企业携手在大数据领域的一次成功探索 ,也是 TalkingData 近年来倡导构建“连接、安全、共享”数据智能应用生态的又一次践行。将院校的理论基础和科研能力与企业的数据能力和行业经验相结合,优势互补,更有助于用新思路、新技术、新方案为大数据应用赋能,为促进国家大数据战略落地、加速数字化转型升级带来 1+1>2 的效果。


本文转载自公众号 TalkingData(ID:Talkingdata)。


原文链接


人群移动轨迹可视化新论文,入选IEEE TVCG及VIS


2020-10-08 14:001916

评论

发布
暂无评论
发现更多内容

百度文心多项任务分数刷新GLUE榜单,NLP界的“MVP”再次夺冠

百度大脑

自然语言处理 百度 文心 ERNIE

1500道算法面试题:Github上标星86.7K!直接火遍全网

比伯

Java 编程 程序员 架构 面试

2021年4款好用的音乐编曲软件推荐

奈奈的杂社

ZooKeeper 的选举机制,你了解多少?

架构 分布式

有源晶振和无源晶振的区别

不脱发的程序猿

28天写作 电路设计 3月日更 晶振 元器件

一文搞懂步进电机特性、原理及驱动器设计

不脱发的程序猿

硬件产品 28天写作 3月日更 步进电机 驱动电机

我用一个小小的开放设计题,干掉了40%的面试候选人

架构精进之路

Web 安全 软件设计 3月日更

音乐信息检索:理性解构音乐

阿里云CloudImagine

阿里云 算法 音频

JVM笔记 -- JVM经历了什么?

秦怀杂货店

Java JVM

Python 中级知识之装饰器,滚雪球学 Python

梦想橡皮擦

28天写作 3月日更

Weblogic11g安装部署-winserver篇

xiezhr

中间件 Windows Server 3月日更 weblogic

数字经济时代,区块链能否担当产业数字化转型核心赋能者?

旺链科技

区块链数字经济 区块链发展

轻量级的接口自动化冒烟框架

小小娃爱吃甜食

自动化 测试 框架 自动化部署

万字长文,肝了一下午的线程池详解!

一个优秀的废人

Java 多线程 线程池 线程池工作原理

什么是VXLAN?为什么需要VXLAN?

华为云开发者联盟

网络 虚拟化 VLAN VXLAN 报文

mysql 四种隔离级别

Sakura

28天写作 3月日更

百度×TCL丨鸿鹄语音芯片首次在家电行业量产!

百度大脑

百度 语音识别 百度大脑 智能家居 百度智能云

全国大学生智能汽车竞赛-百度线下赛题发布!封狼居胥,等你来战!

百度大脑

人工智能 百度 比赛 飞桨 AI Studio

助我拿到37KOffer,这份阿里巴巴890页Redis笔记可谓功不可没

Java架构追梦

Java redis 阿里巴巴 架构 面试

阿里P8手把手教你!万字Android技术类校招面试题汇总,附赠课程+题库

欢喜学安卓

android 程序员 面试 移动开发

《精通比特币》学习笔记(第七章)

棉花糖

区块链 学习 3月日更

大作业

胡益

首款微控制器级树莓派 Pico,超廉价只需4美元

不脱发的程序猿

树莓派 28天写作 3月日更 树莓派 Pico 微处理器

【LeetCode】 基本计算器 II Java题解

Albert

算法 LeetCode 28天写作 3月日更

HashData与HDFS的高效数据交换

酷克数据HashData

带你全面认识CMMI V2.0(一)

IPD产品研发管理

项目管理 CMMI

江苏交通控股打造IT架构云转型下的智慧交通

酷克数据HashData

HashData多集群共享统一存储架构

酷克数据HashData

HashData外部表的实现与应用

酷克数据HashData

快了何止300%?阿里巴巴Java优化:设计+程序+并行+JVM+工具

Java架构追梦

Java 阿里巴巴 架构 面试 性能优化

阿里P8亲自教你!2021Android大厂面试知识分享,实战篇

欢喜学安卓

android 程序员 面试 移动开发

人群移动轨迹可视化新论文,入选IEEE TVCG及VIS_移动_TalkingData_InfoQ精选文章