写点什么

人群移动轨迹可视化新论文,入选 IEEE TVCG 及 VIS

  • 2020-10-08
  • 本文字数:1966 字

    阅读完需:约 6 分钟

人群移动轨迹可视化新论文,入选IEEE TVCG及VIS

近日, TalkingData 与北京航空航天大学、浙江大学合作论文 “UrbanMotion: Visual Analysis of Metropolitan-Scale Sparse Trajectories”,入选 国际顶级期刊 IEEE TVCG ,并受邀在 10 月举办的 IEEE VIS 大会 上进行全文报告。


本研究基于脱敏后的京津冀城市群超过 120 亿条移动终端位置记录, 对城市人群移动模式进行了挖掘和分析,创新性地提出了针对时间稀疏轨迹的分类、聚合和可视化方法 。本研究成果有望作为新的交互分析手段,为城市规划、交通优化、商业选址等应用领域带来重要价值。


IEEE Transactions on Visualization and Computer Graphics(TVCG)是可视化领域排名第一的国际顶级期刊。 该 19 页长文获得了 TVCG 的全文刊登, 并获得了期刊编辑的高度评价。论文第一作者北京航空航天大学时磊教授,将代表研究团队在可视化领域全球规模最大、最受认可的 顶级会议 IEEE Visualization Conference(VIS)2020 年度大会上 ,对论文进行详细介绍。

基于大规模数据集创新算法和可视化方式

本次研究使用的数据集由国内领先的数据智能服务提供商 TalkingData 提供 ,包括来自约 4265 万个设备的超过 122 亿条的脱敏位置信息。以往类似研究基于的数据通常规模较小且来源单一,而本次研究使用的数据集来自超过 10 万种移动应用程序,不仅规模庞大,而且具有整合多数据来源的优势,可以覆盖更多类型的移动轨迹、具有更小的误差。但同时,这些轨迹数据也具有采样随机且时间稀疏的特点,为数据挖掘和分析带来了一定难度。


经过探索, 论文中提出了一系列针对稀疏轨迹数据的分析和可视化方法,并总结出一套包含移动提取、人流聚合、路段匹配、模式发现、移动可视化以及用户交互六大阶段的流程。 为了解决数据的稀疏性这一难点,论文中提出了可以准确高效地判断记录静止/移动的 SDS 算法。为了实现不同区域内移动流的聚类,论文中设计了一维的 DBSCAN 向量聚类方法。此外,论文中还设计了模式发现算法,用于检测各区域的类型及异常度。在可视化方面,论文中对流生成算法和风图可视化技术进行了改进,采用动态流和热力图结合的展示形式,设计了多种展示和交互方式。


本研究最终实现了一个可以 从大规模的脱敏位置数据中提取人群移动模式、并将其直观展示出来的可视化分析系统——UrbanMotion ,该系统可以用于 城市人群移动概况观测、局部人口流动模式观测和分析、人群分布与人群移动之间的关系探索以及异常模式检测和大型事件检测等场景

行业调研案例验证多场景应用价值

研究团队邀请了相关行业专家对论文成果进行了调研,结合通勤分析、异常检测、广告投放等多个应用案例分析证明了系统的可用性和有效性。


例如 在通勤分析的案例中 ,专家选取了北京一个普通工作日,来观察早间通勤时段的人群移动情况。结果如下图所示,可以看出轨迹的可视化结果与北京市道路路网走向大多一致。通过观察流量最多的移动轨迹,即图中密度较大、线条较粗的流,可以很直观地识别出中关村、CBD 等重要的就业中心;而 回龙观与西二旗地区的人群流动颜色较暗,表示对应的移动速度较慢,说明该地区的通勤状况不佳



图:北京市人群移动轨迹分析


对比早间通勤时段与中午 12 点回龙观和西二旗地区的移动热力图,可以发现 两个地区的职住平衡较差 :早间时段西二旗地区中心有一个突出的红色区域——说明人群主要向这里聚集,而回龙观地区显示大片蓝色——说明这里是人群的主要来源;而中午 12 点的热力图中,两地不再有明显的颜色差异,说明通勤行为大部分已结束。当地图切换到路网模式时,可以看到西二旗和回龙观中间被 G6 高速公路阻隔。专家表示, 道路的拓扑结构在一定程度上导致了西二旗和回龙观地区的交通拥堵,未来这部分区域需要建立更多的道路来满足通勤需求。



图:(左)早间通勤时段移动热力图与(右)中午 12 点移动热力图对比


通过案例调研,可以验证 UrbanMotion 系统在如城市规划、交通优化、安全防护、事件预测、商业选址等公共事业领域和商业领域,都可以提供重要价值。

企业+名校产学研结合促进大数据应用

本研究, 由北京航空航天大学计算机学院大数据科学与脑机智能高精尖创新中心时磊教授团队、浙江大学计算机学院副院长陈为教授团队、TalkingData 首席数据科学家张夏天团队(通讯作者)共同完成 。后续,研究团队计划对系统进一步优化,并推动在各行业场景下的落地应用。


这是 国内顶尖院校与领先企业携手在大数据领域的一次成功探索 ,也是 TalkingData 近年来倡导构建“连接、安全、共享”数据智能应用生态的又一次践行。将院校的理论基础和科研能力与企业的数据能力和行业经验相结合,优势互补,更有助于用新思路、新技术、新方案为大数据应用赋能,为促进国家大数据战略落地、加速数字化转型升级带来 1+1>2 的效果。


本文转载自公众号 TalkingData(ID:Talkingdata)。


原文链接


人群移动轨迹可视化新论文,入选IEEE TVCG及VIS


2020-10-08 14:001784

评论

发布
暂无评论
发现更多内容

每日算法刷题Day4-完全数、分情况输出、平方矩阵、斐波那契数列匹配输出

timerring

刷题 算法题 9月月更

Java进阶(三十六)深入理解Java的接口和抽象类

No Silver Bullet

Java 接口 抽象类 9月月更

orbeon form 的架构简介 - 如何访问用户通过 form 存储的数据

汪子熙

SAP Hybris commerce form 9月月更

爱番番企业查询结果优化实践

百度Geek说

大数据 搜索引擎 elasticsearch

MSE 结合 Dragonwell,让 Java Agent 更好用

钟奕礼

编程 java; MSE

每日算法刷题Day3-起始时间转换、二次方根、while连续输入、斐波那契思路

timerring

刷题 算法题 9月月更

从 0 到 1 上手阿里云服务器 ECS(三)

六月的雨在InfoQ

MySQL RDS ECS 云数据库RDS for MySQL 9月月更

每日算法刷题Day5-平方矩阵II和III、蛇形矩阵图解

timerring

刷题 算法题 9月月更

安全、可靠、稳定的企业IM,WorkPlus是政企工作的首选

BeeWorks

java技术线下面授培训学习好还是自学好

小谷哥

参加java培训学习难不难?

小谷哥

阿里P9师傅亲传98K+星的MySQL性能优化金字塔法则手册助我升职P7

Geek_0c76c3

Java 数据库 开源 程序员 架构

每日算法刷题Day2-向上取整、三角形条件、字符串拼接匹配、三数排序思路

timerring

算法 刷题 9月月更

MASA Stack 第五期社区例会

MASA技术团队

MASA Framewrok MASA MASA Blazor

再添重磅理事成员!麒麟软件、浪潮信息、中科曙光、新华三加入龙蜥

OpenAnolis小助手

龙蜥社区 新华三 中科曙光 麒麟软件 浪潮信息

Java面试:你了解HashMap吗?

钟奕礼

编程 面试 java;

文科生大数据培训需要注意的问题

小谷哥

每日算法刷题Day1-隐式转换与精度丢失

timerring

算法 刷题笔记 9月月更

每日算法刷题Day7-比较字符串大小,去掉多余的空格,单词替换

timerring

算法 刷题 9月月更

极狐GitLab 15.4 | 四大专享更新、更能打的CI/CD,近 50 项更新全面来袭!

极狐GitLab

DevOps 运维 Harbor CI/CD 极狐GitLab

每日算法刷题Day6-循环相克令,字符串插入,单次字符出现

timerring

算法 刷题 9月月更

回归理性,直面低代码

华为云开发者联盟

云计算 后端 软件开发 低代码 企业号九月金秋榜

web前端开发技术培训需要学习多久

小谷哥

Redis进阶知识点(可学习,可复习,可面试)

钟奕礼

编程 redis 底层原理

得物基于 StarRocks 的 OLAP 需求实践

得物技术

数据库 开源 OLAP 开发工具 StarRocks

移动应用平台有哪些优势?能为企业带来什么好处?

BeeWorks

膜拜大佬!分享一份京东T9大牛私藏文档:从NIO一直学到Netty

Geek_0c76c3

Java 数据库 开源 程序员 开发

面试中经常问到的几个问题,快来看看能答对几道吧(Java)

钟奕礼

编程 java;

Java开发学习----SpringBoot三种配置文件解析

钟奕礼

编程 Spring Boot java;

Github星标百万!终于有人将Spring技术精髓收录成册

Geek_0c76c3

Java 数据库 开源 程序员 开发

参加前端培训哪种方式比较靠谱

小谷哥

人群移动轨迹可视化新论文,入选IEEE TVCG及VIS_移动_TalkingData_InfoQ精选文章