速来报名!AICon北京站鸿蒙专场~ 了解详情
写点什么

深度学习在高德 ETA 应用的探索与实践

  • 2020-06-18
  • 本文字数:1687 字

    阅读完需:约 6 分钟

深度学习在高德ETA应用的探索与实践

1.导读

驾车导航是数字地图的核心用户场景,用户在进行导航规划时,高德地图会提供给用户 3 条路线选择,由用户根据自身情况来决定按照哪条路线行驶。



同时各路线的 ETA(estimated time of arrival,预估到达时间) 会直接显示给用户,这是用户关心的核心点之一。用户给定起点和终点后,我们的任务是预测起终点的 ETA,ETA 的准确率越高,给用户带来的出行体验越好。

2.基于深度学习模型的探索和实践

2.1 模型选择

传统机器学习模型在 ETA 中,比较常用的有线性回归、RF(随机森林)、GBDT(梯度提升决策树)等回归预测类模型。线性模型表达能力较差,需要大量特征工程预先分析出有效的特征;RF 通过样本随机和特征随机的方式引入更多的随机性,解决了决策树泛化能力弱的问题;GBDT 是通过采用加法模型(即基函数的线性组合),以及不断减小训练过程产生的残差来达到回归的算法。


传统机器学习模型相对简单易懂,也能达到不错的效果,但存在两个问题:


  • 模型的表达能力跟选取的特征有关,需要人工事先分析出有效的特征。

  • 没有考虑上游对下游路段的影响,产生了如丢失上下游关联信息、下游受上游影响导致的不确定性等问题。


第一个问题很好理解,深度学习模型能很好地弥补这方面。针对第二个问题,以历史速度信息选取存在的不确定性为例来说明一下,历史速度信息是一个区分周一到周日七个工作日、10 分钟间隔的历史平均时间,可以根据该路段的预计进入时间所在 10 分钟区间来选定。如下图(历史平均速度)从 0:00-24:00 的变化曲线,可以看到一天中特别是早晚高峰,速度值存在较大波动。



而在选取历史平均时间时,依赖的是预计进入时间,这个时间依赖于上游路段的预计通行时间,因此其选取存在不确定性,进而导致 ETA 计算不准确。


考虑到以上问题的存在,我们选择利用 RNN 的时间序列思想将路线中上下游路段串联起来进行路段 ETA 的预测。


另外考虑到 RNN 存在的长依赖问题,且结合实际业务情况,我们选择使用 LSTM 模型来进行建模,LSTM 的门结构具有的选择性还能让模型自行学习选择保留哪些上游的特征信息进行预测。

2.2 网络架构


上图为整个模型的框架图,主要分为两部分,使用 LSTM 模块对路线中的路段 ETA 的预测和最终使用 N 层全连接模块对累计路段 ETA 及路线各特征进行完整路线的 ETA 预测。

2.3 路段 ETA 预测


上图为各路段 ETA 预测使用的 LSTM 结构图,Xt 为路线中第 t 个路段的特征信息,主要包含对应的实时路况信息、历史路况信息、路段的静态特征等。


LSTM 本是输入时间序列数据的模型,我们利用该思想,将路线中各路段序列依次输入模型。

2.4 完整路线 ETA 预测

在 LSTM 模块得到累计路线 ETA 预测值后,结合该路线的静态属性,使用全连接模块将其整合成最终输出的完整路线 ETA 预测值。


路线的属性特征主要指一些人工提取的特征,如该路线的长度、导航规划发起特征日、是否早晚高峰时段等,用以加强模型在不同场景下的表达能力。


损失函数选用线性回归常用的平方形式:MSE,公式如下:



其中,N 是路线数量,ETA 路线 j 为路线 ETA,即预测值;用户实走 j 为用户在该路线的实走时间,即真值。

3.模型效果

衡量模型效果,即路线上 ETA 的预测值时,主要考虑的是准确率。一般情况下,用户对 ETA 偏长和偏短的容忍度不同,对偏长容忍度更高。比如用户要去机场,ETA 给的时间偏短 10 分钟比偏长 10 分钟对用户的损害更大。因此准确度的指标设计倾向于 ETA 偏长,定义为满足用户一定容忍范围的请求比例,即准确率作为主要衡量指标。


在北京市上的实验结果显示,ETA 准确率得到提升,MSE loss 下降比例 28.2%,效果有了明显的提升。

4.小结

本文介绍了引入深度学习模型,帮助建模导航规划的预估到达时间预测,成功解决了线性模型的不足,也为后续引入更多特征、进行更多探索打开了空间,如历史速度信息的不确定度、时效性、周期性、突发事件、路网结构等。


本文转载自公众号高德技术(ID:amap_tech)。


原文链接


https://mp.weixin.qq.com/s?__biz=Mzg4MzIwMDM5Ng==&mid=2247485006&idx=2&sn=b837e9658599eef64acbab11409601a7&chksm=cf4a5eadf83dd7bb73e340f31ba92c1b3aa74378829793b6d7bba98272d15f42a4509ea747a9&scene=27#wechat_redirect


2020-06-18 10:001973

评论

发布
暂无评论
发现更多内容

PON网络应用场景

小魏写代码

TiDB x 云盛海宏丨加速精细化运营,云海零售系统的架构演进

TiDB 社区干货传送门

实践案例

TiDB x CAPCOM丨为在线游戏提供灵活、可靠、可扩展的数据库服务

TiDB 社区干货传送门

实践案例

同城双机房公网环境下搭建TIDB集群

TiDB 社区干货传送门

数据库架构设计

来文心中国行厦门站,感受大模型落地生花的进展!

飞桨PaddlePaddle

文心一言 文心中国行

如何搞砸一场面试?

王磊

Java 面试

CodeWhisperer--手把手教你使用一个十分强大的工具

亚马逊云科技 (Amazon Web Services)

Python 人工智能 云上探索实验室 Amazon CodeWhisperer Amazon Cloud9

Mini PCIe WiFi card SOC-QCA9880 vs. QCA9882: 802.11ac Dual-Band Wireless Chipset Sh

wifi6-yiyi

QCA9880 Mini PCIe WiFi card

你真的了解@Async吗? | 京东云技术团队

京东科技开发者

spring 注解 Async 企业号11月PK榜

APM建设踩了哪些坑?去哪儿旅行分布式链路追踪系统实践

TakinTalks稳定性社区

同城双机房公网+阿里云ECS搭建混合云TIDB集群

TiDB 社区干货传送门

数据库架构设计

一张图厘清各大操作系统的发展脉络

巫山老妖

欢迎提报 | 2023年龙蜥社区优秀贡献者评选正式启动

OpenAnolis小助手

开源 操作系统 龙蜥社区 最佳案例 突出贡献

提升提测质量之研测共建 | 京东云技术团队

京东科技开发者

测试 研发 企业号11月PK榜

Colibri for Mac(原生无损音频播放器) 2.1.9永久激活版

mac

苹果mac Windows软件 Colibri 音频播放器软件

OpenCL任务调度基础介绍 | 京东物流技术团队

京东科技开发者

gpu 编程语言 企业号11月PK榜 OpenCL

TiDB 在安信证券资产中心与极速交易场景的实践

TiDB 社区干货传送门

实践案例

为何选择独立服务器?稳定、高效、安全等优势一览

一只扑棱蛾子

独立服务器

更快更省更好用!天翼云云原生一体机iStack打通物云最后一公里!

Geek_2d6073

故障发现、定位提效超70%,去哪儿可观测体系做了哪些优化?

TakinTalks稳定性社区

精彩回顾|从架构到实践,AntDB融合型数据库揭秘

亚信AntDB数据库

数据库 AntDB AntDB数据库

利用 Kubernetes 降本增效?EasyMR 基于 Kubernetes 部署的探索实践

袋鼠云数栈

Kubernetes 运维 集群管理

21 天技术人写作行动营招募中

InfoQ写作社区官方

AI 写作 写作技巧 热门活动 活动预告

微众银行 TiDB HTAP 和自动化运维实践

TiDB 社区干货传送门

实践案例

任福继院士:基于交叉学科的研究将成主流,算力平台和计算人才是自主创新关键

Geek_2d6073

邀请报名|11月24日阿里云原生 Serverless 技术实践营 深圳站

Serverless Devs

云计算 Serverless AIGC 沙龙预告

为了 Vue 组件测试,你需要为每个事件绑定的方法加上括号吗?

OpenTiny社区

开源 Vue 前端 测试

TiDB Cloud 上 Tiflash 列存功能初体验

TiDB 社区干货传送门

版本测评 性能测评 新版本/特性解读

微信团队分享:详解iOS版微信视频号直播中因帧率异常导致的功耗问题

JackJiang

网络编程 即时通讯 IM

体验函数计算 FC 3.0,写测评赢取索尼头戴式耳机

Serverless Devs

云计算 Serverless AIGC

深度学习在高德ETA应用的探索与实践_AI&大模型_高德技术_InfoQ精选文章