写点什么

Uber 是如何基于 Go 语言构建高 QPS 服务的?

  • 2016-04-11
  • 本文字数:2255 字

    阅读完需:约 7 分钟

在 2015 年初,我们构建了一个只做一件事(也的确做的非常好)的微服务——查找地理围栏(geofence lookup)。一年后,这项服务已经成为 Uber 数百个正在运行的服务中每秒查询次数(QPS)最高的服务。接下来,本文将谈论我们构建这项服务的原因以及我们是如何使用 Go 语言快速构建和扩展这项服务的。

背景

在 Uber,一个地理围栏就表示地球表面上人为划分的一个地理区域。此外,我们进一步在基于地理的配置中使用地理围栏的概念。地理围栏的概念在很多地方发挥了很重要的作用——向用户展示在某个位置可使用的产品时,定义机场等特殊用途区域时以及在很多人同时呼叫实现动态定价时。

Colorado 的一个地理围栏样例

在提取用户手机的经纬度坐标等基于地理位置的配置信息时,需要做的第一件事情就是确定该位置落在哪个地理围栏中。而该功能已经在多个服务或模块中被实现。但是,当我们从一体化架构转移到基于微服务的架构时,我们选择了将这项功能集中在一个新的单独的微服务中进行实现。

选择Go 的原因

当我们评估所要使用语言的时候, Node.js 正是广大的服务设计团队普遍采用的编程语言。而我们也在 Node.js 的使用方面有着丰富的经验。然而,Go 语言却由于以下原因满足了我们的需求:

  • 高吞吐量和低延迟的需求。Uber 的手机端 App 在发送请求时,必然会触发一次查找地理围栏的操作。而服务器必须要能够对每秒上万次的请求以 99% 的概率响应时间小于 100ms 的速度进行响应。
  • CPU 密集型负载。查找地理围栏需要使用计算密集型的 Point-In-Polygon(PIP)算法。尽管 Node.js 可以很好的用于 I/O 密集型的服务,解释执行以及动态类型定义等的特性使得它并不适合于我们的使用场景。
  • 非中断式的后台加载。为了保证查询操作是基于最新的地理围栏信息而进行的,服务必须要能够根据多个数据源的信息在后台实时刷新内存中的地理围栏数据。因为 Node.js 是单线程的,后台刷新很可能会占用一定的CPU 时间(如CPU 密集型的 JSON 的编译工作),最终导致部分查询的响应时间过长。但是,对于 Go 语言而言,这完全不是问题。 Goroutine 可以运行在多个 CPU 核上,并且可以在响应前端查询的同时后台并行进行刷新数据的工作。

是否建立地理信息索引——这是个问题

当给定了一个经纬度坐标的位置信息时,如何从上万个地理围栏中找到该位置所在的那一个呢?最直接而暴力的解决方法为:浏览所有的地理围栏,然后采用光线投射(Ray Casting)等算法进行PIP 检查。但是,这种方法实在是太慢了。那么,我们怎么才能有效的缩小搜索空间呢?

由于Uber 的商业模型是以城市为中心的,我们并没有采用 R-tree S2 等结构来索引地理围栏,而是采用了一个相对要简单很多的算法;商业规则以及相关的地理围栏都和城市相关。这使得我们可以采用层次式的方式来组织地理围栏——第一层是定义城市边界的围栏,而第二层是城市内的城市围栏。

对于每一次查询,我们首先线性扫描所有的边界城市围栏,找到目的城市。然后,我们采用另外一种线性扫描的方法来找到城市内的目标城市围栏。尽管新算法的复杂度仍然是 O(N),它却把 N 从万降到了百,大大减少了算法执行的复杂性。

架构

根据设计需求,我们希望这项服务是无状态的。因此,每一次请求都可以发送给任意的服务实例,并获得相同的结果。这意味着每一个服务实例都必须掌握全局信息,而非局部信息。我们采用了一种确定性的轮询调度策略,从而保证了不同服务实例的地理围栏数据都是同步的。这样,该服务的架构也非常简单。后台任务周期性地轮询来自不同数据源的数据。而这些数据就保存在主存中以服务不同的查询。同时,数据被串行保存在本地文件系统中,以实现系统重启时的快速引导。

查询地理围栏服务的架构

处理Go 存储模型

我们的服务架构需要对内存中的地理索引信息进行并行读写访问。在特殊情况下,后台轮询任务修改索引,而前台查询引擎同时从索引中读取信息。相比于利用单线程的Node.js 进行服务编写的情况而言, Go 存储模型必然会遇到挑战。尽管 Go 语言可以利用 goroutine 和 channel 自然的实现并行读写,其带来的性能影响不可忽视。我们试图利用 sync/atomic 包中的 _StorePointerLoadPointer_ 原语来自己管理内存屏障。但是,这导致了代码难以理解和维护。

最终,我们选择了一种折衷的方式——利用读写锁来保证对地理索引的同步访问。为了减少锁的竞争,新的索引片段在被自动交换到主索引之前都是处于隐藏状态的。相比于_StorePointerLoadPointer_ 方法,这种锁会轻微增加查询延迟。但是,我们维护代码库的工作却变得简单很多,非常值得。

我们的经验

回首过往,我们非常开心选择了 Go 语言来编写我们的服务。其带来的好处包括:

  • 高的设计效率。对于 C++,Java 或 Node.js 的开发者而言,学习 Go 语言只需要几天。而且代码维护工作也很简单。(这一切都是因为静态类型检查。)
  • 高吞吐量和低延迟。在我们处理非中国区流量的数据中心中,该服务在 40 台机器 35% 的 CPU 利用率的情况下的最高 QPS 为 170,000。其响应时间为 95% 的概率低于 5ms,99% 的概率低于 50ms。
  • 超级可信。从启动到现在,该服务正常运行的时间为总时间的 99.99%。唯一的一次停止服务也是由初级编程错误和第三方库中的文件描述符泄露 bug 引起的。最重要的是,我们迄今为止没发现任何有关 Go 运行时的问题。

未来的展望

尽管 Uber 曾经主要采用 Node.js 和 Python,Go 语言正在成为 Uber 设计师构建新服务的选择。


感谢郭蕾对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2016-04-11 17:276827
用户头像

发布了 268 篇内容, 共 123.3 次阅读, 收获喜欢 24 次。

关注

评论

发布
暂无评论
发现更多内容

融云一图看懂 | 居家办公的正确姿势

融云 RongCloud

明道云APaaS在酒店业中的应用场景例举

明道云

​对 Jenkins 和 CloudBees CI 的 UI 改进

龙智—DevSecOps解决方案

CloudBees

Nebula Graph|信息图谱在携程酒店的应用

NebulaGraph

图数据库 知识图谱 NebulaGraph

自助洗车机如何使用?其实很简单

共享电单车厂家

自助洗车加盟 自助洗车机使用

自助洗车机投放在哪里比较好?

共享电单车厂家

自助洗车加盟 车白兔自助洗车 自助洗车机投放 自助洗车场地

“微博评论”的高性能高可用计算架构

Dean.Zhang

2022年国内外好用的10大甘特图软件(团队使用)

爱吃小舅的鱼

项目管理 Worktile 研发管理 甘特图 PingCode

6元自助洗车怎么加盟?有啥门槛

共享电单车厂家

自助洗车怎么加盟 6元自助洗车 自助洗车加盟门槛

小插件大功能!轻量化森BIM插件手把手教学

ThingJS数字孪生引擎

插件 数字孪生 BIM

当家里小神兽睡醒乱爬导致摔下床后,我决定做点啥

BUG侦探

Python OpenCV WebRTC

新升级!网易数帆轻舟中间件推出运维稳定性管控服务

网易数帆

Kubernetes 运维 云原生 中间件 稳定性

自助洗车怎么洗?来看看洗车教程

共享电单车厂家

自助洗车加盟 自助洗车怎么洗 自助洗车机使用

在nginx中使用proxy protocol协议

程序那些事

Java nginx 网络协议 程序那些事 5月月更

首次全面定义,《2022企业应用运维管理指标体系白皮书》重磅发布

博睿数据

白皮书 博睿数据

最佳实践 | 用腾讯云AI文字识别从0到1实现通信行程卡识别

牵着蜗牛去散步

腾讯 文字识别 技术实践 腾讯云AI 疫情防控

钉钉宜搭发布大学生低代码实践计划,一起为公益发光发热!

一只大光圈

低代码 公益 钉钉宜搭

AIRIOT物联网低代码平台如何配置http客户端?

AIRIOT

物联网 HTTP 低代码平台

Apache Calcite SQL验证

不穿格子衬衫的程序员

数据库 大数据 SQL解析 Apche Calcite

一些销售术语

刘旭东

5月月更 销售术语

GaussDB(for Redis)新特性发布:前缀搜索千倍提升与集群版多租隔离

华为云开发者联盟

redis GaussDB(for Redis) 缓存数据库 多租隔离 前缀搜索

元宇宙与数字经济的互相融合,PlatoFarm的通证经济模型是根本

西柚子

客户体验和客户服务的区别

龙国富

客户服务 客户体验管理

关于数据一致性解决方案

穿过生命散发芬芳

数据一致性 5月月更

游戏美术和设计师的福音,Helix DAM 测试版来了!

龙智—DevSecOps解决方案

perforce Helix DAM

自助洗车机投放应该注意哪些问题?

共享电单车厂家

自助洗车加盟 自助洗车机投放 自助洗车场地

Golang名库观止 | 配置解析神器viper使用详解

程序员读书

Go golng golang 面试

Klocwork 2022.1推出Kotlin分析引擎

龙智—DevSecOps解决方案

klocwork perforce

架构实战营作业五

热猫

关于electron-builder打包遇到的一点点问题

空城机

Electron Node 5月月更

数据中心进入“液冷时代”,曙光引领绿色变革

WorkPlus

Uber是如何基于Go语言构建高QPS服务的?_语言 & 开发_张天雷_InfoQ精选文章