HarmonyOS开发者限时福利来啦!最高10w+现金激励等你拿~ 了解详情
写点什么

Algolia 通往高可用搜索 API 的狂暴之路(系列之一)

  • 2015-07-16
  • 本文字数:1531 字

    阅读完需:约 5 分钟

Algolia 是一家提供托管式搜索 API 的初创企业。作为一家年轻的企业,其架构令人印象深刻:

  • 其高端专用机器托管在世界上 13 个地区的 25 个数据中心里
  • 其 master-master 配置至少会在三台不同的机器上复制他们的搜索引擎
  • 每个月处理超过 60 亿次查询
  • 每个月接收和处理超过 200 亿次写操作

Julien Lemoine 是 Algolia 的联合创始人兼首席技术官。他计划用一个系列的文章,介绍他们如何分 15 步构建出如此高可用的基础设施。近日,他发表了这个系列的第一篇文章,重点讨论了前三个步骤。

在开始介绍架构之前,Julien 比较了云和裸机。对于大多数情况而言,云基础设施都是一个不错的方案。它易于部署,而且本身提供了高可用性。而基于裸机的基础设施需要他们自己构建高可用性。但选择裸机基础设施,他们可以购买性能更好的硬件,而且与所获得的性能相比,价格也算相当便宜了。

接下来,Julien 按时间顺序介绍了 Algolia 架构演进的前三个阶段,时间跨度为 2013 年 3 月到 8 月。

步骤 1:2013 年 3 月

这个阶段,他们的搜索服务 API 内测版本开始运行。基于对产品市场前景的自信,他们在两个不同的地点(加拿大东部和欧洲西部)分别部署了一台机器。每台机器根据地点为不同的用户提供服务。此时,他们百分百关注性能,时钟频率是他们决策时重点考虑的一个因素,因为就同一代 CPU 而言,时钟频率与搜索引擎的搜索查询速度有直接关系。索引由单独的进程完成,而且优先级较低;而所有的查询都直接在 nginx 内处理,并且优先级最高,即它可以占用更多的 CPU 时间,这样可以有效地处理流量峰值。让他们引以为豪的是,其中一个内部测试用户执意用 Algolia 的服务替换了其当时正在使用的解决方案。

步骤:2013 年 6 月

经过三个月的开发和大量的测试,他们在 Beta 测试中引入了高可用性,其思想是:用集群取代了单机,集群由三台相同的机器组成,每台机器都完美地复制了所有数据,均可以作为 master。也就是说,每台机器都可以接受用户的写操作,每次写操作都会触发一个一致性保证机制。另外,基于前期的测试,他们发现:

  • 32G 的内存不够用,单是索引进程有时候就会用掉 10G
  • 磁盘空间不够用,为了处理节点失败,机器需要将多个任务保存在磁盘上

由于内存需求增加,他们将机器由 Xeon E3 系列换成了 Xeon E5 系列,因为前者只能处理 32G 内存。而考虑到时钟频率的重要性,他们决定采用 Xeon E5 1600 系列。至此,他们已经提供了高可用性。

与此同时,他们还测试了多种负载均衡和故障检测方法,发现所有的硬件负载均衡器均让他们几乎不可能使用多个提供商。于是,他们在 API 客户端中实现了一种基本的重试策略,即在开发的时候确保每个 API 都能够访问三台不同的机器。

步骤 3:2013 年 8 月

他们将 API 客户端的数量增加到 10 种, 包括 JS、Ruby、Python、PHP、Objective-C、Java、C#、Node.js 等。而且,他们尽量避免自动生成代码,人工开发了 API 客户端。2013 年 8 月,他们在上述两个地点(加拿大东部和欧洲西部)正式推出了其搜索服务 API。每个地点一个集群,每个集群包含三台相同的主机。主机换成了 E5-2687W,内存加倍(128G),并且使用了更好的 SSD。这主要是因为他们观察到,内存不足以缓存所有的用户数据,而 SSD 成为索引速度的瓶颈。接下来,他们又重点实现了“可用区域(availability zone)”。关于这一点,Julien 并未提供细节信息。

在本系列的下一篇文章中,Julien 将介绍其 API 正式推出后前 18 个月的情况以及所有意料之外的问题,其中包括第一次停机。


感谢徐川对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群)。

2015-07-16 09:004015
用户头像

发布了 1008 篇内容, 共 389.7 次阅读, 收获喜欢 344 次。

关注

评论

发布
暂无评论
发现更多内容

即构微信小程序直播组件是什么?有哪些功能?哪些小程序类目可以使用?

ZEGO即构

量化策略交易软件开发|量化策略交易系统APP开发

系统开发

如何利用策略模式避免冗长的if-else/switch分支判断代码?

码农架构

Java 学习 设计模式

Linux I/O 原理和 Zero-copy 技术全面揭秘

赖猫

c++ Linux linux编程 服务器开发 I/O

DeFi流动性挖矿管理系统开发|去中心化金融借贷系统开发

W13902449729

去中心化金融借贷系统开发 DeFi流动性管理系统开发

百度研究院的追星逐浪,中国科技的奋发自强

脑极体

阿里2021年首次公开五份Java并发编程全彩小册:模型+原理+应用+模式+面试题五管齐下

Java架构追梦

Java 学习 架构 面试 并发编程

高并发架构---TCP

赖猫

TCP 后端 高并发 TCP/IP 服务器开发

区块链发展应以密码应用创新为根基

CECBC

区块链 密码学

K线成交量管理系统开发、成交量管理系统开发

W13902449729

K线成交量管理系统开发 成交量管理系统开发

2021年编排将成为DevSecOps关键推动者

啸天

DevSecOps 应用安全 开发安全

超强Android进阶路线知识图谱:Kotlin可能带来的一个深坑,持续更新中

欢喜学安卓

android 程序员 面试 移动开发

细节!3部分讲明白HotSpot:运行时+编译器+垃圾回收器

996小迁

Java 架构 虚拟机 hotspot

区块链大趋势

CECBC

数字经济

厉害了!来看看这份超全面的《Android面试题及解析》,一线互联网公司面经总结

欢喜学安卓

android 程序员 面试 移动开发

Serverless 架构到底要不要服务器?

Serverless Devs

Java 云计算 Serverless 运维 云原生

Linux网络之 从 C10K 到 DPDK

赖猫

c++ Linux linux编程 C10K DPDK

Java 程序经验小结:类层次优于标签类

后台技术汇

28天写作

五分钟快速掌握Maven的核心概念

Java架构师迁哥

阿里面试官纯手打:金九银十跳槽必会Java核心知识点笔记整理

Java架构之路

Java 程序员 架构 面试 编程语言

中美上市软件公司对比中的投资启示

ToB行业头条

持续集成对IT团队和企业分别有哪些好处?

禅道项目管理

DevOps 运维 开发 CI/CD

WiFi6 与 5G 的异同分析

石君

5G wifi 28天写作

“区块链+数字身份”,道路坎坷前途光明

CECBC

数字技术

工作11年,从阿里P8出来,头发也没了,人也虚了,就剩下这份笔记了!

Java架构之路

Java 程序员 架构 面试 编程语言

字节内部MySQL宝典意外流出!极致经典,堪称数据库的天花板

比伯

Java 编程 架构 面试 程序人生

比特币矿机工作原理

v16629866266

比特币 比特币区块链

在函数计算中到底该不该使用 VPC?

donghui

Serverless

现货合约量化交易系统开发搭建

薇電13242772558

数字货币 策略模式

为什么建议没事不要随便用工厂模式创建对象?

码农架构

Java 学习 设计模式

并发阻塞队列(BlockingQueue)— 生产者消费者模式核心部件

码农架构

Java 架构 jdk 设计模式

Algolia通往高可用搜索API的狂暴之路(系列之一)_架构_谢丽_InfoQ精选文章