免费下载!由 O’Reilly 出版的《NGINX 完全指南》中文版已正式上线 了解详情
写点什么

分布式缓存能否作为 NoSQL 数据库?

  • 2011-11-13
  • 本文字数:2350 字

    阅读完需:约 8 分钟

对于文档、对象图、键值对这样的非关系型数据类型,NoSQL 数据库为它们提供了另一种可选的数据存储方式。分布式缓存能被用作 NoSQL 数据库吗?Ehcache 的 Greg Luck撰文描述了分布式缓存与NoSQL 数据库的相似性。InfoQ 就此采访了他,讨论了该方案的利弊之处。

InfoQ:你能否就分布式缓存解决方案与 NoSQL 数据库做个对比?

Greg Luck:分布式缓存通常会把数据放在内存里,用于降低延时。NoSQL 数据库是没有 R 的 DBMS(即没有关系的数据库管理系统),一般也缺乏对事务和其他高级特性的支持。对于不支持关系的系统,表关系的关联是 SQL 里最麻烦的部分,这也正是 NoSQL 这个名字的起源。

其中一种 NoSQL 数据库是键值存储。典型的例子包括 Dynamo、Oracle NoSQL Database 和 Redis。缓存也是键值存储,因此说这两者是相关的。很多缓存实现能被配置为可持久化的,之所以很多时候不那么做,是因为缓存是要提升性能而不是做持久化。而 NoSQL 数据库则与此相反,它是用来做持久化的。

持久化缓存也可当作键值 NoSQL 数据库来使用。NoSQL 也提到了 Big Data ,通常是指比能放进一个单独的 RDBMS 节点的量要大的数据,一般从几 TB 到几 PB。

分布式缓存通常用于降低事务性数据的延时,这些数据开始时并不大,但慢慢就会往 Big Data 这个方向发展。由于缓存将数据保存在内存里,这提高了存储的成本,而且需要限制数据的大小。如果依赖于堆存储,每个服务器节点可能只有可怜的 2GB。如果依赖于分布式缓存,Ehcache 还提供了堆外存储,每台服务器可以存储几百 GB 数据,可以用作 TB 级别的缓存。

持久化、分布式的缓存可以适用于一些 NoSQL 的场景。NoSQL 数据库也可以应对一些缓存的场景,只是延时稍高而已。

InfoQ:从架构角度来看,分布式缓存和 NoSQL 数据库有什么相似之处吗?

Greg:它们都想提供优于 RDBMS 的 TPS 和可扩展性。为此,它们都在功能上做了简化,抛开了那些麻烦的问题,比如表关联、存储过程和 ACID 事务。

虽然 Java 缓存领域里有 JSR 107 ,它为 Spring 和 Java EE 程序员提供了一套标准的缓存 API,但是比起标准化接口,它们都更倾向于使用私有接口。

它们都采用对客户端透明的方式对数据进行分区,做向外扩展。非 Java 产品向上扩展做得也很好。拥有 Terracotta BigMemory ,我们在 Java 平台上的向上扩展方面也做得很特别。最后,两者都可以部署在常见的硬件和操作系统上,这让它们都能理想地运行于云端。

InfoQ:架构上这两项技术又有何不同呢?

Greg:NoSQL 和 RDBMS 通常使用的是磁盘。磁盘是机械设备,延时很厉害,因为寻道时间是磁头移动到正确的磁道的时间,读写时间依赖于磁盘的 RPM。NoSQL 尝试优化磁盘的使用,例如,仅仅在磁头当前位置追加日志,偶尔才刷新到磁盘上。相反,缓存主要都把数据放内存里。

NoSQL 和 RDBMS 的客户端很薄(想想 Thrift 或 JDBC),只是在网络中传输数据,而像 Ehcache 这样的缓存使用进程内存储和远程存储,因此常用请求在本地就能被成功处理。在分布式缓存上下文中,每个应用程序服务器的进程内存储中都会缓存热点数据,增加服务器数量并不会增加网络或后端的负载。

RDBMS 专注于成为通用的 SOR(System of Record)。NoSQ 希望成为某类特定数据类型的 SOR,比如键值对、文档、稀疏表(宽表)或图。缓存着眼于性能,一般会与 RDBMS 或 NoSQL 数据库结合使用,数据类型就是 SOR。往往缓存中会存储 Web 服务调用的结果,业务对象的计算结果,这个结果可能需要成百 SOR 调用才能得到。

像 Ehcache 这样的缓存部分运行在应用程序的操作系统进程里,部分运行在网络那头自己机器的进程里。但也不是全部分布式缓存都这样:memcache 就是一个例子,所有的数据都跨网络存储。

InfoQ:哪类应用程序最适合这种方式?

Greg:这还得从先前的问题说起,要将分布式缓存用于你现有的应用程序,通常只需要很小的工作量,而 NoSQL 则需要做很多事,还有大的架构变更。

因此适用分布式缓存的第一类应用程序是现有系统,特别是有以下需要的:

  • 由于使用量或负载激增而需要向外扩展
  • 为达到 SLA 而需要有更低的延时
  • 为了将大型机这样的昂贵基础设施的使用减到最低
  • 减少 Web 服务调用而带来的费用
  • 应对极端负载高峰(比如黑色星期五一样的促销)

InfoQ:这种方式有什么局限么?

Greg:缓存,置于内存之中,在大小上有制约,它们的技术局限受限于有多少内存给它们使用(下面还会具体展开说明)。

缓存,就算它提供持久化功能,也未必算的上作为 SOR 的上选。缓存故意回避了备份到磁盘和从中还原的复杂功能,尽管也有简单的。RDMBS 在过去 30 年里开发了丰富的备份、还原、迁移、报表和 ETL 特性。而 NoSQL 则介于两者之间。

缓存提供了改变数据与访问数据的编程 API。NoSQL 和 RDBMS 则提供了工具,可以执行脚本化语言(比如 SQL、UnSQL 和 Thrift)。

但关键一点是要记住缓存并不想成为你的 SOR。它能轻松地与你的 RDBMS 和睦相处,为此它并不需要 RDBMS 所有用的复杂功能。

InfoQ:以后分布式缓存解决方案、NoSQL 数据库和传统 RDBMS 互相协同工作,你有何看法?

Greg:速度大幅快于 RDBMS,依赖于部署拓扑的 NoSQL,还有数据访问模式,分布式缓存可以位于这三者之间的任意位置。那些需要更低延时的人可以将缓存作为 NoSQL 的一个补充,就像现在对待 RDBMS 那样。

稍有不同的是,在你想将 RDBMS 扩展到多个节点时,经常会难于扩展,或者影响编程契约,或者受制于 CAP 做出权衡;而使用 NoSQL,就算只使用一个节点,你也可以简单地将其视为多节点安装。如果是向上扩展就没有这些问题。在 RDBMS 中,添加缓存是为了避免向外扩展会遇到的麻烦。通常缓存能解决系统的容量问题,你不用费太多力气。因此当需要向外扩展时,加入缓存吧。

对于 NoSQL 而言,内建了向外扩展的能力,在需要低延时的时候使用缓存吧。

查看英文原文: Distributed Cache as a NoSQL Data Store?

2011-11-13 08:406159
用户头像

发布了 135 篇内容, 共 56.7 次阅读, 收获喜欢 43 次。

关注

评论

发布
暂无评论
发现更多内容

极客星球 | 开发者服务合规检测护航企业数字生态建设

MobTech袤博科技

信息安全 开发者服务 安全合规检测 SDK检测 数据健康

架构实战营 - 第 6 期 模块八课后作业

乐邦

「架构实战营」

【LeetCode】马戏团人塔Java题解

Albert

LeetCode 6月月更

洞见科技承建国家工信安全中心「隐私计算平台」,筑基互联互通生态底座

洞见科技

隐私计算 数据要素

通用池化框架GenericKeyedObjectPool性能测试

FunTester

客户之声|携程基于 OceanBase 读写分离方案的探索与优化

OceanBase 数据库

数据库 oceanbase

寻找 Web3 的灵魂

CECBC

引入区块链技术 是开展碳信息审计的有效举措

CECBC

同步屏障CyclicBarrier

周杰伦本人

6月月更

当Spring邂逅Kafka,有趣的知识增加了

翊君

kafka spring 6月月更

Flutter 开发一个通用的购物车数量编辑组件

岛上码农

flutter 安卓开发 ios 开发 跨平台应用 6月月更

盘点:2022年10款比较火的项目管理软件

优秀

项目管理软件

数据库每日一题---第5天:变更性别

知心宝贝

数据库 前端 后端 6月月更

KusionStack 开源有感|历时两年,打破“隔行如隔山”困境

SOFAStack

开源 编程语言 语言 #Github 运维‘

Web3生态龙头AQUANEE,即将登录Gate等平台

股市老人

GameFi新的契机,AQUANEE市场近状一览

EOSdreamer111

NFT市场进入聚合时代,OKALEIDO成BNB Chain上的首个聚合平台

小哈区块

Hoo首发上线CloudChat(CC) 推出空投5,000 USDT活动

区块链前沿News

Hoo

面向艺术家的Web3商业生态,由OKALEIDO的NFT聚合交易赋能

西柚子

GameFi新的契机,AQUANEE市场近状一览

西柚子

天翼云践行“双碳”目标 “东数西算”绘画绿色发展新蓝图

天翼云开发者社区

Spark Shuffle 原理

布兰特

大数据 spark

建立java和jin函数之间的关系

北洋

6月月更

vue指令-3

小恺

6月月更

社区动态|SelectDB 联合传智教育推出免费 Apache Doris 中文视频教程

SelectDB

Doris 开源社区 Apaache Doris 开源治理

MySql函数

秋名山码民

6月月更

全国首批“持证上岗”的区块链应用操作员来了

CECBC

NFT市场进入聚合时代,OKALEIDO成BNB Chain上的首个聚合平台

西柚子

太卷了!腾讯一面被问到内存满了,会发生什么?

Java全栈架构师

Java Linux 程序员 面试 操作系统

Web3生态龙头AQUANEE,即将登录Gate等平台

威廉META

分布式缓存能否作为NoSQL数据库?_Java_Srini Penchikala_InfoQ精选文章