飞天发布时刻:2024年 Forrester 公有云平台Wave™评估报告解读 了解详情
写点什么

NoSQL 与 RDBMS:何时使用,何时不使用

  • 2014-01-08
  • 本文字数:2496 字

    阅读完需:约 8 分钟

Naresh Kumar 是位软件工程师与热情的博主,对于编程与新事物拥有极大的兴趣,非常乐于与其他开发者和程序员分享技术上的研究成果。近日,Naresh撰文比较了NoSQL 与RDBMS,并详细介绍了他们各自的特点与适用的场景。

NoSQL 并不是关系型数据库管理系统,本文将会介绍 NoSQL 数据库与关系型数据库之间的差别,同时还会讨论在何种场景下应该使用 NoSQL,何种场景下不应该使用。由于 NoSQL 还是个相对较新的技术,因此它还面临着很多挑战。

时至今日,互联网上有数以亿计的用户。大数据与云计算已经成为很多主要的互联网应用都在使用或是准备使用的技术,这是因为互联网用户每天都在不断增长,数据也变得越来越复杂,而且有很多非结构化的数据存在,这是很难通过传统的关系型数据库管理系统来处理的。NoSQL 技术则能比较好地解决这个问题,它主要用于非结构化的大数据与云计算上。从这个角度来看,NoSQL 是一种全新的数据库思维方式。

为何要使用 NoSQL 数据库?

1.NoSQL 具有灵活的数据模型,可以处理非结构化 / 半结构化的大数据

现在,我们可以通过 Facebook、D&B 等第三方轻松获得与访问数据,如个人用户信息、地理位置数据、社交图谱、用户产生的内容、机器日志数据以及传感器生成的数据等。对这些数据的使用正在快速改变着通信、购物、广告、娱乐以及关系管理的特质。没有使用这些数据的应用很快就会被用户所遗忘。开发者希望使用非常灵活的数据库,能够轻松容纳新的数据类型,并且不会被第三方数据提供商内容结构的变化所累。很多新数据都是非结构化或是半结构化的,因此开发者还需要能够高效存储这种数据的数据库。但遗憾的是,关系型数据库所使用的定义严格、基于模式的方式是无法快速容纳新的数据类型的,对于非结构化或是半结构化的数据更是无能为力。NoSQL 提供的数据模型则能很好地满足这种需求。很多应用都会从这种非结构化数据模型中获益,比如说 CRM、ERP、BPM 等等,他们可以通过这种灵活性存储数据而无需修改表或是创建更多的列。这些数据库也非常适合于创建原型或是快速应用,因为这种灵活性使得新特性的开发变得非常容易。

2.NoSQL 很容易实现可伸缩性(向上扩展与水平扩展)

如果有很多用户在频繁且并发地使用你的应用,那么你就需要考虑可伸缩的数据库技术而非传统的 RDBMS 了。对于关系型技术来说,很多应用开发者会发现动态的可伸缩性是难以实现的,这时就应该考虑切换到 NoSQL 数据库上。对于云应用来说,关系型数据库一开始是普遍的选择。然而,在使用过程中却遇到了越来越多的问题,原因就在于他们是中心化的,向上扩展而非水平扩展的。这使得他们不适合于那些需要简单且动态可伸缩性的应用。NoSQL 数据库从一开始就是分布式、水平扩展的,因此非常适合于互联网应用分布式的特性。

在三层互联网架构的 Web/ 应用层上,多年来向上扩展已经成为默认的扩展方式了。随着应用使用人数的激增,我们需要添加更多的服务器,性能则是通过负载均衡来实现的,这时的代价与用户数量成线性比例关系。在 NoSQL 数据库之前,数据库层的默认扩展方式就是向上扩展。为了支持更多的并发用户以及存储更多的数据,你需要越来越好的服务器,更好的 CPU、更多的内存、更大的磁盘来维护所有表。然而,好的服务器意味着更加复杂、私有、并且也更加昂贵。这与 Web/ 应用层所使用的便宜的硬件形成了鲜明的对比。

3. 动态模式

关系型数据库需要在添加数据前先定义好模式。比如说,你需要存储客户的电话号码、姓名、地址、城市与州等信息,SQL 数据库需要提前知晓你要存的是什么。这对于敏捷开发模式来说是场灾难,因为每次完成新特性时,数据库的模式通常都需要改变。因此,如果在开发过程中想将客户喜欢的条目加到数据库中,那就得向表中添加这一列才行,然后要做的就是将整个数据库迁移到新的模式上。

4. 自动分片

由于是结构化的,关系型数据库通常会垂直扩展,单台服务器要持有整个数据库来确保可靠性与数据的持续可用性。这样做的代价就是非常昂贵、扩展受到限制,并且数据库基础设施会成为失败点。这个问题的解决方案就是水平扩展,添加服务器而不是为单台服务器增加更多的能力。NoSQL 数据库通常都支持自动分片,这意味着他们本质上就会自动在多台服务器上分发数据,应用甚至都不知道这些事情。数据与查询负载会自动在多台服务器上做到平衡,当某台服务器当机时,它能快速且透明地被替换掉。

5. 复制

大多数 NoSQL 数据库也支持自动复制,这意味着你可以获得高可用性与灾备恢复功能。从开发者的角度来看,存储环境本质上是虚拟化的。

NoSQL 数据库面临的挑战

1. 成熟度

RDBMS 系统由来已久。NoSQL 拥护者们会说 RDBMS 的高龄是其衰退的标志,不过对于大多数 CIO 来说,RDBMS 的成熟让人放心。对于大多数情况来说,RDBMS 系统是稳定且功能丰富的。相比较而言,大多数 NoSQL 数据库则还有很多特性有待实现。

2. 支持

企业需要的是安心,如果关键系统出现了故障,他们可以获得即时的支持。所有 RDBMS 厂商都在不遗余力地提供良好的企业支持。与之相反,大多数 NoSQL 系统都是开源项目,虽然每种数据库都有那么几家公司提供支持,不过这些公司大多都是小的初创公司,没有全球支持资源,也没有 Oracle、微软或是 IBM 那种令人放心的公信力。

3. 分析与商业智能

NoSQL 数据库在 Web 2.0 应用时代开始出现。因此,大多数特性都是面向这些应用的需要的。然而,应用中的数据对于业务来说是有价值的,这种价值远远超出了 Web 应用那种 CRUD。企业数据库中的业务信息可以帮助改进效率并提升竞争力,商业智能对于大中型企业来说是个非常关键的 IT 问题。

4. 管理

NoSQL 的设计目标是提供零管理的解决方案,不过当今的现实却离这个目标还相去甚远。现在的 NoSQL 需要很多技巧才能用好,并且需要不少人力、物力来维护。

5. 专业

全球有很多开发者,每个业务部门都会有熟悉 RDBMS 概念与编程的人。相反,几乎每个 NoSQL 开发者都处于学习模式。这种状况会随着时间的流逝而发生改观。但现在,找到一个有经验的 RDBMS 程序员或是管理员要比 NoSQL 专家容易多了。

结论

NoSQL 数据库正在成为数据库领域的重要力量。如果使用恰当,那么它会带来很多好处。然而,企业应该非常小心并注意到这些数据库的限制与问题。

2014-01-08 10:2710079
用户头像

发布了 88 篇内容, 共 265.9 次阅读, 收获喜欢 8 次。

关注

评论

发布
暂无评论
发现更多内容

大模型技术的发展与实践 主赛道:技术人的 2023 总结

芯动大师

大模型 ChatGPT LLM

如何从 Jira 成功迁移到极狐GitLab,看这个就够了!

极狐GitLab

项目管理 DevOps gitlab 敏捷开发

06 | 链表(上):如何实现LRU缓存淘汰算法

鲁米

三层开发

Geek_8da502

APP开发

CnosDB FDW:打通一扇通往PostgreSQL世界的大门

CnosDB

开源 时序数据库 CnosDB

CnosDB 科技春晚暨CnosDB 2.4.0 Milky Way发布会

CnosDB

开源 时序数据库 CnosDB CnosDB2.4.0发布会

05 | 数组:为什么很多编程语言中数组都从0开始编号

鲁米

用友与厦国会联合培训,探索智能会计时代业财融合成功模式

用友BIP

智能会计

揭秘大脑中的贪婪因子:全面解析多巴胺

少油少糖八分饱

情绪 理性 大脑 快乐 多巴胺

一款充电桩解决方案设计

芯动大师

Go 程序编译过程(基于Go1.21)

-Hedon🍭

Go 编译原理 Go 面试题 面经 后端 大厂 Go编译过程

拼版不合理案例详解

华秋电子

纯CSS实现炫酷背景霓虹灯文字效果

南城FE

CSS 前端 动画 交互设计

Tomcat 配合虚拟线程,一种新的编程体验

越长大越悲伤

Java springboot 虚拟线程

喜讯!华秋荣获2023中国产业数字化百强榜企业

华秋电子

What's new in Pika v3.5.2

apache/dubbo-go

redis 底层原理 Redis 7 Pika

mybatis-plus代码生成器

智慧源点

Mybatis Plus 代码生成器

DevOps|研发提效-敏捷开发之每日站立会

laofo

DevOps Scrum 敏捷开发 研发效能 每日站会

JVM C1、C2编译器

FunTester

糟了,数据库崩了,又好像没崩

越长大越悲伤

MySQL MySQL 8.0

文心一言 VS 讯飞星火 VS chatgpt (148)-- 算法导论12.2 3题

福大大架构师每日一题

福大大架构师每日一题

高防服务器租用注意事项

Geek_f19a80

服务器

细说GaussDB(DWS)的2种查询优化技术

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 华为云GaussDB(DWS)

架构实战营模块 2 作业

陈斌

架构实战营

SQL 日期处理和视图创建:常见数据类型、示例查询和防范 SQL 注入方法

小万哥

MySQL 数据库 程序员 sql 后端开发

时间序列数据压缩算法简述

CnosDB

开源 时序数据库 CnosDB

[大厂实践] Netflix容器平台内核panic可观察性实践

俞凡

Kubernetes netflix 大厂实践

GPU深度学习性能的三驾马车:Tensor Core、内存带宽与内存层次结构

Baihai IDP

人工智能 程序员 AI gpu LLM

NoSQL与RDBMS:何时使用,何时不使用_语言 & 开发_张龙_InfoQ精选文章