
最近,Andrew Pavlo 的数据库领域年度回顾报告发布,报告涵盖了过去一年的趋势和创新。这份题为“ 2024 年数据库年度回顾”的报告观点鲜明:报告强调,虽然我们可能确实处于 “数据库的黄金时代”,但去年也见证了重大的许可证变化、DuckDB 的快速发展以及一些令人惊讶的新发布。
在讨论开源数据库 “动荡”的一年(包括 Redis 和 Elasticsearch 许可证的重大变化)时,Pavlo 写道:
请注意,与其他采取类似举措的系统相比,Redis 和 Elasticsearch 引起的反响更大。(…)这不可能是因为 Redis 和 Elasticsearch 的安装数量比其他系统大得多(…),因为 MongoDB 和 Kafka 在更换许可证时的安装数量也同样庞大。就 Redis 而言,我只能认为,人们认为 Redis 公司从他人的工作中获利并不公平,因为该公司的创始人并非该系统最初的创建者。
根据 2024 年的报告文章,与 Postgres 近年来成为操作型数据库的默认选项类似,DuckDB “成为运行数据分析查询的默认选项”。正如 Pavlo 所说的那样,这一趋势证明,最近发布的将 OLAP 数据库与 Postgres 相集成的四种不同的扩展是合理的:
大多数 OLAP 查询不会访问那么多数据。Fivetran 分析了来自 Snowflake 和 Redshift 的跟踪数据,结果显示,查询扫描的数据量中位数仅为 100 MB。这么小的数据量意味着,一个 DuckDB 实例就足以处理大多数的查询。
Pavlo 是卡内基梅隆大学的副教授,也是 OtterTune 的前联合创始人。他从 2021 年开始发布年度分析报告,重点关注 PostgreSQL 的主导地位。2022 年的主题是 “区块链数据库仍然是个愚蠢的想法”,而到了 2023 年,他又将重点转移到了向量数据库的崛起上。
这位数据库管理系统专家 2024 年的回顾引起了广泛的关注,在 Reddit 和 Hacker News 上引发了热烈的讨论。其中有一段观点鲜明的陈述(我不喜欢 Redis。它很慢,有假事务,查询语法也很怪异。)在 Hacker News 上引发了一场与 Redis 创建者 Salvatore Sanfilippo(绰号 ”antirez")的激烈争论,争论的焦点是这个曾经开源的键值存储的重要性和设计。
年度回顾关注了一些重要的发布,重点介绍了 Microsoft Garnet 和 Valkey ,它们都是值得注意的键值存储。不过,Pavlo 对 MySQL v9 的功能列表表示失望,并认为亚马逊 QLDB 的退出意义重大:
如果连亚马逊都不知道如何在区块链数据库上赚钱,那就没人能做到了。
在谈到最近发布的 Aurora DSQL 预览版时,他补充道:
这一公告表明,在数据库领域,“ Aurora ”这个名字有很高的品牌知名度。这个 DBMS 似乎并没有共享其旗舰产品 Aurora Postgres RDS 的代码,但亚马逊云科技还是使用了这个名字。
继 Pavlo 之后,ByteBase 团队最近也发布了 “ 2024 年数据库工具年度回顾“。感兴趣的读者可以在 YouTube 上观看 Pavlo 的许多大学课程以及最近的演讲 “What Goes Around Comes Around… And Around… ”。
原文链接:
评论