写点什么

Andy 教授 2023 年数据库回顾:向量数据库没有技术护城河!没人能靠技术大佬背书“假装成功”

  • 2024-01-12
    北京
  • 本文字数:8875 字

    阅读完需:约 29 分钟

大小:4.56M时长:26:34
Andy教授2023年数据库回顾:向量数据库没有技术护城河!没人能靠技术大佬背书“假装成功”

本文是由世界知名数据库行业专家 Andy Pavlo 教授撰写的 2023 年数据库回顾文章。最近几年,每一个岁末或年初,Andy 教授都会撰写下关于过去一年他对数据库领域的观察和感悟,他的系列文章不仅整理和收纳了数据库领域的大事件和技术发展趋势,更为数据库领域从业者提供了宝贵的参考和启示。

 

在本文中,Andy 教授首先回顾了 2023 年数据库领域的重要里程碑,包括技术进步和业界动态。他还详细阐述了在这一年中引起广泛关注的几个主题,如向量数据库、自然语言查询和 SQL 之间的关系、人工智能崛起为数据库领域带来的机遇等。AI 前线对本文进行了翻译,以便广大读者能够更好地理解相关内容,紧跟全球的数据库动态。

 

新年新气象,尽管发生了很多糟心事,但我还是要对过去一年间的各主要数据库事件和趋势进行回顾和盘点,毕竟 2023 确是数据库发展历程中的重要一年。

 

我的目标是继续保持犀利但公正的观点,同时过滤掉那些言过其实的炒作言论。

向量数据库的兴起

2023 年无疑是向量数据库全面兴起的一年。尽管其中一些系统几年之前就已经诞生,但出于人们对大语言模型及相关服务应用(例如 ChatGPT)的广泛关注,向量数据库终于在这一年中迎来全面爆发。向量数据库能够根据数据的语义、而不仅仅是内容,来对数据(特别是非结构化数据)进行深入搜索。换句话说,应用程序现在可以直接搜索关于特定主题的内容,而不是僵硬地查找具体关键字。

 

这种“神奇”搜索的背后离不开 transformers,这项技术能够将数据转换成固定长度的一维浮点数向量,被称为嵌入。人类无法直接理解这些嵌入中的值,但其内容却编码了参数和 transformers 训练语料库之间的某种关系。这些嵌入向量的大小范围从简单的数百维 transformers,一路延伸到高端模型中的数千维。

 

当我们使用 transformers 为数据库内的所有记录生成嵌入时,即可通过在高维空间中查找最接近搜索嵌入的记录嵌入来找到特定输入的相似记录。但是,暴力比较所有向量来寻找最接近匹配项会带来极高的成本

 

这项操作的复杂度为 O(N * d * k),其中 N 代表嵌入数量,d 是各个向量的大小,k 是我们需要的匹配数量——看不懂也没关系,这本身就是项艰深的技术,大家随便听听就好。

 

这时候就轮到向量 DBMS 发挥作用了。从本质上讲,向量 DBMS 就是一种拥有专门索引数据结构的文档数据库,用于加快对嵌入相似性的搜索过程。这些系统可以使用近似搜索来生成结果,而不是傻傻对每项查询的最相似向量执行精确匹配。如此一来,我们就能以“足够好”的效果换取更快的返回速度。

 

刚刚遭遇 2022 年区块链数据库的海量崩溃之后,沮丧的风险投资商们猛然嗅到了向量数据库中的商机,并再次兴奋起来。他们开始为向量数据库领域的几乎每家主要厂商都注入了大笔种子资金。在 2023 年的种子轮融资当中,Marqo 拿到 530 万美元,Qdrant 斩获 750 万美元,Chroma 则获得 1800 万美元。Weaviate 在 2023 年 4 月的 B 轮融资成功筹得 5000 万美元,而这一年中领跑全场的还得说 Pinecone 的 1 亿美元 B 轮。这下可真是抄上了。

小结:向量数据库没什么技术壁垒

 

在 2022 年底大语言模型在 ChatGPT 的加持下进入“主流”视野后,多家 DBMS 厂商只用不到一年时间就推出了自己的向量搜索扩展,其中包括 SingleStore、甲骨文、Rocket 和 Clickhouse。几大 PostgreSQL 衍生系统也宣布将支持微量搜索,其中一些使用到 pgvectorryna(Supabase、AlloyDB),也有几家使用其他开源 ANN 库(Timescale、Neon 等)。MongoDB 和 Cassandra 等领先 NoSQL DBMS 也引入了向量索引。

 

就在 DBMS 向量支持功能快速普及的同时,JSON 数据类型也在迅猛崛起。采用原生存储 JSON 的 NoSQL 系统是从 2000 年代末起开始流行的(包括 MongoDB 和 CouchDB),但又过了好几年,关系型 DBMS 才开始添加对 JSON 的支持(PostgreSQL、Oracle 和 MySQL 的支持时间分别是在 2012 年、2014 年和 2015 年)。SQL 标准在 SQL:2016 中引入了对 JSON 灵气进行操作的函数,但直到 SQL:2023 才正式将 JSON 数据类型添加进来。鉴于许多关系 DBMS 早已支持具有相似概念的 XML 数据类型,这样的滞后的确令人感到意外。

 

向量搜索索引的快速增长有两大潜在原因。首先,通过嵌入进行相似性搜索开始成为愈发重要的用例,迫使每家 DBMS 厂商都匆忙推出了自己的版本。其二是这种引入新型访问方法和索引数据结构的工程量并不算大,所以 DBMS 厂商往往可以快速发布自己的向量搜索功能。大多数厂商根本不需要从头开始编写向量索引,而只需集成市面上可用的几种高质量开源库(例如微软 DiskANN 和 Meta Faiss 等)。

 

而从这个角度来看,向量搜索功能的实现工作量不高,导致向量 DBMS 厂商根本没有足够深的护城河来抵御老牌 DBMS 厂商的竞争压力

 

我最近曾给 Pinecone 和 Weaviate 公司的联合创始人提出忠告,建议他们的系统采取两条发展路径:其一是由客户用这些向量 DBMS 作为“记录数据库”,而厂商则为操作工作负载提供更好的支持。这样他们的产品就会越来越像目前流行的文档型 DBMS(例如 MongoDB),并在五年之内像之前的 NoSQL 系统那样添加对 SQL 的支持。另一条路则是将向量 DBMS 作为上游主流 DBMS 的辅助性方案,目前其实已经有不少人在以这样的方式使用 Elastic 和 Vespa 等搜索引擎 DBMS。如此一来,向量 DBMS 不能在不扩展自身查询语言或者改变数据模型结构的前提下维持生存。


旁注:我最近还专门录制了一期向量与关系数据库的问答节目,提到在未来五年内,每一种关系 DBMS 都将拥有自己的一套高性能向量索引实现。

SQL 正变得越来越好

刚刚到来的 2024 年,也恰好是 Don Chamberlain 和 Ray Boyce 在 IBM 研究院发明 SQL 的五十周年。SQL 最初被命名为 SEQUEL(结构化英语查询语言),自上世纪八十年代以来一直是数据库交互领域的客观标准编程语言。尽管 SQL 历史悠久,但其用途和功能一直在不断更新,并在过去十年间迎来了颠覆性变化。

 

就在去年,ISO/UEC 9075 规范发布了最新版本,即 SQL:2023。此次更新引入了大量“锦上添花”的功能,用以解决不同 SQL 方言(例如 ANY_VALUE)中的不一致问题。值得一提的是,其中对 SQL 的两项增强进一步削弱了对替代性数据模型和查询语言的需求。但请注意,SQL 新规范包含这些内容,并不代表大家常用的关系 DBMS 会立即支持这些新功能。

 

截至 2024 年 1 月,据我了解唯一支持 SQL/PGQ 功能的 DBMS 就只有 Oracle。DuckDB 倒是提供一个支持 SQL/PGQ 的实验性分支,但仍无法正常运行以上示例,因为其支持的语法仍略有区别。

 

多维数组(SQL/MDA):


自从 SQL:1999 引入有限的一维、固定长度数组这种数据类型以来,SQL 就正式开启了自己的数组支持之旅。SQL:2023 扩展了这项功能,可以支持未对最大基数进行预定义的嵌套数组。SQL:2023 中的 SQL/MDA 更新能够支持使用基于整数的坐标的任意维度多维数组。Rasdaman 的 RQL 极大启发了 SQL/MDA 语法,以提供与 SQL 兼容且符合其集合语义的结构及操作数组构造。这些增强功能使得应用程序可以完全在 SQL 之内对多维数组执行操作和交互,而无需单独导出(例如导出为 Python notebook)。下表所示,为在 CREATE TABLE 语句中使用 MDARRAY 数据类型的几种不同示例:

 


尽管 SQL.MDA 规范自 2019 年就已经发布,但直到 SQL:2023 才被纳入官方标准。据我了解,除了 Rasdaman 之外,还没有哪种生产级 DBMS 能够支持 SQL/MDA 扩展。我能找到的唯一其他原型就只有 HSQLDB 的一个分支,名为 ASQLDB。

小结:自然语言查询永远取代不了 SQL

SQL:2023 修订版代表这种通用语言迈进了持续发展和改造的下一阶段。当然,SQL 仍不算完美、也不具备真正的可移植性,因为每种 DBMS 都有自己的怪癖、专有功能和非标扩展。我个人最喜欢 PostgreSQL 的::cast 运算符快捷方式。

 

SQL/PGQ 虽然意义重大,但我觉得它在短时间内还不足以对图 DBMS 造成致命打击。毕竟已经有多种方法可以将面向图的查询转换为 SQL,不少 DBMS(包括 SQL Server 和 Oracle)也提供内置的 SQL 扩展,能够降低图数据存储和查询的门槛。Amazon Neptune 是亚马逊云科技旗下 Aurora MySQL 产品上的图数据库方案。Apache AGE 在 PostgreSQL 之上则提供 OpenCypher 接口。预计諅 要 OLAP 系统(例如 Snowflake、Redshift 和 BigQuery 等)也将在不久的将来支持 SQL/PGQ。

 

在 DBMS 中添加 SQL/PGQ,绝不像添加新语法支持那么简单。必须关注一系列工程要点,才能保证图查询操作拥有良好的性能。例如,图查询会执行多路连接来遍历整个图结构。但当这些连接的中间结果大于基表时,往往会引发问题。DBMS 必须使用最坏情况最优连接(WCOJ)算法来改善表间常用的哈希连接方法。另一项重要技术,则是使用 factorization 来避免连接期间实现的冗余中间结果。这类压缩方法能帮助 DBMS 避免一遍又一遍地用相同连接消耗内存。

 

我这里提出的优化方法,并没能在现有图 DBMS 中全部得到实现。因为据我所知,Neo4j、TigerGraph 等领先系统也还做不到。我听说过的唯一面向图系统就是滑铁卢大学的嵌入式 Kuzu DBMS。此外,大多数关系 DBMS 也还没有实现(至少那些开源数据库还不行)。前文提到的 DuckDB 有个实验分支实现了 WCOJ 和 factorization 优化,并在 2023 年的论文中提到,其在行业标准图基准上的操作性能比 Neo4j 高出 10 倍。

 

但正如前文提到,SQL 在大多数读者朋友出生前就已经存在,也将在我们故去后依旧坚挺。总之,我反对一切所谓自然语言查询将彻底取代 SQL 的说法。

 

旁注:两年之前,我曾公开打赌说在 2030 年之前,图 DBMS 还不可能在数据库市场上取代关系 DBMS。至少就目前看,我的结论仍然正确。

MariaDB 身陷困境

去年,MariaDB 开始在新闻报道中频频亮相,而且大多不是什么好事。我们发现独立于 MariaDB 基金会之外的 MariaDB 公司已经后院起火。2022 年,该公司尝试借壳上市,但股价在 IPO 后的三天内迅速下跌 40%。而为了加快上市速度而搞的借壳操作也被公之于众。截至 2023 年底,该公司股价较开盘以来已累计下跌超 90%。

 

面对一系列财务问题,该公司被迫宣布了两轮裁员。第一轮是在 2023 年 4 月,并随后在 2023 年 10 月进行了一轮更大规模的精简。该公司还宣布将淘汰两款产品:Xpand 和 SkySQL。MariaDB 公司于 2018 年收购了当时名为 Xlustrix 的 Xpand;2014 年时我曾参观过 Clustrix 的办公室,发现那里就像一座令人毛骨悚然的鬼城(巨大的楼层中,有半数房间都关着灯)。SkySQL 的来历则更为复杂,他们最初是一家提供 MariaDB 服务的独立公司,后来在 2013 年与 Monty Program AB 合并。2014 年,合并后的两家公司共同成为我们如今熟知的 MariaDB 公司。但就在去年 12 月,该公司宣布 SkySQL 将会转为一家独立企业。

 

MariaDB 公司的情况如此糟糕,导致其基金会 CEO 专门撰文,抱怨自 IPO 以来基金会与公司间的关系如何快速恶化,并表达了“重启”的意愿。其他坏消息还包括:微软于 2023 年 9 月宣布,未来不会继续在 Azure 上提供 MariaDB 托管服务,转而专注支持 MySQL。有些朋友可能不太熟悉,MariaDB 就是 MySQL 的一个分支,是 MySQL 缔造者 Monty Widenus 在甲骨文于 2009 年宣布收购 Sun Microsystems 后开发而成。总而言之,当初被放弃的 MySQL 表现良好,而作为新兴替代力量的 MariaDB 却身陷困境。所以还看什么宫斗戏,多关注数据库市场什么都有了!

小结:数据库行业无法再用技术大佬的背书来“假装成功”

过去十年以来,数据库客户明显变得越来越精明了。企业没办法再通过华而不实的基准数据、承诺取代 SQL 的新查询语言或者技术大佬的背书来“假装成功”。DBMS 的声誉比以往任何时候都更加重要。也就是说,DBMS 软件本身及其背后的开发企业需要齐心协力,任何内斗都将直接削弱产品的市场生命力。

 

而且也别指望着开源能让项目长久存续,事实告诉我们,任何 DBMS 项目都很难在相应的营利性公司倒闭后继续健康发展。少数反例就只有 PostgreSQL;再加上为 MySQL 构建 InfiniDB OLAP 引擎的公司在 2014 年破产之后,其 GPLv2 源代码被继承下来并成为 MariaDB 中的 ColumnStore。

 

相反,更多例子表明一旦没有营利企业来支撑项目开销,DBMS 将很快消失。感兴趣的朋友可以去看看 Apache 基金会的库存清单,了解到底有多少 DBMS 项目被这样彻底废弃。

 

纯云 DBaaS(数据库即服务)方案的出现令形势变得更加严峻。因为一旦公司失败(或者财务状况不佳),用于托管数据库的服务器也将被快速关停。Xeround 曾在 2013 年关闭数据库时,给了客户两周时间来迁移数据库。为了削减成本,InfluxDB 虽在 2023 年 7 月下线整个服务区前给客户预留了六个月过渡期,但此举仍令人们感到震惊。

 

MariaDB 显然比大多数普通数据库初创企业的情况更好,毕竟 Monty 等成员还建立起了控制这个开源项目的非营利基金会。但对于任何一个开源 DBMS 项目,只要负责赚钱的公司跟负责推进项目发展的基金会发生了冲突,项目本身可就危险了!而且就在此时此刻,MySQL 仍在不断改进,且甲骨文用实际行动证明自己确实是非常优秀的企业业务管理者(至少在工程层面是这样)。相信 MariaDB 公司的乱象,将进一步推动用户群体转向 PostgreSQL。

 

但作为 Monty 用自己女儿名字命名的数据库,我也相信 MariaDB 仍会继续存在下去。

自研数据库崩溃导致美国航空业中断

2023 年 1 月 11 日,受 NOTAM 系统中断影响,美国联邦航空管理局(FAA)被迫叫停了美国境内的所有航班。NOTAM 系统负责向飞行员提供纯文本编码消息,并就飞行路径上可能遇到的意外变化或潜在危险发出警告。1 月 11 日上午,NOTAM 系统崩溃,导致全美约 1.1 万个航班暂停起飞。但拥有独立航空通报系统的其他国家未受此次系统故障的影响。

 

根据 FAA 的解释,此次中断是由数据库文件损坏所造成。第三方承包商的工程师尝试用备份替换该文件,但发现操作过程导致备份文件也被损坏。类似的问题曾经在 2008 年导致 FAA 的原有基础设施出现同样的故障。

 

目前并不清楚 FAA 在 NOTAM 系统中到底使用的是哪款 DBMS。但有报道表明,该系统至今仍运行在两台 1988 年的飞利浦 DS714/81 大型机上。这些设备使用的根本就不是我们熟知的现代操作系统,而上世纪六十年代的老古董。也就是说,FAA 明显没能在上世纪八十年代利用 Oracle、Ingres 和 Informix 等能够支持各种 Unix 平台的 DBMS 完成现代化改造。我个的合理推测是,NOTAM 系统使用的可能是普通文件(例如 CSV)自托管数据库。这些由非数据库专家编写的应用代码负责从文件中读取/写入记录,将结果复制到备用服务器并在崩溃时保障数据完整性。

小结:在老掉牙的内部自研数据库上工作,是开发者的噩梦

在不可替代的遗留硬件上运行关键任务系统,并使用早已老掉牙的内部原研自定义数据库,可以说是每一位数据库从业者最恐怖的噩梦。我很惊讶 NOTAM 居然拖到现在才崩溃(或者说 2008 年搞出问题的也是同一套系统?),所以面对这样一套能够支持运行 35 年的“出土文物”,我反倒有点肃然起敬了。

 

有消息人士称,NOTAM 系统每秒只能处理 20 条消息。以现代标准来看,这确实少得可怜。但还是那句话,这套系统的部署是在上世纪八十年代。数据库传奇大佬、1998 年图灵奖获得者 Jim Gray 曾在 1985 年专门撰文介绍“普通”DBMS 如何每秒执行 50 项事务,而非常高端的 DBMS 每秒甚至能够处理 200 项事务。作为参考,五年之前曾有人用八十年代的基准(即基于 TPC-A 的 TPC-B)在 Raspberry Pi 3 上运行过 PostgreSQL,最终性能也大致就是每秒 200 项事务。但如果不考虑跨数据中心间的强一致系统(约束其性能的唯一瓶颈就是光速),现代单节点 OLTP DBMS 在某些工作负载上可以轻松实现每秒数百万项事务。所以必须承认,NOTAM 哪怕是以上世纪八十年代的标准看也没达到顶尖水准,放在今天更是落后得吓人。

 

由于 NOTAM 没有将数据库跟应用程序逻辑区分开来,所以根本不可能对这些组件进行独立升级。考虑到当时人们已经很清楚关系模型的优势所在,这样的设计哪怕放在当年也该受到批判。我们并不能说 SQL 就一定可以阻止这次故障(毕竟这属于人为错误),但至少组件间的独立性可以让系统更加灵活、也更易于管理。

 

而且,美国政府当时已经开始使用商用关系型 DBMS。例如,Stonebraker 的 RTI(Ingres 的开发商)就曾在 1988 年的上市文件中提到,其客户包括国防部、财政部、多个军事部门和研究实验室。我相信美国政府的其他部门当时肯定也在使用 IBM DB2 和 Oracle。所以,硬要选择 NOTAM 并延续至今,在我看来是个不可理喻的决定。

 

在听说这事时,我正从阿姆斯特丹坐飞机返回美国。幸运的是,故障并没有影响到入境航班,所以我们的飞机可以正常按时降落。但后来我还是被困在了纽瓦克机场,因为所有国内航班都被迫中止。

聊聊数据库融资

除了前文提到向量 DBMS 的风险投资热潮之外,其他类型的数据库系统在过去一年中也吸纳了不少资金。但总体而言,这一年的数据库融资热度要比往年冷清得多。

 

自动调优初创公司 DBTune 在欧洲筹集到 260 万美元的种子轮资金;PostgresML 的种子轮则融得 450 万美元,这笔款项将用于构建自定义扩展 DBaaS 以通过 SQL 调用机器学习框架。TileDB 在秋季宣布了 3400 万美元的 B 轮融资,用于继续构建其阵列 DBMS。尽管已经成立 13 年有余,SQReam 仍凭借其 GPU 加速型 DBMS 完成了 4500 万美元的 C 轮融资。Neon 于 2023 年 8 月拿下 4600 万美元 B 轮融资,用以扩展其无服务器 PostgreSQL 平台。这一年中最大的融资赢家当数 Databricks,他们于 2023 年 9 月的 I 轮融资中获得 5 亿美元巨资,但仍远不及 2021 年 H 轮的 16 亿美元。

 

2024 年 1 月 5 日更新:这里补充一下,MotherDuck(DuckDB 的商业版本)于 202 年 9 月筹得 5250 万美元 B 轮融资,而 DBeaver 则凭借其备受装腔的 DBMS 管理工具拿到 500 万美元种子轮融资。

 

2023 年数据库领域还出现了不少收购。最大的一次发生在去年年初,Progress Software 以 3.55 亿美元现金直接买下了 MarkLogic——后者是历史最悠久的 XML DBMS 之一(诞生于 2001 年前后)。Progress 旗下还拥有 OpenEdge,它的出现甚至早于 MarkLogic(约 1984 年)。IBM 收购了 Meta 的衍生公司 Ahana,后者尝试对 PrestoDB 进行商业化改造(与现已更名为 Trino 的硬分叉 PrestoSQL 不同)。多云数据库服务商 Aiven 收购了 AI 驱动型查询重写器初创公司 EverSQL,EnterpriseDB 则借用贝恩资本的资金收购了 Seafowl 团队——后者开发出基于 DataFusion、能够兼容 PostgreSQL 的 OLAP 引擎。Snowflake 则分别收购了两家初创公司:其一是由前斯坦福大学教授 Peter Bailis 创立的 Sisu Data,其二是由伯克利大学教授 Aditya Parameswaran 创立的 Ponder(基于 Modin)。

小结:大模型相关产业,仍将受到资本青睐

搞风投的朋友告诉我,跟往年相比,2023 年市场上出现了更多新兴企业,但资方却谨慎地捂紧了钱袋子。这种趋势其实在整个初创领域都有体现,只能说数据库也未能幸免。当然,唯一的例外就是 AI+大语言模型,对于这类有望开拓计算领域新疆土的项目,大资本们仍然慷慨而热情。

 

尽管 2023 年内,美国的一系列宏观经济指标开始转好,但科技行业仍然心存疑虑并努力寻求降本增效。以 OtterTune 为例,客户们希望我们能更积极地优化数据库,帮助他们在 2023 年内降低数据库基础设施成本。与之对应,之前客户们的主要诉求集中在提高 DBMS 的性能和稳定性上。我们计划在 2024 年发布新功能,切实达成成本节约目标。而在我自己带的班里,大学生们纷纷请我帮他们推荐数据库开发岗位。要知道,卡耐基梅隆大学的计算机科学系享有盛誉,如今这里的学生居然都很难靠自己找到理想的实习机会和全职岗位了,看来大环境的确不好。

 

如果美国的科技市场继续保持这样的颓势,那么多数数据库初创企业在未来几年内恐怕都很难有实质性发展。规模较小的 DBMS 厂商可能被科技巨头或者私募股权公司吞并,甚至直接消亡。另一方面,那些凭借高估值筹得大量资金的公司也同样身陷困境。正如前文提到,其中很多可能根本无法成功上市,也没有多少科技大厂会用这些 DBMS,因为这是个人人都有自家 DBMS 的时代。对于这些体量很大、但还不够大的初创公司来说,摆在面前的路有三条:要么继续进行融资来维持公司运转;要么通过 Cloudera 等私募股权机构寻求帮助;要么接受 IT 服务公司(例如 Rocket、Actian)的收购,在维持原有系统稳定的同时,继续从被锁定的遗留客户身上榨取许可费用。但对于一家有追求的数据库公司来说,这三条路明显都不理想,而且明显不利于继续扩大客户受众。

 

最后我要提醒大家的是,Databricks 的问题已经不是要不要上市,而是什么时候上市。

有史以来最贵的一次密码修改

OG 数据库专家 Larry Ellison 在 2023 年的事业可谓蒸蒸日上。对于他本就出色的职业生涯来说,这又是再创辉煌的一年。2023 年 6 月,他重登全球第四大富豪的宝座。甲骨文股价在 2023 年内上涨了 22%,几乎追平标准普尔 500 指数的 24%回报率。2023 年 9 月,Larry 生平第一次前往微软总部,与软件巨头的 CEO 一道宣布 Oracle DBMS 将以托管服务的形式正式登陆 Azure 云。在 2023 年 11 月,股东们又以压倒性的多数票,决定让 79 岁的 Larry 继续担任甲骨文董事会主席。

 

但 2023 年真正的大新闻,还和蠊马斯克砸下 10 亿美元收购社交媒体 Twitter 之后,亲自帮助 Larry 重置了账户的密码。通过这次价值 10 亿美元的密码重置,Larry 终于在 2023 年 10 月发出了自己的第二条、也是近十多年来的唯一一条推文。Larry 表示自己即将动身前往牛津大学,随后宣布将在牛津创建 Ellison 理工学院(EIT)。

 

其实 Larry 具体发了什么并不重要,真正重要的是 Larry 重新回归 Twitter 了。我还通过个人门路打听到,Larry 会偶尔阅读 Twitter 消息,而且主要关注创业宣传、热情的生日祝福还有他自己灵光一现时的各种想法。

 

通过 Larry 的推文,我们终于发现这位技术圈大佬原来也有日常生活,并不像人们想象中那么日理万机——毕竟这家伙可是拥有自己的米格-29 战斗机外加一座夏威夷海岛。而更让人羡慕嫉妒恨的是,他还有位更有钱的好友,甚至愿意拿出 10 亿美元(捎带着)帮他重置账户密码。感觉 10 亿太多了?朋友们,当你身价 1030 亿时,这真的不算多。

新的一年,更加精彩

我满心期待 2024 年,也会把更多时间和精力投入到数据库领域。Dana、Bohan 和我创立的 OtterTune 公司也即将迎来四周年生日。这段经历教会了我很多,也让我们的数据库优化服务扩展到了最初的学术原型以外。

 

面对新的一年,我们打算分享更多关于使用 AI 技术改进现有 MySQL 和 PostgreSQL DBMS 的亮点和成果。我们也将开发更多新的增强功能,帮助更多用户轻松维护起稳定可靠的自有数据库。

备注:别忘了在数据库上多跑 ANALYZE,你的 DBMS 查询优化器会感谢你的。如果嫌麻烦,也可以选择用 OtterTune 自动解决。

 

原文链接:

https://ottertune.com/blog/2023-databases-retrospective

 

往年文章链接:

https://ottertune.com/blog/2021-databases-retrospective

https://ottertune.com/blog/2022-databases-retrospective

2024-01-12 14:229256
用户头像
李冬梅 加V:busulishang4668

发布了 940 篇内容, 共 534.1 次阅读, 收获喜欢 1105 次。

关注

评论

发布
暂无评论

为您收录的操作系统系列 - 进程管理(中篇)

鲁米

操作系统 进程 同步

5步教你将MRS数据导入DWS

华为云开发者联盟

数据 MRS GaussDB 集群 DWS

让我们与内心聊聊,寻找一段思考发展之路。

叶小鍵

如果生命的长度可以被改写「幻想短篇 27/28」

道伟

28天写作

SpringIOC的注解开发

小马哥

Java spring 七日更

速看!教育上云 让学习战“疫”两不误

教育云

Elasticsearch+Fluentd+Kafka搭建日志系统

远鹏

kafka ELK EFK Fluentd 日志系统

一个合格的初级前端工程师需要掌握的模块笔记

我是哪吒

程序员 面试 Vue 大前端 2月春节不断更

Kafka架构介绍

架构精进之路

kafka 七日更 28天写作 2月春节不断更

RocketMQ-Spring 毕业两周年,为什么能成为 Spring 生态中最受欢迎的 messaging 实现?

阿里巴巴云原生

Docker 容器 微服务 云原生 API

面试官:请讲一下Redis主从复制的功能及实现原理

华为云开发者联盟

redis 数据 节点 redis哨兵 主从复制

Spring Boot Admin 集成诊断利器 Arthas 实践

阿里巴巴云原生

Java Docker 容器 云原生 Arthas

回顾与总结 | 视频号28天(28)

赵新龙

28天写作

你会在车里唱K吗? (28天写作 Day27/28)

mtfelix

28天写作 智能汽车 MaaS 出行方案

信任从对自己诚实开始

Justin

心理学 信任 28天写作

Kubernetes安装篇(下):基于Kubeadm方式的集群部署

xcbeyond

Kubernetes kubeadm 部署 28天写作 Kubernetes从入门到精通

区块链终将彻底改变医疗行业,但哪些因素制约当前的采用?

CECBC

区块链

机器学习笔记之:Addition and Scalar Multiplication

Nydia

Webpack | 如何提升构建速度,进行体积优化?

梁龙先森

大前端 webpack 28天写作 2月春节不断更

口碑销量双爆的数据分析丛书再添新成员!

博文视点Broadview

区块链+电力,又擦出什么新火花?

CECBC

区块链

Mybatis【18】-- Mybatis自关联多对一查询方式

秦怀杂货店

mybatis

驱动力读书笔记之三

张老蔫

28天写作

十倍效率背后的管理逻辑

Ian哥

28天写作

人员培养,不是捷径的捷径(下)

一笑

管理 人才培养 28天写作

程序员成长第三篇:好的代码和好的工程师

石云升

28天写作 2月春节不断更 工程师等级

探索语言交互技术在政务数字化的应用

华为云开发者联盟

语音 政务 语言交互 VUI G2c

【JS】异常处理

德育处主任

JavaScript 大前端 js 28天写作 2月春节不断更

Elasticsearch Bulk API 奇特的 JSON 格式

escray

七日更 28天写作 死磕Elasticsearch 60天通过Elastic认证考试 2月春节不断更

Spark Shuffle 内部机制(一)

hanke

大数据 spark 开源

统一数据管理工具——CloudQuery v1.3.3 上线!

BinTools图尔兹

数据库 运维 开发工具 dba 数据库管理工具

Andy教授2023年数据库回顾:向量数据库没有技术护城河!没人能靠技术大佬背书“假装成功”_数据库_Andy Pavlo_InfoQ精选文章