DoltgreSQL 以版本控制数据库 Dolt 为基础构建,为 Postgre 数据库模式及数据提供类 Git 的日志、差异、分支及合并功能。
Dolt 作为 SQL 数据库,允许用户像是 Git 代码库一样进行克隆、fork、分支及合并。通过 Dolt,应用程序开发者可以为用户创建分支,合并工作流,比如发送 pull 请求修复数据中的错误。同理,Dolt 可以通过数据库分支、变更应用,在暂存环境中测试,并最终部署回生产环境的这种简单模型修改生产数据库。
Dolt 从创建之初就采用了 MySQL 的语法和面向命令行的范式,Git 用户对此必然不会感到陌生。
DoltgreSQL 专注于数据库服务体验,提供可定制且易于部署的服务器。此外,该公司表示这款数据库不提供命令行支持,以更好地与 PostgreSQL 的一般用户体验保持一致。
DoltgreSQL 的工作原理是模拟 PostgreSQL 服务器,将接收到的命令转化为 AST 后提供给底层的 Dolt 服务器。如此一来便能实现快速的启动和运行,同时还可利用 Dolt 已提供的能力和功能。
这种在 Dolt 基础之上的构建新功能的优势在于可借助后者的稳定性和可靠性,减少开发的范围和工作量。
DoltHub 称他们研究了不同的方式,其中包括编写外来数据包装器、构建全新 PostgreSQL 存储后端,甚至是 fork PostgreSQL 本身。这些方式中有些存在太大的局限性,有些(如 fork PostgreSQL)则需要数年之久的开发时间。
至于负面方面,这种仿 Git 方法的缺点在于其无法运行实际的 PostgreSQL 二进制文件。正如前文所述,DoltgreSQL 是将 PostgreSQL 语法转换为 AST 表示法,并在 Dolt 层中运行。
在完成安装 DoltgreSQL 之后,用户可以使用 psql
命令行客户端连接到数据库。若要查询数据库状态,则可运行这行语句:
这行语句会列出所有现存表,并指定这些表为新表或暂存表等等。若要将一个表添加到暂存区域,则可运行这行语句:
若要提交变更,则运行:
而 select * from dolt_log;
语句则是等同于 git log
。
Doltgres 仍处于试验阶段且存在一些限制情况,其中包括不支持 DoltHub 和 DoltLab、没有身份验证或用户管理、对 SSL 连接的支持有限、不支持复制、群集等。
虽然 Dolt 的“数据版 Git”这一价值主张听起来很有吸引力,但数据库专家 J. Andrew Rogers 在 Hacker News 上指出,这一目标与多版本并发控制(MVCC)几十年来的尝试并无二致,而且还存在几个重要缺点。Dolt 首席执行官 Tim Sehn 强调,与原生 MySQL 在 sysbench 基准的运行相对比,Dolt 仅比 MySQL 略慢一点。
原文链接:
Git-for-Data, Version-Controlled Database Dolt Gets PostgreSQL-Flavor
评论