写点什么

MariaDB 发布开源向量的预览功能,致力于成为默认的 MySQL 方案

Renato Losio

  • 2024-09-17
    北京
  • 本文字数:1179 字

    阅读完需:约 4 分钟

MariaDB 发布开源向量的预览功能,致力于成为默认的 MySQL 方案

随着 MariaDB 11.6 的发布,MariaDB 基金会宣布了公开预览的向量(Vector)搜索,以用于开源 fork 的 MySQL 引擎。数据库专家和开源倡导者认为向量搜索是 MariaDB 引领 MySQL 生态系统的一个机会,尤其是在甲骨文公司只为其企业版保留了大部分新特性的情况下。


根据发布公告,特性完备的 MariaDB 11.6 向量版本预计在几个月内发布,向量功能将会在 MariaDB 11.7 及以后的版本中全面可用。与 MySQL 9.0 目前提供的不带索引(Indexes)的新向量类型不同,MariaDB 没有提供专门的数据类型,但是引入了专门的索引以及 VEC_ToText 和 VEC_FromText 函数,这是向量存储的新可选方案。


向量搜索是基于行业标准 HNSW 算法实现的,新的 MariaDB Vector(也就是在今年早些时候 FOSDEM 上演示的 LLM 存储引擎)即将成为标准 MariaDB 服务器的一部分。


MariaDB 基金会首席执行官 Kaj Arnö 这样写到:


我们与 MySQL 服务器中的向量支持(称为 Heatwave)的差异在于,我们的向量搜索是开源的。实际上,与 MySQL 不同的是,我们仍然缺少一个单独的向量数据类型,不过我们会在正式发布前添加该数据类型。


Percona 创始人、开源倡导者 Peter Zaitsev 评论说:


显然,这个项目还处于早期阶段,但是它展示了一个重要的现象,那就是,在对现代开发人员至关重要的向量搜索方面,MariaDB 击败了甲骨文 MySQL。我很好奇甲骨文公司会有什么反应。它是否会迫使甲骨文在 MySQL 社区版中采用向量搜索,还是甲骨文不再关心他们的开源版本是否会受到现代开发者青睐?


Arnö补充道:


我们不仅要帮助 MariaDB 服务器的用户,还要帮助 MySQL 服务器的用户能够轻松地以开源方式采用向量功能。我们一直认为,从 MySQL 服务器迁移到 MariaDB 服务器非常容易,而获得向量功能则是迁移的一个重要原因。


向量搜索的实现是 MariaDB plc 员工、MariaDB 基金会和其他贡献者(尤其亚马逊云科技,它是 MariaDB 最新的支持者之一)共同努力的结果。


随着生成式 AI 工作负载越来越流行,MariaDB 并不是唯一一家致力于支持向量搜索的关系型数据库。正如 InfoQ 此前报道的那样,谷歌和亚马逊云科技已经在其托管的 RDBMS 中引入了这一选项,而 MySQL 9.0 则是首个支持向量搜索的甲骨文产品。此外,PlanetScale 去年 宣布计划 fork MySQL,以增加向量搜索的功能。


虽然许多开发人员对向量搜索的众多可选方案表示了赞赏,但用户 nhatnv 在 Reddit 上发表了这样的评论:


除非你面对的是数十亿的规模,否则我认为没有必要为向量数据库提供如此多样的选择。


MariaDB plc 首席架构师 Sergei Golubchik 在“MariaDB 向量有多么快?”一文中使用 ann-benchmarks 套件将新功能与其他向量数据库进行了对比。


鉴于目前还是 alpha 版本,所以还没有完整的二进制包;不过,Quay.io 上已经提供了支持向量搜索并启用了 CPU 优化的容器镜像。


查看英文原文

https://www.infoq.com/news/2024/08/mariadb-vector-search/

2024-09-17 08:3010080

评论

发布
暂无评论
发现更多内容

FILPool云算力挖矿系统开发源码案例

系统开发咨询1357O98O718

Spark内存管理与调优

小舰

4月日更

浅谈BSS3.0产品“守成”之策中 • 业务提升篇

鲸品堂

系统架构 性能调优

专访阿里巴巴研究员吴翰清 | 安全的持续运营之道

架构精进之路

4月日更 调查采访能力考核 人物访谈

YouTube如何下载1080P的高清视频带声音?5种方法可以搞定

右手牵

下载 视频 youtube

时间很贵,有趣才对

小天同学

读书笔记 读书感悟 好书推荐 有趣 4月日更

独家对话阿里云函数计算负责人不瞋:你所不知道的 Serverless

阿里巴巴云原生

Serverless 容器 微服务 开发者 云原生

Linux nslookup 命令

一个大红包

Linux linux命令 4月日更

面试4轮字节Java研发岗,最终拿下2-1Offer(原题复盘)

Java架构追梦

Java 字节跳动 面试

手机淘宝轻店业务 Serverless 研发模式升级实践

Serverless Devs

阿里云 Serverless 云原生 淘宝

如何缓解低代码开发的安全风险

YonBuilder低代码开发平台

小程序云开发 开发者 低代码 APP开发 APICloud

Redis的AOF方案(Redis持久化)

大数据技术指南

redis 4月日更

腾讯iOS开发要达到咋样的水准?

一意孤行的程序员

flutter 职业规划 音视频 ios开发 iOS逆向

产业级项目实战配合技术讲解,百度零门槛AI开发实训营重磅开营

百度大脑

百度 AI

低代码真能做到“让人人都能做开发者”吗?

优秀

低代码

Go Channel

escray

学习 极客时间 Go 语言 4月日更

万字长文,38 图爆肝 Redis 基础!

一个优秀的废人

redis 数据结构 集合 哈希表 跳表

gdb调试工具使用

正向成长

gdb

不忘初心,中级领导力修炼

IT民工大叔

领导力 管理

数字化转型:打破孤岛以提高数据安全性

龙归科技

数字化

专访前美篇首席架构师张超|从工程师到CTO的蜕变

Aldeo

程序员 采访 调查采访能力考核

ORC格式和PARQUET格式介绍

五分钟学大数据

hive 存储 4月日更

苦难中开花|靠谱点评

无量靠谱

Rust从0到1-代码组织-Packages和Crates

rust Package crate

随机而转 当机而动|靠谱点评

无量靠谱

JVM 读书笔记(一) 内存划分

U2647

JVM 4月日更

工作三年,小胖连 HashMap 源码都没读过?真的菜!

一个优秀的废人

扩容 hashmap 源码剖析 HashMap底层原理 加载因子

【全网首发】2021 年从iOS初级到大牛,涵盖大部分iOS开发知识体系,不会没收藏吧!

一意孤行的程序员

swift 面试 ios开发 底层应用开发 知识分享

阿里P8带你学习:一次线上服务高 CPU 占用优化实践

学Java关注我

Java 编程 架构 程序人生 软件架构

云洲链硬核支撑!济南标识解析二级节点解析量全国第一

云计算

英特尔Ice Lake对于高性能计算市场意味着什么

E科讯

MariaDB 发布开源向量的预览功能,致力于成为默认的 MySQL 方案_后端_InfoQ精选文章