QCon 演讲火热征集中,快来分享技术实践与洞见! 了解详情
写点什么

MariaDB 发布开源向量的预览功能,致力于成为默认的 MySQL 方案

Renato Losio

  • 2024-09-17
    北京
  • 本文字数:1179 字

    阅读完需:约 4 分钟

MariaDB 发布开源向量的预览功能,致力于成为默认的 MySQL 方案

随着 MariaDB 11.6 的发布,MariaDB 基金会宣布了公开预览的向量(Vector)搜索,以用于开源 fork 的 MySQL 引擎。数据库专家和开源倡导者认为向量搜索是 MariaDB 引领 MySQL 生态系统的一个机会,尤其是在甲骨文公司只为其企业版保留了大部分新特性的情况下。


根据发布公告,特性完备的 MariaDB 11.6 向量版本预计在几个月内发布,向量功能将会在 MariaDB 11.7 及以后的版本中全面可用。与 MySQL 9.0 目前提供的不带索引(Indexes)的新向量类型不同,MariaDB 没有提供专门的数据类型,但是引入了专门的索引以及 VEC_ToText 和 VEC_FromText 函数,这是向量存储的新可选方案。


向量搜索是基于行业标准 HNSW 算法实现的,新的 MariaDB Vector(也就是在今年早些时候 FOSDEM 上演示的 LLM 存储引擎)即将成为标准 MariaDB 服务器的一部分。


MariaDB 基金会首席执行官 Kaj Arnö 这样写到:


我们与 MySQL 服务器中的向量支持(称为 Heatwave)的差异在于,我们的向量搜索是开源的。实际上,与 MySQL 不同的是,我们仍然缺少一个单独的向量数据类型,不过我们会在正式发布前添加该数据类型。


Percona 创始人、开源倡导者 Peter Zaitsev 评论说:


显然,这个项目还处于早期阶段,但是它展示了一个重要的现象,那就是,在对现代开发人员至关重要的向量搜索方面,MariaDB 击败了甲骨文 MySQL。我很好奇甲骨文公司会有什么反应。它是否会迫使甲骨文在 MySQL 社区版中采用向量搜索,还是甲骨文不再关心他们的开源版本是否会受到现代开发者青睐?


Arnö补充道:


我们不仅要帮助 MariaDB 服务器的用户,还要帮助 MySQL 服务器的用户能够轻松地以开源方式采用向量功能。我们一直认为,从 MySQL 服务器迁移到 MariaDB 服务器非常容易,而获得向量功能则是迁移的一个重要原因。


向量搜索的实现是 MariaDB plc 员工、MariaDB 基金会和其他贡献者(尤其亚马逊云科技,它是 MariaDB 最新的支持者之一)共同努力的结果。


随着生成式 AI 工作负载越来越流行,MariaDB 并不是唯一一家致力于支持向量搜索的关系型数据库。正如 InfoQ 此前报道的那样,谷歌和亚马逊云科技已经在其托管的 RDBMS 中引入了这一选项,而 MySQL 9.0 则是首个支持向量搜索的甲骨文产品。此外,PlanetScale 去年 宣布计划 fork MySQL,以增加向量搜索的功能。


虽然许多开发人员对向量搜索的众多可选方案表示了赞赏,但用户 nhatnv 在 Reddit 上发表了这样的评论:


除非你面对的是数十亿的规模,否则我认为没有必要为向量数据库提供如此多样的选择。


MariaDB plc 首席架构师 Sergei Golubchik 在“MariaDB 向量有多么快?”一文中使用 ann-benchmarks 套件将新功能与其他向量数据库进行了对比。


鉴于目前还是 alpha 版本,所以还没有完整的二进制包;不过,Quay.io 上已经提供了支持向量搜索并启用了 CPU 优化的容器镜像。


查看英文原文

https://www.infoq.com/news/2024/08/mariadb-vector-search/

2024-09-17 08:309984

评论

发布
暂无评论
发现更多内容

技术分享 | 测试开发工程师必读经典好书清单,抽奖赠书送福利!

霍格沃兹测试开发学社

openGemini内核源码正式对外开源

华为云开发者联盟

数据库 物联网 华为云 企业号十月 PK 榜

HashMap源码分析(六)

知识浅谈

hashmap 10月月更

升级全新网络方案,给你低成本、高性能的裸金属体验

华为云开发者联盟

云计算 后端 华为云 云服务器 企业号十月 PK 榜

C++精通之路:红黑树

雪芙花

c c++ 10月月更

牛客刷题系列之进阶版(搜索旋转排序数组,链表内指定区间反转)

雪芙花

c c++ 10月月更

以指标驱动业务决策,Kyligence 亮相 Gartner IT Symposium/Xpo™ 峰会

Kyligence

数据分析 指标中台 OLAP技术

记一个“奇葩”需求的实现

甜点cc

JavaScript 前端 Element UI 10月月更

面试官:数据库加了唯一索引,就不会有重复数据了吗???

小小怪下士

Java MySQL 程序员

一种基于柔性事务的分布式事务解决方案设计探究

京东科技开发者

编程 分布式事务 事务 事务回滚 柔性事务

校招面试真题 | 显式等待与隐式等待的区别?与强制等待的方式分别是什么,有什么区别?

霍格沃兹测试开发学社

【网络安全篇】JavaSript基础内容大全

贤鱼很忙

10月月更

牛客刷题系列之初阶版(自守数,返回小于 N 的质数个数,第一个只出现一次的字符)

雪芙花

c c++ 10月月更

你真的了解过Vue的组件化开发吗🔥

渔戈

前端 Vue3 10月月更

2022年第六届数据质量管理国际峰会重磅开启

数据质量管理智库

数据 数据隐私 数据安全 峰会 数据质量

Python列表和元组有什么区别

芥末拌个饭吧

后端 python 3.5+ 10月月更

算法 | 详解斐波那契数列问题

甜点cc

JavaScript 算法 10月月更 斐波那契数列

基于Ernie-3.0 CAIL2019法研杯要素识别多标签分类任务

汀丶人工智能

nlp

热门探讨:为何数字化转型的企业,大都“死”在了黎明前夕?

优秀

数字化转型

【网络安全篇】--HTML基础(预计学习时间:30分钟)从此以后不迷糊~

贤鱼很忙

html 前端 10月月更

Vue的开发模式与webpack🔥

渔戈

前端 Vue3 10月月更

复杂场景数据处理的 OLTP 与 OLAP 融合实践

NebulaGraph

数据库 知识图谱

全彩LED显示屏近年来在中国的发展趋势

Dylan

LED显示屏 户外LED显示屏 led显示屏厂家

【kafka运维】Topic的生产和消费运维脚本

石臻臻的杂货铺

kafka kafka运维 10月月更

vue-router学习-1

Studying_swz

前端 10月月更

详解Native Memory Tracking 追踪区域分析

华为云开发者联盟

开发 华为云 企业号十月 PK 榜

【高并发】深度解析ScheduledThreadPoolExecutor类的源代码

冰河

并发编程 多线程 高并发 协程 异步编程

你真的了解v-model吗🔥

渔戈

前端 Vue3 10月月更

Java中的super和this关键字详解

共饮一杯无

Java 10月月更 super和this关键字

《Go语言学习路线图》让你少踩坑,高效学,Let’s Go!

王中阳Go

golang 学习方法 技术专题合集 10月月更 “程”风破浪的开发者

Go语言入门—06切片

良猿

Go golang 后端 10月月更

MariaDB 发布开源向量的预览功能,致力于成为默认的 MySQL 方案_后端_InfoQ精选文章