写点什么

MariaDB 发布开源向量的预览功能,致力于成为默认的 MySQL 方案

Renato Losio

  • 2024-09-17
    北京
  • 本文字数:1179 字

    阅读完需:约 4 分钟

MariaDB 发布开源向量的预览功能,致力于成为默认的 MySQL 方案

随着 MariaDB 11.6 的发布,MariaDB 基金会宣布了公开预览的向量(Vector)搜索,以用于开源 fork 的 MySQL 引擎。数据库专家和开源倡导者认为向量搜索是 MariaDB 引领 MySQL 生态系统的一个机会,尤其是在甲骨文公司只为其企业版保留了大部分新特性的情况下。


根据发布公告,特性完备的 MariaDB 11.6 向量版本预计在几个月内发布,向量功能将会在 MariaDB 11.7 及以后的版本中全面可用。与 MySQL 9.0 目前提供的不带索引(Indexes)的新向量类型不同,MariaDB 没有提供专门的数据类型,但是引入了专门的索引以及 VEC_ToText 和 VEC_FromText 函数,这是向量存储的新可选方案。


向量搜索是基于行业标准 HNSW 算法实现的,新的 MariaDB Vector(也就是在今年早些时候 FOSDEM 上演示的 LLM 存储引擎)即将成为标准 MariaDB 服务器的一部分。


MariaDB 基金会首席执行官 Kaj Arnö 这样写到:


我们与 MySQL 服务器中的向量支持(称为 Heatwave)的差异在于,我们的向量搜索是开源的。实际上,与 MySQL 不同的是,我们仍然缺少一个单独的向量数据类型,不过我们会在正式发布前添加该数据类型。


Percona 创始人、开源倡导者 Peter Zaitsev 评论说:


显然,这个项目还处于早期阶段,但是它展示了一个重要的现象,那就是,在对现代开发人员至关重要的向量搜索方面,MariaDB 击败了甲骨文 MySQL。我很好奇甲骨文公司会有什么反应。它是否会迫使甲骨文在 MySQL 社区版中采用向量搜索,还是甲骨文不再关心他们的开源版本是否会受到现代开发者青睐?


Arnö补充道:


我们不仅要帮助 MariaDB 服务器的用户,还要帮助 MySQL 服务器的用户能够轻松地以开源方式采用向量功能。我们一直认为,从 MySQL 服务器迁移到 MariaDB 服务器非常容易,而获得向量功能则是迁移的一个重要原因。


向量搜索的实现是 MariaDB plc 员工、MariaDB 基金会和其他贡献者(尤其亚马逊云科技,它是 MariaDB 最新的支持者之一)共同努力的结果。


随着生成式 AI 工作负载越来越流行,MariaDB 并不是唯一一家致力于支持向量搜索的关系型数据库。正如 InfoQ 此前报道的那样,谷歌和亚马逊云科技已经在其托管的 RDBMS 中引入了这一选项,而 MySQL 9.0 则是首个支持向量搜索的甲骨文产品。此外,PlanetScale 去年 宣布计划 fork MySQL,以增加向量搜索的功能。


虽然许多开发人员对向量搜索的众多可选方案表示了赞赏,但用户 nhatnv 在 Reddit 上发表了这样的评论:


除非你面对的是数十亿的规模,否则我认为没有必要为向量数据库提供如此多样的选择。


MariaDB plc 首席架构师 Sergei Golubchik 在“MariaDB 向量有多么快?”一文中使用 ann-benchmarks 套件将新功能与其他向量数据库进行了对比。


鉴于目前还是 alpha 版本,所以还没有完整的二进制包;不过,Quay.io 上已经提供了支持向量搜索并启用了 CPU 优化的容器镜像。


查看英文原文

https://www.infoq.com/news/2024/08/mariadb-vector-search/

2024-09-17 08:301

评论

发布
暂无评论

DAPP算力合约代币质押项目系统开发步骤详细解析

V\TG【ch3nguang】

AIGC应用实战营-毕业总结

王琨琨

为什么要用云手机进行海外社交营销

Ogcloud

云手机 海外云手机 云手机海外版 海外社媒营销

阿里巴巴拍立淘API返回值:商品分类与属性的智能识别

技术冰糖葫芦

API Explorer API 接口 API 策略

Voice agent connected!回顾一场 24 小时的黑客松

声网

微软发布 Phi-3.5 系列模型,涵盖端侧、多模态、MOE;字节 Seed-ASR:自动识别多语言丨 RTE 开发者日报

声网

Python多进程日志以及分布式日志的实现方式

我再BUG界嘎嘎乱杀

Python 编程 多线程 日志 分布式日志

腾讯会议升级“万室如意”计划,助力实体会议室引入AI能力

Geek_2d6073

Java 流式编程的七个必学技巧

高端章鱼哥

短剧开发丨短剧系统开发模式讲解丨短剧现成源码

V\TG【ch3nguang】

短剧系统开发

快手主站前端工程化探索:Gundam 脚手架在新春除夕项目中的实践与展望

快手技术

前段

关于Arrays.asList返回List无法新增和删除?

EquatorCoco

数据结构 后端

IPQ5018 motherboard: QCN6102-QCN6122 Multi-band integration -DIY customization

wifi6-yiyi

wifi ipq5018 WIFI6E

ReidsTemplate序列化器

李爽

5款在线PPT工具,一键生成精美的PPT幻灯片!

职场工具箱

效率工具 职场 PPT 办公软件 AI生成PPT

七牛云 CDN 视频瘦身,为视频分发「减负增效」

七牛云

CDN CDN带宽

2025第二十四届杭州国际智能楼宇展览会

AIOTE智博会

智能楼宇展 智能楼宇展会 智能楼宇展览会

推三返一消费全返模式系统开发指南教程/步骤详细/功能逻辑/源码程序

V\TG【ch3nguang】

让程序员欲罢不能的职场工具合集

伤感汤姆布利柏

解锁未来财富密码:AI自动化副业创收班——终身财富加速器

测吧(北京)科技有限公司

测试

动态化-鸿蒙跨端方案介绍

京东科技开发者

python Socket无限发送接收数据方式

我再BUG界嘎嘎乱杀

Python 编程 后端 socket 开发语言

上线一天销售额超15亿!《黑神话:悟空》火爆全网的技术秘诀!

可信AI进展

人工智能

一对一语音视频聊天APP系统开发玩法设计/步骤指南/案例源码

V\TG【ch3nguang】

云手机如何保障TikTok多账号安全运营

Ogcloud

云手机 海外云手机 tiktok云手机 手机群控 tiktok矩阵

数据安全审计必备攻略:一文掌握6大核心审计要点(附下载)

极盾科技

基于飞桨框架实现PCA的人脸识别算法

百度Geek说

人脸识别 百度飞桨

Python开发中,SQLAlchemy 的同步操作和异步操作封装,以及常规CRUD的处理。

不在线第一只蜗牛

Python 数据库 oracle

一文了解电商大促系统的高可用保障思路-献给技术伙伴们

京东科技开发者

2024年最受欢迎的轻量级项目管理软件推荐

易成管理学

项目管理 轻量项目管理

如何使用 Higress 快速构建 AI 应用?

阿里巴巴云原生

阿里云 云原生 Higress

MariaDB 发布开源向量的预览功能,致力于成为默认的 MySQL 方案_后端_InfoQ精选文章