速来报名!AICon北京站鸿蒙专场~ 了解详情
写点什么

蚂蚁集团开源向量索引库 VSAG,支持千维以上向量存储

  • 2024-09-09
    北京
  • 本文字数:875 字

    阅读完需:约 3 分钟

大小:470.54K时长:02:40
蚂蚁集团开源向量索引库VSAG,支持千维以上向量存储

近日,由蚂蚁集团发起的,旨在提高数据库与大模型应用开发效率的“星辰智能社区”新发布了两个项目:AI 原生数据应用开发框架 DB-GPT 新版本与向量索引库 VSAG。


DB-GPT 是一个开源的 AI 原生数据应用开发框架。在数据库领域,如何增强和大语言模型的交互任务,减少大模型的幻觉,为用户提供可靠并且安全的数据理解和分析能力,仍然是一项极具挑战的工作。DB-GPT 通过开发多模型管理(SMMF)、Text2SQL 效果优化、RAG 框架以及优化、Multi-Agents 框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单便捷。


本次开源的新版本 DB-GPT v0.6.0,完整支持了数据驱动的 AI 原生应用生命周期管理(AI Native Data Apps-dbgpts)以及 AI 原生应用仓库,方便开发者构建、发布、分享 AI Native Data Apps,还新增了六大特性,包括将 AWEL 协议升级至 2.0,支持更复杂的编排;结合 TuGraph,能支持图的构建与检索,进一步增强检索的准确性与召回的稳定性,以减少大模型的幻觉,在同样的检索效果下,构建 Graph 的成本比业界的方案少 50%的 Tokens;支持 Agent Memory,如感知记忆、短期/长期记忆、混合记忆等;支持意图识别、槽位填充,支持 Text2NLU、Text2GQL 微调等。


除此之前,社区还新发布了向量索引库 VSAG。VSAG 是蚂蚁集团在向量数据库上一系列的工程优化与向量索引的算法改进成果,适用于高维向量的存储和计算优化,并能提供 C++ 和 Python 的接口以便使用。VSAG 已在蚂蚁内部百亿数据量级业务上使用,在保证同样的召回率情况下,VSAG 可以通过量化和基于磁盘的重排技术,将内存消耗降低到 HNSW(最流行的向量索引)的 1/10,从而实现生产部署成本的大幅降低。VSAG 将结合 DB-GPT,让 RAG 的构建更加简单、高效,同时 VSAG 作为独立开放的向量引擎,也将支持 LangChain、LlamaIndex 构建 RAG 应用。


关于星辰智能社区

“星辰智能社区”由蚂蚁集团发起,专注于 AI 时代数据智能技术的探索,社区在 GitHub 上已获得 17k Star 数,核心成员来自蚂蚁、阿里、美团、京东、唯品会等科技公司和知名海内外高校硕博在校学生。目前已有超过 50 万用户正在学习和使用 DB-GPT,社区活跃人数近 7000 人,开发贡献者 130 人。

2024-09-09 15:416649

评论

发布
暂无评论
发现更多内容

制造业工厂万界星空科技云MES系统中的设备管理模块

万界星空科技

生产管理系统 mes 设备资产管理系统 制造业数字化

OpenHarmony知识共享与论坛共建:更深层次的社区共建与繁荣

新消费日报

API测试:了解API接口测试与API接口测试指南

Noah

ios数据清除工具 FoneLab FoneEraser for iOS中文最新版

mac大玩家j

Mac软件 数据清除工具 iOS数据管理

从互联网到云计算再到 AI 原生,百度智能云数据库的演进

Baidu AICLOUD

redis 分布式数据库 云原生数据库

KeyShot 2023 Pro 动画渲染制作工具 附 安装教程 支持M1

加油,小妞!

3D动画渲染软件 KeyShot Pro 2023下载

一种全新的日志异常检测评估框架:LightAD

华为云开发者联盟

人工智能 机器学习 深度学习 华为云 华为云开发者联盟

Milvus 2.3.功能全面升级,核心组件再升级,超低延迟、高准确度、MMap一触开启数据处理量翻倍、支持GPU使用!

汀丶人工智能

向量检索 Milvus 向量数据库

解锁数据库运维秘籍:掌握AntDB-T动态共享内存,提升进程间通信效率

亚信AntDB数据库

亚信科技 数据库· AntDB数据库

选择美国站群服务器的五大理由:安全、稳定、高效

一只扑棱蛾子

美国站群服务器

人工智能 |企业私有版大语言模型引领人工智能创新

测吧(北京)科技有限公司

测试

为什么云游戏被认为是行业的未来趋势?

Finovy Cloud

5G 游戏 vr 云计算, 云游戏

这么有趣的ts类型,不看真的会后悔!

秃头小帅oi

TDengine 3.0 数据订阅功能的“独家”使用经验,只此一份!

TDengine

tdengine 时序数据库

LangChain:引领人工智能应用系统的语言模型革新

测吧(北京)科技有限公司

测试

Permute 3 for mac(媒体文件格式转换器) 3.11.2中文版

展初云

Mac 格式转换 视频转换

软件测试/人工智能丨​Python运算符解析,小白也能轻松get

测试人

人工智能 软件测试

数仓实时算子难以观测,快来试试算子级监控吧

华为云开发者联盟

数据库 后端 华为云 华为云GaussDB 华为云开发者联盟

对话在行人|索通发展:从ERP到BIP,携手用友共创数智索通

用友BIP

企业数智化

王文京:行业化经营创造更大的客户价值

用友BIP

第七期 |《实时洞察 智能运营一用友企业绩效管理白皮书》解读

用友BIP

企业绩效

FoneLab Location Changer for mac虚拟定位软件

展初云

Mac 虚拟定位软件

怎么理解 React Server Component 和 Next.js 的关系

伤感汤姆布利柏

一个干净的前端架构是什么样的?

秃头小帅oi

Downie 4 for Mac(好用的视频下载软件) 4.6.34直装版

展初云

Mac 视频下载 Downie

DAPP开发:探索NFT DAPP的世界创建和启动指南

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

8个比较流行的无/低代码后端数据平台

小狗围观科幻

全国见!飞桨星河社区五周年,邀你共赴大模型盛宴!

飞桨PaddlePaddle

人工智能 开发者 大模型 星河社区

阿里云 E-MapReduce 全面开启 Serverless 时代

阿里云大数据AI技术

众包平台,解锁自由职业者的灵活空间

知者如C

蚂蚁集团开源向量索引库VSAG,支持千维以上向量存储_AI&大模型_蚂蚁集团_InfoQ精选文章