写点什么

蚂蚁集团开源向量索引库 VSAG,支持千维以上向量存储

  • 2024-09-09
    北京
  • 本文字数:875 字

    阅读完需:约 3 分钟

大小:470.54K时长:02:40
蚂蚁集团开源向量索引库VSAG,支持千维以上向量存储

近日,由蚂蚁集团发起的,旨在提高数据库与大模型应用开发效率的“星辰智能社区”新发布了两个项目:AI 原生数据应用开发框架 DB-GPT 新版本与向量索引库 VSAG。


DB-GPT 是一个开源的 AI 原生数据应用开发框架。在数据库领域,如何增强和大语言模型的交互任务,减少大模型的幻觉,为用户提供可靠并且安全的数据理解和分析能力,仍然是一项极具挑战的工作。DB-GPT 通过开发多模型管理(SMMF)、Text2SQL 效果优化、RAG 框架以及优化、Multi-Agents 框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单便捷。


本次开源的新版本 DB-GPT v0.6.0,完整支持了数据驱动的 AI 原生应用生命周期管理(AI Native Data Apps-dbgpts)以及 AI 原生应用仓库,方便开发者构建、发布、分享 AI Native Data Apps,还新增了六大特性,包括将 AWEL 协议升级至 2.0,支持更复杂的编排;结合 TuGraph,能支持图的构建与检索,进一步增强检索的准确性与召回的稳定性,以减少大模型的幻觉,在同样的检索效果下,构建 Graph 的成本比业界的方案少 50%的 Tokens;支持 Agent Memory,如感知记忆、短期/长期记忆、混合记忆等;支持意图识别、槽位填充,支持 Text2NLU、Text2GQL 微调等。


除此之前,社区还新发布了向量索引库 VSAG。VSAG 是蚂蚁集团在向量数据库上一系列的工程优化与向量索引的算法改进成果,适用于高维向量的存储和计算优化,并能提供 C++ 和 Python 的接口以便使用。VSAG 已在蚂蚁内部百亿数据量级业务上使用,在保证同样的召回率情况下,VSAG 可以通过量化和基于磁盘的重排技术,将内存消耗降低到 HNSW(最流行的向量索引)的 1/10,从而实现生产部署成本的大幅降低。VSAG 将结合 DB-GPT,让 RAG 的构建更加简单、高效,同时 VSAG 作为独立开放的向量引擎,也将支持 LangChain、LlamaIndex 构建 RAG 应用。


关于星辰智能社区

“星辰智能社区”由蚂蚁集团发起,专注于 AI 时代数据智能技术的探索,社区在 GitHub 上已获得 17k Star 数,核心成员来自蚂蚁、阿里、美团、京东、唯品会等科技公司和知名海内外高校硕博在校学生。目前已有超过 50 万用户正在学习和使用 DB-GPT,社区活跃人数近 7000 人,开发贡献者 130 人。

2024-09-09 15:416494

评论

发布
暂无评论
发现更多内容

Redis跳跃表是如何添加元素的?

小小怪下士

Java redis 面试

大语言模型的开发利器langchain

程序那些事

程序那些事 AIGC ChatGPT 大语言模型

快上车,搭乘HUAWEI HiCar驶向未来

HarmonyOS SDK

HMS Core

2023银川市等级保护测评中心地址在哪里?有几家?

行云管家

等保 等保测评 等级测评 银川

用华为云低代码Astro Zero10分钟搭建 “图书馆数据可视化大屏” 应用

华为云PaaS服务小智

软件开发 低代码 华为云

【直播预告】HarmonyOS极客松赋能直播第三期:一次开发多端部署与ArkTS卡片开发

HarmonyOS开发者

HarmonyOS

软件测试/测试开发丨Python内置库学习笔记

测试人

Python 软件测试 io 科学计算 内置库

G1垃圾回收参数调优及MySQL虚引用造成GC时间过长分析 | 京东云技术团队

京东科技开发者

MySQL G1 GC 企业号 6 月 PK 榜

一文搞定PCB元器件的布局布线

华秋PCB

元器件 PCB 布局 PCB设计 布线

华为云专家出品《从零到一•Python图像处理入门》电子书

华为云PaaS服务小智

Python 华为 华为云 华为开发者大会2023

程序员用哪一种IDE写代码比较好?

没有用户名丶

融云出海:TikTok 百亿美元投向东南亚,巨头将如何影响市场格局

融云 RongCloud

产品 运维 出海 市场 通讯

Spring Boot配置文件加载顺序详解

2756

推荐几款可以大幅提高开发效率的vscode插件 | 京东云技术团队

京东科技开发者

Vue 前端 vscode

schema registry口令认证配置

Shen-Xmas

kafka Bigdata dba schema schema registry

AIGC+任务管理|给既定目标一个“精准打击”

TE智库

人工智能 任务管理 AIGC 生成式AI

英特尔宣布极光超级计算机安装完成,将于2023年末正式上线!

E科讯

行业首个多重节律照明!三翼鸟“亮”在哪?

脑极体

智能照明

【网络安全】堡垒机对于企业的重要性你知道吗?

行云管家

云计算 运维 网络安全 堡垒机

从Kafka中学习高性能系统如何设计 | 京东云技术团队

京东科技开发者

云计算 kafka 高性能 企业号 6 月 PK 榜

VLDB2023|方略:一个交互式的规则研发系统

AI Infra

程序员 AI 开发者 AI大模型 大模型时代

图文结合带你搞懂GreatSQL体系架构

GreatSQL

greatsql greatsql社区

HTML5 游戏开发实战 | 黑白棋

TiAmo

html html5 6 月 优质更文活动

MaxCompute湖仓一体近实时增量处理技术架构揭秘

阿里云大数据AI技术

sql 大数据 分布式计算 数据处理 企业号 6 月 PK 榜

构建系列之新一代利器Esbuild(下)

江湖修行

前端 cli 构建 #web esbuild

安全专家们看过来,易安联EnSRC第二期众测启动

权说安全

IPQ9574-Four M.2 Connectors Platform|Wallys Industrial WIFI7 Solution

wallyslilly

WiFi7 ipq9574

低代码渲染那些事

阿里技术

低代码 渲染

直播系统源码知识分享:解你忧愁!降低直播延迟的实现

山东布谷科技

软件开发 源码搭建 直播系统源码 直播源码

Intellij IDEA 插件开发 | 京东云技术团队

京东科技开发者

Java IntelliJ IDEA 企业号 6 月 PK 榜 插件工程

mysql

ltc

MySQL

蚂蚁集团开源向量索引库VSAG,支持千维以上向量存储_AI&大模型_蚂蚁集团_InfoQ精选文章