7 月 4 日,腾讯云正式发布 AI 原生(AI Native)向量数据库 Tencent Cloud VectorDB。该数据库能够被广泛应用于大模型的训练、推理和知识库补充等场景,是国内首个从接入层、计算层、到存储层提供全生命周期 AI 化的向量数据库。
向量数据库专门用于存储和查询向量数据,业界称之为大模型的“海马体”。据介绍,腾讯云向量数据库最高支持 10 亿级向量检索规模,延迟控制在毫秒级,相比传统单机插件式数据库检索规模提升 10 倍,同时具备百万级每秒查询(QPS)的峰值能力。
腾讯云定义 AI Native 向量数据库
大模型时代的到来,拥抱大模型成为企业的刚需。
向量数据库通过把数据向量化然后进行存储和查询,可以极大地提升效率和降低成本。它能解决大模型预训练成本高、没有“长期记忆”、知识更新不足、提示词工程复杂等问题,突破大模型在时间和空间上的限制,加速大模型落地行业场景。
统计显示,将腾讯云向量数据库用于大模型预训练数据的分类、去重和清洗相比传统方式可以实现 10 倍效率的提升,如果将向量数据库作为外部知识库用于模型推理,则可以将成本降低 2-4 个数量级。
值得关注的是,腾讯云重新定义了 AI Native 的开发范式,提供了接入层、计算层、存储层的全面 AI 化解决方案,使用户在使用向量数据库的全生命周期,都能应用到 AI 能力。
具体而言,在接入层,腾讯云向量数据库支持自然语言文本的输入,同时采用“标量+向量”的查询方式,支持全内存索引,最高支持每秒百万的查询量(QPS);在计算层,AI Native 开发范式能实现全量数据 AI 计算,一站式解决企业在搭建私域知识库时的文本切分(segment)、向量化(embedding)等难题;在存储层,腾讯云向量数据库支持数据智能存储分布,助力企业存储成本降低 50%。
企业原先接入一个大模型需要花 1 个月左右时间,使用腾讯云向量数据库后,3 天时间即可完成,极大降低了企业的接入成本。
据了解,腾讯云向量数据库的向量化能力(embedding)曾多次获得权威机构认可,2021 年曾登顶 MS MARCO 榜单第一、相关成果已发表于 NLP 顶会 ACL。
腾讯云数据库副总经理罗云表示,AI Native(AI 原生)时代已经到来,“向量数据库+大模型+数据”,三者将产生“飞轮效应”,共同助力企业步入 AI Native(AI 原生)时代。
腾讯云向量数据库助力数据接入效率提升 10 倍
腾讯云向量数据库基于腾讯集团每日处理千亿次检索的向量引擎(OLAMA),经过腾讯内部海量场景的实践,数据接入 AI 的效率也比传统方案提升 10 倍,运行稳定性高达 99.99%,目前已经应用在了腾讯视频、QQ 浏览器、QQ 音乐等 30 多款国民级产品中。
腾讯云向量数据库能有效助力产品提升运营效率。数据显示,使用腾讯云向量数据库后,QQ 音乐人均听歌时长提升 3.2%、腾讯视频有效曝光人均时长提升 1.74%、QQ 浏览器成本降低 37.9%。
以腾讯视频的应用为例,视频库中的图片、音频、标题文本等内容使用腾讯云向量数据库,月均完成的检索和计算量高达 200 亿次,有效满足了版权保护、原创识别、相似性检索等场景需求。
大模型加速向量数据库进入飞速发展期,据东北证券预测,到 2030 年,全球向量数据库市场规模有望达到 500 亿美元,国内向量数据库市场规模有望超过 600 亿人民币。
向量数据库可以帮助企业更高效、便捷地使用大模型,将数据的价值释放到最大,随着大模型的不断发展和普及,AI Native 向量数据库将成为企业数据处理的标配。
评论