FCon7折倒计时最后一周:日程已上线70%!查看详情>>> 了解详情
写点什么

腾讯云发布 AI 原生向量数据库:已支撑腾讯视频、QQ 浏览器等业务,提供 10 亿级向量检索能力

  • 2023-07-04
    北京
  • 本文字数:1335 字

    阅读完需:约 4 分钟

腾讯云发布AI原生向量数据库:已支撑腾讯视频、QQ浏览器等业务,提供10亿级向量检索能力

7 月 4 日,腾讯云正式发布 AI 原生(AI Native)向量数据库 Tencent Cloud VectorDB。该数据库能够被广泛应用于大模型的训练、推理和知识库补充等场景,是国内首个从接入层、计算层、到存储层提供全生命周期 AI 化的向量数据库。


向量数据库专门用于存储和查询向量数据,业界称之为大模型的“海马体”。据介绍,腾讯云向量数据库最高支持 10 亿级向量检索规模,延迟控制在毫秒级,相比传统单机插件式数据库检索规模提升 10 倍,同时具备百万级每秒查询(QPS)的峰值能力。

腾讯云定义 AI Native 向量数据库


大模型时代的到来,拥抱大模型成为企业的刚需。


向量数据库通过把数据向量化然后进行存储和查询,可以极大地提升效率和降低成本。它能解决大模型预训练成本高、没有“长期记忆”、知识更新不足、提示词工程复杂等问题,突破大模型在时间和空间上的限制,加速大模型落地行业场景。


统计显示,将腾讯云向量数据库用于大模型预训练数据的分类、去重和清洗相比传统方式可以实现 10 倍效率的提升,如果将向量数据库作为外部知识库用于模型推理,则可以将成本降低 2-4 个数量级。


值得关注的是,腾讯云重新定义了 AI Native 的开发范式,提供了接入层、计算层、存储层的全面 AI 化解决方案,使用户在使用向量数据库的全生命周期,都能应用到 AI 能力。


具体而言,在接入层,腾讯云向量数据库支持自然语言文本的输入,同时采用“标量+向量”的查询方式,支持全内存索引,最高支持每秒百万的查询量(QPS);在计算层,AI Native 开发范式能实现全量数据 AI 计算,一站式解决企业在搭建私域知识库时的文本切分(segment)、向量化(embedding)等难题;在存储层,腾讯云向量数据库支持数据智能存储分布,助力企业存储成本降低 50%。



企业原先接入一个大模型需要花 1 个月左右时间,使用腾讯云向量数据库后,3 天时间即可完成,极大降低了企业的接入成本。


据了解,腾讯云向量数据库的向量化能力(embedding)曾多次获得权威机构认可,2021 年曾登顶 MS MARCO 榜单第一、相关成果已发表于 NLP 顶会 ACL。


腾讯云数据库副总经理罗云表示,AI Native(AI 原生)时代已经到来,“向量数据库+大模型+数据”,三者将产生“飞轮效应”,共同助力企业步入 AI Native(AI 原生)时代。

腾讯云向量数据库助力数据接入效率提升 10 倍


腾讯云向量数据库基于腾讯集团每日处理千亿次检索的向量引擎(OLAMA),经过腾讯内部海量场景的实践,数据接入 AI 的效率也比传统方案提升 10 倍,运行稳定性高达 99.99%,目前已经应用在了腾讯视频、QQ 浏览器、QQ 音乐等 30 多款国民级产品中。


腾讯云向量数据库能有效助力产品提升运营效率。数据显示,使用腾讯云向量数据库后,QQ 音乐人均听歌时长提升 3.2%、腾讯视频有效曝光人均时长提升 1.74%、QQ 浏览器成本降低 37.9%。


以腾讯视频的应用为例,视频库中的图片、音频、标题文本等内容使用腾讯云向量数据库,月均完成的检索和计算量高达 200 亿次,有效满足了版权保护、原创识别、相似性检索等场景需求。


大模型加速向量数据库进入飞速发展期,据东北证券预测,到 2030 年,全球向量数据库市场规模有望达到 500 亿美元,国内向量数据库市场规模有望超过 600 亿人民币。


向量数据库可以帮助企业更高效、便捷地使用大模型,将数据的价值释放到最大,随着大模型的不断发展和普及,AI Native 向量数据库将成为企业数据处理的标配。

2023-07-04 16:143934
用户头像
李冬梅 加V:busulishang4668

发布了 710 篇内容, 共 288.3 次阅读, 收获喜欢 888 次。

关注

评论

发布
暂无评论
发现更多内容

面试官:你是怎样进行react组件代码复用的

beifeng1996

React

阿里云块存储团队卓越工程实践

阿里技术

经验分享 语言 & 开发

Flowable 任务如何认领,回退?

江南一点雨

Java springboot workflow flowable JavaEE

爆火的RPA尚在初期阶段,拥挤的赛道厂商如何突围?

ToB行业头条

一天梳理完react面试高频题

beifeng1996

React

MySQL高级--性能优化之索引

Java学术趴

10月月更

什么是深度学习?人工智能能影响未来的特点之一

Finovy Cloud

人工智能 深度学习

明道云伙伴大会2022/秋,免费门票限量领

明道云

低代码 零代码 aPaaS

【愚公系列】2022年10月 Go教学课程 025-递归函数

愚公搬代码

10月月更

MySQL高级--性能优化开篇

Java学术趴

10月月更

MySQL高级--性能优化之索引使用

Java学术趴

10月月更

向量数据库是如何检索的?基于 Feder 的 IVF_FLAT 可视化实现

Zilliz

人工智能 可视化 向量检索 anns 以图搜图

什么是数字体验平台(DXP)?

Baklib

客户体验 数字体验

Spring Boot「03」使用 Maven 管理并构建项目

Samson

Java spring Spring Boot 学习笔记 10月月更

得物 × StarRocks:潮流网购社区的极速 OLAP 实践

StarRocks

数据库、

MySQL高级--性能优化之Explain分析SQL

Java学术趴

10月月更

String、StringBuffer、StringBuilder的区别

zarmnosaj

10月月更

JFrog Xray 与 Amazon Security Hub 集成

亚马逊云科技 (Amazon Web Services)

安全 DevSecOps

融云 uni-app 原生插件,生态丰富、高效集成

融云 RongCloud

sdk 集成 uri app

技术解读:现代化工具链在大规模 C++ 项目中的运用 | 龙蜥技术

OpenAnolis小助手

c++ 开源 龙蜥技术 优化技术 ThinLTO

使用rust实现的持久kv存储

杨光跃

rust KV存储引擎

企业集成方案

久歌

企业架构 企业集成

公司合同管理软件有哪些?

优秀

合同管理软件

【Nacos源码之配置管理 十一】服务端LongPollingService推送变更数据到客户端

石臻臻的杂货铺

nacos 10月月更

【一Go到底】第十一天---流程控制

指剑

Go golang 10月月更

SAAS公司的金额续费率怎么算

久歌

企业架构 SaaS 数字化

用了这个API协作调试工具,忘记了postman

Liam

Postman 接口调试 开放api API接口 API调试

SchedulX V1.7.0更新,规格压测、成本洞察等重磅功能发布!

星汉未来

云原生 降本增效 星汉未来

网易数帆数据治理2.0实践分享

网易数帆

大数据 数据中台 数据治理 数据质量 企业号十月 PK 榜

【Nacos源码之配置管理 十】客户端长轮询监听服务端变更数据

石臻臻的杂货铺

nacos 10月月更

软件工程基础知识总结

老张

软件工程

  • 扫码添加小助手
    领取最新资料包
腾讯云发布AI原生向量数据库:已支撑腾讯视频、QQ浏览器等业务,提供10亿级向量检索能力_腾讯_李冬梅_InfoQ精选文章