谷歌Vertex AI推出新的RAG引擎_AI&大模型

Vertex AI RAG Engine 是一项托管的编排服务，旨在简化大语言模型与外部数据源的连接，它能够帮助模型保持数据更新，生成更贴合需求的答案，并有效减少幻觉。

根据谷歌的说法，新的 RAG Engine 是使用 Vertex AI 实现基于 RAG 的 LLM 的“理想选择”，它在 Vertex AI Search 的易用性与基于底层 Vertex AI API（如文本嵌入 API、排名 API 等）构建自定义 RAG 管道的强大功能之间取得了平衡。

Vertex AI RAG Engine 支持的总体工作流包含了从多种不同来源摄取数据的步骤：数据转换，例如在索引之前将数据拆分为块；嵌入处理，将文本转换为数值向量，以捕捉其语义和上下文；数据索引，构建针对搜索进行了优化语料库；基于用户提示词从知识库中检索相关信息；最后是生成内容，将原始用户查询与检索到的信息结合，生成最终输出。

使用 Vertex AI RAG Engine，你可以很容易地将所有这些步骤集成到自己的解决方案中。集成 Vertex AI RAG Engine 最简单的方式是使用它的 Python 绑定，这些绑定位于 google-cloud-aiplatform 包中。在设置 Google Cloud 项目并初始化 Vertex AI 引擎后，你可以使用 upload_file 或 import_file 方法快速从本地文件、Google Cloud Storage 或 Google Drive 中的文档创建语料库。

# Currently supports Google first-party embedding modelsEMBEDDING_MODEL = "publishers/google/models/text-embedding-004"  # @param {type:"string", isTemplate: true}embedding_model_config = rag.EmbeddingModelConfig(publisher_model=EMBEDDING_MODEL)

rag_corpus = rag.create_corpus(    display_name="my-rag-corpus", embedding_model_config=embedding_model_config)

rag_file = rag.upload_file(    corpus_name=rag_corpus.name,    path="test.txt",    display_name="test.txt",    description="my test file",)

复制代码

在有了语料库之后，你就可以创建一个检索工具，然后将其连接到 LLM，并暴露出端点，你可以使用该端点查询增强后的模型：

# Create a tool for the RAG Corpusrag_retrieval_tool = Tool.from_retrieval(    retrieval=rag.Retrieval(        source=rag.VertexRagStore(            rag_corpora=[rag_corpus.name],            similarity_top_k=10,            vector_distance_threshold=0.5,        ),    ))

# Load tool into Gemini modelrag_gemini_model = GenerativeModel(    "gemini-1.5-flash-001",  # your self-deployed endpoint    tools=[rag_retrieval_tool],)

response = rag_gemini_model.generate_content("What is RAG?")

复制代码

根据谷歌的说法，Vertex AI RAG Engine 特别适合用于个性化投资建议与风险评估、加速药物发现与个性化治疗计划制定，以及增强尽职调查和合同审查等场景。

检索增强生成（RAG）是一种用于 “锚定” 大语言模型的技术，即使其更适合特定用例或企业环境。RAG 的核心是从模型训练时无法访问的外部数据源中检索与特定任务相关的信息，并将这些信息与提示词一起提供给模型。或者也可以通过微调来“锚定”模型，这是一个使用外部数据重新训练模型的过程，即使在提示词中未明确指定，模型也能在每次查询时提供更贴合需求的结果。

锚定模型使其能够更好地理解查询的上下文，并提供额外特定于任务的信息，从而生成更好的答案。更具体地说，在企业数据场景中，锚定旨在通过安全地提供防火墙内的私有数据来克服 LLM 的局限性。

查看英文原文：

https://www.infoq.com/news/2025/01/google-vertes-ai-rag-engine/

发布

暂无评论

创作场景

谷歌 Vertex AI 推出新的 RAG 引擎

评论

零信任走向成熟零信任应用将全面普及

接口测试：使用 curl 发送请求

B站视频数据接口应用：关键词搜索与数据分析

功能强大的数字绘画和照片编辑应用：Artstudio Pro

Karmada v1.10发布，新增多集群声明式负载重平衡

Mac电脑FTP客户端推荐：Transmit 5 for Mac 中文版

2023“物联之星”年度榜单揭晓，陶建辉榜上有名

文献解读-流行病学-第十期|《SARS-CoV-2 德尔塔和奥密克戎合并感染和重组的证据》

Microsoft Remote Desktop for Mac(微软远程连接软件)v10.9.8直装激活版

Music Tag Editor Mac版：音频标签管理工具

Pixelmator Pro for Mac v3.6.4中文激活版媲美PS的修图软件

FSNotes for mac 文本处理软件

借助 NGINX Unit 在服务器端使用 WebAssembly

SiteSucker for mac 允许用户下载整个网站以供离线浏览

Forklift Mac破解版一款强大的文件管理程序

4K Video Downloader Plus Pro for mac 4K视频下载器

Mac用户设计的YouTube视频转音频软件 4K YouTube to MP3 for Mac

3CX的内容介绍

探索计算机视觉（人工智能重要分支）的发展与应用

OpenAI新模型发布，免费开放GPT-4o！但只开放一点点...

多媒体下载和转换工具Allavsoft

创作场景

谷歌 Vertex AI 推出新的 RAG 引擎

评论

推荐阅读

电子书

大厂实战PPT下载

推荐阅读