报名参加CloudWeGo黑客松,奖金直推双丰收! 了解详情
写点什么

微软推出 CoRAG:通过迭代推理提升 AI 检索能力

作者:Robert Krzaczyński

  • 2025-03-05
    北京
  • 本文字数:1350 字

    阅读完需:约 4 分钟

微软推出CoRAG:通过迭代推理提升AI检索能力

微软人工智能团队与中国人民大学合作,推出了 CoRAG(检索增强生成链 Chain-of-Retrieval Augmented Generation),这是一种全新的人工智能框架,旨在优化检索增强生成(Retrieval-Augmented Generation,RAG)模型。与传统 RAG 系统仅依赖单次检索不同,CoRAG 支持迭代搜索和推理,使得人工智能模型在生成答案前能够动态优化检索结果。


这一改进弥补了传统 RAG 系统的重大缺陷:传统 RAG 系统难以有效整合多源信息。在处理复杂查询,尤其是多跳问答(QA)时,传统 RAG 模型往往力不从心,因为它们仅检索一次信息,这就导致结果不完整或不准确。CoRAG 则通过在每一步重新构建查询来改变这一现状,使人工智能能够像人类研究人员一样“深入思考”检索过程。


CoRAG 的核心创新在于其动态查询重构机制。该模型不再依赖单次检索,而是根据中间推理状态迭代优化查询。这一过程确保了每个阶段检索到的信息都与上下文相关,进而逐步构建出更完整的最终答案。


为了能在无需大量昂贵的人工标注的情况下训练 CoRAG,研究人员采用了 拒绝采样技术(Rejection Sampling),即从现有的 RAG 数据集中生成合理的检索链。模型在这些增强数据集上进行训练,学习生成子查询、子答案和最终答案。


在推理阶段,CoRAG 提供了多种灵活的解码策略,比如:


  • 为提高效率的贪心解码;

  • 为优化准确性的 N 选 1 采样;

  • 为平衡计算成本和性能的树搜索。


这种可扩展性使用户能够控制检索深度,在准确性和计算效率之间实现最佳平衡。



图注:来源:https://arxiv.org/abs/2501.14342


CoRAG 在 KILT 基准测试和多跳问答任务上进行了测试,与现有的 RAG 模型相比,其效果得到了提升。在需要从多个来源检索和整合信息的任务中,该方法尤为有效。



图注:KILT 基准测试结果,来源:https://arxiv.org/abs/2501.14342



图注:多跳问答任务基准测试结果,来源:https://arxiv.org/abs/2501.14342


人工智能领域已经注意到了 CoRAG 的潜在影响力。Durapid Technologies 的创始人兼首席执行官迪普什·贾恩(Deepesh Jain)评价道:> “这是 RAG 向前迈出的一大步!传统方法常常遗漏关键细节,而 CoRAG 的迭代方法让检索更智能、更具动态性。让模型像人类一样优化搜索,有望为复杂查询提供更好的答案。”


此外,Velotix 的高级机器学习工程师叶卡捷琳娜·巴鲁(Ekaterina Baru)强调了该方法与人类研究方法的相似之处:> “这是一种引人入胜的方法——利用迭代检索优化查询,真实地反映了研究人员深入探究问题的过程。它在多跳问答任务上的性能提升令人印象深刻,我很好奇在实际应用中,更长的检索链和计算成本之间的平衡将如何发展。期待看到它的后续进展!”


从静态检索转向迭代方法,CoRAG 开创了一种全新的人工智能搜索和推理处理方式。这在自动研究、企业知识系统以及人工智能辅助决策等领域具有重要价值,因为在这些领域中,获取准确且结构化的信息至关重要。


关于作者


Robert Krzaczyński,Robert Krzaczyński 是一名专注于微软技术的软件工程师。日常工作中,他主要使用.NET 进行软件开发,但他的兴趣远不止于此。除了核心专业技能外,他对机器学习和人工智能有着浓厚的兴趣,并不断在这些前沿领域拓展自己的知识。他拥有控制工程与机器人学的工程学学士学位以及计算机科学的工程学硕士学位。


原文链接:


https://www.infoq.com/news/2025/02/corag-microsoft-ai/

2025-03-05 14:003746

评论

发布
暂无评论

直击运维痛点,大数据计算引擎 EasyMR 的监控告警设计优化之路

袋鼠云数栈

监控 监控告警

首期"源规律"开源公益课程正式上线

开放原子开源基金会

开源 合规 法律法规

定档!WAVE SUMMIT 2023@全球开发者,8月16日北京见!

飞桨PaddlePaddle

人工智能 百度 paddle 飞桨 百度飞桨

落实《中国人民银行业务领域数据安全管理办法》,极盾科技是怎么做的?

极盾科技

数据安全

全新升级!腾讯云大数据ES Serverless服务开启日志分析新体验

腾讯云大数据

elastic

第二期开源答题挑战,看看你是什么级别吧!

开放原子开源基金会

开源 挑战 答题

如何解决大量小文件传输慢的问题

镭速

小文件传输

基于低代码平台快速搭建应用

互联网工科生

低代码 低代码开发 JNPF java低代码开发平台

让数据管理由繁至简的低代码开发平台

力软低代码开发平台

LeetCode题解:剑指 Offer 56 - I. 数组中数字出现的次数,哈希表,JavaScript,详细注释

Lee Chen

JavaScript LeetCode

软件测试 | mysqlhotcopy(MyISAM表热备份工具)

测吧(北京)科技有限公司

测试

作为CTO,我真正想要的可观测性平台

JainChen

开发者 监控 可观测性

软件测试 | mysqlshow(数据库对象查看工具)

测吧(北京)科技有限公司

测试

铜锁 SM2 算法性能优化实践(二)|快速模约减算法实现

铜锁开源密码库

开源 开发者 算法 同态加密 密码学

如何通过Python线程池实现异步编程?

互联网工科生

Python 线程池

如何为物联网设备注入“华为云+鸿蒙DNA”?

华为云开发者联盟

云计算 后端 华为云 华为云开发者联盟 企业号 8 月 PK 榜

安全文件传输的重要性及其对企业的影响

镭速

文件传输

GPTCache 悬赏令!寻找最佳捉虫猎手,豪华赏格等你来拿!

Zilliz

Zilliz AIGC ChatGPT LLM gptcache

saas堡垒机定义以及优势简单说明-行云管家

行云管家

SaaS 堡垒机 saas堡垒机

代码随想录Day36 - 贪心算法(五)

jjn0703

MIAOYUN获评“2023年度一云多芯稳定安全运行优秀案例”

MIAOYUN

解决方案 信创 中国信通院 信创云 可信云大会

平台工程社区:与全球 2w+ 早期实践者同行

杨振涛

DevOps 云原生 社区 平台工程 平台工程师

校源行 | 2023年开放原子校源行开源大使培训圆满结束,考试时间正式公布

开放原子开源基金会

开源

AI+游戏,内容生产力的又一次变革

澳鹏Appen

人工智能 AR vr 生成式AI 游戏AI

校源行|开放原子开源社团(山东大学)授牌仪式隆重举行

开放原子开源基金会

开源 山东大学

使用低代码平台提高生产力

树上有只程序猿

低代码 生产力 全栈开发 JNPF

站在营销的角度浅谈直播行业

山东布谷网络科技

直播 直播app 直播APP源码

利用文心千帆打造一个属于自己的小师爷

为自己带盐

大语言模型 文心千帆

软件测试 | 日志的删除

测吧(北京)科技有限公司

测试

微软推出CoRAG:通过迭代推理提升AI检索能力_AI&大模型_InfoQ精选文章