写点什么

RAG 驱动的 Copilot 为 Uber 节省了 13,000 个工程小时

作者:Eran Stiller

  • 2024-11-28
    北京
  • 本文字数:1125 字

    阅读完需:约 4 分钟

RAG 驱动的 Copilot 为 Uber 节省了 13,000 个工程小时

Uber 最近详细介绍了它构建 Genie 的经历,这是一款由 AI 驱动的随时待命的 Copilot,旨在提高随时待命的支持工程师的效率。Genie 利用检索增强生成(RAG)技术提供准确的实时响应,并显著提高事件响应的速度和效率。


自 2023 年 9 月推出以来,Genie 对 Uber 的支持团队产生了重大影响。它已在 154 个 Slack 频道中回答了超过 70,000 个问题,节省了大约 13,000 个工程小时,根据用户的评估,其回答有效率为 48.9%。


Uber 的待命工程师通常花费大量时间答复重复的查询或浏览零散的文档,使用户难以独立找到答案。这些情况导致了响应时间过长和生产力下降,这也是构建 Genie 的驱动力。


Uber 使用检索增强生成(RAG)来驱动 Genie。RAG 是一种创新方法,它将信息检索系统的优势与生成式 AI 模型相结合,以产生准确且相关的响应。它让 Uber 可以利用现有知识来源快速部署解决方案,这样就用不着 AI 模型微调所需的大量示例数据了。


Genie 从各种内部来源提取数据,例如 Uber 的 wiki、Stack Overflow 和工程文档。信息被抓取后,使用 OpenAI 模型转换为向量嵌入,并存储在 Uber 的内部向量数据库 Search In Action(SIA)中。Genie 仅从预先批准的数据源提取数据,且不包含敏感数据,以避免泄露敏感信息。


Genie 的整体架构(来源)


当用户在 Slack 中提出问题时,查询会被转换为嵌入,Genie 会使用该嵌入在向量数据库中获取上下文相似的数据。然后它将这些数据输入到大型语言模型中,以根据检索到的信息生成准确的响应。


Uber 实施了一个指标框架,通过持续的实时用户反馈来提高 Genie 的性能。在 Genie 回答问题后,用户可以通过选择“已解决”、“有帮助”或“不相关”等选项来提供反馈。


Genie 的用户反馈流程(来源)


这些反馈通过 Slack 插件收集,并使用 Uber 的内部数据流系统处理,将指标发送到 Hive 表中分析。反馈循环允许 Uber 的团队跟踪 Genie 的帮助有效率,并根据真实的用户体验改进其响应。


对于性能评估,Uber 设计了一个自定义评估管道,用于评估各种指标,例如幻觉率和响应的相关性。该管道处理的是历史数据,包括 Slack 元数据、用户反馈和 Genie 以前的响应。它通过由 LLM 提供支持的评分系统来处理这些数据,用这个系统充当评判者。


Uber 还采用了一套文档评估流程,以保障 Genie 在其响应中检索和使用的信息的质量。系统将抓取的知识库转换为结构化格式,其中一行代表一个文档。


文档评估应用程序的工作流程(来源)


Genie 将这些文档输入带有自定义评估提示的 LLM 来评估每个文档的清晰度、准确性和实用性。然后,LLM 返回分数并提供改进每个文档的可行建议。此过程有助于保持底层文档的高标准,确保 Genie 的响应保持可靠和有效。


查看原文链接:

https://www.infoq.com/news/2024/10/uber-genie-rag-copilot/

2024-11-28 08:038420

评论

发布
暂无评论
发现更多内容

ABB宣布收购Aurora Motors

财见

Need 3 WiFi Radios? Meet the Game-Changing 3-in-1 Solution!

wallyslilly

QCN9074 QCN9024

Mac 桌面管理软件Royal TSX for Mac(强大的远程管理软件)

Mac相关知识分享

万界星空科技汽车零部件MES解决方案

万界星空科技

mes 万界星空科技mes 汽车行业数字化转型 汽车零部件 汽车零部件mes

探讨京东商品 API 接口:运用及收益

科普小能手

API 接口 API 测试 京东API接口 京东API 京东商品API

如何确保度量过程中收集到的数据是有实际意义的?

思码逸研发效能

研发效能 数据研发 研发效能度量 研发效能管理

大语言模型鼻祖Transformer的模型架构和底层原理

Zilliz

nlp Transformer 大模型 Zilliz LLM

怎么对ppt进行批注?2个PPT制作干货分享!

职场工具箱

效率工具 PPT 办公软件 高效办公 AI生成PPT

低代码,而不是低能力,低代码能成为企业降本增效的神器吗?

积木链小链

低代码 低代码开发

打造理想开发环境!双十一硬核装备与云资源全攻略【必备收藏清单】💻🌐

申公豹

程序员

TDengine 签约蘑菇物联,改造通用设备工业互联网平台

TDengine

数据库 tdengine 时序数据库

从热数据到冷数据:TDengine 多级存储如何助力智能数据管理

TDengine

数据库 tdengine 时序数据库

实时防护,清洗服务可用性达99.95%,江苏杰邦芜湖DC安全基地正式上线

江湖老铁

亚太地区人工智能应用加速,战略数据管理仍是关键

财见

达摩院发布八观气象大模型:精度达1小时1公里,率先落地国网山东省调

新消费日报

TikTok封号原因有哪些?怎么解决?

Ogcloud

TikTok 云手机 海外云手机 tiktok运营 tiktok封号原因

如何预测市场趋势和潜在价格变动?请收好这份「加密货币蜡烛图」解读指南

TechubNews

豆包MarsCode 助力:Canvas 上的素描变色魔法✨

豆包MarsCode

程序员 AI 开发 代码 可画

MySQL 8.0 执行COUNT()很慢原因分析

GreatSQL

哪些开源项目管理工具值得尝试?8款功能对比

爱吃小舅的鱼

开源项目管理工具

nPlayer for Mac功能强大的视频播放软件

Mac相关知识分享

Premiere Pro 2025 for mac(adobe pr 2025) 特别版

你的猪会飞吗

mac破解软件下载 pr2025下载

Sketch for mac专业矢量图形设计软件中文版

Mac相关知识分享

怎么在国内运营tiktok账号?

Ogcloud

云手机 tiktok云手机 tiktok运营 TikTok矩阵运营 tiktok运营干货

团子东子开奖了,这泼天的富贵!

王磊

鸿蒙Flutter实战:02-Windows环境搭建踩坑指南

少湖说

flutter 鸿蒙 HarmonyOS

度量数据是人工凭感觉录入的,产生的偏差如何解决?

思码逸研发效能

DevOps 研发效能 效能度量 研发效能管理

Playwright:掌握Web自动化测试的新利器

霍格沃兹测试开发学社

【论文速读】| APOLLO:一种基于 GPT 的用于检测钓鱼邮件并生成警告用户的解释的工具

云起无垠

【FAQ】HarmonyOS SDK 闭源开放能力 —Vision Kit

HarmonyOS SDK

HarmonyOS

研发团队管理中的常见挑战与解决方案

爱吃小舅的鱼

团队管理

RAG 驱动的 Copilot 为 Uber 节省了 13,000 个工程小时_性能优化_InfoQ精选文章