QCon北京|3天沉浸式学习,跳出信息茧房。 了解详情
写点什么

Uber 创建镜像 OpenAI API 的 GenAI 网关,支持 60 多个 LLM 用例

作者:Rafal Gancarz

  • 2024-10-28
    北京
  • 本文字数:1070 字

    阅读完需:约 4 分钟

Uber 创建镜像 OpenAI API 的 GenAI 网关,支持 60 多个 LLM 用例

Uber 为服务外部供应商及自托管的大语言模型而创建的统一平台,为便于内部的采用而选择了镜像 OpenAI 的 API。GenAI 网关提供了一致且高效的接口,可为多个领域内的 60 多个不同的 LLM 用例提供服务。


Uber 是大语言模型(LLM)最早的一批采用者之一, 公司内有多个团队专注于将以 AI 驱动的功能融入到流程自动化、客户支持和内容生成等各个领域之中。然而,不同的集成类型也导致了工作的重复和方法的不统一。为应对这些挑战,Uber 决定将大模型相关的服务集中都在 GenAI 网关这一项服务中。


Uber 高级软件工程师 Tse-Chi Wang 和 Roopansh Bansal 解释了创建网关的原因:


GenAI 网关是为简化团队在项目中集成大模型的工作流程,简易的载入流程减少了团队的工作量,为利用大语言模型强大的功能提供了清晰且直接的途径。此外,工程安全团队所提供的标准化审核流程也会根据 Uber 的数据标准审查用例,审核通过才会允许用例访问网关。


出于 LangChain 和 LlamaIndex 等开源库的广泛采用和高可用性,Uber 团队选择在网关中使用 OpenAI API,通过镜像这一知名的应用程序接口可以简化载入的流程,扩大网关的负载范围。


GenIAI 网关是一项用 Go 语言编写的、位于服务层中的服务,结合了外部(OpenAI、Vertex AI)、内部的大语言模型和许多通用的能力(如验证和账户管理、缓存、可观测性和监控)。


GenAI 网关的架构图(来源:Uber Engineering Blog)


GenAI 网关可减少个人身份信息(PII),这对大语言模型来说不仅重要也是一项挑战。Uber 要在将请求转发至第三方供应商之前确保其中的 PII 数据是经过匿名处理的,从而避免敏感数据的暴露风险。但从另一方面来说,PII 的减少可能会导致请求中丢失重要上下文信息,从而让大语言模型无法提供有用的回复。此外,数据的减少对大语言模型的缓存和检索增强生成(RAG)来说也是个问题。为应对这些挑战,Uber 团队鼓励使用 Uber 托管的大语言模型或是考虑依赖第三方供应商提供的安全保障。


作者在这里提供了一个案例研究,通过为客服提供聊天内容总结,减少处理用户查询的时间,从而提高客服的运营效率。在这一案例中,大语言模型所生成的总结有 97% 被客服认为有用,用户查询时间缩短了 6 秒。目前该方案每周生成约 2,000 万份总结,Uber 团队计划将其扩展到更多的地区和使用类型中。


集成 GenAI 网关以支持特定用例(来源:Uber Engineering Blog)


Uber 团队从 GenAI 网关的开发和运行中学到了很多,并计划通过智能大模型缓存机制和更优秀的回滚逻辑、模型幻觉检测和安全策略维护进行改进。


查看英文原文

https://www.infoq.com/news/2024/09/uber-genai-gateway-llm-openai/

2024-10-28 08:083499

评论

发布
暂无评论
发现更多内容

阿里云PAI-灵骏大模型训练工具Pai-Megatron-Patch正式开源!

阿里云大数据AI技术

机器学习 阿里云

从AIxCC大赛看下一代AI漏洞挖掘

云起无垠

软件测试/测试开发丨ChatGPT在测试计划中的应用策略

测试人

人工智能 软件测试 测试开发 ChatGPT

软件测试丨探索基于大模型的人工智能应用与开发,开启智能化时代

测试人

人工智能 程序员 软件测试 公开课 ChatGPT

融云聊天室再放大招,服务更完整、集成更便捷

融云 RongCloud

产品 通信 服务 融云 属性

如何选择美国多IP站群服务器?学习如何统筹管理多个站点

一只扑棱蛾子

站群服务器

8个免费的AI和LLM游乐场

3D建模设计

人工智能 AI LLM

WavJourney:进入音频故事情节生成世界的旅程

3D建模设计

LLM 大语言模型

奇点云对话顺丰科技、周大生:数据中台不是一次性项目

Geek_2d6073

舞台租赁LED显示屏技术

Dylan

技术 LED显示屏 led显示屏厂家

即时通讯技术文集(第20期):IM架构设计技术文章(Part3) [共14篇]

JackJiang

网络编程 即时通讯 IM

更多场景、更多选择,Milvus 新消息队列 NATS 了解一下

Zilliz

非结构化数据 Milvus Zilliz 向量数据库

Orca LLM:模拟 ChatGPT 的推理过程

3D建模设计

ChatGPT

HarmonyOS Codelab 优秀样例——溪村小镇(ArkTS)

HarmonyOS开发者

HarmonyOS

性能、安全和稳定,DataAPI 为企业 API 保驾护航

袋鼠云数栈

大数据 数据中台 API

搭建无损网络的关键要素与技术

百度开发者中心

AIGC ChatGPT 千帆大模型平台

企业综合信息化,人力资源管理,培训考学管理,电子采购(源码系统)

金陵老街

java;

如何实现一个数据库的 UDF?图数据库 NebulaGraph UDF 功能背后的设计与思考

NebulaGraph

数据库 UDF

glTF和GLB有什么区别?

3D建模设计

GLTF glb

41 个下载免费 3D 模型的最佳网站

3D建模设计

模型 3D

“源聚一堂”开源技术沙龙济南站顺利举办

inBuilder低代码平台

开源 低代码

泄露个人信息的2300余名“内鬼”被抓?

极盾科技

数据安全

使用代理IP可以解决哪些网络问题?代理ip是怎么优化网络游戏玩家的游戏体验的?

巨量HTTP

代理IP

GLTF在线编辑器

3D建模设计

gltf/glb模型 GLTF gltf编辑器

你应该知道的几个国产化平台-行云管家

行云管家

信创 国产化 国产化平台

Be Focused Pro for Mac(个人任务时间管理工具) 2.3.2中文激活版

mac

苹果mac Windows软件 Be Focused Pro 时间管理工具

Mac电脑最新2023 Xmind 激活中文版

胖墩儿不胖y

思维导图 Mac软件 mac思维导图 思维导图软件

苹果电脑电量显示软件 Magic Battery中文最新版

mac大玩家j

Mac 软件 电池管理工具 电池软件

如何实现MongoDB副本集实例间的数据迁移

NineData

数据库 mongodb 复制 迁移 NineData

面向OpenHarmony终端的密码安全关键技术

OpenHarmony开发者

OpenHarmony

深入学习 FastAPI 鉴权:实现可扩展的身份认证机制

Apifox

程序员 后端 鉴权 FastApi ptyhon

Uber 创建镜像 OpenAI API 的 GenAI 网关,支持 60 多个 LLM 用例_AI 工程化_InfoQ精选文章