写点什么

OPPO 推出自主训练大模型 AndesGPT,初衷是智能助手的技术升级

  • 2023-11-16
    北京
  • 本文字数:928 字

    阅读完需:约 3 分钟

大小:474.34K时长:02:41
OPPO推出自主训练大模型AndesGPT,初衷是智能助手的技术升级

11 月 16 日,在2023 OPPO开发者大会上,OPPO 正式推出了自主训练的大模型 AndesGPT。


据介绍,AndesGPT 拥有对话增强、个性专属和端云协同三大技术特征,对于大模型带来的变革,OPPO 认为体现在四个方面:知识、 记忆、工具和创作


  • 在知识能力方面,AndesGPT 融合了知识图谱及通用搜索能力,为用户提供更专业的问答。通过知识增强技术,将外部知识与模型融合生成结果,降低幻觉。

  • 在记忆能力方面,AndesGPT 实现长期记忆机制,以支持无限长度的上下文和有状态服务。而长期记忆带来首字推理延迟这个技术挑战。为了解决该难题,OPPO 研发了一种注意力算 法命名为 SwappedAttention。SwappedAttention 能够在多轮长上下文对话中,有效降低每个 query 的首字推理时长。其核心技术原理是,通过外部存储和 KV 压缩的方式实现会话级 KV 缓存。结合 PagedAttention 算法一起使用,能够带来 50%的首字延迟降低,以及 30%的推理吞吐提升。

  • 工具使用也是 AndesGPT 一项核心能力,更好的理解设备控制与服务 API,端到端生成可执行指令。 目前 AndesGPT 已支持使用系统设置、一方应用、三方服务、代码解释器等各类工具。

  • 在创作方面,AndesGPT 已全面支持文生图与图生图场景。



AndesGPT 主要训练三种参数规格的模型——AndesGPT-Tiny、AndesGPT-Turbo 和 AndesGPT-Titan,可根据不同场景灵活选择。AndesGPT 使用行业主流的网络结构,主要做了两个组合优化:

  1. RoPE 位置编码探索了 base 的最优值,结合 log-scale 和 attention 加 bias,扩展外推能力;

  2. GQA 结合复杂移动窗口(Dilated Attention)加速了训练和推理,实现了 O(Nd)的线性复杂度。


OPPO 数智工程事业部总裁刘海锋在接受 InfoQ 采访时表示,OPPO 做大模型的一个最基本的初衷就是升级智能助手产品,让小布助手变得更有用更智能。“对于手机厂商或者智能终端厂商、本来就有智能助手的团队来说,这个事儿是非常自然且水到渠成的,因为我们有现实的用户的需求,有数据的积累,也有一些 knowhow 积累,那么我们肯定要做技术升级。”


除了落地应用,OPPO 还在推进产学研联合促进前沿技术研究。去年 OPPO 联合中国科学技术大学成立的智能计算联合实验室,已将大模型技术作为核心研究方向。此外,OPPO 还和国内外超过 45 所重点院校建立了 AI 相关的合作。未来,AndesGPT 还将面向开发者开放核心的智能体开发平台。

2023-11-16 16:336997

评论

发布
暂无评论
发现更多内容

高考成绩都出来了,你的秒杀系统如何了?

冰河

并发编程 多线程 高并发 协程 秒杀系统

OpenResty 安装

流火

干货|三个维度详解 Taier 本地调试原理和实践

袋鼠云数栈

开源 前端

南通市属于几线城市?本地有正规等保测评机构吗?

行云管家

等级保护 等保测评 南通

微服务架构的重要性:现代应用开发的关键趋势

2756

微服务架构 微服务、

带你了解爆火的AI框架-LangChain

派大星

TICDC 数据同步至 MySQL初体验

TiDB 社区干货传送门

迁移

发送Tidb告警信息到企业微信群实践

TiDB 社区干货传送门

监控

TiDB 升级利器(参数对比)——TiDBA

TiDB 社区干货传送门

7.x 实践

TiDB 多租户方案和原理

TiDB 社区干货传送门

TiDB 底层架构 新版本/特性解读 7.x 实践

IPQ9574 IPQ9554 what's the difference?|WIFI7 Solution|Wallys

wallyslilly

ipq9554 ipq9574

慧博云通加入飞桨技术伙伴计划,共同推动企业 AI 应用创新

飞桨PaddlePaddle

人工智能 百度 paddle 飞桨 百度飞桨

在找稳定的企业级数据云平台?奇点云DataSimbaR4.9 LTS发布

Geek_2d6073

基于驱动因素的全面预算管理方式

智达方通

智达方通 全面预算管理 业财驱动 驱动因素

数字先锋|云上医院长什么样?宁夏固原中医医院带你一探究竟!

天翼云开发者社区

云计算

关于 3.0 和 2.0 的数据文件差异以及性能优化思路

爱倒腾的程序员

TIDB v7.1 reource control资源管控特性体验贴

TiDB 社区干货传送门

版本测评 7.x 实践

【TiDB v7.1.0】资源管控调研及评测

TiDB 社区干货传送门

7.x 实践

如何用smardaten90天快速开发并上线智慧空间loT物联平台?

热爱编程的小白白

来了,kubesphere轻松搭建redis

夜栩

后端 docker image KubeSphere

程序员搞开发的时候,心态真的不稳

伤感汤姆布利柏

从零开始初识机器学习 | 京东云技术团队

京东科技开发者

人工智能 机器学习 企业号 6 月 PK 榜

无类教育完善内训体系,开启校企合作新篇章

Geek_2d6073

linux自动化运维工具用哪款好?理由是什么?

行云管家

Linux IT运维 自动化运维

WEB系统安全之开源软件风险使用评估

天翼云开发者社区

开源 Web

记一次Native memory leak排查过程 | 京东云技术团队

京东科技开发者

native 企业号 6 月 PK 榜 memory leak

微服务之道:8个原则,打造高效的微服务体系

不在线第一只蜗牛

微服务 微服务架构

券商网络信息安全启动三年计划圈重点

原点安全

零样本视频生成无压力,基于飞桨框架实现Text2Video-Zero核心代码及依赖库

飞桨PaddlePaddle

人工智能 百度 paddle 飞桨 百度飞桨

边缘云特点、应用实践和发展趋势浅析

天翼云开发者社区

边缘云

资源池化:多租户与数据库整合解决方案

TiDB 社区干货传送门

新版本/特性解读 数据库架构设计

OPPO推出自主训练大模型AndesGPT,初衷是智能助手的技术升级_生成式 AI_罗燕珊_InfoQ精选文章