速来报名!AICon北京站鸿蒙专场~ 了解详情
写点什么

2024 卷模型 + 卷应用,企业用大模型如何更具效价比?

  • 2024-03-21
    北京
  • 本文字数:3391 字

    阅读完需:约 11 分钟

大小:1.71M时长:09:58
2024卷模型+卷应用,企业用大模型如何更具效价比?

服务 8 万企业用户,累计帮助用户精调 1.3 万个大模型,帮助用户开发出 16 万个大模型应用,自 2023 年 12 月以来百度智能云千帆大模型平台 API 日调用量环比增长 97%...从一年前国内大模型平台的“开路先锋”到如今的大模型“超级工厂”,百度智能云千帆大模型平台在国内大模型市场牢牢占据着领先身位,但奔跑的脚步却并未停歇。

 

3 月 21 日,百度智能云在北京首钢园召开千帆产品发布会,百度智能云在大会期间宣布:

1、携手北京市石景山区,共建全国首个百度智能云千帆大模型产业创新基地,助推区域产业腾飞;

2、满足企业“效价比”核心诉求,千帆 ModelBuilder 大模型服务全面升级,3 个轻量级大模型、2 个垂直场景大模型全新发布;

3、大幅降低 AI 原生应用开发门槛,千帆 AppBuilder 组件能力全面升级。

 

活动中,石景山区政府党组成员、副区长曹世辉,中关村石景山园管委会副主任崔明明,百度副总裁谢广军,百度副总裁石清华共同启动全国首个百度智能云干帆大模型产业(北京)创新基地。

 

创新基地致力于推动大模型技术与产业创新深度融合,双方将围绕提升算力供给、优化模型算法、推动数据开放、打造示范场景、深化人才引育等方面深耕厚植,政企合力打造人工智能产业新高地。曹世辉副区长表示,石景山区将与百度携手共进,聚焦人工智能和大模型技术研发和创新应用,构建完善 AI 产业生态,为区域数字化转型和产业智能化升级提供支撑,为新质生产力的培育和发展注入澎湃动能。


(百度副总裁谢广军)

 

2023 年,大模型在全球范围呈现出爆发式增长,国内更是打起了“百模大战”,无数科技大厂与科研院所聚焦大模型“本体”,疯狂“内卷”。

 

百度副总裁谢广军表示,大模型技术在过去一年飞速发展,随着逐步落地千行百业,2024 年将成为国内大模型产业应用爆发的元年。针对企业最关心的大模型落地场景、使用成本、应用开发、应用效果四大挑战,百度智能云千帆在大模型、AI 原生应用开发两个方面给出了最新“解题思路”。

 

百度智能云千帆大模型平台发布“3+2”新模型套餐:

提高企业应用大模型的“效价比”


大模型效果是“技术派”的不懈追求,而经济效益则是“市场派”的终极目标。谢广军在与诸多行业客户的交流中发现,除了极少的大客户对大模型有极致的效果追求,更多的企业和机构往往要综合考量大模型的使用效果、性能以及成本,即“效价比”。本次,千帆平台的模型矩阵针对企业的“效价比”核心诉求进行了一系列升级。


(百度智能云千帆大模型平台模型矩阵)

 

文心大模型 ERNIE 3.5 是目前百度智能云千帆大模型平台上最受欢迎的基础大模型之一。针对用户的常见通用的对话场景,ERNIE 3.5 在指令遵循、上下文学习和逻辑推理能力三方面分别进行了能力增强。升级后的 ERNIE 3.5 在企业应用场景如文案创作、信息抽取和工具调用三大场景中,应用表现分别大幅提升 24%、27%和 22%。

 

其次,相比超大规模参数的大模型,轻量级大模型的参数量更小,更便于客户针对特定使用场景进行模型精调,更容易达成使用效果预期,同时节约更多成本开销。本次大会,百度智能云发布了包括 ERNIE Speed、ERNIE Lite、ERNIE Tiny 在内,参数量由大到小的三款轻量级大模型,帮助客户实现“减量不减效”,节约不必要投资。

 

具体来讲,ERNIE Speed 作为三款轻量级大模型中的“大个子”,推理场景下拥有最高 128k 的上下文长度,在处理知识问答等任务时,能够更好的处理上下文的依赖关系,生成更加连贯和准确的预测或回答。同时,针对特定场景可以将 ERNIE Speed 作为基座模型进行精调,模型效果可以追平甚至超过旗舰级大参数规模大模型,效价比大幅提升。

 

相比 ERNIE Speed,ERNIE Lite 的参数量则更小,也更加适合搭载在低算力的 AI 加速卡上处理推理任务,在兼顾模型效果与推理性能的同时,大幅降低客户落地应用成本。作为 ERNIE-Bot-turbo 模型的升级版,ERNIE Lite 在情感分析、多任务学习、自然推理等场景下的应用效果提升了 20%。推理调用成本大幅下降了 53%!

 

三款轻量级模型中参数量最小的 ERNIE Tiny 则为客户提供了极致低成本、低延迟的最佳选择。在检索、推荐、意图识别等高并发、低延时等应用场景中,ERNIE Tiny 的优异性能呈现了不俗表现。在某对话推荐业务场景中,精调后的 ERNIE Tiny 在搜索引擎推荐词激发环节,相比 ERNIE 3.5,对话轮次增长了 3.5%,成本下降了 32%。

 

此外,企业在落地应用中,对大模型在人物扮演、外部工具调用均有更高的效果要求。本次千帆大模型平台 ModelBuilder 还基于对企业场景的深入洞察,结合百度自身业务最佳实践沉淀,推出了 ERNIE Character 和 ERNIE Functions 两款垂直场景大模型,分别适配客户在角色扮演类应用场景(如游戏 NPC、客服对话等)和工具调用场景(对话中使用外部工具、调用业务函数等)中的使用需求。

 

在企业实践中,某智能硬件厂商,基于 ERNIE Character 打造智能助理,应用该模型后在人设一致性、激发并提升用户聊天欲望等方面效果显著提升。某旅游出行类 APP,使用 ERNIE  Functions 打造智能客服助手,在执行订票、查询航班状态等多种 function 调用上准确性达到 85%。

 

千帆 AppBuilder 全面升级:

大幅降低 AI 原生应用开发门槛

 

千帆 AppBuilder 作为产业级 AI 原生应用开发平台,是千帆的重要组成部分。AppBuilder 底层由基于百度多年技术和实践经验沉淀的大模型组件、AI 能力组件的基础组件和面向典型应用场景深入调优建设的一系列高级组件构成。基础组件与高级组件共同支撑 Agent,一方面可以通过工作流编排实现更为复杂的业务逻辑,另一方面 Agent 也具备强大的自主任务规划能力,能够理解用户意图自动规划执行路径,实现多工具的自动编排和执行。这些能力通过零代码态、代码态两类开发方式提供服务,更好的匹配不同开发者的使用需求。

 

开发完成后,应用可多渠道分发与集成,AppBuilder 支持将应用一键分发到微信客服、微信公众号、Web 端/H5 及百度灵境矩阵等主流渠道。基于百度灵境矩阵,应用可在百度搜索、百度信息流等主流场景分发与挂载。真正实现应用开发出来后,就直接触达用户,打通从 AI 原生应用创建到开发再到分发的全流程。

 

(百度智能云千帆 AppBuilder)

 

升级后的 AppBuilder 开放的工具组件多达 55 个。包括基于百度多年技术积累和自有业务沉淀的大模型组件、AI 能力组件,也包括搜索等百度特色的业务组件、和多场景的第三方 API 工具,另外还提供了 RAG(知识检索问答)、GBI(生成式数据分析)等根据典型应用场景深入调优的高级能力组件。

 

开发 AI 原生应用离不开云基础设施,本次发布的基础组件还包括了百度智能云全新推出的向量数据库 VDB 1.0。向量数据库是企业不可或缺的知识库核心组件,它针对传统知识库问答系统遇到的性能瓶颈、维护挑战及规模限制等问题提供了有力解决方案。全新发布的百度向量数据库 VDB 1.0,不仅集成了全面的运维控制和安全防护能力,还兼容了千帆、LangChain 等主流生态系统,能够帮助企业轻松管理数以千万计的文档知识,最大支持百亿向量存储规模以及毫秒级的向量检索速度。同时,相比同类型开源产品,VDB 1.0 性能最高提升 10 倍。

 

在组件之上,千帆 AppBuilder 推出的 Agent(智能体)应用框架,具备精准的任务自主规划能力,对多种应用工具的自动编排准确率超过 90%,这个数字还在不断提升。AppBuilder 还支持开发者接入自定义工具,通过将自动编排与手动编排相结合,实现更复杂场景应用的需求定制。Agent 框架内的代码解释器能力,也在本次升级中大幅提升了 40%的性能、在复杂的数据分析场景的生成结果可接受度高达 95%,轻松应对各类数据分析与信息处理的场景。

 

此外,AppBuilder 的代码态开发工具也再添利器。AppBuilder SDK 本次重磅发布了 Agent API,支持开发者将 Agent 便捷集成到自己的业务系统中,同时 AppBuilder SDK 面向主流 AI 原生应用场景提供了丰富的应用样例,目前已在 Github 开源,支持各个组件自由调用的灵活编排,帮助开发者实现应用的二次开发和便捷集成。

 

大会现场,还演示了如何在零代码开发模式中,只用 1 分钟构建一个“英语作文小帮手”Agent(智能体)应用,只需在 AppBuilder 中输入应用名称或希望开发的应用功能,平台就可以自动生成应用,通过简单的调整角色指令、添加所需工具组件,就可以快速生成一个英语作文批改小助手。发布后就可直接使用,三步完成应用创建与分发。


(1 分钟创建英语作文批改小助手)

 

在百度智能云看来,随着大模型技术的不断演进和突破,工程化实践与用户需求适配正在变得愈发重要。只有深入场景,发掘、响应客户的真实需求,才是释放创新技术红利的最佳路径。

2024-03-21 13:055397

评论

发布
暂无评论
发现更多内容

表格检测识别技术的发展历程

合合技术团队

人工智能 算法 表格识别

从ChatGPT到AGI还有多远?| 社区征文

轻口味

ChatGPT

学会用规则引擎Drools,让你早点下班

JAVA旭阳

Java drools

KaiwuDB 时序引擎数据存储内存对齐技术解读

KaiwuDB

时序数据库 KaiwuDB 内容对齐

深入理解CSS Grid网页布局,并通过示例代码来演示如何使用它

兴科Sinco

前端 前端开发 网页布局 CSS Grid 网络相册

全面项目管理软件:Project Office 激活版

真大的脸盆

项目管理 Mac Mac 软件 项目流程

热点面试题:Vue2、3 生命周期及作用?

Immerse

JavaScript 生命周期 Vue 3 vue2 前端面试题

苹果办公必备远程工具:Royal TSX使用教程

Rose

SSH Royal TSX 教程 Royal TSX 破解 Royal TSX mac下载

IBM Semeru Windows 下的安装 JDK 17

HoneyMoose

Amazon GuardDuty 的新增功能 – Amazon EBS 卷的恶意软件检测

亚马逊云科技 (Amazon Web Services)

Matlab常用图像处理命令108例(一)

timerring

图像处理 数字图像处理

【深度挖掘RocketMQ底层源码】「底层系列」深度挖掘RocketMQ底层导致消息丢失透析(Broker Busy和ToManyRequest)

洛神灬殇

源码分析 RocketMQ 消息队列 消息队列架构 3月日更

铜面上覆盖一层阻焊的油墨,你知道吗?华秋一文告诉你

华秋电子

奇点云DataSimba发版全解析:“企业级”版本升级,提供最佳组合

奇点云

数据中台 奇点云 数据云平台

在 Linux 上有哪些运行程序的方式?

蓬蒿

Shell fork Linux 上启动程序 execv

应该升级 JDK 到 17 了吗

HoneyMoose

燃!网易架构大牛熬夜手敲千页网络协议笔记,竟在GitHub标星数万

做梦都在改BUG

Java 计算机网络 网络协议

普通大专生,从面试无人问到拿下阿里offer!说说我的艰辛历程

做梦都在改BUG

Java 面试 专科

阿里内网开源:多位大佬联合撰写的Java多线程手册被我拿到了

做梦都在改BUG

Java 多线程

图数据结构-路径查找

alexgaoyh

DFS 图数据库 知识图谱 路径规划 三元组

看完这一篇,ShardingSphere-jdbc 实战再也不怕了

勇哥java实战分享

Okhttp 的 retrofit2 运行警告信息异常

HoneyMoose

想要快速学会Blender雕刻?这些Blender雕刻技巧不要错过

Finovy Cloud

OpenAI-J 如何进行测试

HoneyMoose

面试官:如何防止 Java 源码被反编译?我:有点懵

做梦都在改BUG

Java Java源码

GridView(网格视图)的基本使用

梦笔生花

ListView Android; girdview

BetterSnapTool for Mac 帮你整理窗口,提升效率

Rose

BetterSnapTool 窗口管理软件 mac软件下载

清华AIR与英特尔开展合作,研发全新绿色数据中心解决方案

科技之家

字节一面:“为什么网络要分层?每一层的职责、包含哪些协议?”

做梦都在改BUG

Java 计算机网络 网络协议

深度解析首个Layer3 链 Nautilus Chain,有何优势?

西柚子

解决mac电脑打开应用“意外退出”的问题 (点按“重新打开”以再次打开应用程序)

Rose

意外退出 Mac软件

2024卷模型+卷应用,企业用大模型如何更具效价比?_百度_百度_InfoQ精选文章