QCon北京「鸿蒙专场」火热来袭!即刻报名,与创新同行~ 了解详情
写点什么

加速大模型应用落地最后一公里,AI 基础设施如何再升级?

  • 2023-07-12
    北京
  • 本文字数:3006 字

    阅读完需:约 10 分钟

加速大模型应用落地最后一公里,AI基础设施如何再升级?

AI 大模型热潮来袭,当下,越来越多的大模型在千行百业中落地应用。作为 AI 大模型的“底座”,AI 基础设施承载着顶层大模型的建设,也是大模型应用落地的关键。在算力、数据和基础软件三大 AI 基础设施中,算力是驱动大模型发展的底层动力,数据是训练大模型的信息基础,基础软件则是大模型应用落地的主要效率支撑。

 

6 月 30 日,九章云极 DataCanvas 举办“New AI · New Data · New Software”主题发布会,发布了“AIFS(AI Foundation Software)”、“DataPilot”两款新系列产品。

 

在发布会上,九章云极 DataCanvas 董事长方磊提到,“大模型时代需要完整基础设施升级,而不是依靠单个大模型解决所有的问题;大模型的落地将解决更困难的问题,引起更深远的影响,而它并不比小模型更容易。”

 

大模型时代的 AI 技术依然需要“最后一公里”的结合。方磊指出,软件、模型和硬件的统一优化空间巨大,是创新最活跃的地方。强大灵活的基础软件,开放弹性的白盒模型,精通业务的专业人才,将加速实现最后一公里的跨越。

大模型时代,AI 基础软件扮演什么角色?

 

ChatGPT 的爆火加速 AI 大模型应用落地。今年以来,越来越多的企业涌入 AI 大模型赛道,行业进入“白热化”竞争状态。有不少专家表示,大模型背后的技术理念早已存在多年,因此 AI 大模型并不存在技术壁垒。

 

“现在训练 AI 大模型最大的挑战主要集中在算力和数据层面”,九章云极 DataCanvas 副总裁于建岗在接受 InfoQ 采访时表示,大模型的构建本身并没有不可逾越的基础鸿沟,主要是基于 Transformer 进行构建,对企业而言,如何更好且更有效率地运用算力和数据才是核心痛点。“大模型对算力的需求巨大,对于中小企业而言,本身没有足够的 GPU 支撑其去搭建大模型。此外,大模型对数据的需求量也有一定的要求,中小企业很难获得足够的数据训练大模型。”

 

在这一背景下,AI 基础软件的重要性凸显。未来随着算力性能逐渐同质化和标准化,数据的差异性和企业需求的个性化逐渐加大,“AI 基础软件”将成为模型训练效率和算力使用效率的决定性因素。作为模型生态系统的中坚力量,AI 基础软件将会成为大模型应用落地的最主要的效率支撑,并通过大模型+小模型的方式,形成模型训练新范式。

 

与构建传统应用相比,构建大模型应用的基础软件主要解决系统和架构层优化,通过一系列工具和服务,帮助企业快速、高效构建上层 AI 应用。于建岗表示,“训练大模型需要庞大的计算集群,如何更好的处理集群之间的通信?如何更好的进行模型切分?如何更好的利用内存和显存?这些都需要 AI 基础软件来解决。AI 大模型时代对基础软件最大的诉求就是如何实现模型训练优化,包括运行时推理效率的优化等等。”

模型训练新范式:大模型+小模型

 

AI 基础软件使得 AI 技术的应用更加广泛和高效,并为各个行业和领域的发展提供了强有力的支持。当前,企业对 AI 技术的关注度高涨,也为 AI 基础软件市场带来新的增长机遇。Gartner 预测,中国的 AI 软件市场将保持快速增长。预计未来五年,该市场的营收将从 47.67 亿美元增长至 138.58 亿美元,年复合增长率(CAGR)达到 28%。

 

“现在,越来越多的企业意识到 AI 基础软件的重要性。九章云极 DataCanvas 在基础软件领域耕耘多年,我们认为只要针对企业在训练和应用大模型的过程中的痛点提供切实有效的解决方案,企业完全可以做出自己的 AI 大模型并且落地本企业的应用。”于建岗说道。

 

基于这种认知,九章云极 DataCanvas 正式发布了人工智能应用构建基础设施平台 AIFS(AI Foundation Software),其覆盖了大模型的训练、精调、压缩、部署、推理和监控以及小模型的全生命周期过程,为数据科学家、应用程序开发人员和业务专家提供了一套工具,使不同角色的人员可以相互协作,轻松地处理数据并使用这些数据来开发、训练和部署任何规模的模型。

 

作为人工智能基础软件体系,AIFS 主要包括 DataCanvas Alaya 九章元识大模型、DataCanvas APS 机器学习平台、DataCanvas BAP 面向业务自动建模平台、开源 DAT 自动机器学习软件、开源 YLearn 因果学习软件等一系列全开放、高自动、高协同的软件工具,为用户自主构建全生命周期的“大+小”模型提供一站式支持。

 

“我们认为一个足够智能的、能够覆盖所有小模型的大模型时代还没有到来,比如在精准科学计算和符号推理方面大模型并不比小模型可靠,所以当前还是大小模型并存的时代。”在于建岗看来,大模型可以基于对通用知识的理解变得更广泛,也可以通过压缩或者知识蒸馏,部署到小模型环境中去替代一部分能力。但整体而言大小模型并存的时代还会延续一段时间。

 

九章云极 DataCanvas 董事长方磊也曾在一场演讲中表示,尽管大模型当前表现优异,但对于各行业使用者来说,实际应用于业务场景仍然存在较高的技术和成本门槛。方磊指出,当前迎来“大+小”的新纪元,不仅仅是大模型和小模型的融合使用,大模型的小型化,或者说以大模型为底座的小型化微调,也是一种趋势,这种方式能够以低廉的成本解决大量的问题。

 

“大和小是一个相对的变化。”当前大模型的参数标准并不统一,相对于参数级,模型的效果且是否能够支持快速迭代对于用户实际应用来说更为重要。用户能够在一个白盒大模型基础上快速地、低成本地微调和迭代出客制化的小模型,才能高效地实现丰富场景的大模型应用。这就再次点明了 AI 基础软件工具链的重要性。

 

值得一提的是,本次发布的 DataCanvas Alaya 九章元识大模型,具有“通识+产业”系列模型矩阵、多模态大模型、优化的训练机制和友好的开源协议管理等特点。在开源支持方面,九章元识不仅支持 Apache2.0 协议,还为用户提供白盒模型。于建岗强调,这是公司对产品“开放性”的坚守,旨在为用户赋予更大自由度的 AI 创新能力,以求加速实现大模型在多元业务场景中的应用。

数据处理新范式:DataPilot

 

在过去的十几年,数据通常被认为是 AI 的原料、基础要素。而大模型的出现,让数据得到了 AI 的反向赋能。

 

利用 DataCanvas Alaya 九章元识大模型的通用文本的理解和生成能力以及在数据领域的微调优化,九章云极 DataCanvas 发布了数据处理新范式——DataPilot 数据领航员,可以帮助用户实现数据在建模全生命周期的智能化与自动化。

 

九章云极 DataCanvas 公司副总裁周晓凌介绍,DataPilot 的特性包括多模“向量海”数据架构,按需自动化数据集成、代码生成、流程编排和分析计算,以及基于自然语言的数据获取、分析和机器学习建模能力。DataPilot 能够大幅降低数据集成、治理、建模、计算、查询、分析、机器学习建模全链路的技术门槛,降低数据驱动业务发展的成本,加快数字化创新的进程。

 

基于“向量海”理念,DataPilot 所包含的 DataCanvas RT 实时决策中心平台、开源 DingoDB 多模向量数据库等各类数据软件,让用户具备 AI 技术突破情况下亟需的实时、多模态的数据能力。

 

其中,DingoDB 作为一款开源的多模态向量数据库,将是向量海时代的强大引擎。它结合了数据湖和向量数据库的特性,支持存储任何类型(键值、PDF、音频、视频等)和任何大小的数据。通过 DingoDB,用户可以构建专属的数据“向量海”,不论是结构化还是非结构化数据,仅通过 1 套 SQL 即可完成多模态数据的分析与科学计算。

 

“未来,AI 基础软件的发展会更加多样化,模型之间的数据交换也会更加频繁,也许会产生新的连接方式与生态。此外,在国家战略与政策推动下,未来可能会出现一些相对统一化的模型,这些都会驱动 AI 基础设施进一步升级。”周晓凌说道。

2023-07-12 09:413690

评论

发布
暂无评论
发现更多内容

揭秘亚马逊云科技软件开发工程师团队

亚马逊云科技 (Amazon Web Services)

软件开发 工程师

技术分享 | Javaer 如何做单元测试?

LigaAI

Java 单元测试 LigaAI

打造会“找”主人的麦克风,腾讯个性化语音增强技术荣获2022数博会领先科技成果奖

科技热闻

一键式打造DAO,M-DAO或成Web3新宠儿

西柚子

浪潮云应用质效管理系统(AOM)荣获2022数博会领先科技成果“优秀项目”奖

云计算

面向服务的架构

力软低代码开发平台

React Echarts 使用教程 - 如何在 React 中加入图表(内附数据看板实战搭建案例)

蒋川

react.js 可视化 eCharts 组件库 图表库

周六晚8点,如何基于 eBPF 技术构建应用可观测平台?

OpenAnolis小助手

Linux 直播 内核 龙蜥社区 sig

元宇宙的十大经济规则

CECBC

大数据ETL自动化调度运维专家-TASKCTL

敏捷调度TASKCTL

Docker 大数据 程序员 DevOps 数据仓库

谁需要实验室内部管理系统?

低代码小观

实验室管理系统 数据管理系统 LIMS实验室信息管理系统 企业管理工具 检查系统服务

【等保】等保测评中双因素认证是什么意思?等于双因子认证吗?

行云管家

网络安全 等保 双因子认证 等级保护

图解|高性能服务器设计之缓存系统一致性

C++后台开发

redis 后端开发 Linux服务器开发 高性能服务器 系统缓存

免费领 CRMEB 移动社交电商系统源码与授权

CRMEB

ETH合并在即,这次升级将带来哪些机遇?

区块链前沿News

以太坊 eth Hoo

怎么用netty开发一个同时提供http和websocket的服务?

风斩断晚霞

Java spring Netty springboot websocket

MASA Auth - SSO与Identity设计

MASA技术团队

C# .net 设计 构架 Auth

密码学系列之:ASN.1接口描述语言详解

程序那些事

密码学 程序那些事 5月月更 ASN.1

虚拟化解决方案 virtio 的技术趋势与 DPU 实践解读 | 龙蜥技术

OpenAnolis小助手

虚拟化 技术分享 DPU 龙蜥大讲堂 云豹智能

如何实现24/7客户服务自动化?建设智能客服知识库

小炮

融云漫话:通信中台

融云 RongCloud

AI简报-增强版GAN图像超分:ESRGAN

AIWeker

人工智能 深度学习 5月月更 AI简报

加码布局版式文档垂直赛道,福昕船舶图纸管理系统重磅发布

联营汇聚

从Oracle日志解析学习数据库内核原理

沃趣科技

oracle 数据库内核

元宇宙用户已准备就绪,但技术瓶颈仍制约其真正“落地”

CECBC

HashSet源码分析-基础结构

zarmnosaj

5月月更

【智人智语】史赛克全球数字化、机器人及赋能技术总裁柯若博:世界智能大会是一个非常重要的盛会

InfoQ 天津

【LeetCode】单词距离Java题解

Albert

LeetCode 5月月更

Hadoop3.0时代,怎么能不懂EC纠删码技术?

个推

大数据 hadoop hadoop3 大数据 开源

什么是区块哈希?哈希游戏开发技术原理方案(源码搭建)

开发微hkkf5566

【技术干货】代码示例:使用 Apache Flink 连接 TDengine

TDengine

数据库 tdengine

加速大模型应用落地最后一公里,AI基础设施如何再升级?_生成式 AI_凌敏_InfoQ精选文章