过去一年多,大模型技术飞速发展,驱动了人工智能开发应用范式的变革,并且已经开始深刻影响产业发展。与此同时,AI Infrastructure 的重要性也更加凸显。大模型以及对应的大数据、大算力,带来了训练推理效率和成本的巨大压力,大模型基础设施能力已上升为核心竞争力。另一方面,大模型背景下开发者面临的痛点难点也相对传统深度学习模型有了很大不同,技术的快速演进也带来了全新的需求。
在 6 月 14 日-15 日即将在深圳举办的ArchSummit全球架构师峰会上,百度飞桨平台总架构师于佃海将在 Keynote 主题演讲中,分享《大模型时代深度学习平台的挑战和机遇》,他将全面阐述深度学习平台在大模型时代面临的挑战和机遇,并结合飞桨平台支撑文心大模型快速迭代和产业应用的实践,介绍大模型下大规模分布式训练和高效推理部署的关键技术和经验心得,探讨大模型技术及深度学习平台未来的发展趋势。
在百度看来,以深度学习框架为核心的深度学习平台是人工智能时代技术研发必不可少的基础软件,可类比智能时代的操作系统。这意味着,大模型的发展离不开深度学习平台提供有力支撑。作为中国首个自主研发、功能丰富、开源开放的产业级深度学习平台,近来飞桨的大模型相关技术也在持续实现创新突破。
对此,百度深度学习技术平台部杰出架构师胡晓光也将在 14 日下午举办的“大模型基础框架”专题论坛上分享《飞桨深度学习平台技术创新之路》,详细介绍飞桨在支持大模型开发、训练、压缩、推理和部署方面所取得的技术创新成果。这些创新将有助于开发者以更低的成本进行开发,并更高效地训练大模型,从而加速大模型技术的创新与应用。
当然,大模型也对应着更大的计算量,为智算平台建设带来了新的挑战,也由此衍生出一系列工程实践问题。如算力规模的急遽增长带来的集群纳管和运维难度增加问题;训练时长增长,则出错概率变高问题;面向用户的推理时效性问题;以及在人工智能领域知识逐渐深入的背景下,如何同时服务好运维人员和算法工程师的问题。
同在 14 日下午举办的“智算平台建设与应用实践”专题论坛上,百度混合云部资深技术专家肖松将分享《大模型场景下智算平台的设计与优化实践》。基于百度多年来在 AI 领域的工程积累,百度百舸团队专为大规模深度学习场景,打造了一套高性能云原生 AI 计算平台,为模型算法专家和运维专家提供全面的集群运维支持和任务全生命周期管理,同时具备训练/推理加速、故障容错、智能故障诊断等高级功能,大幅提升算力使用效率。
在底层基础技术层面,数据库作为关键 PaaS 能力,多年以来也一直顺应业务和技术发展,不停变更和创新。大模型的兴起,对数据库也有深刻的影响,包括通过大模型赋能的 SQL 改写、智能诊断、问答等一系列能力。同时数据库承担基础数据管理的作用,数据库技术如向量数据库,对解决大模型一些幻觉等也起到关键的作用。大模型和数据库技术相互成就,数据库技术在过去的一年内取得非常大的创新和发展。
对此,百度数据库产品总架构师朱洁将在 15 日下午举办的“Data 4 AI 和 AI 4 Data 方面的探索和实践案例”专题论坛上介绍《大模型时代数据库技术创新》。
除了百度之外,现场还有来自阿里、腾讯、网易、字节跳动、 火山引擎等一众技术大厂将齐聚一堂,将在现场同台 PK,秀出自己的 AI 大模型“肌肉”。比如,阿里巴巴 / 研究员、阿里云云原生应用平台负责人丁宇(叔同) 将在 Keynote 主题演讲中详细介绍在 AI 大模型快速发展的背景下,AI 编程的发展实现了哪些突破,以及 AI 编程助手的引入如何为软件开发带来质的飞跃。此外,来自腾讯机器学习平台部、腾讯 PCG 前端技术专家苑宗鹤、腾讯云、腾讯星星海实验室多个不同条线的技术专家,将从训练框架、开发、落地应用等多个维度分享现阶段企业如何利用大模型实现降本增效的目标。
大会两天日程已 100% 上线,更多详细议题可点击链接可查看详细日程:https://archsummit.infoq.cn/2024/shenzhen/schedule
ArchSummit 深圳开幕倒计时 3 天(根据发布日期更改),6 月 14 日 -15 日,一起探索大模型时代的软件架构最佳范式。扫描下方海报二维码购票咨询,期待与你的现场交流~
评论