写点什么

“ AI 框架”与“ AI 中台”在大模型训练实践中如何发挥作用?

  • 2023-07-13
    北京
  • 本文字数:888 字

    阅读完需:约 3 分钟

“ AI 框架”与“ AI 中台”在大模型训练实践中如何发挥作用?

大模型已经成为了各个应用领域的标配,而支持大模型训练和部署的 AI 基础设施也变得越来越重要。


为了保障大模型的成功落地,需要构建起全栈的 AI 基础设施,包含 AI IaaS 和 AI PaaS,其中 AI IaaS 提供海量的算力和资源调度、任务管理的能力,解决资源效能的问题。AI PaaS 为大模型提供并行策略和优化过的环境,覆盖训练的全生命周期,解决开发效率的问题。


为了让大家更全面地了解 AI 技术的前沿发展趋势及技术实践,百度智能云团队特推出《大模型时代的 AI 基础设施——百度 AI 大底座》系列云智公开课,该课程围绕“云:AI 算力构建”、“智:AI 框架和 AI 中台”、“实践:大模型训练实践”三大主题展开,由多位专业大咖倾情打造,揭秘核心技术,直击行业痛点。


过去一个月,第一模块“云:AI 算力构建”的四讲课程已上线直播,为大家陆续剖析了《大规模 AI 高性能网络的设计和实践》、《GPU 容器虚拟化新能力发布和全场景实践》、《面向大模型的存储加速方案设计和实践》、《向量检索在⼤模型应⽤场景的设计和实践》。接下来的一个多月,我们将继续围绕“AI 框架和 AI 中台”、“大模型训练实践”两大模块进行深度探索:



第五讲 《飞桨大模型分布式训练技术》:


  • 了解飞桨核心分布式训练技术以及在大模型训练场景中的应用;


  • 了解如何根据实际场景选择合适的飞桨分布式训练技术。


 第六讲《飞桨大模型推理部署高性能优化 》:


  • 了解大模型推理的需求、难点、应用场景;


  • 了解大模型推理加速的常用方法、加速原理和关键技术。


 第七讲《大模型 LLMOps 工具链与文心千帆大模型平台》:


  • 了解大模型技术发展趋势;


  • 了解大模型训练推理的主要环节及挑战;


  • 了解什么是企业级大模型 LLMOps 工具链和基础设施;


  • 了解百度 AI 大底座中的文心千帆大模型平台的核心技术。


 第八讲《百度百舸平台的大模型训练最佳实践》:


  • 了解不同大模型对基础设施资源选型和规划的要求;


  • 了解在百度百舸平台中如何进行环境搭建和使用;


  • 了解训练过程中典型故障处理方法和性能调优技巧。


第五讲课程《飞桨大模型分布式训练技术》上线时间为 2023 年 7 月 19 日 19:30,目前课程报名通道现已开启,立即点击此链接进行报名,还有机会抽奖赢取周边大礼哦!

2023-07-13 14:245725
用户头像
鲁冬雪 GMI Cloud China Marketing Manager

发布了 364 篇内容, 共 282.0 次阅读, 收获喜欢 299 次。

关注

评论

发布
暂无评论
发现更多内容

uni-app实现实时消息SDK插件

anyRTC开发者

uni-app 音视频 WebRTC 跨平台 sdk

RocketMQ如何保证消息顺序性

废材姑娘

RocketMQ

低成本构建音视频质量监控平台的最佳路径

华为云开发者联盟

数据中台 数据湖 云原生 RTC 华为云

<译文>NGINX 实战手册 - 控制访问

东风微鸣

低代码和零代码快速开发崛起,迎来普通人开发软件的时代!

J2PaaS低代码平台

CSS01 - 引入方式

Mr.Cactus

html/css

Kubernetes 疑难问题排查 - 10s 延迟

东风微鸣

Kubernetes

云算力系统APP开发|云算力软件开发

系统开发

Java内存模型精讲

伯阳

Java 后端 多线程 多线程与高并发 Java内存模型

CSS02 - 选择器

Mr.Cactus

html/css

在NGINX中根据用户真实IP限制访问

东风微鸣

企业架构培训感悟

Man

企业架构 中台战略

一文教你学会Hive视图和索引

大数据老哥

大数据 hadoop hive

大作业一

Geek_83908e

架构师一期

比易宝betBEB平台获278万美元约合1807万元融资

DT极客

CSS04 - 常用外观属性

Mr.Cactus

html/css

详解 Flink 容器化环境下的 OOM Killed

Apache Flink

flink 流计算

可用性、可维护性、可靠性有什么区别?

禅道项目管理

DevOps 可用性 质量保障 可靠性

Vue 3 组件开发:搭建基于SpreadJS的表格编辑系统(功能拓展)

葡萄城技术团队

做运维,送你7个常用的服务器资源监控工具

华为云开发者联盟

工具 监控 内存 服务器 系统

抄答案就是了,两套详细的设计方案,解决头疼的支付掉单问题

楼下小黑哥

支付系统 架构设计

ROMA Compose:ROMA的新武器

华为云开发者联盟

数据 API ROMA

在线自习室场景爆发,在线教育平台用户时间争夺战打响

ZEGO即构

面向行业智能,华为数据通信推动的2020之变

脑极体

微服务可能失败的11个原因

xcbeyond

微服务 方法论

Ansible 新手指南 - 如何批量管理 NGINX

东风微鸣

ansible

应用案例| 基于Volcano 的锐天大规模离线高性能计算生产实践

华为云原生团队

云计算 大数据 AI 云原生 批量计算

技术干货丨隐私保护下的迁移算法

华为云开发者联盟

迁移

一周信创舆情观察(2020.12.28~2021.1.3)

统小信uos

CSS03 - 常用字体样式

Mr.Cactus

html/css

Spring 事务,你真的用对了吗(下篇)?

废材姑娘

Java Spring Framework

“ AI 框架”与“ AI 中台”在大模型训练实践中如何发挥作用?_百度_鲁冬雪_InfoQ精选文章