在 AICon 北京 2019 大会上,夏磊讲师做了《分布式深度学习训练》主题演讲,主要内容如下。
演讲简介:
本 talk 将分享如何在 IA 架构服务器集群上利用基于英特尔优化的 Tensorflow、MXNet、PyTorch 开源方案高效地搭建分布式 AI 模型训练系统,并利用其进行分布式模型训练。
内容大纲:
构建基于 IA 架构的容器或虚拟化服务器集群
如何在 IA 架构服务器优化分布式任务性能
如何利用 Horovod 构建分布式训练代码
如何优化分布式训练超参数
听众受益点:
了解在 IA 架构服务器集群搭建分布式 AI 模型训练的原理
掌握在 IA 架构服务器优化分布式性能的要点
获得基于 Horovod 分布式方案训练的经验分享
内容亮点:
现代 Xeon 处理器上的 NUMA 特性
VM、Docker 分布式训练环境
Horovod 分布式训练
讲师介绍:
夏磊,英特尔首席工程师英特尔数据中心技术销售集团人工智能技术中国首席架构师。
英特尔首席工程师,现任英特尔数据中心技术销售集团人工智能技术中国首席架构师,专注于为客户在应用人工智能前沿技术过程中为客户的创新提供技术建议与指导,并提供英特尔产品与技术相关的支持。
夏磊先生于 2000 年加入英特尔,历任网络、PC、服务器、云计算、大数据、物联网等领域的技术和管理岗位,支持了国内信息产业在互联网、数据中心、云计算与物联网技术时代的持续技术创新。
完整演讲 PPT 下载链接:
https://aicon.infoq.cn/2019/beijing/schedule
评论