AICon上海|与字节、阿里、腾讯等企业共同探索Agent 时代的落地应用 了解详情
写点什么

英特尔数据中心与人工智能事业部 AI 软件架构师何普江确认出席 QCon 上海,分享大模型时代:最大化 CPU 价值的优化策略

  • 2023-12-12
    北京
  • 本文字数:1243 字

    阅读完需:约 4 分钟

大小:660.17K时长:03:45
英特尔数据中心与人工智能事业部 AI 软件架构师何普江确认出席 QCon 上海,分享大模型时代:最大化 CPU 价值的优化策略

QCon 全球软件开发大会,将于 12 月在上海召开。英特尔数据中心与人工智能事业部 AI 软件架构师何普江将发表题为《大模型时代:最大化 CPU 价值的优化策略》主题分享,探讨一种结合 CPU 和 GPU 的投机采样方法,在大语言模型时代充分利用 CPU 资源的关键策略,以及最新的性能情况,以便了解这些优化策略的实际效果。


何普江,2007 年硕士毕业于中国科学技术大学。精通英特尔软件架构、英特尔产品与技术以及 IA 平台性能优化。在英特尔工作期间,为国内主流 ISV 开发出基于 IA 平台的云计算产品过程中提供关键支持,并优化了多家主要互联网公司的核心产品,使其性能提升数倍。对 PyTorch,Tensorflow 等 AI 框架有深入研究,并拥有 10 年以上软件优化经验。工作期间曾获得英特尔中国个人员工最高荣誉奖,与国内互联网厂商多个部门进行深度合作,并在 2019 年助力某云厂商云在 MLPerf 评测中创下了业界领先的 Performance/TOPS 性能记录。他致力于基于 IA 架构平台的深度学习、机器学习研究和在互联网行业的落地推广工作,最新工作包括创建并开源了 CPU 上大语言模型的极致优化方案 xFasterTransformer。他在本次会议的演讲内容如下:


演讲:大模型时代:最大化 CPU 价值的优化策略


本次演讲将探讨在大语言模型时代充分利用 CPU 资源的关键策略。具体介绍一些结合硬件特性的优化方法,例如利用 CPU 的多核特性、采用并行计算和 AMX 指令集扩展技术来提高处理速度。


此外还将介绍一种结合 CPU 和 GPU 的投机采样方法,通过在 CPU 上运行部分计算任务,充分利用 CPU 资源并减少对 GPU 的依赖。最后,我将分享一些最新的性能情况,让您了解这些优化策略的实际效果。通过这些方法,您将能够更好地利用 CPU 资源,提高模型推理速度,以更快速高效的实现生成式模型部署落地。


演讲提纲:


  1. 大语言模型时代为什么需要最大化 CPU 价值

  2. CPU 上的大模型优化策略

○ 大语言模型计算特点

○ CPU 硬件特性概览

○ 优化方法

○ 从向量化到张量化

○ 从并行执行到分布式推理

○ 低精度优化

○ 深入 CPU 微架构的软件优化

○ 各优化策略的实际性能数据对比及效果展示

  1. 结合 CPU 和 GPU 的投机采样方法

○ CPU 和 GPU 协同工作的背景

○ 投机采样技术的介绍

○ 利用 CPU 进行部分计算任务的优势

○ 优化方法:选择合适的投机采样策略、任务调度等

  1. 总结与展望

○ 各优化方法的核心优势与局限性总结

○ 对未来大语言模型时代的展望与挑战


听众收益点:


○ 理解并结合硬件特性进行优化,提高模型推理速度和处理能力

○ 了解 CPU 上的最新性能情况,为实际业务的大模型线上部署提供更多选择

○ 掌握结合 CPU 和 GPU 协同工作的优化策略,减少对 GPU 的依赖,提高资源利用率


除上述演讲外,QCon 上海还将围绕 GenAI和通用大模型应用探索AI Agent 与行业融合应用的前景LLM 时代的性能优化智能化信创软件 IDE面向人工智能时代的架构性能工程:提升效率和创新的新方法等专题进行交流。


QCon 上海 2023,相约 12 月!9 折优惠仅剩最后 4 天,现在购票立减¥680!咨询购票请联系:18514549229(微信同手机号)。



2023-12-12 11:304066
用户头像

发布了 89 篇内容, 共 46.7 次阅读, 收获喜欢 12 次。

关注

评论

发布
暂无评论
发现更多内容

谈安全测试的重要性

京东科技开发者

漏洞 软件系统 安全测试 网络安全渗透测试

C#/VB.NET: 为Excel表格添加超链接

Geek_249eec

C# Excel VB.NET 超链接

小六六学Netty系列之编解码器和handler的调用机制

自然

Netty 网络 9月月更

Java线程池创建方式和应用场景

Java快了!

线程池 java;

极致体验!基于阿里云 Serverless 快速部署 Function

阿里巴巴云原生

阿里云 Serverless 云原生

融云 2022 社交泛娱乐出海嘉年华,邀你一起「超浪」!

融云 RongCloud

IT 程序猿 社交娱乐

Linux系统安装Nginx

nginx Linux tree 9月月更

国内唯一|阿里云入选 Gartner 应用性能监控与可观测魔力象限

阿里巴巴云原生

阿里云 云原生 Gartner 可观测

Axios的引入与使用-提供可响应api案例

Sam9029

前端 网络 axios 9月月更

多云时代如何实现自动化运维?博云给你最优解!

BoCloud博云

云计算 云原生 多云管理平台

实战 | 基于JMeter 完成典型电商场景(首页浏览)的性能压测

霍格沃兹测试开发学社

【InfoQ】博睿数据CTO孟曦东访谈实录:可观测性技术是未来发展方向

博睿数据

可观测性 博睿数据 智能运维AIOps 极客有约

从普通网站到 PWA 你还在重新写代码吗?

鼎道智联

前端 OS PWA

从成都核酸系统崩溃,谈谈IT系统如何应对10倍以上流量冲击

星汉未来

全面构建数据安全“护城河”,助力企业数智化升级| 极客星球

MobTech袤博科技

大数据 数据安全

Online Schema Change(在线更新元数据)

KaiwuDB

分布式数据库 schema

如何做好性能压测(一):压测环境的设计和搭建

霍格沃兹测试开发学社

内卷时代下的前端技术-使用JavaScript在浏览器中生成PDF文档

葡萄城技术团队

前端 PDF JavaScrip

港股交易系统开发之APP原生or封装?

软件开发大鱼V15988750073

证券 港股交易系统开发 港股打新系统 港股多账户系统 证券app

易观千帆《银行APP用户体验分析白皮书》重磅首发,助力银行打造获客新增长点

易观分析

金融 银行

实战 | UI 自动化测试框架设计与 PageObject 改造

霍格沃兹测试开发学社

史上最全 Appium 自动化测试从基础到框架实战精华学习笔记(一)

霍格沃兹测试开发学社

45张图带你从入门到精通学习WireShark!

wljslmz

Wireshark 网络技术 抓包分析 9月月更

实战 | JMeter 典型电商场景(下单/支付)的性能压测

霍格沃兹测试开发学社

IDaaS系统方舟一账通ArkID内置OIDC认证插件配置流程

龙归科技

Idaas OIDC ArkID

小六六学Netty系列之再遇Netty

自然

Netty 网络 9月日更

数据可视化分析工具如何在国内弯道超车,迅速崛起?

葡萄城技术团队

云桌面解决方案 企业最佳合作伙伴

力软低代码开发平台

学习Docker就应该掌握的dockerfile语法与指令

霍格沃兹测试开发学社

如何用Sonic云真机打王者

霍格沃兹测试开发学社

如何利用 xUnit 框架对测试用例进行维护?

霍格沃兹测试开发学社

英特尔数据中心与人工智能事业部 AI 软件架构师何普江确认出席 QCon 上海,分享大模型时代:最大化 CPU 价值的优化策略_生成式 AI_徐晓博_InfoQ精选文章