写点什么

大模型智算与开发落地实践:释放 AI 潜力的关键技术与行业应用

  • 2024-12-02
    北京
  • 本文字数:1929 字

    阅读完需:约 6 分钟

大模型智算与开发落地实践:释放AI潜力的关键技术与行业应用

大模型服务已经成为推动各行各业创新的核心力量。为了充分释放大模型的潜力,智算基础设施的建设与大模型的研发成为了关键环节。大模型智算与开发并非仅仅局限于算法的优化与创新,如何构建高效的 AI 基础设施,如何优化训练与推理架构,如何在多个行业中实现大模型的成功落地,这些都是当前技术发展的核心问题。


12 月 13 日~14 日,2024 年度最后一场「AICon全球人工智能开发与应用大会」将在北京盛大开幕!大会特别策划了《大模型智算与开发落地实践》专题,聚焦于大模型服务背后的智算基础设施与基础大模型研发中的前沿技术与实践。

更多精彩议题可以点击链接查看大会日程:https://aicon.infoq.cn/202412/beijing/schedule


本专题的出品人为阿里云智能政企事业部大模型智算负责人 王浩 博士,负责政企 AI 大模型智算产品研发。曾任阿里巴巴达摩院人工智能实验室天猫精灵智能语音助手产品算法负责人。之前曾是 360 搜索首席科学家以及中国科学院教授,成果大多发表在人工智能国际顶级会议和期刊:KDD、NeurIPS、SIGIR、AAAI、IJCAI、WWW、ICDE、ACM MM、ECCV、ICCV、TOIS、TKDE、TPAMI、TIP 等。


精彩分享一

智谱 GLM 技术团队专注于面向通用人工智能(AGI)的基础模型研发,早在 2022 年就训练并开源了媲美 GPT-3 性能的中英双语预训练模型 GLM-130B,后续发布的 ChatGLM 开源模型系列在 Hugging Face 社区上获得了超过一千万的下载量;2024 年 8 月,GLM 团队发布的旗舰模型 GLM-4-Plus 在 9 月的 SuperBench 大模型评测中位列世界前三。


智谱这些模型展现出来的卓越性能离不开海量互联网数据和算力训练。与此同时,大语言模型的兴起给训练基础设施带来全新的挑战,包括对算力、大规模数据处理量、复杂的系统管理等需求。针对自身的特定需求,智谱从零开始构建了一套大模型原生的训练基础设施。针对大规模训练稳定性、多算力集群数据流转、平台易用性等进行了一些优化,大会上,智谱 AI GLM 模型预训练与基础设施负责人曾奥涵将通过《智谱大模型训练基础设施落地实践》演讲,分享智谱在大模型原生基础设施建设中的经验与实践。


精彩分享二

模型量化通过降低权重精度减少计算量与内存占用,加速推理过程并降低能耗,对于提升大模型在资源受限设备上的部署效率至关重要以往 PTQ 量化方法忽略不同层权重对量化精度的敏感性,且在超低比特量化下(2-3 位)精度损失严重。


为了应对这一挑战,阿里巴巴行业大模型智算技术负责人张跃伟,将在本次演讲中分享《大模型超低比特无损量化技术实践》,介绍 AMLQ(Adaptive Mixed precision and Low-rank Quantization error reconstruction)量化方法,探讨大模型在推理实践中的挑战以及如何通过创新的量化技术提升大模型在资源受限设备上的部署效率。


精彩分享三

在资源有限的情况下,如何提高模型训练效率,尤其是数据的质量控制,成为了一个重要的课题。许多轻量化模型如 Phi 系列,通过严谨的质量控制,在较少数据和较低算力(FLOPs)支持下,达到了显著的效果提升。当前开源数据集的趋势集中在增多 Tokens 和更精细化的质量筛选,以获得更小、效果更佳的数据集。此外,去重策略需要根据具体业务需求定制,更高比例的去重未必能带来更优结果,且数据质量这一概念难以仅依赖人类偏好定义。


来自百川智能的算法专家张宇鹏,将在本次演讲中分享《百川智能预训练数据策略的探索与实践》他将详细阐述如何通过优化数据质量控制策略,提升模型在有限资源下的表现;介绍基于模型自我学习能力和人类标注结合的数据筛选策略,解决数据去重和质量控制问题,并分享如何通过知识类别的分类采样和小模型拟合 Scaling Law,降低实验成本并提升数据利用效率。


精彩分享四

随着 ChatGPT 的出现,大模型获得了前所未有的热度,但关于大模型研究主要聚焦在高资源语种上(如英文、中文),对中低资源语种的支持相对较差。如何在中低资源语上进行大模型业务落地,是一个非常有价值且值得探索的问题。


华为翻译中心高级工程师商恒超带来演讲《盘古多语言大模型研究与业务落地探索》,他将介绍华为翻译中心以翻译技术为出发点,提升大模型在低资源语种的表现,并且以阿语和泰语为例,详细介绍模型的适配、翻译技术的应用、以及业务场景的落地等内容。


彩蛋

在本场专题期间,我们还将举行一场圆桌讨论,主题为「Scaling Law 的边界及 AI 芯片领域的新竞争格局」。本次圆桌将探讨以下核心问题:

  • 大模型预训练阶段的 Scaling law 还可持续吗?算力的突破能否带来新的 Scaling law?

  • 形如 OpenAI o1 的推出会对未来算力的格局发生什么变化?

  • 新一代推理芯片(Groq、Celebras)是否会挑战 NVIDIA 的 GPU 地位?


PS,AICon 大会门票即将售罄,若团购可全年最低价入手,还有最后为数不多的优惠名额,有兴趣的朋友真得抓紧了:https://aicon.infoq.cn/202412/beijing/

2024-12-02 18:015882

评论

发布
暂无评论
发现更多内容

Python代码阅读(第62篇):列表是否包含相同元素判断

Felix

Python 编程 列表 阅读代码 Python初学者

解决 Serverless 落地困难的关键,是给开发者足够的“安全感”

阿里巴巴中间件

阿里云 Serverless 技术 云原生 中间件

群雄“逐鹿”风采显露:2021信创“大比武”鲲鹏赛道总决赛火热来袭

科技热闻

用户增速与体验质量并存,博睿数据携阿里云发布双十一电商网站用户体验报告

博睿数据

The Data Way Vol.6|我不是开发者,但我依然向往开源

SphereEx

开源 开发者 播客 ShardingSphere SphereEx

Aeron是如何实现的?—— Ipc Publication

BUG侦探

Aeron Ipc Publication

Apollo生产环境整合springboot

小鲍侃java

11月日更

CRM与ERP之争,谁能在“企业数字化转型”的趋势中胜出?

优秀

低代码 CRM ERP

JAVA应用生产问题排查步骤

热爱java的分享家

Java 架构 程序人生 编程语言 经验分享

论文解读丨无参数的注意力模块SimAm

华为云开发者联盟

卷积神经网络 视觉 注意力模块 SimAm 神经元

百度Q3财报:百度智能云同比增长73%,稳居中国四朵云之一

百度大脑

人工智能

Redis为什么需要强一致?技术揭秘秒杀活动如何限流

华为云开发者联盟

redis 开源 华为云 强一致 MySQL组件

LifseaOS 悄然来袭,一款为云原生而生的 OS

阿里巴巴云原生

阿里云 云原生 操作系统 LifseaOS

安全稳定高效节约的云运维软件哪个好?咨询电话多少?

行云管家

云计算 公有云 混合云 云管平台 云运维

微信和QQ这么多群,该如何管理好友关系?

Tom弹架构

Java 架构 设计模式

微服务的灾难:拆的很爽,但服务太小...

热爱java的分享家

Java 架构 程序人生 编程语言 经验分享

Apache ShardingSphere 企业行|走进转转

SphereEx

ShardingSphere SphereEx Apache ShardingSphere 转转

HBase 的预分区及 rowkey 设计技巧

五分钟学大数据

11月日更

阿里云发布云原生加速器,携手生态企业拥抱数字时代

阿里巴巴云原生

阿里云 云原生 企业 合作伙伴 创投

青海西宁市正规等保测评公司名单汇总-行云管家

行云管家

网络安全 等级保护 等保测评 过等保

恒源云(GPUSHARE)_云GPU服务器如何使用VSCode?

恒源云

人工智能 深度学习

带你了解AKG正反向算子注册+关联流程

华为云开发者联盟

算子 AKG 正向算子 反向算子 算子注册

3分钟搞定 web人脸识别登录,这样式爱了

程序员小富

Java 编程 人脸识别 springboot 毕业设计

驴行千里不洗沙尘,尚硅谷Spark性能调优教程发布

编程江湖

大数据 spark

微帧Film Grain编码技术,致敬电影胶片颗粒的独特魅力

微帧Visionular

视频编解码

几个高效做事的法则,让你的一天有 25 小时

程序员鱼皮

Java c++ 效率 大前端 高效

智能云分支(Cloud Intelligent Branch)方案正式发布!

阿里云 云网络 智能化 发布会

Hadoop 生态里,为什么 Hive 活下来了?

大数据技术指南

11月日更

数据可视化界的小公主:cutecharts,入门+实战应用

老表

Python 数据可视化 11月日更 实战案例 cutecharts

Linux一学就会之Linux环境搭建并安装VMware虚拟机

学神来啦

Linux centos 运维 vmware

“低代码”是什么?低代码平台如何助力企业实现数字化转型?

优秀

低代码

大模型智算与开发落地实践:释放AI潜力的关键技术与行业应用_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章