写点什么

大模型训推更高效!这款国产开源 AI 框架再迎重大升级

  • 2024-03-27
    北京
  • 本文字数:2113 字

    阅读完需:约 7 分钟

大小:1.08M时长:06:16
大模型训推更高效!这款国产开源AI框架再迎重大升级

人工智能作为我国“十四五”规划国家战略科技力量以及在数字新基建重点建设方向,前景广阔,大有作为。在今年的政府工作报告中更首次提出了开展人工智能+活动,不仅顺应了全球 AI 的发展潮流,更与中国产业升级的大趋势紧密相连,这一行动无疑将在人工智能技术在中国的各行各业的广泛应用开启新篇章。

 

人工智能框架作为软件根技术,已成为加速人工智能大模型开发、推动产业智能化发展的核心力量。以“为智而昇,思创之源”为主题的昇思人工智能框架峰会 2024 近日在北京国家会议中心举办,旨在汇聚 AI 产业界创新力量,推动根技术持续创新,共建人工智能开源新生态。


人工智能作为引领未来的战略型技术,正在深刻地改变着我们的世界。人工智能技术的快速发展应用场景越来越多,走进我们的生活和企业生产系统。2023 年,自然语言处理领域中 Transformers 框架的应用和发展,让人工智能从感知理解迈向了生成创造的阶段,广泛应用于交互、创作、办公、生产等场景。

 

今年,长序列多模态的大模型技术快速,成为了大模型的标配,进一步拓宽了人工智能的应用边界,加速大模型落地更多专业领域。在人工智能发展的过程中,人工智能框架扮演着至关重要的角色,它为开发者提供了一个高效、灵活、便捷的开发平台,加速了人工智能技术的创新和应用。


昇思 MindSpore 作为国内主流开源框架,打造充满活力的开发者社区,致力于推动中国人工智能产业的进步。近两年包括昇思 MindSpore 在内的开源框架产品不断发展,IDC 的研究显示,昇思 MindSpore 在生态建设方面取得了不错的成绩。


华为在 2020 年 3 月 28 日开源昇思 MindSpore 框架,开源后获得了国内外开发者的积极响应,访问量数千万,社区核心贡献者超过 2.5 万,社区贡献比例超过 20%。


从 2020 年发布 1.0 版本到 2023 年发布 2.2 版本,版本持续快速迭代,能力也从支持端、边、云,全场景,到原生支持大模型分布式训练,到部署的全流程。并成为业界首个原生支持科学智能的人工智能融合框架,经过四年的发展,超过 687 万用户下载安装使用,服务企业数量超过 5500 家,合作高校 360 所。


同时,MindSpore 社区开源 500 多种模型,支持伙伴孵化,适配 50 多个大模型。大模型技术快速迭代演进,业界主流模型也从千亿的稠密走向万亿的稀疏模型,人工智能的框架并行计算能力、简洁的编程能力、便捷的部署能力成为大模型训练的关键成功要素。


中国工程院院士、中国人工智能学会副理事长何友在致辞中表示:中国人工智能学会与昇思 MindSpore 紧密合作,携手鹏城实验室、昇思 MindSpore 开展学术基金 2.0 项目,加速推动基于昇思的原生学术创新及论文成果发表,发挥学术人才的原生力,结合昇思的技术原创力,以学术创新支撑人工智能产业繁荣。


华为 ICT Marketing 总裁周军表示:AI 框架的并行计算能力、简洁编程能力、便捷部署能力等,逐渐成为大模型训练的关键成功要素。昇思将持续创新探索,聚焦根技术,以更开放的技术体系,让伙伴和开发者更灵活的实现大模型创新,加速大模型应用规模落地。


2021 年图灵奖获得者、田纳西大学计算机科学杰出教授 Jack Dongarra 分享了计算和框架的发展趋势,他指出开源本质上有很多优点,能切实地为未来提供更好的软件基础,开发 MindSpore 开源框架推动了软件性能提升。

AI for Science 新范式,生成式 AI 赋能气动外形设计

中国科学院院士、中国空气动力学会理事长唐志共表示:基于昇思 MindSpore,生成式气动设计大模型平台打破传统设计范式,设计时长由月级缩短到分钟级,满足概念设计要求。未来该平台将扩展到航空、航天、船舶、高铁、能源、汽车等多个行业领域,引领工业装备的设计和制造能力跨越式发展。


生成式气动设计大模型平台基于昇思 AI 框架自主创新开发。模型开发阶段,昇思框架和流体力学套件 MindSpore Flow 提供全面的科学计算算法库和模型通用接口,提升模型开发效率;模型训练阶段,使用 MindSpore 多维度并行接口,基于成都智算中心算力支撑,模型和数据得以高效扩展;模型部署阶段,使用昇思大模型套件,将专业知识融入气动设计大模型平台。串联大语言模型、气动外形设计模型、气动预测模型和风雷软件等非 AI 工具,气动设计大模型平台可支撑多种气动外形设计场景。

昇思 MindSpore 2.3 全新发布,大模型开发训推更简、更稳、更高效

昇思 MindSpore 积极探索前沿技术,支撑大模型原生高效训练。通过原创的多副本、多流水交织等 8 种并行技术,使集群线性度达到 90%(业界不足 60%),通过整图优化及下沉执行等,使得算力利用率达到 55%(业界不足 40%);针对集群故障率高,恢复时间长的普遍问题,通过编译快照,确定性 CKPT 技术实现 20 分钟完成故障恢复。

 

在大模型部署上,昇思通过训推一体的架构升级实现脚本、分布式策略,运行时的统一,Baichuan2-13B 的推理部署只需 1 天。在大模型推理上,通过 LLM Serving 实现推理吞吐提升 2 倍多;升级模型压缩工具金箍棒 2.0 实现千亿大模型压缩至十倍。 


为降低开发门槛,昇思持续升级 MindSpore TransFormers 大模型套件,并提供 MindSpore One 生成式套件,全流程开箱即用,一周即可完成大模型全流程的开发。

 

创新 AI+科学计算范式,孵化科学领域基础大模型。MindSpore 已在 AI 生物计算探索多年,联合顶级科研机构和伙伴打造了 AI 生物计算套件,包含蛋白质结构预测、生成等 20 多个 SOTA 模型,加速相关领域创新。

 

2024-03-27 07:122697
用户头像
李冬梅 加V:busulishang4668

发布了 960 篇内容, 共 558.0 次阅读, 收获喜欢 1119 次。

关注

评论

发布
暂无评论
发现更多内容

图数据库|基于 Nebula Graph 的 Betweenness Centrality 算法

NebulaGraph

数据库 算法 图数据库

上海理工大学:巧用数字技术打响智慧抗疫信息战

华为云开发者联盟

低代码 welink 防疫 AppCube 核酸检测

SimpleDateFormat类的安全问题,这6个方案总有一个适合你

华为云开发者联盟

Java 高并发 线程池 线程安全 SimpleDateFormat类

正则表达式提取 git 提交记录中的新增代码行

OpenHacker

JavaScript 正则表达式

Telnet是什么意思?与SSH有啥区别?

行云管家

运维 SSH IT运维

linux运维是做什么工作的?有哪些岗位?

行云管家

运维 网络运维 IT运维

适合中小企业的文档管理软件有哪些?

小炮

企业 文档管理

要想推荐系统做的好,图技术少不了

华为云开发者联盟

推荐系统 图分析 图技术 单部图 异构图

天翼云CDN+云主机护航,全天候支撑云上战“疫”

天翼云开发者社区

Groovy踩坑记之方法调用八层认识

FunTester

开源之夏 2022 与您相约!

RadonDB

数据库 开源 开源之夏

企业为什么要实施知识管理?

小炮

知识管理 企业知识管理 企业知识管理工具

阿拉德之怒手游超详细图文架设教程

echeverra

游戏开发

Go Runtime 设计:计算资源调度

张旭海

Go runtime goroutine scheduler

解决方案| anyRTC金融音视频解决方案

anyRTC开发者

音视频 WebRTC 解决方案 在线金融 视频通话

TiDB 在连锁快餐企业丨海量交易与实时分析的应用探索

PingCAP

架构实战营总结

刘洋

#架构实战营 「架构实战营」

王世杰:读博被美国拒签之后

OneFlow

人工智能 深度学习 计算机视觉 深度学习框架 oneflow

什么是低代码开发?

源字节1号

软件开发 低代码开发

了解云桌面,看这一篇文章就够了!

天翼云开发者社区

云端守望者(上):十二道难关

天翼云开发者社区

云主机 云安全

web前端培训Nestjs模块机制概念与实现原理

@零度

前端开发 nest

直播技术干货分享:千万级直播系统后端架构设计的方方面面

JackJiang

直播技术 即时通讯IM 音视频技术

英特尔中国研究院“双轮驱动,融合创新”,解锁智能发展新机遇

科技新消息

持续进击,STI上演极致通缩模型

西柚子

java培训和自学哪个适合你,自学需要什么条件

@零度

JAVA开发 自学java

【直播预告】凡泰讲堂第一期:洞见云原生,Kubernetes技术详解与实践

FinClip

Kubernetes

为什么说Aquqnee有望成为GameFi板块天花板

西柚子

如何通过云效流水线扩展代码检测

阿里云云效

云计算 阿里云 代码 代码管理 代码检测

走进英特尔中国研究院,探索科技创新无穷奥秘

科技新消息

从Python到C++调用过程分析|OneFlow学习笔记

OneFlow

Python 人工智能 机器学习 深度学习框架 oneflow

大模型训推更高效!这款国产开源AI框架再迎重大升级_生成式 AI_李冬梅_InfoQ精选文章