写点什么

阿里云已支持 Llama2 全系列训练部署,助力企业快速打造专属大模型

  • 2023-07-25
    北京
  • 本文字数:1042 字

    阅读完需:约 3 分钟

阿里云已支持 Llama2 全系列训练部署,助力企业快速打造专属大模型

近日, Llama2 大语言模型宣布开源,覆盖 70 亿、 130 亿及 700 亿参数版本。 Llama2 可免费用于研究场景和月活 7 亿用户以下的商业场景,为企业和开发者提供了大模型研究的新工具。然而,对 Llama2 的再训练和部署仍存在较高门槛,尤其是针对效果更胜一筹的大尺寸版本。

 

为方便开发者群体,阿里云机器学习平台 PAI 在国内率先对 Llama2 系列模型进行深度适配,推出了轻量级微调、全参数微调、推理服务等场景的最佳实践方案,助力开发者快速基于 Llama2 进行再训练,搭建自己的专属大模型。



阿里云牵头发起的 AI 模型社区魔搭 ModelScope ,第一时间上架了 Llama2 系列模型。开发者可在魔搭社区 Llama2 模型页面点击“ Notebook 快速开发”,一键拉起阿里云机器学习平台 PAI ,对模型进行云上开发和部署;在其他平台下载的 Llama2 模型,也可使用阿里云 PAI 进行开发。



针对特殊的场景需求,开发者往往需使用微调训练的方法对模型进行“调整”,以获得特定领域的专业能力和知识。此时, PAI 支持开发者在云上进行轻量级 Lora 微调或更深度的全参数微调。完成模型微调后, PAI 支持开发者通过 Web UI 及 API 的方式部署 Llama2 ,使模型可以通过网页或嵌入应用与使用者交互。

 


相比本地单机训练 Llama2 ,在阿里云上可完成对超大尺寸模型的深度开发,且预置环境免运维,操作简单便捷,同时开发者可获得丰富的 AI 计算资源和极致弹性。本地单卡 GPU 只能完成 Llama2 70 亿 参数版本的轻量级 Lora 微调和推理,更大尺寸版本及更深度训练均很难支撑。在阿里云上,通过 PAI 灵骏智算服务提供的分布式计算能力,可对 Llama2 全尺寸版本进行轻量级和全参数微调,并进行高效部署和推理。


作为全球前三、亚洲第一的云厂商,阿里云是中国 AI 浪潮重要的引领者和服务者,已构建完备的 IaaS+PaaS+MaaS 一体化 AI 服务。在基础设施层,阿里云拥有国内最强的智能算力储备,灵骏智算集群具备最大十万卡 GPU 规模扩展性,可承载多个万亿参数大模型同时在线训练;在 AI 平台层,阿里云机器学习平台 PAI 提供 AI 开发全流程的工程能力, PAI 灵骏智算服务支撑了通义千问等超大模型的训练和应用,可将大模型训练性能提高近 10 倍,推理效率提升 37 %;在模型服务层,阿里云构建了国内最活跃的 AI 模型社区魔搭,并支持企业基于通义千问或三方大模型进行再训练。



今年 7 月初,阿里云宣布,将把促进中国大模型生态的繁荣作为首要目标,向大模型创业公司提供包括模型训练、推理、部署、精调、测评、产品化落地等在内的全方位服务,并在资金和商业化探索方面提供充分支持。

2023-07-25 17:236226
用户头像
赵钰莹 极客邦科技 总编辑

发布了 893 篇内容, 共 666.6 次阅读, 收获喜欢 2689 次。

关注

评论

发布
暂无评论
发现更多内容

要性能还是要模型?

escray

学习 极客时间 7月日更 如何落地业务建模

华为18级工程师耗时三年才总结出这份Java亿级高并发核心编程手册

Java 编程 程序员

OLAP 扫盲

Galaxy数据平台

OLAP 高基数

模块2作业

Tina

Liunx之chown命令

入门小站

Linux

2021年网络安全市场全景图,看看都有哪些企业吧!

郑州埃文科技

项目管理实践篇(一):技术人如何做好风险把控

后台技术汇

项目管理

【Flutter 专题】84 图解自定义 ACEWave 波浪 Widget (二)

阿策小和尚

Flutter 小菜 0 基础学习 Flutter Android 小菜鸟 7月日更

有趣的SVG、Favicon

devpoint

favicon SVG 7月日更

Python 正则表达式急速入门

喵叔

7月日更

模块-6 拆分电商系统为微服务

小遵

vivo S系列的爆款密码:自拍,自然,自出机杼

脑极体

模块-1 微信业务架构图 和 备选方案

小遵

JDBC数据库链接的那些事

卢卡多多

JDBC 7月日更

🐧【Linux技术专题系列】「必备基础知识」一起探索(su、sudo等相关身份提权/身份切换机制)

码界西柚

Linux linux 文件权限控制 7月日更 Linux身份提权

架构实战营模块二作业

王晓宇

一文搞懂二分查找面试

泽睿

算法 二分查找

Spark SQL和DataFrames:内置数据源简介(四)

Databri_AI

spark sparksq

架构实战营 模块二 作业

一雄

作业 架构实战营 模块二

北鲲云计算,用技术成就生物科学领域发展

北鲲云

Discourse 调整使用不同的表情符号

HoneyMoose

Spark :: 源代码(前传)—Spark多线程 :: NettyRpcEnv.ask解读

dclar

spark 多线程 Spark调优 源代码

微服务架构服务容错设计分析

慕枫技术笔记

架构 微服务 后端

golang解析---进程,线程,协程

en

线程 进程 协程 Go 语言 goroutine

金九银十马上要来了,我熬夜整理10 万字节详细面试笔记(带完整目录) 良心分享

Java 编程 程序员 架构 面试

八位阿里大牛耗时三年总结出Java面试复盘手册!带你实现逆风翻盘

白亦杨

Java 编程 程序员

模块一作业

A先生

Ping Exporter -- Prometheus

耳东@Erdong

Prometheus ping 7月日更 exporter

架构实战营第二周作业——微信朋友圈高性能复杂度

发酵的死神

架构实战营

分布式事务最经典的七种解决方案

叶东富

数据库 分布式事务 微服务 TCC Go 语言

深入了解Spring之MessageSource

邱学喆

MessageFormat MessageSource MessageSourceAware

阿里云已支持 Llama2 全系列训练部署,助力企业快速打造专属大模型_AI&大模型_赵钰莹_InfoQ精选文章