写点什么

阿里云已支持 Llama2 全系列训练部署,助力企业快速打造专属大模型

  • 2023-07-25
    北京
  • 本文字数:1042 字

    阅读完需:约 3 分钟

阿里云已支持 Llama2 全系列训练部署,助力企业快速打造专属大模型

近日, Llama2 大语言模型宣布开源,覆盖 70 亿、 130 亿及 700 亿参数版本。 Llama2 可免费用于研究场景和月活 7 亿用户以下的商业场景,为企业和开发者提供了大模型研究的新工具。然而,对 Llama2 的再训练和部署仍存在较高门槛,尤其是针对效果更胜一筹的大尺寸版本。

 

为方便开发者群体,阿里云机器学习平台 PAI 在国内率先对 Llama2 系列模型进行深度适配,推出了轻量级微调、全参数微调、推理服务等场景的最佳实践方案,助力开发者快速基于 Llama2 进行再训练,搭建自己的专属大模型。



阿里云牵头发起的 AI 模型社区魔搭 ModelScope ,第一时间上架了 Llama2 系列模型。开发者可在魔搭社区 Llama2 模型页面点击“ Notebook 快速开发”,一键拉起阿里云机器学习平台 PAI ,对模型进行云上开发和部署;在其他平台下载的 Llama2 模型,也可使用阿里云 PAI 进行开发。



针对特殊的场景需求,开发者往往需使用微调训练的方法对模型进行“调整”,以获得特定领域的专业能力和知识。此时, PAI 支持开发者在云上进行轻量级 Lora 微调或更深度的全参数微调。完成模型微调后, PAI 支持开发者通过 Web UI 及 API 的方式部署 Llama2 ,使模型可以通过网页或嵌入应用与使用者交互。

 


相比本地单机训练 Llama2 ,在阿里云上可完成对超大尺寸模型的深度开发,且预置环境免运维,操作简单便捷,同时开发者可获得丰富的 AI 计算资源和极致弹性。本地单卡 GPU 只能完成 Llama2 70 亿 参数版本的轻量级 Lora 微调和推理,更大尺寸版本及更深度训练均很难支撑。在阿里云上,通过 PAI 灵骏智算服务提供的分布式计算能力,可对 Llama2 全尺寸版本进行轻量级和全参数微调,并进行高效部署和推理。


作为全球前三、亚洲第一的云厂商,阿里云是中国 AI 浪潮重要的引领者和服务者,已构建完备的 IaaS+PaaS+MaaS 一体化 AI 服务。在基础设施层,阿里云拥有国内最强的智能算力储备,灵骏智算集群具备最大十万卡 GPU 规模扩展性,可承载多个万亿参数大模型同时在线训练;在 AI 平台层,阿里云机器学习平台 PAI 提供 AI 开发全流程的工程能力, PAI 灵骏智算服务支撑了通义千问等超大模型的训练和应用,可将大模型训练性能提高近 10 倍,推理效率提升 37 %;在模型服务层,阿里云构建了国内最活跃的 AI 模型社区魔搭,并支持企业基于通义千问或三方大模型进行再训练。



今年 7 月初,阿里云宣布,将把促进中国大模型生态的繁荣作为首要目标,向大模型创业公司提供包括模型训练、推理、部署、精调、测评、产品化落地等在内的全方位服务,并在资金和商业化探索方面提供充分支持。

2023-07-25 17:236184
用户头像
赵钰莹 极客邦科技 总编辑

发布了 891 篇内容, 共 659.0 次阅读, 收获喜欢 2684 次。

关注

评论

发布
暂无评论
发现更多内容

企评家|河南豫能控股股份有限公司的企业成长性报告简述

企评家

企评家企业大数据,实现6种应用的场景

企评家

Dio 封装之金屋藏娇

岛上码农

flutter ios开发 安卓开发 4月月更 跨平台开发

我们需要一个元宇宙吗?

涛哥 数字产品和业务架构

元宇宙

大咖说 X 对话开源|论数据库人才发展战略

大咖说

数据库 阿里云 科技

轻量级 Kubernetes 多租户方案的探索与实践

火山引擎开发者社区

Kubernetes 云原生

时序数据库 vs OLAP

CnosDB

IoT 时序数据库 开源社区 CnosDB infra

微服务架构设计实践

鲁米

微服务架构

阿里云发布企业云原生IT成本治理方案:五大能力加速企业 FinOps 进程

阿里巴巴云原生

阿里云 云原生 FinOps

ArrayList和SubList的坑面试题

芝士味的椒盐

Java 面试题 Java 开发

进程主要由哪几个部分组成?

InfoQ IT百科

使用任务管理软件有哪些好处,好用的任务管理软件有哪些?

爱吃小舅的鱼

架构实战营 - 第 6 期 模块四课后作业

乐邦

「架构实战营」

元宇宙(Metaverse)对普通人意味着什么?

涛哥 数字产品和业务架构

元宇宙

CPU散热器是电脑标配吗?

InfoQ IT百科

组织能力建设为啥这么难

凌晞

组织活力 组织建设

Plato Farm的“P2E”经济模型,赚取更多的MARK是关键

BlockChain先知

企业架构的7个关键趋势

涛哥 数字产品和业务架构

企业架构

开发、运维、业务都说好的全栈云原生长这样!

York

云原生 系统架构 全栈

阿里云数字化安全生产平台 DPS V1.0 正式发布!

阿里巴巴云原生

阿里云 云原生 数字化 安全生产平台

企业知识管理平台的作用及功能

小炮

企业知识管理

易捷行云EasyStack 加入龙蜥社区,共同打造多样化算力创新云平台

OpenAnolis小助手

云计算 开源 龙蜥社区 CLA 易捷行云

企评家,企业评价助力新三板企业健康发展

企评家

LAXCUS分布式操作系统如何保障系统安全

LAXCUS分布式操作系统

软件系统安全 量子攻击 分布式软件系统

浅谈MatrixOne如何用Go语言设计与实现高性能哈希表

MatrixOrigin

golang 哈希表 MatrixOrigin MatrixOne 矩阵起源

Mysql应用开发规范

阿丞

MySQL

提前起跑的OPPO,靠闪充完成一次“三级跳”

脑极体

中关村e谷为产业搭台:中关村论坛(空天专场)黑科技亮相现场

联营汇聚

面由 AI 生|虚拟偶像“捏脸”技术解析

ZEGO即构

计算机视觉 虚拟偶像 Avatar AI捏脸

KubeVela 1.3 发布:开箱即用的可视化应用交付平台,引入插件生态、权限认证、版本化等企业级新特性

阿里巴巴云原生

阿里云 开源 云原生 KubeVela

微信小程序开发系列 (二) :微信小程序的单步调试和控制器实现步骤概述

汪子熙

微信小程序 前端开发 MVVM 微信开发 4月月更

阿里云已支持 Llama2 全系列训练部署,助力企业快速打造专属大模型_AI&大模型_赵钰莹_InfoQ精选文章