报名参加CloudWeGo黑客松,奖金直推双丰收! 了解详情
写点什么

第四范式发布先知 AIOS 5.1,升级支持 GPU 资源池化功能

  • 2024-07-23
    北京
  • 本文字数:433 字

    阅读完需:约 1 分钟

大小:240.51K时长:01:22
第四范式发布先知AIOS 5.1,升级支持GPU资源池化功能

今天,第四范式先知 AIOS 5.1 版本正式发布。该版本新增 GPU 资源池化(vGPU)能力,实现对硬件集群平台化管理、算力资源的按需分配和快速调度,最多节省 80%的硬件成本,提高 GPU 综合利用率多达 5-10 倍。



第四范式先知 AIOS 5 是行业大模型开发及管理平台。平台以提升企业核心竞争力为目标,在支持接入企业各类模态数据的基础上,提供大模型训练、精调等低门槛建模工具、科学家创新服务体系、北极星策略管理平台、大模型纳管平台、主流算力适配优化等能力,实现端到端的行业大模型的构建、部署、管理服务。



在行业大模型的构建过程中,为进一步提高算力资源利用率,第四范式先知 AIOS 5.1 版本新增 GPU 资源池化(vGPU)能力,拥有五大技术亮点:

  • 全面适配国产/非国产算力,支持混合部署与统一调度

  • 算力和显存超分复用,算力切分精细到 1%,显存切分以 M 兆为单位

  • 具备千卡级别分布式调度与管理能力

  • 支持自定义隔离策略,实现共享或独享算力池

  • 利用多任务共享及处理优化技术,推理性能提升 10 倍以上

 

了解产品详情,可致电 400-898-7788,或扫描下方二维码。



2024-07-23 16:498568

评论

发布
暂无评论
发现更多内容

【FAQ】运动健康服务云侧数据常见问题及解答

HarmonyOS SDK

深入解读ReAct框架

Bob Lin

AI Python3 openai GPT-4 #LangChain

给网站引入各大搜索引擎的关键字提示,白给的接口薅他羊毛。

23朵

js 搜索

每日一题:LeetCode-394. 字符串解码

Geek_4z9ami

Go 算法 递归 LeetCode 字符串

华为云多活高可用服务MAS荣获“2023年香港星光奖“

华为云PaaS服务小智

云计算 华为云

BMF 开箱体验 开源赛道 1:高效视频处理

Echo_Wish

Python 视频处理 开源赛道1 BMF 高效视频处理

MegEngine 优化 dataloader 使用体验!data monitor 帮助更好定位性能瓶颈

MegEngineBot

性能优化 Data 开源框架

大模型实践 | 为慧眼智能可观测平台插上ChatInsight的翅膀

网易数帆

可观测性 网易 大模型 AIGC ChatInsight

一位福友的2023年外贸总结

九凌网络

拼多多ID取商品详情API:电商行业的核心价值与实时数据获取策略

Noah

E3PO 进行 360° 视频传输体验 开源赛道 2:畅想 360° 视频传输

Echo_Wish

技术 2023 E3PO 畅想 360° 视频传输 开源赛道2

2023 Tech Sanya大赛半决赛暨中国企业战略投资峰会即将盛势来袭

创业邦

文心一言 VS 讯飞星火 VS chatgpt (160)-- 算法导论12.4 2题

福大大架构师每日一题

福大大架构师每日一题

Google 沙盒效应是什么?网站如何避免谷歌沙盒!

九凌网络

KubeWharf:云原生操作系统引领大规模分布式应用的新时代

熬夜磕代码、

你需要的圣诞祝福模板都在这里了!过不过圣诞都能用!

九凌网络

浅析 ArrayList

emanjusaka

jdk 源码分析 ArrayList

支持GPU虚拟化的云桌面厂家有哪些?

青椒云云电脑

云桌面 云桌面厂家

第四范式发布先知AIOS 5.1,升级支持GPU资源池化功能_AI&大模型_第四范式技术团队_InfoQ精选文章