产品战略专家梁宁确认出席AICon北京站,分享AI时代下的商业逻辑与产品需求 了解详情
写点什么

阿里云与清华大学共建 AI 大模型推理项目 Mooncake 正式开源

  • 2024-11-21
    北京
  • 本文字数:741 字

    阅读完需:约 2 分钟

大小:366.02K时长:02:04
阿里云与清华大学共建AI大模型推理项目Mooncake正式开源

2024 年 6 月,国内优质大模型应用 Kimi 与清华大学 MADSys(Machine Learning, AI, Big Data Systems)实验室联合发布了以 KVCache 为中心的大模型推理架构 Mooncake。通过使用以 KVCache 为中心的 PD 分离和以存换算架构,大幅提升大模型应用 Kimi.ai 推理吞吐的同时有效降低了推理成本,自发布之日受到业界广泛关注。近日,清华大学和 9#AISoft 联合以阿里云为代表的多家企业和研究机构,正式开源大模型 KVCache 项目 Mooncake。希望更多的厂商与开发者共建高性能 KVCache 开源生态。

为了加速大模型推理技术的发展,特别是以 KVCache 为中心的缓存池化层的标准化,阿里云与清华大学深度共建 Mooncake  项目,结合主流大模型推理框架,抽象池化 KVCache 的底层接口,实现高效分布式 KVCache。针对大模型场景进行深度优化,帮助提升大模型超长上下文的推理性能。

 

作为 AI 基础设施服务商,阿里云在 Mooncake 项目中,向 Transfer Engine,P2P Store 和高性能内存存储等关键组件贡献了代码。在推理框架层面,完成了与广泛使用的大模型推理框架 vLLM 的适配,取得了优异的性能提升,并为其他大模型推理框架的对接适配提供了参考实现。在 Transfer Engine 层面,提供了 CXL 和阿里云自研 eRDMA 网络的支持,可以通过 eRDMA 网络支持云上快速规模化部署。

 

清华大学 MADSys 实验室章明星教授表示,通过 Mooncake 可以充分利用 AI Infra 中的 CPU、内存和 SSD 资源,,提升推理请求的处理速度,借助资源解耦架构和池化 KVCache,减少资源浪费。此次联合阿里云一起将 Mooncake 项目开源,希望能够协同产学研力量共建开源社区,推动当下大模型推理系统的快速发展。

 

未来,阿里云会更深层次的参与 Mooncake 项目的共建,携手更多企业、机构、高校力量,持续探索更加高效和先进的模型推理系统架构创新,让大模型技术真正惠及千行百业。

2024-11-21 14:492

评论

发布
暂无评论

华为云开年采购季全面启动 智领千行万业 赋能美好未来

轶天下事

OgGame——游戏全球发行的全套解决方案

Ogcloud

云游戏 游戏发行 云游戏发行 游戏云化 游戏发行公司

分享一个国内可用的AIGC生成平台|免费创作

京东科技开发者

iNet Network Scanner for Mac(mac网络扫描工具) v3.1.0永久激活版

iMac小白

Footprint Analytics 强势入局 AI 推出全新投研工具

Footprint Analytics

#人工智能 #区块链

LED芯片寿命试验过程解析

Dylan

屏幕亮度 光热发电 电子 LED display LED显示屏

软件测试学习笔记丨Pytest结合数据驱动读取csv文件

测试人

软件测试

新一代AI模型Claude 3:有大学生智商,全面超越GPT-4,现已正式登陆 Amazon Bedrock!

伊克罗德信息科技

2024政府工作报告聚焦数字经济,“双象限”评选凸显数字化先锋

信通院IOMM数字化转型团队

数字化转型 数字经济 IOMM 企业数字化转型发展双象限

架构实战营 - 模块二作业

满心

架构实战营

【AAAI 2024】MuLTI:高效视频与语言理解

阿里云大数据AI技术

人工智能 机器学习 模型训练 大模型

轻播zFuse Pro for Mac(简单小巧的视频播放器) v1.7.38直装版

iMac小白

Room Arranger for Mac(简单易用的室内设计软件) v9.8.3.645中文激活版

iMac小白

你在测试金字塔的哪一层(上)

禅道项目管理

软件开发 自动化测试 测试工程师 测试金字塔

Java社招面经分享,别人都是怎么面试蚂蚁的?

阿里、莫言

Java Java面经 Java面试题

全新架构!日志服务 SLS 自研免登录方案发布

阿里巴巴云原生

阿里云 云原生 日志服务 sls

API接口知识小结

Noah

被快手面试官追着问的真正线上索引失效的问题是如何排查的

派大星

:MySQL 数据库 Java 面试题 互联网大厂面试

Java 中 HashMap 详解

小白牙

Java Map集合

如何通过ETL做数据转换

RestCloud

ETL 数据集成 数据转换

兼顾稳定和性价比的跨国企业SD-WAN组网

Ogcloud

SD-WAN 企业网络 SD-WAN组网 SD-WAN服务商 SDWAN

软件测试学习笔记丨Pytest结合数据驱动读取json文件

测试人

软件测试 测试开发

聚道云如何实现薪人薪事与金蝶云无缝对接,破解财务难题?

聚道云软件连接器

案例分享

程序员排查BUG指南

宇文辰皓

bug定位

制造业工厂中的设备管理系统

万界星空科技

工业互联网 制造业 mes 设备管理 设备数据采集

讲讲鸿蒙开源与技术细节

Geek_2305a8

云手机为电商提供五大出海优势

Ogcloud

云手机 海外云手机 云手机海外版 国外云手机 跨境云手机

一键制作iOS上架App Store描述文件教程

雪奈椰子

Vue.js 应用实现监控可观测性最佳实践

OpenTiny社区

开源 Vue 前端

20年编程,AI编程6个月,关于Copliot辅助编码工具,你想知道的都在这里

京东科技开发者

NFTScan | 03.11~03.17 NFT 市场热点汇总

NFT Research

NFT\ NFTScan

阿里云与清华大学共建AI大模型推理项目Mooncake正式开源_生成式 AI_凌敏_InfoQ精选文章