AICon议程上新60%,阿里国际、360智脑、科大讯飞、蔚来汽车分享大模型探索与实践 了解详情
写点什么

Meta 开源 DCPerf:一个面向超大规模云工作负载的基准测试套件

作者:Aditya Kulkarni

  • 2024-09-29
    北京
  • 本文字数:1134 字

    阅读完需:约 4 分钟

Meta 开源 DCPerf:一个面向超大规模云工作负载的基准测试套件

Meta 最近发布了 DCPerf,它可以模拟数据中心云部署中的各种工作负载。对于研究人员、硬件开发人员和互联网公司来说,该基准测试集有望成为一项非常有用的资源,帮助他们设计和评估未来的产品。


在一篇博文中,来自 Meta 的 Abhishek Dhanotia、Wei Su、Carlos Torres、Shobhit Kanaujia 和 Maxim Naumov 着重说明了超大规模云数据中心工作负载的独特性。他们强调,这些主导服务器市场的工作负载与高性能计算(HPC)或传统企业场景中的工作负载有着很大的不同。因为存在这种差异,所以需要专门的服务器设计和评估方法,也就是说,需要专用的基准测试。


DCPerf 是一个基准测试套件,设计用来模拟现实世界的超大规模云应用程序,旨在为硬件供应商、系统软件开发商和研究人员提供评估新产品、开展性能预测和建模的工具。这种方法可以反映互联网应用程序公司开发并部署在超大规模云数据中心中的实际生产负载。


从检查底层硬件微体系结构特性到分析应用程序和库的使用概况,Meta 团队采用了多种技术来确保其基准测试的代表性。这种方法使他们能够捕获生产负载的关键特征,并将其纳入到 DCPerf 中。


有了这些基准测试,基于未来服务器平台的软硬件设计及优化工作将更直接地转化改进超大规模生产部署的效率。



图片来源:DCPerf:一个面向大规模计算应用的开源基准测试套件


Meta 确保了该套件与各种指令集体系结构(x86、ARM)的兼容性,验证了它在新兴技术(如芯片粒子(chiplet))中的有效性,并添加了多租户支持,以便可以利用现代服务器上不断增加的内核数。


当 Hacker News 分享这一消息 时,技术社区注意到,它与专为谷歌工作负载定制的基准测试套件 Fleetbench 相似。Fleetbench 的 C++ 代码旨在帮助芯片供应商、编译器研究人员和其他希望提高类谷歌工作负载性能的人。


Meta 内部一直在使用 DCPerf 和 SPEC CPU 基准测试套件,以增强他们在产品评估和数据中心配置选择方面的能力。这种方法可以针对容量规划做早期性能预测,有助于确定硬件和软件中的性能问题,并促进与硬件合作伙伴协作开展平台优化。


与 SPEC CPU 等传统基准测试相比,DCPerf 的应用程序软件集提供了对平台性能更全面的洞察。在认识到这些好处之后,Meta 将 DCPerf 集成到了其数据中心部署过程中的平台选择流程中。


在评估和优化 CPU 性能、IPC、内存延迟以及在一定程度上评估和优化内存带宽和功耗方面,DCPerf 具有很强的适用性。但是,它在网络和存储评估方面的用处不大,并且受限于特定的工作负载。这篇博文着重介绍了 DCPerf 可能需要进一步开发的特定方面,或者用户在解释结果时应该谨慎对待的地方。


对于 DCPerf,Meta 感谢其合作者的支持和贡献。感兴趣的读者可以在 GitHub 上了解项目的更多细节。


原文链接:

https://www.infoq.com/news/2024/08/meta-dcperf-benchmark-suite/

2024-09-29 08:0013947

评论

发布
暂无评论

充值满赠,IM+RTC+X 全通信服务「回馈季」开启

融云 RongCloud

毕业设计

ASCE

程序员女友给我做了一个疲劳驾驶检测

华为云开发者联盟

人工智能 疲劳驾驶检测

全技术栈、全场景、全角色云原生系列培训重磅首发,助力企业打造硬核云原生技术团队

York

容器 云原生 IT建设 技术培训 开发运维

全文手敲代码,教你用Java实现扫雷小游戏

华为云开发者联盟

Java

为什么一定要从DevOps走向BizDevOps?

阿里云云效

阿里云 DevOps 研发 BizDevOps

NLP 论文领读|文本生成模型退化怎么办?SimCTG 告诉你答案

澜舟孟子开源社区

人工智能 自然语言处理 机器学习 nlp 文本生成

居家办公没有“血泪史”| 社区征文

穿过生命散发芬芳

居家办公 6月月更 初夏征文

C++函数调用栈分布详解

dvlinker

c++ 函数调用 汇编代码 栈分布

如何使用物联网低代码平台进行服务管理?

AIRIOT

低代码 物联网 低代码开发平台 低代码,项目开发

ElasticSearch从入门到精通:Logstash妙用

Jackpop

开源实习经验分享:openEuler软件包加固测试

openEuler

开源 操作系统 部署 openEuler 实习

“信任机器”为发展赋能

CECBC

盘点华为云GaussDB(for Redis)六大秒级能力

华为云开发者联盟

数据库 后端 华为云

ElasticSearch从入门到精通:基础知识

Jackpop

ElasticSearch从入门到精通:常用操作

Jackpop

做一个 Scrollbar 的思考

cssghost

远程办公期间,项目小组微信群打卡 | 社区征文

IT蜗壳-Tango

6月月更 初夏征文

HashMap分析-扩容

zarmnosaj

6月月更

设计电商秒杀系统

流火

ElasticSearch从入门到精通:数据导入

Jackpop

元宇宙可能成为互联网发展的新方向

CECBC

激发新动能 多地发力数字经济

CECBC

Rust 如何实现依赖注入?

非凸科技

依赖注入 Trait 对象 编程语言‘ public

为什么越来越多的人选择云渲染?

Finovy Cloud

服务器 渲染 云渲染

联想YOGA 27 2022,超强配置全面升级

Geek_2d6073

实践GoF的23种设计模式:装饰者模式

华为云开发者联盟

开发 对象 装饰者模式

学习总结

ASCE

数字货币:影响深远的创新

CECBC

Windbg调试工具介绍

dvlinker

c++ windbg 调试工具

攻防演练中的防泄露全家福

穿过生命散发芬芳

6月月更 防泄露

Meta 开源 DCPerf:一个面向超大规模云工作负载的基准测试套件_AI 工程化_InfoQ精选文章