写点什么

Meta 开源 DCPerf:一个面向超大规模云工作负载的基准测试套件

作者:Aditya Kulkarni

  • 2024-09-29
    北京
  • 本文字数:1134 字

    阅读完需:约 4 分钟

Meta 开源 DCPerf:一个面向超大规模云工作负载的基准测试套件

Meta 最近发布了 DCPerf,它可以模拟数据中心云部署中的各种工作负载。对于研究人员、硬件开发人员和互联网公司来说,该基准测试集有望成为一项非常有用的资源,帮助他们设计和评估未来的产品。


在一篇博文中,来自 Meta 的 Abhishek Dhanotia、Wei Su、Carlos Torres、Shobhit Kanaujia 和 Maxim Naumov 着重说明了超大规模云数据中心工作负载的独特性。他们强调,这些主导服务器市场的工作负载与高性能计算(HPC)或传统企业场景中的工作负载有着很大的不同。因为存在这种差异,所以需要专门的服务器设计和评估方法,也就是说,需要专用的基准测试。


DCPerf 是一个基准测试套件,设计用来模拟现实世界的超大规模云应用程序,旨在为硬件供应商、系统软件开发商和研究人员提供评估新产品、开展性能预测和建模的工具。这种方法可以反映互联网应用程序公司开发并部署在超大规模云数据中心中的实际生产负载。


从检查底层硬件微体系结构特性到分析应用程序和库的使用概况,Meta 团队采用了多种技术来确保其基准测试的代表性。这种方法使他们能够捕获生产负载的关键特征,并将其纳入到 DCPerf 中。


有了这些基准测试,基于未来服务器平台的软硬件设计及优化工作将更直接地转化改进超大规模生产部署的效率。



图片来源:DCPerf:一个面向大规模计算应用的开源基准测试套件


Meta 确保了该套件与各种指令集体系结构(x86、ARM)的兼容性,验证了它在新兴技术(如芯片粒子(chiplet))中的有效性,并添加了多租户支持,以便可以利用现代服务器上不断增加的内核数。


当 Hacker News 分享这一消息 时,技术社区注意到,它与专为谷歌工作负载定制的基准测试套件 Fleetbench 相似。Fleetbench 的 C++ 代码旨在帮助芯片供应商、编译器研究人员和其他希望提高类谷歌工作负载性能的人。


Meta 内部一直在使用 DCPerf 和 SPEC CPU 基准测试套件,以增强他们在产品评估和数据中心配置选择方面的能力。这种方法可以针对容量规划做早期性能预测,有助于确定硬件和软件中的性能问题,并促进与硬件合作伙伴协作开展平台优化。


与 SPEC CPU 等传统基准测试相比,DCPerf 的应用程序软件集提供了对平台性能更全面的洞察。在认识到这些好处之后,Meta 将 DCPerf 集成到了其数据中心部署过程中的平台选择流程中。


在评估和优化 CPU 性能、IPC、内存延迟以及在一定程度上评估和优化内存带宽和功耗方面,DCPerf 具有很强的适用性。但是,它在网络和存储评估方面的用处不大,并且受限于特定的工作负载。这篇博文着重介绍了 DCPerf 可能需要进一步开发的特定方面,或者用户在解释结果时应该谨慎对待的地方。


对于 DCPerf,Meta 感谢其合作者的支持和贡献。感兴趣的读者可以在 GitHub 上了解项目的更多细节。


原文链接:

https://www.infoq.com/news/2024/08/meta-dcperf-benchmark-suite/

2024-09-29 08:0014017

评论

发布
暂无评论
发现更多内容

每周一看:16份文档资料,程序员软硬实力全概览,总有一个适合你

小Q

Java 学习 程序员 架构 面试

【云小课】版本管理发展史之Git+——代码托管

华为云开发者联盟

git 代码管理 托管

嗯,查询滑动窗口最大值的这4种方法不错...

王磊

Java 数据结构和算法

阿里云官方推出操作系统“等保合规”镜像 -- Alibaba Cloud Linux 等保2.0三级版

阿里云基础软件团队

内核

重磅解读:K8s Cluster Autoscaler模块及对应华为云插件Deep Dive

华为云开发者联盟

容器 k8s 服务

简析低代码开发与传统开发的区别与优势

Marilyn

敏捷开发 低代码

会展云技术解读 | 面对突发事故,APP如何做好崩溃分析与性能监控?

京东科技开发者

云计算 云服务

终于啃完了这份Java核心原理+框架“面试圣经”,成功五面上岸美团

Java架构追梦

Java 架构 面试 微服务 框架开发

揭秘在召唤师峡谷中移动路径选择逻辑?

华为云开发者联盟

算法 地图 最短路径

谈谈敏捷开发概念和迭代开发方案

Learun

敏捷开发

LeetCode题解:77. 组合,递归回溯,JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

【涂鸦物联网足迹】API及SDK介绍

IoT云工坊

软件开发 物联网 API sdk 云平台

mongodb 源码实现系列 - 网络传输层模块实现三

杨亚洲(专注MongoDB及高性能中间件)

MySQL mongodb 分布式 高性能 分布式数据库mongodb

移动安全加固助力 App 实现全面、有效的安全防护

蚂蚁集团移动开发平台 mPaaS

安全攻防 App风险 mPaaS

解决大中型浏览器(Chrome)插件开发痛点:自定义热更新方案——2.基于双缓存更新功能模块

梁龙先森

Java chrome 大前端 浏览器 技术方案

天啦撸!打印日志竟然只晓得 Log4j?

沉默王二

Java 日志 log4j

医疗界“最强大脑”落户杭州!阿里巴巴联合浙大一院共同打造

互联网

如何实现后台管理系统的权限路由和权限菜单

徐小夕

Java 大前端 编辑器 H5 数据可视化

帮助企业摆脱困境,名企归乡工程师:能成功全靠有它!

Philips

敏捷开发

【运维思考】如何做好云上运维服务?

嘉为蓝鲸

云计算 运维 数字化转型 数据中心 云服务

分库分表的 9种分布式主键ID 生成方案,挺全乎的

程序员小富

分库分表 Java 分布式

接口测试如何在post请求中传递文件

测试人生路

接口测试

go-zero如何追踪你的请求链路

万俊峰Kevin

Trace microservice Go 语言

DB-Engines 11月数据库排名:PostgreSQL坐稳同期涨幅榜冠军宝座

华章IT

数据库 postgresql

《Python:Python编程简介:计算机编程和机器学习入门指南》

计算机与AI

Python

技术分享:WebAssembly能否重新定义前端开发模式?

葡萄城技术团队

webassembly

浅谈API网关(API Gateway)如何承载API经济生态链

华为云开发者联盟

API 网关

架构师训练营 - 第 7 周课后作业(1 期)

Pudding

架构训练营 - 第7周课后作业 - 学习总结

Pudding

“开源软件供应链点亮计划-暑期2020”公布结果 基于ChubaoFS开发的项目获得最佳质量奖

京东科技开发者

大数据 开源 云原生

Apache DolphinScheduler 是如何走进Apache的

代立冬

大数据 数据湖调度 DolphinScheduler Apache DolphinScheduler

Meta 开源 DCPerf:一个面向超大规模云工作负载的基准测试套件_AI 工程化_InfoQ精选文章